2025年4月1日,致力于亞太地區(qū)市場的國際領先半導體元器件分銷商---大聯(lián)大控股宣布,其旗下世平推出基于MemryX MX3 AI推理加速卡和瑞芯微(Rockchip)Orange Pi 5 Plus模塊(RK3588)的邊緣AI多路物體檢測方案。
圖示1-大聯(lián)大世平基于MemryX和瑞芯微產(chǎn)品的邊緣AI多路物體檢測方案的優(yōu)勢示意圖
隨著物聯(lián)網(wǎng)、大數(shù)據(jù)、云計算等技術的飛速發(fā)展,邊緣AI作為人工智能領域的一個重要分支,正逐漸成為推動智能應用普及和深化的關鍵力量。邊緣AI將AI算法直接部署到邊緣設備上,在靠近數(shù)據(jù)生成源的地方進行處理和推理,可極大地提升數(shù)據(jù)處理的實時性和效率,同時減少數(shù)據(jù)傳輸?shù)难舆t和成本。借助邊緣AI的優(yōu)勢,大聯(lián)大世平基于MemryX MX3 AI推理加速卡和瑞芯微Orange Pi 5 Plus模塊(RK3588)推出邊緣AI多路物體檢測方案,旨在實現(xiàn)高效、低延遲、高性價比的智能監(jiān)控和物體識別應用,滿足多樣化場景需求。
圖示2-大聯(lián)大世平基于MemryX和瑞芯微產(chǎn)品的邊緣AI多路物體檢測方案的場景應用圖
MemryX是一家專注于邊緣AI處理解決方案的半導體公司,致力于為各種工業(yè)和消費應用場景提供高性能、低功耗的AI處理能力?。本方案搭載的MX3 AI推理加速卡將四個MX3 AI芯片封裝到M.2 2280擴展卡上,能夠輕松集成到配備PCIe 3.0 M.2插槽的系統(tǒng)中,MX3 AI芯片能夠提供每瓦5 TOPS的算力性能,并且支持浮點數(shù)(Brain Floating Point)運算來確保用戶的模塊準確度。每顆芯片內(nèi)置10.5MB的靜態(tài)隨機存取存儲器用于訪問模塊,不會占用主系統(tǒng)的資源,最多可以串聯(lián)16顆芯片來擴展性能。借助MX3 AI芯片的性能,MX3 AI加速卡具備高達20 TOPS的卓越計算性能,可以為各類工業(yè)電腦帶來即插即用的便捷體驗。
圖示3-大聯(lián)大世平基于MemryX和瑞芯微產(chǎn)品的邊緣AI多路物體檢測方案的方塊圖
配合MemryX的強大運算能力,本方案能夠輕松實現(xiàn)多路物體檢測應用。開發(fā)者僅需利用普通的USB攝像頭或通過網(wǎng)絡串聯(lián)的方式,即可輕松實現(xiàn)諸如停車場管理系統(tǒng)、智能停車柱、智能交通監(jiān)控、商場人流監(jiān)測以及居家全方位意外檢測等多種監(jiān)控功能。另外,為加速研發(fā)進程,MemryX還提供Developer Hub開發(fā)環(huán)境,使開發(fā)者能夠便捷地將TensorFlow Lite、ONNX、PyTorch、Keras等主流深度學習框架的模塊轉(zhuǎn)換為MX3 AI芯片所需的DFP框架,從而快速完成AI應用設計。
核心技術優(yōu)勢:
· 采用浮點數(shù)BF16進行計算,確保模塊準確度:
模塊設計以BF16(Brain Floating Point 16)為基礎進行運算,相較于傳統(tǒng)的浮點數(shù)格式,BF16能夠在大幅減少內(nèi)存使用量的同時,提供接近FP32的計算準確度。這使其特別適合用于人工智能和深度學習模型的推理與訓練場景,確保結(jié)果的精確性。
· 不占用系統(tǒng)內(nèi)存:
模塊運行時采用獨立內(nèi)存的架構(gòu),無需占用主系統(tǒng)的RAM資源,有效降低對系統(tǒng)整體性能的影響。這種設計特性確保模塊在高效運行的同時,仍能為其他應用程序預留足夠的系統(tǒng)資源。
· 高度可擴展性:
支持連接多達16個模塊,通過模塊化設計實現(xiàn)高擴展性。這使得系統(tǒng)能夠根據(jù)需求靈活擴展計算能力,以應對不同場景的計算需求,例如需要更高性能的數(shù)據(jù)中心或邊緣計算。
· 最佳數(shù)據(jù)流優(yōu)化,最大限度減少數(shù)據(jù)移動:
模塊內(nèi)部針對數(shù)據(jù)流進行了高度優(yōu)化設計,通過智能路由和緩存機制,能夠最大程度地減少數(shù)據(jù)在運行過程中的移動頻率,從而提升處理性能并降低延遲。此外,這樣的設計也有助于降低能耗,進一步增強系統(tǒng)的運行效率。
· 高性價比與低功耗解決方案:
將主平臺Orange Pi 5 Plus搭配MemryX MX3 AI芯片,即可升級為更高階的AI平臺,每秒能夠運行約480幀(YOLOv8)的物體檢測;且MX3擁有5 TOPS/W的性能表現(xiàn),整套多路物體檢測解決方案僅耗電約14W。
· 多路應用的新概念:
相較于近年來興起的邊緣計算,將其概念套用到區(qū)域性場景或許是一個新穎且能夠大幅降低成本的解決方案。利用輕松易得的攝像頭,再搭配一臺智能工業(yè)主機,即可實現(xiàn)許多應用,并且能夠?qū)η岸说臄z像頭進行任意更換與配置。
方案規(guī)格:
· 主平臺開發(fā)板采用瑞芯微RK3588平臺為基礎,搭載四顆Cortex-A76處理器與四顆Cortex-A55處理器,并提供高性能圖像處理器Arm Mali-G610與神經(jīng)運算處理器NPU等強大核心架構(gòu)。
· I/O Board開發(fā)板提供強大的周邊配置,如Gigabit Ethernet千兆以太網(wǎng)、USB Type A/C 3.0通用串行總線接口、HDMI高清多媒體接口、M.2 E-Key傳輸接口、M.2 M-Key傳輸接口,并能夠通過擴展的40 pin針腳來模擬常用的UART、I2C、SPI、CAN等信號。
· MemryX MX3 AI芯片提供強大的AI運算能力(20 TOPS),以PCIe Gen3 M.2 2280 M-Key接口為主,其M.2加速卡搭載四顆MX3 AI芯片,每顆芯片能夠提供5 TOPS/W的性能,并內(nèi)置10.5MB的靜態(tài)隨機存取存儲器用于存取模塊。支持Linux與Windows兩大操作系統(tǒng),并提供豐富的軟件資源供開發(fā)者使用,能夠直接移植Tensorflow、ONNX、Pytorch、Keras等熱門的深度學習框架。