AI已無處不在。其中,邊緣AI基于流量占用少、時延低、隱私性強等優勢,也已被廣泛用于交通、醫療、智能零售、智能工廠、智能城市等各行各業。
4月9日,AMD(超威半導體)宣布擴展 AMD Versal™ 自適應片上系統(SoC)產品組合,推出全新第二代Versal AI Edge系列和第二代Versal Prime系列自適應SoC,為AI驅動型
嵌入式系統提供端到端加速。
據介紹,第二代Versal系列產品組合中的首批器件以第一代為基礎進行構建,具備強大的全新AI引擎,預計每瓦TOPS較之初代Versal AI Edge系列器件提升至多3倍,同時全新高性能集成Arm® CPU預計可提供比第一代Versal AI Edge和Versal Prime系列器件至高10倍的標量算力。
并且,第二代Versal系列器件將預處理、AI 推理與后處理集成于單器件中,能夠為AI驅動型嵌入式系統提供端到端加速。此外,其還平衡了性能、功耗、占板面積以及先進的功能安全與信息安全,提供的全新功能與特性支持為汽車、工業、視覺、醫療、廣播與專業音視頻市場設計高性能邊緣優化型產品。
目前,斯巴魯已成為首批宣布計劃部署AMD第二代Versal AI Edge系列的客戶之一,為下一代EyeSight ADAS視覺系統提供支持。
為嵌入式系統帶來單芯片智能
在過去十余年時間里,數據經歷了“野蠻式”增長,以物聯網感知為背景的應用程序運行和海量數據處理,疊加智能電動汽車走向中央集成式的電子電氣架構,傳統的云計算難以完全滿足毫秒級響應時間、安全性等高要求。也由此,邊緣計算應運而生,并愈發重要。
當然,高要求意味著更大的工作負載,當前邊緣AI也面臨著更多限制,包括功耗、尺寸、算力、安全與可靠性等多方面。
一般而言,由人工智能驅動的嵌入式系統,首先要對數據進行預處理,包括傳感器的融合以及數據的交集;然后通過矢量處理器進行推斷;最后再利用高性能的嵌入式CPU進行后處理,這樣才可以通過推斷的結果做出決策。
AMD自適應與嵌入式計算事業部(AECG)Versal產品營銷總監Manuel Uhm強調,在預處理階段,必須要實現實時處理,這樣才可以真正做到整個系統的實時處理。而這就需要可編程邏輯。
“因為可編程邏輯無論是對于傳感器還是對于各種類型的接口,都可以非常靈活地去適應,做到真正的實時,同時還可以保證低時延、確定性,甚至可以在現場部署之后,還可以進行升級。”他進一步談到,在實時AI驅動嵌入式系統當中,三個步驟的算力都必須能夠加速,才能夠真正實現全系統的實時。
不過,Manuel Uhm指出,當前市面上還沒有一類處理器能夠針對三個階段直接完成優化,多數采用多芯片的解決方案,然而這就會對整個嵌入式系統帶來一系列問題與限制。比如,更高的功率需求和供電復雜性,更高的占板面積和終端系統尺寸,更高的外部內存需求和芯片間的凸性帶來的時延增加,更多的安全漏洞和報廢挑戰,以及工作效率低下等。
這也是AMD此次推出第二代Versal自適應SoC的原因所在——多個器件疊加運行才能實現的功能,通過單一芯片的智能來解決。同時,實現對第一代產品的補充。
第二代Versal AI Edge系列和第二代Versal Prime系列自適應SoC所擁有的單芯片智能性,消除了構建多芯片處理解決方案的需求,進而帶來了更小、更高效的嵌入式AI系統,并為縮短上市時間提供潛能。
根據介紹,該系列器件在預處理階段采用FPGA可編程邏輯架構用于實時處理,靈活連接各種傳感器并實現高吞吐量、低時延數據處理工作流程;在AI推理階段,則通過矢量處理器陣列構成下一代AI引擎,實現高效AI推理;在后處理階段,以Arm CPU內核為安全關鍵型應用提供復雜決策與控制所需的后處理能力。
與此同時,該系列器件還能帶來較之初代至高10倍的標量算力。但不可忽視的是,標量算力顯著提升的同時,也帶來了相應功耗的增長。
據Manuel Uhm透露,第二代的功耗會比一代的VE2302高出很多。但是他也補充,“如果要實現同樣的DMIPS,使用一代2302產品的話,就需要使用外部的處理器,由此產生的總功耗實際上還是要高于二代的產品。”
值得一提的是,此次新產品的推出還有一個很大的亮點在于,相較于第一代產品,第二代則主要針對中央計算引擎,而第一代更多的是進行CPU的加速。
當前,汽車行業已經進入到ADAS標配時代,越來越多傳感器被集中在一個域控制器內,即中央計算。
沿著這種趨勢,AMD推出的第二代Versal產品能夠在“汽車大腦”進行數據融合。用官方的話來說,就是第二代Versal AI Edge系列與第二代Versal Prime系列產品組合為AI驅動型系統提供了從邊緣傳感器到中央計算的可擴展性,支持客戶選擇性能、功耗以及占板面積,以高效實現應用性能與安全目標。
此外,該產品組合也能簡化設計周期。AMD表示,AMD Vivado™ 設計套件工具及庫有助于為嵌入式硬件系統開發人員提升生產力并簡化設計周期,從而縮短編譯時間與提升結果質量。對于嵌入式軟件開發人員,AMD Vitis™統一軟件平臺支持在用戶首選的抽象級別進行嵌入式軟件、信號處理和AI設計開發,無需具備FPGA經驗。
對于AMD而言,其在FPGA領域實力的突破與在數據中心領域大舉進攻,很大一部分原因在于,于2022年2月完成對全球FPGA第一大品牌賽靈思(Xilinx)的收購。
彼時,原賽靈思總裁兼CEO,后擔任AMD自適應與嵌入式計算事業部(AECG)總裁的Victor Peng認為,“快速發展的連接設備和嵌入式人工智能的數據密集型應用,推動了對高效和自適應高性能計算解決方案需求的不斷增長。AMD和賽靈思的結合,將提供非常全面的自適應計算平臺組合,為廣泛的智能應用提供動力,從而加速我們定義計算新時代的能力。”
AMD在AI時代的動作還在持續加速。目前,AMD第二代Versal產品早期訪問文檔已經發布。據透露,AMD預計于2025年上半年提供第二代 Versal系列芯片樣片,2025年年中提供評估套件及系統模塊(SOM)樣品,并預計于2025年末提供量產芯片。
“對人工智能化嵌入式應用的需求正呈爆炸式增長,并帶動了對能在嵌入式系統的功耗和占板面積限制內實現高效端到端加速的單芯片解決方案的需求。依托于40余年來自適應計算的先進地位,這些最新一代Versal器件將多個計算引擎集成于一個架構之上,將提供高計算效率與性能以及從低端到高端的可擴展性。”AMD高級副總裁兼自適應和嵌入式計算事業部總經理Salil Raje談到。