作者:David Lammers
“對于邊緣技術來說,關鍵在于如何優化所需性能,同時最大限度地降低功耗。”
鑒于疫情期間,行業活動已普遍轉變為虛擬活動,年初至今我已經參加了6次線上半導體會議。討論的熱門主題之一是人工智能(AI)和深度學習(DL)芯片,這是一個不斷發展的領域,范圍涵蓋了廣泛的技術和器件類型。一項共同主題是關注內存優化和解決功耗/內存瓶頸。
人工智能是一個炙手可熱的市場。據ABI Research估計,2024年整個人工智能芯片市場將達到210億美元。令人驚訝的是,基于ASIC的人工智能加速器占據了市場的很大一部分,預計到2024年,其價值將增長三倍,達到90億美元的總可用市場(TAM),年復合增長率(CAGR)為30%。
各家公司都想方設法,研發出低能耗的訓練和推理處理解決方案。雖然機器學習只占數據中心總功耗的一部分,但這一部分功耗正在迅速擴大。2017年,數據中心消耗的電力約占美國總電力的3%,2020年這一數字翻了一倍,達到了6%。智能邊緣器件的普及也在加速。根據市場研究公司IDC的數據,未來十年將有1,250億個“物品”連接到互聯網上,屆時每年將創建、捕獲、復制和消費近60澤字節的數據。
很明顯,我們的行業面臨著一項重大挑戰:如何在邊緣部署多個智能設備,在邊緣以極低的功耗推斷所有數據,并在云端管理、處理和訓練指數級增長的數據,同時將功耗保持在控制水平內。
人工智能參考封裝發展
格芯®(GLOBALFOUNDRIES®)計算業務部副總裁Hiren Majmudar表示:“在推理和訓練中都存在功耗瓶頸”,而格芯技術產品很好地解決了這一點,無論是基于FinFET的12LP (12nm FinFET)平臺和12LP+解決方案,還是基于全耗盡型SOI的平面22FDXTM (22nm FD-SOI)平臺。
Hiren Majmudar
基于FinFET技術的人工智能處理器,無論是用于云端還是邊緣,都具有功率和成本優勢。12LP+解決方案能夠以高于1 Ghz的速度運行人工智能內核,并采用全新的低電壓SRAM和支持在0.55V下工作的標準單元庫。格芯先進的FinFET解決方案12LP+于今年投產,與12LP基礎平臺相比,其雙功函數FET的邏輯性能最高可提高20%,相當于功耗最高可降低40%。
他表示:“我們客戶使用獨特的架構,往往依賴一組有限的標準單元。我們一直致力于研究設計技術協同優化(DTCO),并開發了人工智能參考封裝,可通過一套預封裝元件來充分發揮潛能。借助合作DTCO模式,我們的客戶可以快速將SoC目標推向市場。DTCO工作包括基于客戶自身架構的設計分析服務,以針對性能、功率和面積(PPA)進行優化。”
Majmudar表示,最佳PPA因具體應用而不同。
他表示:“所有的細分市場都非常關注成本。對于云計算來說,指標是每瓦TOPS,以最低的功耗獲得最佳性能。對于邊緣技術來說,關鍵在于如何優化所需性能,同時最大限度地降低功耗。”
Majmudar表示,對于開發“即時開啟或永遠在線”人工智能應用的客戶來說,22FDX的eMRAM產品具有很強的優勢。他補充道:“eMRAM有很多應用,可幫助客戶實現高密度和非易失性。另一項功能是模擬存儲器內計算。”
人工智能工作負載范圍很廣,除了訓練和推理外,還包括語音、視覺和成像。他表示:“我們是一家專業晶圓廠,不斷推出創新的IP產品。我們持續投資IP、晶圓到晶圓互聯、存儲器和接口IP領域。我們擁有明確的路線圖,并吸收客戶的意見不斷改進。”
創新型初創公司
我計劃在未來的博客中,詳細介紹格芯如何與該領域的初創公司開展合作,但本文將先介紹其中一家公司,以便讓大家初步了解格芯客戶在人工智能芯片方面的豐富創新成果。
全耗盡型絕緣體上硅平臺經過專門設計,支持動態電壓、頻率微縮和自動時鐘門控。由此實現了超低功耗的信號處理和神經網絡算法,可用于電池供電的物聯網設備。
Perceive是Xperi Corp.擁有多數股權的子公司,旨在為超低功耗消費器件中的傳感器數據提供人工智能推理。Perceive的“Ergo”邊緣推理處理器能夠在設備上處理大型神經網絡,其效率是目前支持推理的處理器的20至100倍。
該公司專注于通過集成神經網絡處理技術實現安全攝像頭、智能家電和移動設備,而無需將數據發送到云端進行推理處理。