人工智能處理器降低功耗帶來的挑戰(zhàn)與機遇
作者:David Lammers
“對于邊緣技術(shù)來說,關(guān)鍵在于如何優(yōu)化所需性能,同時最大限度地降低功耗。”
鑒于疫情期間,行業(yè)活動已普遍轉(zhuǎn)變?yōu)樘摂M活動,年初至今我已經(jīng)參加了6次線上半導(dǎo)體會議。討論的熱門主題之一是人工智能(AI)和深度學(xué)習(xí)(DL)芯片,這是一個不斷發(fā)展的領(lǐng)域,范圍涵蓋了廣泛的技術(shù)和器件類型。一項共同主題是關(guān)注內(nèi)存優(yōu)化和解決功耗/內(nèi)存瓶頸。
人工智能是一個炙手可熱的市場。據(jù)ABI Research估計,2024年整個人工智能芯片市場將達到210億美元。令人驚訝的是,基于ASIC的人工智能加速器占據(jù)了市場的很大一部分,預(yù)計到2024年,其價值將增長三倍,達到90億美元的總可用市場(TAM),年復(fù)合增長率(CAGR)為30%。
各家公司都想方設(shè)法,研發(fā)出低能耗的訓(xùn)練和推理處理解決方案。雖然機器學(xué)習(xí)只占數(shù)據(jù)中心總功耗的一部分,但這一部分功耗正在迅速擴大。2017年,數(shù)據(jù)中心消耗的電力約占美國總電力的3%,2020年這一數(shù)字翻了一倍,達到了6%。智能邊緣器件的普及也在加速。根據(jù)市場研究公司IDC的數(shù)據(jù),未來十年將有1,250億個“物品”連接到互聯(lián)網(wǎng)上,屆時每年將創(chuàng)建、捕獲、復(fù)制和消費近60澤字節(jié)的數(shù)據(jù)。
很明顯,我們的行業(yè)面臨著一項重大挑戰(zhàn):如何在邊緣部署多個智能設(shè)備,在邊緣以極低的功耗推斷所有數(shù)據(jù),并在云端管理、處理和訓(xùn)練指數(shù)級增長的數(shù)據(jù),同時將功耗保持在控制水平內(nèi)。
人工智能參考封裝發(fā)展
格芯®(GLOBALFOUNDRIES®)計算業(yè)務(wù)部副總裁Hiren Majmudar表示:“在推理和訓(xùn)練中都存在功耗瓶頸”,而格芯技術(shù)產(chǎn)品很好地解決了這一點,無論是基于FinFET的12LP (12nm FinFET)平臺和12LP+解決方案,還是基于全耗盡型SOI的平面22FDXTM (22nm FD-SOI)平臺。
Hiren Majmudar
基于FinFET技術(shù)的人工智能處理器,無論是用于云端還是邊緣,都具有功率和成本優(yōu)勢。12LP+解決方案能夠以高于1 Ghz的速度運行人工智能內(nèi)核,并采用全新的低電壓SRAM和支持在0.55V下工作的標(biāo)準(zhǔn)單元庫。格芯先進的FinFET解決方案12LP+于今年投產(chǎn),與12LP基礎(chǔ)平臺相比,其雙功函數(shù)FET的邏輯性能最高可提高20%,相當(dāng)于功耗最高可降低40%。
他表示:“我們客戶使用獨特的架構(gòu),往往依賴一組有限的標(biāo)準(zhǔn)單元。我們一直致力于研究設(shè)計技術(shù)協(xié)同優(yōu)化(DTCO),并開發(fā)了人工智能參考封裝,可通過一套預(yù)封裝元件來充分發(fā)揮潛能。借助合作DTCO模式,我們的客戶可以快速將SoC目標(biāo)推向市場。DTCO工作包括基于客戶自身架構(gòu)的設(shè)計分析服務(wù),以針對性能、功率和面積(PPA)進行優(yōu)化。”
Majmudar表示,最佳PPA因具體應(yīng)用而不同。
他表示:“所有的細分市場都非常關(guān)注成本。對于云計算來說,指標(biāo)是每瓦TOPS,以最低的功耗獲得最佳性能。對于邊緣技術(shù)來說,關(guān)鍵在于如何優(yōu)化所需性能,同時最大限度地降低功耗。”
Majmudar表示,對于開發(fā)“即時開啟或永遠在線”人工智能應(yīng)用的客戶來說,22FDX的eMRAM產(chǎn)品具有很強的優(yōu)勢。他補充道:“eMRAM有很多應(yīng)用,可幫助客戶實現(xiàn)高密度和非易失性。另一項功能是模擬存儲器內(nèi)計算。”
人工智能工作負(fù)載范圍很廣,除了訓(xùn)練和推理外,還包括語音、視覺和成像。他表示:“我們是一家專業(yè)晶圓廠,不斷推出創(chuàng)新的IP產(chǎn)品。我們持續(xù)投資IP、晶圓到晶圓互聯(lián)、存儲器和接口IP領(lǐng)域。我們擁有明確的路線圖,并吸收客戶的意見不斷改進。”
創(chuàng)新型初創(chuàng)公司
我計劃在未來的博客中,詳細介紹格芯如何與該領(lǐng)域的初創(chuàng)公司開展合作,但本文將先介紹其中一家公司,以便讓大家初步了解格芯客戶在人工智能芯片方面的豐富創(chuàng)新成果。
全耗盡型絕緣體上硅平臺經(jīng)過專門設(shè)計,支持動態(tài)電壓、頻率微縮和自動時鐘門控。由此實現(xiàn)了超低功耗的信號處理和神經(jīng)網(wǎng)絡(luò)算法,可用于電池供電的物聯(lián)網(wǎng)設(shè)備。
Perceive是Xperi Corp.擁有多數(shù)股權(quán)的子公司,旨在為超低功耗消費器件中的傳感器數(shù)據(jù)提供人工智能推理。Perceive的“Ergo”邊緣推理處理器能夠在設(shè)備上處理大型神經(jīng)網(wǎng)絡(luò),其效率是目前支持推理的處理器的20至100倍。
該公司專注于通過集成神經(jīng)網(wǎng)絡(luò)處理技術(shù)實現(xiàn)安全攝像頭、智能家電和移動設(shè)備,而無需將數(shù)據(jù)發(fā)送到云端進行推理處理。