導讀:人工智能已經成為目前芯片行業(yè)的一個重要驅動力?;仡櫲斯ぶ悄茉诎雽w行業(yè)的發(fā)展,我們可以清晰地看到一條從云到終端的演進路線。
人工智能已經成為目前芯片行業(yè)的一個重要驅動力?;仡櫲斯ぶ悄茉诎雽w行業(yè)的發(fā)展,我們可以清晰地看到一條從云到終端的演進路線。
最初,人工智能主要是作為一種服務部署在云端。本代人工智能基于大數據和神經網絡,因此在訓練時候需要大量的算力,在云端部署的時候也需要算力做支撐,因此云端人工智能領域中以Nvidia為代表的GPU加速人工智能成為了關注焦點,同時也有以Graphcore、Habana為代表的云端專用人工智能芯片公司與GPU分庭抗禮。2018年之后,隨著模型和芯片設計的優(yōu)化,人工智能逐漸從云端下沉到手機等強智能設備終端,在手機上基于人工智能算法的超分辨、美顏、人臉識別等應用也漸漸得到了主流認可,相應的芯片(IP)也就成為了手機SoC上不可或缺的一部分,高通、蘋果、華為海思等都擁有自己的高性能人工智能加速IP,用以支持手機人工智能應用。
而隨著人工智能技術的進一步演進,我們看到它正在進一步和物聯網結合,超低功耗人工智能正是這個人工智能繼續(xù)下沉的新動向。
超低功耗人工智能芯片的應用場景
超低功耗人工智能芯片(IP)的工作功耗在數十毫瓦或更低(作為比較,手機端人工智能IP的工作功耗往往在數百毫瓦到瓦級別,而云端人工智能加速卡功耗通常在數百瓦),同時往往結合事件驅動技術,即絕大部分時間計算部分都處于休眠狀態(tài),僅僅在發(fā)生相關事件時才會啟動,這樣就可以把平均功耗降低到毫瓦數量級以下。
超低功耗人工智能可以應用在什么場景下呢?消費電子領域中就有超低功耗人工智能的一席之地。在下一代智能設備如可穿戴設備和智能眼鏡類設備中,設備由于尺寸等原因電池容量有限,而這些設備需要執(zhí)行智能生物信號處理(例如智能手表上的心率檢測)、手勢識別(例如在目前的HoloLens中,基于人工智能的手勢識別是主要用戶交互方式)、語音識別等等,因此需要非常高能效比的人工智能加速模塊。除此之外,在智能家庭等領域,超低功耗人工智能也有落地機會,例如目前的智能門鎖市場,加入人臉識別會使智能門鎖的用戶體驗大大改善,但是智能門鎖通常必須依靠電池供電,而且預期的電池壽命至少要半年到一年,這樣一來對于執(zhí)行人工智能計算的模塊就提出了非常高的能效比需求。
除了消費電子之外,工業(yè)應用中也需要超低功耗人工智能。工業(yè)應用中對于超低功耗人工智能的需求往往來源于智能傳感器。這類傳感器安裝在機器、機械臂、管道等重要環(huán)境中,需要能時刻監(jiān)測各類信號并且運行相應的人工智能算法來判斷運行狀況。在這些場景下,傳感器必須依靠電池供電,而超低功耗人工智能可以大大減少電池消耗,這也意味著傳感器更換電池的間隔可以提升,這也就大大降低了這類傳感器系統(tǒng)的部署和維護成本。
超低功耗人工智能芯片的技術路徑
目前,超低功耗人工智能芯片大概可以分為三種技術路徑。
首先是基于數字電路的超低功耗人工智能加速模塊設計。使用數字電路向超低功耗方向的優(yōu)化方法首先是從系統(tǒng)架構層面做優(yōu)化,盡量減小模型的體積,并優(yōu)化數據流以降低內存訪問開銷。此外,在電路層面可以降低電源電壓,甚至使用亞閾值邏輯門設計,以降低電路運行時的功耗,以及漏電流。使用數字電路方法的優(yōu)勢在于可以更容易地與人工智能計算之外的模塊集成并構成SoC,而無需在數模轉換上消耗額外能量。
第二條技術路徑是使用模擬計算來完成神經網絡的計算。模擬計算往往和內存內計算相結合以實現高能效比,其具體的思路是目前人工智能計算中往往存儲訪問是能量消耗最大的部分,而使用模擬計算則可以在存儲(如SRAM或Flash等NVM)讀出電路中直接做計算,這樣就省去了數據讀出再計算的步驟,而可以直接在內存內完成計算。使用模擬計算配合內存內計算往往可以實現很高的能效比,例如歐洲的著名半導體研究機構IMEC宣布將在未來數年內完成能效比高達10000TOPS/W的模擬計算人工智能加速模塊。但是模擬計算對于模型往往有較多限制,例如必須在計算精度較低時仍然能保證準確率等,因此需要很好的軟件/硬件協同設計。
存內模擬計算是超低功耗人工智能的主要技術路徑之一
第三條道路則是在模型設計上使用脈沖神經網絡的設計(神經模態(tài)芯片)。使用脈沖神經網絡設計的神經模態(tài)芯片僅僅在神經元被激活時消耗能量,而絕大部分神經元在大部分情況下都處于休眠狀態(tài)而幾乎不消耗能量,因此其平均能效比可以做到比基于主流卷積神經網絡的芯片高一個數量級。脈沖神經網絡和神經模態(tài)芯片的難點主要在于模型設計和訓練上存在很高的門檻,此外如何對相應的脈沖神經網絡模型做電路級優(yōu)化也有很高的技術含量。
超低功耗人工智能芯片競爭格局:中國公司占據有利地位
超低功耗人工智能芯片市場目前仍然處于起步階段,但是隨著未來物聯網和下一代智能設備的技術演進,預計在未來幾年內市場熱度會越來越高。目前,從事超低功耗人工智能芯片開發(fā)的主要初創(chuàng)公司,但是未來超低功耗人工智能芯片的下一代領導者很可能就出現在這些初創(chuàng)公司中。
在消費電子領域,美國的Syntiant得到了亞馬遜Alexa Fund、微軟M12和Intel Capital等行業(yè)資本的支持,其主要產品是針對智能設備語音處理的超低功耗芯片。與此相對,中國的初創(chuàng)公司在這個領域的布局則更加多樣。來自清華大學的清微科技使用可重構電路技術,其超低功耗產品能覆蓋語音識別、視覺識別等多個領域,可望為下一代智能設備賦能。另一家中國公司則是SynSense,SynSense的技術路線是使用脈沖神經網絡,技術來自于神經脈沖網絡權威,蘇黎世大學Giacomo Indiveri教授的團隊。目前SynSense的脈沖神經網絡已經完成了多次流片迭代和驗證,相關的產品覆蓋了視覺、生物信號處理、語音識別等,平均功耗可以低至微瓦數量級。此外,SynSense還于最近推出了使用神經脈沖網絡結合動態(tài)視覺傳感器DVS的產品Speck,該產品能真正實現事件驅動,在絕大多數時間運行于超低的功耗下,而在檢測到動態(tài)事件后DVS能提供超高的視覺采樣頻率,并且配合脈沖神經網絡實現超高性能/超低延遲的視覺信號處理,從而兼具超低功耗和高性能。
而在工業(yè)應用領域,同樣來自清華大學的湃方科技走在了全球前列,成為了在工業(yè)領域能真正落地的超低功耗人工智能算法和芯片解決方案公司。湃方科技的應用場景涵蓋了衛(wèi)星、機械臂、發(fā)電機、電機等等重要的工業(yè)應用,其芯片能提供高達50TOPS/W的能效比。
目前,在超低功耗人工智能芯片領域,中國的初創(chuàng)公司和團隊無論是數量還是質量都走在了全球前列。讓我們期待中國能在未來的超低功耗人工智能領域繼續(xù)引領全球的潮流。