導讀:在需要AI相關算力的應用中,使用專用AI加速器的收益往往大于加強處理器性能。
今年上半年,ARM發(fā)布了針對MCU場景的首款microNPUEthosU55系列。該microNPU主打超低功耗,根據用戶需求可以搭載32-256個MAC(乘法累加器)單元,最高可以提供0.5TOPS的算力。ARM給EthosU55搭配的處理器是高端CortexM系列處理器(例如CortexM55),可見在當時EthosU55設計的初衷就是賦能中高端MCU市場。
在過了半年多時間之后,ARM在最近又發(fā)布了EthosU65系列,作為EthosU55的升級版本。EthosU65是ARM和主要合作方NXP一起定義和設計,相對于EthosU55的主要區(qū)別在于EthosU65中的MAC單元數量從原來的最多256增加到了512,從而將最大的算力從0.5TOPS提升到了1TOPS。此外,在NXP的系統(tǒng)設計中,整體系統(tǒng)中除了EthosU65除了搭配CortexM之外,還配上了一個CortexA系列處理器。
我們認為,ARM在一年中連續(xù)發(fā)布兩代針對MCU的microNPU,一方面說明了MCU市場對于AI和AI加速器確實有很強的需求,而另一方面,我們也看到了隨著智能家居等新品類的出現和流行,MCU和APU之間的間隔正在縮小,這也將為未來的智能MCU生態(tài)帶來新的變化。
MCU搭配AI加速器正在成為主流
在2017年之后,智能MCU慢慢進入了大眾的視野。例如,在2017年意法發(fā)布了ProjectOrlando作為實驗性質的MCU超低功耗AI加速器單元,而瑞薩也在2018年發(fā)布了針對MCU的可編程可重構協處理器DRP。在經過了三年發(fā)展之后,我們認為在MCU中加入AI加速器正在變得越來越主流,而且在需要AI相關算力的應用中,使用專用AI加速器的收益往往大于加強處理器性能。
從應用的角度來說,AI加速器搭配MCU更加主流的主要原因是需要AI的場景越來越普遍,而且從具體的算法和模型來看正在收斂到少數幾個模型,例如機器視覺(人臉識別,物體識別)和語音喚醒詞中需要的卷積神經網絡,以及在一些較為先進的語音識別中需要的循環(huán)神經網絡(RNN)。如果說在三年前,未來AI算法和應用生態(tài)前景還不夠明確,因此會出現走專用化(AI加速器)和通用化(加強處理器性能以及可編程協處理器)兩條道路的話,那么在應用和相關算法都已經很集中的今天,AI加速器已經成為較為明確的選擇了,因為一方面使用專用化的AI加速器可以提供最佳的性能和能效比,而且另一方面在芯片設計門檻上事實上也并不太高,事實上更考驗設計能力的反而是編譯器和相關的軟件/模型優(yōu)化。因此,我們認為在未來會有更多智能MCU相關的產品和解決方案出現。
MCU與APU的融合
我們觀察到的另一個趨勢是MCU和APU,至少在一些熱門的場景中(例如智能家電),正在走向融合以組成新的系統(tǒng)。
在過去的家用電器中,MCU是常見的元件,它主要用于家用電器的控制,并且能執(zhí)行一些簡單的預定義程序。上一代家用電器中,需要用到計算的場景幾乎沒有,所以MCU除了控制之外,并不需要負責計算。而在上一代的MCU和APU的分工定位中,MCU通常意味著低功耗,低成本,低處理能力;而APU則代表著高性能,高成本以及高功耗。在對于成本需求較高的家電領域,使用高成本APU的機會很少。
而在這一代的智能家電中,隨著AI的普及,對于計算的要求越來越高,這也是MCU越來越多搭配AI加速器的原因。除此之外,“智能化”的另一個涵義通常是能和人做交互,因此在這些智能家電中,往往還需要跑一個操作系統(tǒng),這樣的需求就會需要一個類似APU的核來完成。在這樣的需求下,使用APU搭配能處理AI算力的MCU就是一個合理的選擇。這里的MCU不再是傳統(tǒng)上用于watchdog的APU周邊設備,而是一個能以高能效比處理大量實際任務的重要模塊。舉例來說,在需要聲控喚醒的智能設備中,就可以采用這樣的方案:高功耗的APU絕大多數時候處于深度睡眠狀態(tài),同時帶有AI處理能力的低功耗MCU則處于監(jiān)聽狀態(tài),當MCU上以低功耗運行的AI加速器檢測到喚醒詞時,MCU負責喚醒APU,同時APU則執(zhí)行更復雜的語音識別算法并且完成相應的操作,例如播放音樂,或者語音通話等等。在這樣的一個系統(tǒng)中,智能MCU和APU各負其責,由于絕大多數時間APU處于深度睡眠狀態(tài),因此整體功耗可以控制到較低的水準;同時,我們看到MCU需要監(jiān)聽環(huán)境,執(zhí)行AI算法并且在需要的時候準備喚醒APU,因此MCU中的高能效比AI處理能力就成了關鍵。
此外,另一個推動APU+智能MCU方案的因素是智能家居對于成本的需求不再那么苛刻。一方面,不少消費者愿意為智能家居中的AI能力付相應的溢價;另一方面,許多智能家居的背后有著互聯網巨頭的加持,智能家居更多是一個使用互聯網巨頭相應服務的一個入口,因此相對于成本互聯網公司更關心的是智能家居能實現的功能特性。因此,智能家居對于成本的要求不再像上一代家用電器那么苛刻,從而APU+智能MCU的方案也會得到更多的應用。
市場生態(tài)將如何發(fā)展?
智能MCU未來的市場生態(tài),我們認為可以從多個維度去分析。
首先是RISC-V和ARM之間的競爭格局。從智能MCU的技術生態(tài)方面做分析,我們認為RISC-V在這個智能領域并沒有特別的優(yōu)勢。如前所述,智能MCU的主流技術路徑是MCU搭配AI加速器,而AI加速器的設計通常和處理器指令集(即使用ARM還是RISC-V)關系不大。另一方面,AI加速器中事實上軟件編譯器是一個重要難點,而這一方面擁有較大團隊和時間投入的ARM顯然更有優(yōu)勢一些。另一方面,RISC-V在這個領域的使用往往是考慮到可定制性和可控知識產權,因此我們認為更有可能是一些對于深度定制產品的大公司有更大的動力去使用RISC-V來實現芯片-軟件-產品協同設計。一個典型的例子就是阿里巴巴對于RISC-V的大力投入,我們認為未來中國基于RISC-V的智能MCU很可能會首先在阿里巴巴的物聯網和智能家居產品中成為主力。
其次,我們還可以分析智能MCU中AI加速器方案的生態(tài)。目前,除了以ARM的microNPU為代表的AI加速器之外,還有以CadenceHiFi系列為代表的的DSP也在積極布局這個市場。DSP在這個市場的主要優(yōu)勢在于語音相關的AI應用,因為DSP技術在音頻相關應用已經有了幾十年的積累,因此在加入神經網絡支持后就可以覆蓋語音相關的AI場景,而目前我們看到的是智能語音占領了智能MCU中很大的一塊市場需求,這也為DSP方案提供了很強的支撐。而在以機器視覺為主的方案中,一個專門為卷積神經網絡做優(yōu)化的AI加速模塊目前來從性能和能效比還是會更強一些。
最后,我們還看到了許多以低功耗為主打的AI芯片公司也在積極布局這個市場,例如能實現微瓦級別機器視覺任務加速的識時科技等。以傳統(tǒng)公司立足MCU并加入AI加速模塊賦予MCU以智能不同,AI芯片公司對于這個市場的打法是基于自己的AI處理器方案,搭配一個MCU來實現智能MCU。這樣的方案更適合對于人工智能處理有極致需求的場景(比如需要超低功耗超高能效比的AI處理能力,類似智能門鎖等),因此隨著未來AI應用場景進一步下沉,我們預計會看到會有越來越多的AI芯片公司進入這個市場。