應(yīng)用

技術(shù)

物聯(lián)網(wǎng)世界 >> 物聯(lián)網(wǎng)新聞 >> 物聯(lián)網(wǎng)熱點新聞
企業(yè)注冊個人注冊登錄

數(shù)讀全球人工智能格局——2018年斯坦福AI報告發(fā)布

2018-12-18 09:01 億歐

導(dǎo)讀:上周,2018年度的斯坦福AI報告發(fā)布,從學(xué)界、企業(yè)、政府和公眾等不同主體出發(fā),通過論文發(fā)布及引用、學(xué)術(shù)會議、初創(chuàng)公司、技術(shù)進(jìn)展等幾個主題對當(dāng)前全球人工智能格局進(jìn)行了全面的數(shù)據(jù)呈現(xiàn)和分析解讀。

上周,2018年度的斯坦福AI報告發(fā)布,從學(xué)界、企業(yè)、政府和公眾等不同主體出發(fā),對人工智能當(dāng)前的進(jìn)展進(jìn)行了數(shù)據(jù)呈現(xiàn)。經(jīng)過長期的跟蹤、整理和分析人工智能相關(guān)數(shù)據(jù),報告發(fā)現(xiàn),美國目前在人工智能的學(xué)術(shù)影響力專利產(chǎn)出、和商業(yè)活躍質(zhì)量具有明顯優(yōu)勢,中國則在學(xué)術(shù)論文發(fā)表方面相當(dāng)高產(chǎn),但就發(fā)展質(zhì)量而言仍有待提升。在人工智能內(nèi)部,機(jī)器學(xué)習(xí)和概率推理、神經(jīng)網(wǎng)絡(luò)、計算機(jī)視覺三個子領(lǐng)域備受學(xué)界關(guān)注,這也影響到了企業(yè)創(chuàng)業(yè)和人才需求。

以下,億歐智庫以論文發(fā)布、論文引用、學(xué)術(shù)會議、初創(chuàng)公司等幾個模塊,對報告的主要內(nèi)容進(jìn)行呈現(xiàn)整理:

論文發(fā)布情況

發(fā)布論文主題來看,AI相關(guān)的論文增速(8x)在2010年后已經(jīng)大幅超過計算機(jī)科學(xué)領(lǐng)域(6x),從一定程度表明人工智能領(lǐng)域的論文增長不僅僅是由人們對計算機(jī)科學(xué)興趣的提高所驅(qū)動的。

不同主題的發(fā)表論文增速

區(qū)域來看,歐洲一直是AI論文主要的發(fā)布來源地,占到整體的28%。中國(25%)自2006年后開始超越美國(17%),并在2008年實現(xiàn)出版數(shù)的高漲,報告推測是《國家中長期科學(xué)和技術(shù)發(fā)展規(guī)劃綱要(2006-2020)》和其他政府項目為人工智能研究提供資金和一系列激勵政策的結(jié)果。

AI論文數(shù)量(分區(qū)域)

AI領(lǐng)域的子類目中(類別間不互相排斥),機(jī)器學(xué)習(xí)和概率推理(Machine Learning and Probabilistic Reasoning)占到最高比例,為56%,而神經(jīng)網(wǎng)絡(luò)(Neural Networks)是2014年以來增速最快的研究領(lǐng)域,年復(fù)合增長率達(dá)到37%。計算機(jī)視覺也保持了較高的增速。搜索及優(yōu)化、自然語言處理及知識表示、模糊系統(tǒng)、規(guī)劃和決策類論文目前還未呈現(xiàn)大的增長。

AI各子領(lǐng)域的論文數(shù)量

ArXiv是收錄科學(xué)文獻(xiàn)預(yù)印本的在線數(shù)據(jù)庫(其中預(yù)印本是指學(xué)者的還未在正式出版物上發(fā)表,而出于和同行交流目的自愿發(fā)布的科研論文或報告),投稿量每月高達(dá)上萬篇。鑒于知識的更迭速度和研究主題的競爭性,學(xué)者往往會在漫長的期刊/學(xué)術(shù)會議審核期之前就投稿在ArXiv上。數(shù)據(jù)顯示投稿的AI相關(guān)論文整體呈現(xiàn)增長,其中計算機(jī)視覺和模式識別占最大比例,體現(xiàn)了學(xué)者較高的傳播意愿。

不同領(lǐng)域的AI論文數(shù)量(基于arXiv)

關(guān)注領(lǐng)域來看,中國對AI的研究側(cè)重于工程技術(shù)和農(nóng)業(yè)科技,歐美則集中在人文和醫(yī)藥科學(xué)。

AI研究關(guān)注行業(yè)(分區(qū)域)

論文發(fā)布的主體來看,學(xué)術(shù)論文仍占絕大部分,其次則來自政府、企業(yè)。以中國為例,92%的AI論文來自學(xué)術(shù)領(lǐng)域。此外,2017年中國政府主體發(fā)布的論文是企業(yè)的4倍。而美國的企業(yè)主體發(fā)布的論文不論從數(shù)量還是所占比例來講都高于中國。由此可見,美國在人工智能科研方面的商業(yè)化驅(qū)動力相對更強(qiáng)。

論文被引用量

FWCI(Field-Weighted Citation Impact,領(lǐng)域權(quán)重引用影響系數(shù))是指該區(qū)域AI學(xué)者收到的平均引用次數(shù)除以所有AI作者的平均引用次數(shù),能在一定程度反映論文質(zhì)量。從數(shù)據(jù)來看美國的FWCI指數(shù)達(dá)到1.83,盡管歐洲的AI論文發(fā)布量最高,但其FWCI指數(shù)略高于平均水平。中國的論文質(zhì)量則在持續(xù)穩(wěn)步的提高中。

FWCI指數(shù)(分區(qū)域)

考慮到AI學(xué)者的國際流動性,報告也針對做出研究。數(shù)據(jù)顯示,中美歐三個區(qū)域的久居型學(xué)者(指從未遷移至外國發(fā)表論文)的產(chǎn)出率最低,而那些動態(tài)遷出遷入的“候鳥型”作者的論文產(chǎn)出和被引用水平更高。其中中國的久居型學(xué)者所占比例最高(75%),相比歐美同類型學(xué)者更加高產(chǎn),但論文質(zhì)量仍有待提升。

學(xué)術(shù)會議

在AI相關(guān)的老牌學(xué)術(shù)會議中,NeurIPS(神經(jīng)信息處理系統(tǒng)大會)、CVPR(計算機(jī)視覺與模式識別會議)、ICML(國際機(jī)器學(xué)習(xí)大會)人數(shù)增長較快。此外,學(xué)界對深度學(xué)習(xí)和強(qiáng)化學(xué)習(xí)的關(guān)注,助推ICLR(國際學(xué)習(xí)表征會議)的新興小型學(xué)術(shù)會議規(guī)??焖僭鲩L。

大型AI會議參會人數(shù)

AAAI(美國人工智能協(xié)會)作為國際性的重要AI學(xué)術(shù)會議,具備較強(qiáng)的專業(yè)度和影響力。按所屬國家對會議提交和接受的論文歸類,70%均來自于中美兩國,兩國的論文通過率分別為29%、21%。

2018AAAI會議論文投稿和接受數(shù)(分區(qū)域)

如今,超過50%的人工智能相關(guān)機(jī)構(gòu)是非營利組織,包括美國公民自由聯(lián)盟、牛津大學(xué)人類未來研究所和聯(lián)合國開發(fā)計劃署。同時,人們更加認(rèn)識到性別和種族多樣性對AI進(jìn)步的重要性,AI4ALL和WiML等鼓勵多元群體參與到AI研究的組織成員數(shù)有所增加。

初創(chuàng)公司、風(fēng)投和人才需求

報告通過統(tǒng)計美國初創(chuàng)公司(接受過風(fēng)險投資支持)每年的累計數(shù)量,發(fā)現(xiàn)在初創(chuàng)公司數(shù)量整體穩(wěn)步增長的同時,AI領(lǐng)域初創(chuàng)公司則開始呈現(xiàn)指數(shù)級增長的趨勢,成為創(chuàng)業(yè)主旋律。

每年獨立的風(fēng)險投資數(shù)額呈現(xiàn)波動趨勢。自2015年以來,AI領(lǐng)域的投資金額迅速高漲,峰值比2014年來的風(fēng)投擴(kuò)張期來得更早。

針對初創(chuàng)公司的風(fēng)險投資數(shù)額

在此背景下,企業(yè)對人工智能相關(guān)人才的需求也更加旺盛,機(jī)器學(xué)習(xí)和深度學(xué)習(xí)尤為明顯,其中深度學(xué)習(xí)的職位需求在2015~2017年間有了35倍的增長。

企業(yè)AI相關(guān)的職位需求

企業(yè)關(guān)注度和應(yīng)用情況

針對紐交所上市公司,研究發(fā)現(xiàn),財報電話會議中提及人工智能和機(jī)器學(xué)習(xí)的頻次自2015年來大幅增長。而提及兩者最多的行業(yè)依次是IT、非必需消費品、金融和醫(yī)療保健行業(yè),企業(yè)則分別是英偉達(dá)(AI提及93次)、Alphabet(機(jī)器學(xué)習(xí)提及57次)。在中國,大量的科技和互聯(lián)網(wǎng)公司也呈現(xiàn)言必提AI的程度。

財報電話會議對不同技術(shù)的提及頻次

麥肯錫在2018年對受訪者所在公司在某些業(yè)務(wù)中嵌入AI功能的情況進(jìn)行了調(diào)研,結(jié)果發(fā)現(xiàn)不同的人工智能技術(shù)在世界各地和不同行業(yè)中得到廣泛采用,大約一半的公司已經(jīng)將人工智能嵌入到公司的業(yè)務(wù)流程中。然而,AI應(yīng)用還處在早期,大多數(shù)公司還未采取措施從人工智能大規(guī)模獲取價值。

不同行業(yè)的各個環(huán)節(jié)的AI采用率

技術(shù)進(jìn)展程度

在2015年,ImageNet視覺識別挑戰(zhàn)賽中的算法模型識別精度已經(jīng)超過人類水平,2017年進(jìn)一步提升至了97%左右。盡管競賽在2017年已是最后一屆,ImageNet2012開放數(shù)據(jù)集仍在被引用,可以說,ImageNet所構(gòu)建的規(guī)則為研究者提供了標(biāo)準(zhǔn)的研究度量進(jìn)行比較競爭。

1545044117188073.png

利用ImageNet數(shù)據(jù)集培訓(xùn)能夠進(jìn)行高精度圖像分類的大型網(wǎng)絡(luò)在以往需要耗費不少時間。對于擁有足夠資源機(jī)進(jìn)行開發(fā)的參與者而言,培訓(xùn)網(wǎng)絡(luò)所需的時間已經(jīng)從一年半前的1小時降到了大約4分鐘,速度提升了16倍,算法創(chuàng)新和硬件進(jìn)步在其中發(fā)揮了重要作用。

其他如COCO(微軟發(fā)布的圖像數(shù)據(jù)庫,用于對象檢測、分割、人體關(guān)鍵點檢測、語義分割和字幕生成等)、Parsing(語法分析)、機(jī)器翻譯、機(jī)器問答等競賽或應(yīng)用領(lǐng)域在近年來的算法精度也均有不同程度的提高,此處不一一贅述。

其他

專利:從區(qū)域來看,2014年,人工智能專利中有30%便來自美國,其次則是日、韓兩國,各占有16%的比例。

AI專利數(shù)量(分區(qū)域)

學(xué)校開設(shè)課程:AI的火熱也發(fā)生在高校中,學(xué)生報名注冊人工智能和機(jī)器學(xué)習(xí)的比例和數(shù)量也隨之增長。在報告的統(tǒng)計的幾所美國頂尖計算機(jī)科學(xué)高校中,2017年機(jī)器學(xué)習(xí)基礎(chǔ)課程的注冊人數(shù)是2012年水平的5倍,AI課程注冊人數(shù)是2012年的3.4倍。在中國,清華大學(xué)的AI及機(jī)器學(xué)習(xí)課程自2010年到2017年更是實現(xiàn)了16倍的增長。

Github星數(shù):GitHub(知名開源軟件網(wǎng)站)的星數(shù)類似于關(guān)注數(shù),基本能判定AI編程語言的流行程度。目前TensorFlow(Google)一騎絕塵,其后是Pytorch(Facebook)、mxnet(Amazon)。

Github編程語言的流行程度

ROS安裝:ROS(robot operating system,機(jī)器人操作系統(tǒng))是目前在人工智能領(lǐng)域被廣泛使用的機(jī)器人軟件平臺。自2014年, 來自唯一IP地址的ROS安裝包下載次數(shù)實現(xiàn)了567%的增長。從頁面瀏覽量來看,中國增長最為明顯,值得一提的是,百度的自動駕駛平臺Apollo就是基于ROS開發(fā)的。

ROS頁面瀏覽量

工業(yè)機(jī)器人安裝量:自2012年以來,中國每年的機(jī)器人安裝量增長了500%,而韓國和歐洲等其他地區(qū)分別增長了105%和122%。

機(jī)器人安裝量

媒體報道情緒:在包含人工智能一次的媒體文章中,情感表達(dá)正面的文章所占比例逐步增多,為30%,負(fù)面文章則一直保持低水平。

政府關(guān)注度:通過采集美國、加拿大、英國議會的記錄文本,報告發(fā)現(xiàn)自2016年來政府對人工智能和機(jī)器學(xué)習(xí)的提及次數(shù)大幅增加。

報告最后還列舉了歷年來重要的里程碑式事件、中國及歐美政府在人工智能領(lǐng)域的主要舉措、專家對人工智能目前缺陷所給的建議等內(nèi)容。以上僅對報告的主體部分進(jìn)行了闡述,如需了解報告完整內(nèi)容,官網(wǎng)鏈接如下:https://aiindex.org/