應用

技術

物聯(lián)網世界 >> 物聯(lián)網新聞 >> 物聯(lián)網熱點新聞
企業(yè)注冊個人注冊登錄

當AI入職FBI,克格勃直呼內行

2020-11-03 14:24 腦極體

導讀:明明 AI 連預測個天氣都時準時不準,怎么就突然能預報國家大事了?

“城市東部的一所房屋有炸彈即將爆炸!”

“炸彈是由捕鼠器,ACDelco 品牌 AA 電池和鍍鋅管碎片組成的,似乎跟轟炸機有關。”

“恐怖分子來電,第五枚炸彈已經在聯(lián)邦快遞的傳送帶上了!”

上述劇情如果發(fā)生在好萊塢電影里,此刻一定會出現(xiàn)一群運籌帷幄的聯(lián)邦調查局分析師,在蛛絲馬跡中開展一場爭分奪秒的競賽,利用各種類型的數(shù)據(jù)中,抽絲剝繭,作出預判,再與一線特工們緊密合作,阻止悲劇的發(fā)生。

這事兒聽起來,是不是比下象棋、寫文章、玩游戲、替人巡邏、流水線“打工人”要炫酷多了?

最近美國情報高級研究項目活動(IARPA)提出利用人工智能來預測地緣政治事件,進而找出恐怖分子、黑客或任何被認為是美國敵人的人,所以我們就借此機會,聊聊AI做情報分析師這事兒,到底靠不靠譜。

科學算命:美國情報機構來了一位新員工

IARPA 所自主的一些項目,從技術角度看都是我們熟悉的名字:量子計算、低溫計算、人臉識別、通用語言翻譯等等,這些看起來人畜無害的項目,好像和 BAT 這種大廠的實驗室沒啥不一樣。

但作為一個由間諜以及博士精英們組成的機構,一切顯然不會這么簡單,IARPA 可以說是美國政府秘密項目中風險最大、影響最深遠的一個,因為它需要告訴決策者未來可能發(fā)生的地緣政治事件。

他們關注的大多是諸如:G7 成員國是否會(在某一特定日期)對敘利亞發(fā)動軍事攻擊?委內瑞拉一個月內究竟能生產多少石油等等,之類的硬核題材。

那AI在其中扮演了什么角色呢?比如 IARPA 資助的一個名叫 SAGE 的項目,就是利用機器學習來進行協(xié)同預測,通過合作將大量的人類非專家預測因子集中起來,使它們“比單一的人類專家預測得更準確、更快”。

通過這一混合模型,SAGE 可以向人類提供機器從圖表中獲得的信息,將趨勢可視化呈現(xiàn)出來,以及AI做出的具體預測。

該項目的負責人、南加州大學維特比信息科學研究所(ISI)人工智能部主任阿蘭·加爾斯泰安(Aram Galstyan),前不久就發(fā)聲說,SAGE 成功預測了朝鮮何時將發(fā)射導彈試射。聽起來是不是很刺激?

放在上古時代,擁有占卜未來能力的 AI 絕對會成為部落里權利最高的大巫師。不過子不語亂力亂神,想必大家更想知道這種玄而又玄的能力到底是怎么來的。

耳目、尖兵、參謀:分析師的職場密碼,AI 學會了幾招?

明明 AI 連預測個天氣都時準時不準,怎么就突然能預報國家大事了?

用南加州大學計算機科學家弗雷德·莫爾斯塔特(Fred Morstatter)的話來說,“AI 之所以有效,是因為人類有硬幣的一面,而機器有硬幣的另一面”——不是針砭時事、運籌帷幄,而是與以前的分析工具相比,讓人類更加準確地抵達未來。說人話就是提高“猜中”的概率和效率。

就拿雙十一剁手來說,電商網站的“猜你喜歡”合你心意的幾率越來越高多了,其中就有分析預測模型的功勞。

國家大事也同樣遵循這一定律,在各類犯罪行為發(fā)生之前,通過不正常的間諜活動、社交網絡動態(tài)、消費記錄等等,來分析和研究對象的行為與活動,將潛在損害扼殺在搖籃里。所以 AI 在政治預測中起到的作用,更像是一個情報分析師,而非指哪兒打哪兒的超級特工。

一個情報分析師應該具備哪些能力?簡單來說有三個:耳目、尖兵、參謀,AI 又做到了哪一階段?

1. 無處不在的數(shù)字“耳目”。

預測的前提,是在數(shù)據(jù)收集環(huán)節(jié)就能夠提供給分析師們足夠規(guī)模的準確而有效的數(shù)據(jù)。

古代的大巫師靠燒龜殼、看星象來“未卜先知”。而 IARPA 的操作模式,就將數(shù)據(jù)收集通過人工智能進行自動化管理,根據(jù)《匹茲堡郵報》的報道,該系統(tǒng)“能夠全天候記錄世界各地所有人的生活?!?/p>

其中包括了每一篇 Facebook 帖子、推特和 YouTube 視頻;每一個收費站的標簽號碼;每一個 GPS 下載、網絡搜索和新聞提要;每一個街頭攝像機視頻,甚至是每一次外賣下單和餐廳預約……

IARPA 的系統(tǒng)讓程序沒日沒夜地不斷訪問并抓取這些數(shù)據(jù),輸送到上游來支撐決策。

2. 先知先覺的模型“尖兵”。

每個人對數(shù)據(jù)的敏感度和運用能力是不同的,一個對各種信息和情報變化不敏感的人,自然無法從中洞察并做出對未來的判斷和預測,也就是缺乏態(tài)勢感知(Situation Awareness,SA)的能力,而 AI 亦如是。

要在讀懂大量信息和情報的基礎上,結合復雜的國內外政治、經濟、科技、文化環(huán)境等等,找到規(guī)律,這就需要復雜且高性能的模型了。

模型,也就是一種預測的基本方法論,就像媒體們總愛拿“義烏指數(shù)”來預測美國大選結果(競選者的應援道具如旗子等大多是由義烏生產的)一樣。一個有效的預測模型,可以成為一把尖刀,在紛繁的大數(shù)據(jù)中間庖丁解牛、抽絲剝繭。

這一部分可以說是科技競賽的核心機密了,IARPA 到底采用了哪些算法創(chuàng)新我們不得而知,但從大體來看,一般通用的包括決策樹、回歸技術、聚類算法、深度神經網絡等等,結合 NLP 自然語言處理來理解網絡信息,來綜合判斷事件的走向與結果。這也是一個科技廠商的大練兵場,比如在 2015 年巴西世界杯期間,谷歌、微軟、百度、高盛等巨頭就對全部 64 場比賽的勝負結果,以及冠軍和黑馬進行了預測,哪家準確率更高大家可以自己搜搜看。

3. 不令而信的決策“參謀”。

光有模型,那豈不是沒有人類啥事兒了?如果要評選“最晚被 AI 搶走崗位的職業(yè)”,那情報分析師一定位居前列。原因無他,分析的目的是為行動服務的。

尤其是 IARPA 這樣的情報機構,最終是要針對各種可能的突發(fā)政治事件、公共危機、恐怖活動等等,迅速產出針對性、國家性的戰(zhàn)略決策。

這就需要兩個前提:第一,創(chuàng)新。分析師更強調基于隱性知識的處理和分析,并在此基礎上提出自己的論斷和建議。對于未來不確定的事物,個人的既有知識與經驗就極為重要了。如果拿情報流程鏈來說的話,數(shù)據(jù)收集與模型分析大概處于前半段,而后半段能改變事情走向的則來自于專家的智慧結晶。

尤其是一些主觀層面的信息,必須面對面溝通才能從表情、言談舉止中反映出來,依然需要人類分析師出馬,AI 在后端提升的效率優(yōu)先;還有一些隱藏信息,像是一些國家大政方針之類的報告等等,在網絡上可能根本就沒有任何數(shù)據(jù)留存,也讓 AI 心有余而力不足。在這個 AI 連小學生作文都寫不好的當下,人類分析師的飯碗自然端的穩(wěn)穩(wěn)的。

IARPA 就每 3 年到 5 年輪換一批項目經理,這些人往往來自各個領域,比如語言學、航空航天、原子物理、人工智能、生物識別、神經科學等等。

第二,影響力。分析師所找到的“政策密碼”,不能閉門造車,最終要在現(xiàn)實中接受檢驗,而執(zhí)行力度就取決于其建議被認可的程度了。如果是 AI 上馬,它能保證執(zhí)行者不用三令五申就會遵守服從嗎,能讓隊友們勇往直前時不需要為判斷失誤而擔憂嗎,預測錯誤導致行動失敗的責任又如何劃分呢?

換句話說,分析師兜售的是一種具有不確定性的“思想商品”,這就需要其具備能夠與他人發(fā)生關系、獲得認可,并推動他人更充分地展開行為的能力。

技術與影響力,在分析師這一角色的能力體系中互為表里。少了后者的 AI,目前只能當個“工具人”。

讀到這里,或許我們不會對 IARPA 的 AI 動作有太高的憂慮感。不過,此前我國也有領導人提出了“從科技規(guī)律出發(fā)前瞻思考世界科技發(fā)展走勢,提出咨詢建議,開展科學評估,進行預測預見,在國家宏觀決策中發(fā)揮建設性作用”的意見。

我們能從 IARPA 打造 AI 情報師的經驗中,去粗取精找到什么收獲嗎?

變局之前:AI 情報待解的隱患

盡管兩國國情不同,但從美國政府機構將 AI 引入情報工作的動作以及引起的輿論反響中,也可以幫我們規(guī)避掉許多不必要的煩惱。

目前來看,IARPA 的 AI 實踐有幾點值得探討。

首先,AI 預測結果只在小部分范圍內有效,并沒有更多案例被曝光。除了技術本身的原因之外,許多地方的數(shù)據(jù)覆蓋范圍并不普遍也有著直接關系。數(shù)據(jù)是預測的前提,數(shù)據(jù)不足自然會出現(xiàn)失真的情況。

還有一些領域的規(guī)律不明顯,充滿了突發(fā)事件和意外影響,比如商界相對于農林牧漁等傳統(tǒng)行業(yè),時不時就有人為因素影響,這些都需要不斷實時修正。

因此,AI 在信息 、知識的獲取和處理上所體現(xiàn)出的極強能力,值得重視,卻也不用過度緊張。

另外,IARPA 在 AI 情報分析上過度發(fā)力,已經開始侵犯公民的信息邊界。此前就有媒體曝出,IARPA 對國家安全局收集的數(shù)百萬私人海外通信進行數(shù)據(jù)挖掘,盡管其目的是防止恐怖活動,但濫用和侵犯隱私權的可能性也已經引起了不少觀察家的警覺。

在美國,這樣的事情還不在少數(shù),2017 年,F(xiàn)acebook 收到了來自世界各國政府的 78890 條信息請求,41%來自美國,其中 85%的請求得到了批準,同時也向谷歌、蘋果和其他公司提出了類似的要求。

美國國土安全部(U.S.Department of Homeland Security)的一篇帖子也顯示,他們正試圖創(chuàng)建一個系統(tǒng),能夠“全天候訪問有密碼保護的影響力人群的個人社交媒體,并從內容、情感、數(shù)量等方面進行分析”。

如何平衡好公民隱私安全與國家利益之間的問題,考驗著政府對待數(shù)字化、智能化技術的管理水平。

而在沒有給出具有說服力的共識方案之前,我想大多數(shù)人都會更希望這一天更慢一點到來。