導(dǎo)讀:人工智能的出現(xiàn),讓業(yè)務(wù)邏輯層開始發(fā)生翻天覆地變化。如何讓新技術(shù)從研究到研發(fā)逐環(huán)節(jié)培育轉(zhuǎn)移?如何讓新技術(shù)從原型到創(chuàng)新產(chǎn)品到核心產(chǎn)品逐層吸收應(yīng)用?
圖片來自“123rf.com.cn”
先來想想未來。
未來的企業(yè)應(yīng)用特征是社會化商業(yè)、網(wǎng)絡(luò)連接、數(shù)據(jù)智能
未來的信息化場景是企業(yè)互聯(lián)網(wǎng)-產(chǎn)業(yè)互聯(lián)網(wǎng)-社會化商業(yè)
未來的信息化產(chǎn)品體系是產(chǎn)業(yè)互聯(lián)網(wǎng)云服務(wù)、中臺與平臺、企業(yè)級云ERP
未來的數(shù)字化場景是智能零售、智能倉儲物流運(yùn)輸、智能車間、智能辦公、智能城市
未來的數(shù)字化產(chǎn)品體系是智能硬件芯片、智能OS、IoT物聯(lián)網(wǎng)接入平臺、可視屏音箱助手
1.網(wǎng)絡(luò)連接:互聯(lián)網(wǎng)服務(wù)連接平臺、物聯(lián)網(wǎng)連接平臺、SaaS服務(wù)連接平臺、ERP集成平臺
2.數(shù)據(jù):數(shù)據(jù)中臺、大數(shù)據(jù)技術(shù)平臺
3.智能:人工智能技術(shù)平臺、人工智能應(yīng)用中臺
未來的技術(shù)棧是:
用戶交互層:傳感器、人工智能視覺識別/語音交互
邏輯層:Open API Mesh、人工智能關(guān)聯(lián)推薦算法
數(shù)據(jù)層:人工智能精準(zhǔn)搜索/關(guān)系圖譜、區(qū)塊鏈
1.IT服務(wù):云訂閱服務(wù)、智能硬件
2.金融服務(wù):大數(shù)據(jù)+AI驅(qū)動的金融信貸服務(wù)、大數(shù)據(jù)+AI驅(qū)動的金融科技服務(wù)(聚合支付服務(wù)、反欺詐服務(wù)、信用服務(wù)、實(shí)時(shí)風(fēng)控服務(wù))
3.業(yè)務(wù)服務(wù):大數(shù)據(jù)+AI驅(qū)動的:社會化財(cái)稅自動化服務(wù)、社會化用工調(diào)度服務(wù)、社會化營銷數(shù)字化服務(wù)、社會化供應(yīng)鏈資源調(diào)度服務(wù)
看,從客戶需求,到產(chǎn)品,到技術(shù),到商業(yè)模式,全不一樣了。面對未來,不管是中國BAT互聯(lián)網(wǎng)公司,還是中國企業(yè)軟件公司,還是國外的企業(yè)軟件巨頭公司,還是實(shí)業(yè)企業(yè)的科技公司,大家全都同一個(gè)起跑線,全都懵逼探索,就看誰從研究、戰(zhàn)略合作、資本融資與投資并購、組織與人才、激勵多方組合,誰能做到:選準(zhǔn)、做對、跑得快,誰就能贏得未來。
人工智能專業(yè)發(fā)展了60年,一共折翼兩次。一次是剛剛發(fā)展起來,想通用解決問題,太樂觀,當(dāng)然折翼。一次是90年代,吸收了第一次的經(jīng)驗(yàn)教訓(xùn)不搞通用了,專門做細(xì)分專業(yè)領(lǐng)域的專業(yè)系統(tǒng),但太依賴專業(yè)領(lǐng)域知識加工,還是沒法做成商業(yè)。
如何不強(qiáng)依賴專業(yè)領(lǐng)域知識呢?嘿嘿嘿,這就是這一次的發(fā)力重點(diǎn):深度學(xué)習(xí)。這會對上層視覺識別、語音交互、自然語言處理三大應(yīng)用領(lǐng)域都有加持助推效能。
而在深度學(xué)習(xí)領(lǐng)域,Google收購的英國DeepMind公司在這塊有兩個(gè)重大突破:神經(jīng)網(wǎng)絡(luò)(質(zhì)量)、TransFormer(性能)。所以,各種CNN(卷積神經(jīng)網(wǎng)絡(luò))、MTCNN(多任務(wù)卷積神經(jīng)網(wǎng)絡(luò))、RNN(循環(huán)神經(jīng)網(wǎng)絡(luò))、DNN(深度神經(jīng)網(wǎng)絡(luò))、ResNet(深度殘差網(wǎng)絡(luò))、LSTM(時(shí)間序列長短期記憶網(wǎng)絡(luò))、GAN(生成式對抗網(wǎng)絡(luò))。
模型改進(jìn):大規(guī)模無監(jiān)督模型GPT-2,并且結(jié)合了Attention機(jī)制,頗適合圖像生成質(zhì)量優(yōu)化。
算法改進(jìn):如BERT算法,頗適合NLP訓(xùn)練質(zhì)量優(yōu)化。
當(dāng)然,這些網(wǎng)絡(luò)結(jié)構(gòu)、算法、模型、機(jī)制都已經(jīng)被開源成深度學(xué)習(xí)平臺,這讓高深的人工智能走入普通IT公司:
Google:Tensorflow/Koras
Facebook:Caffe/Pytorch
微軟:CNTK/DMTK
AWS:MXNet
OpenAI:Open AI(目前尚無完全開源)
Apache:OpenNLP
百度:PaddlePaddle
Salesforce:TransmogrifAI
除了在算法模型平臺層有開源外,在其他幾個(gè)方面也湊在了一起:
算力芯片層:英偉達(dá)借助區(qū)塊鏈比特幣大風(fēng)發(fā)展起來專用芯片GPU,也可用于人工智能。Google發(fā)布了TPU。
算力資源層:AWS、Azure云計(jì)算廠商都提供了人工智能訓(xùn)練所需的IaaS服務(wù),正好適合人工智能訓(xùn)練這種波峰波谷的工作。
數(shù)據(jù)存儲層:AWS、Azure云計(jì)算廠商都提供了云分布式對象存儲服務(wù)、大數(shù)據(jù)存儲平臺、大數(shù)據(jù)計(jì)算平臺
數(shù)據(jù)集層:4G、智能手機(jī)/高清攝像頭、照片相冊云盤這三樣的普及,讓圖像數(shù)據(jù)積累快速膨脹。
所以說,這是學(xué)術(shù)界(算法模型)、工程界(開源)、云計(jì)算、智能手機(jī)移動互聯(lián)網(wǎng)四者疊加的效果。所以,為啥這次學(xué)術(shù)界的人紛紛加入產(chǎn)業(yè)界,就是因?yàn)檫@個(gè)原因,沒有數(shù)據(jù)沒有算力沒有應(yīng)用場景,就沒法改進(jìn)算法模型。
開源是個(gè)好東西。
我這里就是列了一些通用的、大面的。至于更詳細(xì)的,大家可以看:paperswithcode這個(gè)網(wǎng)站,浩如煙海的論文和代碼,你想要的都在這里。
一、視覺
OpenCV(Intel) DeepDream (Google)
人臉識別:InSightFace
物體檢測:Detectron(Facebook)
二、語音
語音到文字:wav2Letter(Facebook)
語音識別:kaldi(約翰霍普金斯大)
文字到語音:VoiceLoop(Facebook)、Merlin(英國愛丁堡大學(xué))
三、NLP
搜索:Apache的Nutch、Luence、ElasticSearch
關(guān)聯(lián)推薦:PredictionIO (Salesforce) 關(guān)聯(lián)推薦算法庫LibRec (中國東北大學(xué))
對話系統(tǒng):如DeepPavlov(莫斯科物理學(xué)院)、ParlAI(Facebook)、Texar(卡耐基梅隆大學(xué))
通用NLP:Pytext(Facebook)、OpenNLP(Apache)、Spacy、AllenNLP、NLTK(賓夕法尼亞大學(xué))、CoreNLP(斯坦福大學(xué))、HaNLP(中國哈工大)、FastNLP(中國復(fù)旦大學(xué))
四、深度學(xué)習(xí)
深度學(xué)習(xí):Tensorflow/Koras(Google)、Coffe/Pytorch(Facebook)、微軟CNTK/DMTK、AWS的MXNet、百度的PaddlePaddle。Salesforce還針對Tensorflow出了一套簡化封裝的流水線TransmogrifAI
增強(qiáng)學(xué)習(xí):Dopamine(Google)
五、機(jī)器學(xué)習(xí)/數(shù)據(jù)挖掘
算法庫:Spark MLlib、Numpy、Pandas
最早我們寫應(yīng)用,是UI、邏輯、數(shù)據(jù)一體化,如DBaseIII。
后來出現(xiàn)了大型關(guān)系數(shù)據(jù)庫,我們才有了C/S結(jié)構(gòu),數(shù)據(jù)和應(yīng)用分離。這是VB、PB、Delphi的輝煌時(shí)期。
后來又有了組件、容器中間件,所以我們才有了三層結(jié)構(gòu):UI層、業(yè)務(wù)邏輯層、數(shù)據(jù)層三者物理分離,而且三個(gè)層使用的技術(shù)也都不一樣。尤其是出現(xiàn)了多端的時(shí)候,萬金油程序員終于頂不住了,開始分離出專門的前端程序員(Web/移動App/小程序)。在數(shù)據(jù)層也是對象存儲、SQL、NOSQL、數(shù)據(jù)倉庫、大數(shù)據(jù)計(jì)算平臺各種技術(shù)組合,就出現(xiàn)了數(shù)據(jù)層的專門程序員。反而業(yè)務(wù)邏輯層的技術(shù)變化并不大,編程語言也基本就是JAVA了。
但人工智能的出現(xiàn),讓業(yè)務(wù)邏輯層開始發(fā)生翻天覆地變化。如何讓新技術(shù)從研究到研發(fā)逐環(huán)節(jié)培育轉(zhuǎn)移?如何讓新技術(shù)從原型到創(chuàng)新產(chǎn)品到核心產(chǎn)品逐層吸收應(yīng)用?
對于前沿技術(shù),最佳的研發(fā)組織分工應(yīng)該是:
1. 戰(zhàn)略合作:云計(jì)算廠商合作、開源社區(qū)界合作、學(xué)術(shù)界合作。從云計(jì)算廠商來看,微軟Azure很牛,開源社區(qū)Google很牛,學(xué)術(shù)界看了看香港很牛,港大、香港理工大、香港科技大、香港中文大學(xué)、香港城市大學(xué)都是榜上有名的。看來布局大灣區(qū)很有必要。
2. 科學(xué)家研究實(shí)驗(yàn)室:戰(zhàn)略合作、論文閱讀理解、技術(shù)平臺選擇、原型算法原型模型原型應(yīng)用快速突破驗(yàn)證
3. 技術(shù)平臺研發(fā)中心:人工智能技術(shù)平臺正式研發(fā)、與科學(xué)家研究實(shí)驗(yàn)室合作開發(fā)技術(shù)算法模型、對人工智能應(yīng)用平臺暴露簡化后的API
4. 應(yīng)用平臺研發(fā)中心:開發(fā)人工智能應(yīng)用平臺、與應(yīng)用雅畈中心合作開發(fā)應(yīng)用算法模型、通過Open API平臺對外暴露簡化后的API
5. 應(yīng)用研發(fā)中心:微調(diào)節(jié)應(yīng)用模型、調(diào)用Open API平臺的一個(gè)API就直接應(yīng)用了人工智能能力
6. 大客戶定制研發(fā)中心:微調(diào)節(jié)應(yīng)用模型
最佳的研發(fā)流程應(yīng)該是:
第一步 科學(xué)家研究實(shí)驗(yàn)室(特種部隊(duì)尖刀連):搭建快而臟的原型,快速技術(shù)+應(yīng)用驗(yàn)證應(yīng)用價(jià)值場景、技術(shù)使用性和技術(shù)成熟度,然后把成果轉(zhuǎn)移給創(chuàng)新產(chǎn)品研發(fā)中心
第二步 創(chuàng)新產(chǎn)品研發(fā)中心:創(chuàng)新產(chǎn)品研發(fā)中心接到成果,當(dāng)做最佳實(shí)踐案例進(jìn)行產(chǎn)品分析,然后對新技術(shù)模塊、新產(chǎn)品模塊,按照產(chǎn)品管理流程與質(zhì)量保證進(jìn)行正式的微服務(wù)化設(shè)計(jì)(如可擴(kuò)展、可定制、高性能、高可用、可實(shí)施、可運(yùn)維)
第三步 核心產(chǎn)品研發(fā)中心:在創(chuàng)新產(chǎn)品商業(yè)推廣一年后,核心產(chǎn)品研發(fā)中心對核心產(chǎn)品進(jìn)行新技術(shù)的吸收與利用,升級核心產(chǎn)品