導(dǎo)讀:Alphabet的DeepMind破解了一個長期困擾生物學(xué)家的問題,在醫(yī)療保健領(lǐng)域掀起了一場技術(shù)軍備競賽。
Alphabet的DeepMind破解了一個長期困擾生物學(xué)家的問題,在醫(yī)療保健領(lǐng)域掀起了一場技術(shù)軍備競賽。
機器學(xué)習(xí)技術(shù)在國際象棋比賽中擊敗了人類,并在全球范圍內(nèi)引起轟動。在給毫無戒心的人打詐騙電話時,它驚人的逼真人聲模仿能力得到了展示,一時在網(wǎng)上掀起了軒然大波。
谷歌母公司Alphabet旗下人工智能子公司DeepMind在兩年一度的生物大會上展示的一項不太引人注目的技術(shù),可能會顛覆制藥商發(fā)現(xiàn)和開發(fā)新藥的方式。它還可能加大對全球最大制藥公司的壓力,迫使它們?yōu)橐粓黾夹g(shù)軍備競賽做好準(zhǔn)備。以科技為依托的制藥新秀已經(jīng)加入了這場混戰(zhàn)。
去年12月,在墨西哥里維埃拉舉行的CASP13會議上,DeepMind的新技術(shù)在預(yù)測蛋白質(zhì)的形狀方面擊敗了經(jīng)驗豐富的生物學(xué)家。蛋白質(zhì)是疾病的基本組成部分。這一看似深奧的研究有著重要的意義:一種能夠精確模擬蛋白質(zhì)結(jié)構(gòu)的工具可以加速新藥的開發(fā)。
“這絕對令人震驚,”一名科學(xué)家在原始結(jié)果發(fā)布到網(wǎng)上后發(fā)推說道。會議創(chuàng)始人、馬里蘭大學(xué)計算生物學(xué)家John Moult表示:“它完全是一個驚喜。與我們自身能夠做到的成果相比,它的前景不可限量。”
為了找到藥物治療疾病的方法,對蛋白質(zhì)結(jié)構(gòu)進行分類是一個極其復(fù)雜的工程。研究人員還沒有完全理解蛋白質(zhì)是如何形成的。同時,還有一個數(shù)學(xué)問題:蛋白質(zhì)的形狀可能比宇宙中的原子還多,這使得預(yù)測成為一項艱巨的計算任務(wù)。四分之一個世紀(jì)以來,計算生物學(xué)家一直在努力設(shè)計出能勝任這項任務(wù)的軟件。
DeepMind在蛋白質(zhì)折疊(蛋白質(zhì)獲得三維形狀的物理過程)方面經(jīng)驗有限,但憑借最新的神經(jīng)網(wǎng)絡(luò)算法,DeepMind完成了全球50個頂級實驗室所能完成的事情。
在會議舉行的瑪雅主題度假村,與會者的興奮之情溢于言表。兩位DeepMind的演講者被科學(xué)家們一直追問他們是如何做到這一點的。幾小時后,英國《衛(wèi)報》表示,DeepMind的人工智能可能“開啟醫(yī)學(xué)進步的新時代”。在一篇博客文章中,該公司夸口說,它的蛋白質(zhì)模型“比以前的任何模型都精確得多”,“為藥物發(fā)現(xiàn)帶來了新的潛力”。
DeepMind在一封電子郵件中表示,該公司的科學(xué)家“完全專注于他們的研究”,無法接受采訪。
DeepMind的模擬還不能夠產(chǎn)生對藥物發(fā)現(xiàn)非常重要的原子水平的分辨率。盡管許多公司都在尋找利用計算機識別新藥物的方法,但很少有基于機器學(xué)習(xí)的藥物發(fā)展到可以在人體上進行測試的地步。還需要花費數(shù)年的時間,人們才能知道這樣的軟件是否能定期發(fā)現(xiàn)有希望的治療方法,而這些方法是研究人員可能會錯過的。
人工智能是醫(yī)療保健領(lǐng)域一個非常熱門的詞匯,經(jīng)常被吹捧為一劑包治百病的靈丹妙藥。它被認(rèn)為是一個潛在的解決方案,可以修復(fù)繁瑣的電子病歷,加快診斷速度,使手術(shù)更加精確等。DeepMind的成功表明,該技術(shù)有可能在制藥行業(yè)最昂貴、最容易失敗的領(lǐng)域之一得到實際應(yīng)用。
一些觀察人士表示,一個由外部人士組成的團隊能夠在解決生物學(xué)中最棘手的問題之一上取得如此重大的進展,這令該領(lǐng)域的研究人員大失顏面。對制藥行業(yè)來說,這也可能是其遭受沖擊的一個預(yù)兆。制藥行業(yè)在研發(fā)上投入了數(shù)十億美元,但卻被科技公司打了個措手不及。
參加這次會議的哈佛大學(xué)計算生物學(xué)研究員Mohammed AlQuraishi在一篇博客文章中寫道,大型制藥公司沒有在蛋白質(zhì)折疊方面投入大量精力,基本上是把這個領(lǐng)域讓給了科技公司。當(dāng)制藥公司還在猶豫不決時,“Alphabet突然進來攪局,在他們的專屬領(lǐng)地開辟了自己的區(qū)域,”他寫道。
眾所周知,找到新藥并將其推向市場是非常困難的。據(jù)估計,大型制藥公司至少需要花費超過25億美元才能為病人提供一種新藥。進入人體臨床試驗的10種療法中,最終只有一種能夠進入藥店。同時,醫(yī)療科學(xué)進展緩慢:在人類基因組測序后的近20年里,研究人員僅僅發(fā)現(xiàn)了治療大約7000種已知罕見疾病中的一小部分的方法。
此外,大約有2萬個基因會以至少十萬種方式發(fā)生病變,并且產(chǎn)生的蛋白質(zhì)之間可能存在數(shù)百萬種相互作用。對于制藥行業(yè)來說,手工檢測所有這些組合幾乎是不可能的。
“如果我們想了解人類生物學(xué)中的其他97%,我們將不得不承認(rèn)對我們來說太復(fù)雜了,”Chris Gibson說。他是Recursion Pharmaceuticals的聯(lián)合創(chuàng)始人兼首席執(zhí)行官,該公司是一家位于鹽湖城的創(chuàng)企,利用機器學(xué)習(xí)來尋找新的治療方法。
Recursion這樣的公司正在迅速吸引投資者。數(shù)據(jù)提供商PitchBook的數(shù)據(jù)顯示,風(fēng)險投資家去年向?qū)W⒂谒幬镅邪l(fā)的人工智能和機器學(xué)習(xí)初創(chuàng)企業(yè)投入了10.8億美元,高于2016年的2.37億美元,今年迄今已投入6.99億美元。
Recursion周一表示,在最近一輪融資中,已從Intermountain Ventures和明尼蘇達大學(xué)董事會等投資者那里籌集了1.21億美元。據(jù)PitchBook的數(shù)據(jù),它的估值為6.46億美元?!斑@是一家雄心勃勃的公司。他們正在考慮從根本上改變這個行業(yè),”領(lǐng)投此次融資的蘇格蘭Baillie Gifford & Co.的投資經(jīng)理Marina Record說。
而那些老牌制藥商正競相與從事類似工作的公司結(jié)盟。
今年4月,Gilead Sciences與前斯坦福大學(xué)機器學(xué)習(xí)專家Daphne Koller領(lǐng)導(dǎo)的初創(chuàng)公司Insitro達成協(xié)議,尋找治療納什肝病的方法。與此同時,AstraZeneca也與英國的BenevolentAI進行了合作,其研究旨在確定腎臟疾病和肺纖維化的治療方法。今年6月,GlaxoSmithKline與加州大學(xué)基因編輯專家合作,斥資6700萬美元,使用人工智能進行目標(biāo)搜索。
“你還能接受十分之一的成功率嗎?如果我們能將這一比例提高一倍達到20%,那將是驚人的,”GlaxoSmithKline高級副總裁Tony Wood說,他是這家英國制藥巨頭的醫(yī)藥科學(xué)和技術(shù)負(fù)責(zé)人。
默克公司負(fù)責(zé)計算化學(xué)的副總裁Juan Alvarez表示,機器學(xué)習(xí)方法對藥物發(fā)現(xiàn)“至關(guān)重要”。這家制藥巨頭正在開發(fā)人工智能工具,以幫助其化學(xué)家加快制造化學(xué)物質(zhì),以縮短異常蛋白質(zhì)搜索的艱苦過程。Alvarez說,早期的機器學(xué)習(xí)發(fā)展已經(jīng)為人類測試藥物做出了貢獻,而第一批基于更先進的神經(jīng)網(wǎng)絡(luò)方法的藥物可能在幾年內(nèi)投入臨床試驗。
人工智能可以被用來掃描數(shù)以百萬計的高分辨率細(xì)胞圖像,以發(fā)現(xiàn)能夠以意想不到的方式使患病細(xì)胞更健康的療法,這個數(shù)量比人類能夠自己處理的還要多。
Recursion是最早使用這種方法的初創(chuàng)公司之一。每周,機器人都會在40萬到50萬個微型實驗中,將數(shù)千種潛在的藥物應(yīng)用到不同類型的病變細(xì)胞上,生成500萬到1000萬張細(xì)胞圖像。然后,機器學(xué)習(xí)算法掃描圖像,尋找在不損害健康細(xì)胞的情況下破壞疾病的化合物。
最初的算法是手工編程來解釋基本的細(xì)胞特征,但Recursion越來越多地使用直接解析圖像的神經(jīng)網(wǎng)絡(luò)方法,并可能發(fā)現(xiàn)人類程序員不會尋找的模型。在此過程中,計算機科學(xué)家與實驗室里的生物學(xué)家緊密合作,以改進解析算法。
該公司已同意與武田制藥有限公司和賽諾菲達成罕見病方面的協(xié)議。過去幾年,賽諾菲生成了超過2.5PB的數(shù)據(jù),總量超過了好萊塢所有故事片的容量。
公司創(chuàng)始人Gibson說,公司現(xiàn)在的做法“在六、七年前根本行不通”。
Gibson最初轉(zhuǎn)向機器學(xué)習(xí)是在猶他大學(xué)讀研究生時,當(dāng)時他正在尋找治療大腦海綿狀畸形的方法。根據(jù)血管瘤聯(lián)盟的數(shù)據(jù),大約每500個人中就有1個人患有這種疾病,雖然患者常常表現(xiàn)正常,但卻可能導(dǎo)致癲癇發(fā)作、語言或視力障礙,以及嚴(yán)重的腦出血。
大約四分之一的患者有這種疾病的遺傳形式,更有可能導(dǎo)致多種畸變。盡管導(dǎo)致這種疾病的三種基因是已知的,但目前還沒有藥物可供治療。Gibson在猶他大學(xué)測試的一種藥物是基于對這種疾病的普遍理解,但卻使動物的癥狀更加嚴(yán)重。
沮喪之余,Gibson和他的同事使用開源的機器學(xué)習(xí)軟件掃描細(xì)胞圖像,以探測2100種化合物的效果,尋找那些能夠改善攜帶壞基因的血管細(xì)胞外觀和功能的化合物。這些算法指出,在動物實驗中,一種意想不到的化學(xué)物質(zhì)可以將血管滲漏減少50%。這種藥物將于明年進入人體試驗的第二階段,它是Gibson決定創(chuàng)立Recursion的原因之一。
Alphabet的其他部門,以及社交媒體巨頭Facebook旗下的人工智能研究部門也正在慢慢進入制藥行業(yè)。Facebook在4月份悄悄地發(fā)表了一篇論文,使用深度學(xué)習(xí)技術(shù)分析了2.5億個蛋白質(zhì)序列。今年春天,谷歌的人工智能研究人員推出了一種神經(jīng)網(wǎng)絡(luò)算法,可以根據(jù)序列預(yù)測蛋白質(zhì)的功能。