導讀:近年來,人工智能技術(AI)與醫(yī)療健康領域的融合不斷加深。AI在醫(yī)療領域主要應用場景包括語音錄入病歷、醫(yī)療影像輔助診斷、藥物研發(fā)、醫(yī)療機器人和個人健康大數(shù)據(jù)的智能分析等。
圖片來自“123rf.com.cn”
【編者按】人工智能(AI)技術應用的重要場景之一是助力藥物研發(fā),相比傳統(tǒng)的藥物研發(fā)耗時耗力、成功率低,AI技術的應用可大大縮短藥物研發(fā)時間、提高研發(fā)效率并控制研發(fā)成本。
本文來源于火石創(chuàng)造,作者孫翔宇;經(jīng)億歐大健康編輯,供行業(yè)人士參考。
近年來,人工智能技術(AI)與醫(yī)療健康領域的融合不斷加深。AI在醫(yī)療領域主要應用場景包括語音錄入病歷、醫(yī)療影像輔助診斷、藥物研發(fā)、醫(yī)療機器人和個人健康大數(shù)據(jù)的智能分析等。隨著語音交互、文本識別、圖像識別和大數(shù)據(jù)分析,以及智能終端等技術的逐漸成熟,AI的應用場景越發(fā)多樣。
圖1 人工智能在醫(yī)療領域的應用
藥物研發(fā)是AI技術應用的重要場景之一。藥物研發(fā)要經(jīng)歷靶點的發(fā)現(xiàn)與驗證、先導化合物的發(fā)現(xiàn)與優(yōu)化、候選化合物的挑選及開發(fā)和臨床研究等多個階段。傳統(tǒng)的藥物研發(fā)耗時耗力,且成功率低。AI助力藥物研發(fā),可大大縮短藥物研發(fā)時間、提高研發(fā)效率并控制研發(fā)成本。
圖2 新藥開發(fā)流程圖
目前制藥企業(yè)紛紛布局AI領域,主要應用在新藥發(fā)現(xiàn)和臨床試驗階段,主要有以下六大應用場景:
1.海量文獻信息分析整合
海量文獻信息分析整合對于藥物研發(fā)工作者來說,最讓他們頭疼的事如何去甄別每天產(chǎn)生的海量科研信息。而人工智能技術恰恰可以從這些散亂無章的海量信息中提取出能夠推動藥物研發(fā)的知識,提出新的可以被驗證的假說,從而加速藥物研發(fā)的過程。
英國生物科技公司Benevolent Bio(隸屬于 Benevolent AI),利用技術平臺JACS(Judgment Augmented Cognition System),從全球范圍內(nèi)海量的學術論文、專利、臨床試驗結果、患者記錄等數(shù)據(jù)中,提取出有用的信息,發(fā)現(xiàn)新藥研發(fā)的蛛絲馬跡。
2017年,借助JACS的分析能力,Benevolent Bio 標記了100個可用于治療肌萎縮性側索硬化癥(ALS)的潛在化合物,從中篩選出5個化合物。經(jīng)過英國謝菲爾德神經(jīng)轉化研究所的小鼠試驗,證實4個化合物在治愈運動神經(jīng)衰退方面確有療效。4/5的有效篩選率,這是研究人員之前從未想過的。
位于英國倫敦的BenevolentAI成立于2013年,是一家致力于AI技術開發(fā)和應用的公司,是歐洲大的AI初創(chuàng)公司。他們的目標是建立人們期盼已久的“制藥企業(yè)2.0”,利用AI助力新藥開發(fā),降低臨床試驗的失敗率。自2013年以來,Benevolent AI已經(jīng)開發(fā)出24個候選藥物,且已經(jīng)有藥物進入臨床IIb期試驗階段。
國際制藥巨頭之一的強生公司已經(jīng)與Benevolent AI達成合作協(xié)議,強生將一些已經(jīng)進入臨床階段的試驗藥物連帶一起特許給Benevolent AI,而Benevolent AI將利用人工智能系統(tǒng)來指導臨床試驗的進行和數(shù)據(jù)的收集。
2.化合物高通量篩選
化合物篩選,是指通過規(guī)范化的實驗手段,從大量化合物或者新化合物中選擇對某一特定作用靶點具有較高活性的化合物的過程。而要從數(shù)以萬計的化合物分子中篩選出符合活性指標的化合物,往往需要較長的時間和成本。
AI 技術可以通過對現(xiàn)有化合物數(shù)據(jù)庫信息的整合和數(shù)據(jù)提取、機器學習,提取大量化合物與毒性、有效性的關鍵信息,既避免了盲人摸象般的試錯路徑,還可以大幅提高篩選的成功率。
典型代表是硅谷公司Atomwise。Atomwise公司成立于2012年,其核心產(chǎn)品為AtomNet是一種基于深度學習神經(jīng)網(wǎng)絡的虛擬藥物發(fā)現(xiàn)平臺。AtomNet就像一位人類化學家,使用強大的深度學習算法和計算能力,來分析數(shù)以百萬計的潛在新藥數(shù)據(jù)。目前,AtomNet已經(jīng)學會識別重要的化學基團,如氫鍵、芳香度和單鍵碳,同時該系統(tǒng)可以分析化合物的構效關系,識別醫(yī)藥化學中的基礎模塊,用于新藥發(fā)現(xiàn)和評估新藥風險。
圖2 AtomNet通過訓練能夠識別抗生素中常見的化合物結構——磺?;?/p>
AtomNet在抗腫瘤藥物、神經(jīng)系統(tǒng)疾病藥物、抗病毒藥物、抗寄生蟲藥和抗生素藥物的藥物篩選方面表現(xiàn)出色。例如,2015年AtomNet僅用一周模擬出2種有潛力用于埃博拉病毒治療的化合物。Atomwise正與全球知名藥企和大學院校進行合作,其中包括輝瑞、默克、abbvie和哈佛大學等。
類似于Atomwise ,現(xiàn)在有一系列人工智能公司專注于藥物分子篩選,包括Recursion Pharmaceuticals、BenevolentAI、TwoXAR、Cyclica和Reverie Labs等。
3.發(fā)掘藥物靶點
現(xiàn)代新藥研究與開發(fā)的關鍵是尋找、確定和制備藥物靶點。靶點是指藥物在體內(nèi)的作用結合位點,包括基因位點、受體、酶、離子通道和核酸等生物大分子。
典型代表是Exscientia公司,Exscientia與葛蘭素史克(GSK)在藥物研發(fā)達成戰(zhàn)略合作。Exscientia 通過AI藥物研發(fā)平臺為GSK的10個疾病靶點開發(fā)創(chuàng)新小分子藥物。
Exscientia開發(fā)的AI系統(tǒng)可以從每個設計周期里的現(xiàn)有數(shù)據(jù)資源中學習,其原理與人類的學習方式相似,但AI在識別多種微妙變化以平衡藥效、選擇性和藥代動力學方面要更加高效。其AI系統(tǒng)完成新藥候選的時間和資金成本只需傳統(tǒng)方法的1/4。目前該公司與國際多家知名藥企形成戰(zhàn)略合作,包括強生、默克和賽諾菲等。
圖3 Exscientia 藥物研發(fā)流程圖示
4.預測藥物分子動力學指標(ADMET)
ADMET包括藥物的吸收、分配、代謝、排泄和毒性。預測ADMET是當代藥物設計和藥物篩選中十分重要的方法。過去藥物ADMET性質研究以體外研究技術與計算機模擬等方法相結合,研究藥物在生物體內(nèi)的動力學表現(xiàn)。目前市場中有數(shù)十種計算機模擬軟件,包括ADMET Predicator、MOE、Discovery Studio和Shrodinger等。該類軟件現(xiàn)已在國內(nèi)外的藥品監(jiān)管部門、制藥企業(yè)和研究院所得到了廣泛應用。
典型的代表包括晶泰科技(XtalPi)、Numerate等。為了進一步提升ADMET性質預測的準確度,已有生物科技企業(yè)探索通過深度神經(jīng)網(wǎng)絡算法有效提取結構特征,加速藥物的早期發(fā)現(xiàn)和篩選過程。其中晶泰科技通過應用人工智能高效地動態(tài)配置藥物晶型,能完整預測一個小分子藥物的所有可能的晶型,大大縮短晶型開發(fā)周期,更有效地挑選出合適的藥物晶型,減少成本。
圖4 晶泰科技提供的晶型篩選服務
5.病理生物學研究
病理生物學(pathophysiology)是一門研究疾病發(fā)生、發(fā)展、轉歸的規(guī)律和機制的科學。病理生物學研究是醫(yī)藥研發(fā)的基礎,至今許多疾病尚無治療方法,是由于在病理生物學研究方面沒有取得進展。
肌萎縮側索硬化(ALS)是一種破壞性的神經(jīng)退行性疾病,發(fā)病機制至今不明。ALS的一個突出病理特征是,一些RNA結合蛋白(RNA binding proteins, RBPs)在ALS中發(fā)生突變或異常表達/分布。人類基因組中至少有1 542種RBPs,目前已發(fā)現(xiàn)17種RBPs與ALS相關,除此以外,其他RBPs是否與ALS相關呢?
圖6 IBM Watson鑒定RBPs
典型案例是IBM公司開發(fā)的Watson系統(tǒng),通過閱讀了2 500萬篇文獻摘要,100萬篇完整論文和400萬專利文獻,并基于相關文獻的大量學習,建立了模型預測RBPs與ALS相關性。有研究者為了測試其模型的預測能力,首先將IBM Watson的知識庫限制在2013年之前的學術出版物上,并要求Watson使用這些可用的信息來預測與ALS相關的其他RBPs。在2013—2017年期間,Watson在對4個導致突變的RBPs給出了高度評價,證明了模型的有效性。而后,Watson對基因組中所有的RBPs進行篩選,并成功鑒定在ALS中改變的5種新型RBPs。
6.發(fā)掘藥物新適應癥
利用深入學習技術,將臨床藥物與新的適應癥相匹配。這樣可以繞過動物實驗和安全性實驗。
例如,沙利度胺曾用來治療麻風病,后來研究人員發(fā)現(xiàn)其對多發(fā)性骨髓瘤具有療效。由于該藥物已經(jīng)積累了大量的安全性與劑量數(shù)據(jù),研究人員能夠繞過第一階段的安全性和劑量試驗。
根據(jù)實驗結果,F(xiàn)DA在2012年批準沙利度胺治療多發(fā)性骨髓瘤。據(jù)彭博預測,這個過程總共花費了4 000~8 000 萬美元。如果從零開始,一個新藥所需的平均費用為20 億美元。
圖7 藥物再利用與新藥研發(fā)的成本對比
典型代表為Lam Therapeutics、NuMedii、Healx和Insilico Medicine等人工智能公司,他們已經(jīng)在“老藥新用”這個領域進行了深度探索。
中國在AI領域的論文發(fā)表數(shù)量位居全球第一。在醫(yī)學領域,我們在放射影像、病理、自然語言處理和智能語音錄入等領域的研究與歐美并駕齊驅,但在AI+新藥研發(fā)領域,卻差距較大。部分AI新藥研發(fā)公司名單見表1。
表1 部分人工智能藥物研發(fā)公司名單
2014年,晶泰科技創(chuàng)立于麻省理工學院校園。其核心總部位于深圳,并在北京、波士頓設有分部。晶泰科技目前已與多家世界頂級藥企與科研機構建立深度合作,其藥物固相篩選與設計平臺是行業(yè)最先進的解決方案。憑借團隊的技術優(yōu)勢與項目廣闊的市場空間,晶泰科技已獲得騰訊、真格基金、峰瑞資本數(shù)千萬元的A輪投資,以及來自紅杉、Google、騰訊的數(shù)千萬美金B(yǎng)輪融資,成為全球AI+制藥領域獲得融資最高的創(chuàng)業(yè)公司之一。
2018年12月,天津國際生物醫(yī)藥聯(lián)合研究院與北京天云大數(shù)據(jù)簽署戰(zhàn)略合作協(xié)議,雙方將在人工智能醫(yī)藥研發(fā)平臺建設領域聯(lián)手,為京津冀乃至全國提供服務。根據(jù)協(xié)議,雙方將共同建設人工智能醫(yī)藥研發(fā)平臺,立足京津地區(qū),為藥物研發(fā)等大健康行業(yè)創(chuàng)新發(fā)展賦能,致力于人工智能與大數(shù)據(jù)技術在醫(yī)藥行業(yè)內(nèi)的推廣和應用。同時,雙方各自發(fā)揮優(yōu)勢,共同開展人工智能醫(yī)藥研發(fā)平臺的推廣工作,推動建立京津冀醫(yī)藥智能技術創(chuàng)新聯(lián)盟。
中國在AI藥物開發(fā)領域已經(jīng)開始起步,但遠未成熟,還有非常大發(fā)展空間。在筆者看來,我國進行AI藥物研發(fā)需要在人才培養(yǎng)、數(shù)據(jù)共享和商業(yè)模式創(chuàng)新等方面進行發(fā)力。
1.培養(yǎng)高端人工智能人才,探索跨學科人才合作機制。
創(chuàng)業(yè)的競爭歸根結底是人才的競爭,這在人工智能領域表現(xiàn)得愈加明顯。在全球范圍內(nèi),大約有2.2萬名具有博士以上學歷的人工智能從業(yè)人員和研究人員,中國僅600名左右。國內(nèi)人工智能人才幾乎被幾大頭部企業(yè)壟斷,比如商湯有150多名人工智能博士,占比全國人工智能博士總數(shù)1/4。
數(shù)據(jù)顯示,未來中國人工智能人才缺口高達500萬,唯一的解決辦法就是成體系地培養(yǎng)人工智能人才。
2018華為全聯(lián)接大會上,華為云推出了“沃土AI開發(fā)者計劃”,投入10億人民幣培養(yǎng)高校和研究所的AI人才,并與清華大學、中科院、中國科學技術大學、浙江大學等達成AI合作。
2018年8月,商湯科技攜手香港中文大學、亞馬遜、南洋理工大學、悉尼大學聯(lián)合舉辦的首屆WIDER Face and Pedestrian Challenge 2018(簡稱:WIDER Challenge)挑戰(zhàn)賽,包括中科院計算所、微軟亞洲研究院、北京大學、卡耐基梅隆大學、香港大學以及雅虎、京東、曠視、科大訊飛、滴滴等科技公司參賽。
此外,AI應用于藥物研發(fā)需要若干個垂直領域的專家共同參與才能有所突破。既需要物理學家、化學專家、藥物學家、藥企研發(fā)高管,又需要人工智能科學家、云計算工程師等跨學科人才。通過在多個領域人才和經(jīng)驗的積累,
整個團隊需要緊密合作,這樣才更容易獲得突破性的思路和好的成果。
2.建立研發(fā)數(shù)據(jù)標準體系,完善數(shù)據(jù)共享機制。
AI藥物研發(fā)需要高質量數(shù)據(jù)支持。國內(nèi)創(chuàng)新藥研發(fā)起步較晚,與國外相比,對于優(yōu)質數(shù)據(jù)的積累還有一定差距。
制藥產(chǎn)業(yè)的專業(yè)門檻高、鏈條長,加之國內(nèi)長期以來的“多頭管理”體制,造成了國內(nèi)的藥品數(shù)據(jù)極度割裂,標準不統(tǒng)一、數(shù)據(jù)孤島現(xiàn)象嚴重;另外,醫(yī)藥領域的監(jiān)管政策與機構改革頻繁,造成歷史藥品數(shù)據(jù)銜接難度較大。這些都會導致醫(yī)藥數(shù)據(jù)統(tǒng)計在完整度和精準度上的不足,從而影響相關決策。
當前國內(nèi)企業(yè)“大數(shù)據(jù)化”采取的一個路徑,便是以“專業(yè)人工+機器輔助”方式建立數(shù)據(jù)標準詞典(包括藥品、企業(yè)、靶點、疾病等),持續(xù)進行數(shù)據(jù)清洗、識別、匹配和挖掘算法,將市場上分散的數(shù)據(jù)全面重構,形成一系統(tǒng)標準數(shù)據(jù)模塊倉庫,根據(jù)用戶場景對數(shù)據(jù)模塊進行組合。比如國內(nèi)的醫(yī)藥魔方、米內(nèi)數(shù)據(jù)、藥渡等醫(yī)藥大數(shù)據(jù)服務公司。
3.定位產(chǎn)業(yè)鏈角色,創(chuàng)新商業(yè)模式。
目前人工智能醫(yī)藥研發(fā)領域存在三種商業(yè)模式:
(1)開放和反饋模式。晶泰科技一開始就明確了初期主要客戶群,在地域設置上形成國內(nèi)研發(fā),國際業(yè)務拓展的模式。在有效控制研發(fā)成本的同時,起步階段就努力在國際范圍內(nèi)尋求合作者。
基于藥物研發(fā)流程的復雜性,人工智能在藥物研發(fā)中的大規(guī)模應用依賴于整個產(chǎn)業(yè)鏈的共同努力。晶泰科技主導開放和反饋模式,其長處是為傳統(tǒng)研發(fā)人員提供最先進的計算軟硬件工具,幫助他們更好更快地完成科研任務。
(2)虛擬篩選團隊外包驗證模式。虛擬篩選團隊外包的主要方式有是與利益相關者或非利益相關者合作。
與入利益相關者合作,比如一個更大的醫(yī)藥公司,公司將受益頗多,比如激勵一致、與已有臨床生產(chǎn)線的整合、致力于特定疾病團隊帶來的專業(yè)知識等。雖然公司需要割舍部分控制力或所有權, 但是有利于項目研發(fā)成功率的提升。
與非利益相關者合作(例如CRO),公司保留完全的知識產(chǎn)權,執(zhí)行速度快但是成本高。而且在實驗設計上有可能面對控制權的損失,所以為了保證高質量的結果必須給予特殊的關注。
這個模式的好處是成本低,速度快,特別是工業(yè)界的合作伙伴在新化合物后期驗證和臨床研發(fā)中具有巨大機會。合作伙伴能夠理解這些驗證實驗的動機和設計是至關重要的,因為他們在后續(xù)的臨床研發(fā)中充當重要角色。Nimbus Therapeutics,TwoXAR,Atomwise等公司就采用這種模式。
(3)獨立的藥物研發(fā)團隊和虛擬篩選團隊的合作模式。在這個模式中,公司團隊專注于計算機虛擬篩選,而其他團隊給予實驗藥物研發(fā)的支持。和通常專注于特定的配體\受體、生物現(xiàn)象或者疾病領域的團隊的良好合作,使項目研發(fā)團隊有獨特的專業(yè)性。
雖然配合程度沒有一個完全整合團隊那么強,但這種模式的優(yōu)勢在于,提供的處理結構的可變性和合作者的可選擇性。具有廣泛應用平臺的虛擬篩選團隊可以考慮用這個結構,在使資本成本最小化的同時處理很多研發(fā)項目。
1.新藥研發(fā)存在環(huán)節(jié)多、研發(fā)費用高、研發(fā)周期長和研發(fā)成功率低等問題。
新藥研發(fā)從上游到下游的幾個環(huán)節(jié)包括藥物靶標的確定,先導化合物的篩選,先導化合物的優(yōu)化和最終的臨床實驗。研發(fā)費用高、研發(fā)周期長、研發(fā)成功率低一直是壓在制藥企業(yè)身上的“三座大山”。塔夫茨藥物開發(fā)研究中心(Tufts Center for The Study of DrugDevelopment)的數(shù)據(jù)顯示:開發(fā)一種新藥的平均成本為 26 億美元;一種新藥上市的平均時間約為12 年;大約只有 10% 的候選藥物能從第一階段測試走向市場。德勤的數(shù)據(jù)顯示:2017 年,美國最大的生物制藥公司的投資回報率下降至3.2%。
2.AI技術的崛起,為新藥研發(fā)帶來了新方向。
過去 20 年,計算機處理能力的持續(xù)快速增長,大量數(shù)據(jù)集的可用性和先進算法的開發(fā),大大推動了機器學習的發(fā)展。新藥研發(fā)領域數(shù)據(jù)密集,這讓人工智能有了用武之地。AI 不僅能夠挖掘出不易被發(fā)現(xiàn)的隱性關系,構建藥物、疾病和基因之間的深層次關系。同時,可對候選化合物進行虛擬篩選,更快地篩選出具有較高活性的化合物,為后期臨床試驗做準備。
目前,AI 在新藥研發(fā)領域主要應用于靶點發(fā)現(xiàn)、化合物合成、化合物篩選、晶型預測、患者招募、優(yōu)化臨床試驗設計和藥物適應癥開拓等場景。來自 Tech Emergence 的一份報告研究了所有行業(yè)的人工智能應用,結果表明:人工智能可以將新藥研發(fā)的成功率從 12%提高到 14%,可以為生物制藥行業(yè)節(jié)省數(shù)十億美元。
自2017年以來,AI在制藥領域的應用可謂如火如荼,國際制藥巨頭紛紛入局AI開發(fā),用于提高新藥的研發(fā)效率。據(jù)統(tǒng)計,有100 多家初創(chuàng)企業(yè)在探索用 AI 發(fā)現(xiàn)藥物,傳統(tǒng)的大型制藥企業(yè)更傾向于與采用合作的方式,如阿斯利康與 Berg,強生與 Benevolent AI,默沙東與 Atomwise,武田制藥與 Numerate,賽諾菲和葛蘭素史克與 Exscientia,輝瑞與 IBM Watson 等。同時,AI應用于新藥研發(fā)仍需面對人才短缺、數(shù)據(jù)標準化與共享機制、商業(yè)模式創(chuàng)新等諸多問題。
在制藥和生命科學中,數(shù)據(jù)是AI的關鍵。AI被應用于藥物研發(fā)的各個階段,但若是數(shù)據(jù)質量不高,即便使用非??煽康乃惴?,也不會取得好結果,反而會浪費大量的資源和時間。鑒于此,IBM 曾在2016年斥資26億美元收購醫(yī)療數(shù)據(jù)公司Truven;羅氏曾在2018年以19億美金收購腫瘤大數(shù)據(jù)公司Flatiron Health的全部股份。也有專家表示,通過知識共享開展合作和提高已有數(shù)據(jù)的質量比積累數(shù)據(jù)更為重要,關鍵是建立一套切實可行的數(shù)據(jù)標準,與風險利益共擔的數(shù)據(jù)分享機制。
3.AI和藥物開發(fā)的模式,主要包括AI研發(fā)外包、企業(yè)內(nèi)部組建AI研發(fā)部門,但每種模式都有各自的優(yōu)缺點。
AI研發(fā)外包。由制藥公司提供特定的研究數(shù)據(jù)和生物靶點信息,然后由AI驅動的藥物發(fā)現(xiàn)初創(chuàng)公司依靠這些數(shù)據(jù)建立模型。一旦成功篩選出候選藥物,制藥公司會根據(jù)協(xié)議進行授權或自行擁有這種藥物。這種策略靈活性高且成本較低,但AI公司做為服務方需要獲取制藥公司整個藥物開發(fā)流程中最“隱私”的情報,因此,選擇合適的合作伙伴是重中之重。
在企業(yè)內(nèi)部組建AI研發(fā)部門。在與外部積極合作的同時,制藥公司也在培養(yǎng)內(nèi)部AI專業(yè)技能,并建立數(shù)字基礎設施,以提高數(shù)據(jù)使用效率。這種方式的挑戰(zhàn)在于如何建立內(nèi)部專業(yè)的AI算法和自動化流程,以及高效的運算平臺。
無論哪種模式,AI和藥物開發(fā)的結合,與其說是對IT技術人員的挑戰(zhàn),不如說更是對藥學人員的挑戰(zhàn)。一個運營良好的AI藥物發(fā)現(xiàn)團隊,應該是能夠讓IT技術人員和藥學科學家保持溝通無障礙,彼此交流更明晰,清楚對方的意圖。