人工智能在藥物研發(fā)中的應(yīng)用(上):AI與制藥場(chǎng)景如何相互“適配”?
近年來(lái),人工智能(AI)已經(jīng)被廣泛應(yīng)用于多個(gè)行業(yè),徹底改變了 社會(huì) 生活的許多領(lǐng)域。
在制藥這一傳統(tǒng)行業(yè),AI也已經(jīng)有了諸多應(yīng)用。AI逐漸應(yīng)用于藥物發(fā)現(xiàn)的靶點(diǎn)發(fā)現(xiàn),虛擬篩選,化合物設(shè)計(jì)與合成,ADME-T性質(zhì)和理化性質(zhì)預(yù)測(cè),藥物臨床試驗(yàn)設(shè)計(jì)、管理、患者招募,藥物警戒應(yīng)用和真實(shí)世界證據(jù)生成等多個(gè)流程和環(huán)節(jié)。
那么,AI應(yīng)用于制藥的邏輯是什么?AI會(huì)如何改變藥物研發(fā)?如何應(yīng)對(duì)制藥行業(yè)的效率挑戰(zhàn)?本文分為上下篇,本篇重點(diǎn)介紹AI在制藥行業(yè)多場(chǎng)景中展開(kāi)及面臨的挑戰(zhàn)。
制藥受困
從制藥行業(yè)的困境說(shuō)起。
在過(guò)去的數(shù)十年里,許多科學(xué)、技術(shù)和管理因素都取得了巨大進(jìn)步,這有助于提高藥物研發(fā)的生產(chǎn)率(R&D)。然而,自1950年以來(lái),每10億美元研發(fā)投入獲得批準(zhǔn)的新藥數(shù)量幾乎每9年減少一半,該趨勢(shì)在60年間非常穩(wěn)定,被稱為制藥行業(yè)的反摩爾定律(Eroom’s Law)。新藥的開(kāi)發(fā)成本越來(lái)越高,藥物研發(fā)面臨著嚴(yán)重的生產(chǎn)力危機(jī)。
對(duì)于反摩爾定律主要有三種解釋,即低垂果實(shí)假設(shè)(好摘的果子被摘走了)、監(jiān)管障礙假設(shè)(新藥申報(bào)的監(jiān)管要求不斷增高)、研發(fā)模式問(wèn)題。前兩種解釋都是客觀事實(shí)難以改變,那么,是否有更好的藥物研發(fā)模式?這是制藥行業(yè)一直在思考的問(wèn)題。
制藥行業(yè)在遭遇生產(chǎn)力困境的同時(shí),也面臨著數(shù)據(jù)困境。
隨著全 社會(huì) 數(shù)字化信息化的快速推進(jìn)、藥物研發(fā)設(shè)備的升級(jí)和長(zhǎng)期的積累,可用的藥物研發(fā)數(shù)據(jù)越來(lái)越多,以至于在一定時(shí)間范圍內(nèi)無(wú)法使用常規(guī)方法和軟件工具分析和處理所有數(shù)據(jù)。傳統(tǒng)的統(tǒng)計(jì)學(xué)在浩瀚的大數(shù)據(jù)面前越來(lái)越力不從心。制藥企業(yè)正在經(jīng)歷數(shù)字化轉(zhuǎn)型,大量的數(shù)據(jù)產(chǎn)生。于是,日益增長(zhǎng)的數(shù)據(jù)處理的需求,與現(xiàn)有數(shù)據(jù)分析能力之間的矛盾,推動(dòng)制藥行業(yè)尋求新出路。
AI的橄欖枝
2016年3月,AI程序AlphaGo大勝韓國(guó)著名棋手李世石,是AI發(fā)展 歷史 上的里程碑事件。這一事件加快了AI在 社會(huì) 生活多個(gè)領(lǐng)域的 探索 和應(yīng)用,也讓制藥行業(yè)看到了提高藥物研發(fā)生產(chǎn)率的希望。2016年后,AI在制藥行業(yè)的技術(shù)測(cè)試大量開(kāi)展。實(shí)驗(yàn)科學(xué)不再是唯一選項(xiàng),以數(shù)據(jù)為中心的藥物發(fā)現(xiàn)逐漸走上舞臺(tái)。
在隨后的幾年時(shí)間里,AI制藥逐漸 升溫,概念驗(yàn)證研究持續(xù)不斷、大量的資本涌入AI驅(qū)動(dòng)的生物技術(shù)初創(chuàng)公司、制藥公司與AI生物技術(shù)公司和AI技術(shù)供應(yīng)商之間的合作越來(lái)越多。一些領(lǐng)先的制藥公司的高管認(rèn)為,AI不僅僅是一個(gè)先導(dǎo)化合物發(fā)現(xiàn)的工具,而且是一個(gè)促進(jìn)生物學(xué)研究、發(fā)現(xiàn)新的生物靶點(diǎn)和開(kāi)發(fā)新的疾病模型的更通用的工具。
AI在制藥的多場(chǎng)景中展開(kāi)
數(shù)年間,AI已經(jīng)被嘗試應(yīng)用于藥物研發(fā)的幾乎所有流程和環(huán)節(jié),主要有以下方面:
/ / 靶點(diǎn)確認(rèn)
靶點(diǎn)確認(rèn)是藥物開(kāi)發(fā)中的關(guān)鍵步驟,也是最復(fù)雜的步驟之一。目前已知的藥物靶點(diǎn)絕大多數(shù)為蛋白質(zhì),通過(guò)機(jī)器學(xué)習(xí)的方法,從蛋白質(zhì)原始信息中提取特征,構(gòu)建準(zhǔn)確穩(wěn)定的模型進(jìn)行功能的推斷、預(yù)測(cè)和分類(lèi),已經(jīng)成為靶點(diǎn)研究的重要手段。從患者的樣本中、海量的生物醫(yī)學(xué)資料中提取基因組學(xué)、蛋白質(zhì)組學(xué)、代謝組學(xué)等多組學(xué)數(shù)據(jù),借助深度學(xué)習(xí)來(lái)分析非疾病和疾病狀態(tài)之間的差異,也可用來(lái)發(fā)現(xiàn)對(duì)疾病有影響的蛋白質(zhì)。
/ / 基于表型的藥物發(fā)現(xiàn)
在過(guò)去的三十多年里,基于靶點(diǎn)的藥物發(fā)現(xiàn)都是藥物發(fā)現(xiàn)的主要方法。近年來(lái),基于表型的藥物發(fā)現(xiàn)(直接使用生物系統(tǒng)進(jìn)行新藥篩選)受到關(guān)注。機(jī)器學(xué)習(xí)可以在表型篩選中將細(xì)胞表型與化合物作用方式聯(lián)系起來(lái),獲得靶點(diǎn)、信號(hào)通路或遺傳疾病關(guān)聯(lián)的聚類(lèi)。而AI強(qiáng)大的圖像處理能力,能夠?qū)⑸锵到y(tǒng)的所有形態(tài)特征整合,系統(tǒng)研究藥物潛在的作用方式和信號(hào)通路,擴(kuò)展對(duì)于疾病的生物學(xué)認(rèn)識(shí)。
/ / 分子生成
機(jī)器學(xué)習(xí)方法可以產(chǎn)生新的小分子。AI可以通過(guò)對(duì)海量的化合物或者藥物分子的學(xué)習(xí),獲得化合物分子結(jié)構(gòu)和成藥性方面的規(guī)律,進(jìn)而根據(jù)這些規(guī)律生成很多自然界從未存在過(guò)的化合物作為候選藥物分子,有效構(gòu)建擁有一定規(guī)模且高質(zhì)量的分子庫(kù)。
/ / 化學(xué)反應(yīng)設(shè)計(jì)
AI目前正在取得進(jìn)展的化學(xué)領(lǐng)域之一是對(duì)化學(xué)反應(yīng)和合成路線進(jìn)行建模和預(yù)測(cè)。AI可以將分子結(jié)構(gòu)映射為可以由機(jī)器學(xué)習(xí)算法處理的形式,根據(jù)已知化合物的結(jié)構(gòu),形成多條合成路線,并推薦最佳合成路線。反過(guò)來(lái),在給定反應(yīng)物的情況下,深度學(xué)習(xí)、遷移學(xué)習(xí)可以預(yù)測(cè)化學(xué)反應(yīng)結(jié)果。AI還可用來(lái) 探索 新的化學(xué)反應(yīng)。
/ / 化合物篩選
AI能夠?qū)衔锏幕瘜W(xué)結(jié)構(gòu)與生物活性之間的關(guān)系進(jìn)行建模,預(yù)測(cè)化合物的作用機(jī)制。一個(gè)典型的例子是MIT的研究人員基于深度學(xué)習(xí)發(fā)現(xiàn)了新的抗生素。研究人員訓(xùn)練了一個(gè)能夠預(yù)測(cè)具有抗菌活性的分子的深層神經(jīng)網(wǎng)絡(luò),在幾天內(nèi)篩選超過(guò) 1 億個(gè)化合物,根據(jù)模型的預(yù)測(cè)分?jǐn)?shù)對(duì)化合物進(jìn)行排名,最終確定了8種與已知抗生素在結(jié)構(gòu)上差別較大的抗生素。
/ / ADMET性質(zhì)預(yù)測(cè)
藥代動(dòng)力學(xué)性質(zhì)不夠理想,是臨床研究階段藥物研發(fā)失敗的主要原因之一。深度學(xué)習(xí)可以自動(dòng)識(shí)別化合物的相關(guān)特征,評(píng)估數(shù)據(jù)集中多個(gè)ADMET參數(shù)之間的隱藏的關(guān)系和趨勢(shì),預(yù)測(cè)化合物的細(xì)胞滲透性和溶解性等性質(zhì)。
/ / 藥物臨床試驗(yàn)
新藥開(kāi)發(fā)中資金投入最多的階段是臨床試驗(yàn)階段,AI在臨床試驗(yàn)的設(shè)計(jì)、管理、患者招募方面皆有應(yīng)用潛力。自然語(yǔ)言處理技術(shù)可從各種結(jié)構(gòu)化和非結(jié)構(gòu)化數(shù)據(jù)類(lèi)型中提取信息,找到符合臨床試驗(yàn)入組標(biāo)準(zhǔn)的受試者;也可用于關(guān)聯(lián)各種大型數(shù)據(jù)集,找到變量之間的潛在關(guān)系,改進(jìn)患者與試驗(yàn)的匹配情況。諾華已使用機(jī)器學(xué)習(xí)算法監(jiān)控和管理所有的臨床試驗(yàn)。
/ / 藥物警戒
AI將對(duì)傳統(tǒng)的藥物警戒帶來(lái)沖擊。隨著監(jiān)管要求的嚴(yán)格和患者安全意識(shí)的提高,藥物警戒的工作量和成本大大增加。AI可以將藥物不良反應(yīng)從接收到報(bào)告的整個(gè)流程實(shí)現(xiàn)自動(dòng)化,優(yōu)化藥物警戒的工作并降低成本。基于AI系統(tǒng)還有可能通過(guò)預(yù)測(cè)能力展開(kāi)藥物風(fēng)險(xiǎn)評(píng)估。
/ / 真實(shí)世界研究
AI的進(jìn)步提供了分析大型多維RWD(真實(shí)世界數(shù)據(jù))的新策略。AI能夠識(shí)別真實(shí)世界數(shù)據(jù)中的內(nèi)在關(guān)聯(lián),生成新的假設(shè),也能為臨床試驗(yàn)提供新的信息。最新的一個(gè)案例是,AI通過(guò)分析真實(shí)世界數(shù)據(jù),可以找出不會(huì)影響試驗(yàn)的總生存期的風(fēng)險(xiǎn)比的入組標(biāo)準(zhǔn),從而擴(kuò)大臨床試驗(yàn)的人群范圍。
AI在藥物研發(fā)中的應(yīng)用還包括 理化性質(zhì)預(yù)測(cè)、藥物重定向、制劑開(kāi)發(fā)中的應(yīng)用 等。
問(wèn)題顯現(xiàn)
AI在藥物研發(fā)中的應(yīng)用遠(yuǎn)非一帆風(fēng)順,歸結(jié)起來(lái),是AI如何與制藥場(chǎng)景相互“適配”的問(wèn)題。
對(duì)制藥行業(yè)來(lái)說(shuō),走AI的路,就要穿AI的鞋。AI方法對(duì)于其適用對(duì)象的相關(guān)條件有諸多要求。如同傳統(tǒng)藥物研發(fā)需要配備必要的硬件設(shè)備和必要的環(huán)境設(shè)施(如科學(xué)儀器設(shè)備、實(shí)驗(yàn)室等),基于AI的藥物研發(fā)需要配備數(shù)據(jù)、算法、算力,其中對(duì)數(shù)據(jù)的要求最為嚴(yán)格。
傳統(tǒng)的藥物研發(fā)以實(shí)驗(yàn)科學(xué)為主。數(shù)十年來(lái),藥物研發(fā)數(shù)據(jù)的記錄、治理和儲(chǔ)存都以實(shí)驗(yàn)為核心,根據(jù)實(shí)驗(yàn)的需求來(lái)調(diào)整,數(shù)據(jù)是實(shí)驗(yàn)的“附屬”。而AI作為虛擬科學(xué)、計(jì)算科學(xué)和數(shù)據(jù)科學(xué)范疇內(nèi)的方法,直接從數(shù)據(jù)入手,將數(shù)據(jù)放在第一位,對(duì)于數(shù)據(jù)的格式、標(biāo)準(zhǔn)、質(zhì)量、數(shù)量都有內(nèi)在的要求。在這樣的情況下,AI直接使用傳統(tǒng)藥物研發(fā)模式的數(shù)據(jù)往往遇到困難。
對(duì)AI來(lái)說(shuō),進(jìn)入制藥的主場(chǎng),就應(yīng)當(dāng)遵循制藥的規(guī)律。比如,藥物的開(kāi)發(fā)是一個(gè)多維同步優(yōu)化的過(guò)程,鑒于數(shù)據(jù)的規(guī)模和復(fù)雜性,基于AI的藥物研發(fā)往往需要重寫(xiě)機(jī)器學(xué)習(xí)算法,而不是簡(jiǎn)單地調(diào)用。AI與制藥這一傳統(tǒng)行業(yè)的核心業(yè)務(wù)深度融合,需更深刻的行業(yè)理解力和更高的技術(shù)準(zhǔn)確率。AI雖然已經(jīng)可以從大量已知論文、實(shí)驗(yàn)數(shù)據(jù)中挖掘新的知識(shí),改變了傳統(tǒng)基于學(xué)術(shù)經(jīng)驗(yàn)的研究方式,然而方法的準(zhǔn)確性、可解釋性、可重復(fù)性等還有待提高。
此外,傳統(tǒng)的藥物研發(fā)模式已有相對(duì)健全的監(jiān)管政策、行業(yè)體系。作為一種新的模式,AI在制藥行業(yè)的應(yīng)用 探索 ,也需要相應(yīng)的行業(yè)政策和體系來(lái)規(guī)范和引導(dǎo)。
文 智藥邦 侯小龍
來(lái)源 中國(guó)食品藥品網(wǎng)