作為高投入高風(fēng)險(xiǎn)的創(chuàng)新行業(yè),生物醫(yī)藥行業(yè)一直面臨著“雙10困境”:一款新藥的研發(fā)至少需要花費(fèi)10億美元、10年投入。伴隨著AI大模型引領(lǐng)的創(chuàng)新浪潮席卷全球,生物醫(yī)藥產(chǎn)業(yè)正在面臨新一輪的機(jī)遇期。一家初創(chuàng)企業(yè)借助大模型的算力,在短短兩年內(nèi)找到合適的抗癌苗頭化合物,AI大模型能否真的改變生物醫(yī)藥的“雙10困境”?
AI輔助尋找抗癌苗頭化合物
(相關(guān)資料圖)
“經(jīng)過AI生物大模型的虛擬篩選,從780萬個(gè)分子庫中最終找到6個(gè)潛在活性分子,效率相較于以往的人工篩選提升了成千上萬倍。”杭州立德百克生物醫(yī)藥科技有限責(zé)任公司負(fù)責(zé)人王紫壹告訴記者,生物醫(yī)藥行業(yè)有一個(gè)“雙10困境”,一款新藥的研發(fā)至少需要花費(fèi)10億美元和耗時(shí)10年投入,這是一家初創(chuàng)公司幾乎難以承擔(dān)的成本,如今憑借AI大模型的能力,生物技術(shù)團(tuán)隊(duì)也能實(shí)現(xiàn)彎道超車。
乳腺癌是全球女性發(fā)病率最高的惡性腫瘤,去年我國乳腺癌發(fā)病人數(shù)超過42萬,CDK4/6抑制劑是該領(lǐng)域最為暢銷的藥物。立德百克自主研發(fā)的PPI檢測技術(shù),可以對蛋白質(zhì)之間的相互作用進(jìn)行快速的“濕”實(shí)驗(yàn)(生理學(xué)試驗(yàn)方法)驗(yàn)證,建立了專門針對CDK4/6-CCND蛋白-蛋白相互作用的藥物篩選技術(shù)和活性檢測技術(shù)平臺,但是如何找到苗頭化合物分子卻犯了難。
“市面上的化合物商品庫中有上千萬種化合物,篩選工程耗時(shí)耗力,恰好生物計(jì)算大模型能彌補(bǔ)這一短板?!蓖ㄟ^引入百度飛槳螺旋槳的文心生物計(jì)算大模型技術(shù),王紫壹團(tuán)隊(duì)的“干”實(shí)驗(yàn)(計(jì)算機(jī)模擬試驗(yàn)方法)能力得到極大的提升,通過虛擬篩選,從780萬個(gè)分子中得到了模型打分比較高的110個(gè)分子,并采購了其中的40個(gè)進(jìn)行檢測,最后發(fā)現(xiàn)有6個(gè)高潛力的分子,其中3個(gè)化合物能夠同時(shí)打斷CDK4/6-CCND蛋白-蛋白相互作用,還有3個(gè)化合物能夠打斷CDK4-CCND蛋白-蛋白相互作用。目前,雙方正在對這些化合物進(jìn)行更進(jìn)一步的分析研究,也為下一步的結(jié)構(gòu)優(yōu)化提供數(shù)據(jù)準(zhǔn)備。
國產(chǎn)生物大模型進(jìn)入爆發(fā)期
當(dāng)下,隨著通用大模型的走紅,生物醫(yī)藥等垂直領(lǐng)域大模型正逐漸浮出水面。不少研報(bào)指出,AI制藥行業(yè)經(jīng)歷了算法迭代、算力提升及海量實(shí)驗(yàn)數(shù)據(jù)的堆砌,隨著AlphaFold 2、ChatGPT等創(chuàng)新產(chǎn)品的出現(xiàn),行業(yè)有望迎來高速發(fā)展的成長初期。
AI大模型如何提高新藥研發(fā)的效率,之江實(shí)驗(yàn)室圖計(jì)算中心副主任陳紅陽有一個(gè)非常形象的比喻:靶點(diǎn)發(fā)現(xiàn)是藥物研發(fā)過程中的關(guān)鍵環(huán)節(jié),其中靶點(diǎn)是藥物在體內(nèi)的作用結(jié)合位點(diǎn),藥物好比一把“鑰匙”,靶點(diǎn)就是與之匹配的“鎖”。基于大量的醫(yī)學(xué)材料和生化數(shù)據(jù),生物計(jì)算大模型能發(fā)掘潛在的藥物靶點(diǎn),甚至預(yù)測靶點(diǎn)與潛在藥物之間的相互作用,提高藥物研發(fā)成功率。
國外研究報(bào)告顯示,AI可以將新藥研發(fā)的成功率提高16.7%,AI輔助藥物研發(fā)每年能節(jié)約540億美元的研發(fā)費(fèi)用,并在研發(fā)主要環(huán)節(jié)節(jié)約40%至60%的時(shí)間成本。根據(jù)英偉達(dá)公開資料,使用AI技術(shù)可使藥物早期發(fā)現(xiàn)所需時(shí)間縮短至1/3,成本節(jié)省至1/200。
生物制藥和轉(zhuǎn)化醫(yī)學(xué)作為AI的重點(diǎn)賽道之一,涉及藥物設(shè)計(jì)、篩選、優(yōu)化、驗(yàn)證等多個(gè)環(huán)節(jié),需要處理大量的復(fù)雜數(shù)據(jù)和知識,也吸引了更多的競爭者。
當(dāng)下國內(nèi)AI生物大模型逐漸開始發(fā)力,清華智能產(chǎn)業(yè)研究院日前開源了輕量版BioMedGPT1.6B,這是一個(gè)參數(shù)為16億的生物醫(yī)藥領(lǐng)域輕量級科研版基礎(chǔ)模型,具有跨模態(tài)與知識融合的特點(diǎn),可以處理藥物性質(zhì)預(yù)測、自然語言類、跨模態(tài)等多種任務(wù)。
中銀證券研報(bào)表示,AI醫(yī)療市場呈高增長態(tài)勢,市場規(guī)模在2025年有望達(dá)385億元,2020—2025年復(fù)合年均增長率達(dá)46%,其中AI制藥是AI醫(yī)療領(lǐng)域的重要一環(huán)。
(文章來源:解放日報(bào))
標(biāo)簽: