去年7月,澳大利亞弗林德斯大學(xué)研究團(tuán)隊(duì)宣布,利用AI技術(shù)開發(fā)的新型季節(jié)性流感疫苗已進(jìn)入臨床試驗(yàn)階段。該產(chǎn)品基于一套配體搜索算法(SAM),而公眾冠以“首個(gè)AI設(shè)計(jì)藥物”的稱謂,多少傳遞出業(yè)界對(duì)AI賦能藥物研發(fā)的期待。
同樣令公眾注意的是,兩個(gè)月后,加拿大的Deep Genomics公司也對(duì)外表示,“第一款由AI發(fā)現(xiàn)的治療候選藥物(therapeutic candidate)”成功誕生。這款名為DG12P1的化合物,得益于AI從靶點(diǎn)發(fā)現(xiàn)到先導(dǎo)化合物篩選的全程指導(dǎo),只耗費(fèi)了18個(gè)月。
AI工具越來越多地應(yīng)用于藥物發(fā)現(xiàn)。盡管一些主要參與者指出,這些工具能給藥物研發(fā)帶來巨大的變革機(jī)遇,但還是有不少業(yè)內(nèi)人士持懷疑態(tài)度。
“有爭(zhēng)論很正常,任何一項(xiàng)新技術(shù)在普及之前,都會(huì)面臨這種挑戰(zhàn)。”6月底,采訪了晶泰科技聯(lián)合創(chuàng)始人溫書豪,對(duì)方如是回應(yīng)這種意見分歧,“AI當(dāng)然有它擅長(zhǎng)的地方,比如對(duì)數(shù)據(jù)的處理能力,但也還有需要提升的空間。我們擁抱的不是純粹的技術(shù),而應(yīng)該看重技術(shù)在藥物開發(fā)中帶來的結(jié)果,從這一點(diǎn)出發(fā),包括AI在內(nèi)的數(shù)字化,實(shí)際上提供了一種認(rèn)識(shí)事物的新視角。”
晶泰科技聯(lián)合創(chuàng)始人、董事長(zhǎng)溫書豪博士
從宏觀到微觀,藥物是什么?
長(zhǎng)周期、高成本的特征,一直是新藥研發(fā)行業(yè)的顯著標(biāo)簽。通常認(rèn)為,成功開發(fā)出一款新藥需要滿足“10億美元、10年時(shí)間”的前提,但現(xiàn)實(shí)似乎正變得更為復(fù)雜。
按照2014年Tufts Center的統(tǒng)計(jì)報(bào)告,開發(fā)一款藥物的資金門檻已經(jīng)提升到25.88億美元。具體來說,藥企實(shí)際支出13.95億美元,加上12-14%的名義利率(資本成本),彌補(bǔ)資本時(shí)間和機(jī)會(huì)成本后,得到一個(gè)新化合物的成本便陡然上升。從時(shí)間維度看,這種變化趨勢(shì)讓藥物開發(fā)變得越發(fā)困難。
究其原因,這一方面與新藥研發(fā)的成功率不斷降低、臨床試驗(yàn)成本不斷增加,以及監(jiān)管條件更加嚴(yán)格等因素相關(guān);另一方面,藥企正在快速消耗著既往發(fā)現(xiàn)的新藥靶點(diǎn)。
持續(xù)增長(zhǎng)的資本化研發(fā)費(fèi)用
“工業(yè)界可能更多從生物、化學(xué)的角度去看這個(gè)事情,例如,怎樣設(shè)計(jì)出更優(yōu)的臨床試驗(yàn)方案,在最短的時(shí)間內(nèi)驗(yàn)證藥物的有效性、安全性,然后推動(dòng)后面的上市申報(bào)。但基于物理背景,我們希望能以更微觀的角度理解藥物和靶點(diǎn)的相互作用。實(shí)際上,這種思維是貫穿整個(gè)藥物開發(fā)流程的,從前期的藥物設(shè)計(jì)到后面的臨床研究,更清楚地認(rèn)識(shí)藥物,都有助于提高成功率,降低試錯(cuò)成本。”溫書豪解釋說。
藥物都是原子、電子組成的——這也是溫書豪在藥物開發(fā)領(lǐng)域的切入點(diǎn)。2014年,溫書豪與馬健、賴力鵬還在美國(guó)麻省理工學(xué)院攻讀博士后,從事物理學(xué)研究。受當(dāng)?shù)貏?chuàng)業(yè)氛圍的影響,三人決定從所擅長(zhǎng)的藥物晶型出發(fā),成立晶泰科技,希望能加速藥物研發(fā),提高創(chuàng)新藥物可及性。
上述理念得到了輝瑞的認(rèn)可,后者針對(duì)雙方的合作,還專門發(fā)表了一篇討論量子物理學(xué)和AI如何影響藥物發(fā)現(xiàn)與開發(fā)的文章:“近年來,科學(xué)家已經(jīng)開始使用被稱為晶型預(yù)測(cè)(CSP)的計(jì)算機(jī)建模技術(shù)來進(jìn)行虛擬晶體學(xué)研究。通過應(yīng)用量子物理學(xué),科學(xué)家可以預(yù)測(cè)分子中電子的行為,以確定其3-D結(jié)構(gòu)。”
外界通常把晶型預(yù)測(cè)作為晶泰科技的一個(gè)標(biāo)簽,實(shí)際上正如文中所述,輝瑞科學(xué)家對(duì)于晶泰科技在底層物理、人工智能以及跨云超算能力在新藥發(fā)現(xiàn)中的巨大應(yīng)用潛力做了詳細(xì)闡述。在這些跨國(guó)大藥企的驅(qū)動(dòng)下,晶泰科技已經(jīng)打造起“物理+AI+云端超算”的新一代藥物發(fā)現(xiàn)平臺(tái)ID4。更重要的是,這個(gè)平臺(tái)已經(jīng)在中美的近20個(gè)新藥開發(fā)項(xiàng)目中取得多個(gè)里程碑式進(jìn)展。
CSP和AI新藥發(fā)現(xiàn)都涉及很多復(fù)雜的數(shù)學(xué)計(jì)算,依賴相應(yīng)的計(jì)算能力。“過去大家認(rèn)為藥物電子云和人體靶點(diǎn)蛋白電子云之間的相互作用是固定不變的,實(shí)際上它們會(huì)互相干擾。”溫書豪認(rèn)為,雖然變化能量很小,然而為了算準(zhǔn)其中的結(jié)果則需要花費(fèi)很多算力。由于既往的條件缺乏,藥企通常放棄這個(gè)環(huán)節(jié),導(dǎo)致晶型預(yù)測(cè)不準(zhǔn),以及新藥設(shè)計(jì)中假陽性分子的產(chǎn)生。隨著AI、云計(jì)算技術(shù)的發(fā)展,上述難題可以得到有效解決。
另一個(gè)值得注意的現(xiàn)象是,越來越多的國(guó)際大型藥企,開始推動(dòng)設(shè)立首席數(shù)字官(Chief Digital Officer)。這很大程度上也透露出,藥物開發(fā)行業(yè)正在擁抱多學(xué)科交叉的融合浪潮。雖然目前復(fù)合型人才缺口仍舊很大,但在溫書豪眼中,這些變動(dòng)至少扭轉(zhuǎn)了傳統(tǒng)觀點(diǎn)對(duì)于藥物的認(rèn)知,讓其下探到更加微觀的世界。
AI藥物開發(fā)的“三座大山”
“人工智能不僅給相關(guān)科學(xué)家?guī)砹诵碌奶魬?zhàn),也給生物制藥行業(yè)及其發(fā)現(xiàn)和開發(fā)新藥的既定流程帶來了新的挑戰(zhàn)。”2019年12月,《自然評(píng)論藥物發(fā)現(xiàn)》(Nature Reviews Drug Discovery)刊登的一篇文章,重新思考了AI時(shí)代的藥物設(shè)計(jì)。
在藥物發(fā)現(xiàn)中,將先導(dǎo)分子的特征提高到候選藥物級(jí)別的過程,被稱為“設(shè)計(jì)-制造-測(cè)試-分析”(DMTA)周期。這種基于假設(shè)的經(jīng)典方法,首先使用可用數(shù)據(jù)來進(jìn)行假設(shè)并設(shè)計(jì)分子(或從庫中選擇現(xiàn)有分子),隨后合成設(shè)計(jì)化合物,并用適當(dāng)活性測(cè)試法進(jìn)行測(cè)試和驗(yàn)證假設(shè)。然后,對(duì)這些知識(shí)進(jìn)行分析并將其轉(zhuǎn)化為下一個(gè)周期的設(shè)計(jì)假設(shè)的基礎(chǔ)。
AI的優(yōu)勢(shì),在于無需依賴大型篩選化合物庫,而是可以在每次操作中合成少量化合物,并且僅以測(cè)試所需的量進(jìn)行合成。換句話說,AI為提高DMTA效率提供了一系列選擇。通過提供改進(jìn)合成路線和優(yōu)化反應(yīng)條件,AI算法模型可以使化學(xué)家遵循最有效的路線,從而縮短“制造”階段。
需要指出,一套標(biāo)準(zhǔn)的數(shù)據(jù)集對(duì)建立AI預(yù)測(cè)模型至關(guān)重要。如果憑借有限的數(shù)據(jù)以及局限的理解來進(jìn)行預(yù)測(cè),那么即使是很復(fù)雜的算法,也無法產(chǎn)生有用的結(jié)果。
實(shí)際上,數(shù)據(jù)問題正是當(dāng)前業(yè)界對(duì)AI應(yīng)用于藥物開發(fā)的作用有無及其大小的分歧源頭之一。文首引述的兩個(gè)案例,也要面臨同樣的追問:有些內(nèi)部數(shù)據(jù)無法獲取,AI的數(shù)據(jù)集和訓(xùn)練集都有局限;此外,由于數(shù)據(jù)的規(guī)范不一致,質(zhì)量問題也影響了結(jié)果的可信度。
然而,溫書豪卻對(duì)此有所保留:“數(shù)據(jù)不可忽視,但對(duì)數(shù)據(jù)本身的理解同樣重要。一開始,訓(xùn)練集的大小還真不一定有那么關(guān)鍵。”以晶泰科技的經(jīng)驗(yàn)為例,由于早期并不具備從大型藥企獲得數(shù)據(jù)的條件,晶泰科技犧牲巨大的算力,通過虛擬數(shù)據(jù)自建能力,解決藥物設(shè)計(jì)中最基本的模塊——這種數(shù)字孿生(Digital Twin)技術(shù),可以在虛擬空間中完成映射,從而反映相對(duì)應(yīng)的實(shí)體裝備的全生命周期過程。
另一方面,晶泰科技在具體項(xiàng)目過程中,也會(huì)衍生出一系列可用數(shù)據(jù)。并且,這種數(shù)據(jù)的反饋直接作用于算法模型,幫助后者優(yōu)化調(diào)整。有趣的是,溫書豪似乎比外界更在意AI算法的可發(fā)揮空間。“每個(gè)新藥開發(fā)項(xiàng)目中,我們會(huì)對(duì)算法在每個(gè)環(huán)節(jié)起了多少作用進(jìn)行評(píng)估,甚至要建立相應(yīng)的量化標(biāo)準(zhǔn)。”溫書豪補(bǔ)充說。
相較于“AI新藥發(fā)現(xiàn)”的概念,溫書豪更愿意將這個(gè)過程看作“數(shù)字化和人工智能在制藥工業(yè)的一次效率升級(jí)”。而升級(jí)的內(nèi)涵,除了是數(shù)據(jù)獲取與算法利用方式的變革之外,還包括了算力的巨大提升。
深入至原子電子級(jí)的微觀藥物分子研究
“在微觀上,他們(晶泰科技)正在計(jì)算藥物分子中電子效應(yīng)對(duì)藥物作用帶來的影響。但由于分子具有許多不斷移動(dòng)和變化的電子,因此必須同時(shí)執(zhí)行多次計(jì)算,而得出最終答案可能需要數(shù)十億次計(jì)算。”輝瑞格羅頓研究站材料科學(xué)的全球負(fù)責(zé)人Bruno Hancock,在前述那篇關(guān)于晶泰科技合作的文章中指出,當(dāng)云服務(wù)提供商為這些項(xiàng)目計(jì)算時(shí),晶泰科技成為其最大的用戶。
目前,晶泰科技仍舊借助云服務(wù)提供商進(jìn)行計(jì)算工作。但從最理想的情況出發(fā),溫書豪也設(shè)想過構(gòu)建內(nèi)部云端架構(gòu)。這可以進(jìn)一步降低成本,加快項(xiàng)目周期,與此同時(shí),還能把晶泰科技的算法融入其中,實(shí)現(xiàn)協(xié)同效應(yīng)。
為制藥工業(yè)開源
以體量而論,作為最早布局國(guó)內(nèi)AI藥物開發(fā)的科技公司之一,晶泰科技的成長(zhǎng)有目共睹。
2015年底,成立不到一年的晶泰科技便從騰訊獲得2400萬元A輪融資;2017年,晶泰科技的1500萬美元B輪融資中,股東還出現(xiàn)了紅杉資本中國(guó)和Google的身影;在2018年,中國(guó)人壽作為領(lǐng)投方,也參與了晶泰科技B+輪融資。
“AI、云計(jì)算和醫(yī)藥結(jié)合的科技公司”,這是此前溫書豪給晶泰科技打下的標(biāo)簽。按照其所規(guī)劃的發(fā)展邏輯,晶泰科技通過算法連接了AI和藥物研發(fā),這為TMT領(lǐng)域的基金入局提供了可能。更重要的是,引入這些投資方后,晶泰科技得以調(diào)動(dòng)后者所擁有的巨大算力,進(jìn)而實(shí)現(xiàn)對(duì)藥物開發(fā)環(huán)節(jié)的推動(dòng)。
這便回到晶泰科技的起點(diǎn)上。“我們最終的目的,是幫助制藥工業(yè)開源,而開源的表現(xiàn)之一就是,大家可以利用這個(gè)平臺(tái),催生出更多的藥物資產(chǎn)。”溫書豪認(rèn)為,“對(duì)大藥企來說意味著新的產(chǎn)品管線,對(duì)中小藥企來說是孵化和壯大的機(jī)會(huì),對(duì)CRO公司來說則增加了相應(yīng)的研發(fā)需求帶給他們更多的業(yè)務(wù)。”