清華新聞網(wǎng)4月15日電 藥物研發(fā)的流程通常漫長(zhǎng)且成本高昂,人工智能技術(shù)通過(guò)對(duì)藥物數(shù)據(jù)的快速分析建模,成為了加速藥物研發(fā)過(guò)程的重要技術(shù)手段。然而,現(xiàn)有的深度學(xué)習(xí)模型決策過(guò)程不透明,可解釋性不足,無(wú)法可靠地應(yīng)用在藥物研發(fā)中。此外,模型還依賴(lài)于大量的有標(biāo)簽數(shù)據(jù),但在藥物研發(fā)的過(guò)程中,數(shù)據(jù)獲取通常伴隨著高昂的成本和漫長(zhǎng)的時(shí)間等待,這導(dǎo)致藥物標(biāo)簽數(shù)據(jù)極為稀缺。常見(jiàn)模型在這種場(chǎng)景下存在預(yù)測(cè)準(zhǔn)確性低、數(shù)據(jù)需求量大、可解釋能力弱的局限。為了應(yīng)對(duì)這一問(wèn)題,清華大學(xué)電子工程系姚權(quán)銘助理教授課題組以小樣本學(xué)習(xí)技術(shù)作為突破口,研究提升模型樣本利用效率的算法,使深度學(xué)習(xí)模型能快速泛化到只有少量有標(biāo)簽樣本的藥物研發(fā)相關(guān)任務(wù)上。

圖1.(a)人工智能助力藥物研發(fā)的重要挑戰(zhàn):可解釋性不足和樣本數(shù)量稀缺(b)現(xiàn)有的藥物研發(fā)相關(guān)任務(wù)研究方法存在的局限
藥物研發(fā)相關(guān)的典型任務(wù)——藥物互作用(Drug-Drug Interaction,DDI)預(yù)測(cè)是臨床研究的重要部分。目前大約有6.7%的住院患者面臨藥物副反應(yīng)的困擾,大約有0.32%的住院患者面臨藥物副反應(yīng)帶來(lái)的生命危險(xiǎn)。挖掘潛在的藥物間相互作用對(duì)于加速藥物研發(fā)過(guò)程和加強(qiáng)人民健康保障都有重要意義。該任務(wù)可以建模為藥物-藥物互作用網(wǎng)絡(luò)上的鏈路預(yù)測(cè)問(wèn)題。然而,由稀缺的藥物標(biāo)簽數(shù)據(jù)構(gòu)建的藥物-藥物互作用網(wǎng)絡(luò)非常稀疏,傳統(tǒng)數(shù)據(jù)驅(qū)動(dòng)方法在這種場(chǎng)景下表現(xiàn)不佳。

圖2.(a)小樣本學(xué)習(xí)技術(shù)啟發(fā)的基于流的圖神經(jīng)網(wǎng)絡(luò)(EmerGNN)的框架(b)基于流的圖神經(jīng)網(wǎng)絡(luò)(EmerGNN)在預(yù)測(cè)準(zhǔn)確性、數(shù)據(jù)需求量、可解釋能力方面與基線(xiàn)方法的比較
針對(duì)藥物標(biāo)簽數(shù)據(jù)稀缺的問(wèn)題,課題組采用了小樣本學(xué)習(xí)的方法,在醫(yī)藥領(lǐng)域首次提出了有效的深度學(xué)習(xí)方法——“藥物相互作用的知識(shí)子圖學(xué)習(xí)方法(Knowledge Subgraph Learning for Drug-drug Interaction Prediction,KnowDDI)”和“基于流的圖神經(jīng)網(wǎng)絡(luò)與生物醫(yī)學(xué)網(wǎng)絡(luò)的新興藥物相互作用預(yù)測(cè)(Emerging Drug Interaction Prediction by Flow-based Graph Neural Network,EmerGNN)”,這兩種方法分別高效地實(shí)現(xiàn)了現(xiàn)有藥物潛在互作用的發(fā)掘和新藥物間反應(yīng)的預(yù)測(cè)。
課題組在原始藥物間反應(yīng)圖譜的基礎(chǔ)上引入了生物醫(yī)藥網(wǎng)絡(luò)(Biomedical Network),利用其中豐富的醫(yī)藥學(xué)信息,構(gòu)建了新的醫(yī)藥圖譜,有效解決了監(jiān)督數(shù)據(jù)不足的問(wèn)題。醫(yī)藥圖譜信息豐富,但同時(shí)也伴隨著眾多的噪聲,準(zhǔn)確預(yù)測(cè)藥物互作用需要排除噪聲干擾,挖掘有效信息。因此,課題組從醫(yī)藥圖譜中提取目標(biāo)藥物之間的關(guān)系路徑作為子圖,并為路徑設(shè)置注意力權(quán)重,基于注意力機(jī)制建立基于流的圖神經(jīng)網(wǎng)絡(luò)EmerGNN,以此完成關(guān)鍵知識(shí)的提取與知識(shí)傳遞,建立了藥物互作用預(yù)測(cè)的完整框架(圖2.a)。在公共數(shù)據(jù)集上的大量實(shí)驗(yàn)表明,提出的EmerGNN在預(yù)測(cè)準(zhǔn)確性和可解釋能力上顯著優(yōu)于基線(xiàn)方法,數(shù)據(jù)需求量顯著降低(圖2.b)。這些成果為藥物研發(fā)中的藥物互作用預(yù)測(cè)提供了有效的算法和工具,增強(qiáng)了算法的可解釋性,展現(xiàn)了人工智能在醫(yī)藥領(lǐng)域的重要輔助作用。這些研究成果有望應(yīng)用于候選藥物篩選和臨床試驗(yàn),對(duì)于加速藥物研發(fā)和促進(jìn)人類(lèi)健康具有重大意義。
相關(guān)研究成果以“藥物相互作用的知識(shí)子圖學(xué)習(xí)方法”(Accurate and Interpretable Drug-Drug Interaction Prediction Enabled by Knowledge Subgraph Learning)為題,近期發(fā)表于《自然·通訊(醫(yī)藥)》(Nature Communication Medicine)。百度研究員王雅晴博士為論文第一作者,姚權(quán)銘為論文通訊作者。以“基于流的圖神經(jīng)網(wǎng)絡(luò)與生物醫(yī)學(xué)網(wǎng)絡(luò)的新興藥物相互作用預(yù)測(cè)”(Emerging Drug Interaction Prediction by Flow-based Graph Neural Network)為題,近期發(fā)表于《自然·計(jì)算科學(xué)》(Nature Computational Science),第四范式(北京)技術(shù)有限公司研究員張永祺博士為論文第一作者,姚權(quán)銘為論文通訊作者。研究得到國(guó)家自然科學(xué)基金項(xiàng)目的支持。
論文鏈接:
https://www.nature.com/articles/s43856-024-00486-y.pdf
https://www.nature.com/articles/s43588-023-00558-4
供稿:電子系
編輯:李華山
審核:郭玲