太阳城集团娱乐球赛-澳门太阳城集团周焯华老婆-澳门太阳城集团车模-豪胜娱乐城客户端

清華主頁(yè) - 清華新聞 - 學(xué)術(shù)科研 - 正文

生命學(xué)院魯志課題組合作發(fā)表人工智能模型RNAsmol預(yù)測(cè)靶向RNA的小分子藥物

清華新聞網(wǎng)6月27日電 目前絕大多數(shù)的臨床藥物以蛋白質(zhì)作為靶標(biāo),然而,許多蛋白質(zhì)由于缺乏合適的結(jié)構(gòu)口袋,常被認(rèn)為是“難成藥”或“不可成藥”的。在人類(lèi)的2萬(wàn)個(gè)左右的蛋白編碼基因(占人類(lèi)基因組總長(zhǎng)度的1.5%左右)中,大約有10%至15%與疾病直接相關(guān);而在這些基因中,據(jù)估計(jì)僅有700至900個(gè)的蛋白產(chǎn)物是可以成藥的(僅占人類(lèi)基因組總長(zhǎng)度的0.05%左右)。另一方面,人類(lèi)基因組的約70%甚至更多都會(huì)被轉(zhuǎn)錄成RNA,其中大多是非編碼RNA(ncRNA。因此,近年來(lái)開(kāi)始有越來(lái)越多的研究者試圖將RNA作為藥物靶標(biāo),并初步證明了這一策略的可行性。新藥研發(fā)成本昂貴且周期漫長(zhǎng),使用計(jì)算機(jī)輔助藥物設(shè)計(jì)能夠極大地降低研發(fā)成本,助力并加速靶向RNA的小分子藥物的研發(fā)進(jìn)程。然而,由于公開(kāi)的RNA-小分子互作及已知的高分辨率RNA結(jié)構(gòu)數(shù)據(jù)匱乏,開(kāi)發(fā)數(shù)據(jù)驅(qū)動(dòng)的深度學(xué)習(xí)模型仍面臨諸多挑戰(zhàn)。

6月24日,清華大學(xué)生命學(xué)院魯志課題組和合作者在《自然·計(jì)算科學(xué)》(Nature Computational Science)發(fā)表了題為“通過(guò)數(shù)據(jù)擾動(dòng)與增強(qiáng)模型進(jìn)行RNA-配體相互作用預(yù)測(cè)”(RNA-ligand interaction scoring via data perturbation and augmentation modeling)的研究論文。該研究突破了傳統(tǒng)藥物設(shè)計(jì)方法依賴(lài)三維結(jié)構(gòu)的局限,針對(duì)RNA結(jié)構(gòu)匱乏的現(xiàn)實(shí),提出了一種基于序列輸入的RNA-小分子相互作用AI預(yù)測(cè)模型RNAsmol。該模型為靶向RNA的小分子藥物研發(fā)提供了高效計(jì)算工具,為不依賴(lài)三維結(jié)構(gòu)的人工智能輔助藥物設(shè)計(jì)提供了新的方案和思路。

該工作提出的RNAsmol框架,是一種結(jié)合數(shù)據(jù)擾動(dòng)和數(shù)據(jù)增廣策略的深度學(xué)習(xí)方法。在該框架中,數(shù)據(jù)擾動(dòng)通過(guò)對(duì)訓(xùn)練數(shù)據(jù)進(jìn)行隨機(jī)擾動(dòng)模擬真實(shí)環(huán)境中的數(shù)據(jù)多樣性,從而幫助模型更好地學(xué)習(xí)到RNA-小分子結(jié)合的規(guī)律。而數(shù)據(jù)增廣則通過(guò)在已知互作的基礎(chǔ)上生成虛擬的負(fù)樣本和潛在的未標(biāo)記樣本,增加模型對(duì)未知空間的識(shí)別能力。這種策略不僅提高了模型的魯棒性,還幫助其更好地捕捉到不同類(lèi)型的相互作用模式。此外,該模型結(jié)合基于圖的分子特征表示方法和圖擴(kuò)散卷積模塊對(duì)藥物小分子進(jìn)行結(jié)構(gòu)建模,通過(guò)基于注意力機(jī)制的特征融合模塊在多個(gè)模態(tài)下對(duì)靶標(biāo)和藥物分子特征進(jìn)行加權(quán)整合,最終實(shí)現(xiàn)RNA靶標(biāo)與小分子之間的打分預(yù)測(cè)。

圖1.RNAsmol模型和整體計(jì)算框架

在數(shù)據(jù)擾動(dòng)空間中,RNAsmol通過(guò)擾動(dòng)策略有效地減少了真實(shí)負(fù)樣本與未知互作空間之間的偏差。該策略通過(guò)對(duì)已知的負(fù)樣本進(jìn)行擾動(dòng),生成潛在的“負(fù)例”樣本,同時(shí)通過(guò)數(shù)據(jù)增廣技術(shù)擴(kuò)展已知的正例和負(fù)例樣本的邊界。這使得模型能夠更好地理解RNA與小分子之間的結(jié)合規(guī)律,尤其是在數(shù)據(jù)不均衡的情況下,避免了模型偏向已知的正負(fù)樣本。實(shí)驗(yàn)結(jié)果表明,RNAsmol在10折交叉驗(yàn)證中的表現(xiàn)超過(guò)了傳統(tǒng)方法,平均AUROC(曲線(xiàn)下面積)指標(biāo)提升約8%,同時(shí)在未見(jiàn)樣本的評(píng)估中,性能提升了約16%。這一優(yōu)勢(shì)證明了該方法在稀疏數(shù)據(jù)場(chǎng)景中的有效性,進(jìn)一步推動(dòng)了RNA-小分子結(jié)合預(yù)測(cè)的計(jì)算研究。

圖2.RNAsmol在不同驗(yàn)證集上的預(yù)測(cè)效果評(píng)估

在虛擬篩選的應(yīng)用中,RNAsmol展現(xiàn)出獨(dú)特的優(yōu)勢(shì)。與傳統(tǒng)依賴(lài)于結(jié)構(gòu)信息的篩選方法不同,RNAsmol完全基于RNA的序列信息進(jìn)行預(yù)測(cè)。因?yàn)樵S多與疾病相關(guān)的RNA靶點(diǎn)(如lncRNA)的三維結(jié)構(gòu)數(shù)據(jù)常常難以獲得,RNAsmol能夠彌補(bǔ)這一數(shù)據(jù)缺口實(shí)現(xiàn)對(duì)這些靶點(diǎn)的預(yù)測(cè)篩選。實(shí)驗(yàn)結(jié)果表明,RNAsmol在區(qū)分誘餌分子與真實(shí)配體時(shí),成功將排序得分提高了約30%。因此,RNAsmol在各類(lèi)RNA靶向藥物篩選中具有廣泛的適用性,通過(guò)該方法可以更加高效地篩選潛在的藥物分子。

圖3.RNAsmol和其他計(jì)算方法的比較

綜上所述,研究通過(guò)探究基于數(shù)據(jù)擾動(dòng)和增廣的深度學(xué)習(xí)訓(xùn)練策略在數(shù)據(jù)匱乏場(chǎng)景的應(yīng)用,為靶向RNA藥物研發(fā)的計(jì)算建模提供了新思路。

清華大學(xué)生命學(xué)院副教授魯志與南昌大學(xué)教授徐振江為論文通訊作者。清華大學(xué)已出站博士后(現(xiàn)為哈爾濱工業(yè)大學(xué)副研究員)馬洪麗為論文第一作者。研究得到國(guó)家重點(diǎn)研發(fā)計(jì)劃、國(guó)家自然科學(xué)基金、“生物信息學(xué)”教育部重點(diǎn)實(shí)驗(yàn)室、“綠色生物制造”全國(guó)重點(diǎn)實(shí)驗(yàn)室、清華大學(xué)精準(zhǔn)醫(yī)學(xué)研究院、拜耳公司等的資助支持。

論文鏈接:

https://www.nature.com/articles/s43588-025-00820-x

供稿:生命學(xué)院

編輯:李華山

審核:郭玲

2025年06月27日 14:54:28

相關(guān)新聞

讀取內(nèi)容中,請(qǐng)等待...

最新動(dòng)態(tài)

清華大學(xué)新聞中心版權(quán)所有,清華大學(xué)新聞網(wǎng)編輯部維護(hù),電子信箱: [email protected]
Copyright 2001-2020 news.tsinghua.edu.cn. All rights reserved.