太阳城集团娱乐球赛-澳门太阳城集团周焯华老婆-澳门太阳城集团车模-豪胜娱乐城客户端

清華主頁(yè) - 清華新聞 - 學(xué)術(shù)科研 - 正文

生命學(xué)院王童課題組綜述基于機(jī)器學(xué)習(xí)力場(chǎng)的人工智能驅(qū)動(dòng)的生物分子模擬最新進(jìn)展

清華新聞網(wǎng)11月28日電 分子動(dòng)力學(xué)(MD)模擬是探究生物分子機(jī)制的重要工具,其成功依賴(lài)于力場(chǎng)的準(zhǔn)確性、效率和泛化能力。近年來(lái),人工智能驅(qū)動(dòng)的MD模擬快速發(fā)展,從靜態(tài)結(jié)構(gòu)預(yù)測(cè)向動(dòng)態(tài)行為建模轉(zhuǎn)型,為揭示信號(hào)通路、藥物靶點(diǎn)結(jié)合等提供原子級(jí)洞見(jiàn),推動(dòng)生物機(jī)制闡明和藥物發(fā)現(xiàn)。

11月21日,清華大學(xué)生命科學(xué)學(xué)院王童課題組應(yīng)邀在《結(jié)構(gòu)生物學(xué)的當(dāng)前觀(guān)點(diǎn)》(Current Opinion in Structural Biology)上發(fā)表題為“基于機(jī)器學(xué)習(xí)力場(chǎng)的AI驅(qū)動(dòng)的生物分子模擬最新進(jìn)展”(Recent advances in artificial intelligence–driven biomolecular dynamics simulations based on machine learning force fields)的綜述文章。文章概述了機(jī)器學(xué)習(xí)力場(chǎng)(MLFF)的設(shè)計(jì)關(guān)鍵因素,總結(jié)了三大類(lèi)MLFF的進(jìn)展,分析了其局限性,并展望了其在全細(xì)胞多尺度模擬中的應(yīng)用。

近年來(lái),人工智能的興起,如AlphaFold在蛋白質(zhì)結(jié)構(gòu)預(yù)測(cè)領(lǐng)域的突破,凸顯了人工智能在計(jì)算結(jié)構(gòu)生物學(xué)中的潛力?;贛LFF分子動(dòng)力學(xué)模擬使用神經(jīng)網(wǎng)絡(luò)計(jì)算原子的受力并迭代更新位置和速度,能夠追蹤分子行為的時(shí)序演化,從而探查生物分子的復(fù)雜機(jī)制。

MLFF的成功取決于準(zhǔn)確性、效率和泛化能力的平衡。準(zhǔn)確性要求預(yù)測(cè)能量和力忠實(shí)再現(xiàn)量子勢(shì)能面,以準(zhǔn)確計(jì)算如蛋白折疊自由能等宏觀(guān)性質(zhì)。效率確保對(duì)于蛋白質(zhì)折疊或變構(gòu)調(diào)控的長(zhǎng)時(shí)間尺度模擬。目前MLFF對(duì)典型生物體系在顯式水環(huán)境中的模擬速度可達(dá)每天數(shù)納秒。泛化能力則要求模型能夠在有限數(shù)據(jù)的訓(xùn)練下,泛化到不同構(gòu)象和分子上?;谄位呗院蚆LFF的MD系統(tǒng)極大提高了泛化性,避免為每個(gè)系統(tǒng)從頭訓(xùn)練的高成本。

機(jī)器學(xué)習(xí)力場(chǎng)設(shè)計(jì)中的關(guān)鍵因素:準(zhǔn)確性、效率和泛化能力

通過(guò)神經(jīng)網(wǎng)絡(luò)參數(shù)化經(jīng)典分子力場(chǎng)是MLFF的一大類(lèi)別,如Espaloma、ByteFF等。這些方法利用從頭計(jì)算數(shù)據(jù)集優(yōu)化經(jīng)典力場(chǎng)的鍵合和非鍵合項(xiàng)參數(shù),捕捉多體相互作用如極化和電荷轉(zhuǎn)移,同時(shí)保留經(jīng)典力場(chǎng)的計(jì)算效率。ByteFF在蛋白質(zhì)和核酸模擬中表現(xiàn)出色,超越傳統(tǒng)力場(chǎng)在能量和力計(jì)算方面的精度。

端到端訓(xùn)練的MLFF摒棄固定解析形式,直接建立原子坐標(biāo)到勢(shì)能面的映射,旨在突破經(jīng)典力場(chǎng)限制以逼近從頭算精度。相較于早期的不變性模型,引入等變圖神經(jīng)網(wǎng)絡(luò)(EGNN)已成為主流,通過(guò)在網(wǎng)絡(luò)中保留旋轉(zhuǎn)和平移的幾何對(duì)稱(chēng)性,顯著提升了模型的數(shù)據(jù)利用率與準(zhǔn)確性。以ViSNet為例,該模型采用高效的標(biāo)量-矢量交互網(wǎng)絡(luò)架構(gòu),并基于物理啟發(fā)引入四體相互作用,在避免高昂計(jì)算成本的同時(shí)有效增強(qiáng)了對(duì)復(fù)雜幾何特征及遠(yuǎn)程相互作用的捕捉,為生物大分子體系提供了兼具高精度與高效率的模擬方案。

為克服端到端模型在泛化上的局限性,AI2BMD和GEMS等通用力場(chǎng)引入了片段化策略。AI2BMD基于二肽單元構(gòu)建通用庫(kù),GEMS則融合bottom-up的小分子與top-down的特異性片段,實(shí)現(xiàn)了對(duì)大分子體系的高效擴(kuò)展。實(shí)驗(yàn)表明,這些方法不僅能精確計(jì)算蛋白質(zhì)熱力學(xué)性質(zhì)和折疊自由能,還能準(zhǔn)確復(fù)現(xiàn)太赫茲光譜等動(dòng)態(tài)特征,在萬(wàn)原子級(jí)溶劑化體系中實(shí)現(xiàn)了近從頭算精度。

盡管進(jìn)展顯著,MLFF仍面臨準(zhǔn)確性、效率與泛化性的多重挑戰(zhàn)與內(nèi)在權(quán)衡。局域截?cái)嘞拗屏藢?duì)長(zhǎng)程靜電相互作用的捕捉,計(jì)算效率仍顯著慢于經(jīng)典力場(chǎng),制約了對(duì)慢速生物過(guò)程的探索。此外,各要素間難以兼得:提升模型精度往往以犧牲效率為代價(jià),而追求廣泛的化學(xué)空間覆蓋則可能導(dǎo)致特定體系的預(yù)測(cè)精度下降。

展望未來(lái),MLFF將與虛擬細(xì)胞模型和粗?;硎菊?,實(shí)現(xiàn)全細(xì)胞多尺度模擬,橋接計(jì)算預(yù)測(cè)與實(shí)驗(yàn)驗(yàn)證,加速生物機(jī)制闡明和治療發(fā)現(xiàn)。

清華大學(xué)生命科學(xué)學(xué)院助理教授王童為論文通訊作者,王童課題組來(lái)自香港中文大學(xué)的實(shí)習(xí)生崔濤鏞和來(lái)自北京大學(xué)的實(shí)習(xí)生周雨濤為論文共同第一作者。研究得到國(guó)家重點(diǎn)研發(fā)計(jì)劃、清華-北大生命科學(xué)聯(lián)合中心、北京生物結(jié)構(gòu)前沿研究中心等的支持。

論文鏈接:

https://doi.org/10.1016/j.sbi.2025.103191

供稿:生命學(xué)院

編輯:李華山

審核:郭玲

2025年11月28日 15:05:56

相關(guān)新聞

讀取內(nèi)容中,請(qǐng)等待...

最新動(dòng)態(tài)

清華大學(xué)新聞中心版權(quán)所有,清華大學(xué)新聞網(wǎng)編輯部維護(hù),電子信箱: [email protected]
Copyright 2001-2020 news.tsinghua.edu.cn. All rights reserved.