太阳城集团娱乐球赛-澳门太阳城集团周焯华老婆-澳门太阳城集团车模-豪胜娱乐城客户端

清華主頁(yè) - 清華新聞 - 學(xué)術(shù)科研 - 正文

數(shù)學(xué)中心包承龍團(tuán)隊(duì)“面向蛋白質(zhì)結(jié)構(gòu)解析的弱配對(duì)數(shù)據(jù)生成算法”入選2025年度醫(yī)學(xué)人工智能代表性算法

清華新聞網(wǎng)12月18日電 12月12日至14日,第四屆醫(yī)學(xué)人工智能大會(huì)(CMAIC 2025)在蘇州舉行。會(huì)上,清華大學(xué)丘成桐數(shù)學(xué)科學(xué)中心副教授包承龍、2024屆博士畢業(yè)生鄭棣瀚以及求真書(shū)院2023級(jí)博士生張慧共同提出的“面向蛋白質(zhì)結(jié)構(gòu)解析的弱配對(duì)數(shù)據(jù)生成算法”入選2025年度醫(yī)學(xué)人工智能代表性算法。

20251215-清華包承龍團(tuán)隊(duì)“面向蛋白質(zhì)結(jié)構(gòu)解析的弱配對(duì)數(shù)據(jù)生成算法”入選2025年度中國(guó)醫(yī)學(xué)人工智能代表性算法-第四屆醫(yī)學(xué)人工智能大會(huì)-包承龍、張慧在第四屆醫(yī)學(xué)人工智能大會(huì)上接受證書(shū)頒授.jpg

包承龍(左一)、張慧(左二)接受證書(shū)頒授

冷凍電子顯微鏡(Cryo-EM)雖已成為解析生物大分子結(jié)構(gòu)的核心技術(shù),但在實(shí)際應(yīng)用中,由于復(fù)雜的成像環(huán)境和極低的信噪比,獲取高質(zhì)量的干凈-噪聲配對(duì)訓(xùn)練數(shù)據(jù)始終是制約AI算法性能的瓶頸。針對(duì)這一挑戰(zhàn),包承龍團(tuán)隊(duì)構(gòu)建了一套基于概率圖模型的弱配對(duì)數(shù)據(jù)生成理論體系。團(tuán)隊(duì)首先提出LUD-VAE模型,在僅有干凈域數(shù)據(jù)x與退化域數(shù)據(jù)y的邊緣樣本條件下,用概率圖顯式拆分結(jié)構(gòu)/內(nèi)容隱變量z與成像退化/噪聲隱變量z_n,并在推斷不變性假設(shè)下把ELBO寫(xiě)成無(wú)需成對(duì)樣本也可計(jì)算的形式,從而學(xué)習(xí)聯(lián)合分布并由條件分布p(y|x)把任意干凈樣本合成逼真的退化觀(guān)測(cè),批量產(chǎn)出可控的配對(duì)訓(xùn)練對(duì)。隨后,SeNM-VAE面向少量配對(duì)+大量不配對(duì)的實(shí)際情況,采用層級(jí)隱變量與混合推斷,將僅配對(duì)數(shù)據(jù)、僅干凈數(shù)據(jù)、僅退化數(shù)據(jù)三類(lèi)數(shù)據(jù)統(tǒng)一到同一變分目標(biāo)中,既保留可解釋的退化因子,又顯著增強(qiáng)對(duì)真實(shí)復(fù)雜噪聲分布的表達(dá)能力,生成更貼近實(shí)驗(yàn)的配對(duì)訓(xùn)練樣本。

20251215-清華包承龍團(tuán)隊(duì)“面向蛋白質(zhì)結(jié)構(gòu)解析的弱配對(duì)數(shù)據(jù)生成算法”入選2025年度中國(guó)醫(yī)學(xué)人工智能代表性算法-論文截圖-CryoPROS算法架構(gòu).png

CryoPROS算法架構(gòu)

在此基礎(chǔ)上,團(tuán)隊(duì)進(jìn)一步將弱配對(duì)數(shù)據(jù)生成模型應(yīng)用于冷凍電鏡領(lǐng)域長(zhǎng)期存在的“優(yōu)勢(shì)取向”難題。由于生物樣本易在氣液界面以特定方向吸附,導(dǎo)致顆粒在冰層中排列產(chǎn)生嚴(yán)重偏倚,進(jìn)而引發(fā)三維重構(gòu)失真。團(tuán)隊(duì)研發(fā)了基于條件層次化變分自編碼機(jī)(cHVAE)的CryoPROS算法,該算法能在超低信噪比及采樣不均衡條件下,高效生成高保真度的輔助顆粒視圖。這些生成數(shù)據(jù)有效補(bǔ)全了實(shí)驗(yàn)數(shù)據(jù)的采樣缺口,團(tuán)隊(duì)據(jù)此提出了生成數(shù)據(jù)與實(shí)驗(yàn)數(shù)據(jù)聯(lián)合優(yōu)化的計(jì)算范式,顯著降低了顆粒對(duì)齊誤差并提升了結(jié)構(gòu)解析的穩(wěn)健性。

目前,該系列成果已在多套實(shí)驗(yàn)數(shù)據(jù)中驗(yàn)證了其有效性,以計(jì)算手段突破了傳統(tǒng)方法依賴(lài)復(fù)雜生物樣本優(yōu)化或特殊數(shù)據(jù)收集策略的局限。CryoPROS算法已被由哈佛大學(xué)醫(yī)學(xué)院管理的國(guó)際生物軟件聯(lián)盟SBGrid收錄。

供稿:丘成桐數(shù)學(xué)科學(xué)中心

編輯:李華山

審核:郭玲

2025年12月18日 09:27:54

相關(guān)新聞

讀取內(nèi)容中,請(qǐng)等待...

最新動(dòng)態(tài)

清華大學(xué)新聞中心版權(quán)所有,清華大學(xué)新聞網(wǎng)編輯部維護(hù),電子信箱: [email protected]
Copyright 2001-2020 news.tsinghua.edu.cn. All rights reserved.