清華新聞網(wǎng)12月31日電 近日,清華大學(xué)生命科學(xué)學(xué)院歐光朔課題組開(kāi)發(fā)了一種名為SynSeg的通用方法,通過(guò)生成合成數(shù)據(jù)來(lái)訓(xùn)練機(jī)器學(xué)習(xí)模型,實(shí)現(xiàn)了對(duì)亞細(xì)胞結(jié)構(gòu)的魯棒分割,徹底消除了對(duì)手工標(biāo)注數(shù)據(jù)的需求。SynSeg利用幾何基元和域隨機(jī)化策略,在囊泡、細(xì)胞骨架等多種結(jié)構(gòu)的分割任務(wù)中表現(xiàn)優(yōu)異,并可成功應(yīng)用于神經(jīng)退行性疾病和脂代謝疾病的定量分析。

圖1.細(xì)胞骨架為例分割模型。(a)合成細(xì)胞骨架數(shù)據(jù)集生成與U-Net模型架構(gòu)。(b)基于A(yíng)iryscan成像對(duì)split-GFP標(biāo)記的TUBA1A進(jìn)行細(xì)胞骨架分割
SynSeg方法的核心理念在于,生成魯棒的訓(xùn)練數(shù)據(jù)并不需要完美的物理模擬。通過(guò)引入域隨機(jī)化(Domain Randomization),SynSeg構(gòu)建了包含各種噪聲、模糊、強(qiáng)度變化和干擾項(xiàng)的合成數(shù)據(jù)集。這些合成數(shù)據(jù)往往比真實(shí)圖像更具挑戰(zhàn)性,從而迫使模型學(xué)習(xí)魯棒的形態(tài)特征,而非死記硬背圖像。這種方法不僅降低了建模門(mén)檻,還極大地提高了模型的泛化能力。
團(tuán)隊(duì)首先在囊泡分割任務(wù)中驗(yàn)證了SynSeg的有效性。在培養(yǎng)細(xì)胞(HeLa cells)和模式動(dòng)物秀麗隱桿線(xiàn)蟲(chóng)(C. elegans)的溶酶體相關(guān)細(xì)胞器成像中,SynSeg能夠精準(zhǔn)識(shí)別微弱和小尺寸的囊泡,在復(fù)雜背景下依然保持了形態(tài)細(xì)節(jié),性能顯著優(yōu)于一系列基線(xiàn)方法。隨后,團(tuán)隊(duì)將該方法擴(kuò)展至更為復(fù)雜的細(xì)胞骨架分割。針對(duì)微管和肌動(dòng)蛋白絲的分割挑戰(zhàn),SynSeg展現(xiàn)了卓越的性能。在A(yíng)iryscan超高分辨率成像數(shù)據(jù)中,SynSeg在IoU、Dice系數(shù)和精度等關(guān)鍵指標(biāo)上均優(yōu)于傳統(tǒng)方法(如Otsu、ILEE)以及專(zhuān)門(mén)的絲狀結(jié)構(gòu)分析工具FilamentSensor2.0 。
在更具挑戰(zhàn)性的活體動(dòng)態(tài)成像場(chǎng)景中,SynSeg展現(xiàn)了強(qiáng)大的魯棒性。利用轉(zhuǎn)基因秀麗隱桿線(xiàn)蟲(chóng)模型,研究人員對(duì)表皮微管進(jìn)行了低分辨率、高噪聲的轉(zhuǎn)盤(pán)共聚焦活體成像。SynSeg不僅成功分割了密集的微管網(wǎng)絡(luò),還能在沒(méi)有時(shí)序訓(xùn)練的情況下,精準(zhǔn)捕捉微管的聚合和重排動(dòng)態(tài) 。此外,為了測(cè)試泛化能力,研究團(tuán)隊(duì)將SynSeg應(yīng)用于完全不同成像系統(tǒng)獲得的植物細(xì)胞(煙草BY-2細(xì)胞)微管數(shù)據(jù)集。結(jié)果顯示,在無(wú)需任何重新訓(xùn)練或微調(diào)的情況下,SynSeg的表現(xiàn)竟優(yōu)于該數(shù)據(jù)集原研究中專(zhuān)門(mén)訓(xùn)練的深度學(xué)習(xí)模型,展現(xiàn)了該方法對(duì)活體成像中的動(dòng)態(tài)捕捉與跨數(shù)據(jù)集泛化能力。
SynSeg不僅是一個(gè)分割工具,更是定量細(xì)胞生物學(xué)的有力工具,可通過(guò)量化病理特征賦能疾病研究。研究團(tuán)隊(duì)利用SynSeg定量分析了與神經(jīng)退行性疾病相關(guān)的Tau蛋白。結(jié)果發(fā)現(xiàn),致病突變Tau-F(R406W)會(huì)導(dǎo)致微管異常成束,表現(xiàn)為局部熒光強(qiáng)度的顯著增加。此外,研究人員還將SynSeg與YOLO目標(biāo)檢測(cè)模型結(jié)合,建立了一套全自動(dòng)的高內(nèi)涵篩選流程,用于分析先天性脂肪營(yíng)養(yǎng)不良癥2型(BSCL2)模型細(xì)胞中的脂滴(Lipid Droplets)。分析結(jié)果揭示,BSCL2的特定錯(cuò)義突變會(huì)導(dǎo)致脂滴尺寸顯著增加,從而將基因突變與具體的細(xì)胞表型缺陷直接關(guān)聯(lián)。

圖2.擴(kuò)展SynSeg框架用于疾病相關(guān)細(xì)胞定量分析。(a)BSCL2 野生型(WT)細(xì)胞,與基因敲除(KO)細(xì)胞熒光圖像,表明該模型能夠準(zhǔn)確測(cè)量?jī)煞N細(xì)胞類(lèi)型中的脂滴(LD)尺寸。(b)BSCL2 WT、KO及四種錯(cuò)義突變體脂滴尺寸的定量比較與統(tǒng)計(jì)分析。熱圖呈現(xiàn)了所有生物學(xué)重復(fù)之間兩兩比較的結(jié)果,顏色越深表示被比較的兩組之間的統(tǒng)計(jì)顯著性越大
綜上所述,該研究提出了SynSeg這一基于合成數(shù)據(jù)的分割新范式。它通過(guò)模擬圖像的幾何本質(zhì)與光學(xué)特性,克服了深度學(xué)習(xí)對(duì)標(biāo)注數(shù)據(jù)的依賴(lài),解決了傳統(tǒng)方法抗噪性差的難題。SynSeg不僅在多種生物成像場(chǎng)景中表現(xiàn)魯棒,還展現(xiàn)了強(qiáng)大的泛化能力和定量分析潛力,為細(xì)胞生物學(xué)和病理學(xué)研究提供了一套高效、可擴(kuò)展的自動(dòng)化分析工具。
研究成果以“SynSeg:一種用于廣泛亞細(xì)胞結(jié)構(gòu)分割的合成數(shù)據(jù)驅(qū)動(dòng)方法”(SynSeg: A synthetic data-driven approach for robust subcellular structure segmentation)為題,與12月18日發(fā)表于《細(xì)胞生物學(xué)雜志》(Journal of Cell Biology)。
清華大學(xué)生命科學(xué)學(xué)院教授歐光朔為論文通訊作者,清華大學(xué)生命科學(xué)學(xué)院2023級(jí)博士生郭正陽(yáng)為論文第一作者。研究得到清華-北大生命科學(xué)聯(lián)合中心、北京生物結(jié)構(gòu)前沿研究中心、清華-IDG/麥戈文腦科學(xué)研究院、國(guó)家自然科學(xué)基金委等單位以及錢(qián)塘冠名教授項(xiàng)目的支持與資助。
論文鏈接:
https://doi.org/10.1083/jcb.202506096
供稿:生命學(xué)院
編輯:李華山
審核:郭玲