清華交叉信息研究院曾堅(jiān)陽(yáng)研究組開(kāi)發(fā)三維基因組結(jié)構(gòu)重構(gòu)新方法
清華新聞網(wǎng)5月5日電 清華大學(xué)交叉信息研究院曾堅(jiān)陽(yáng)研究組成功開(kāi)發(fā)了基于FISH數(shù)據(jù)和Hi-C數(shù)據(jù)的三維基因組重構(gòu)方法,相關(guān)研究論文《基于FISH和Hi-C數(shù)據(jù)整合的三維基因組結(jié)構(gòu)建模》(Integrating Hi-C and FISH data for modeling of the 3D organization of chromosomes)5月3日在《自然·通訊》在線(xiàn)發(fā)表。

三維基因組結(jié)構(gòu)建模的流程圖

三維基因組結(jié)構(gòu)建模結(jié)果
大量研究表明,染色體的空間結(jié)構(gòu)與細(xì)胞內(nèi)大多數(shù)的生物過(guò)程包括基因調(diào)控、DNA復(fù)制以及染色體異位等密切相關(guān)。因此,三維基因組結(jié)構(gòu)解析對(duì)于細(xì)胞內(nèi)生物過(guò)程的理解具有十分重要的意義。近年來(lái),染色體構(gòu)象捕獲(3C)技術(shù)高速發(fā)展,通過(guò)與高通量測(cè)序技術(shù)相結(jié)合(Hi-C),可以直接獲得全基因組范圍內(nèi)染色體相互作用圖譜?;谌旧w相互作用圖譜,可以分析出染色體的層次結(jié)構(gòu)并且重構(gòu)出三維空間結(jié)構(gòu),從而為下游的分析和實(shí)驗(yàn)提供有價(jià)值的線(xiàn)索,并且為染色體折疊機(jī)制和功能的研究提供幫助。目前,由于Hi-C實(shí)驗(yàn)的限制,高分辨的三維基因組結(jié)構(gòu)的重構(gòu)難度較大。
曾堅(jiān)陽(yáng)研究組在三維基因組結(jié)構(gòu)的重構(gòu)方面具有豐富的經(jīng)驗(yàn),先后開(kāi)發(fā)出了基于貝葉斯推斷和流形學(xué)習(xí)并結(jié)合染色體物理特性的建模方法,相關(guān)成果均發(fā)表在核心期刊《核酸研究》(Nucleic Acids Research)上,其中基于流形學(xué)習(xí)的GEM方法被《基因組蛋白質(zhì)組與生物信息學(xué)報(bào)》(Genomics,Proteomics & Bioinformatics,簡(jiǎn)稱(chēng)GPB)評(píng)為2018年國(guó)內(nèi)生物信息學(xué)十大進(jìn)展之一。
此次曾堅(jiān)陽(yáng)研究組發(fā)表于《自然·通訊》的方法基于上述流形學(xué)習(xí)的模型首次將FISH數(shù)據(jù)與Hi-C數(shù)據(jù)相結(jié)合,極大程度上提高了結(jié)構(gòu)建模的準(zhǔn)確性。在該方法中,建模過(guò)程分為三個(gè)主要的步驟:第一,利用FISH數(shù)據(jù)和Hi-C數(shù)據(jù)來(lái)確定拓?fù)浣Y(jié)構(gòu)域(TADs)的相對(duì)空間位置;第二,利用Hi-C數(shù)據(jù)提供的幾何約束以及多聚體的生物物理性質(zhì)來(lái)確定TADs內(nèi)的結(jié)構(gòu);第三,將上述兩步進(jìn)行融合,調(diào)整優(yōu)化后得到最終的三維基因組結(jié)構(gòu)。在與之前方法的比較中,該方法將結(jié)構(gòu)的平均相對(duì)誤差降低了近一半,進(jìn)一步的下游分析表明,該方法可以準(zhǔn)確構(gòu)建出染色體的基本層次結(jié)構(gòu)。
論文第一作者是曾堅(jiān)陽(yáng)研究組的埃及籍博士后艾哈邁德·阿巴斯(Ahmed Abbas),通訊作者是曾堅(jiān)陽(yáng)副教授,合作者包括高軍濤研究員等。研究成果得到國(guó)家自然科學(xué)基金等項(xiàng)目經(jīng)費(fèi)的支持。
論文鏈接:
https://www.nature.com/articles/s41467-019-10005-6
供稿:交叉信息研究院
編輯:李華山
審核:周襄楠