清華新聞網(wǎng)9月13日電 近日,清華大學(xué)交叉信息研究院的曾堅(jiān)陽(yáng)研究組與北京大學(xué)馬劍竹課題組、索爾克生物研究所、加利福尼亞大學(xué)、上海交通大學(xué)合作,首次將基因調(diào)控網(wǎng)絡(luò)顯式的引入單細(xì)胞RNA測(cè)序(scRNA-seq)數(shù)據(jù)建模中,其效果在調(diào)控網(wǎng)絡(luò)預(yù)測(cè)、scRNA-seq數(shù)據(jù)低維嵌入、scRNA-seq數(shù)據(jù)模擬生成等任務(wù)中優(yōu)于現(xiàn)有方法。
基因調(diào)控網(wǎng)絡(luò)(Gene Regulatory Network, GRN)是研究細(xì)胞分化、細(xì)胞重編程中的關(guān)鍵問(wèn)題。近年來(lái),已有工作將統(tǒng)計(jì)學(xué)方法、自回歸機(jī)器學(xué)習(xí)算法應(yīng)用于這一領(lǐng)域,但這些算法在預(yù)測(cè)準(zhǔn)確性上仍然存在提升空間。隨著深度學(xué)習(xí)在因果推斷中的應(yīng)用,研究人員提出了DeepSEM模型,通過(guò)設(shè)計(jì)GRN layer 和 Inverse GRN layer,首次將深度學(xué)習(xí)應(yīng)用于基因調(diào)控網(wǎng)絡(luò)的預(yù)測(cè),提高了基因調(diào)控網(wǎng)絡(luò)預(yù)測(cè)的準(zhǔn)確度。
與此同時(shí),基因調(diào)控網(wǎng)絡(luò)作為每一類(lèi)細(xì)胞特有的性質(zhì),卻被絕大部分scRNA-seq低維嵌入模型所忽視。在本項(xiàng)研究中,研究人員利用GRN layer 和Inverse GRN layer,將被預(yù)測(cè)的基因調(diào)控網(wǎng)絡(luò)顯式引入scRNA-seq 低維嵌入中。在聚類(lèi)和可視化任務(wù)中,DeepSEM在基準(zhǔn)數(shù)據(jù)集上優(yōu)于現(xiàn)有方法的效果。與此同時(shí),研究人員還進(jìn)一步將DeepSEM模型應(yīng)用于scRNA-seq數(shù)據(jù)模擬生成,在提出的GRN一致性指標(biāo)上高于現(xiàn)有scRNA-seq 數(shù)據(jù)模擬生成方法。

DeepSEM模型框架圖
此項(xiàng)研究工作巧妙地將基因調(diào)控網(wǎng)絡(luò)預(yù)測(cè)和scRNA-seq數(shù)據(jù)建模進(jìn)行結(jié)合,實(shí)現(xiàn)了一個(gè)模型、多個(gè)用途,為將來(lái)scRNA-seq數(shù)據(jù)分析和計(jì)算方法研究提供了新的思路和切入點(diǎn)。
該成果論文“基于神經(jīng)網(wǎng)絡(luò)的基因調(diào)控網(wǎng)絡(luò)建?!保∕odeling Gene Regulatory Networks Using Neural Network Architectures)發(fā)表于《自然·計(jì)算科學(xué)》(Nature Computational Science)期刊。論文第一作者為清華大學(xué)交叉信息院2018級(jí)博士生束晗濤,共同通訊作者為北京大學(xué)人工智能研究院馬劍竹副教授、清華大學(xué)交叉信息研究院曾堅(jiān)陽(yáng)副教授。該研究得到了國(guó)家自然科學(xué)基金、南京圖靈人工智能研究院的支持。
論文鏈接:
https://www.nature.com/articles/s43588-021-00099-8
供稿:交叉信息研究院
編輯:李華山
審核:呂婷