清華新聞網(wǎng)6月17日電 在多細(xì)胞生物體中,盡管所有細(xì)胞共享相同的基因組,但由于內(nèi)部基因調(diào)控網(wǎng)絡(luò)的差異以及與周?chē)h(huán)境中相鄰細(xì)胞的外部信號(hào)交流,它們?cè)谛螒B(tài)、基因表達(dá)和功能上展現(xiàn)出顯著的多樣性。相鄰的不同種類(lèi)細(xì)胞之間再通過(guò)復(fù)雜的相互作用,形成一定功能的組織模塊。近年來(lái),隨著空間轉(zhuǎn)錄組技術(shù)的不斷發(fā)展,研究者能夠在單細(xì)胞分辨率下獲得細(xì)胞的基因表達(dá)譜,同時(shí)保留細(xì)胞在組織內(nèi)的空間位置信息。因此,如何有效地利用這些空間位置信息來(lái)揭示復(fù)雜組織中細(xì)胞的空間排列模式和相關(guān)的生物學(xué)功能,即識(shí)別空間細(xì)胞亞型和發(fā)現(xiàn)組織模塊,是空間轉(zhuǎn)錄組數(shù)據(jù)分析的核心任務(wù)。
目前空間轉(zhuǎn)錄組數(shù)據(jù)分析面臨以下兩方面難題:第一,對(duì)于空間細(xì)胞類(lèi)型的識(shí)別,許多研究?jī)H使用細(xì)胞基因表達(dá)譜而忽視細(xì)胞的空間位置信息。然而,近年來(lái)的研究表明,原本被認(rèn)為是同質(zhì)性的細(xì)胞類(lèi)型,根據(jù)其在組織中的位置,可以進(jìn)一步細(xì)分為多個(gè)亞型。第二,對(duì)于組織模塊的發(fā)現(xiàn),當(dāng)前的方法主要基于組織內(nèi)區(qū)域的基因空間表達(dá)模式的一致性來(lái)發(fā)現(xiàn)組織模塊。然而,構(gòu)成組織的不同細(xì)胞的基因表達(dá)特征可能高度異質(zhì)化,這些方法未能充分利用最新的單細(xì)胞分辨率的空間轉(zhuǎn)錄組數(shù)據(jù)中細(xì)胞類(lèi)型的信息。
5月31日,清華大學(xué)生命科學(xué)學(xué)院/結(jié)構(gòu)生物學(xué)高精尖創(chuàng)新中心/清華-北大生命科學(xué)聯(lián)合中心張強(qiáng)鋒副教授課題組在《細(xì)胞·系統(tǒng)》(Cell Systems)雜志在線(xiàn)發(fā)表題為“基于感知細(xì)胞-細(xì)胞相互作用的細(xì)胞嵌入在單細(xì)胞分辨率空間轉(zhuǎn)錄組數(shù)據(jù)中發(fā)現(xiàn)組織模塊”(Tissue module discovery in single-cell resolution spatial transcriptomics data via cell-cell interaction-aware cell embedding)的研究論文。在該研究中,他們開(kāi)發(fā)了基于圖自編碼器(Graph autoencoder)深度學(xué)習(xí)框架的人工智能算法SPACE,可以在空間轉(zhuǎn)錄組數(shù)據(jù)中識(shí)別空間細(xì)胞亞型和發(fā)現(xiàn)組織模塊。

SPACE模型框架
SPACE使用圖自編碼器框架來(lái)學(xué)習(xí)低維的細(xì)胞嵌入,該細(xì)胞嵌入描述了空間轉(zhuǎn)錄組數(shù)據(jù)中每個(gè)細(xì)胞自身的基因表達(dá)信息以及其與空間鄰近細(xì)胞的相互作用信息(因此稱(chēng)該細(xì)胞嵌入為細(xì)胞-細(xì)胞相互作用感知的細(xì)胞嵌入,cell-cell interaction-aware cell embedding)。在該細(xì)胞嵌入基礎(chǔ)上,SPACE再通過(guò)聚類(lèi)算法識(shí)別空間細(xì)胞亞型和發(fā)現(xiàn)組織模塊。SPACE主要在以下兩個(gè)方面區(qū)別于現(xiàn)有方法。首先,SPACE通過(guò)兩個(gè)獨(dú)立的解碼器重構(gòu)細(xì)胞自身的基因表達(dá)譜和空間鄰近圖。其次,SPACE定義了一個(gè)感知場(chǎng)比率α,該系數(shù)決定了基因表達(dá)譜重建損失與空間鄰近圖重構(gòu)損失的相對(duì)權(quán)重。這種可調(diào)整的系數(shù)使SPACE能夠?qū)⒛P偷膬?yōu)化重點(diǎn)(根據(jù)具體研究需要)轉(zhuǎn)向強(qiáng)調(diào)所分析細(xì)胞自身的基因表達(dá)特征或空間鄰近細(xì)胞的組織信息,從而識(shí)別空間細(xì)胞亞型或發(fā)現(xiàn)細(xì)胞群落,即一種具有可辨識(shí)邊界且組成細(xì)胞類(lèi)型空間分布的組織模塊。通過(guò)使用多個(gè)空間轉(zhuǎn)錄組數(shù)據(jù)集對(duì)SPACE進(jìn)行測(cè)試,可以表明SPACE發(fā)現(xiàn)的細(xì)胞群落與人工標(biāo)注的組織結(jié)構(gòu)在空間分布特征上相似。特別地,細(xì)胞群落是由其所組成的細(xì)胞間相似的近端相互作用網(wǎng)絡(luò)而不是一致的基因空間表達(dá)模式來(lái)定義的。這種細(xì)胞間的近端相互作用網(wǎng)絡(luò)可以用于優(yōu)化基于配體-受體的細(xì)胞通訊推斷,從而改進(jìn)對(duì)生物過(guò)程中細(xì)胞間信號(hào)傳遞與調(diào)控的解讀。
綜上所述,研究人員開(kāi)發(fā)了一個(gè)可以從單細(xì)胞分辨率的空間轉(zhuǎn)錄組數(shù)據(jù)中識(shí)別空間細(xì)胞類(lèi)型和發(fā)現(xiàn)組織模塊的空間轉(zhuǎn)錄組數(shù)據(jù)人工智能分析工具SPACE。SPACE可用于大規(guī)模的空間轉(zhuǎn)錄組研究,以了解空間鄰近細(xì)胞之間的相互作用是如何影響細(xì)胞類(lèi)型和組織模塊生物學(xué)功能的。
張強(qiáng)鋒為論文通訊作者,清華大學(xué)生命科學(xué)學(xué)院2019級(jí)博士生李雨哲和博士后張勁松為論文共同第一作者。沙特阿卜杜拉國(guó)王科技大學(xué)計(jì)算生物學(xué)科研中心主任,前百圖生科(BioMap)研究院主任AI科學(xué)家高欣教授參與合作研究。
研究得到國(guó)家重點(diǎn)研究發(fā)展計(jì)劃專(zhuān)項(xiàng)、國(guó)家自然科學(xué)基金、北京市結(jié)構(gòu)生物學(xué)高精尖創(chuàng)新中心、清華-北大生命科學(xué)聯(lián)合中心、清華大學(xué)計(jì)算平臺(tái)、上海期智研究院和阿卜杜拉國(guó)王科技大學(xué)研究管理辦公室的支持。
論文鏈接:
https://www.cell.com/cell-systems/fulltext/S2405-4712(24)00124-8
供稿:生命學(xué)院
編輯:李華山
審核:郭玲