清華新聞網(wǎng)10月4日電 近日,清華大學(xué)交叉信息研究院曾堅(jiān)陽(yáng)課題組成功開(kāi)發(fā)了一個(gè)基于序列的多尺度預(yù)測(cè)多肽和蛋白質(zhì)相互作用的深度學(xué)習(xí)模型。該研究為多肽和蛋白質(zhì)相互作用的機(jī)制提供了一個(gè)高效的預(yù)測(cè)框架,可以在為多肽藥物預(yù)測(cè)結(jié)合靶點(diǎn)的同時(shí),識(shí)別多肽序列上的結(jié)合位點(diǎn)。
多肽和蛋白質(zhì)的相互作用在生物體內(nèi)起到關(guān)鍵的作用,參與多種細(xì)胞過(guò)程,比如信號(hào)傳導(dǎo)、基因表達(dá)調(diào)控、細(xì)胞增殖和凋亡。識(shí)別和解析多肽和蛋白質(zhì)的相互作用及其機(jī)制,有助于為多肽藥物精準(zhǔn)定位靶點(diǎn),并為多肽藥物的化學(xué)修飾提供信息,從而加速多肽藥物的研發(fā)進(jìn)程。
目前主流的計(jì)算框架分別基于序列的和基于結(jié)構(gòu)來(lái)識(shí)別蛋白質(zhì)和多肽配體的相互作用。然而,這些方法主要集中于識(shí)別蛋白質(zhì)表面與多肽結(jié)合結(jié)合的殘基,無(wú)法直接提取多肽序列中的結(jié)合殘基。此外,基于結(jié)構(gòu)的方法需要用到三維結(jié)構(gòu)信息,但通過(guò)傳統(tǒng)的實(shí)驗(yàn)方法測(cè)定得到的蛋白質(zhì)-多肽復(fù)合物的結(jié)構(gòu)非常昂貴且耗時(shí)。在本項(xiàng)研究中,作者提出了名為CAMP的深度學(xué)習(xí)框架,用于同時(shí)預(yù)測(cè)多肽-蛋白相互作用(PepPIs)和識(shí)別多肽序列上的結(jié)合殘基。

CAMP的模型框架圖
CAMP將蛋白質(zhì)和多肽的氨基酸序列、二級(jí)結(jié)構(gòu)、理化性質(zhì)、序列靈活性得分和蛋白質(zhì)的PSSM矩陣作為模型輸入,利用卷積神經(jīng)網(wǎng)絡(luò)(CNN)模塊和自注意力機(jī)制(self-attention)來(lái)預(yù)測(cè)給定的肽-蛋白對(duì)之間是否存在相互作用,同時(shí)識(shí)別多肽序列上的結(jié)合位點(diǎn)。
實(shí)驗(yàn)結(jié)果表明,在多種數(shù)據(jù)劃分的設(shè)定下,CAMP在基準(zhǔn)數(shù)據(jù)集上的表現(xiàn)均優(yōu)于現(xiàn)有的方法。此外,測(cè)試結(jié)果和案例分析表明,CAMP可以準(zhǔn)確地預(yù)測(cè)多肽序列上的結(jié)合殘基,從而為進(jìn)一步理解多肽與蛋白質(zhì)的結(jié)合機(jī)制提供有效的幫助。最后,作者進(jìn)一步研究了CAMP在三個(gè)相關(guān)任務(wù)中的應(yīng)用潛力,即多肽-蛋白結(jié)合域相互作用預(yù)測(cè)(peptide-PBDinteraction)、結(jié)合親和力評(píng)估和多肽的虛擬篩選。結(jié)果表明,CAMP在這三個(gè)相關(guān)任務(wù)上均獲得出色表現(xiàn)。
綜上所述,作者開(kāi)發(fā)了一個(gè)多層次的多肽-蛋白相互作用預(yù)測(cè)的深度學(xué)習(xí)框架(CAMP)以同時(shí)預(yù)測(cè)多肽和蛋白質(zhì)之間時(shí)候存在相互作用和識(shí)別多肽序列的結(jié)合殘基。該方法使用多通道特征提取器分別處理數(shù)值特征和分類(lèi)特征,以避免多源特征的不一致性。此外,作者通過(guò)和現(xiàn)有的最有方法比較,驗(yàn)證了CAMP擁有更優(yōu)的性能,同時(shí)展示了CAMP在peptide-PBD相互作用預(yù)測(cè)、多肽-蛋白質(zhì)的親和力評(píng)估和多肽的虛擬篩選方面的應(yīng)用潛力。這些結(jié)果表明,CAMP可以提供準(zhǔn)確的肽-蛋白相互作用預(yù)測(cè),并有助于研究者理解多肽與蛋白質(zhì)結(jié)合的潛在機(jī)制。
相關(guān)成果《一個(gè)多層次多肽-蛋白相互作用預(yù)測(cè)的深度學(xué)習(xí)框架》(A deep-learning framework for multi-level peptide–protein interaction prediction)于9月15日在《自然·通訊》(Nature Communications)上發(fā)表。論文通訊作者為清華大學(xué)交叉信息研究院曾堅(jiān)陽(yáng)副教授和趙誕助理研究員,第一作者為清華大學(xué)交叉信息研究院2022級(jí)擬入學(xué)博士生雷逸品,合作作者包括清華大學(xué)自動(dòng)化系李梢課題組等。此項(xiàng)研究工作獲得國(guó)家自然科學(xué)基金和南京圖靈人工智能研究院支持。
論文鏈接:
https://www.nature.com/articles/s41467-021-25772-4
供稿:交叉信息研究院
編輯:李華山
審核:呂婷