清華新聞網(wǎng)11月11日電 在科學(xué)研究中,常常存在大問(wèn)題和小問(wèn)題之分。大問(wèn)題能夠更新我們對(duì)世界的認(rèn)知,具有深遠(yuǎn)影響,也易于獲得較多的關(guān)注和研究投入;而小問(wèn)題往往因?yàn)槿狈Z動(dòng)效應(yīng),解決難度卻不見(jiàn)得小,常常處于懸而未決的狀態(tài)。但從科學(xué)假說(shuō)到應(yīng)用落地,其間需要跨越一條漫長(zhǎng)且深邃的轉(zhuǎn)化研究溝壑,其中大小問(wèn)題相互交織、彼此轉(zhuǎn)化。小問(wèn)題的研究有可能為解決大問(wèn)題提供關(guān)鍵線(xiàn)索,反之,大問(wèn)題的解決也可能帶來(lái)對(duì)小問(wèn)題的全新理解。因此,每一個(gè)小問(wèn)題的解決都是科學(xué)進(jìn)步和技術(shù)落地不可或缺的一部分。
在計(jì)算化學(xué)領(lǐng)域,“小分子構(gòu)象采樣”便是這樣一個(gè)看似不起眼的小問(wèn)題,甚至被部分從業(yè)人員認(rèn)為是“已解決的科學(xué)問(wèn)題”。在過(guò)去的十?dāng)?shù)年間,基于結(jié)構(gòu)的虛擬篩選已被廣泛應(yīng)用于藥物篩選的早期階段。通過(guò)分子對(duì)接這種方式,可以快速高效地評(píng)估配體-受體的相互作用,處理規(guī)模高達(dá)109的化學(xué)分子庫(kù),對(duì)于發(fā)現(xiàn)潛在的結(jié)構(gòu)多樣的先導(dǎo)化合物具有重要意義。其中,小分子構(gòu)象采樣為評(píng)估化學(xué)小分子與受體的相互作用賦予了必要的柔性,對(duì)虛擬篩選的成功率有著顯著影響。目前,已有多種構(gòu)象采樣方法在“晶體結(jié)構(gòu)構(gòu)象再現(xiàn)”任務(wù)中表現(xiàn)優(yōu)異,并獲得了廣泛認(rèn)可。但這些方法的多樣性和準(zhǔn)確性在實(shí)際應(yīng)用中,尤其是“虛擬篩選分子對(duì)接”任務(wù)中,缺乏系統(tǒng)的測(cè)試和比較,這一情況限制了研究人員對(duì)這些方法的選擇和使用,成為一個(gè)亟待解決的“小問(wèn)題”。
10月30日,清華大學(xué)生物醫(yī)學(xué)交叉研究院黃牛實(shí)驗(yàn)室在《計(jì)算化學(xué)雜志》(Journal of Computational Chemistry)上發(fā)表了題為 “評(píng)估分子對(duì)接中的小分子構(gòu)象采樣方法”(Assessing Small Molecule Conformational Sampling Methods in Molecular Docking) 的研究論文。黃牛團(tuán)隊(duì)借助分子對(duì)接軟件UCSF DOCK3.7,對(duì)七種基于不同算法的小分子構(gòu)象采樣方法進(jìn)行了公平比較,深入分析了構(gòu)象采樣方法在分子對(duì)接任務(wù)中的表現(xiàn),闡明了小分子構(gòu)象采樣對(duì)于對(duì)接結(jié)果的影響。研究發(fā)現(xiàn),采樣方法的采樣能力與其在對(duì)接任務(wù)中的對(duì)接性能之間存在顯著差距,并且不同采樣方法在不同場(chǎng)景中的對(duì)接效果和篩選能力也各有差異?;跍y(cè)試結(jié)果,研究人員為分子對(duì)接過(guò)程中小分子構(gòu)象采樣方法的選擇提供了建議,為進(jìn)一步提升構(gòu)象采樣的性能提出了新的技術(shù)方案。
為了在DOCK3.7中對(duì)不同構(gòu)象采樣方法進(jìn)行公平比較,研究人員設(shè)計(jì)了db2_converter工作流程。通過(guò)統(tǒng)一采樣數(shù)量等參數(shù)設(shè)定,并引入PoseBusters測(cè)試套件以過(guò)濾不合理構(gòu)象,該流程能夠生成數(shù)量相當(dāng)且適用于對(duì)接的合理構(gòu)象集。隨后,研究人員在類(lèi)藥小分子-蛋白復(fù)合物晶體結(jié)構(gòu)數(shù)據(jù)集Platinum Diverse Dataset上,將采樣構(gòu)象集、對(duì)接結(jié)果和晶體結(jié)構(gòu)進(jìn)行對(duì)比,評(píng)估了采樣方法的采樣能力及其與DOCK3.7結(jié)合后的對(duì)接性能。結(jié)果表明,各采樣方法的對(duì)接性能相比采樣能力均顯著下降。例如,表現(xiàn)最佳的CCDC Conformer Generator的采樣能力為0.98,而其對(duì)接能力則為0.59。進(jìn)一步系統(tǒng)分析對(duì)接結(jié)果后,研究人員發(fā)現(xiàn)不同采樣方法之間的性能差異主要來(lái)源于對(duì)采樣自由度,尤其是二面角的覆蓋程度不同。而采樣能力和對(duì)接能力的差異則與采樣能力評(píng)估標(biāo)準(zhǔn)的局限性有關(guān)——該標(biāo)準(zhǔn)將采樣構(gòu)象與晶體構(gòu)象間的RMSD小于2?作為符合標(biāo)準(zhǔn)的判據(jù),但這種評(píng)估未能充分涵蓋形成關(guān)鍵相互作用的子結(jié)構(gòu)翻轉(zhuǎn)情況。一些滿(mǎn)足該標(biāo)準(zhǔn)的構(gòu)象在關(guān)鍵子結(jié)構(gòu)上發(fā)生了翻轉(zhuǎn),因此在分子對(duì)接中缺乏必要的相互作用,導(dǎo)致評(píng)分較低,難以被篩選出。此外,對(duì)接能力相較于采樣能力的大幅下降,還可以部分歸因于分子對(duì)接過(guò)程中的剛性受體處理。一些可能有效的對(duì)接構(gòu)象由于分子間的碰撞被過(guò)濾,從而減少了對(duì)接的成功率。
圖1.不同構(gòu)象采樣方法的采樣能力和對(duì)應(yīng)的對(duì)接能力
研究人員還在DUDE-Z數(shù)據(jù)集上測(cè)試了各采樣方法在分子對(duì)接中的回顧性篩選能力。DUDE-Z數(shù)據(jù)集包含43個(gè)已知蛋白靶標(biāo),每個(gè)靶標(biāo)下有數(shù)十個(gè)已知活性小分子,每個(gè)活性小分子對(duì)應(yīng)50個(gè)物理性質(zhì)相似但結(jié)構(gòu)不同的誘餌分子。篩選能力反映了對(duì)接軟件從化合物庫(kù)中富集活性小分子的能力。整體來(lái)看,ConfGenX展現(xiàn)了較優(yōu)的回顧性篩選能力,其LogAUC和EF1的中位數(shù)分別為19.07和8.71。由于不同靶點(diǎn)的活性分子化學(xué)結(jié)構(gòu)各異,且結(jié)合口袋的性質(zhì)不同,采樣方法在各靶點(diǎn)上的篩選能力表現(xiàn)出較大差異。具有不同采樣偏好的方法在不同靶點(diǎn)上各自展現(xiàn)出最佳的篩選能力。
圖2.不同構(gòu)象采樣方法對(duì)應(yīng)的虛擬篩選能力
基于這一結(jié)論,研究人員推測(cè)不同采樣方法的結(jié)果可能具有互補(bǔ)性。為驗(yàn)證這一點(diǎn),研究人員嘗試將采樣方法進(jìn)行兩兩組合,以考察組合采樣方法對(duì)上述分子對(duì)接任務(wù)的影響。結(jié)果表明,在對(duì)接能力和篩選能力上,組合采樣方法能夠進(jìn)一步提升分子對(duì)接的整體表現(xiàn)。
圖3.構(gòu)象采樣方法的組合能夠進(jìn)一步提升對(duì)接能力和篩選能力
綜上所述,研究人員將六種傳統(tǒng)采樣方法(Omega、BCL::Conf、CCDC Conformer Generator、ConfGenX、Conformator、RDKit ETKDGv3)和一種基于深度學(xué)習(xí)的構(gòu)象生成模型(Torsional Diffusion)與分子對(duì)接軟件UCSF DOCK3.7結(jié)合,系統(tǒng)評(píng)估了多種采樣方法在分子對(duì)接任務(wù)中的對(duì)接能力和篩選能力。結(jié)果顯示,盡管采樣方法在整體采樣上表現(xiàn)優(yōu)異,但在分子對(duì)接任務(wù)中的表現(xiàn)差異明顯,這主要?dú)w因于不同方法在可旋轉(zhuǎn)鍵的二面角采樣范圍上的獨(dú)特偏好,對(duì)進(jìn)一步發(fā)展構(gòu)象采樣方法提供了清晰的方案。研究指出,在分子對(duì)接中,除了關(guān)注打分函數(shù)的精度,還需重視小分子構(gòu)象采樣的數(shù)量和質(zhì)量。結(jié)合多種采樣方法的優(yōu)勢(shì)有望進(jìn)一步提升對(duì)接表現(xiàn)。
黃牛實(shí)驗(yàn)室的2020級(jí)博士生夏前程為論文第一作者,黃牛研究員為通訊作者。其他作者包括黃牛實(shí)驗(yàn)室的付秋禹、沈成,以及挪威卑爾根大學(xué)的魯斯·布倫克(Ruth Brenk)博士。研究得到美國(guó)加利福尼亞大學(xué)舊金山分校的彭士明博士和約翰·歐文(John Irwin)博士的幫助。研究由北京市科委和清華大學(xué)共同資助。
論文鏈接:
https://onlinelibrary.wiley.com/doi/10.1002/jcc.27516
供稿:生物醫(yī)學(xué)交叉研究院
編輯:李華山
審核:郭玲