在蛋白質(zhì)結(jié)構(gòu)預測上,人工智能革命仍在繼續(xù)。一年前,軟件程序首次成功地模擬了單個蛋白質(zhì)的3D形狀。今年夏天,研究人員利用人工智能程序編制了一個近乎完整的人類蛋白質(zhì)結(jié)構(gòu)目錄?,F(xiàn)在,美國研究人員更進一步使用人工智能技術確定了不同蛋白質(zhì)之間可能的相互作用,以及由這種相互作用產(chǎn)生的“復合體”是什么樣子的。相關研究結(jié)果發(fā)表于《科學》。
斯坦福大學系統(tǒng)生物學家Michael Snyder表示,這項新發(fā)現(xiàn)會促進細胞生物學領域產(chǎn)生一系列新觀點,并為發(fā)現(xiàn)下一代治療藥物指明新方向。
幾十年來,精確重現(xiàn)人類蛋白質(zhì)的形態(tài)和結(jié)構(gòu),一直是研究人員的目標。過去,要追求這個目標很困難,需要昂貴且緩慢的實驗,如X射線晶體學和核磁共振光譜學實驗。即使實驗取得進展,也只能得到單個蛋白質(zhì)的某些結(jié)構(gòu)。
計算機專家一直致力于加快實現(xiàn)該目標。他們借助人工智能和深度學習算法,使用蛋白質(zhì)結(jié)構(gòu)數(shù)據(jù)庫來訓練軟件程序根據(jù)蛋白質(zhì)的氨基酸序列預測蛋白質(zhì)的結(jié)構(gòu)。
該研究同時使用了華盛頓大學的RoseTTAFold和DeepMind的AlphaFold工具,篩選了830萬對酵母蛋白的配對多序列比對,識別出了1505種可能的相互作用,并為106個以前未識別的部分和806個尚未結(jié)構(gòu)表征的部分構(gòu)建了結(jié)構(gòu)模型。
為了找到可以形成復合物的蛋白質(zhì),研究團隊首先將所有6000種酵母蛋白質(zhì)的氨基酸序列,與2026種其他真菌、4325種其他真核生物的氨基酸序列進行比較。在比較過程中,研究人員追蹤了這些蛋白質(zhì)的進化過程,并識別出不同蛋白質(zhì)中同時發(fā)生變化的序列。研究人員推斷,這些蛋白質(zhì)可能會形成復合物,并會逐步改變以保持它們之間的相互作用。
隨后,團隊嘗試揭示每組候選對象的3D結(jié)構(gòu)。在共830萬個“候選”酵母蛋白質(zhì)對中,兩個人工智能程序合力識別出了1506種可能發(fā)生相互作用的蛋白質(zhì),并成功繪制出其中712個的3D結(jié)構(gòu)。
研究通訊作者之一、得克薩斯大學西南醫(yī)學中心生物醫(yī)學信息學專家Qian Cong表示,這些相互作用涵蓋了真核細胞的所有活動。該研究的亮點在于發(fā)現(xiàn)了蛋白質(zhì)復合物的結(jié)構(gòu),這種復合物在細胞活動中發(fā)揮著不可替代的重要作用,如讓細胞修復DNA損傷等。這一發(fā)現(xiàn)為未來新靶向藥物的研發(fā)提供了更多可能。
AlphaFold首席開發(fā)人員之一、DeepMind團隊成員John Jumper也對此給予了高度評價:“這是再現(xiàn)蛋白質(zhì)3D結(jié)構(gòu)的一個很有前途的研究實例。明確了蛋白質(zhì)之間如何相互作用,生物學家就可以進一步發(fā)現(xiàn)復合物細胞內(nèi)執(zhí)行多項任務的機制。”
上個月,Jumper團隊在bioRxiv上發(fā)布了一篇論文,介紹了AlphaFold人工智能的新版本,名為AlphaFold-Multimer。該工具繪制出了4433種蛋白質(zhì)復合物的結(jié)構(gòu),準確率達到69%。(辛雨)