在人體的“宇宙”中,居住著數(shù)百萬種微生物。它們相生相克、相互制衡,維持著人體健康的微生態(tài)平衡。
很多常見耐藥菌,如金黃色葡萄球菌、肺炎鏈球菌、大腸桿菌等都是人體共生的“原住民”。而人體中同樣存在著克制它們的微生物及其代謝產(chǎn)物。找到這些耐藥菌的“克星”作為藥物是當前生命科學領(lǐng)域的前沿問題。
如何在數(shù)以千萬億計的人體微生物“居民”中“撈出”這些耐藥菌的天然“殺手”呢?面對這一難題,中國科學院微生物研究所研究員陳義華和王軍團隊合作,利用機器學習的方法,從一萬多個腸道微生物中“海淘”出三個具有顯著活性和安全性的抗菌肽“潛力股”。相關(guān)研究3月4日發(fā)表于《自然—生物技術(shù)》。
“整個研究令人振奮!從人體腸道微生物組挖掘抗菌肽的方法十分新穎。”該刊一位審稿人評論說。
AI開路 “海撈”奏效
長期以來,微生物產(chǎn)生的活性代謝產(chǎn)物是開發(fā)抗菌藥物的重要資源。青霉素、頭孢菌素、紅霉素、萬古霉素、達托霉素……臨床使用的抗菌藥物中,超過一半來源于微生物。
科學家認為,人體腸道中龐大的微生物“居民”中也蘊含著與耐藥病原菌共生的克星,它們的代謝產(chǎn)物能夠抑制耐藥菌的活性。
抗菌肽(AMPs)就是這樣一類具有抗微生物活性的小肽(序列在幾個到幾十個氨基酸殘基之間)。以往研究發(fā)現(xiàn),它們經(jīng)過簡單的后修飾或不經(jīng)任何修飾就能直接發(fā)揮作用,達到抑制病原微生物的效果。它們能抵御多重耐藥菌,同時不易產(chǎn)生耐藥性的抗菌肽,被認為是可能替代傳統(tǒng)抗生素的下一代抗菌劑。
近些年來,測序技術(shù)發(fā)展誕生的海量微生物組數(shù)據(jù)為人們尋找這樣的活性肽提供了豐富的數(shù)據(jù)資源。但挖掘方法的局限阻礙了相關(guān)研究的步伐。
一次午餐時,研究細菌的陳義華和做生物信息學的王軍談到此事,便一拍即合,躍躍欲試。
“人體腸道微生物互作網(wǎng)絡(luò)錯綜復(fù)雜,存在許多序列短、多樣性高、相似性低的功能多肽,怎么區(qū)分它們是個難題。”文章共同通訊作者王軍向《中國科學報》解釋,人工智能深度學習方法為此提供了機遇。
研究團隊采用自然語言學習(NLP)的多種神經(jīng)網(wǎng)絡(luò)方法,把氨基酸序列當做“語言”,訓(xùn)練人工智能學習現(xiàn)有抗菌肽的組織方式,從而讓其根據(jù)“經(jīng)驗”識別氨基酸短序列,區(qū)分相似的多肽。通過選取三種NLP神經(jīng)網(wǎng)絡(luò)模型來預(yù)測鑒定,他們實現(xiàn)了抗菌肽挖掘模型的構(gòu)建和優(yōu)化。在測試集中,該模型的精確度達到了91.31%。
有了模型,接下來的就是放開手腳挖掘數(shù)據(jù)——研究團隊對1萬多個微生物組進行了“海淘”,挖掘并合成了216種潛在的新型抗菌肽。經(jīng)實驗驗證,其中181種新型抗菌肽具有抗菌活性(占83.8%)。進一步實驗表明,抗菌肽對多重耐藥革蘭氏陰性菌具有較強的抑菌能力。
這些抗菌肽是否新穎呢?對此,王軍表示:“它們絕大多數(shù)與已知的抗菌肽序列同源性低于40%。而且最終選取的抗菌肽作用機制不單一,體現(xiàn)出我們的方法沒有特定的偏好性。”
層層篩選 “萬里挑三”
新抗菌肽拿到了,接踵而至的是三個關(guān)鍵問題:它們的抗菌活性究竟如何?作用機理是什么?是否安全可靠?
首先,陳義華團隊對181種抗菌肽的活性逐一測試,并在此基礎(chǔ)上選取了其中最有效的11種進行了新一輪測試。其測試對象包括糞腸球菌、金黃色葡萄球菌、肺炎克雷伯菌、鮑曼不動桿菌、綠膿桿菌、陰溝腸桿菌和大腸桿菌等病原細菌。
“我們發(fā)現(xiàn)這些抗菌肽只需要少許劑量就能實現(xiàn)多重耐藥菌的顯著抑制能力。”論文共同作者陳義華向記者介紹,11種抗菌肽對單個菌的最低抑菌濃度(MIC)大部分值低于每升50微摩爾(即百萬分之五十摩爾)。在針對臨床分離得到的鮑曼不動桿菌、肺炎克雷伯菌和大腸桿菌等多重耐藥菌活性測試中,有10種抗菌肽顯示出強抑制能力。
為了解其作用機理,研究者通過對11種抗菌肽進行測試,確定了其中部分肽的作用位點分別為細胞膜和細胞壁。“如果用電子顯微鏡觀察,可以看到和抗菌肽共培養(yǎng)的大腸桿菌細胞膜明顯破裂。這樣細胞內(nèi)容物外流,耐藥微生物就被殺死了。”陳義華向記者解釋。
據(jù)介紹,經(jīng)過長達30天的連續(xù)傳代培養(yǎng),研究者并未觀察到大腸桿菌產(chǎn)生任何抗性。另外,他們還發(fā)現(xiàn)這11種優(yōu)質(zhì)抗菌肽中有超過一半的小肽由alpha-螺旋結(jié)構(gòu)主導(dǎo),這種小肽或具有更強的抑菌活性。
通過溶血實驗(紅細胞破裂溶解)和細胞毒性實驗,他們進一步從11種抗菌肽中篩選出了3種溶血性和細胞毒性相對較低的小肽。小鼠模型實驗表明,這3種小肽治療后小鼠比未進行任何治療的小鼠體重恢復(fù)速率明顯較快;同時,治療組的肺部組織病原菌遺留量比非治療組下降了一到兩個數(shù)量級。驗證了這三類多肽的有效性和安全性。
“這項工作非常有意義。它利用機器學習的方式挖掘新穎的抗菌肽,然后通過細致的微生物學測試研究它們的功能,對相關(guān)領(lǐng)域有啟發(fā)作用。”另一位審稿人評論說。
或迎來多肽類藥物爆發(fā)期
當前,傳統(tǒng)新藥開發(fā)困難重重,從候選小分子出發(fā),要經(jīng)過很多輪的篩選,每一步都有很多的失敗率。經(jīng)常,一個藥物投入幾十億美元,最后折戟而歸。
很多人常用“十年十億美金”來形容一款新藥的開發(fā)成本。但事實上有時還會低估其真實的研發(fā)成本。美國塔夫茨大學藥物發(fā)展研究中心2016年研究發(fā)現(xiàn),最終獲美國食品與藥物管理局批準的每種創(chuàng)新藥物總平均成本或高達25.58億美元。
“如果一開始候選分子的范圍比較窄,失敗的風險和投入的成本會更高。”王軍說,“我們的方法說明,通過深度學習可以更快、更高效地確定更多的候選分子,在此基礎(chǔ)上一步步篩選,極大縮減了時間和實驗的成本。”
他表示,理論上多肽藥物可選擇的序列是“天文級”的,遠超ZINC15數(shù)據(jù)庫(目前最大的有機小分子化合物庫之一)現(xiàn)在收集的1億余種化學類分子總量。然而,因為開發(fā)、利用的效率低,過去40年里獲批的多肽藥物數(shù)量十分有限。
隨著機器學習的深入發(fā)展,或?qū)⒂瓉矶嚯念愃幬锏谋l(fā)期。生物學家可以通過海量的基因組數(shù)據(jù),大量發(fā)現(xiàn),乃至主動設(shè)計、從頭生產(chǎn)自然界不存在的活性肽。“這是未來的發(fā)展方向。”王軍說。
陳義華也表示,在此次研究中,微生物在復(fù)雜的人體環(huán)境中產(chǎn)生抗菌肽的巨大潛能,提供了通過微生態(tài)關(guān)系從微生物組數(shù)據(jù)中直接挖掘活性代謝產(chǎn)物的證據(jù)和良好范例。
作者表示,目前的研究僅通過動物實驗證明部分多肽的有效性和安全性,提供了一個成藥的候選分子或前體分子。接下來需要進行臨床前的成藥性等評價,挖掘相關(guān)分子在農(nóng)業(yè)和畜牧業(yè)方面的潛在應(yīng)用價值。(馮麗妃)