Cell | MIT通過人工智能技術發現超級抗生素

先睹為快

靶點

病原菌,超級細菌

模型訓練庫

FDA數據庫(1760個分子)

天然產物(800個分子)

篩選庫

藥物庫:Drug Repurposing Hub(6111)

實體庫:ZINC15(~1億類抗生素分子)

計算方法

有向消息傳遞的深度神經網絡(Directed message passing neural network)

計算軟件

RDKit, Chemprop

計算流程

作者首先利用藥物庫和天然產物構建了一個訓練集(2335個分子),並根據對大腸桿菌的抑制活性將化合物分為兩類:hits或者non-hits。隨後使用有向消息傳遞的深度神經網絡訓練模型,模型AUC值達到0.896。利用這個模型對藥物庫(Drug Repurposing Hub,6111)篩選發現具有廣譜抗菌效應的新型抗生素halicin(糖尿病藥物)。隨後對ZINC15中約1億類抗生素分子進行篩選,選擇預測打分>0.8並且與已知抗生素相似度

<0.4的23個化合物,測試發現8個至少對一種細菌有效,其中2個具有廣譜抗菌效果。

Cell | MIT通過人工智能技術發現超級抗生素

有向消息傳遞深度神經網絡

作者使用有向消息傳遞深度神經網絡(directed-message passing neural network),直接從分子的圖結構中預測分子特性,其中原子表示為節點,鍵表示為邊界。作者重建了與每個化合物的SMILES字符串相對應的分子圖。接下來,作者初始化了一個特徵向量,基於單個原子和鍵的可計算特徵:原子特徵:原子序數,每個原子的鍵數,電荷,手性,氫鍵數,雜化,芳香性,原子量。鍵特徵:鍵類型(單/雙/三/芳香),共軛,環成員,立體化學。該模型應用了一系列消息傳遞步驟,在該步驟中,它將來自相鄰原子的信息彙總並結合,以建立對局部化學的理解。經過固定數量的消息傳遞步驟後,對分子中學習到的單個特徵進行求和,以生成整個分子的單個特徵。這種特徵化通過前饋神經網絡進行饋送,輸出預測值。作者使用分子是否抑制大腸桿菌生長作為分類標準,因此訓練該模型輸出0或者1來表示它對於輸入分子的預測。


總結

作者使用深度學習構建了一個預測抗生素的篩選模型,特徵向量使用有向消息傳遞深度神經網絡構建,而後使用前饋神經網絡進行訓練,鑑別出Halicin具有潛在的抗菌活性,且與已知的抗生素結構差距較大,後期又進行了生物活性測試,在動物模型上,halicin療效顯著。後期又對ZINC數據庫進行了預測,發現了8種與已知抗生素結構差別較大的分子。其中2中具有廣譜抗菌效果。

Cell | MIT通過人工智能技術發現超級抗生素

圖片來源:Cell


Cell | MIT通過人工智能技術發現超級抗生素

圖片來源:Cell

Cell | MIT通過人工智能技術發現超級抗生素

圖片來源:Cell


Cell | MIT通過人工智能技術發現超級抗生素

圖片來源:Cell


參考文獻

Stokes, J.M., et al., A Deep Learning Approach to Antibiotic Discovery. Cell, 2020. 180(4): p. 688-702 e13. DOI: 10.1016/j.cell.2020.01.021

中大唯信頭條號與中大唯信公眾號、唯信計算訂閱號均由中大唯信科技有限公司運營,歡迎關注轉發,未經授權禁止轉載


分享到:


相關文章: