深蘭科技IAI首次發現超級抗生素

深蘭科技IAI首次發現超級抗生素

熱點回顧

由麻省理工學院合成生物專家吉姆·柯林斯(Jim Collins)領導的研究團隊發現了一種開創性的機器學習方法,該方法首次在沒有使用人類任何先前假設的情況下,短短几天從超過 1 億個分子的庫中篩選出強大的新型抗生素。目前,該成果已經登上全球自然科學研究領域最著名期刊之一《細胞(Cell)》2 月 20 日的封面。熱點解讀傳統研發週期長回報低從上世紀20年代,英國發現了世界上最早的抗生素——青黴素開始,科學家不斷研發開拓,至今已發現或合成了上百種抗生素藥物。然而,隨著時間的推移,人類面臨前所未有的抗生素耐藥性和耐多藥細菌的問題,這就需要藥物研發人員不斷開發新的抗生素。有研究預測,如果不立即採取措施,到2050年,因耐藥感染而死亡的人數將達到每年1000萬人。世衛組織強調,後抗生素時代可能已經到來,常見的感染和微小的創傷也能致命。幾個世界大國都已將抗藥性細菌的激增看作當今時代一大全球風險。

深蘭科技IAI首次發現超級抗生素

世界銀行圖片| 抗生素和其他藥物一方面形勢嚴峻,一方面大公司紛紛終止抗生素研發。2014-2018五年分析表明:抗生素研發一直在“啃老本”。似乎抗生素的規模研發都停留在30年前,主要是通過篩選原著微生物的次生代謝物來阻止致病菌的生長(Clardy et al.,2006; Wright, 2017),現今幾乎所有可用的抗生素都是基於此研發的。然而當前的研發速度正在減慢,從自然化合物中篩選出的常常是重複相同的小分子。抗生素研發緩慢的原因之一是科學障礙,研發投入回報率低直接導致了抗生素市場的低迷。開發新型抗生素的成本越來越高,藥物獲取基因會研究部主任加布裡埃爾·布洛伊格曼說,全球正在進行的大約275個抗生素研發項目,可能最終只會成功產生兩三種藥物。米卡爾·多斯滕(Mikael Dolsten)博士是輝瑞的全球研發負責人,他坦承說:“現在想要找到新的抗感染藥族太難了,這個行業得不到足夠的激勵去花10到15年做研發。”國家政策對創新藥物的研發一直持鼓勵態度,有療效的抗生素不管在臨床上,還是藥店,都存在很大需求。但是現實局面是,企業願意潛心開發新型抗生素的動力不強。國內藥企對於抗生素的研發主要以仿製為主,基本沒有創新藥。新興抗生素的研發率先效率越來越低,10年研發時間毫不意外,但可能在兩年內就產生耐藥菌素,研發速度趕不上耐藥菌的繁殖速度。無疑,在全世界範圍內,抗生素領域的新研究和開發需要更大的技術保障。近年來,人們提出將結構分析和篩選相結合的思路,利用機器學習算法從分子性質中預測具有潛在抗菌性能的化合物。隨著深度學習的快速發展,這種方法的精確性得到巨大的提升。AI獨立發現超強抗生素2月下旬,MIT 研究人員通過訓練一個預測抗菌分子的深層神經網絡,發現halicin抗生素分子,其具有很好的廣譜抗菌能力,這是人類首次完全使用人工智能的方法發現新抗生素。研究人員表示,halicin 可以消滅一些世界上最危險的細菌。這一研究登上了生命科學頂級期刊《Cell》。

深蘭科技IAI首次發現超級抗生素

研究者訓練了一個深度神經網絡模型,收集2335個已知抗菌活性的分子,包括大約 1760種已獲批的抗生素和800 種從植物、動物和微生物中得到的化合物。將訓練集小分子進行二分類,建立預測模型判斷一個新的化合物是否可以抑制大腸桿菌生長。


深蘭科技IAI首次發現超級抗生素

研究過程摘要(Stokes et al., 2020)在這項研究中,模型不需要知道關於藥物機理的假設,也不需要化學基團的標註就能執行預測。該模型能夠學習人類專家未知的新模式。訓練完成後進行模型的進一步優化,研究者用該模型在一個名為Drug Repurposing Hub的庫中進行分子篩選,該庫有6111個正處於研究階段的治療人類疾病的藥物分子。篩選後對每個分子進行預測得分,篩選出哪種分子能對抗大腸桿菌,去除掉和常規抗生素分子相似的分子。最後得到99個表現出強烈抗生素特性的候選特異分子,並打分,分數越高表示生長抑制作用越強。經過一系列標準的篩選,一種名為halicin的分子效果很好,該分子正處於針對糖尿病治療的研究階段。在小鼠實驗中,該分子對多種病原體具有抗菌活性,包括艱難梭菌、腸桿菌科和有廣泛耐藥性並迫切需要新抗生素的鮑曼不動桿菌。

深蘭科技IAI首次發現超級抗生素

Halicin在小鼠感染模型中表現出有效性(Stokes et al., 2020)A:Halicin對泛抗性鮑曼不動桿菌CDC 288的生長抑制作用;B:2小時後(藍色),4小時(青色),6小時(綠色),8小時(紅色),存在不同濃度halicin的磷酸緩衝鹽溶液中殺死的鮑曼不動桿菌CDC 288量;C:在傷口感染模型中,小鼠感染鮑曼不動桿菌CDC 288 1小時後,使用DMSO溶液 (綠色,一種含硫化合物)或halicin(藍色)超過24小時,用選擇性電鍍法測定處理後創面組織的細菌載量; D:Halicin對C.difficile 630的生長抑制作用; E:C.difficile感染的實驗設計與治療; F:C.difficile 630在感染小鼠糞便中的細菌載量。滅滴靈(紅色)沒有提高細菌的清除率,經過halicin處理的小鼠(藍色)治療後72 h開始滅菌,96 h 100%小鼠無感染。抗生素分子的建模過程相比傳統的模型方法需要手工設計特徵向量,標註分子的組成和結構特徵以及對大腸桿菌的抑制特性等的複雜繁瑣過程,神經網絡模型可以用一個自己學習的向量表徵分子,最終預測不同分子結構對大腸桿菌的抑制能力並給出評分。該項研究中,研究人員表示有向信息傳遞網絡能直接從分子的圖結構預測分子的屬性,其中節點代表原子,邊代表化學鍵。研究者重建了每個化學分子的 SMILES 字符串對應的分子圖,其中 SMILES 是一種用 ASCII 字符串明確描述分子結構的規範。在初始化特徵向量時,它又分為原子特徵向量與化學鍵特徵向量。用不同顏色的向量表示不同的化學鍵。現代發現抗生素的方法通常包括篩選大的化學分子庫,找到所需的表型。但是這些篩選數量一般是幾十萬到幾百萬個分子,價格昂貴、耗時長,而且無法捕捉分子的化學空間數據。相比之下,機器學習方法提供了快速、廉價地篩選分子方法。深度神經網絡模型通過構建一個基於特定屬性的分子表徵,比如生長抑制,首先使用2335個不同的可以抑制大腸桿菌生長的分子來訓練神經網絡模型,用一組分子特徵、超參數來優化和集成擴展模型。然後將該模型應用於包含1.07億個分子的多個化合物數據庫中,識別出具有抗大腸桿菌活性的潛在先導化合物。根據模型的預測分數對候選分子排序,選擇出潛在的抗性分子。

深蘭科技IAI首次發現超級抗生素

機器學習助力抗生素髮現(Stokes et al., 2020)模型需要整合鄰近原子和化學鍵信息並將信息一層層傳遞下去,從而理解局部分子的化學性質。這種傳遞是有向的,構成信息的傳遞網,求和鄰近化學鍵特徵向量,反饋到非線性單層神經網絡中,化學鍵特徵向量進一步得到更新。這樣的信息傳遞過程進行到一定次數後,一個分子可以被各種特徵向量表徵,並加和成一個單個向量,到達前饋神經網絡,可以預測該化學分子對大腸桿菌的抑制效果。如何用圖與向量表示分子之間的複雜關係是整個抗生素分子預測模型建立的關鍵。人工智能助力藥物分子發現這項工作標誌著抗生素的研發有可能出現範式轉換,未來會有越來越多的學者使用深度學習模型設計優化新的抗生素分子。抗生素分子的發現不是藥物挖掘領域第一次應用機器學習的方法,已經有研究團隊藉助人工智能技術,發現了幾種候選藥物,證明了AI應用於發現藥物分子的有限性。建立數據集以後,基於強化學習初步得到一系列可行的結構。根據反應基團和化學空間結構等信息,對分子結構進行優化篩選出潛在的成藥分子。然後進行體外體內實驗,找到在動物實驗中表現活性較高的分子。以新型冠狀病毒的新藥研發為例,部分 AI 藥物研發公司已經開始嘗試用多種深度學習模型發掘2019-nCoV關鍵蛋白靶點的分子結構,如Insilico Medicine利用二十多種模型合成和測試出對新冠病毒關鍵蛋白酶有抑制作用的100多個分子,相關成果也在陸續公佈。深蘭科技作為國內知名的快速成長的人工智能第一梯隊頭部企業,疫情發生後,深蘭科學院生命科學院組織精銳科研人員進行AI藥物篩選和AI疫苗設計方面的研究,並取得了初步研究結果。在這一困難時期,AI作為一種有前途的方法,在加速針對2019-nCoV的藥物發現過程中起到了重要推動作用。


參考文獻

Stokes JM, Yang K, Swanson K et al. (2020). A Deep Learning Approach to Antibiotic Discovery. Cell. 180, 688-702.e13DOI: (10.1016/j.cell.2020.01.021.

Clardy, J., Fischbach, M.A., and Walsh, C.T. (2006). New antibiotics from bac-terial natural products. Nat. Biotechnol. 24, 1541–1550.

Wright, G.D. (2017). Opportunities for natural products in 21 st century anti-biotic discovery. Nat. Prod. Rep. 34, 694–701.

唐鯤,深蘭科學院-生命科學院院長

新加坡國立大學生物化學博士、德國馬普所博士後;

原中國科學院上海生科學院計算生物學所課題組長、教授、正研究員,29歲成為該所最年輕的博士生導師之一;

2008年至今工作主要涉及人類基因組群體遺傳學和複雜性狀的遺傳學研究兩個方面。在人類基因組自然選擇信號方面、人臉複雜性狀的基因組預測方面,以及基於面部形態數據進行健康狀態信息提取等計算生物學領域,多次受到包括Nature News、Science和日本NHK電視臺等頂級科技媒體的報道;

以主要作者發表包括PLoS Biology、Human Molecular Genetics、Cell等SCI文章50多篇。


分享到:


相關文章: