本文來自微信公眾號:X-MOLNews
讀者朋友們是不是覺得這個標題風格好熟悉,像極了當年某新聞網站?這次真不是本君故意要搞雙歎號標題黨,這篇來自美國哈佛大學Christoph Gorgulla等人的Nature 文章,就是這麼個標題“An open-source drug discovery platform enables ultra-large virtual screens”。
虛擬篩選可以說得上是眾多藥物發現技術中備受追捧的明星了。隨著蛋白結構井噴式的被解析,虛擬篩選無疑成為眾多藥物化學工作者手中的利器。在另一方面,合成方法學高速發展,越來越多的有機分子被創造出來,可用於進行虛擬篩選的各種分子庫呈幾何級數增長。不過,日益增長的數據庫同計算方法的發展速度形成了尖銳的矛盾。正如Christoph Gorgulla等人的文章提到,現在一個單核處理器每對接一個配體花費的時間大約15秒,虛篩10億個分子將耗時475年。現在可用於藥物發現的有機分子已經超過1060個,現有的虛擬篩選方法急需迭代升級。Christoph Gorgulla等人開發的VirtualFlow平臺解決的就是這個問題。
基於VirtualFlow平臺的藥物發現流程示意圖。圖片來源:Nature
簡單地講,VirtualFlow平臺分為兩部分,一部分用於配體準備(VirtualFlow for Ligand Preparation,VFLP),另一部分用於虛擬篩選(VirtualFlow for Virtual Screening,VFVS),VFVS模塊兼容市面上大部分免費的分子對接程序,並可進行同時計算交叉驗證。VirtualFlow強大的地方在於,它能整合上萬個CPU來進行分子對接,還可應用雲計算平臺。實測結果顯示,VirtualFlow使用16000個CPU對接十億個小分子耗時約15小時。這種超大規模計算的組織架構如下圖所示。
VirtualFlow的計算工作流示意圖。圖片來源:Nature
對虛擬篩選來說,算得快固然重要,算得準才更具應用價值。VirtualFlow平臺算得是否靠譜,那必須得經過實戰檢驗一番。為此,作者選擇了腫瘤研究領域熱門的KEAP1蛋白作為虛擬篩選靶點,對含有13億配體的數據庫進行了虛擬篩選。在第一階段,對13億分子進行剛性對接,選擇打分處於前3百萬的分子進入第二階段。在第二階段,允許小分子對KEAP1和NFR2相互作用的13個氨基酸殘基進行柔性對接,篩選出大約1萬個打分優秀的分子。
基於VirtualFlow以KEAP1為靶點的虛擬篩選流程。圖片來源:Nature
作者隨後從成藥性、配體效率、化學多樣性以及獲取難度等方面在這約10000個候選分子中挑選了590個苗頭化合物進行活性驗證。在活性驗證方面,作者選擇了4種目前認可度較高的生物物理學方法,表面等離子體共振(surface plasmon resonance,SPR)、核磁共振波譜(nuclear magnetic resonance,NMR)、熒光極化(fluorescence polarization,FP)以及生物層干涉(bio-layer interferometry,BLI)。幾種方法的綜合應用和化合物的排除標準都在下面這張圖中得以體現。
應用4種生物物理手段驗證590個苗頭化合物與KEAP1的相互作用。圖片來源:Nature
最後作者給出了兩個活性達到納摩爾級別的代表性化合物iKEAP 1和iKEAP 2的多種實驗結果。
代表性化合物iKEAP 1和iKEAP 2的多種實驗結果。圖片來源:Nature
本君感覺這篇文章屬於初看不足為奇、細思價值連城那種。你說套路吧,分子對接-活性驗證的閉環沒什麼特別之處,高通量虛擬篩選也是很多人在做的工作。可是你細品,人家搞的這個虛擬篩選平臺算力驚人,幾乎是完全碾壓前人,按照他們的算力,“給個靶點算遍天下有機物”指日可待。所以,本君竊以為這篇Nature 文章硬核的地方既不是精妙的科研思路,也不是優秀的實驗結果,而是那能調動上萬CPU進行計算的代碼。雖然這代碼開源 [1],但是隔行如隔山,本君同大家一樣只能望碼興嘆,無法領略代碼之間的美感啦。
最後想說的是,更高的命中率,更快的計算速度,更強的迭代能力,虛擬篩選在藥物發現的長跑途中從未掉隊。
An open-source drug discovery platform enables ultra-large virtual screens
Christoph Gorgulla, Andras Boeszoermenyi, Zi-Fu Wang, Patrick D. Fischer, Paul Coote, Krishna M. Padmanabha Das, Yehor S. Malets, Dmytro S. Radchenko, Yurii S. Moroz, David A. Scott, Konstantin Fackeldey, Moritz Hoffmann, Iryna Iavniuk, Gerhard Wagner, Haribabu Arthanari
Nature, 2020, DOI: 10.1038/s41586-020-2117-z
參考資料
1. VirtualFlow platform
https://virtual-flow.org/
(本文由樂只君子供稿)