自由能方法及應用(二)在默克藥物研發實踐中的大規模前瞻性評估

自由能方法及應用(二)在默克藥物研發實踐中的大規模前瞻性評估

引言

在保證安全性和生物學功能的前提下,尋找高親和力的配體是小分子藥物開發的目標。因此,精確預測結合自由能一直是計算機輔助藥物設計中的一個重要方向,而使用建立在嚴密物理基礎上的蒙特卡羅或分子動力學模擬方法一直被認為是解決此問題最嚴謹的方法。然而,高昂的計算成本及採樣算法和力場侷限性仍阻礙著這類方法的廣泛應用。過去十年間,硬件及算法的不斷髮展,越來越多藥企將相對自由能計算工具(如薛定諤的FEP+)納入其藥物研發流程。

最近,來自德國默克集團的研究者們展示了他們從2016年起的一項對FEP+的大型前瞻性研究工作。在這項研究中,作者們旨在將FEP+應用到所有合適的內部在研藥物發現項目中,以達到三個目的:(1)對計算工具進行前瞻性盲評,(2)評估藥物研發中普遍存在的時間限制、資源限制和信息限制對使用該方法效用的影響,(3)對此前2015年以來FEP+加入的新功能進行基準測試。從2016年到2019年,作者前瞻性地將FEP+應用於12個靶點和23個化合物系列,進行了超過35,000個獨立擾動計算。最終,作者獲得了6,000多個化學實體的有效預測,合成和測試了400多個預測得到的新穎分子,產生了大量的前瞻性數據,提供了該方法在典型小分子藥物發現的實際流程中準確性的詳細評估。

項目中自由能計算工作流程

在過去三年中,作者建立了一個用於在項目中部署自由能計算的工作流程(圖1)。首先,作者通過收集可用的蛋白結構數據和實驗測得的結合親和力,對給定的靶點和感興趣的化合物系列使用FEP的一般可行性進行的評估。在這一階段,作者通常需要至少一個高分辨率的共晶結構,且其配體應屬於靶點化合物類似物。這一嚴格的要求源於作者在三個項目中的失敗經驗,作者嘗試在沒有X射線衍射結構的情況下使用同源模建模型,結果均未獲得令人滿意的結果。雖然作者使用同源模建模型未能成功,但當作者使用蛋白晶體結構和對接技術獲得複合物結構時,兩個項目中一成功一失敗。與實驗結果不一致的那個項目中,後來獲得共晶結構表明蛋白結合位點有相當大的柔性。在第一個項目中,作者無法與實驗數據取得良好的一致性。後來獲得的共晶體結構在結合位點顯示出相當大的蛋白質柔性,儘管預測的結合姿勢與晶體結構相對相似。而成功的項目中,後續的共晶結構與預測時的一致性很強。

自由能方法及應用(二)在默克藥物研發實踐中的大規模前瞻性評估

圖1 德國默克的自由能計算流程。

圖片來源:Journal of Chemical Information and Modeling

一旦獲得足夠的結構數據,作者將收集具有實驗結合親和力的同類配體的數據集(至少10個配體,最好20個),以及有關生化和生物物理測定的所有可用信息。注意,關於配體數據集大小的建議是一個“經驗法則”,通常在早期項目中其實很難獲得更大的數據集。如果配體數據集足夠大,則可以根據被修飾的分子的R-基團進行拆分,因為不同位點可能準確性不同。然後根據這些數據集進行回顧性自由能計算評估,將預測值與實驗值進行比較。作者將這些回顧性的計算實驗稱為驗證研究(System Validation)。在這一階段,通常會評估不同的輸入結構和體系設置,以便找到最佳參數用於以後的前瞻性計算。實際流程中,由於時間限制這一階段通常只能評估3種可能的模型。

針對出現的較大的異常值(| ΔGpred - ΔGexp | > 2 kcal / mol),需要進行詳細的分析以便了解的其產生原因。如果獲得的RMSE pw < 1.3 kcal / mol且存在較大的異常值能夠充分解釋的話,通常可以認為驗證研究成功了。儘管FEP所需的確切準確度取決於具體應用場景,如通常認為2 kcal / mol的準確度可用於對大型化合物庫打分,但作者發現驗證研究中使用更嚴格的閾值(RMSE pw

< 1.3 kcal / mol)可以更大概率的保證在前瞻性預測中獲得足夠準確度(RMSE < 2 kcal / mol)。

理想情況下,如果數據集的動態範圍合適則FEP預測也應產生良好的排名。但實際上,經常只有動態範圍有限的數據集可用。在這種情況下,作者以“試用”方式進入了前瞻性預測階段。作者預測了所有正在合成的分子,並在合成以後評估這些前瞻性預測的準確性。最後,作者再決定是否在生產模式(Production)下將FEP應用於該項目。

在成功完成驗證階段之後,FEP項目進入生產模式,對複合物構象進行前瞻性計算。這些新化合物必須與驗證階段的化合物足夠相似。對於新的骨架和新的晶體結構信息,必須進行新的驗證研究。作者在整個項目中密切監視前瞻性預測的準確性,並跟蹤已合成了哪些化合物。所有數據存在數據庫中,使用自動化的工作流程。根據作者的經驗,這種對合成分子的持續監控以及及時更新的前瞻性預測準確性對於在項目團隊中建立最初的信任以及隨後監測衍生化合物何時超出模型的適用範圍是必不可少的。


內部藥物研發項目中的

FEP可行性和驗證性研究

在三年的過程中,作者評估了28個靶點上FEP的可行性(圖2 A)。作者對18個靶點和44個化合物系列進行了驗證研究,並對14個靶點和25個化合物系列進行了前瞻性計算。大部分無法進行驗證研究的靶點的主要原因是缺乏相關的結構數據(7個靶點)。總體而言,一旦有足夠的結構和結合親和力數據可用於進行驗證研究,作者觀察到FEP驗證研究的失敗率相對較低。圖2 B顯示了18個靶點在驗證研究中的準確性。總的來說,作者獲得了針對14個靶點和21個化合物系列的高精度(RMSE pw <1 kcal / mol)和可接受精度(RMSE pw <1.3 kcal / mol)的預測。在該計劃的早期階段,作者判斷驗證研究成功的標準較寬,因此了RMSE pw大於1.3 kcal / mol的一些系列也進入了生產模式。後續發現由於驗證研究中準確率較低總會導致前瞻性預測準確度更低。預測準確率不僅在不同靶點之間而且在同一靶點蛋白的不同化合物系列之間都有差異。此外,在在研項目中前瞻性地使用FEP時,作者經常會面臨各種各樣可能影響方法準確性的挑戰。圖2 C顯示了對這些挑戰的定性評估。幾乎所有項目都有至少一個方面可能影響在其中應用自由能計算。毫無疑問,現實生活中的藥物發現項目並不是理想的案例方案。

在作者嘗試進行驗證研究的項目中,作者遇到的最常見挑戰是至少一部分配體的結合模式存在不確定性,並且由於懷疑的蛋白質構象變化而導致蛋白質結構存在不確定性(分別為66%和44%) 。在六個項目中,作者發現實驗數據的來源會影響作驗證研究是否成功的判斷。在一種情況下,作者最初將預測的親和力與功能分析的結果進行了比較,發現偏差較大。但是,在將相同的預測親和力與SPR數據進行比較時,作者發現了很好的一致性,因此決定將系列推向生產模式。在四個項目中,作者發現小分子力場的參數可能無法準確描述相互作用。在其中兩個項目中,使用更高版本的OPLS3e力場提高了驗證研究中使用的配體組的準確性。在一個項目中,力場的變化與部分電荷有關。在另一個項目中,該化合物具有取代脂肪環。而最近版本的Force Field Builder中對該環中扭轉電勢進行重新參數化,提高了預測的準確性。然而對於三個出現較大離群值的項目,作者使用較新版本的力場進行重新計算也並未改善結果。

自由能方法及應用(二)在默克藥物研發實踐中的大規模前瞻性評估

圖2 內部項目的FEP可行性、驗證結果和挑戰。(A)對28個靶點進行FEP評估的結果。(B)使用FEP +進行驗證研究的結果。(C)在所有項目中都可能遇到預測準確性方面的挑戰。

數據來源:Journal of Chemical Information and Modeling

內部項目的前瞻性FEP+預測結果

對於12個靶點的19個化合物系列,作者獲得了包含至少五個數據點的前瞻性預測數據集(圖3)。與驗證研究相比,有幾個普遍的原因可以解釋前瞻性中較大的誤差。首先,前瞻性數據集大於原始驗證集。樣本量越大,RMSE的估計就越可靠。其次,在整個項目過程中,新設計的化合物往往與驗證研究中使用的化合物不太相似,與晶體結構中配體也不太相似。這導致在配體的結合方式和質子化狀態方面有更高的不確定性。第三,作者發現作者內部化合物庫中的多種分子仍然是小分子力場面臨的挑戰。對於幾乎每個新的化學系列,即使使用了具有非常高的扭轉電勢的新型OPLS3e力場,作者也必須重新設定一些扭轉電勢。第四,使用前瞻性自由能預測時,作者傾向於關注極端預測(例如排名最高的化合物)。可以通過使用選擇偏差校正來減輕關注極端預測值產生的偏差。然而,作者發現這對最大離群值的影響不大。最後,許多作者非常感興趣的化學結構修飾都對該方法產生了固有的挑戰(例如,從芳環系統到脂肪鏈、電荷變化、使用柔性連接結構的引入新官能團等)。尤其是最後一種對構象採樣產生了巨大的挑戰,但實際上它經常出現在早期的苗頭化合物優化和片段優化中。

自由能方法及應用(二)在默克藥物研發實踐中的大規模前瞻性評估

圖3 來自12個靶點的19個化學系列的前瞻性FEP +結果。數值上下角標為90%置信區間。

數據來源:Journal of Chemical Information and Modeling

將從FEP+獲得的排名與從Glide對接和Prime MMGB-SA打分中獲得的排名進行比較時,作者發現整體上FEP+的性能優於這些常規的基於結構的藥物設計方法。在四種情況下(靶點1 /系列4、靶點4 /系列1、靶點5 /系列3和靶點6 /系列1),Prime MM-GBSA似乎產生了更好的效果,比基於FEP+的排名要好。甚至在其中兩種情況下(靶點1 /系列4和靶點4 /系列1),Glide打分也好於FEP+。但是由於數據集都非常小(

<10個配體),因此置信區間非常大,所以很難就不同方法的相對性能得出最終結論。儘管如此,這可能仍暗示著有機會在某些情況下使用更簡單的評分方法,而像FEP +這樣的計算量大的方法可以用在其他方法無法對配體進行準確排名的時候。作者還將前瞻性內部數據集上的FEP+性能與通過簡單的描述符(例如分子量和log P)進行排名進行比較,FEP+也優於這些“無效模型”。

新基準數據集的構建與評估

基於作者在無法公開的內部項目中自由能計算的豐富經驗,作者決定構建一個新的基準數據集,由8個具有挑戰性的、最近發佈的、具有成藥潛力的相關靶點及小分子組成,總共包含264個配體。此基準數據集中的蛋白質靶點和配體化學空間可以代表作者內部項目的情況,但配體與內部數據集沒有重疊。總體而言,此數據集很好地說明了作者在內部項目中面臨的許多挑戰。與先前發佈的基準數據集相比,配體結構變化包括分子總電荷和電荷分佈變化、及開環和母核躍遷(圖4)。同時,配體組還顯示出結構多樣性略有增加。總體而言,作者在這些數據集實現了良好的相關性(圖5)。鑑於此數據集中包含的挑戰,這是一項了不起的成就。分析不同類型的結構變化時,作者發現涉及淨電荷或電荷位置變化或分子核心/骨架變化的轉化時會顯示出較低的準確性。FEP+軟件已經認為這些變化從本質上講更加難以計算並使用了特殊的採樣設置。儘管如此,出現這些變化時,計算結果仍顯示較大的偏差。有趣的是,對於其餘類型的結構變化,作者未發現誤差與變化程度(即改變的重原子數)的強烈相關性。

自由能方法及應用(二)在默克藥物研發實踐中的大規模前瞻性評估

圖4 新基準集中不同類型的轉換的示例。(A)在Eg5中添加柔性鏈。(B)HIF-2α中的閉環轉化。(C)SHP-2中帶電荷的胺的移動。

數據來源:Journal of Chemical Information and Modeling

自由能方法及應用(二)在默克藥物研發實踐中的大規模前瞻性評估

圖5 新基準集的FEP +結果。

數據來源:Journal of Chemical Information and Modeling

有趣且令人震驚的是,根據作者此前得到的驗證實驗成功標準,作者只能將基準中的8個化合物系列中的一個判為成功。作者發現將λ從5ns提高至20ns可以降低RMSEpw,從而可以使成功的系列擴大為3個,但這對預測親和力和實驗親和力之間的相關性沒有影響。為了研究FEP+的最新版本是否在新基準數據集上會有更好的性能,作者使用Schrödinger 2020-1版重新計算了PFKFB3和SYK數據集。對於PFKFB3,作者獲得了略微改善的性能,對於SYK其準確率較低。接下來,作者將更詳細地討論c-Met和SYK 的FEP+結果。

c-Met數據集上的準確率適中。對於c-Met,FEP+預測重現了從氨基甲酸酯結構變為各種芳雜環的構效關係(圖6)。它成功地預測出嘧啶比兩種噻唑、咪唑、惡二唑和噠嗪活性更好。但是當從吡啶變為嘧啶時,它未能成功再現活性的增強。作者最初假設吡啶化合物的質子化情況的存在會負面影響與鉸鏈區結合,因此吡啶和嘧啶化合物質子化狀態的不同可能是活性差異的原因。但是使用Jaguar計算得到吡啶化合物的pKa為4.5,這使得質子化不太可能發生。對於吡啶化合物的預測值與實驗值的偏差的另一種可能的解釋可能是在結合位點缺乏雜環的旋轉異構體的採樣。由於其對稱性,嘧啶化合物可以兩種旋轉狀態結合,通過N原子接觸蛋白質的鉸鏈區。相反,吡啶只能以一種構象結合以建立這種相互作用。因此,如果在模擬過程中僅取樣一種構象,則會低估嘧啶的結合力。確實,嘧啶和吡啶化合物的軌跡表明,在複雜的模擬中旋轉受到阻礙,而在溶劑中兩種狀態均被採樣。

自由能方法及應用(二)在默克藥物研發實踐中的大規模前瞻性評估

圖6 c-Met基準案例的FEP+結果。(A)預測親和力與實驗親和力良好相關。(B)| ΔΔGpred- ΔΔGexp |誤差直方圖。(C)數據集中淨電荷變化。(D)一系列不同的芳香族雜環取代。

數據來源:Journal of Chemical Information and Modeling

對於SYK基準案例,作者發現準確度較低,這導致預測的親和力與實驗親和力之間的相關性較差。一組離群值與化合物CHEMBL3265015相關。作者觀察到,涉及該化合物的六個擾動計算中有四個顯示絕對誤差> 1 kcal / mol(一個示例在圖7 C中顯示)。化合物CHEMBL3265015在鄰位的苯環上帶有甲基,這可能會影響環的旋轉。與c-Met情況相似,在複合物中沿該扭轉角的採樣不完整。從化合物CHEMBL3265009到CHEMBL3265003轉化時,作者還注意到一個大的離群值(圖7 C)。在這裡,分子是通過兩個延伸到溶劑中的芳環生長的。同樣,根據實驗,從CHEMBL3264999到CHEMBL3265003的預測相對親和力被高估了2 kcal / mol以上。對於每個λ窗口以20 ns採樣進行計算時,觀察到了相同的結果。但是,FEP+卻準確預測了從CHEMBL3265003到大小相似的分子CHEMBL3265004的擾動。作者在其他幾個項目中也觀察到了類似的高估。這種對結合袋入口處生長和置換溶劑的基團的高估可能是由於水模型高估了水的流動性或低估了水與蛋白質的相互作用。

自由能方法及應用(二)在默克藥物研發實踐中的大規模前瞻性評估

圖7 SYK基準案例的FEP+結果。(A)預測親和力與實驗親和力相關性較差。(B)| ΔΔGpred- ΔΔGexp |誤差直方圖。(C)誤差> 1.5 kcal / mol的示例。

數據來源:Journal of Chemical Information and Modeling

FEP+對項目的影響和實操中的挑戰

儘管獲得了總體上令人鼓舞的前瞻性FEP +結果,並且與簡單的SBDD方法相比具有明顯的優勢,但在整個計劃中,作者已經清楚地發現,預測的有效性和獲得有意義的排名所需的預測準確性在很大程度上取決於所研究的化合物系列和實驗測得的親和力分佈範圍。例如,對於靶點3 /系列1和靶點3 /系列3,儘管RMSE大於1.5 kcal / mol,但作者發現FEP +具有良好的排名。這有助於確定化合物的合成優先順序,並且被項目中的化學家認為是有價值的。另一方面,在靶點1 /系列1-3中,儘管就RMSE而言具有相似的準確性,但作者沒有獲得任何預測性排名。

根據作者的經驗,在探索的化學空間對應的活性分佈範圍較大的項目中,可以容許相對較低的預測準確性。一旦優化達到了化學空間中的親和力“峽谷”,此時小的結構變化不會對親和力產生很大的影響,那麼此時應用自由能計算對項目的價值就非常有限(就像靶點1 /系列1-3和靶點5 /系列1)。有趣的是,作者發現這種情況(親和力峽谷)經常出現在(後期)先導物優化項目中。在這一計劃開始之初,作者認為先導物優化應該是FEP的主要應用場景,因為通常在此階段進行的小規模化學修飾最適合使用該方法。然而,與作者最初的預期相反,當要探索的化學空間更廣闊並且活性仍然是主要的優化目標時,FEP表現更好,例如苗頭-先導(hit-to-lead)優化,片段(fragment)優化。此外,在這些情況下,這些化合物的合成通常是“木桶中的最短板”,化學家面臨的合成挑戰限制了可以進行實驗測試的分子數量。在這種情況下,對候選分子進行排序以專注於最有前景的分子被認為是非常有價值的,因此此時使用這些計算量大的方法並不會被認為沒有必要。

強有力的溝通對於成功實施項目中的自由能計算也至關重要。作者親身體會到了在項目團隊中充分了解該方法的功能和侷限性是多麼重要。這有助於選擇計算適用範圍內的化合物,以FEP+進行排序。最初,作者在項目中使用FEP+時總會遇到藥物設計者想要計算的分子不在計算適用範圍內;在計劃實施的後期階段,作者專注於對定製庫進行計算排名,這些庫在設計之初就將適用範圍考慮在內。這種方法的缺點是,在某些情況下此類庫的計算結果會由項目團隊用於設計新分子。但是這種方式下,由於未合成FEP預測的確切分子,因此很難評估該方法的影響。為避免此問題,作者則在之後使用FEP+對此類分子進行計算,以便能夠通過自動工作流程評估預測的質量(請參見上文)。總的來說,

作者發現當結果可以被解釋或合理化時,化學家對FEP預測的接受程度更高,例如,分析相互作用或配體柔性。因此,作者建議在進行FEP預測的同時提供此類分析,尤其要關注那些被預測為最佳和最差的化合物。

總之,要在項目中充分利用自由能計算,必須仔細權衡,在預測準確性、適用範圍、關鍵優化目標、所關注化合物系列的合成可及性和項目時間之間取得平衡。作者發現,篩選大型定製庫是提供增加FEP附加值的有效方法。對於這些庫,作者篩選至少50–100個設計的新化合物,一般篩選數量為實際可合成數量的5-10倍。

結論

自由能計算在製藥行業中越來越常用,並且已成為計算化學家工具箱中的一項強大功能。在這裡,作者描述了為在項目中使用自由能計算而建立的一般工作流程,報告了在多個內部藥物發現項目中前瞻性使用FEP+計算的寶貴數據。作者同時提供了一個新的基準數據集,該基準數據集的可供其他研究者使用,可能推動相關方法的進一步開發。除了預測的準確性外,作者還確定了影響該方法在項目中的效果的多個重要的實操因素。作者期待在不久的將來FEP+將作為一種專家工具,通過大規模計算支持相關藥物研發項目。

基準數據集獲取地址

www.github.com/MCompChem/fep-benchmark

參考文獻

Schindler, Christina EM, et al. Large-scale assessment of binding free energy calculations in active drug discovery projects. Journal of Chemical Information and Modeling (2020). (Article ASAP)。DOI: 10.1021/acs.jcim.0c00900


中大唯信頭條號與中大唯信公眾號、唯信計算訂閱號均由中大唯信科技有限公司運營,歡迎關注轉發,未經授權禁止轉載


分享到:


相關文章: