HitBTC生態系統中的最新項目CureCoin的生物信息學貢獻者訪談


早在3月底,我們就宣佈了啟動COVID-19計劃,該計劃是為了幫助希望加入全球冠狀病毒大流行鬥爭的項目而啟動的。我們很高興分享我們能夠採訪CureCoin的Josh Smith,這是我們作為該計劃的一部分而整合的第一個項目,還有一位極具奉獻精神的科學家和生物信息學專家正在處理該項目的核心數據。我們將發佈的第一份採訪將與生物信息學和數據分析師進行,由於從事這項研究的科學家受到持續的限制,受訪者將保持匿名。

作為Folding @ home項目的一部分,CureCoin於2014年開始運營。 Folding @ home是由斯坦福大學(Stanford University)支持的一項計劃,該計劃一直在使用分佈式計算機網絡來整理計算能力,以研究蛋白質如何自身摺疊。蛋白質錯誤摺疊是由於突變和其他變化而在人體中隨時間推移發生的過程,並導致多種退行性疾病。

由於正在進行的冠狀病毒大流行已經發生的一切,Folding @ home優先考慮了與COVID-19相關的研究,以幫助更好地瞭解這種疾病,從而找到治療方法。

HitBTC(H):癌症,阿爾茨海默氏病,亨廷頓氏病和傳染病之間的蛋白病有何相似之處-只有幾款軟件(GROMACS,OpenMM等)如何涵蓋如此廣泛的疾病?

貢獻科學家(CS):嗯,當然,所有疾病在菌株和突變方面可能有所不同,我們知道是基於目前患有這些疾病的個人的健康數據。在一個人達到一定年齡時,從長期來看,還有其他疾病可能導致癌症和其他傳染病。不幸的是,許多疾病的原因仍是未知的,即是否有人遺傳了它,或它是否是由其他疾病導致,等等。為了解釋所有這些原因,是的,計算機模擬可以為我們提供某些答案,讓我們開始開發治療藥物,並能相對確保它們的安全性。細胞受體和蛋白質結合是我們最感興趣的;癌細胞能否通過受體進入並擊中細胞核破壞細胞,或者通過開發阻斷劑來使外來細胞失活以防止其殺死為我們健康而戰的細胞,如T細胞、B細胞......(免疫細胞)。大多數藥物結合被強調創建或設計阻斷劑或抑制劑,以保護我們的免疫細胞[讓它們正常工作]。在計算機模擬中,免疫細胞的研究是信息學的另一部分,幫助我們瞭解當細胞進入壓力時它們的行為和分子結構。

H:與專用超級計算機相比,您如何預見使用分佈式超級計算在對抗衰弱性疾病方面的巨大潛力? (成本,時間共享期間的可用性等)

CS:嗯,是的,必須利用瞭解疾病所需的所有工具,並能夠將其帶到實驗室進行實驗,從而削減成本和時間,因為使用實驗室設備,試劑等的維護和使用都非常昂貴。

H:Folding @ home現在被認為是世界上分佈最廣泛,運行速度最快的計算系統之一,速度約為1.18 exaFLOPS或2.36 x86 exaFLOPS,可以在1.5毫秒的時間內摺疊幾種蛋白質。這與過去的實驗晶體學方法相比如何?

CS:這部分內容更適合使用“實驗晶體學方法”的化學家或生物化學家。 [根據我的經驗]在開發特定分子時,我們使用輻射來打破鍵並確定效能,我們使用了放射性Iodine-125生物測定法和類似化合物–因此,沒錯,擁有計算機模型可以讓我們看到分子摺疊並預測如何靶向那些受體更好[不需要昂貴的,早期常常不準確的化學實驗]。

H:什麼是蛋白質摺疊動力學和分子模擬中的k-因子–用於確定授予Folding @ home上的蛋白質摺疊的因子?

CS:K因子是確定Folding @ home工作單位(WU)的PPD點值的一部分。根據Folding @ home的描述,許多因素會影響WU的價值。運動學和熱力學變量會導致蛋白質摺疊困難,而成功模擬該分子的結構會產生科學價值。傳統上,化學家會整天這樣做。危險地!勇敢地對待它們,併為它們勇敢地冒險在那些研究實驗室中生活!這是研究計算機模擬的最大附加值之一。 [Urey-Miller Ab從頭開始的納米反應器實驗可能最清楚地表明瞭這一點(另見Cosmos上的Carl Sagan)。 1952年,科學家基本上試圖在一個罐子中創造生命,模擬在生命出現之前在地球上發現的條件(通過許多排列)。他們能夠找到一些有機化合物,但實驗受到設備資金和專門實驗室時間的限制。 2014年,Folding @ home能夠進行相同的實驗,並通過數千種排列在Folding @ home軟件上虛擬運行。他們能夠找到600種當今地球上從未見過的獨特有機化合物–類似於我們剛剛開始發現隱藏在隕石深處的化合物。它不是我們所知道的“生命”,而是生命的基本組成部分]。

H:Folding @ home研究人員使用什麼新穎的方法對蛋白質摺疊的動力學進行統計分析? AI既用於生成初始摺疊模型,又用於分析蛋白質摺疊生成的所有數據。為什麼馬爾可夫狀態模型是分析蛋白質模型的首選方法?

CS:是的,在[FDA藥物批准過程中]每個人都首先要考慮計算機模擬,這在當今已經很重要。馬爾可夫模型提供了對特定簇的強大理解,這些簇按某些菌株,突變或任何未知的特定特徵分組。 馬爾可夫模型可以很好地工作,它可以從特定的mRNA,細胞類型,受體(例如離子通道)或其他提供大量數據,根據某些特徵或變量將每個組分類為一個組作為標識符,從而更好地工作。根據您試圖完成的任務,算法可以定製,以描述每個給定的分子。

H:由於現在可用的計算能力超過了1 exaflop(比世界上某些頂級超級計算機快),因此可以在這種水平上進行什麼樣的探索?您可以探索離子通道,蛋白質摺疊時間尺度等嗎?

CS:隨著我們可以通過分佈式計算獲得更多的計算能力,可以以十年前幾乎不可能的方式探索更多的“超複雜系統”(如離子通道)。可以理解,人類具有被研究過最多但仍是最複雜的新陳代謝和免疫系統。因此,與疾病作鬥爭需要大量的計算能力。 [即使具有所有可用的算力,我們距離能夠完全模擬整個器官整整數十年,更不用說整個人類構造啦。]

H:COVID-19研究與2013-2016年埃博拉病毒流行情況相比如何?您能否討論不同類型的病毒(正鏈和負鏈RNA)及其傳播方式?

CS:這些疾病的傳播方式和所含RNA都不相同(冠狀病毒是正義單鏈RNA病毒,而埃博拉病毒是單鏈負義RNA病毒,因此它們如何在我們的細胞中綁定是不同的)。冠狀病毒是一種呼吸系統疾病,只能通過在無症狀患者附近呼吸相同的空氣來傳播,埃博拉病毒是一種出血熱,僅通過與明顯患病的患者的體液接觸才能傳播。

雖然CureCoin是我們通過主動行動整合的第一個項目,但我們希望增加更多的項目,這些項目試圖在對抗病毒方面產生有意義的影響。同時,我們希望您能從訪談中獲得更多信息。


HitBTC生態系統中的最新項目CureCoin的生物信息學貢獻者訪談


分享到:


相關文章: