科研:研究人員採用機器學習算法破解了COVID-19基因組簽名!

西方計算機科學家和生物學家 t團隊通過使用機器學習,為29個不同的COVID-19 DNA序列確定了潛在的基因組特徵。這種新的數據發現工具將使研究人員能夠在短短几分鐘內快速輕鬆地對致命病毒(如COVID-19)進行分類,這一過程和步伐對於大流行期間的戰略規劃和動員醫療需求至關重要。該研究還支持科學假設,即COVID-19(SARS-CoV-2)起源於蝙蝠中的Sarbecovirus,即Betacoronavirus的一個亞群。這項研究《使用內在基因組特徵對新型病原體進行快速分類的機器學習:COVID-19案例研究》,發表在PLOS ONE期刊上。

科研:研究人員採用機器學習算法破解了COVID-19基因組簽名!

“超快速,可擴展且高度準確”的分類系統使用新的基於圖形的專用軟件和決策樹方法來說明分類,並從所有可能的結果中找到最佳選擇,整個方法使用基於新圖形的專用軟件來說明所有測試的可能結果中的最佳選擇。生物學教授凱瑟琳·希爾(Kathleen Hill)與計算機科學,統計與精算科學領域的西方合作者以及滑鐵盧大學計算機科學系的其他人共同領導了這項研究。

機器學習方法可實現COVID-19序列的100%準確分類,更重要的是,可在數分鐘內再次發現5,000多個病毒基因組之間最相關的關係。

“我們需要的是COVID-19 DNA序列來發現其自身的內在序列模式。我們使用該簽名模式和一種邏輯方法,使該模式與其他病毒儘可能接近,並在數分鐘內達到了很好的分類水平,而不是天,而不是數小時,而是數分鐘,”希爾說。

該分類工具已被用於分析5,000多個獨特的病毒基因組序列,包括1月27日可用的29個COVID-19序列。

希爾認為,該工具能夠對任何新發現的病毒序列COVID-19進行分類,否則將成為全球大流行期間疫苗和藥物開發人員,一線醫療工作者,研究人員和科學家使用的工具包的重要組成部分超越。


來源:Gurjit S. Randhawa et al. Machine learning using intrinsic genomic signatures for rapid classification of novel pathogens: COVID-19 case study, PLOS ONE (2020). DOI: 10.1371/journal.pone.0232391


分享到:


相關文章: