科研:研究人员采用机器学习算法破解了COVID-19基因组签名!

西方计算机科学家和生物学家 t团队通过使用机器学习,为29个不同的COVID-19 DNA序列确定了潜在的基因组特征。这种新的数据发现工具将使研究人员能够在短短几分钟内快速轻松地对致命病毒(如COVID-19)进行分类,这一过程和步伐对于大流行期间的战略规划和动员医疗需求至关重要。该研究还支持科学假设,即COVID-19(SARS-CoV-2)起源于蝙蝠中的Sarbecovirus,即Betacoronavirus的一个亚群。这项研究《使用内在基因组特征对新型病原体进行快速分类的机器学习:COVID-19案例研究》,发表在PLOS ONE期刊上。

科研:研究人员采用机器学习算法破解了COVID-19基因组签名!

“超快速,可扩展且高度准确”的分类系统使用新的基于图形的专用软件和决策树方法来说明分类,并从所有可能的结果中找到最佳选择,整个方法使用基于新图形的专用软件来说明所有测试的可能结果中的最佳选择。生物学教授凯瑟琳·希尔(Kathleen Hill)与计算机科学,统计与精算科学领域的西方合作者以及滑铁卢大学计算机科学系的其他人共同领导了这项研究。

机器学习方法可实现COVID-19序列的100%准确分类,更重要的是,可在数分钟内再次发现5,000多个病毒基因组之间最相关的关系。

“我们需要的是COVID-19 DNA序列来发现其自身的内在序列模式。我们使用该签名模式和一种逻辑方法,使该模式与其他病毒尽可能接近,并在数分钟内达到了很好的分类水平,而不是天,而不是数小时,而是数分钟,”希尔说。

该分类工具已被用于分析5,000多个独特的病毒基因组序列,包括1月27日可用的29个COVID-19序列。

希尔认为,该工具能够对任何新发现的病毒序列COVID-19进行分类,否则将成为全球大流行期间疫苗和药物开发人员,一线医疗工作者,研究人员和科学家使用的工具包的重要组成部分超越。


来源:Gurjit S. Randhawa et al. Machine learning using intrinsic genomic signatures for rapid classification of novel pathogens: COVID-19 case study, PLOS ONE (2020). DOI: 10.1371/journal.pone.0232391


分享到:


相關文章: