数据共享和开源有助于攻克 Covid-19

3 月 18 日,钟南山院士表示,“对于传染病来说,其实没有国界,任何一个国家不能置身事外。我们需要有共同的交流,吸取共同的经验。”同时需要全球紧密的交流,包括疫苗等方面,希望可以共同创造、共享科研成果,才能更快地克服新冠肺炎的肆虐。

数据共享和开源有助于攻克 Covid-19

在全球疫情爆发之下,“开源共享”已经成为抗击病毒的关键词。

美国科技媒体 WIRED,近日发表一篇名为《 Data Sharing and Open Source Software Help Combat Covid-19 》的文章,其中分享了一个案例:

2 月 27 日,美国西雅图的一名少年被诊断出患有 Covid-19 。西雅图流感研究中心的研究人员对该少年的 Covid-19 毒株的基因进行了测序,并将这组基因数据上传到了一个名为 “ Gisaid ” 的开源数据平台。Gisaid 平台开放了完整报告和元数据,外界可以通过这些共享数据作为基础,进行二次开发。

另一个开源项目 Nextstrain 的研究人员正是根据 Gisaid 上的这组元数据,发现了这一毒株,与另一位西雅图的患者存在联系。最终证实,少年体内的毒株是由另一名患者的毒株变异而来的,而这名患者是 1 月 20 日确诊的。由此研究人员得出了 Covid-19 其实已经在西雅图传播了数周的结论。

上文提到的开源平台 GISAID 全称为Global Initiative of Sharing All Influenza Data(全球共享所有流感数据倡议),总部位于德国慕尼黑,于 2008 年 5 月第 61 届世界卫生大会期间启动,是由全世界一组权威的医学科学家组建,该组织致力于改善流感数据的共享。

数据共享和开源有助于攻克 Covid-19

GISAID的数据来源于全球 14000 名研究人员和 1500 个机构,其独特的数据共享机制可以促进相关研究取得快速进展,例如推动对 COVID-19 的认知和相关医疗对策的研发。

GISAID 针对新型冠状病毒开发的 EpiCoV™ 数据库,目前已收录 656 条新型冠状病毒序列数据(截至 3 月 13 日),已超越传统的数据平台。同时,传统数据平台(比如公有领域的数据库)因允许匿名访问而导致数据所有者权益不受保护、数据使用不透明的问题,这些在 GISAID 的数据共享机制中并不存在。

而文章中提到的 Nextstrain 则是一个开源项目,目的是从病原体的基因序列中挖掘科学和公共健康的价值,它能够分析公开的数据,并进行可视化。

像 Covid-19 这样的病毒是通过自我复制来进行传播,但在自我复制的过程中,有一定的概率会出现复制错误。这种错误会使得复制出的病毒和原来的病毒之间存在某些不同,也就是所谓的变异。

数据共享和开源有助于攻克 Covid-19

这些变异在大多数情况下都是微不足道的,而且不会给人们造成威胁。但是,这些变异会慢慢累积下来。Nextstrain 的研究者通过比对基因序列,发现这些变异之间的异同,就可以分析出病毒样本的继承关系,得到病毒的发展图谱,从而追踪病毒和细菌的演变。

全球战疫还在继续,3月16日,深圳国家基因库已经与 GISAID 达成战略性合作,国家基因库生命大数据平台(CNGBdb)成为 GISAID 的中国首个正式授权平台。双方将围绕呼吸道传染病相关病毒的基因数据管理、共享、分析等方面展开全面合作,促进病毒数据的全球共享。

可以看出病毒数据的开源共享,正在为全球各地评估疫情风险、启动公共卫生应对措施及制定医疗对策提供了更可靠的依据。


分享到:


相關文章: