從基因序列追蹤新冠肺炎的變遷,一次共享開放的國際協作

如果你真的關心2019n-CoV,一定不要過多關注各種所謂自媒體的文章。這些文章大部分都沒有調查能力,只能湊字數。無論引起盲目樂觀還是盲目恐慌,都不是好事。今天我介紹一些國際接力合作的資源,希望對你有用。

首先登場的是GISAID。

從基因序列追蹤新冠肺炎的變遷,一次共享開放的國際協作

GISAID的全稱是Global Initiative of Sharing All Influenza Data(全球共享所有流感數據倡議),由多位頂尖科學家和諾貝爾獎獲得者倡導成立。根據網站自述,其使命是:

GISAID力圖促進下列數據的國際間共享:所有流感病毒序列、與人類病毒有關的相關臨床和流行病學數據,與禽和其他動物病毒有關的地理以及物種特定數據。目的在於幫助研究人員瞭解病毒如何進化,傳播,甚至成為潛在的重大流行疾病。

傳統上,流感數據在論文正式發佈之前,會遭遇到各種阻礙和限制,GISAID希望打破限制、克服阻礙,來促進數據的共享。

雖然GISAID的初衷關注“流感”,但目前已經把傳染疾病也納入其中,這當然就包括了2019n-CoV。

打開首頁就可以看到,起碼有三塊內容是關於2019n-CoV的。其中1顯示目前已經有13個國家開放共享了自己的2019n-CoV的病毒序列,2是全球的感染分佈圖,3是進一步的遺傳變異分析 (下面會詳細介紹)。

從基因序列追蹤新冠肺炎的變遷,一次共享開放的國際協作


目前,世界各國都有科學家將2019n-CoV的病毒相關數據提供給GISAID,掌握這些數據之後,GISAID提供了約翰·霍普金斯大學制作的,近乎實時的全球病例分佈圖,這塊看板非常清楚,一目瞭然,看得出來花了心思設計。值得一提的是,中國的數據來自丁香園。

從基因序列追蹤新冠肺炎的變遷,一次共享開放的國際協作

如果認為GISAID只提供了這點信息,那就錯了。GISAID的目的是“共享”,所以它不會只提供成品報告,而是像開源軟件運動一樣,開放了元數據,所以外界可以這些共享數據作為基礎,進行各種二次開發。

因此,有程序員在著名的源代碼託管網站上創建了一個項目ncov,將元數據維護在其中。

從基因序列追蹤新冠肺炎的變遷,一次共享開放的國際協作

注意上面說的是元數據,因為按照GISAID的規範,ncov並不能直接把數據拷貝過來放在github上,而需要用戶自己去GISAID下載(雖然也是免費的)。最終,GISAID的病毒基因序列類似下面這樣:

>Wuhan/WIV04/2019

attaaaggtttat...

>USA/IL1/2020

attaaaggtttat...

>Wuhan/WIV06/2019

ccttcccaggtaa...

其中>開頭的行對應的是data/metadata.tsv中基因序列的名字,而attaaaggtttat之類就是檢測出來的基因序列。有了這些數據,你可以在本地機器上使用下面的命令來生成json文件,然後用auspice或者nextstrain來做可視化。

從基因序列追蹤新冠肺炎的變遷,一次共享開放的國際協作

ncov項目創建於1月19日,到現在已經有20名貢獻者,239次提交,150個star,29個fork。值得一提的是,貢獻者中不乏中國程序員的身影。而且,已經有人將報告翻譯為中文版本。

從基因序列追蹤新冠肺炎的變遷,一次共享開放的國際協作

你大概注意到了,上面出現了一個名字nextstrain。它也是一個開源項目,目的是從病原體的基因序列中挖掘科學和公共健康的價值,根據公開的數據提供及時的查看方式,以及強大的分析和可視化工具。

從基因序列追蹤新冠肺炎的變遷,一次共享開放的國際協作

目前我們看到的許多疫情報告,都是基於醫學的統計數字,而比較少流行病學的分析。流行病學的分析需要關注病毒是如何傳播的,傳播鏈條是什麼,在傳播過程中有沒有變化…… 這些信息,可以通過走訪、篩查獲得,也可以通過基因序列獲得。

關於2019n-CoV,該網站基於GISAID的開放數據不斷更新分析報告,最新的報告是1月30日的,有中文版。

查看該報告可以發現,科學家已經通過基因序列的比對,找出了病毒的變異樹(有點像源代碼的分支管理)。因為病毒在複製時可能發生變異,而變異會累積下來,所以通過比對基因序列,就可以分析出病毒樣本的繼承關係,得到病毒的發展圖譜。

從基因序列追蹤新冠肺炎的變遷,一次共享開放的國際協作

從基因序列追蹤新冠肺炎的變遷,一次共享開放的國際協作

根據已經公開的42株病毒序列比對發現,有少數病毒的基因序列仍然保持不變,而其它病毒的基因序列已經發生了突變,突變的數量從1個到7個不等。

其中值得關注的是,有一組樣本包含廣東的一例和美國的四例,已經發生了累積的突變,最多的突變(7個)也來自這一組,這說明病毒在離開武漢之後已經開始累積突變。

從基因序列追蹤新冠肺炎的變遷,一次共享開放的國際協作

從基因序列追蹤新冠肺炎的變遷,一次共享開放的國際協作

從基因序列追蹤新冠肺炎的變遷,一次共享開放的國際協作

從基因序列追蹤新冠肺炎的變遷,一次共享開放的國際協作

從基因序列追蹤新冠肺炎的變遷,一次共享開放的國際協作

從基因序列追蹤新冠肺炎的變遷,一次共享開放的國際協作

雖然目前還沒有證據證明突變會改變病毒的行為,病毒的突變是正常的客觀現象,但我們都不能掉以輕心。

最後我想說,經常有很多人說“正能量”,我也贊成“正能量”有用。但是“正能量”不只限於我們自己的動人故事,也應該讓大家知道“吾道不孤”,在這個世界上的其它地方,還有許多聰明的頭腦在無私奉獻,在用科學的方法,接力協作,並肩作戰,解決人類共同的難題。

你說,是這樣嗎?


分享到:


相關文章: