21個國家377個全基因組分析:探究新冠病毒起源、突變、進化

日前,Nature製作了關於這次新冠病毒疫情的五張圖表,以一種非常直觀的方式為我們呈現了病毒確診病例的變化趨勢、R0值對比、科研人員發佈研究的速度、旅行限制對碳排放和空氣質量的影響、以及和2003年SARS相比的大流行情況等。

21個國家377個全基因組分析:探究新冠病毒起源、突變、進化

新智元Nature:五張圖表揭示新冠病毒大流行,點擊查看原文地址:小程序


Nature可視化圖表:新冠病毒與SARS時間表對比,這次中國真速度


目前,全球已經有超24萬人感染新冠肺炎,中國境外確診已超過境內確診病例。第一張圖展示了中國和其他國家確診病例的變化趨勢,2月中旬後中國確診數放緩,其他國家3月開始陡增。


21個國家377個全基因組分析:探究新冠病毒起源、突變、進化


第二張圖展示了COVID-19與其他疾病R0值和致死率的對比。目前對COVID-19病死率的估計表明,新冠病毒的致死率低於其他大規模疫情的病原體,如SARS、MERS和埃博拉。但是這種感染似乎比季節性流感等其他疾病更容易傳播。新冠病毒的基本繁殖數R0值約2到2.5。


21個國家377個全基因組分析:探究新冠病毒起源、突變、進化


第三張圖展示了旅行限制對碳排放和空氣質量的影響。中國為控制疫情所做的努力似乎已經遏制了能源消耗和空氣汙染。NASA和歐洲航天局收集的衛星數據顯示,全國範圍內大氣中二氧化氮(NO2,是化石燃料燃燒過程中產生的)含量急劇下降。初步分析表明,農曆新年後的NO2汙染比往年同期減少了10–30%。


21個國家377個全基因組分析:探究新冠病毒起源、突變、進化

第四張圖是新冠病毒與SARS時間表對比。SARS疫情持續了三個月後才被確認為是一種獨特的疾病。然後,在接下來將近兩個月的時間裡,還在尋找病原體:病毒本身的鑑定和基因組測序主要來自中國以外的研究人員。


相比之下,在第一個已知的COVID-19病例發生三週後,中國已經通知世衛組織,出現了類似肺炎的病例激增。兩週後,這種冠狀病毒被分離出來,進行了基因測序,並開發出了一種診斷測試,為中國提供了所需的工具,並啟動了全球有史以來最大規模的傳染病遏制行動之一。


21個國家377個全基因組分析:探究新冠病毒起源、突變、進化


最後一張圖展示了新冠病毒相關研究隨時間的變化。這次疫情的爆發促進了對新冠病毒及其引起的疾病的大規模研究。截至3月12日,有關新冠病毒的論文、預印本和初步報告約有900篇。


21個國家377個全基因組分析:探究新冠病毒起源、突變、進化

接下來我們就和大家分享一個關於新冠病毒的新研究。


21個國家的377個全基因組序列,探究COVID-19病毒之間的相似性和進化關係


西安電子科技大學教授李雁妮等人和北京大學講席教授劉兵發表了一篇關於新冠病毒全基因序列相似性的研究,題為“Similarities and Evolutionary Relationships of COVID-19 and Related Viruses”(COVID-19與相關病毒的相似性及其進化關係)。


21個國家377個全基因組分析:探究新冠病毒起源、突變、進化

論文地址:https://arxiv.org/pdf/2003.05580.pdf


研究人員通過對377個COVID-19新冠病毒及相關病毒的全基因序列進行了相似性及進化關係的計算分析,得到了一些潛在有趣的結果,可能會對相關領域專家找到病毒的源頭、有效的檢測試劑、疫苗及治療藥物的研發等有所幫助。下面為大家解讀這篇研究。


摘要:


我們收集了377個公開發布的COVID-19病毒、先前已知的4種引起流感的冠狀病毒HCov-229E、HCov-OC43、HCov-NL63和HCov-HKU1以及致命的致病性P3/P4病毒:SARS、MERS、Victoria、Lassa、Yamagata、埃博拉和登革熱的全基因組序列。


本文作者利用他們最新研發的大序列數據分析工具I-MLCS、現有的MEGA 6.0系統和聚類算法,對來自21個不同國家的COVID-19病毒序列以及COVID-19病毒與其相關病毒的相似性和進化關係進行了計算分析。


21個國家377個全基因組分析:探究新冠病毒起源、突變、進化

圖1.數據來源和採樣/測序時間。


表1.不同月份的COVID-19病毒序列之間的平均相似度

21個國家377個全基因組分析:探究新冠病毒起源、突變、進化


相似性分析表明,兩株以菊頭蝠為宿主的COVID-19病毒(TG13和 RaTG13)與以人為宿主的COVID-19病毒有很高的相似度,但以穿山甲為宿主的病毒與以人為宿主的病毒平均相似度更高一些。進化關係分析表明:來自5個國家所測序的約13株COVID-19病毒很可能與第一代COVID-19病毒及其起源有關,或可能引導研究人員找到該病毒源頭


劉兵教授還透露,他們對錶1中的相似性進行了統計測試,發現病毒在過去四個月中經歷了具有統計意義的顯著突變,這使得開發好的疫苗更加困難。


介紹:


自2019年12月以來,嚴重的新冠病毒COVID-19所引發的肺炎疫情從武漢迅速蔓延到全國,據中國CDC(中國疾病控制中心)報告:截止2020.3.8號,中國已累計確診病人80868人,累計死亡病例3101人,更為嚴重的是,目前該疫情已在世界100多個國家或地區爆發蔓延。因此,有效地控制與扼制新冠病毒COVID-19疫情、治癒感染病人、免受由疫情所帶來的巨大經濟損失是當前世界面臨的最緊迫與重要問題。


本文報告了作者對新冠病毒COVID-19全基因序列(以下簡稱序列)本身,以及COVID-19病毒序列與其它相關病毒序列之間的相似性與進化關係的計算及分析。


由於新冠病毒COVID-19是一種新型病毒,對它的研究才剛剛開始。不同於現有的研究,本文工作是一種大規模的新冠病毒COVID-19及相關病毒的全基因序列的比較計算研究,共涉及了來自21個國家的377個COVID-19及相關病毒的全基因序列。更重要的是,作者首次對這377個病毒的全基因序列進行了相似性及同源/進化分析。正如本文將要呈現的,這種大規模的對COVID-19及相關病毒的全基因序列的深度計算與挖掘,將揭示COVID-19及相關病毒間的一些重要關係與發現。


本文工作中,作者共收集了公開發布的215個COVID-19全基因序列(包括:宿主為人的194個序列、宿主為菊頭蝠的13個序列、宿主為穿山甲的6個序列,以及宿主為環境的2個序列),已有的四種流感冠狀病毒HCov-229E (3個) , HCov-OC43 (78個), HCov-NL63 (16個) 和 HCov-HKU1 (4個), 以及7種高致病致命的7種 P3/P4病毒, SARS (11個)、MERS (11個)、Victoria (5個)、 Lassa (6個)、Yamagata (5個)、Ebola (11個)和Dengue (12個),以上序列

總計377個。本文的序列數據來源於以下數據庫:GenBank or NCBI[7] (National Center for Biotechnology Information), GISAID[8] (Global Initiative on Sharing All Influenza Data), CDC[9](Center for Disease Control and Prevention)等,序列的平均長度為3萬左右


由於新冠病毒COVID-19肺炎的發病機理、病毒檢測、疫苗與治療藥物的研發等,在很大程度上決取於對COVID-19全基因序列的分析研究,因此,本文研究將會為生物、醫療與健康領域的相關專家們,在追溯COVID-19病毒的起源、傳播路徑、研發有效的檢測試劑、疫苗與治療藥物,以及有效地控制與扼制該疫情提供有價值的決策信息/數據支持。值得注意的是,這項工作是COVID-19全基因序列及相關病毒序列的一個大規模計算與挖掘研究,我們目的並非為了獲得廣泛的生物學解釋,除了一些最低限度的,而是擬從大序列數據的比對計算中,分析與挖掘出可能有價值的信息。


21個國家377個全基因組分析:探究新冠病毒起源、突變、進化

圖2.四種流感冠狀病毒與以人為宿主的COVID-19之間的平均相似度。


21個國家377個全基因組分析:探究新冠病毒起源、突變、進化

圖3. COVID-19與七種致命的致病性P3 / P4病毒序列之間的平均相似度。


21個國家377個全基因組分析:探究新冠病毒起源、突變、進化

圖4.不同宿主中COVID-19病毒序列之間的平均相似度。

這項工作的核心發現(所有的分析都只使用完整的基因組序列):

1. 通過對過去4個月來(2019.12~2020.3 )所收集的194個以人為宿主的新冠病毒COVID-19全基因序列的相似性分析結果表明:序列間具有平均高達99.8%的相似度;採用MEGA 6.0對它們的同源/進化關係分析表明:來自不同國家的新冠病毒COVID-19已發生了一定程度的變異


2. COVID-19與已知的四種流感冠狀病毒(HCov-229E, HCov-OC43, HCov-NL63和HCov-HKU1)的相似度在55.6%~56.1%之間,它表明:新冠病毒COVID-19與已知的四種流感冠狀病毒不同


3. 以人為宿主的新冠病毒COVID-19與高致病與致命的P3/P4病毒中的SARS和MERS最像,與SARS的平均相似度達到82.6%,並且MEGA 6.0計算結果報告:COVID-19與SARS同源


4. 以人為宿主的新冠病毒COVID-19序列與宿主為穿山甲的COVID-19序列相似度高於以宿主為菊頭蝠的COVID-19序列相似度,其平均相似度差值達13%~20%。但有兩株以宿主為菊頭蝠的COVID-19序列(TG13和RaTG13)除外,病毒株TG13和RaTG13與人為宿主的新冠病毒COVID-19序列的相似度高達95.9%;


5. 宿主為人的新冠病毒COVID-19序列與宿主為環境的COVID-19序列的相似度高達99.7%,且兩者為同源關係


6. 採用MEGA 6.0對來自21個國家的共計194個宿主為人的新冠病毒COVID-19序列同源進化關係的計算結果表明:來自5個國家的13株病毒序列,即:中國(China 7/85)、泰國(Thailand 2/2)、日本(Japan 2/9)、美國(USA 1/32)和韓國(South Korea 1/9)極有可能相關於,或導致我們找到第一代病毒或病毒源。值得注意的是,由於存在世界範圍內的旅行,本文決沒有上述來自5個國家的13株病毒序列一定/可能是病毒源國之意,僅表明,這13株病毒序列為我們可能追溯查找到第一代病毒或病毒源提供了必要有價值的線索。


21個國家377個全基因組分析:探究新冠病毒起源、突變、進化

圖5.第一代COVID-19毒株的國家、序列號和測序日期。


21個國家377個全基因組分析:探究新冠病毒起源、突變、進化

圖6.來自21個國家的21個COVID-19病毒株的兩棵進化樹(每個國家一個毒株)。


21個國家377個全基因組分析:探究新冠病毒起源、突變、進化

圖7.圖5中21個COVID-19毒株的進化樹。


21個國家377個全基因組分析:探究新冠病毒起源、突變、進化

圖8.15種病毒的相似度矩陣。


21個國家377個全基因組分析:探究新冠病毒起源、突變、進化

21個國家377個全基因組分析:探究新冠病毒起源、突變、進化

圖9. 15種病毒的全連接加權圖和聚類結果。


21個國家377個全基因組分析:探究新冠病毒起源、突變、進化

21個國家377個全基因組分析:探究新冠病毒起源、突變、進化

圖10.兩個病毒簇的兩棵進化樹。


分享到:


相關文章: