再次呼籲及時公開共享數據!堅守學術道義與承擔社會職責

作者 | 李晨陽


要點速覽

▸ 截至2020年2月10日,共有55條2019-nCoV的病毒基因組可公開獲取。其中,在1月22日以前獲取的31份測序數據幾乎全部來自於中國(僅有1例來自於美國)。然而1月22日以後,餘下的24份數據一律源於境外,包括日本、韓國、新加坡、澳大利亞、美國、法國、英國等。


▸ 國內學術界對於所謂“高影響因子期刊”發表文章的強烈需求,遠遠超乎國際的慣例。扣留數據其實也反映了國內論文發表的評價體系。


▸ 研究人員對“高分期刊”過度看重的不良風氣, 在這次疫情裡已顯示不僅僅是學術圈內的問題了。扣留數據通常不會干擾社會的正常運行,但在當前的危急情形下, 影響會是嚴重而深遠的。


▸ 現在不要求你寫大文章,也不要求你的寫作符合高水平期刊的要求,請大家把數據及時共享到開放的平臺上!


兩週前,中山大學生命科學學院教授、臺灣“中研院”院士吳仲義和中科院腦科學與智能技術卓越創新中心學術主任、中科院院士蒲慕明在《國家科學評論》撰文,呼籲同行將新冠病毒的基因組數據儘快公開。


“數據背景的斷層,使我們很難在時間與地理上找到連續的規律。數據不規範公開的趨勢彰顯了學術界的矛盾。”


2月18日,兩人再次撰文指出,在當前的危急情形下,科學家扣留數據的影響會是嚴重而深遠的,並呼籲國內學者即時公佈和共享新型冠狀病毒測序數據。


《中國科學報》:為什麼關心新型冠狀病毒的基因測序數據?


▲ 吳仲義:

目前,新型冠狀病毒可能已經達到頂峰,不會再進化;但也可能蓄勢待發,正要進入危險期。


在兩級分化的不確定下,只有公開數據,才能讓科學家知道下一步怎麼走。


病毒感染人群后可能會發生快速演變,而自然選擇偏好高傳染力的突變。17年前SARS的爆發也體現出這樣的傳播規律:2002年11月至2003年1月底,SARS病毒的傳播速度較為緩慢,2003年2月起開始迅速加快,這種趨勢一直延續至疫情晚期。


傳播加速與病毒RNA序列的改變息息相關;尤其是病毒S蛋白在傳播前期快速積累了5個氨基酸突變。這說明SARS病毒從果子狸躍染到人之後,經歷了一系列的遺傳適應性改變。


目前我們已經看到,兩場流行病的特徵有諸多不同,但這大多是臨床分析上的。如果能儘快獲得病毒基因組數據,就可以通過對比兩種病毒進化動態的差異,更準確地判斷疫情,也更精準地進行防控。


▲ 蒲慕明:

作為作為科研人員,在很急切地尋找基礎數據、想研究這個病毒到底有沒有變異時,我們卻發現,很難找到較新的國內研究數據,


這很不正常。因為國內有更多的病毒材料,也掌握了更多的相關數據,能開展測序工作的科研人員也並不少。


《中國科學報》:國內哪些機構能獲得新型冠狀病毒基因組的最新序列數據?


▲ 蒲慕明:

很多地方能做,要求就是第一能拿到病毒,第二具備有資質的病毒實驗室。理論上1月22日以前發表序列的這些機構都能做。


《中國科學報》:如此重要的測序數據,在公共平臺上卻難以查找,這是什麼原因導致的?


▲ 吳仲義:

數據是有的,為何不發我們不知道。


▲ 蒲慕明:

我們國內沒有一個公開的地方可以去查這些數據,這的確很奇怪。我們只能推測有可能是科研人員希望用這些數據去寫論文,發表在高影響因子的期刊上。


《中國科學報》:如果真是這樣,那是違背學術道德和科研倫理的吧?


▲ 蒲慕明:

鑑於當前疫情的嚴峻形勢,是這樣的。


因此我們建議採用“胡蘿蔔加大棒”的方式促進數據的發表。


所謂“胡蘿蔔”,就是建議期刊接收發表初步處理的組學數據。即便沒有新的數據產出,基於先期數據完善的分析結果也應該繼續接收。


所謂“大棒”,就是期刊應當對那些隱瞞公共衛生安全數據的論文嚴肅對待,拒絕發表這種基於不道德學術行為的研究。


應對數據發佈,國內已經建立了一些開放數據庫(例如https://bigd.big.ac.cn/,https://db.cngb.org,或開放數據分析平臺(例如https://fight-sars2.genowis.com) 。


現在不要求你寫大文章,也不要求你的寫作符合高水平期刊的要求,請大家把數據及時共享到開放的平臺上!


以下為吳仲義和蒲慕明2月18日在《國家科學評論》發表的呼籲原文:


來源 | 中國科學雜誌社

作者 | 吳仲義 蒲慕明

翻譯 | 呂雪梅 (中國科學院昆明動物研究所)


學術道義與社會職責——呼籲即時公佈和共享2019-nCov測序數據


2020年伊始,由SARS-CoV-2 (原稱2019-nCov) 病毒引發的COVID-19 (2019冠狀病毒病) 席捲全國。兩週前,疫情日益嚴峻,我們曾在本欄目呼籲同行,將此病毒的基因組數據儘快公開[1]。

因為這些數據對全球公共衛生安全有重大意義,國際學術界也通過不同渠道緊急敦促數據共享[2]。然而事與願違,需求越來越迫切,而國內數據的發佈卻非常緩慢。


現在,我們再次呼籲加快新冠病毒的數據發佈速度。基於專家初步分析病毒進化的結果,我們有更充分的理由重複前述倡議(請參閱致謝部分,本文對相關研究結果的引用皆得到許可)。


在疫情防控的關鍵時期, 及時發佈病毒數據更該是我們的道義和責任。希望學術界能夠促進數據的傳播與共享,避免不必要的發佈延誤。

病毒的進化

根據進化的基本原理,病毒感染人群后可能會發生快速演變——這是迅速公佈數據的關鍵科學依據。自然選擇偏好高傳染力的突變,進而增強了毒株的進化優勢。而病毒傳染力增強,也有可能伴隨著毒力降低。

17年前,這樣的進化規律已經在SARS的爆發中得到過例證[3]。在2002年至2003年的流行週期中,SARS病毒早期的傳播速度較為緩慢(2002年11月24日~2003年1月30日),在流行中期迅速增快(2003年2月)。

這一趨勢延續了幾個月直至疫情晚期。傳播加速與病毒DNA序列的改變息息相關;尤其是病毒S蛋白在傳播前期快速積累了5個氨基酸突變。這說明SARS病毒從果子狸躍染到人之後,經歷了一系列的遺傳適應性改變。

本次COVID-19的防控可以借鑑SARS的經驗,但也可能有相當的不同。

因此,如果快速發佈病毒基因組數據,我們通過對比2019-nCoV與SARS-CoV得以儘快瞭解它們進化動態的差異。目前臨床分析已經揭示了兩場流行病的特徵有諸多不同,基因組的分析迫在眉睫。

2019-nCoV的緩慢進化可望稍慰人心

目前,病毒在人群中進化的初步分析(崔傑、陸劍,未發表的研究)僅能基於有限的公共數據(https://www.gisaid.org/)。

截至2020年2月10日,共有55條2019-nCoV的病毒基因組可公開獲取。

其中,在1月22日以前獲取的31份測序數據幾乎全部來自於中國(僅有1例來自於美國)。然而1月22日以後,餘下的24份數據一律源於境外,包括日本、韓國、新加坡、澳大利亞、美國、法國、英國等。

數據背景的斷層,使我們很難在時間與地理上找到連續的規律。數據不規範公開的趨勢彰顯了學術界的矛盾。

目前的分析結果提示了幾個重要的科學問題。最關鍵的是,“2019-nCoV是否在人群中持續的進化?” 如果這一問題的答案是否定的,病毒沒有快速變異, 對於抵抗疫情是個定心丸。


從疫情剛開始至2020年2月早期,病毒的變化是相對緩慢的。出現在多例樣本中(>=2)的氨基酸突變只有8個。

更重要的是,這些突變的分佈與 “沉默”突變(沒功能效應的突變)非常相似。這說明,2019-nCoV在傳播的過程中沒有發生劇烈的適應性變化,這與2002 年SARS病毒非常不同。

簡單的說,2019-nCoV可能在野生動物與人之間已經“磨牙”好些時候了,現已進入適應性進化的遲緩期了。我們希望這個推測是對的。如果得到證明,也許可以緩解公眾的不安。

隱現危機的可能性

雖然看起來病毒似乎進化遲緩,但是有一些信號不能掉以輕心。

首先, 大部分的氨基酸序列突變都出現在近期國外報道的數據中,隱示病毒也許正進化中。


其次,8個氨基酸序列突變是成簇出現的, 一個突變似乎促進另一個突變的發生。

第三,尤其需要警惕的是位於病毒ORF8基因中28144位點上的突變—— 在1月5日以前於武漢採集的13例樣本中只出現了1次(7.8%),但在1月10日之後於武漢之外採集的42例樣本中,出現了18次(43%)。


這樣的躍變看起來很驚人,但樣本數量不夠大,統計學上未必可靠。我們需要更多的數據來查清楚這個突變是否是個危險訊號。


另一個突變,在55例樣本中僅出現了五次:橙縣(CA2/2020,美國)、巴黎(IDF0373, 0373/2020,法國)、高雄(2/2020,中國)、克萊頓(VIC01/2020,澳大利亞),但全部是在大陸境外。這也是值得密切關注的。


最壞的可能性是, 經歷了兩個月的“慢進化”模式之後,2019-nCoV“摸索”出了進化的途徑,開始蠢蠢欲動。SARS病毒進化的第一階段也恰好是兩個月。


上面兩個推測,不確定性都很高。因為樣本數實在不夠大。只有完整並及時地發佈數據, 才有可能塵埃落定。


數據(不)公開的文化根源


數據共享與否背後有科學文化的不良背景。新發布的數據主要來自於國外而不是疫情嚴重的國內。關於測序數據是否應該公開發布和自由獲取,在國內網絡上頗有爭論。根源在於如何保護研究貢獻、影響知識產權。


更具體來講,國內學術界對於所謂“高影響因子期刊”發表文章的強烈需求,遠遠超乎國際的慣例[4]。扣留數據其實也反映了國內論文發表的評價體系。一篇論文不管是在A期刊還是B期刊上發表,還是同一篇論文。

研究人員對“高分期刊”過度看重的不良風氣, 在這次疫情裡已顯示不僅僅是學術圈內的問題了。扣留數據通常不會干擾社會的正常運行,但在當前的危急情形下, 影響會是嚴重而深遠的。

的確,第一批發布病毒序列的論文闡明病毒有人傳人的可能,但是沒及時告知社會。未來回顧這次疫情,這幾天的延遲可能是關鍵。

關於科研人員道義責任的幾點提議

鑑於當前疫情的嚴峻形勢,選擇不公開病毒相關的數據是有悖科研道德的。應對數據發佈,國內已經建立了一些開放數據庫(例如https://bigd.big.ac.cn/,https://db.cngb.org,或開放數據分析平臺(例如https://fight-sars2.genowis.com) 。

學術期刊,包括《國家科學評論》(National Science Review),應該採用“胡蘿蔔加大棒”的方式促進數據的發表。


一方面(胡蘿蔔),我們建議期刊接收發表初步處理的組學數據[1]。更進一步, 基於先期提交的數據完善的分析結果(即便沒有新的數據產出),也應該隨後繼續接收。

另一方面(大棒),期刊應當對那些隱瞞公共衛生安全數據的論文嚴肅對待,拒絕發表這種不道德學術行為的研究。正如不符合動物實驗倫理的研究無可轉圜地拒稿, 隱瞞對公共衛生安全至關重要數據的行為,業內更應該秉持零容忍的態度。

致謝

數據分析由中國科學院上海巴斯德研究所崔傑研究員指導的課題組完成,並得到了北京大學陸劍教授課題組的補充;中國科學院昆明動物研究所呂雪梅研究員課題組對本文提供了寶貴的意見;志諾維思(北京)基因科技有限公司凌少平博士提供了組學數據分析平臺。為避免致COVID-19與SARS的病毒名稱混雜,我們使用2019-nCoV的舊名, 最新定名應為SARS-CoV-2。


參考文獻:

[1] Wu CI, Poo MM. Natl Sci Rev 2020; Very fast evolution, not-so-fast publication – A proposed solution. https://doi.org/10.1093/nsr/nwaa010

[2] Nature Editorial. Calling all coronavirus researchers: keep sharing, stay open. Nature 578, 7 (2020). https://doi.org/10.1038/d41586-020-00307-x.

[3] He JF, Peng GW and Min J et al. Science 2004; 303:1666-1669.

[4] Wu CI, Poo MM. Natl Sci Rev 2017; 4:518-519. What went wrong in science publishing?


分享到:


相關文章: