基於病毒學文獻數據集的情報分析

2019新型冠狀病毒(2019 novel Coronavirus,以下簡稱2019-nCov)在武漢爆發,2020年1月30日WHO宣佈將新型冠狀病毒感染肺炎疫情列為國際關注的突發公共衛生事件(PHEIC)。冠狀病毒(Coronaviruses、CoV)肆虐全球,成為所有人關注的焦點。

浙江大學文獻信息分析與應用中心(https://ciraa.zju.edu.cn/)、中國工程院知識中心中國工程科技機構與專家庫(http://expert.ckcest.cn)課題組基於Web of Science數據庫,利用關鍵詞對法構建發佈了病毒學研究文獻數據集,涵蓋了病毒學領域2003-2018的研究文獻322094篇,1839840條學者與研究機構信息,我們基於上述數據集進行了一些分析與探索,希望有助於學者的進一步合作與研究。

病毒學及傳染病學研究概況

採用構建的相關研究數據集,統計數據按學者姓名和其所在機構聚類,如同機構同名學者將被認為是一位學者。我們對發文量前20的學者的研究內容進行聚類,按發文量指標進行排序後,得到前20的學者數據如表1所示。


基於病毒學文獻數據集的情報分析


基於病毒學文獻數據集的情報分析

冠狀病毒的研究

將上述專家研究方向按雲圖展示發現病毒學領域的主要研究關注是艾滋病(HIV),而冠狀病毒是一個相對細化的分支,因此病毒學TOP20的學者中並沒有研究者以coronavirus(冠狀病毒)作為主要研究方向。

為此我們從數據集中抽取coronavirus有關的關鍵詞數據共計22個關聯關鍵詞,主要內容為冠狀病毒及具體症狀,如:MERS、MERS-CoV、severe acute respiratory syndrome (SARS)、SARS virus等,除此之外,也有一些上級詞彙,如:Evolution(進化)、Vaccine(疫苗)等,如下圖。


基於病毒學文獻數據集的情報分析

通過對冠狀病毒研究的共詞,按出現最早年份排序,可以獲得冠狀病毒研究的研究過程樹。從圖3中可以看出冠狀病毒的研究源於自身免疫性(Autoimmunity)研究(1990年),其下級節點包含SARS(2003年),MERS(2014年), 突刺蛋白 (Spike Protein,2017年), 豬流行性腹瀉病毒 (PEDV,2019年)。其中SARS有關論文發文年度為:2003-2018,共計155篇;MERS有關論文發文年度為:2014-2018,共計1829篇。由上述數據可知,MERS所引發的關注遠比SARS集中而持久,由於其超高的致死率,學術界對其傾注了極大的研究資源。


基於病毒學文獻數據集的情報分析

通過上述冠狀病毒相關的22個關鍵詞對,在數據集中二次檢索收斂獲取冠狀病毒TOP20研究學者結果(因為發文數量並列,實際選取23名)如表2所示。


基於病毒學文獻數據集的情報分析


基於病毒學文獻數據集的情報分析


基於病毒學文獻數據集的情報分析

從表2可以看到香港大學的袁國勇(Yuen,Kwok-Yung)院士以相關研究成果45篇位列第一。同時,在冠狀病毒研究TOP20學者中,香港大學學者佔據7位。可見我國香港地區對冠狀病毒有著持久的研究和長足的人才儲備,未來極有可能在此領域產生重要的學術成果和解決方案。

我們以袁國勇院士為例進行文獻計量分析。


基於病毒學文獻數據集的情報分析

袁國勇,中國工程院院士,2001年至2011年擔任香港大學微生物學系主任,2005年擔任香港大學新發傳染性疾病國家重點實驗室首任主任,2020年,擔任國家衛生健康委員會高級別專家組成員。

袁國勇院士在2013-2018年間對冠狀病毒和SARS的研究共計發文29篇,在發現引起非典型肺炎的病原體方面,袁國勇院士發揮了關鍵作用,並在《柳葉刀》上發表了第一篇關於甲型H5N1流感的臨床和實驗室診斷論文。

截止2019年,袁國勇院士已在《Lancet》、《New England Journal of Medicine》、《Science》、《Journal of Virology and PNAS》等頂級醫學期刊發表超過900篇學術論文,被引用超過36000次,主要的研究方向如圖5所示,近期主要SCI醫學期刊發文情況如圖6所示。


基於病毒學文獻數據集的情報分析

我們同時通過中國工程科技機構與專家庫網站檢索“冠狀病毒”,發現袁院士也是相關研究領域專家推薦的榜首。


基於病毒學文獻數據集的情報分析

通過對冠狀病毒關聯文章中的機構進行聚類,得到冠狀病毒主要研究機構如表3所示,以香港大學位居首位。其中,中國的冠狀病毒的主要研究機構有香港大學、中國科學院、中國醫學科學院。


基於病毒學文獻數據集的情報分析

全球對冠狀病毒研究的國家有55個,覆蓋亞洲、歐洲和美洲的絕大部分國家和地區,其研究熱度分佈如圖8所示。可以明顯看到,熱點研究區域主要集中在美國和中國,我們預計,對於此次疫情的防控和治療方案也將依賴中美兩國的研究與合作取得突破。


基於病毒學文獻數據集的情報分析

中國工程院中國工程科技知識中心

浙江大學信息資源分析與應用中心


分享到:


相關文章: