姿勢|面對新冠疫情,你或許需要這張疫情軌跡圖

自從新冠疫情爆發以來,你生活或許變成了這樣:每天早上一起床,便習慣性地打開手機,點開微信朋友圈或新聞類APP,查看今天的新增確診人數、新增死亡人數和疑似病例數,而後憂心忡忡地看著窗外,想著什麼時候情況能夠好轉,自己得以“刑滿釋放”,出門去在春風楊柳裡走一遭。


在各類消息中,一些傳染病的名字頻頻出現,被拿來與此次新型冠狀病毒引起的傳染病相對比或類比:非典型肺炎、中東呼吸綜合徵、埃博拉、禽流感、西班牙流感……每一個名字都意味著大規模的感染和死亡,每一段故事都豐富著困於斗室之中的人們對於此刻正在發生的疫情的想象。


新型冠狀病毒肺炎與這些歷史上的傳染病相比,其“威力”究竟幾何呢?


21世紀,病毒為何仍肆虐


一個傳染病想要流行,需要同時存在三個環節:傳染源、傳播途徑和人群易感性,若切斷任何一個環節,流行即告終止。其中,傳染源除了患者,也包括其他攜帶病原體的人或者動物,比如在此次疫情中,最初的傳染源被普遍認為是華南海鮮市場販售的野生動物;而易感者則是指對該傳染病缺乏特異性免疫力的人(而對於新型冠狀病毒,幾乎所有人群都是易感的)。傳播途徑主要包括呼吸道傳播(包括飛沫和氣溶膠)、消化道傳播、接觸傳播、血液/體液傳播、蟲媒傳播等[1]。


每一種傳染病都有其特異性的病原體。病原微生物除了大眾熟知的病毒和細菌,還包括朊粒、真菌、衣原體、支原體、立克次體、寄生蟲等。曾經造成過大規模傳播和死亡的傳染病中,鼠疫、傷寒和霍亂便都是由細菌傳播造成的,其病原體分別為鼠疫耶爾森菌、傷寒桿菌和霍亂弧菌;而2003年肆虐神州大地的“非典”,一度也被懷疑是其病原體為某種衣原體。而最常見的病原體還數病毒:從每年冬季肆虐的流行性感冒、生活中常聽說的艾滋病,到所有孩子一出生就要接種疫苗預防的麻疹、水痘、脊髓灰質炎,都是以病毒為病原體的傳染病。


20世紀以來,隨著多種抗菌藥物的發現,人們對於應對由細菌或真菌引發的傳染病已經有了較為豐富的經驗。這些藥物往往通過特異性干擾細菌的生化代謝過程,影響其結構和功能,使其失去正常生長繁殖能力,達到抑制或殺滅細菌的作用。然而,抗病毒藥物的研發卻要困難得多:病毒並不具備獨立的細胞結構和代謝系統,僅以一層蛋白質外殼包裹其遺傳物質(DNA或RNA),複製、轉錄、翻譯和蛋白組裝過程都依賴宿主細胞內的物質和能量完成,且在其不斷的複製過程中會因出現的錯誤而形成新的變異體,這些生物學特性都使得研發一種有效、特異地殺滅入侵細胞的病毒而不對機體產生損害的藥物不那麼容易[2]。因此面對病毒性傳染病,人類難以事先準備,只能倉促應戰。


21世紀以來,對世界衛生產生過大規模危害的傳染病幾乎是病毒性傳染病。其中最可怕的當屬由埃博拉病毒導致的人畜共患傳染病埃博拉出血熱。1976年,該病首次出現在非洲在蘇丹南部和剛果金埃博拉河附近的部落,並由此得名。埃博拉病毒屬下目前已發現六個不同物種,斷斷續續引起了多次爆發,1994年加蓬, 2002年烏干達,2003年剛果共和國……其中,2014-2016年在塞拉利昂,利比里亞和幾內亞引起的疫情爆發,是有史以來規模最大、最複雜的埃博拉疫情,感染人數超過28000例,死亡人數超過11000人[3]。埃博拉症狀不一,發病初期的典型症狀是起病急,發燒、極度虛弱、肌肉疼痛、頭痛和咽喉痛。隨著病情加重,病人往往會出現嘔吐和腹瀉、皮疹、腎臟和肝臟功能受損,某些情況下會有內出血和外出血[4],病死率在30%以上。目前認為果蝠很可能是埃博拉病毒的天然宿主。


姿勢|面對新冠疫情,你或許需要這張疫情軌跡圖

△電子顯微鏡下觀測到的埃博拉病毒,長約60至80納米。來源:美國疾病控制與預防中心(https://commons.wikimedia.org/wiki/File:Ebola_virus_em.png)


另一個21世紀長期存在、危害著人類健康的傳染病便是艾滋病。艾滋病由感染HIV病毒( human immunodeficiency virus,人類免疫缺陷病毒)引起,是一種危害性和病死率極高的傳染病。HIV主要經由攻擊人體中的CD4T淋巴細胞,使人喪失免疫功能。


姿勢|面對新冠疫情,你或許需要這張疫情軌跡圖

△新型冠狀肺炎病毒、HIV病毒、H1N1病毒模型(來源見文末)


除此之外,2003的SARS、禽流感,2009的甲型H1N1流感,2012-2015年的MERS,2019年在美國大規模爆發的季節性流感……人類與傳染病的鬥爭還遠遠未結束。


新冠會與SARS、MERS一樣發展嗎?


2003年,SARS病毒肆虐神州大地的場景仍然歷歷在目,而在疫情爆發的初期,科學家們便宣佈導致此次疫情的新型冠狀病毒的基因序列與SARS病毒有著高達75%的同源度[5]。因而眼看著感染人數一天天增加,很多人的第一反應就是:莫非“非典”時隔17年又捲土重來?


姿勢|面對新冠疫情,你或許需要這張疫情軌跡圖

△新型冠狀病毒武漢株01電鏡照片。來源:國家病原微生物資源庫(http://nmdc.cn/#/nCoV)


“非典型肺炎”的正式名稱為嚴重急性呼吸道綜合症(SARS),是由SARS冠狀病毒(SARS-CoV)引起的病毒性呼吸道疾病。SARS-Cov與導致此次疫情的新型冠狀病毒SARS-Cov-2及下文的MERS病毒,同屬於網巢病毒目冠狀病毒科。冠狀病毒球形包膜上的蛋白刺突狀如王冠,也是與細胞表面受體結合、侵入人體的“鑰匙”。


SARS於2002年末2003年初在中國廣東最先發生[6],並在春節前後從廣東省蔓延到了全國的其他省份,4月份在北京爆發,2003年上半年波及我國內地24個省、自治區、直轄市的266個縣(市、區)[7]。到2003年6月流行結束時,SARS-CoV感染了8422人,造成916人死亡[8]。SARS主要通過呼吸道傳播,以發熱為首發症狀,其他症狀包括乾咳、肺炎、頭痛、腹瀉等,嚴重的病例通常會迅速發展為呼吸窘迫,需要重症監護。研究認為SARS病毒起源於中華菊頭蝠[9],並由果子狸作為中間宿主傳染人類。


中東呼吸綜合徵(MERS)是由MERS冠狀病毒(MERS-CoV)感染引起的新興病毒性呼吸系統疾病,於在2012年在中東地區首次爆發,最初被發現於一位曾去過沙特阿拉伯的卡塔爾病患身上,醫生針對他的呼吸道症狀進行了對症治療,但疾病最後引起腎衰竭,入院後11天死亡[10]。2015年,隨著韓國一位有中東旅行史的感染者前往醫院檢查,MERS疫情在韓國蔓延。截至2019年12月底,全球共報告了2499例實驗室確認的中東呼吸綜合徵病例,包括861例相關死亡,病死率:34.4%。其中大多數病例來自沙特阿拉伯(2106例,包括783例相關死亡,病死率為37.2%)[11]。當前有科學證據表明,單峰駱駝可能是中東呼吸綜合徵冠狀病毒的一大宿主,並且是人類MERS感染的動物源。


基於系統發生學、分類學和既有慣例,日前,國際病毒分類學委員會則宣佈這種病毒的英文名為“SARS-CoV-2”,正式將其識別為SARS冠狀病毒的一個姊妹病毒,屬於SARS相關冠狀病毒種[12]。同時,世界衛生組織宣佈新型冠狀病毒所引發疾病命名為“COVID-19”(即coronavirus disease 2019)[13]。然而,包括國際病毒分類學委員會冠狀病毒研究小組主席約翰·齊布爾以及鍾南山院士都表示,儘管名稱接近,但新型冠狀病毒與SARS冠狀病毒並不一樣,COVID-19也和SARS疾病在表現上有許多不同。


那麼,從流行病學表現上看,這種“不同”體現在何處?我們選取了各種在歷史上發生過的對人類社會產生了重大影響的傳染病,以橫軸映射其感染人數,縱軸映射其死亡人數或者病死率(死亡人數/總感染人數),與新冠肺炎疫情每日的對應統計數據進行對比,繪製出新冠肺炎的疫情軌跡線。


姿勢|面對新冠疫情,你或許需要這張疫情軌跡圖

△疫情軌跡線—新型冠狀病毒肺炎與其他重大傳染病感染人數/病死率情況對比(http://vis.pku.edu.cn/ncov/mortalityline)


疫情軌跡線從病死率/死亡人數和感染人數兩個維度出發,以紅色方塊代表新冠肺炎,將其置於其他傳染病的數據中間,為疫情發展給出一個直觀的側寫,明確地反映新冠肺炎和其他大規模的流行病之間的差異。


通過疫情軌跡線我們可以發現,新冠肺炎的傳播表現和“非典”有很大不同:二十多天以來,儘管感染人數逐步攀升,並很快超過了SARS,但其病死率和SARS相比卻差異很大,其“影響力”似乎和甲型H1N1流感、季節性流感等更加相似。


在選擇了病死率變量的疫情軌跡圖上,我們還可以觀察到另外一個現象:代表歷史上曾大規模流行的傳染病的數據點沒有發佈在圖的右上角。即感染人數更多的傳染病,往往病死率並不是最高的。因此,在不考慮感染人數這個變量的情況下,僅通過比較死亡人數來判斷某個傳染病本身的兇險程度並不嚴謹。從病死率上看,新冠肺炎並非一種格外兇險的傳染病,之所以死亡人數超過非典,很大程度上可能是由於前期的大規模傳播,以及隨之引起的一系列實際問題(如醫療機構承載力不足、許多患者無法得到有效醫療保障等)導致的。


圖背後的故事


做一個新穎而出色的可視化並非易事,不能依靠不可琢磨的靈機一現,而是要遵循很多科學原理。這裡我們進一步解讀在疫情軌跡圖中的設計思想。


為何要用座標位置表示數據

這裡面為何要用平面座標來表示感染病例數和死亡病例數這兩個變量?為什麼不用更加絢麗多彩的顏色來表示數據?在可視化中,我們可以有很多種方法(視覺通道)來編碼數據,包括位置、大小、顏色、亮度,甚至紋理。但是實質上不同的視覺通道對於數值的表達效果是有明顯差異的。例如對於不同長度的兩條線段,普通人很容易估計出他們相對長度的倍數,而要估計兩個不同亮度對象之間的差別,對人來說要困難的多。這是由人的生理感知能力決定的。通過大量的心理學實驗,世界各國學者們逐漸明確了不同視覺通道對各種可視化任務表達效率的相對順序。


在確定可視化方案的設計階段,我們傾向於優先使用更精確的通道來映射更為重要的信息。對於數值型數據,使用位置這一通道進行映射時,人的感知是最為準確的。散點圖正是使用了橫軸和縱軸的位置來映射疫情中我們最為關心的兩個因素:傳染影響和致死性。不同疫情的感染人數和死亡人數可能有著顯著的差異,極大值和極小值之間可能相差多個數量級。在線性座標中,較小數值之間的差異難以比較。我們使用對數座標變換的方法來應對這一問題。


如何做好動靜對比

新型冠狀肺炎病毒疫情暫時沒有結束,感染人數每天還在增長。身處疫情中的人們,非常關心疫情變化的趨勢。比如最近很多人關注到了中國除湖北省外的新增確診人數,連續10天在下降。在疫情對比的散點圖中,我們使用了動畫的形式,來表現每一天的疫情傳染和致死情況的變化。在動畫播放的過程中,我們可以通過觀察點的運動,來理解疫情變化的趨勢。


使用動畫來表現多維度數據隨時間的變化,是可視化中的一種常用方法,在中學教學中就開始廣泛應用於實驗數據分析,也廣泛見於社交媒體和宣傳。一個為公眾熟知的例子,是Hans Rosling教授使用世界各國統計數據所製作的動態散點圖。


然而,動畫也具有一些不足。觀眾需要等到動畫的播放週期結束後,才能觀察到全部的數據。當對不同時間段進行比較時,用戶需要承擔更大的認知負擔,記住以前的數據,或者花費較多的時間回看動畫。考慮到這些因素,軌跡線除了使用動畫,還保留了已出現過的時間點,並使用折線連接相鄰時間的點,來作為新冠病毒肺炎疫情變化的一個“軌跡”。以這樣的方式,疫情軌跡圖達到了摺疊時間的效果,雖是靜態,又涵蓋著動態的過程,並減輕讀者的記憶負擔。對於動畫在趨勢可視化中的效用,可以參考 George Robertso 等人在2008年發表的IEEE VIS 可視化大會論文 “Effectiveness of animation in trend visualization”[14]。


姿勢|面對新冠疫情,你或許需要這張疫情軌跡圖

△使用了尾跡的散點圖(截圖於 https://www.gapminder.org/tools)


需要指出的是,和上圖中所有數據點都有相同的時間範圍不同,疫情軌跡圖中,我們只為要關注的重點對象——當前的新冠疫情提供了動畫尾跡,其他數據均為其最後統計時間的狀態。這一時間差異並不會帶來認知的模糊,反而能讓用戶更好理解和猜測新冠疫情將發展得更接近哪一種歷史上出現過的疫病。


視解疫情數據


巧妙設計的可視化為快速深度理解當前疫情提供了有力的手段。下圖表示因疫病死亡人數和感染人數的關係,從圖中可以看到,目前疫情還在“爬坡”,新冠肺炎感染數目增長很快,其影響程度很快就超過了2003年的非典。而在圖中我們可以發現,新冠肺炎與“非典”有不同的傳播表現:傳播範圍更大、傳染能力更強、病死率更低,其“影響力”似乎接近於甲型H1N1流感、季節性流感等。


姿勢|面對新冠疫情,你或許需要這張疫情軌跡圖

△疫情軌跡圖—新型冠狀病毒肺炎與其他重大傳染病感染人數/死亡人數情況對比


同時我們從前文感染人數/病死率的軌跡線中也可以看到,自疫情開始以來,新冠肺炎病死率一直在相對較低的水平,遠小於近年的埃博拉病毒、HIV等。對比位置較為接近的甲型H1N1流感(2009-2010年數據,感染人數五十萬人,死亡率3.69%),截至2020年2月14日24時,新冠肺炎的確診人數為66,492例,病死率為2.29%,且病死率這一指標有繼續維持在同一水平的趨勢。一百多年前的西班牙流感中,全球有數千萬人死亡,病死率高達20%,為20世紀留下了一個巨大的陰影。而伴隨著醫療水平以及公共衛生意識的逐步提高,傳染病帶來的死亡數目已經大幅降低。


姿勢|面對新冠疫情,你或許需要這張疫情軌跡圖

△疫情軌跡圖—新型冠狀病毒肺炎與其他重大傳染病感染人數/病死率情況局部


軌跡線也同樣反映出了疫情走向的變化。1月21日是折線的谷底,這時武漢尚未封城,疫情也處於早期傳播階段,死亡人數較小,而感染人數相對而言增速更快。封城之後,感染人數開始指數級暴增。由於重症患者死亡與發病之間有一定的滯後,可以觀察到病死率是經過一個緩慢下降的過程後迅速拔升。2月12號起,臨床診斷病例被納入確診病例公佈,原已近乎平滑的散點列再次產生了跳躍。對應的當前死亡率也有所下降。


更多的歷史流行病例數據可以更好地充實今天我們介紹的疫情軌跡圖這一可視化,未來北京大學可視化與可視分析實驗室還將補充更多歷史數據,探索包括傳染係數在內的更多指標,敬請期待。



分享到:


相關文章: