可視化的統計學是如何提升公眾對疫情的認知的?

現代統計學的起源之一是對疾病的記錄與分析。這裡面有兩個歷史上非常有名的統計圖形。


第一張圖如下:


可視化的統計學是如何提升公眾對疫情的認知的?


這張圖有很多名稱,比如玫瑰(花瓣)圖、雞冠花圖、極區圖等。它的作者是佛羅倫薩·南丁格爾


對,就是現代醫護行業的創始人南丁格爾。她1820年出生於意大利佛羅倫薩市,父母以出生地給她取了名字。南丁格爾的教育大部分來自畢業於劍橋大學的父親。她從父親那裡遺傳了對數學的熱愛,併成了著名數學家西爾韋斯特的學生。南丁格爾17歲那年在公園散步的時候突然感到自己聽到了神的召喚。24歲開始她希望進入醫院從事護理工作,但受到了家庭的反對,因為那時候的醫護行業從業人員受教育水平很低,父母覺得有損於家庭聲譽。但南丁格爾信念堅定,在朋友的幫助下,她終於獲得了進入醫院進行護理學習的經驗。


1854年克里米亞戰爭爆發,南丁格爾在報紙上看到對戰地英國醫療設施的批評。她自告奮勇,在1854年10月帶領38個護士到達戰地醫院。然而,醫院管理者開始並不歡迎她的到來。直到1855年3月,當戰地醫院感染傷寒和霍亂的傷員急劇增加,醫院進入崩潰狀態時,南丁格爾和她帶領的護士們才被允許進入病房幫忙。南丁格爾對醫院的傷病情況有非常敏銳的洞察力。她很快就發現絕大部分的士兵死亡源於糟糕的衛生條件和營養不良,而不是戰傷。南丁格爾繞開官僚僵化的軍隊醫院管理部門,通過社會捐贈的資金開拓了一個獨立的醫護物資供應系統。在她的領導下,戰地醫院的疫情迅速得到了控制。1856年4月,克里米亞戰爭結束,南丁格爾回到倫敦,受到了國家英雄式的歡迎。然而,縈繞在她心中的,是近萬名不幸死亡的士兵的慘狀。


1858年,她基於在戰地醫院所作的記錄進行了非常詳盡的分析,給皇家軍隊健康委員會提交了一份800多頁的關於醫院管理體系改革的報告。上述的圖形是她報告的最大亮點之一。由於南丁格爾的圖形對當時的人們來說實在是太新穎了,所有看過這個圖形的人都被它所吸引。很快,在皇家軍隊健康委員會的推動下,英國部隊醫院的醫護體系開始進行系統改革,並逐步推廣到了其他的醫院。同年,因為在醫學統計上的傑出貢獻,南丁格爾被推選為皇家統計學會首位女性會士。不幸的是,南丁格爾在克里米亞期間染病,這使得她在回英國之後的50多年的時間內一直臥病在床。然而,正是在這段時間,她創立了第一個護士培訓學校,而且出版了200多本關於護理和醫院管理的專業書籍,成為現代醫護行業的創始人。


那麼,醫護行業帶來的衛生革命,究竟對人類社會有多大影響?南丁格爾研究專家Hugh Small所做的下面這張圖,清晰地表明瞭南丁格爾推動的這場革命對人的壽命的提升居功至偉。

可視化的統計學是如何提升公眾對疫情的認知的?


第二張著名的統計圖是:


可視化的統計學是如何提升公眾對疫情的認知的?


這張圖的作者是約翰·斯諾,一位醫術精湛的醫生。


同樣也是在1854年,倫敦,當時世界最大城市,爆發了第三大規模的霍亂疫情。醫生和科學家們普遍認為疫情是通過瘴氣傳播的,也就是說,腐爛物體和廢棄物中的有害物質進入了空氣中,形成了我們今天所說的氣溶膠,人們呼吸了受汙染的空氣,因而染病。斯諾醫生通過深入的研究發現,霍亂疫情不是通過空氣而是通過飲用水傳播的。


如何改變專家以及大眾多年以來的固有觀點?斯諾走訪和統計了Soho區疫情集中爆發地的病例情況,並將病例的分佈情況畫在了地圖上(每一個病例用一根短橫線表示)。斯諾總結他的發現時寫道:“我從病發現場發現,幾乎所有的死亡案例都發生在布勞德大街(Broad Street)的水泵附近。只有10名死亡案例的住所靠近另一個街頭水泵。而其中5個死亡家屬告訴我,他們一直使用布勞德大街水泵,原因是其實布勞德大街水泵離得更近些。有3戶死亡家屬確認,病亡的孩子所在學校就在布勞德大街水泵附近。”1854年9月8日,在斯諾的建議下,布勞德大街上那個被汙染的公用水泵的手柄被移除,疫情很快得到控制。


斯諾的霍亂分佈地圖被認為是現代社會的第一個流行病學分析,他本人也被認為是流行病學分析的創始人。這張圖也作為疾病數據的第一個地理分析圖而載入了GIS分析的經典案例集。


可視化的統計學是如何提升公眾對疫情的認知的?

佛羅倫薩·南丁格爾

可視化的統計學是如何提升公眾對疫情的認知的?

約翰·斯諾


一個半世紀以後,南丁格爾和斯諾所開創的現代醫療護理和流行病學研究,再次成為了全世界抗擊新冠病毒疫情的最中堅的力量。


統計學作為一門以數據分析為基礎提出解決方案的學科,在新冠肺炎這種突發重大新型疫情面前,可以提供哪些幫助?回顧上面的歷史我們可以或許可以得到不少啟發。


其中重要的一點就是,我們可以通過對疫情數據的準確的、及時的而且新穎的描述來提升公眾對於疫情的認識,形成防控的凝聚力和共識。


疫情防控最基本的落腳點是個人。在疫情突發的時候,各種真真假假的信息潮水般湧來,一個簡潔明瞭而且結論清晰的圖形,尤其是當它的呈現形式相當特別的時候,很容易受到廣泛傳播而形成防控的共識。比如,丁香醫生網站的疫情數據實時動態,迄今為止已經有超過35億次的瀏覽量,影響非常大。又比如人民日報出的一系列的新型的玫瑰花瓣圖就受到了廣泛關注,這是南丁格爾的圖形的現代版。


可視化的統計學是如何提升公眾對疫情的認知的?


在全球疫情數據呈現方面,美國約翰霍普金斯大學開發的數據以及疫情分佈圖,現在平均每天點擊次數近10億次,其核心圖形也是斯諾的霍亂分佈地圖的現代版。


可視化的統計學是如何提升公眾對疫情的認知的?


在這方面,我們還可以進行很多有益的探索。比如下面一張圖形顯示的是全球主要國家每日新增死亡病例的變化情況(根據《金融時報》新冠疫情可視化結果仿做):


可視化的統計學是如何提升公眾對疫情的認知的?


現在全世界都對疫情的轉折點的判斷非常關注,而上圖綜合各主要疫情國家的歷史數據可以看到,在防控措施得當的重點國家或地區,大約30-40天左右可以看到疫情的回落。這個圖也可以做成動態圖如下:


可視化的統計學是如何提升公眾對疫情的認知的?


除了對基礎數據的呈現之外,我們也可以利用統計模型對疫情發展趨勢做出預測,再利用圖形對於關鍵結果進行可視化呈現

。在白宮新冠病毒工作小組新聞發佈會上,黛博拉·柏斯博士在總結美國當前疫情及未來趨勢時,全程使用的幾乎都是統計圖形,其中的一個關鍵的導致特朗普總統改變之前的在復活節之前放松管制,並將全國管制延期到4月底的一張圖,源自華盛頓大學健康度量與評估研究所Chris Murray教授的研究結果:


可視化的統計學是如何提升公眾對疫情的認知的?


該結果顯示,美國新冠疫情(每日新增死亡人數)的轉折點預計在4月中旬。這又是一個一張統計圖形改變重大決策的典型例子。


【教授簡介】 肖志國,復旦大學管理學院統計學系副系主任、副教授,研究方向:面板數據,縱向數據,測量誤差模型,廣義矩估計。


分享到:


相關文章: