冠狀病毒:疾病背後的數據

TDS播客上的Jeremy Howard

冠狀病毒:疾病背後的數據

編者注:邁向數據科學播客的"攀登數據科學階梯"系列由傑里米·哈里斯(Jeremie Harris)主持。 Jeremie幫助運行名為SharpestMinds的數據科學指導初創公司。 您可以收聽以下播客:

1月中旬,中國對湖北省的一系列異常肺炎病例進行了正式調查。 在不到兩個月的時間裡,這一系列病例將迅速發展成一場全面的大流行病,全球範圍內將有數十萬甚至是數百萬的感染,並可能釋放出自1918年西班牙流感或大蕭條以來從未出現過的經濟破壞浪潮蕭條。

導致我們從少數幾個孤立的感染髮展到今天的指數式增長,與我們的直覺完全相反。 這對需要遏制冠狀病毒傳播特徵的流行病學家,必須根據其建議行事並說服一般自滿的公眾實施挽救生命的社會疏遠措施的決策者提出了許多挑戰。

隨著冠狀病毒傳的盛開,我認為現在是接觸極受歡迎的Fast.ai機器學習教育網站的聯合創始人傑裡米·霍華德的好時機。 傑里米(Jeremy)與他的聯合創始人瑞秋·托馬斯(Rachel Thomas)共同撰寫了一份近期病毒報告,概述了有關冠狀病毒的數據驅動案例。 在聊天過程中,我們涵蓋了很多領域,以下是一些關鍵要點:

· COVID-19病例的指數增長具有許多違反直覺的後果,其中之一是難以估計可靠的死亡率。 許多幼稚的估計要麼通過低估真實病例(包括無症狀和症狀前攜帶者)的數量高估了死亡率,要麼由於沒有考慮到感染檢測和威脅生命的症狀發作之間的延遲而低估了死亡率 。 歸根結底,獲得合理估計的唯一方法是依賴生存分析之類的技術,這些技術旨在與受檢查的數據一起使用(尚不清楚正在進行中的病例的結果)。

· 貝葉斯模型在處理呈指數級失控的問題時非常重要:低估病毒生長係數10%可能意味著數百萬個感染之間的差異,造成可能病例數非常長的尾巴,這會產生嚴重影響 醫療保健系統避免崩潰的能力。

· 在這種情況下,來自學術界和政府的清晰溝通尤為重要。 這意味著,良好的數據可視化和清晰的統計效果描述對於確保不會誤導人群所面臨威脅的性質極為重要。 傑里米(Jeremy)以最新研究的形式指出了這個問題的一個重要例子,該研究顯示冠狀病毒的傳播具有明顯的季節性,但利用不良的數據可視化來闡明其觀點,從而導致了不值得的懷疑。


(本文翻譯自Jeremie Harris的文章《Coronavirus: the data behind the disease》,參考:https://towardsdatascience.com/coronavirus-the-data-behind-the-disease-68c912f1a5e0)


分享到:


相關文章: