美國到底會死多少人?英美的數據預測為何會失靈?

來源:一小時爸爸

今天,全球新冠疫情感染人數突破300萬,死亡人數突破20萬。


美國到底會死多少人?英美的數據預測為何會失靈?


我們最近總會花些時間去分析歐美國家遇到的防疫問題,分析背後可能存在的原因,但並不是為了和大家一起吃瓜 —— 一方面疫情是全球人類一起面對的問題,其他國家一天不解決這個問題,我們也沒有辦法回到正常的生活中。另一方面,它山之石可以攻玉,它山的坑也可以幫我們避免同樣的錯誤。


美國到底會死多少人?英美的數據預測為何會失靈?


比如根據昨天公佈的數據,英國醫院NHS系統中因為新冠疫情死亡的總人數達到20319人,即便不算養老院、家中死亡的數字,英國此次疫情中的死亡人數也突破了2萬人,成為美國、意大利、西班牙、法國之後,第五個死亡人數突破2萬的國家。


美國到底會死多少人?英美的數據預測為何會失靈?


這同時意味著,在3月份,英國封城前,英國政府所預測的“希望將死亡人數壓低到2萬人”的樂觀目標破滅。雖然經過一個多月的封停,已經將疫情曲線壓平,但死亡數字仍在繼續攀升。


美國到底會死多少人?英美的數據預測為何會失靈?


樂觀目標破產的不只是英國,美國也是如此。


3月川普說過,美國死亡不超過10萬,就是“Good Job/好結果”,這說明當時美國政府對死亡人數的預期是在10萬左右,否則不會給自己埋雷。而之後隨著封停後死亡人數的增速放緩,美國政府變得更加樂觀。


4月9日Fauci博士在發佈會上稱,因為封停措施得力,根據數據模型預估的美國疫情死亡總人數下降,估計6萬人左右。但昨天美國死亡總人數已經達到53000,本月內很可能會突破6萬。因此可以說,美國政府的樂觀目標也已經失敗。

美國到底會死多少人?英美的數據預測為何會失靈?


樂觀目標的失敗會帶來很多相關的問題,可能一些原本既定的政策會出現錯誤,可能會對民眾心理造成重大打擊。這幾天,Fauci博士和英美政府都在受到強烈的質疑。這對於下一步的防疫、恢復經濟工作開展會造成不少負面影響。


而且更嚴重的問題,並不是樂觀目標線被突破,而是這其實說明了,美國政府對於疫情發展趨勢的評估機制出現了大問題。就在上週,美國死亡數字接近5萬的時候,川普在發佈會上依然大談:“雖然我們快到5萬了,但我聽說最終6萬就差不多了,這比我們之前預測的最少10萬死亡人數要少。”


美國到底會死多少人?英美的數據預測為何會失靈?


這種完全脫離實際的目標預估,將會直接導致美國防疫、經濟政策出現偏差。其實也說明了為什麼川普這麼熱衷於推進各州reopen,結束封停重啟經濟 —— 他認為既然預測的死亡人數最終是6萬人,那現在已經死到5萬了,不是說明疫情要結束了麼?


這種數據預測的錯誤,已經導致了很多美國防疫措施以及社會輿論的混亂。右翼民眾將責任歸結於專家團隊,天天要Fire Fauci;而左翼民眾自然認為是川普又蠢又壞,已經直接在華盛頓川普酒店門口擺裹屍袋來抗議。


美國到底會死多少人?英美的數據預測為何會失靈?


從旁觀者的角度,英國、美國政府對於死亡人數預期的失誤,並不是川普或者鮑里斯騙人這麼簡單,因為這些預估數字,的確是來自他們背後的疫情專業團隊。那是什麼原因導致了他們對於疫情的評估判斷出現這麼大的偏差呢?


美國到底會死多少人?英美的數據預測為何會失靈?


美國的預測數據出現極大偏差,但並不是因為數據是政客們拍腦門想出來的。相反,這些預測主要來自一些專業機構的預測數據。


美國在防疫上的一個很大風險,就是在於從聯邦政府到地方政府,在制定政策的時候,需要多少ICU床位,是關停還是解封,主要都是參考一些研究機構的數據模型作出的預測分析。這種數據說話的方法本身值得讚賞,但問題是當參考的數據模型出了問題,就麻煩了。


這次疫情中做數據模型的機構不少,但主要被美國政府用來做數據支持的是華盛頓大學UW的衛生計量與評估研究所/The Institute for Health Metrics and Evaluation (IHME)。IHME其實算是在這方面很專業的機構了,但可惜的是這次IHME的預測大失水準。


IHME數據預測的bug問題已經成為美國學術界以及全民熱議的問題之一,因為前幾年蓋茨基金會捐了幾億美元來支持他們,現在不出意外的,IHME也成為反蓋茨陰謀論的一部分了。但其實IHME在不同預測上的錯誤有正有負,比如一方面多估計了紐約對ICU病床的需求,一方面又少估計了全美的死亡數字,這種忽高忽低,其實倒是能排除他們認為被幹預想故意黑美國的可能。


有人統計了4月上旬IHME對於美國死亡人數預估曲線的變化,可以有趣的看出一個數據模型是怎樣不斷調整,以今日之我向昨日之我開戰的。做科研敢於承認錯誤修訂當然是必要的,但這種大幅度變化的預估數字,實在很難作為制定政策的依據。


美國到底會死多少人?英美的數據預測為何會失靈?


不只是對於美國數字的預期,對於其他國家的預估數字,IHME也基本沒怎麼對過。下圖是4月初IHME對於意大利和西班牙的預估曲線(實線),以及實際數據(點)的對比,也可以看到,他們的預估死亡數字均遠小於實際情況。


美國到底會死多少人?英美的數據預測為何會失靈?

因此,雖然依照數據和模型分析來制定政策是一個正確的選擇,但這樣的前提是模型本身是正確的。像這次一樣,IHME的數據模型本身存在比較大的缺陷,而依據這些結果給出的建議去制定政策,就有麻煩了。


為什麼IHME的預估模型出現如此大的問題呢?


美國到底會死多少人?英美的數據預測為何會失靈?


我們先來看一下IHME對於美國疫情每日新增死亡人數的曲線,它最大的問題就是 ——這條曲線太對稱了。

美國到底會死多少人?英美的數據預測為何會失靈?


IHME的疫情曲線往往呈現出左右對稱的模式,也就是上升快,下降快,這很可能是因為IHME在搭建模型的時候,只有東亞各國和地區的疫情數據可以參考。


我們對比一下中國、韓國和意大利的新增死亡3日平均曲線走勢,可以看到,三個國家在曲線上升階段是比較相像的,這主要是來自病毒的共性,但在下降階段,區別就很大了。因為下降的速度更多取決於防疫措施是否嚴格,是否能快速切斷傳播。


美國到底會死多少人?英美的數據預測為何會失靈?


看三個曲線的差異,可以發現:封停最嚴格的中國的確比較對稱,相對嚴格的韓國也比較對稱,但封停措施更鬆散的意大利,曲線就是明顯的上升快下降慢。而相對於Hard模式的東亞國家曲線,美國其實更應該參考意大利的非對稱曲線。事實上,其他歐洲國家,以及美國大部分地區所展現出來的曲線趨勢,也是類似意大利這種。


而在IHME搭建模型的時候,歐洲的數據還沒有清晰,所以當時的模型只有東亞曲線可以參考,用它來推導美國的抗疫,自然錯誤百出。而後在歐洲數據多起來之後,IHME模型多次調整,但大家對它的信心也隨之逐漸下降。


新冠是一個新病毒,人類對它的傳播模式,致死率等各方面都缺乏瞭解。尤其在疫情爆發,全球抗疫的背景下,疫情曲線是和政策有高度相關性的,目前各個國家所採取的政策或多或少有所差異,各個國家的自然環境、社會屬性也有很大差異。在這樣複雜的情況下,想給出準確的數據預測是很難的,這需要各國進行透明的數據共享,從全球的視角來進行數據研究。


但此次疫情所顯示出來的一個嚴重問題是:面對全球化的疫情,各國都是基本靠自己,缺乏統一協調,不互相搶物資的就算好夥伴了。


而原本應該主要做控制流行病工作的WHO,並沒有管理和組織全球,尤其是是協調歐美亞發達地區抗疫的能力。不可能有哪個國家真的聽WHO的話,能不像美國那樣把WHO當甩鍋對象已經很好了。其實WHO有點像一二戰之間的國聯,雖然川普天天鬧著要不給錢,但這次疫情之後,一個很可能的改變方向,就是WHO的實權化,從國聯向聯合國的方向逐漸變化。不過這是另外一個話題了,今天不扯太遠。


美國到底會死多少人?英美的數據預測為何會失靈?


最後,到底美國的疫情最終會造成多少死亡呢?其實每個人都可以從現在的數據去嘗試搭建自己認為合理的數據模型,來進行推斷。


我們自己也做了一個嘗試:用“拐點日”,也就是單日確診時間最高的那一天來作為一個關鍵值帶入分析 —— 拐點意味著這個國家的疫情得到了控制,從上升轉為下降。


但因為患者的死亡不會“即時”發生,因此死亡人數的增長會有滯後,下降階段的死亡人數會超過上升階段。現在歐美各國基本都出現了拐點,那麼評估一下拐點的情況,可以粗糙的分析最終可能出現的死亡人數。


美國到底會死多少人?英美的數據預測為何會失靈?


我們根據疫情發生階段,用中韓、歐陸四國以及英美的數據來進行對比:取在3日平均曲線上出現拐點那一天,記錄當時死亡總人數,再對比現在的總死亡人數:


美國到底會死多少人?英美的數據預測為何會失靈?


可以看到,疫情基本結束的中韓兩國,目前總死亡人數是拐點日的8倍,已經下行一段時間的歐陸國家,是4-5倍,美國和英國則是2.8和1.9。(英國的數據比較奇怪,確診最高和死亡最高几乎同時出現,其他國家都是滯後1-2周,感覺不太對勁)


從這個數據來看,美國未來還有比較漫長的路要走,無論是按照歐洲的情況對比,還是按照東亞,最終的總死亡人數都會突破10萬,甚至有可能達到15萬人。從這個角度來看,川普的“good job”想達成,很難。


當然,預測只是預測,無論如何,我們都希望未來會比我們預測的更好,而不是相反。



分享到:


相關文章: