用貝葉斯的眼光看待世界

人們熱衷於找到與事實相符的解釋,而且越符合越好。但這對於我們瞭解周圍的世界來說,往往是種糟糕的方式。

想象一下,年輕健康的你正在醫院接受定期體檢。醫生為你做了一項排查罕見疾病的新檢查。患此病的人很少,只有約2.5%,但最好還是通過檢查來確保自己沒事。這個檢查本身也有高達80%的準確率。

但就是那麼不幸,你的檢查結果呈陽性。對此你會作何感想?大部分人都會對此感到憂心忡忡。因為最符合對這一事實(陽性結果)的解釋顯而易見——你得了這種病。陽性的檢測結果表明,你患有此病的可能性(80%)比沒有患此病的概率(20%)要大得多。

但這種擔心並非是全然合理的。假設圖中的200個點代表200個人,你是其中之一,但不確定你是哪一個。5個紅點代表著2.5%的患者。


用貝葉斯的眼光看待世界

讓我們對每個人都進行檢測,並用圈圈出檢測結果為陽性的人。因為這項檢測的準確率為80%,因此我們從5例陽性結果中圈出4例(80%),再從195例陰性結果中圈出39例(20%)。


用貝葉斯的眼光看待世界

這時,你會發現在這個圈中的43人裡,像你一樣患有此病的人只有4人(約9%);其餘的都是假陽性。

貝葉斯概率考慮的是能夠造成你眼前的證據的不同可能性。就你的情況而言,可以是:

  • 你患有此病,經正確檢測後結果呈陽性。這種情況發生的概率是2.5% x 80% = 2%,即概率為1/50。
  • 你沒有患病,檢測錯誤報告了陽性結果。發生這種情況的概率是(1-2.5%)x 20% = 19.5%,約為1/5。


貝葉斯推斷會比較這些事件的概率,看看哪種情況更有可能。在這種情況下,你沒有患病的可能性是你患病可能性的10倍。

在犯罪學、產品推薦、人工智能,以及最近在搜尋失蹤的馬航MH370航班時,都會用到貝葉斯定理。對於馬航事件,被考慮的不同可能性的數量是非常巨大的,它涉及到無限個潛在的墜機點範圍。雖然數量巨大,但計算原理是完全相同的。

假設有一個巨大的搜索位置網格,每個位置都有一個先驗概率。這些概率可以是基於飛機的燃料水平和最後的已知方向而計算得出的。MH370也曾與一顆衛星進行過通信,國際海事衛星組織的人員也利用這些數據來縮小搜索範圍。

用貝葉斯的眼光看待世界

對於搜索空間中的每個區域,我們根據“如果飛機在那個地方墜毀,會有多大的可能性能看到衛星數據”,來將每個搜索區域與一個數字聯繫起來:這個數字就是似然(likelihood)。貝葉斯推斷告訴我們,將似然乘以先驗值,就能得到後驗值。後驗值告訴了我們搜索空間中每塊格子的相對重要性:搜索人員可以從後驗值最高的區域開始搜索。如果沒有在這片區域找到飛機,那麼這就可以作為證據用來更新與每個搜索區域相關的概率。

用貝葉斯的眼光看待世界

這是一個非常簡單,但卻異常強大的方法。而且如果有天當你的醫生告訴你一些壞消息後,想想貝葉斯推斷,或許能讓你感到安心一些。

文:Robin Evans

譯:二宗主

原文鏈接:

https://www.maths.ox.ac.uk/about-us/life-oxford-mathematics/oxford-mathematics-alphabet/b-bayesian-inference


分享到:


相關文章: