冷知識:瞭解概率論——從賭場莊家不輸錢談起

經常有人說“概率是毫無意義的事情,如果事情發生了,概率就是百分之百,如果沒有發生,就是零”。這樣的想法是對概率完全錯誤的理解。

為了解釋概率,我們從賭場坐莊開始。

冷知識:瞭解概率論——從賭場莊家不輸錢談起

我們知道開賭場幾乎沒有輸錢的。儘管有人從賭場贏了錢,但是輸的人更多。很多人認為是賭場有“賭神”,或者賭場能“出老千”,其實都不是,賭場贏錢的原因在於概率的應用。

換句話說,概率決定了賭場是佔便宜的一方。賭客越多,賭場就越不容易輸。

我們來玩一個遊戲:如果有14張牌,其中有一張是A;現在我來坐莊,一塊錢賭一把,如果誰抽中了A,我賠他10塊錢,如果沒有抽中,那麼他那一塊錢就輸給我了。有人賭嗎?

這樣的一個賭局,為什麼說我佔了便宜呢?因為在抽之前,誰也不知道能抽到什麼,但是大家可以判斷抽到A的可能性要小得多,14張牌中才有一張,換句話說概率是十四分之一,而抽不中A的概率是十四分之十三。概率就是這樣一個對未發生的事情會不會發生的可能性的一種預測。

如果你只玩一把,當然只有兩種可能:抽中了贏10塊錢,沒抽中輸一塊錢。但是,如果你玩上幾百幾千甚至更多把呢?有的抽中,有的抽不中,幾千幾百把的總結果是什麼樣的呢?

數學期望

這是概率上的一個概念,叫做數學期望。可以理解成某件事情大量發生之後的平均結果。

現在我們來看上面的那個例子,抽中的概率是1/14,結果是贏10塊錢(+10),抽不中的概率是13/14,結果是輸1塊錢(-1)。把概率與各自的結果乘起來,然後相加,得到的"數學期望"值是(-3/14):

  • 如果你玩了很多很多把,平均下來,你每把會輸掉(3/14)塊錢;
  • 如果抽中A賠13塊錢,那麼數學期望值是0,你玩了很多把之後會發現結果最接近不輸不贏;
  • 如果抽中A賠14塊錢,那麼數學期望值是1/14, 對你有利,大量玩的結果是你會贏錢,我當然不會這麼設賭局。

賭場的規則設計原則就是這樣,無論看起來多麼誘人,賭客下注收益的數學期望都是負值,也就是說,總是對賭場有利。因為有大量的人賭,所以賭場的收支結果會很接近這個值。

冷知識:瞭解概率論——從賭場莊家不輸錢談起

比如美國的輪盤賭,38個數隨機出,你壓一個,壓中了賠你35倍,沒壓中你的錢輸掉。其它的賭局規則可能更復雜——比如21點,但是背後的概率原理是一樣的,就是賭客的數學期望值是負數。

像我們通常見到的彩票,如果所謂的返回比是55%的話,那麼花一塊錢的數學期望是賠掉0.45塊。無論是賭場還是彩票,幸運兒的產生必定伴隨著大量獻愛心的人。賭場和彩票生意興隆的基礎,是每個人都認為自己會是那個幸運兒。

數學期望是作理性決策的基礎

我們做任何一項投資,做任何一個決定,都不能只考慮最理想的結果,還要考慮到理想結果出現的概率和其他結果及其出現的概 率。否則,如果只考慮最理想的結果,大家都應該從大學裡退學--從大學退學的最理想結果是成為世界首富,那個叫比爾蓋茨的傢伙。

概率問題的關鍵是隨機性,比如扔一個硬幣,誰也無法預測是正面還是反面。同樣,擲骰子、搖獎也是。

有個最搞笑的職業叫“彩評家”,號稱分析彩票號碼的規律, 預測下一期最可能的號碼。

電視裡的“彩評”節目往往是專家侃侃而談,主持人做興致盎然崇拜狀。

經常聽到的話是“這幾個數字前兩期出現了,根據概率,下一期 不大可能出現”。

這可以稱之為一本正經地胡說八道。按照概率理論,兩件不相干的事情都發生的概率是各自發生概率的乘積,所以兩件不相干的各自概率為萬分之一的事情都發生的可能性是一億分之一。但是,如果一件已經發生了,那麼另一件發生的概率還是萬分之一,跟已經發生的事情無關。

只要彩票的搖獎沒有醜聞,那 麼中獎數字是無法預測的。不管前幾期出現了什麼號碼,下一期的號碼仍然是隨機的。出現過的數字不會避嫌,沒出現過的數字也不受到照顧。

不過觀眾還是會覺得“彩評家”的“預測”是對的,因為他說不會出現的號碼後來確實沒有出現。其實這種“彩評家”每個人都可以當——你隨便寫幾個數,說“下一期這幾個數不會出現”,再找個神神叨叨的理由,你也就成“大師了”。因為你不管你寫什麼數字,中彩的可能性都是非常非常小的。

據說概率是起源於賭場的學問,但是它的價值已經遠遠超出了賭博。

這裡舉一個很現實的把概率知識轉化成經濟效益的例子:要在人群中普查一種病,檢查方式是抽血檢測其中是否含有某種病毒,這種病在人群中的發生率比較低,比如說1%。對於這樣的一種普查,成本最高的地方是檢測血液,如果能減少血液檢測的數量,就能節約大量成本。我們很自然地想到抽每個人的血,然後檢測,這樣有多少人就驗多少份血,簡單明瞭。

冷知識:瞭解概率論——從賭場莊家不輸錢談起

為了形象起見,假設有1000萬人,那麼直接檢測的方案是測1000萬份血。現在我們換一下思路,把抽來的血兩兩混合,送去檢測,如果檢測結果陰性,表明原來的兩份血都沒問題;如果結果陽性,表明至少有一份血有問題,就把兩份都重測。這樣也可以確定每個人的帶病情況。

這樣作的總檢測量是多大呢?兩兩混合之後,要檢測500萬份,然後結果陽性的那些重測,大概是20萬(1000萬人的1%是10萬人帶病,導致20萬份血重測),總共檢測520萬份的樣子。實際上還有一部分陽性的樣品是混合的兩份血都帶病,這樣實際的陽性結果比10萬份還要少。

總之我們看到,檢測總數幾乎減少了一半,能省很多錢了吧?如果把10份血混一起再測呢?同樣的分析,先要檢測100萬份,加上結果呈陽性的最多10萬份混合樣品重測——共100萬份原始血樣需要重測,總共最多檢測200萬份就搞定了。

在這個例子裡,多少份血混在一起最划算,取決於人群中的發病概率,跟要檢測的總人數無關。另外一個考慮因素是血樣混合之後,病毒濃度被稀釋了,是否還能被檢測出來。

綜合考慮這些因素,運用概率和並不複雜的優化計算,可以精確地算出把幾份血樣混在一起最省錢而又能完成任務。


分享到:


相關文章: