冷知識:嘗試去了解機率學中的「不確定性」

“概率”這兩個字,除了課本以外,最常出現的地方也許就是天氣預報中的“降水概率”,也就是未來幾天下雨的可能性有多大。

在數學中,概率論是專門研究“可能性”的一門分支。它涉及的問題非常廣泛,內容遠遠超出了中學課本里那些刻板的習題。一切隨機或者不確定的事件,都是概率論研究的範疇。

上至氣象下至金融,甚至連“磁鐵的磁性怎麼來的”這種物理問題,都可以用概率的方法來研究。

但這門學科的誕生卻有些“不太光彩”。

來自賭博的問題

在1654年的一天早上,法國數學家布萊茲·帕斯卡收到了他的朋友貢博的一封來信。這位朋友自稱“來自梅雷的騎士”,也算是一位業餘數學家。他向帕斯卡提出了類似如下的問題:

兩位貴族A與B正在進行一場賭局,賭注是每人500法郎,兩人輪流擲硬幣,得到正面則A得一分,反面則B得一分,每一局兩人得分的機會相等,誰先得到6分誰就得到1000法郎。

兩人激戰正酣,比分達到2比4之際,B突然有事需要終止賭局。賭注應該如何分配才最公平。

冷知識:嘗試去了解概率學中的“不確定性”

這一類問題被稱為點數分配問題,早在16世紀就被研究過,但數學家當時的答案並不令人滿意,在一些極端情況下會給出非常不合理的分配方案。也許這位“梅雷騎士”也見識過現實中這種賭局引起的矛盾,他希望帕斯卡能夠解決這個問題。

帕斯卡對這個問題也很感興趣。他向另一位業餘數學家皮埃爾·德·費馬發去一封信討論這個問題。作為“業餘數學家之王”,費馬很快就給出了一個答案。

他認為,不能單靠賭局停止時的比分或者各自獲勝需要的分數來決定賭注的分配,而是應該考慮所有比賽的可能性中,雙方獲勝的比例。但列舉所有的可能性的計算量非常大,帕斯卡繼而提出了一個簡化算法,完美地解決了點數分配問題。

實際上,他們的解答相當於計算兩位玩家勝利概率的大小。在研究中,帕斯卡提出了“數學期望”的概念和著名的“帕斯卡三角形”(楊輝三角)。某個結果為實數的隨機事件的數學期望,也就是所有結果按照發生概率加權之後的平均值。

數學期望這個概念,掀開了概率論研究的序幕。

什麼是概率?

很多概率問題有著特別的結構。對於某個非常簡單的隨機事件,比如說擲硬幣,我們知道每種結果出現可能性的大小,這樣的事件被稱為“基本事件”。我們可以多次重複這些基本事件,假定它們發生的可能性不會改變,而且這些重複沒有相互影響。

如果我們將這些基本事件以合適的形式組合起來,就能得到一個更為複雜而有趣的系統。許多概率問題實際上就是對這些隨機系統的各種性質的研究。比如說,在點數分配問題中,基本事件就是硬幣的投擲,而系統則是賭局的具體規則,最後我們希望知道的則是每一方勝利的可能性大小。

在概率論發展的早期,數學家研究的問題大多比較簡單,基本事件只有有限幾種結果,組合的方式也相對簡單。這樣構成的隨機系統又叫古典概型。隨著數學的發展,數學家開始考慮更復雜的模型。

18世紀的法國數學家布豐提出了這樣一個問題:在數條間隔相等的平行線之間,隨機投下長度與間距相等的一根針,它與這些平行線相交的概率是多少?在這裡,因為角度與距離都是連續的值,基本事件有無數不同的結果,這樣的隨機系統被稱為幾何概型。

早在19世紀,概率論已經成為了一門枝繁葉茂的數學分支。有趣的是,“概率”這個概念的嚴格定義要等到20世紀才出現。對於古典概型,因為結果數量有限,概率的定義並沒有含糊之處,但幾何概型的情況更為複雜。

考慮這樣的一個問題:圓中的一條隨機的弦,它的長度比圓內接正三角形的邊長更長的概率是多少?這個問題又叫貝特朗悖論,它奇怪的地方在於,對於不同的選取“隨機的弦”的方法,得到的概率也不相同,到底誰是誰非?

要等到1933年,俄國數學家柯爾莫哥洛夫為概率論建立公理體系之後,這個問題的解答才變得昭然若揭。

柯爾莫哥洛夫將概率模型建立在某一類所謂的“σ代數上的測度”上,這樣的測度可以有很多種,不同的測度對應著不同的“隨機”。而在貝特朗悖論中,選取隨機弦的方法實際上對應著不同測度的選取,也就是不同的“隨機”概念,那自然會得到不同的結果。

冷知識:嘗試去了解概率學中的“不確定性”

而到了現在,概率模型的種類越來越多也越來越複雜,系統可以包含無限個基本事件,而具體的組織方式也更復雜更有趣。隨機圖、滲流模型、自迴避行走,這些概率模型早已不能用古典概型和幾何概型來概括。

也正因為有了這些複雜的模型,我們才能用概率論解決現實世界的種種難題。

無處不在的分佈

如果讓數學家評選概率論中最重要的定理,桂冠可能非中心極限定理莫屬。它不僅是概率論中許多重要結果的基石,在別的學科中,尤其是計算機科學,它也有重要的應用,而在現實生活中,它是整整一個行業賴以生存的理論基礎。

中心極限定理其實不止一個,可以說它是一連串定理的總稱。它可以看作所謂“大數定理”的細化與推廣。假設我們有一枚硬幣,它擲出正反面的概率相等。那麼,如果我們連續拋擲這枚硬幣一萬次,常識告訴我們其中大概有五千次是正面。

這就是大數定理:對於某個基本事件獨立地重複多次的話,某個可能性發生的次數佔總數的比例會趨近於這個可能性發生的概率。

與大數定理不同的是,中心極限定理處理的是那些結果是實數的隨機基本事件。它告訴我們,如果將許多相同而又獨立的基本事件的結果取平均的話,這個平均值會趨向某個概率分佈。

根據大數定理,這個分佈的數學期望就是基本事件的數學期望。而中心極限定理額外告訴我們的,就是這個概率分佈必定是一個所謂的“正態分佈”,而它的方差,也就是概率分佈的“分散”程度,是基本事件的方差除以事件數目的平方根。

也就是說,基本事件越多,平均值的不確定性就越小。將這個正態分佈畫成曲線的話,它就像一個大鐘,中間高,但兩頭呈指數衰減,這也為它贏得了“鐘形曲線”這個形象的名字。

中心極限定理可以推廣到取值範圍是高維空間中一點的情況,“相同的基本事件”這個要求也可以被更弱的條件代替,只需要基本事件滿足某些要求,而不需要完全相同。

冷知識:嘗試去了解概率學中的“不確定性”

正態分佈在自然界中隨處可見,比如說人的身高和智力都服從正態分佈。這是因為自然界中的很多現象都由各種因素千絲萬縷的聯繫而決定,其中沒有特別突出的因素。

比如說人的身高,除了由許多不同的基因調控以外,後天的營養、環境、健康,甚至偶然的意外,都有著各自的影響。

在這種情況下,如果將每個因素看成一個基本事件,並且假定這些因素各自的影響都差不多,將這些因素綜合考慮,根據中心極限定理,得到的結果就非常接近正態分佈。

中心極限定理也是保險這一整個行業的基礎。每個人都會遇到各種各樣的風險,比如事故、疾病等等,這些風險發生的概率都很低,但一旦發生,後果非常嚴重,並非每個人都能承受。

而保險業,實際上就是通過保費與保險賠付的方式,將上千萬人連結起來,每人付出相對小的代價,在萬一不幸襲來時,就能獲得一定的保障。

由中心極限定理,這樣由數量龐大的個案相加而成的保險業務,由於偶然因素導致無法賠付的概率非常小,而且參與的人數越多,風險就越小。

為了確定保費與賠付,保險公司要做的就是根據大量統計數據精確地確定意外發生的概率,然後根據意外概率與收益確定保費與賠付的金額。這也是為什麼現代的保險公司越來越重視概率與統計。

理解複雜世界

除了與不確定性相關的問題之外,概率論也與物理息息相關。法國物理學家皮埃爾·居里在攻讀博士學位時,就發現了磁鐵的一個有趣的性質:無論磁力多強的鐵製磁鐵,在加熱到770攝氏度時,都會突然失去磁性。這個溫度後來被稱為鐵的居里點。

為什麼磁鐵會突然失去磁性?通過概率論與統計物理,我們現在明白,這種現象與冰雪消融、開水沸騰相似,都屬於相變的範疇。

我們可以將磁鐵裡的鐵原子想象成一個一個的小磁針。在磁鐵還有磁性時,這些小磁針齊刷刷地指向同一個方向,但因為分子熱運動的關係,每個小磁針都會時不時地動一下,但很快會被旁邊的小磁針重新同化。

物理學家將這個場景抽象成所謂的伊辛模型,通過對伊辛模型的研究,概率學家發現,當溫度達到某個臨界值時,整個體系就會由於熱運動而不能保持統一的指向,也就是失去磁性。

這個臨界值就是居里點,而這樣的對伊辛模型的研究也部分揭示了磁鐵的一些微觀結構的成因。

冷知識:嘗試去了解概率學中的“不確定性”

相變不僅僅侷限於物理現象。流言的傳播,傳染病的爆發,還有微博的轉發,都是一種相變過程,都存在某種臨界值。

比如說傳染病,在適當的模型下,如果每個病人傳染人數的平均值低於某個臨界值,那麼疾病就能被控制;如果高於臨界值,就很可能導致疫病的全面爆發。

對於疾病傳播的研究,屬於流行病學研究的範疇,而在概率論被引入流行病學研究之後,我們對如何防止與控制疫病爆發有了更深入的瞭解,這是能挽救成千上萬人的知識。

概率論的應用遠遠不止這些,大至飛機失事搜救,小至垃圾郵件過濾,都能在其中找到概率論的身影。這個複雜的世界充滿了不確定性,有些無傷大雅,有些卻能致命。要駕馭這些不確定性,就要從瞭解它們開始。這就是概率論的意義。

概率論不能為我們帶來一個沒有風險的世界,但它卻能教會我們如何與風險和平共處。它帶來的僅僅是關於不確定性的知識。

但知識,往往就是力量。


分享到:


相關文章: