世界是受控的幻覺:大腦根據貝葉斯概率預測來認識世界嗎?

根據貝葉斯腦理論,為了在錯綜複雜的世界生存,大腦積極地收集外部信息,進行概率計算和推理預測。我們所看到的的“現實”,其實是基於大腦對世界形成的假設形成的,是大腦構築的“幻覺”。

作者 | Manuel Brenner

翻譯 | Yael

審校 | 酷炫腦主創 & 小草

美工 | 豆漿

世界是受控的幻覺:大腦根據貝葉斯概率預測來認識世界嗎?

hackernoon

要是你們能夠洞察時間所播的種子,知道哪一顆會長成,哪一顆不會長成......

——《麥克白》,威廉·莎士比亞

生活充斥著不確定性,沒有人可以預知未來。正如布萊士·帕斯卡(Blaise Pasca)所說,

我們航行在遼闊無邊的區域裡,永遠沒有把握地漂流著,從一頭被推到另一頭。(we sail within a vast sphere, ever drifting inuncertainty, driven from end to end)

沒有人知曉死亡何時會降臨,生活何時會帶給我們苦難,又在何時給予回報。

儘管不得不在人生的某個時刻裡沉悶地接受這個教訓,但我們依舊在這個由不確定性組成的世界裡取得了了不起的成績。我們買房,在銀行賬戶攢錢,為了退休金和子女存錢。我們建立穩定的人際關係,紀念每一段感情。我們掌控著,也理應掌控著正在發生的事。

對於像我們這樣從隨機混亂且異想天開的進化中生存下來的生物來說,能做到這樣已經很了不得了。那麼在不確定的未來面前,我們是如何感知到“確定無疑”的呢?

貝葉斯腦假說(The Bayesianbrain hypothesis)主張我們的行為背後隱藏著一種機制,其根源可以追溯到生命的本質。該假說認為,在某種意義上,除了預測未來和實現這個預測到的未來之外,大腦幾乎沒有做任何其他的事,此外,它還和生物系統一起,與大自然為它們準備的意外“驚喜”長期不懈地艱苦戰鬥著。

世界是受控的幻覺:大腦根據貝葉斯概率預測來認識世界嗎?

thenegativepsychologist

01 穩態的必要性

穩態(Homeostasis)是所有生命體遵循的一條基本法則。它衍生於拉丁語homeo(equal,平等的)和 stasis(to stand still,靜止不動),由沃爾特·布拉福德·坎農於 1926 年創造出來。穩態是生物系統內部生理和化學過程的動態平衡,這有利於維持生物系統的完整和效率。這是一種自我調整的原則,用來應對自然界的無秩序特徵。

安東尼奧·達馬西奧(Antonio Damasio)在他的《事物的奇怪秩序》(The Strange Order of Things)一書中指出這一概念有所偏頗,穩態的內涵遠遠高於“靜止不動”(standstill)。生命的特性是自我實現的(self-realizing),而不是僅僅滿足於維持眼下所擁有的功能。

如果有兩種存在競爭的有機體擺在你面前,一個滿足於它目前所擁有的一切,另一個則為了未來而不斷優化,你認為哪一個更有機會生存幾百萬甚至幾十億年?如今,我們發現生命其實一直在“默默地推動自己到達更遙遠的未來”,因為它在過去進化出了更有利於在未來繼續生存的特性。

像車輪一樣滾動,保持呼吸,向前走。

世界是受控的幻覺:大腦根據貝葉斯概率預測來認識世界嗎?

artistsandillustrators

人們一直試著預測和改變未來。在古代,算命占卜是專屬於司祭和巫師的精妙手藝。德爾斐神諭(the Oracle of Delphi)大概是最出名的一個例子了。希臘政治家和羅馬皇帝千百年來都會向它求教。古時的政治充滿了各種不確定性,我們不應對人們想要減少這種不確定性的訴求太過苛刻。

但是從現代科學的角度來看,我們已經知道,在恍惚的狀態下吸入毒性氣體和打謎語不可能會讓我們真正瞭解到世界的運作機制。為了減少對未來的不確定性,我們(和我們的大腦)需要採取更接地氣的方法,以掌握的知識為基礎預測未來。根據我今天對世界的觀察,我能預計明天會發生些什麼呢?為了獲得最有利於生存的結果,我又該如何行動?

*譯者注:據記載,傳達德爾斐神諭的先是一位名叫皮提亞的女性,她在預言時周身被岩層裂隙中冒出的神秘氣體環繞,進入一種瘋癲的、疑似被上身的狀態。目前有學者經過研究提出這種氣體可能是乙烯類物質,對人產生了麻痺作用。

02 貝葉斯定理

在 18 世紀,備受尊崇的托馬斯·貝葉斯(Thomas Bayes)提出了一個小定理,雖然貝葉斯沒有在在世時把它發表出來,它卻在後來的許多領域中發揮了巨大作用。這個定理很簡單,但並不妨礙它使貝葉斯成為現代認知科學中最出名的人物。

在下圖中我們可以看到它的藍色發光版本:

世界是受控的幻覺:大腦根據貝葉斯概率預測來認識世界嗎?

Bayes’ theorem | mattbuck (category) [CC BY-SA 2.0]

貝葉斯定理描述的是在 B 為前提條件的情況下, A 發生的概率等於以 A 為前提B的發生概率,乘以 A 發生的概率,再除以 B 的發生概率。

它給出了在我們已知其他相關條件發生的概率時,某特定事件的發生的可能性。

希望你已經猜到為什麼這個公式會在預測未來時能派上用場。

作為“變幻無常”的代名詞,天氣是冷酷無情的大自然用來打擊我們的最直接的方式,也是應用貝葉斯定理的絕佳案例。

世界是受控的幻覺:大腦根據貝葉斯概率預測來認識世界嗎?

Photo by Elliott Engelmann on Unsplash

我們假設一下這樣的情景:你外出散步,但出於某些原因迷失在乾旱無邊的沙漠中。原本只是計劃在公園裡走走,所以你身上只帶了一小瓶水。過了三天後,你已經乾渴難耐。在這天早上你抬頭仰望天空,驚訝地發現在地平線上,有一小朵雲。那麼,有多大的可能性會下雨,讓你免於渴死呢?

這裡要計算的概率就是P(Rain | Cloud),也就是當你看見雲朵時,沙漠會下雨的概率。我們需要的其他條件有:

1.P(Cloud | Rain):雨天的早上是不是都會出現雲呢?我們假設沙漠中80%的雨天早上都會出現雲朵,這就意味著在早上看見雲的話,這一天有很大幾率會下雨

2.P(Cloud):沙漠中會出現雲的概率非常小, 10% 左右。

3.P(Rain):下雨的概率就更低了。沙漠中每百天才會下一次雨,所以概率是1%。

所以你在沙漠中看見雲朵後,這一天會下雨的概率為:

P(Rain | Cloud) = P(Cloud | Rain)*P(Rain) / P(Cloud) = 0.8 * 0.01 / 0.10 = 0.08

可以說,看見雲朵後差不多有百分之八的概率這一天會下雨。希望很小,但聊勝於無。

世界是受控的幻覺:大腦根據貝葉斯概率預測來認識世界嗎?

reinertfineart

重要的是,在計算你需要的概率時,另外三個概率是必不可少的。丟棄任何一個都會明顯改變你的結果。

03 假陽性

貝葉斯定理可以幫助我們糾正假陽性(False Positive),比如說我們推測某個事件對結果是有意義的,但實際上它並不是。一個著名的例子就是癌症測試(或者任何其它罕見疾病)。

*譯者注:假陽性又稱為誤報、虛假肯定、偽正性。

假設只有 0.1% 的人口患有某種特定的癌症。你的醫生告訴你有一種新型改良的癌症測試,在患癌的情況下,它檢測的正確率為 90% 。缺點就是,當病人並沒有患癌時,它也會有大概 9% 的概率將病人檢測為癌症。

你是一個天生就對這個問題有些焦慮的人,你想通過做這個測試來緩解焦慮。最終你得到的結果是陽性。你害怕極了,畢竟你得癌症的概率是 90% 不是嗎?

不,不是的。你可以快速地運用貝葉斯定理來推算你患癌的真正幾率。請注意,在這種情況下,你需要區分真實肯定和虛假肯定的概率:

P(cancer | positiveresult)= P(positiveresult | cancer)* p(cancer)/(p(positiveresult)* p(cancer)+ p(falsepositive)* p(nothaving cancer))= 9.17%

所以你並不需要太擔憂(出於焦慮所以進行測試,想必肯定很難做到不擔憂),因為患癌的概率是很低的,檢測結果假陽性的幾率是檢測陽性且真患癌的概率的 10 倍。

04 用先驗概率預測未來

對預測未來有興趣的人來說,掌握事件發生的

先驗概率(prior probability)是很有幫助的。

在觀察天空或者進行癌症測試時,為了判斷一個事件(比如發現天上有云朵,或者癌症測試結果呈陽性)是否能幫助我們對另一個事件(比如下雨,或者真的患了癌症)進行預測,我們需要對下雨和患癌的整體概率進行描述。

我們的感官從外部世界收集到的信息會被大腦進行分類,在分類的同時,大腦會不停地計算概率。你可能在想為什麼它運作的方式跟貝葉斯定理有關。

假設你看到一個四條腿的動物在地平線上飛奔的模糊輪廓,它的前額上有一個長而尖的東西。

你的大腦有沒有自動得出這個動物是個獨角獸(unicorn)的結論?

世界是受控的幻覺:大腦根據貝葉斯概率預測來認識世界嗎?

這很可能不是個真的獨角獸 | PAndrea Tummons on Unsplash

如果你精神還正常,你可能不會得出這個結論,因為在出現獨角獸形狀物體的情況下,真的看見一個獨角獸的概率 P (unicorn | shape),是由獨角獸真正存在的先驗概率 P (unicorn)決定的,然而這個概率差不多是 0 。

05 用貝葉斯推斷建模世界

如果大腦想要對世界上的事件進行建模,尤其是未來的事件,那麼它需要有一個關於世界是如何運作的模型,以便理解世界會如何發展、變化。

在接收到有關世界現狀的新信息,比如新的樣本後,大腦需要更新這個內部模型。假設你時常在每天上下班的路上看見一個獨角獸,大概多久之後你會開始懷疑“世界上不存在獨角獸”這個說法是否成立?或者假設有 50 個人癌症測試結果為陽性,其中有 20 個真的得了癌症,對於只有 9.17% 的人才會真的患癌這個估計,你還有多大的信心認為它是對的?

世界是受控的幻覺:大腦根據貝葉斯概率預測來認識世界嗎?

the beekman school

在新信息的基礎上,以最優化統計的方式更新內部模型的概率分佈被稱為貝葉斯推斷(Bayesian Inference)。

我們在行為實驗中時常發現大腦會進行這種推斷,或者在將感覺輸入信息互相關聯時:有研究表明,在巴甫洛夫有關的刺激實驗中,不同刺激物之間的共有信息會優先被處理。

另一個例子來自於布里頓(Britten)等人於 1992 年做的視覺運動實驗,他們觀察到猴子在對視覺運動的一致性進行解碼時,它們的大腦對刺激物的神經反應速率十分接近於貝葉斯最優解碼速率。

事實證明,大腦會以我們已知的方式預測未來。

06 貝葉斯腦假說

現在我們可以深入討論貝葉斯腦假說(The Bayesian Brain Hypothesis)的內涵到底是什麼了。

貝葉斯腦存在於外部世界,並被賦予了這個外部世界的內在表徵。這兩者被所謂的馬爾科夫毯區分開來。

*譯者注:Markov blanket,也稱馬爾科夫覆蓋。馬爾科夫毯是貝葉斯網絡中的一個核心概念,可以理解為某個目標變量的最小特徵集,所有與目標變量有關的信息都包含在它的馬爾科夫毯中。馬爾科夫毯中的信息集與之外的集合相互獨立。

大腦會試著根據它自身生成的有關世界的模型,來推斷知覺的成因。為了成功地對外部世界進行建模,在某種程度上,它必須能夠模擬外部世界正在發生的事。用卡爾·弗里斯頓(Karl Friston)的話來說:

如果大腦要推斷感知覺產生的原因,那麼它必須有一個模型來描述引起感覺輸入的(潛在的)客觀情形之間的因果關係(聯繫)。進而神經組織會對參與產生感官信息的因果關係進行編碼(建模)。

世界是受控的幻覺:大腦根據貝葉斯概率預測來認識世界嗎?

卡爾·弗里斯頓(Karl Friston)| wired

這是理解貝葉斯腦假說的第一個關鍵點,也是一個深刻的觀點:大腦內部的世界模型證明,大腦的處理加工,是模擬外部世界運作的結果。為了成功地預測未來,大腦需要用自己的結構去模擬外在世界。這些過程需要遵循跟外部世界類似的因果關係,而且大腦自身還會對此進行觀察監督。

第二個關鍵點回到貝葉斯推理上:從某種意義上說,大腦是遵循最優化原則的,正如我們發現大自然也是朝著最優化方向發展那樣。

就像我之前提到過的,在對知覺內容進行分類,並在不確定的情境下做決策時,貝葉斯腦的工作狀態近似於貝葉斯最優水平。這意味著在對未來(潛在的)狀況進行預估時,它儘可能考慮到了所有可用信息和所有概率約束。

你可以給被優化的量取幾個名字,但實際上對各種理論進行深挖、整合後發現,不同觀點所指的被優化的量看似不同,其實內核都是一樣的。有一種考察方式就是把它看作證據(evidence),

在信息論中,證據等同於感官和內部世界模型共有信息的最大化。

07 自由能量最小化

我在寫自由意志的熱力學(TheThermodynamics of Free Will)這篇文章時,詳細地討論了卡爾·弗里斯頓有關主動推理(Active Inference)的理論。

自由能量(Free Energy)最小化是為了優化模型的信息或邊際似然性,弗里斯頓將自由能量的定義跟模型意外度(surprise of the model)的最小化聯繫在了一起(也就是儘量減少與你的內在世界模型不相符的體驗)。

該理論進一步將它的元素與生物系統相結合,比如說大腦,因為它可以對外界施加作用。你不該只是在腦中臆想未來,你能對外界施加影響,追求並實現自己的願望,主動地改變未來。

據弗里斯頓說,主動推理(ActiveInference,AI)跟人工智能(Artificial Intelligence,AI)“撞縮寫”並不是個巧合,他相信“在 5 到 10 年內,大多數的機器學習都將涵蓋自由能量最小化(Free energy minimization)

原理”。

這又令我們想起了達馬西奧對穩態的批判:

生命系統並不是靜止不動的,為了使意外最小化並在充斥著不確定性的未來中生存,它始終在對外界產生著影響。

世界是受控的幻覺:大腦根據貝葉斯概率預測來認識世界嗎?

就像永不停息的瀑布一般 | gtglobalcinema

最小化的自由能與熵(entropy)有關,因為意外度的時間平均值(time-average over the surprise)給出了熵的度量。這會造成物理性質的結果,弗里斯頓這樣說道:

貝葉斯腦在將它所掌握的證據最大化時,實際上也正在隱晦地將它的熵最小化。換句話說,它在對抗著熱力學第二定律,並在面對走向無序的自然界時,為生命系統的自組織(self-organization)提供了一個原則性的解釋。

*譯者注:熵是用來衡量系統混亂程度的量。根據熱力學第二定律,宇宙的熵會不斷增大到最大值,最後所有的一切都會變成無序、解體、無意義的狀態。但根據生物進化論,生命體從簡單形態自發進化到複雜形態,始終保持有序、有組織的狀態,與熱力學第二定律看似存在矛盾。有觀點認為生物通過與外界進行能量交互來增序減熵,避免走向混亂無序。

因此貝葉斯腦假說是一個有關基本問題的理論。它將大腦活動與穩態概念結合在了一起,解釋生命系統是如何在註定消亡的世界裡掙扎求存。

08 我們該如何考察貝葉斯腦?

其一是提出體系龐大的理論,其二是在大腦活動中尋找證據。如果大腦的確是按照貝葉斯腦假說的原理活動,那麼我們需要進一步瞭解大腦是如何實現貝葉斯推理的。

學者認為貝葉斯推理發生在從運動控制到注意和工作記憶等多種認知層面上。每個認知模塊都有各自的預期、內部模型和時間尺度。

有一個叫做預測編碼(Predictive Coding)的理論被認為很有希望揭開這個秘密,它的核心觀念跟貝葉斯腦是一致的:通過改變預測模型的參數,在相同事件發生時將(實際與預測的)差異最小化。有不少實驗證據支持了該理論,例如在詞彙預測實驗中發現了 N400 效應。

認知科學界逐漸認識到,大腦並不僅僅是一個被動接收外界信息並作出反應的探測器。它不斷地通過假設世界的真實模樣和預測未來,以自上而下的方式生成內部世界模型(這意味著低階的信息感知是在高階思維的指導下進行的,就像獨角獸那個例子一樣)。

這使得研究者們將現實描述成“受控的幻覺”(controlled hallucination),以 2018 年 Journal of Neuroscience 發表的文章為例,被試在讀過“kick”這個詞後,把耳邊播放的“pick”錯聽成了“kick”。

幻覺現實以一種可預測的方式帶給我們決定性的進化優勢,當我們在無序複雜的世界中渴求有序時所需要的優勢。

世界是受控的幻覺:大腦根據貝葉斯概率預測來認識世界嗎?

the conversation

目前學者們仍在激烈地爭論該理論的有效性,以及大腦是如何在功能層面實現貝葉斯推理的問題。在定下任何明確的結論之前,還需要大量深入的研究。但我認為該理論以及現有證據的美妙之處在於,可以讓我們意識到人類正走在越來越好的軌道上。

我們離這個宇宙最神秘之物的真相越來越近了,它使我們能夠觀察世界並遨遊其中,它掌握著我們的生死,也引導我們走向美好的未來(讀到這裡你很有可能知道我會怎麼結束這段話了):我們的貝葉斯腦。

特 別 提 示

1. 進入『返樸』微信公眾號底部菜單“精品專欄“,可查閱不同主題系列科普文章。

2. 『返樸』提供按月檢索文章功能。關注公眾號,回覆四位數組成的年份+月份,如“1903”,可獲取2019年3月的文章索引,以此類推。

《返樸》,科學家領航的好科普。國際著名物理學家文小剛與生物學家顏寧共同出任總編輯,與數十位不同領域一流學者組成的編委會一起,與你共同求索。關注《返樸》(微信號:fanpu2019)參與更多討論。二次轉載或合作請聯繫[email protected]


分享到:


相關文章: