一切“為什麼”都可以轉化為因果推斷嗎?

本文刊載於《三聯生活週刊》2020年第15期,原文標題《大數據中的因果關係》,嚴禁私自轉載,侵權必究

《為什麼》一書藉助因果關係之梯的三個層級,揭示了因果推理的本質,並據此構建出相應的自動化處理工具和數學分析範式。

一切“為什麼”都可以轉化為因果推斷嗎?

美國計算機科學教授朱迪亞·珀尓


一切“為什麼”都可以轉化為因果推斷嗎?

普林斯頓大學數學博士達納·麥肯齊


美國計算機科學教授朱迪亞·珀爾和普林斯頓大學數學博士達納·麥肯齊在《為什麼》一書中提出:福爾摩斯主要依靠個人的超強記憶或探案藝術去確定原因,如果我們把因果推斷的原理教給計算機,實現“因果推斷”的自動化處理,未來在人工智能的幫助下,人人都可以成為福爾摩斯,甚至比福爾摩斯“算”得更快更準。

這當然是一項創舉,很多科學家和哲學家都曾有過這樣的設想。那麼,我們該如何教會計算機進行“因果推斷”呢?首先,得理清“因果”觀念。因果思維是人類古老的、伴隨條件句使用的一種認知方式,而且有層級之分。譬如,當你看到一個人按著頭部難過的樣子,可能想到他頭痛。這種形如“如果我看到A就會想到B”的條件句表達了一種“關聯”,是最初級的因果關係。然後,你打算主動提供阿司匹林給他服用,看他是否還頭痛。於是就有形如“如果我實施行動A,就會有結果B”的條件句。這裡表達的是一種“干預”,屬於第二層級的因果關係。其中的A不再是被動接受的所觀察之物,而是你主動採取的一種行動。而待他服藥後不再頭痛時,你可能又設想:假若我剛剛沒有及時給他服用阿司匹林,不知道會怎樣?這時的條件句形式為“如果我當時做的是A,結果可能是B”,它所表達的是一種“反事實”,即,其中的A是一種虛擬的、未曾發生或不可能發生的情況。從“關聯”到“干預”再到“反事實”,三者構成了“因果關係之梯”。它描繪了人類意識進化和個體認知能力提升的三個階段,也代表著機器模擬人類思維(人工智能)的三個臺階。當前已出現的人工智能產品,只停留在“關聯”這個初級階段,連小孩子的因果思維水平也趕不上。要想走向更強的人工智能,必須沿著“因果關係之梯”繼續攀升,讓計算機不只是被動接受信息,而且能學會更高級的因果思維能力,尤其是“反事實”的因果推斷。只有把“反事實”的可能性考慮在內,我們才能突破現有觀察數據的侷限,去把握一種代表一般性規律的、能靈活應對未來不確定情況的因果關係。對“反事實”可能性的思考是人類區別於類人猿祖先以及地球上其他生物的重要特徵。事實上,我們熟知的科學定律很多都是“反事實”條件句,比如牛頓力學第一定律,其精確的表達方式是:任一物體,假若不受外力作用,一定保持靜止或勻速直線運動狀態。這裡的“假若”情形(某一物體不受外力作用)顯然是我們觀察不到的“反事實”。

一切“為什麼”都可以轉化為因果推斷嗎?

《為什麼》


接下去要做的是,藉助於因果圖及其背後的主觀概率理論,從既有觀測數據中推算“原因”。要推算一種現象背後的原因,往往要考慮多個可能相關的因素。通過適當的概率計算,我們可以估量各種“因”的相對重要性。在此過程中,我們經常需要試著改變某一變量的狀態值,並預言如此干預或想象之後會有什麼樣的概率變化。在利用科學界積累的觀察和實驗數據進行模擬計算之後,可能要重新規劃模型,修改原有的因果圖,直至達到關於某一種現象之因果關係的“最佳解釋”。這就是科學邏輯上著名的外展法(Abduction,或譯為“溯因法”)。計算機遵循外展法進行因果推斷並由此反思自身的錯誤,相比基於固定規則而開展的演繹,這毋寧說是更接近了人類的智能。

相比於主流統計學的保守做法,這套“因果關係”理論或顯得有些激進。但此種激進並不等於冒進。它巧妙地把定量的經驗數據和定性的因果模型結合起來,一方面用因果圖來統合和理解數據,反過來又用數據來評估和修改之前的因果判斷。此種策略不僅符合普通人(包括福爾摩斯那樣的偵探)的認知實際和決策路徑,也與邏輯學家對於科學方法實踐的刻畫保持一致。更為直接的一點是,它能很好地解決統計學方法論中的“混雜因”難題。以上世紀五六十年代科學界關於吸菸是否會導致肺癌的爭論為例,現在看來,這似乎是常識。但何以說服那些嗜煙人士或懷疑論者呢?畢竟,有些人一輩子吸菸卻從未得過肺癌,另一些人從不吸菸卻患上肺癌。為了消除這些混雜因子作為“虛假因”的可能性,我們或許需要更多實驗證據,採取隨機對照實驗。但是,這種研究方法在這裡既不可行,也不合乎職業道德。科學家怎能隨機挑選一些人作為被試,讓他們連續吸菸30年,只為了看30年後會否患上肺癌呢?這種排除混雜因子的困難,一直讓很多統計學家焦慮不安。或許也正因為如此,他們寧願只談“相關”而不講“因果”。然而,如果我們通過因果模型來考慮這個問題,綜合比較各種“因素”的相對重要性,並願意調用(即“遷移”或“融合”)科研人員業已掌握的科學證據(尤其是之前所取得的觀察性和試驗性成果,包括白鼠試驗、煙霧致癌物成分等等)來計算所需要的條件概率,最後將能嚴密地推斷出:在“長期吸菸”之外沒有任何其他因素更有可能是導致美國當時“大批肺癌”的主因。

類似這樣為“因果模型”路徑辯護的真實而生動的案例,讀者可以在書中找到很多,透過作者對當代科學前沿中核心概念的歷史溯源和因果圖重釋,你還會懂得為何處決犯人時配置兩人以上的行刑隊可以減輕行刑人員的愧疚感,也會明白計算機程序是如何快速識別遇難者DNA的。

總體來看,作者在哲學上堅信決定論與自由意志之間並無衝突,或許也正因為如此,他似乎相信一切“為什麼”問題都可以轉換為因果推斷。甚至一些通常看來只關乎理由選擇而不牽涉原因的例子,如一個人問:“你為什麼這麼做?”你回答說:“因為我想打動你。”回答者看似擁有的自由意志被認為是一種幻覺,因而在模擬人的這種思維過程時,我們只需教會計算機進行反事實的因果推斷並讓其表現出類似自由意志的幻覺即可。這種論調勢必會在人文學者或其他科學家那裡引起一些異議。不過,作者對“因果性”諸多難題的敏感及其在這方面所做出的跨學科探索是令人敬佩的,也可以期待它們會推進當前人工智能的轉型升級。

更多精彩報道詳見本期新刊《重新看待親密關係:被疫情改變的我們》,點擊下方商品卡即可購買



分享到:


相關文章: