圖靈獎得主珀爾的《為什麼》

因果之箭指向何方?| 圖靈獎得主珀爾的《為什麼》



導語

大數據的許諾,讓科學界偷懶地用相關性代替為了因果關聯。但最終我們還是要問因果相關的問題。由圖靈獎得主、計算機科學家朱迪亞·珀爾和科學作家達納·麥肯齊合著的《為什麼》一書,為這個古老的問題提供一個新的答案。

相關不是因果



這一論斷儘管重要,但也逐漸變成了一種陳詞濫調。股市中,我們經常能看到所謂虛假關聯的例子。比如,一個太平洋島嶼部落認為跳蚤對個人健康是有益的,因為他們觀察到健康的人身上有跳蚤而生病的人身上則沒有。這種關聯是真實而有力的,但跳蚤顯然不會導致健康,它們僅僅是顯示了一個人處在健康的狀態。發燒個體上的跳蚤只是拋棄原宿主去尋找更健康的宿主而已。一個人不應該為了躲避疾病而主動尋找跳蚤。

之所以會出現這樣的問題,在於一個觀察結果:因果關係的證據似乎完全取決於相關性。 但是,看到相關性,我們不能知道是否會有因果關係。比如, 我們發現吸菸導致肺癌的唯一原因是,我們在特殊情況下觀察到了兩者之間的相關性。 因此,就產生了一個難題:如果因果關係不能歸結為相關性,那麼相關性又如何能作為因果關係的證據呢?

由計算機科學家朱迪亞·珀爾(Judea Pearl)和科學作家達納·麥肯齊(Dana Mackenzie)合著的《為什麼》一書,旨在為這個古老的問題提供一個新的答案。從啟蒙運動以來,這個問題一直以某種形式被科學家和哲學家討論著。2011年,珀爾因“通過發展概率和因果推理對人工智能的奠基性貢獻”獲得了計算機科學的最高榮譽圖靈獎,這本書旨在解釋因果推理對普通讀者意味著什麼,對他近20年前出版的關於同一主題的,但更技術性的書《因果關係》進行了內容上的更新。 這本新書以第一人稱的形式寫成,融合了理論、歷史和回憶錄 , 詳細介紹了珀爾發展出的因果推理的技術工具,以及他整個科研經歷,包括 一直與主流科學機構背道而馳,很久以前,主流學界就滿足於對相關性的數據處理分析,而不是對因果關係的詢證。 這本書在科學和社會學方面,都充滿了智慧和警示作用。



因果之箭指向何方?| 圖靈獎得主珀爾的《為什麼》

計算機科學家,圖靈獎得主Judea Pearl 和他的著作《為什麼》



當然珀爾也有一個很大的問題要去解釋和思考:我們如何思考,以及我們對於人工智能的狂熱與炒作。他寫道:「這種以數據為中心的歷史在今天仍然困擾著我們。」11年前, 《連線》雜誌宣佈「理論的終結」,因為他們預見到,「 數據洪流使科學方法過時了 」。而珀爾卻極力反對這種說法,他說, 「我們生活在一個假定大數據是我們所有問題的解決方案的時代 , 但我希望通過這本書來說服你,數據是非常愚蠢的 。」 數據可以幫助我們很好地預測將會發生什麼 ,事實上,計算機可以駕駛汽車,在非常複雜的策略遊戲中擊敗人類,不管是圍棋還是危險邊緣(美國電視智力競賽,涵蓋面廣,參賽者根據答案和線索,回答出問題)。但即使今天最先進的機器學習技術也不能解釋數據,告訴我們為什麼數據能預測。對於珀爾來說,我們現在缺少一個「現實模型」,而這主要取決於「因」。他與數據狂熱分子爭辯說,現代的計算機跟我們的大腦完全不一樣。


因果推理的基本問題

我們再來思考一下以下場景。假設在汽車的顏色和每年事故率之間存在一個穩健的、統計上顯著的且長期的相關性,再具體一點,假設紅色車每年都比其他顏色車事故率都高,你知道了這個研究,準備去買車,你是不是應該保證安全,從而完全不考慮紅色的車呢?

經過一番思索,你對這個觀察到的相關性進行了因果聯繫上的推測。一方面,你想,紅色車事故率高,可能是因為人類視覺系統在測量紅色物體距離和速度方面沒有其他顏色的好。這情況下,紅色車可能會有更多的事故, 因為其他司機往往誤判速度和距離而接近紅色汽車,因此產生事故。

另一方面,你又想,這種相關性可能與顏色本身的危險性沒有任何關係。這紅色只是其他原因的副產品。 選擇紅色汽車的司機可能比一般司機更喜歡冒險和尋求刺激,因此涉及到的事故比例更高。 而這,跟司機的駕駛能力也沒有關係。買紅色車的人可能比其他人更喜歡開車,一年在路上花更多的時間。 在這種情況下,即使司機平均比其他司機更小心謹慎,概率上也會有更多涉及紅色汽車的事故發生。

以上的例子涉及到了一個因果推理的基本問題:對於一個問題的解釋非常多,我們如何在這個因果詢證的過程中,找到最接近真理的那一個?

在某些情況下,最好的辦法是尋找更多的相關性,不同變量之間的相關性。 比如,為了檢驗事故率的提高是否是由於在路上的時間較長所致,我們應該控制時間。 如果相關性的真正原因在於司機喜歡駕駛的不同程度,而不是顏色本身,那麼當我們研究汽車顏色與每英里駕駛事故或每小時駕駛事故之間的相關性時,相關性應該消失。這種思路表明,從相關關係中推斷因果關係的訣竅就是梳理出足夠大的數據集,用其來尋找其他的相關性,從而排除可疑的因果關係。 根據這種操作主義的思維方式,所有的答案,不知何故,都在數據中。 而人們只需要找到正確顯露因果鐵律的方式。



用因果圖解釋因果關係

珀爾早在20世紀70年代就開始了在人工智能方面的工作, 在整個二十世紀,對於科學界的許多人來說,因果關係的概念本身被認為是可疑的,除非它能夠被翻譯成純粹的統計語言。突出的問題是,這個翻譯過程如何進行。但逐漸地, 珀爾發現這個過程行不通。即使是在更大的數據集中, 因果關係真的不能歸結為相關性。在這一過程中投入更多的計算資源,比如他自己早年的工作——貝葉斯網絡,(應用托馬斯貝葉斯的基本原理, 根據新的證據在相互連接的數據集更新對因果聯繫的概率), 這樣做的結果是你永遠也得不到一個解決方案。簡單地說,如果不先加入因果假設,你就永遠不會得到因果信息。

這本書講述了珀爾是如何認識到這一點的。 在這之後,他開發了簡單但強大的技術,使用他所謂的“因果圖”來回答關於因果關係的問題,或者確定什麼時候這些問題根本不能從數據中得到答案。 對於任何有興趣的讀者來說,這本書應該是可以理解的,只需要讀者在一些公式上停下來消化它們的概念與含義(儘管準確的細節即使對那些有概率論背景的人也需要付出一些努力才能理解)。 值得一提的是, 珀爾在宣傳這本書的時候用簡單易懂的方式闡述了因果假設的使用,因果假設,與其說是在充滿代數的統計數據中,不如說是在直觀的圖片中,這種圖叫“有向圖”,說明可能的因果結構,箭頭從假設的原因指向結果。

這種有向因果圖有兩個基本的部分。如果兩個箭頭從同一節點起始,那麼我們就有了一個「共同原因事件」,它可以使本身不存在因果關係的屬性之間呈現統計學上的相關性(比如魯莽駕駛者喜歡紅色這個假設中的汽車顏色和事故率之間的關係) 在這種情況下,A可能導致B和C,但B和C沒有因果關係。 另一方面,如果兩個不同的箭頭進入同一個節點,那麼我們就有了一個“對撞機(collider)”,這需要新的方法來考量了。 在這種情況下,A和B可能共同導致C,但A和B沒有因果關係。 這兩種結構之間的區別對因果推理有著重要的影響。 正如珀爾所展示的,給定某種因果模型的一般分析方法是識別連接節點的“後門”(共同原因)和“前門”(對撞機)路徑,並視情況而採取謹慎的調整。

讓我們來看一些簡單的例子。我們知道,紅色車和某年事故率有著正相關,但我們不知道的是,這輛車如果是紅色,是否會讓它更危險。因此,我們開始思考各種因果假設,並用有向圖表示它們:用箭頭連接起來的各個節點。

在一個假設中,紅色是事故率高的原因,所以我們畫了一個箭頭從節點“紅色汽車”到節點“事故”。

在另一個假設中,某些性格特質是購買紅色汽車和駕駛時長更長的原因,而駕駛更久是每年發生事故數目的原因。在這個因果圖裡,箭頭從「性格特質」節點指向「紅色汽車」節點和「更多駕駛」節點,(因此,個性特質是一個共同原因叉),還有一個箭頭從「更多駕駛」指向「事故數目」。人格特質只會間接導致事故。



因果之箭指向何方?| 圖靈獎得主珀爾的《為什麼》

待驗證的紅色汽車與事故率的因果關係示意圖

在這張圖中,從「紅色汽車」到「事故數目」仍然有一條連通的路徑,這可以解釋這種相關性,但這是一條後門路徑:它通過一個共同的原因(個性特質)。 我們可以通過控制「個性特質」(也可能是一個未知的人格特徵)或“「更多駕駛」(可以測量)來檢驗這個假設。 如果當這兩者中的任何一個被控制時,相關性仍然存在,那麼我們知道這種因果假設是錯誤的。

但是,我們如何決定首先測試哪些因果模型呢? 對珀爾來說,這些模型是由理論家根據背景信息、基於常識的推測,甚至是盲目的猜測提供的,而不是從數據中得出的。因果圖的存在允許我們通過引用數據來測試假設,既可以單獨測試假設,也可以相互測試假設;它不告訴我們要測試哪些假設。(珀爾堅稱:“我們只有在假設了因果模型之後才收集數據,在我們陳述了我們希望回答的科學問題之後。這與傳統的統計方法形成對比的是,傳統統計方法甚至沒有因果模型。“)有時數據可能會反駁一個理論。有時我們發現,我們手頭的數據不能在一對相互競爭的因果假設之間做出決定,但我們可以獲取新數據後再分析。有時我們則會發現根本沒有數據可以用來區分這些假設。

雖然這種用假設的因果結構從統計數據中梳理出因果結論的方法非常簡單,正如珀爾和麥肯齊(Mackenzie)給讀者提供的例子那樣,但是珀爾探索並提出這些方法的途徑是困難和迂迴的。 這主要是因為, 當他們開始普及這個方法時,整個統計學領域已經開始不再談論因果關係,所以珀爾的方法需要與該領域的「常識」背道而馳。 珀爾 從上世紀80年代末和90年代初開始脫離主流,在本書中,他頗為自豪地講述了自己在知識和體制方面的與主流的抗爭。



因果之箭指向何方?| 圖靈獎得主珀爾的《為什麼》

《為什麼》的第二作者,科學作家Dana Mackenzie



這似乎是一個古老而熟悉的故事。對世界的描述,無論是科學的還是常識的,都假定了各種事物不能被立即觀察到(比如法律和社會結構)。 但是,評估這種理論所依據的數據必須是可觀察的:這就是使它們成為數據的原因。因此,在我們相信什麼(理論)和我們相信它的理由(數據)之間出現了差距。 哲學家稱之為「證據理論的不確定性 」,這意味著數據不能完全證明理論是正確的。敏感的人會發現這種認知上的差距是不可容忍的,因此很多科學領域會一次次的試圖去減少這個差距,並以某種方式將科學框定為可觀察的數據結構。

這種“迴歸數據”的方法已經被嘗試過很多次了,心理學上的行為主義和物理學上的實證主義都失敗了。 在統計學上,據珀爾所說,它所採取的形式是放棄了所有關於因果關係的討論,因為正如啟蒙運動哲學家大衛·休謨在17世紀所指出的那樣,事件之間的因果關係本身不是立即可見的。 正如休謨所說,我們可以觀察到的是事物之間的連接,比如一個事情一致地跟隨另一事件出現,但這連接不是因果關係。實證主義者的邏輯是不說因果關係,如珀爾所說,「你會發現, 在統計教科書的索引中尋找一個關於”原因“的條目是徒勞的。」 學生不能說x是y的原因,而只能說x和y是「相關的」。

但我們通常關心的是有效的干預,而有哪些辦法則取決於因果結構。 如果紅色車事故率高的原因是紅色車確實很難被有效準確地看到,那麼買一輛不同顏色的車確實會更安全。如果這種相關性僅僅是由於一個共同的原因,比如買家的心理特質,那麼你也可以選擇你喜歡的顏色。避開那輛紅色的車並不會神奇地讓你成為一個更好的司機。不得不說的是,試圖通過討論相關性來壓制對因果關係的討論,這使得統計分析領域陷入了混亂。

隨機對照試驗還不夠

客觀地說,主流學界其實也不算是壓制因果關係的討論,而只是被降級到更專業的領域中去(比如實驗而不是觀察研究),實驗科學遠遠不止統計分析,而實驗科學本身也專注於結論而不是原因。

事實上,有一種普遍的認識是,觀察到的相關性可以被接受為因果關係的證據:採用隨機對照試驗(RCT)。 假設我們把一大群購車者隨機分成兩組,實驗組和對照組。 然後,我們強迫實驗組駕駛紅色汽車,並禁止對照組這樣做。 由於這些組是隨機形成的,因此極有可能(如果這些組足夠大),它們在統計上的各個方面都是相似的。例如,每個群體中魯莽駕駛員的比例大致相同。如果實驗組的事故數量超過對照組的數量,達到了統計上的顯著水平,我們就有了“金標準”的證據,即顏色本身就會導致事故。

當然,也不一定是真正的金標準,更嚴謹的金標準是雙盲實驗。在這個實驗中,受試者和實驗者都不知道誰在哪一組。 而在汽車顏色的情境裡,我們實際上要使得司機失明才能做雙盲實驗,然而這麼做當然會大大提高事故率。所以我們別再糾結這個問題了。

隨機對照試驗的關鍵在於, 通過隨機方式將成員分配到這兩個組,而不是讓他們自行選擇,我們控制其他可能的解釋。 當然,其實分配隨機的方式也不完全是徹底隨機,它們實際上由投擲骰子或隨機數發生器決定。只是,這些決定方式的影響不會達到任何顯著水平。

珀爾通過「Do 操作符」來識別這種情況,「Do X」表示一種干預,而不僅僅是觀察x的結果。如果我睜開眼睛看著從我身邊經過的車流,我就能記錄下誰開著一輛紅色的車,誰不開紅色的車。 但是,「開紅色汽車」就要求一個駕駛一輛紅色汽車或者駕駛不是紅色的車子。這恰恰就是觀察研究和隨機對照實驗的區別,觀察研究不會進行干預。(對於熟悉統計方法的人來說,這本書中有足夠多的關於微積分的技術細節和計算細節,但也可以從更純粹的圖形層次來閱讀和解讀。)

因果之箭指向何方?| 圖靈獎得主珀爾的《為什麼》

隨機對照試驗並不完美

珀爾並不質疑隨機對照實驗的證據價值。 但RCT 成本高、難度大,有時也不道德。 吸菸導致人類癌症的最佳證據來自一項實驗,該實驗將一大群嬰兒隨機分為兩組,迫使一組每天吸菸兩包,另一組則阻止吸菸。但這樣的實驗在道德上顯然是不允許的。

珀爾的主要貢獻之一是對「Do calculus」的發展。 他和他的學生與同事展示的是,如果一個人從某種情況的因果結構的精確圖形模型開始,箭頭顯示某些變量可能是其他變量的原因,那麼在某些情況下,一個人可以用觀察替代干預。也就是說,適當的被動觀測數據可以提供與RCT相同的證據,當然,前提是初始因果模型是準確的。RCT的優點是它提供了因果關係的證據,而不需要任何初始的因果假設。「Do calculus」演算的優點是, 它可以提供同樣強大的因果推測能力,而不需要干預。

攀上因果關係的階梯

這本書的最後部分進入了哲學領域。珀爾描述了從僅僅觀察相關性到檢驗因果性的轉變,即從因果關係階梯的第一級上升到第二級。

因果之箭指向何方?| 圖靈獎得主珀爾的《為什麼》

因果之梯

其中的區別是僅僅注意數據中的相關性和得出因果結構的結論之間的區別。但是,現在的情況變得相當複雜,因為珀爾還堅持認為,還有一個更高的因果關係階梯:第三階段,這涉及到反事實的推理。

如果世界在某種程度上不是原來的樣子,反事實推理就會斷言會發生什麼。舉個例子,考慮一下這個說法,「如果奧斯瓦爾德沒有射殺肯尼迪,其他人也會射殺肯尼迪。」 這個說法理所當然地認為奧斯瓦爾德確實射殺了肯尼迪,並聲稱如果他不這樣做的話,事情會如何發展。我們可能沒有理由認為這種反事實是真的,但很容易想象它會出現的情況。例如,如果有第二個刺客藏在草丘裡,他的工作是在奧斯瓦爾德失敗的情況下充當後援。

在某種意義上,反事實是關於虛構的世界或未實現的可能性,因為他們的前因與事實相反:他們是關於什麼可能發生,但沒發生。因此,從表面上看,它們似乎超出了正常科學研究的範圍。畢竟,不可能有上帝視角來揭示可能但沒有發生的事情。事實上, 人們很容易認為反事實完全超出了科學的範圍。正如物理學家阿瑟·佩雷斯曾經說過的那樣,未完成的實驗是沒有結果的。那麼反事實在珀爾的書裡面是什麼樣的角色?

事實是,珀爾似乎認為反事實具有哲學意義:在他的講述中,對反事實的考慮比對因果要求的考慮具有更高的認知層次。他認為,許多非人類動物可以進行因果思維,但也許只有人類和一些非常先進的動物可以接受反事實。提升到第三級,就像吃了知識之樹的果實一樣,將人類與動物王國的其他部分區別開來。他用書的最後幾章來描述反事實推理,以及我們必須相信它們的理由。

但在將因果推理和反事實推理的區分開是一個錯誤。反事實是如此緊密地與因果關係聯繫在一起,以至於不可能用因果關係而不用反事實推理來思考。這一事實常常被哲學家們忽視,所以看到珀爾落入同樣的陷阱也就不足為奇了。

試想一下,你拿著一盞珍貴而易碎的蒂芙尼(Tiffany)燈,地板是堅硬的石頭地板。一隻蒼蠅在你的頭附近嗡嗡叫,打擾你,而你希望嗡嗡聲停止,該怎麼辦?你可以放開燈來拍蒼蠅, 但是作為一個因果推理者,你可以預見到這樣做的結果:你可能會殺死蒼蠅,但燈會掉到地板上並摔碎。 這個結果並不好,所以你還是不能鬆手。但是,在接受了掉燈和它粉碎之間的因果聯繫之後,假設你實際上沒有掉燈,那麼你就會不由自主地想反事實中的“如果我當時放開燈,它現在已經粉碎。” 所以你會發現,因果思維和反事實思維其實是聯繫在一起的。

由於未能領會因果推理和反事實推理之間的聯繫,這本書後面的章節比前面的更加晦澀。 珀爾討論因果聯繫是有堅實基礎的,但將反事實推理加到更上的一層就有些瘋狂了。這和他在書的最後討論自由意志一樣,都缺乏對哲學文獻的熟知。

《為什麼》一書的這些方面提出了個有趣的問題,即哲學在珀爾職業生涯中有什麼作用,以及在更廣泛的科學中有什麼作用。作為一個哲學家讀這本書,我發現有很多值得欣慰的地方。珀爾閱讀並欣賞關於因果關係和反事實的哲學討論。 這本書引用了大衛·休謨(David Hume),大衛·劉易斯(David Lewis),漢斯·賴欣巴哈(Hans Reichenbach )和其他哲學家的話。與科學家通常對哲學表現出的蔑視相比,珀爾的態度簡直就是一盞明燈。

這本書同樣是一本警示寓言。統計學嚴謹的訓練,讓珀爾發現統計學避免談論英國關係,從而使他逆流而上,恢復了西沃爾·賴特(Sewall Wright)在20世紀20年代關於「線性路徑分析」的工作,又推動了這些想法。相比之下,我從1980年到1986年是匹茲堡大學歷史和科學哲學的研究生,我可以證明,當時珀爾所爭論的概念是我們賴以生存的東西。當然,科學哲學專業的學生讀過他提到過所有哲學家的書,甚至更多。但除此之外,肯·沙夫納(Ken Schaffner)在醫學研究的背景下教授路徑分析和西沃爾·賴特。更重要的是,克拉克·格萊摩(Clark Glymour)和他的學生彼得·斯皮爾特斯(Peter Spirtes)和理乍得·謝恩斯( Richard Scheines)一起努力,研製出了用於測試因果關係模型的統計軟件Tetrad。他們的研究成果出現在2001年出版的《因果關係、預測和搜索》(Causality: Models, Reasoning, and Inference, Cambridge University Press, 2000)一書中。

因果之箭指向何方?| 圖靈獎得主珀爾的《為什麼》

珀爾的經典學術著作 Causality: Models, Reasoning, and Inference

如果珀爾早點知道這項工作,他本可以節省他自己多年的時間。他在書中承認,他從彼得·斯皮爾特斯那裡學到,強迫進行干預就像抹去了因果關係的箭頭,(是無效的),但考慮到我自己的背景,我不禁想知道,如果珀爾接受了我作為哲學家的訓練,他能走多遠。物理學家理乍得·費曼(Richard Feynman)曾說過廣為流傳的一句話:「科學哲學對科學家的作用就像鳥類學對鳥類的作用一樣。」我總是感到驚訝的是,沒人指出,如果鳥類可以說話,可以向鳥類學家徵求意見的話,那鳥類學確實對於鳥類有很多的作用。

隱藏的因果,天生的好奇心

《為什麼》一書對因果分析的現狀提供了精彩的概述。它有力地論證了提出有充分支持的因果假設既是必要的,也是困難的。困難的是,不管數據集有多大,因果結論不會僅僅從觀察到的統計規律中得出。相反,我們必須利用我們所有的線索和想象力來創建合理的因果假設,然後分析這些假設,看看其是否合理以及如何通過數據來檢驗它們。僅僅靠堆砌更多的數字並不是獲得因果洞察力的捷徑。

但為什麼要關注這個世界或時間的本源與原因呢?其中一個原因是純粹的科學好奇心:我們想了解世界,而瞭解的一部分需要找出它隱藏的因果結構。但同樣重要的是,我們不僅是世界的被動觀察者:我們也有主觀能動性。我們想知道如何有效地干預世界,以防止災難和促進福祉。光有良好的意圖是不夠的,我們還需要深入瞭解自然的饋贈和其力量是如何由因果關係連接起來的。因此,如果我們要理解如何獲得成功,最終必須要去理解這個世界的運轉的因果。



因果之箭指向何方?| 圖靈獎得主珀爾的《為什麼》

原文地址:

https://bostonreview.net/science-nature/tim-maudlin-why-world

翻譯:Frank Xu

審校:郭瑞東

因果之箭指向何方?| 圖靈獎得主珀爾的《為什麼》


分享到:


相關文章: