看似毫不相干,哲學與機器學習竟有如此大的交集?

看似毫不相干,哲學與機器學習竟有如此大的交集?

受訪者 | 張坤

記者 | 夕顏

出品 | CSDN(ID:CSDNnews)

自從 AI 搭乘 AlphaGo 出道以來,關於感知智能需要向認知智能進化的討論被提上日程,因為雖然 AlphaGo 戰勝了李世石,但是為什麼 AI 會贏,其中的因果關係沒人知道。認知智能的理想發展路線,是從認知心理學、腦科學及人類社會歷史中學習,並結合領域知識圖譜、因果推理、持續學習等技術,建立穩定獲取和表達知識的有效機制,讓知識能夠被機器理解和運用,讓 AI 能夠回答為什麼的問題,實現從感知智能到認知智能的關鍵突破。

這其中的關鍵方法,就有我們今天要討論的主題——因果關係。

看似毫不相干,哲學與機器學習竟有如此大的交集?

什麼是因果關係?

18 世紀,蘇格蘭不可知論哲學家大衛·休謨提出“因果關係是人類的錯覺”(即人們所謂的因果,實質上是對“相關關係”的歸納推理,而相關性無法保證因果性),用懷疑論毀掉了因果律,否認了理性分析的作用,引發哲學危機。從此,科學家就未停下過對因果關係的爭論。

看似毫不相干,哲學與機器學習竟有如此大的交集?

愛丁堡的大衛·休謨雕像

那麼,什麼是因果關係?因果關係有多重要?

從定義上來說,人們對因果關係最常見的誤解,是會將其與相關關係混淆。《愛上統計學》一書舉例說明了兩者之間的區別:在美國中西部的一個小鎮,地方警察局局長髮現冰淇淋消費量越多,犯罪率就越高。這個例子中,冰淇淋消費量和犯罪率是正相關的,但並不意味著冰淇凌消費的增多導致了犯罪率的上升,更不可能通過減少冰淇凌的銷售來降低犯罪率。

事實上,存在某個變量同時和冰淇淋消費量、犯罪率相關,這個變量就是室外溫度。當室外氣溫變暖,如在夏天,就會有更多犯罪(白天更長,人們多開窗口等)。而因為天氣變暖,人們更享受吃冰淇凌的樂趣。相對地,在又長又黑暗的寒冬,冰淇凌的消費就減少,同時犯罪也越少。

這裡,冰淇淋消費量與犯罪率只是相關關係,雖然表面上存在著一定程度上的詭異關係,但是卻非因果關係。

因果關係的抽象定義是這樣的——如果保持系統中其他變量都不變,只改變其中的一個變量(比如通過人工降雨來下雨),然後發現有另一個變量也隨之改變(比如我們發現地上由幹變溼了),那麼我們就說前面一個變量(是否下雨)是後一個變量(地上是否溼)的一個原因。一個典型的因果模型可以通過直觀的圖模型來描述,或者通過從因到果的數學函數來刻畫。

此後數百年來,自然科學和社會科學中有很多科學家在嘗試針對因果關係的檢測方法,比如2002 年,加州大學伯克利分校教授亨利·布雷迪撰文整理了因果推斷的各種經典理論,並根據不同假設,將其分為新休謨理論、反事實理論、操控實驗理論、機制理論 4 大類,而從計算視角,近年來還興起了基於統計獨立性、分佈變化性、因果過程複雜度和“壓縮感知”的新方法。新的方法不斷出現,但萬變不離其宗,並且與哲學的緊密關係不減反增,其中包括卡內基梅隆大學哲學系(並在機器學習系兼職)副教授張坤在做的事。

看似毫不相干,哲學與機器學習竟有如此大的交集?

一個用因果思維做機器學習的科研人

在張坤看來,哲學與機器學習看似兩個毫不相關的領域,但其實有著很多交集,他本人就是一個跨越兩個學科的科研人。在卡內基梅隆大學,張坤是哲學系教授,同時指導機器學習系博士生,並且是德國馬克思普朗克智能系統研究所高級研究員。他的主要研究方向是機器學習和人工智能,特別專注於因果發現和因果機器學習的研究。在機器學習頂級會議和期刊上,他的團隊每年展示十餘篇論文, 他並擔任 NeurIPS、ICML、UAI 等多個頂級會議的領域主席。

為什麼說兩個學科之間有交集?張坤的團隊希望有更好的認識論和更恰當的方式來定義和解決實際問題。哲學思維方式能讓他們更在意問題如何定義以及問題本身意義何在,而機器學習的背景和思維方式讓他們腳踏實地從數據出發發現新的信息並進而更新其傳統認識。張坤認為,哲學與機器學習兩者之間類似於思和學的關係——學而不思則罔,思而不學則殆。

張坤在中國科學技術大學讀完本科,在香港中文大學計算機係獲得博士學位。在讀博期間,他對如何從機器學習的角度看因果關係產生了很大興趣,於是便從機器學習領域中逐漸縮小關注範圍。最終將主要研究領域聚焦於因果發現和因果思維方式的機器學習,雖然當時在機器學習領域幾乎還沒什麼人關注因果性。

在讀博期間,張坤第一次接觸到機器學習相關的研究課題,當時的目的是做更好的獨立成分分析的方法。做那個課題的過程中,他深刻地感覺到,做研究要麼著眼於重要的待解決問題而不受領域的限制,要麼著眼於重要的還未被公認完善的方法而不被應用限制。如果兩者都不是,可能需要想一想自己的研究到底要做什麼樣的貢獻。

因果關係,就是一個重要的待解決的問題,也是具有重要意義的還未有完善方法的方向。在 CMU,張坤的主要研究方向就是在各種場景下如何找出真正的因果關係,以及如果解決一系列具有數據異質性的機器學習問題。他所在的小組在這兩個方向並駕齊驅,這幾年在研究上取得了一系列進展,比如他們可以從觀測數據中自動找出背後有相互因果關係的隱變量。在他看來,這是一次不小的進步。

在在此之前,張坤有不少因果關係相關的研究成果出來,其中最為重要的成果包括他提出的自動因果關係發現方法以及用因果的思維方式解決遷移學習等問題。總體來說,前者將就是通過機器學習的方式,分析各種各樣的觀測數據,以找到背後的因果關係。張坤說到,在一些假設條件下,因果關係發現其實就是機器學習問題,問題是我們需要合適的或者很弱的假設,這是因果關係和數據之間的橋樑。上世紀 90 年代初,該方向的研究曾獲得很大進展,因果發現問題得到部分的解決。而在過去十幾年間,機器學習的思維方式的介入更是促進了因果關係突飛猛進的變化。而用因果的思維方式解決遷移學習問題,可以幫助我們判斷系統的那些信息可被遷移,以及如何遷移。

張坤介紹到,近年來,因果發現有了不少新的理論和算法,大致是圍繞如何利用異構數據以及如何自動構建隱藏的因果變量,而張坤團隊最近的自動構建隱變量及其之間因果關係的方法,已經被應用到一系列心理學問題上。用他的話說,“得到了全新且有意義的結果,直接幫助他們重構、理解和干預心理上事實存在的各個維度。”張坤還提到,在這類問題上,華南工業大學的蔡瑞初老師團隊也做出了令人興奮的結果。

看似毫不相干,哲學與機器學習竟有如此大的交集?

因果關係落地難點

具體來說,因果關係下大概分兩個研究領域,其一是因果發現,它可以回答“為什麼”的問題;其二是有了定性因果關係後,如何確定一個變量對另一個變量的因果影響,比如,它可以幫我們確定不同治療方式對 COVID-19 的療效。張坤認為,因果關係的研究領域現在還應該再增加一個,就是因果智能機器學習,它可以幫我們實現更魯棒、更具適應性、更通用的機器學習系統。

關於因果關係的基礎研究範圍在不斷拓扎和完善,大家關心的更多的還有其在實際場景中落地有哪些進展與難度。

張坤提到,因果關係在實際場景落地的最大困難,是需要掌握和使用要解決問題的特定性質,以及熟悉哪些問題一定需要用因果的思維方式才能解決,如此才能精確、高效的找到背後的因果關係並加以適當應用。“舉例來說,現實中我們測量出來的變量往往有很大噪聲,甚至並不是我們真正想找的變量,系統有觀測噪聲這樣的信息都可以幫助我們大大降低搜索空間,從而提高搜索效率並改善最終結果,”張坤錶示。

看似毫不相干,哲學與機器學習竟有如此大的交集?

因果關係研究並不完善,亟待更多人才

實際上,張坤告訴 CSDN,因果關係相關的基礎研究並不完善,因為這還是一個較新的領域,很多實際問題還未得到好的解決,甚至還沒有被很好地刻畫出來。他認為,用非參數的方式自動構建因果隱變量會是很未來重要的方向,無論是對於單純的因果研究領域還是機器學習領域。

看似毫不相干,哲學與機器學習竟有如此大的交集?

Judea Pearl

有著巨大挖掘和進步空間的因果關係領域,還需要更多人才的加入。對於那些對因果關係研究感興趣的同學,張坤推薦了一些入門書籍和資料,包括 Judea Pearl 的 Causality: Models, Reasoning, and Inference,Peter Spirtes, Clark Glymour and Richard Scheines 的Causation,Prediction,and Search,前者注重在概念和因果影響辨識問題(假設定性的因果影響已知),後者著眼於如何從數據發現因果關係。

此外,張坤提到 Clark Glymour 和他本人正在寫一本關於因果發現的書,目前還未完工,希望完成之後能為大家提供比較及時、系統的因果發現以及如何使用因果關係的素材,大家可以關注一下。

另外一個問題大家可能也會關心——學習因果關係方向需要掌握紮實的數理知識基礎嗎?對學生入門學習,專家有哪些建議?

對此,張坤錶示入門因果關係確實需要紮實的數理知識基礎,他的建議就是別怕那些概念——畢竟因果關係不僅僅是對觀測數據的現象描述,它需要一個新的描述體系。把那些概念吃透,變成自己思維方式的一部分。同時多考慮一些看起來寬泛的問題,比如人為什麼在意因果關係以及人如何學習因果關係。在不同階段,我們對這類問題的回答會有不同,更好的答案會直接催生更好的學習方法,而對更好的回答的追求也會給我們源源不斷的動力。

看似毫不相干,哲學與機器學習竟有如此大的交集?

☞NB-IoT 連接數過億,開發者如何抓住新機遇?

☞華為雲躋身Gartner報告中國三強,預示雲計算市場的未來變局?

☞數據庫激盪40年,深入解析PostgreSQL、NewSQL演進歷程

☞黑客用上機器學習你慌不慌?這7種竊取數據的新手段快來認識一下!

☞超詳細!一文告訴你SparkStreaming如何整合Kafka!附代碼可實踐

☞Libra的Move語言初探,10行代碼實現你第一個智能合約


分享到:


相關文章: