全面理解奧卡姆剃刀原則——兼論常識獲取和推理的發展方向

全面理解奥卡姆剃刀原则——兼论常识获取和推理的发展方向

新智元推薦1

奧卡姆剃刀原則是科學方法論當中的一條重要的原則, 以往對奧卡姆剃刀原則的內容闡釋,主要可概括為八個字:“如非必要,勿增實體”。

看起來這八個字簡單明瞭,但是真正理解對了、用對了是不容易的。首先我們要了解:奧卡姆剃刀既不是真理,也不是事實,只是一種科學共同體約定的行事方式。

不符合奧卡姆剃刀的結論,內容雖不一定是錯的,但程序肯定是不妥的。比如,斷言外星人的存在,在現階段並沒有充分的證據。但反駁任何外星人的存在,也沒有任何經得起推敲的成熟理論。如果因為不能舉證外星人不存在就在沒有足夠證據的情況下承認外星人存在,這顯然是不合適的。

符合奧卡姆剃刀原則的結論,內容有可能是錯的,但卻是在當前證據條件下最合情合理的。比如,在天文觀測能力還不發達的年代,人們只能觀測到太陽系有六大行星。在那樣的證據條件下,如果誰說太陽系還有第七、第八個行星,那只是瞎蒙。後來觀測能力發達了,利用攝動現象推測未知行星位置的理論也成熟了,第七、第八個行星存在的確鑿證據也出來了,這時再修改原來的結論,追認第七、第八個行星的存在的結論在內容上的正確性,也是正常的。但是,不能因為證據條件變化了,碰巧當初沒有證據支持的瞎蒙應驗了,就追認其當初的程序正當性。沒有證據支持的瞎蒙永遠是程序不正當的。

之所以如此,在邏輯上是由“有”和“無”的證明(含證實/證偽)難度不對等引起的。“有”是存在命題,舉出正例即可證實,但對其證偽卻相當於證明全稱命題;“無”是全稱命題,舉出反例即可證偽,但對其證實卻相當於證明全稱命題。我們都知道,除數學和形式邏輯這樣的演繹科學外,在包括物理、化學在內的廣大經驗科學領域,並無先驗的全稱命題可以依靠。如果把舉證責任強加給需要證明先驗全稱命題的一方,就意味著無憑無據的“有”不能被他人證偽,而合情合理的“無”卻不能被自己證實。這在科學方法論上是有失公允的。所以,對無憑無據的“有”進行方法論上的限制,對合情合理的“無”進行方法論上的保護是十分必要的。奧卡姆剃刀原則於是應運而生。

在奧卡姆剃刀原則下,主張“無”是無需舉證的,主張“有”是必須舉證的。主張有,就好似法律上的“有罪推定”,你必須自證清白。這一原則,勒緊了科學野馬的韁繩,使聲稱的“科技創新”含金量得到有效的提升。科學的金字招牌之所以好使,之所以令人趨之若鶩,跟奧卡姆剃刀這個“門神”的嚴苛把關是分不開的。但是奧卡姆剃刀原則本身不是教條也不是真理。它是可以隨著證據的積累和獲取證據手段的提升而修正自己的守門標準的。原來不該放行的結論,不排除以後可能被放行。

但是,對“如非必要,勿增實體”這八個字,如果缺乏全面準確的理解,也容易滑到錯誤的方向上去。從數理邏輯的觀點看,不僅實體詞有可能斷言新實體的存在性,函詞也有可能斷言新實體的存在性。問題,恰好出在函詞上。

比如著名的皮亞諾算術公理,裡面有一個“後繼函數”,它的值是自變量加1。所以,有了這個函數,只要確立了0的存在,就可以推出“0的後繼”即1的存在,繼而可以推出2、3等其他自然數的存在。因此,“後繼”這個函詞,是派生無數新實體的潛在源泉。只關注實體詞是不夠的。如果只承認0的存在,皮亞諾公理體系就將是一個矛盾的公理體系,無法承載算術的內容。

再舉一個日常生活的例子。一個人的“標配”是有兩隻手。你不能因為號稱堅持奧卡姆剃刀原則,就把手的個數無緣無故地減到1或者0,除非有證據說明這個人的手被剁了或者有類似的遭遇。一個人的標配可以覆蓋得很全,從五官四肢,到五臟六腑等等。有性別、年齡、種族、職業等差異的地方,標配還有額外的不同。引用這些“標配”,用自然語言說起來,一個“的”字就解決了,但是定義和獲取這些標配,卻要花費無數的筆墨——一個標準化的“人”到底有多少項標配,怕是生理學家也難說全呢。我們不說細節,只說一條——這些一個“的”字就解決的標配,從數理邏輯的角度來看,使用的恰恰是一組函詞。函詞就是標配,標配就是函詞。堅持奧卡姆剃刀原則,尊重函詞、尊重標配是其中應有之義。

所以,為明晰起見,我建議在“如非必要,勿增實體”八個字的後面,還要加上四個字:“勿減標配”。把“如非必要,勿增實體,勿減標配”這十二個字完整地組合在一起,才是對奧卡姆剃刀的準確理解。這十二個字,雖則武斷,但卻有著以一當十的經濟。雖則明快,但卻有著掛一漏萬的風險。個別情況下,馬後炮們看來的真知灼見可能會碧玉蒙塵;但一般情況下,包裝成科學的偽科學也絕難在科學殿堂裡魚目混珠。

最近人工智能有點火,從事人工智能研究的人普遍敬而遠之的一個“神聖”領域,就是常識的獲取和推理。正是因為常識獲取的瓶頸到目前為止無法突破,傳統人工智能出現了長時間的停滯。通過上面的介紹,你可能發現,奧卡姆剃刀和常識推理也有著極深的淵源和關聯。我們隨便舉上幾條:

——“封閉世界假設(Closed worldassumption)”。其含義為:凡是沒有直接(通過實體詞)或間接(通過函詞)提及的對象,操作上均視為不存在。

——“失敗即否定(Negationas failure)”。其含義為:向一個知識推理系統查詢一個命題,如果得不到事實或推理的證明,就要返回該命題的邏輯否定作為查詢結果。

——“極小模型(minimalmodels )”。其含義為,從使一個合式公式集合為真的諸多語義解釋中,選出的那些把論域逐漸收縮到極限意義下不能再小的語義解釋。(論域是什麼?就是給定合式公式中直接或間接提到的實體對象的集合!)等等。

常識專治各種抬槓。拿小概率、非典型、非標配的情形和事例說事兒的抬槓者,在常識機制面前都應該自動選擇閉嘴,因為這些路數都是被常識機制堵死了的。讀到這裡,細心的讀者可能已經看出了奧卡姆剃刀原則的影子。對,奧卡姆剃刀原則已經深入了常識的本質,體現了常識機制的精髓。

常識不是真理。只是為了既要避免誠實的人們在知識的溝通中把眾所周知、共同約定的推理前提車軲轆話來回說,又要避免抬槓成性的小人無孔不入地拿黑天鵝鑽空子,人類才選擇了常識機制,把日常生活中各種標配對象和標配場景做成了不言自明的潛規則。跟不遵守潛規則的抬槓者,不需要廢話;跟遵守潛規則的溝通者,也不需要廢話。反正大家都很忙,不歡迎廢話。

常識可錯。沒關係,只要給出特設性前提,常識完全可以自廢武功,服從特設場景下的特設性知識。常識是軟的,特設性知識是硬的。在遇到矛盾的地方,軟的服從硬的,一般的服從特殊的,這是天經地義。

常識獲取難。這是實情。有人願意花費人工一條一條地把車軲轆話形式化,讓計算機能夠懂得並使用。但是如今是個大數據的年代。那些表現為車軲轆話的標配,是否可以通過大數據來獲取呢?只要我們認定,常識的關鍵在標配,常識獲取本質上就是標配的獲取,常識中最有價值的部分就是標配,或許我們可以聚焦標配,背靠大數據做點什麼。知識圖譜的大旗下,不僅有本體,有實體知識庫,更應該有標配常識庫一席之地。

從大數據中獲取標配,離不開自然語言處理技術。標配數據項往往具有“部件(part-of)”或“關係(relation)”的標籤,而經過多年的通用語言資源建設,已經有很多語義本體知識庫可以比較準確地定位這類標籤。藉助這類標籤的幫助,標配類常識的獲取或許可以率先突破常識獲取和推理領域的低迷,為人工智能未來的發展掃清一個重要的障礙。

感謝奧卡姆剃刀這樣一份寶貴的精神財富。讓我們謹遵“如非必要,勿增實體,勿減標配”十二字箴言,既為科學共同體的健康,也為人工智能的未來。

乾貨下載

1.【華創證券】機械設備:機器人大趨勢

2.【東吳證券】大國崛起:中國智造值得中長期佈局

3.【廣發證券】清潔機器人:舊時王謝堂前燕,飛入尋常百姓家

4.【民生證券】人工智能 + 適合的應用場景

5.【薦書】The Master Algorithm

如何下載?

關注新智元微信訂閱號(AI_era),回覆“12月下載”即可獲得。


分享到:


相關文章: