05.31 數據的哲學

請按上方“創瞰巴黎”關注我們

摘要

數字化的持續推進使得數據已經成為經濟和社會生活的中心。我們生成的數據越來越多,數據交換、數據安全和數據分析的手段也愈發成熟。數據經濟學定義了這些操作的價值。政府和大企業紛紛出臺數據政策。大數據作為一個全新產業如冉冉升起的新星,然而有關數據的本質尚無定論。盧西亞諾·佛羅利迪(Luciano Floridi)帶領我們從哲學視角出發來重新審視數據的定義。

数据的哲学

數據是什麼?這個問題早在19世紀末就被提出,但長久以來一直被人們忽視。如今,數字技術的降臨使我們不得不重新回答並闡釋這一問題。當時有兩派,一派強調要記錄“意識的即刻數據”(柏格森);另一派強調用實驗的方法對“客觀”數據進行間接測量。

蒯因之後,科學的哲學很快拋棄了客觀的偽裝。但無論如何直到今天,所有關乎準確無誤和現實主義的實踐思維、一切的科學手段,其基礎還是數據。

已知和未知

“數據”顧名思義,其意義既是外人賦予它的,也是它強加於人的。正因如此,它才能成為共同思考的基礎,推動技術發展,制定公共政策,促進科學進步。無人不使用數據:工程師、經濟學家、物理學家、植物學家、農學家、化學家······

數據是已知的領域,它帶著我們去探索未知。

但就何為已知,各方須達成共識、表示認可。簡單說來,這要求某種自我證明或是約定俗成,讓共同反思的各方就什麼是“已知”達成一致。數據,無論關乎科學、技術或是社會科學,提供的都是可解讀的、站得住腳的事實。這些事實要麼向公眾開放,要麼至少在承認其價值的使用者社群裡共享。

從這個角度來說,定量數據相較定性數據有一個難以辯駁的優勢——就數字達成一致比較容易,就性質達成一致比較難。正因如此,現代科學和工程尋求量化指標,用數字來描述事物屬性。比如灰色不再是一種介於黑白之間的顏色,而是25%或是70%的黑色。任何圖像都能被分割成像素,而任何一個像素都有帶有數字價值,其範圍介於紅外線和紫外線之間。

因此,所謂的世界的數字化不僅僅意味著所有的傳輸信號都可以用0和1表示,而是說在全球範圍內,我們所能感知的世界——包括人類——都被轉化成了數據序列。這一轉化始於現代之初,而當今我們正在經歷這一進程的加速。

這種加速還帶來了另一個變化,那就是它把分析學變成了推測學。過去對於原理機制一絲不苟而又嚴格縝密的推斷被通過數據挖掘帶來的對於統計規律的事後揭示所取代。這場剛剛才開始的革命可以被看作歸納思維對於演繹思維的勝利。在越來越多的領域,知識的基礎是從海量數據中提取出來的相關性。人們不再試圖證明規律,而只是觀察規律的表徵。

統計數據和算法成了知識以及決策的基本工具。

這是一場革命,其驅動力是存儲在巨型數據存儲中心的海量數據。既然我們所有人都身處其中,就不得不審視這些數據及其重要性。第一個問題,很簡單但也很根本:數據和信息有何區別?

数据的哲学

信息原子

二者之間的差異很重要,也是事實——知識這一鏈條的組成部分。

瑞典皇家理工學院的哲學教授斯文·奧維·漢森(Sven Ove Hansson)在他2002年的一篇文章中曾經這樣總結過數據、信息和知識的差別:“數據有別於信息,因其吸收不需要藉助某一特定形式。比方說,如果我現在不讀這本(社會學的)書,而是讀這本書基於的幾萬份調查問卷,那麼我讀的就是數據而非信息。簡單說來,數據要能被處理才能成為信息,要能被吸收才能成為知識。”

事實上,漢森談及的數據、信息和知識之間的差別羅傑·波恩(Roger Bohn)早在1994年的一期《斯隆管理評論》中就有闡述。數據來自傳感器,衡量任意指定變量的價值。如果按照特定結構組織起來,數據就成了信息,在特定情境下,這些信息持之有故。知識更進一步:知識幫助人做出預測、建立因果關係或者做出決策。

價值來自知識。但是正如波恩所說,相較於信息,存儲、描述、處理信息更容易。那麼數據是否也是如此呢?

如果光看數值,答案是肯定的:一份數據其實就像是一個信息原子,是特定時間內和空間中的一個最小測量單位。簡單說來,它可以用0或1來表示。

從哲學角度看,描述數據比描述信息更容易。數據的概念更簡單、挑戰性也更小。一份數據是對於一個事實最直接、最如實的表達。但是數據不等於事實;它只是人類為定義一個事實所用的最小觀察單位。

要說數據是完全客觀的、不帶任何意圖或投射,那是痴人說夢。一個現象可以測量的方面眾多,偏偏選擇測量某一特定變量,而不是另外一個變量,這種選擇本身已經規定了你想要知道的現實。

但一般由傳感器生成的數據還是在兩個方面體現出了客觀性:第一是數據裡包含的極少量的信息;二是其他傳感器的存在(這些傳感器更好的幫助再現對於某一現象的觀察,比方說要了解你車的右前輪的狀態,可以收集它的熱度、震動、氣壓、年齡、使用年限等等數據,你的車載電腦就能通過這些參數提供高度可靠的信息)。

数据的哲学

數據的語義定義

前述討論也可以反過來看。一方面,它們強迫我們做出選擇、過濾數據,來重建一個簡化的現實。

另一方面,對於客觀性的追求、傳感器的無處不在以及收集的數據的指數性增長預示著這樣一個科學幻想——現象的全方位再現、世界的絕對數字化。科學後果:研究某塊骨頭的病理時,我們使用來自10萬名患者的10萬組極其完整的數據。我們有了前所未有的機會去理解一個現象,或者至少完整記錄這一現象,沒有任何遺漏。深入到日常:連接的人類。每秒鐘傳感器都分析著你的血壓;你在宇宙中的位置不斷被捕捉。你也經歷了轉變,成了數據生成者,而且生成的量越來越大。最終,這些數據價值幾何呢?換句話說,數據怎麼樣才能成為事實——信息——知識這一鏈條的一部分呢?

把數據理解成信息的原子的理論侷限性就在於它無法解釋這一轉變的方方面面。而牛津互聯網學院(Oxford Internet Insititue)的哲學教授和研究主任盧西亞諾·佛羅利迪(Luciano Floridi)看待該問題的角度打破了這種侷限性。

数据的哲学

他對於以數據為基礎來定義信息是否可行提出了質疑。換句話說,他通過問“什麼使得數據能夠產生信息?”來懷疑數據的語義定義。

首先,他採用了一個十分嚴謹的數據定義:“數據是在某一情境下有關差異或統一性缺乏的推定事實”。

這一現實架構中的差異在特定條件下使得信息成為可能。佛羅利迪提出了三個先決條件:1)要求一份或更多數據;2)這些數據必須是可取的,即它們必須是根據特定規則組合起來的;3)這些數據是有意義的,即可以通過不同方式去闡釋、翻譯或表達。

由此,數據可以被定義為一個關係實體,這是其十分關鍵的一個特點。

要理解這一特點,我們可以看看佛羅利迪的理論是如何闡明“差異”和“統一性缺乏”這兩個概念的。根據佛羅利迪,這兩個概念涉及希臘人所說的“diaphora”,即缺口。他提出了“數據的缺口定義”,適用於三個層面。

第一層,數據可以被定義為“diaphora de re”,即現實中統一性之缺乏。對於“自然界裡的數據”目前並無標準說法。一種叫法是把數據稱作“dedomen”(這是英文詞數據data的古希臘文翻譯)。此外應該注意到,從詞源的角度來說,數據的拉丁文中是“datum”,其最早出現在歐幾里得的一本名叫Dedomena的作品的譯本里。人不能直接認識數據,而是通過經驗推斷出來。

佛羅利迪解釋說,“dedomena”是純粹的數據或是原型認識論數據,即還未從認識論的角度被解讀過的數據。作為“現實架構中的斷裂”,人們既無法接近它們,也不能抽象地對其進行獨立的闡釋,也無法從認識論的角度去體會它們;其存在是憑經驗推導出來的(也是經驗要求的)。

除了原型認識論數據,數據還是兩種物理狀態間的“diaphora de signo”,即統一性之缺乏:一個電池不同的電量,一通電話的電信號或者摩爾斯電碼的一個點。

最後一個層面,數據是“diaphora de dicto”,即兩個符號間統一性之缺乏,比如拉丁字母表裡的A和B。

“diaphora”這一概念提綱挈領的提出了數據的三個層面,它指出了一種分歧:事物開始產生差異的時刻;我們需為這一差異尋找意義。數據是象徵性實體,它將這種差異符號化,它的兩端,一頭是(很容易被稱作無關緊要的)差異,另一頭是意義。最終,數據是一個臨界點,從這裡開始,無關緊要變得舉足輕重。

数据的哲学
数据的哲学

布魯諾·特博爾

高級副總裁,科學與創新部,奇利匙集團

布魯諾·特博爾,巴黎綜合理工學院哲學學士,認知科學碩士(聯合碩士,與巴黎高等師範學院、法國社會科學高等學院和巴黎文理研究大學聯合授予),巴黎高等商學院高級工商管理碩士,巴黎第九大學博士。超過20年大型企業工作經驗(包括Boulanger、歐迪辦公、碧諾-春天-雷都、法國郵政、老佛爺百貨、家樂福、Devoteam),主要負責營銷和數字化管理。

他同時還是一名互聯網企業家(1998年QXL,2006年BrandAlley)。2013年起,他成為奇利匙集團科學與創新部高級副總裁以及巴黎綜合理工學院數據科學家主席治理委員會成員(奇利匙、泰雷茲集團和Orange)。

他的研究工作跨越多個學科(哲學、經濟學、數字技術),圍繞對於數字化顛覆以及其社會影響的分析展開。他發表文章眾多,出版多部作品,著名的包括《經濟的優步化》(優步化=經濟顛覆?Kawa, 2015年3月)以及《大數據》(數據非既定—大數據與戰略,Kawa, 2016年7月)。

創瞰巴黎是《巴黎創新評論》(Paris Innovation Review)的中文版,致力於為全球商界與公共領袖提供深度科技、藝術、人文評論。

可免費拷貝、分享、散發,但須註明作者與來源,不得改寫,不得用於商業用途。

感知現今,觸摸未來,請與我同步!

長按上方二維碼,選擇“識別圖中二維碼”,即可關注。


分享到:


相關文章: