「大數據」時代，我們不能把數據當人看科技頭條網

2018-09-21 16:51:44 創客玫瑰

目前這一歷史時期最大的創新就在於，我們的生活現在由收集數據的計算機調控著。在這個時代，頭腦無法理解的複雜情況，數據可以幫我們解讀其中的含義。數據可以彌補我們對直覺的過分自信，數據可以減輕慾望對知覺的扭曲程度。

但有，些事情是“大數據”不擅長的，下面我會一一道來：

數據不懂社交。大腦在數學方面很差勁（不信請迅速心算一下437的平方根是多少），但是大腦懂得社會認知。人們擅長反射彼此的情緒狀態，擅長偵測出不合作的行為，擅長用情緒為事物賦予價值。

計算機數據分析擅長的是測量社會交往的“量”而非“質”。網絡科學家可以測量出你在76%的時間裡與6名同事的社交互動情況，但是他們不可能捕捉到你心底對於那些一年才見2次的兒時玩伴的感情，更不必說但丁對於僅有兩面之緣的貝阿特麗斯的感情了。因此，在社交關係的決策中，不要愚蠢到放棄頭腦中那臺充滿魔力的機器，而去相信你辦工作上的那臺機器。

數據不懂背景。人類的決策不是離散的事件，而是鑲嵌在時間序列和背景之中的。經過數百萬年的演化，人腦已經變得善於處理這樣的現實。人們擅長講述交織了多重原因和多重背景的故事。數據分析則不懂得如何敘事，也不懂得思維的浮現過程。即便是一部普普通通的小說，數據分析也無法解釋其中的思路。

數據會製造出更大的“乾草垛”。這一觀點是由納西姆•塔勒布（Nassim Taleb，著名商業思想家，著有《黑天鵝：如何應對不可知的未來》等書作）提出的。隨著我們掌握的數據越來越多，可以發現的統計上顯著的相關關係也就越來越多。這些相關關係中，有很多都是沒有實際意義的，在真正解決問題時很可能將人引入歧途。這種欺騙性會隨著數據的增多而指數級地增長。在這個龐大的“乾草垛”裡，我們要找的那根針被越埋越深。大數據時代的特徵之一就是，“重大”發現的數量被數據擴張帶來的噪音所淹沒。

大數據無法解決大問題。如果你只想分析哪些郵件可以帶來最多的競選資金贊助，你可以做一個隨機控制實驗。但假設目標是刺激衰退期的經濟形勢，你就不可能找到一個平行世界中的社會來當對照組。最佳的經濟刺激手段到底是什麼？人們對此爭論不休，儘管數據像海浪一般湧來，就我所知，這場辯論中尚未有哪位主要“辯手”因為參考了數據分析而改變立場的。

數據偏愛潮流，忽視傑作。當大量個體對某種文化產品迅速產生興趣時，數據分析可以敏銳地偵測到這種趨勢。但是，一些重要的（也是有收益的）產品在一開始就被數據擯棄了，僅僅因為它們的特異之處不為人所熟知。

數據掩蓋了價值觀念。我最近讀到一本有著精彩標題的學術專著——《‘原始數據’只是一種修辭》。書中的要點之一就是，數據從來都不可能是“原始”的，數據總是依照某人的傾向和價值觀念而被構建出來的。數據分析的結果看似客觀公正，但其實價值選擇貫穿了從構建到解讀的全過程。

這篇文章並不是要批評大數據不是一種偉大的工具。只是，和任何一種工具一樣，大數據有拿手強項，也有不擅長的領域。正如耶魯大學的愛德華•圖弗特教授（Edward Tufte）所說：“這個世界的有趣之處，遠勝任何一門學科。”

摘取編譯自：《紐約時報》，What Data Cannot Do

分享到:

閱讀更多 創客玫瑰 的文章

關鍵字: 一一道來科技當人