百分之九十不懂大數據的人,掌握高中數學就可以看懂

百分之九十不懂大數據的人,掌握高中數學就可以看懂

從發現火種到使用鐵器,從物物交換到貨幣出現,人類對於世界的探索永不停息。

我們曾為青黴素的發現欣喜若狂,為人類登上月球歡呼雀躍,每一次科學的蹣跚前行,都帶來人類社會的一次大飛躍。

活在這個時代的我們,享受前輩帶來的便利,承載著讓後人過的更加美好的重任,將目光鎖定下一個可以為人類帶來進步的事物。

數據這個詞最初應用於天體物理學、基因組學和互聯網搜索引擎等領域的詞語在2016年變得具有多重意思。它被商人當做新潮概念炒作,被地方政府當做經濟的萬能靈藥,有人懷疑大數據既不經濟也不創造實際價值,也有人抱怨對大數據潛力的挖掘遠遠不夠。

我們將穿透是是非非,還你一個真實地大數據。

一 什麼是數據?

百分之九十不懂大數據的人,掌握高中數學就可以看懂

簡單說,數據是將客觀世界數字化觀察測量的結果,是搭建房屋的磚石瓦塊。單純的數據起初被當做經驗保存,書本,基因和人類的記憶都是數據的載體。

人類起初對身邊的事物懵懂,在探索未知的世界中學會了用火取暖,用鐵器耕田。為了繁衍開始抱團,產生了組織和國家。

這是一個很漫長的過程,我們每段基因的產生和軀體的進化都證明了這個過程的存在。當有規模的人類組織出現以後,個體的數據就開始被重新構建成適合集體生存的經驗。

中國古代的《易經》證明了這一點,一個可能叫伏羲的氏族把水地火風用“爻”來排序,在商代,甲骨文短短的幾個字描述了某年的天氣和吉凶。這些都表達出了在生產力極度低下的時代,我們的先人如何記錄數據,使用數據。

顯然,這些都稱不上大數據,當我們對於這個世界的認識越多,積累的數據越廣,量變上升到了質變,從數據就變成了大數據。

這個“大”字有數學上的概念,在海量數據的背後,體現出的是生產力的極大進步。

二 大數據的興起

百分之九十不懂大數據的人,掌握高中數學就可以看懂

計算機的出現極大程度上解決了人類處理問題的方式,我們的思維從平面跳躍到了更高維度,很多窮盡人類精力都難以計算出來的數學問題通過計算機得以解決。

當年放言計算機無用的謠言煙消雲散,人類從來沒有像今天這麼縮小距離,兩個素未謀面的人可以愉快的分享看法,

在互聯網的另一端你甚至不知道是不是坐著一隻狗。越來越多被稱為智能的機器出現,確保他們運行的是各種計算機系統,它們生產數據也記錄數據。

大數據的概念在這樣的環境下悄然興起。時代的浪潮很快將大數據,互聯網思維,比特幣這樣的新名詞推送給普通用戶。

全世界幾乎一夜之間變了,人人變得瘋狂不理性,股市充滿了投機分子,政客們期待用互聯網帶動GDP,坊間到處都是關於互聯網的討論。

一個被稱為萬物互聯的時代到來,機器成了人類思維的延伸,很多人看來這不可思議,更多的人被時代洪流推動,被迫捲入到對未來的思考。

商機,陰謀,未來,滿世界都是大數據,有人看到了月亮,有人看到了鈔票。

不同人的世界總是不同的,互聯網也有江湖,而且水深。

三 大數據的紅與黑

百分之九十不懂大數據的人,掌握高中數學就可以看懂

2014年9月1號,好萊塢眾多女性的豔照被傳出,央視15套新聞頻道將矛頭直指蘋果icloud雲服務有重大漏洞,一時之間輿論譁然,不少不懂數據為何物的中國人甚至公開發起了抵制蘋果手機的言論。

這些都反映出了民眾對於隱私的擔憂。在大數據時代,每個人都相當於互聯網上的透明人,保護的人隱私在法律上難以得到嚴格的執行。

以社工庫為例,社工庫是黑客用來記錄攻擊手段和方法的數據庫,這個數據庫裡面有大量的信息,甚至可以找到每個人各種行為記錄

(每個人在每個網站上的賬號、密碼、分享的照片、信用卡記錄、訂的機票記錄、通話記錄、短信內容、各種社交軟件的聊天等等包羅萬象)

百分之九十不懂大數據的人,掌握高中數學就可以看懂

筆者花錢註冊過一個社工庫,通過查詢身份證的方式找到了自己的開房記錄,這些本該由公安部門蒐集的資料任人售賣,筆者甚至可以通過郵箱查到自己已經忘記註冊的網站。

這裡面隱含的邏輯很恐怖,

如果數據是可以售賣交換的,承載的健康,安全等信息也是可以被買到的

據不完全統計,中國2015年智能手機一年出產2億部,數以億計的智能手機用戶無時無刻不在創造數據,目前可穿戴設備受限於技術難以實現商業用途,大部分商家把手機當做連接未來的接口。

百分之九十不懂大數據的人,掌握高中數學就可以看懂

這些數據告訴我們,當大數據技術用在醫療上又廣泛的前景。中國當前的醫患關係極其緊張,資源利用不當很嚴重。小病大治,大病小治的問題經常發生。醫療健康技術可以有效緩解這些矛盾。

可要求從業人員具有相當程度的醫療水準,患者有一定的道德基礎,對科技產品有一定的熟悉程度。

套用各國的經驗顯然不太妥當,相比其他各國,中國所面臨的數據處理量更大。

百分之九十不懂大數據的人,掌握高中數學就可以看懂

更大的問題是會加劇不平等。醫療資源往一個地方聚集,大數據的資源被某些人掌握,你無法保證資源過度集中會不會造成高度的腐敗,當有人拿你的手機牟利時,維權是將成為一個很難解決的問題。

然而,數據是沒有屬性的,它是任人打扮的小姑娘,互聯網只不過是它的遮羞布。

用某度搜索雙眼皮的時候彈出的第一條內容是整形,這具有很強的誘導作用。弔詭的是,某度既不為搜素結果負責,不會因為就診出現問題受到處罰,而且可以心安理得的對出現問題視而不見。

數據是客觀的,問題在於解釋並使用數據的人。

四 總結

目前來看,大數據在地理,醫療,金融等諸多行業應用廣泛。

坦白講,大數據的發掘目前還在初級階段,涉及大數據的大部分問題,用百分之九十的初等數學就可以解釋。

當然,像你兜售大數據這種概念的人往往是惦記著你口袋裡的錢。事實上,多數技術用到的數學模型僅僅是初級數學,多數人都可以讀懂。那大數據這種高大上概念的人很有可能是在忽悠你

百分之九十不懂大數據的人,掌握高中數學就可以看懂

文末附上我問劉萬里博士的幾個問題:

我:大數據會加劇不平等嗎?我們知道中國的醫療精英都聚集在大城市,鄉鎮的醫務水準不高,基礎投入低

劉:當然會 就像互聯網開始滲透進某一行業的時候 像滴滴打車剛出來一樣,不過我們要表現出歷史理性 把握好工具中立性

我:心理學上更加強調個體的差異,而大數據用百分比統計,會不會忽略個體,或者小部分人?

劉:所以我的talk裡強調大數據要回頭和小數據結合 這裡其實是有大量機會的 但目前技術還沒有發展到那個階段。目前熱點還是從小數據向大數據集中的過程 以後必然要到那一步的 然後就會出現現在老人家也可以手機打車這樣的好結果了

我:你指的大數據和小數據是相對的嗎?比如美國相對於中國,中國是大數據,而美國相對於某個州,則是大數據。

劉:大是宏觀 ,小是微觀,是相對的概念。

我:從哲學上來看,這些有規律的數據,能被稱作上帝嗎?

劉:你太有哲學思維了,這牽扯到數學的意義。

我:可能我看到的分析不少是哲學博士所寫的,受到了影響。

劉:數學是這個世界的本質,還是人類理解世界的工具?不同的人的答案是不同的,我也不知道哪個正確。

我:最後一個問題,未來會更好嗎?

劉:我誠懇的回答,我不知道。但為了讓你感覺好一些,我覺得明天會更好,明年也許會更好。但是往後不一定。

因為取決於你如何定義世界和如何定義好。


分享到:


相關文章: