擁抱“數據+算法”定義的新世界

產業智能官

以下文章來源於阿里研究院 ,作者安筱鵬

擁抱“數據+算法”定義的新世界

阿里研究院

阿里研究院依託阿里巴巴集團海量數據、深耕小企業前沿案例、集結全球商業智慧,以開放、合作、共建、共享的方式打造具影響力的新商業知識平臺。 阿里研究,洞察數據,共創新知! 官方網站http://www.aliresearch.com/

安筱鵬 阿里研究院

幾千年來,人類社會一直面臨的重大挑戰是,如何在不確定性的環境中進行決策。2000多年前人們面臨重大決策、面對不確定性常用的方式就是占卜。五百多年前,宗教是人類面在不確定性的環境中進行選擇的依靠。一百年前,人類送上月球的每一個決策、飛機研發的每一次重大決策的背後是基於科學。今天,我們有了認識世界和進行決策的新方法:“數據+算法”。

擁抱“數據+算法”定義的新世界

以下是發言整理:

數據+算法定義的世界

——面對不確定性人類如何選擇

各位院士、專家,大家上午好!

在清華這個最高學府討論大數據這個前沿課題,對於我這個經濟學背景的人而言,有著巨大的壓力和挑戰。我經常是在技術專家面前講經濟,在經濟學專家面前講技術,所以我今天不給大家講具體技術,講講技術帶來經濟社會影響,看看信息通信技術究竟給我們帶來了什麼了。

幾千年來,人類如何進行決策?

幾千年來,人類社會一直面臨的重大挑戰是,如何在不確定性的環境中進行決策,從遊牧社會、農業社會、工業社會到信息社會,這都是一個永恆的話題,而在過去幾千年人類是如何進行決策?我們來思考一下過去的2000年、500年、100年和今天,在不確定性的世界中人類如何進行決策,什麼東西在影響人類決策。

兩千年前,夏商周的首領要開打一場戰爭(猶如當年的貿易戰),他們怎麼進行決策?《史記·龜策列傳》中記載“自古聖王將建國受命,興動事業,何嘗不寶卜筮以助善!”,是通過占卜來進行決策。面對一觸即發的部落戰爭,出征前面對戰爭結果的無常,部落首領、諸侯國王們,求助龜殼裂紋、星象占卜,以預測等各種重大事件的走向,指導重大決策。

那小國寡民如何進行決策?《詩經》記載“爾卜爾筮,體無咎言,以爾車來,以我賄遷”。年經的姑娘要出嫁了,不知道未來自己的婚姻是否幸福,那麼就告訴他的新郎爾卜爾筮,通過占卜的方式看看這場婚姻是吉是兇,如果卦象沒有什麼不吉,那就選一個黃道吉日開著車然後把我和我的嫁妝帶回去。

2000多年前人們面臨重大決策、面對不確定性常用的方式就是占卜。

五百多年前,西歐封建制度開始解體,宗教改革步伐不斷加快,新教在西北歐取得了主導地位,有專家認為這是造成歐洲經濟發達水平北歐比南歐好、西歐比東歐好的重要原因。

馬克斯·韋伯在《新教倫理與資本主義精神》指出,新教倫理與企業家精神是相通的。新教宣傳什麼理念呢?就是“拼命掙錢—拼命省錢—拼命捐錢”,而不像一部分人想的那樣,拼命掙錢的目的是為了拼命花錢。因為企業家認為世俗經濟行為的成功不是為了創造可供於享受和揮霍的財富,而是為了證明自己是上帝的一個選民。

在這一種情況下,當企業家們面對各種不確定性進行決策的時候,他們的依據是什麼,是新教思想影響著他們的決策,宗教是人類面在不確定性的環境中進行選擇的依靠。

一百年前,愛迪生經過幾千次試驗發明了電燈,1969年美國人把人類送到了月球,同年也研發出波音747並實現首飛。人類送上月球的每一個決策、飛機研發的每一次重大決策的背後是基於什麼?是科學。要發射火箭怎麼來決策?需要計算發射窗口期,要計算月球跟地球的距離,要預測未來天氣的變化,所有的這些所有都是基於科學的決策。飛機的外形如何選擇、材料如何選擇,背後都是基於風洞試驗等空氣動力學規律去選擇,背後是

科學

今天,我們有了認識世界和進行決策的新的方法論。

我們清華大學工業大數據中心在青海有一個風電功率預測項目,能夠對未來(明天、後天)風機的風力發電量進行準確預測;美國Uptake公司,需要對卡特彼勒工程機械運行狀態進行預估,實現產品全生命週期的服務;新零售企業盒馬鮮生,它只賣當天新鮮的產品,今天沒有賣完就扔掉,需要對當天賣什麼樣的產品,銷售量是多少進行決策;我們的手機用戶,每天瀏覽的今日頭條、淘寶看到的首頁都是千人千面。這是一種新的決策方式,這種決策方式叫做“數據+算法”。

“數據+算法”的決策機制,不是對已有決策機制的一種替代,是增加了一種新的決策方式。

並非因為有了宗教,我們就不去占卜(許多現代人仍在用占卜的方式進行決策),占卜的方法在今天仍然很適用。我們用科學方法、科技的規律指導人們決策,但是宗教在很多時候仍然在發揮很重要的作用。現在我們又有了一種新的應對不確定性的方式,就是“數據+算法”。

擁抱“數據+算法”定義的新世界

應對不確定性是人類永恆的挑戰,關於如何理解和認識不確定性,我們有三個基本結論:一是隻有深刻認識不確定性,才能理解數字經濟的本質;二是對不確定性的恐懼是人類社會認知的動力;三是不確定性源於信息約束條件下人們有限的認知能力。

化解不確定性需要經過“三部曲”

在過去上千年裡,每一個個體、族群、部落、企業、國家等都要經歷各種各樣的事件發生,如戰爭、衝突、氣候災害、狩獵、農耕,以及企業的競爭和國家之間貿易,比如中美貿易戰。

我們都面臨著在不確定性的環境中如何進行決策的問題。這些決策正確與否會導致事情的成敗、得失、利弊、對錯、好壞、優劣等結果。而這些結果又會影響我們個人的幸福(我跟他結婚我是不是很幸福我不知道),部落的興衰,企業的成長,國家的繁榮,歷史的走向。

那麼,如何來化解這些不確定性,需要經過“三部曲”。第一,我們首先要理解這個世界,理解和認知這個規律,這是我們化解不確定性的邏輯起點;第二,理解之後我們要預測將會發生什麼,這是做出決策的基礎和依據;第三,我們要去控制,是將決策付諸行動的具體路徑。所以我們剛才講的所有,無論是占卜也好,科學、宗教、哲學、科學也好,從本質上來說,都是來告訴我們如何化解在決策的時候面對的種種不確定性。

擁抱“數據+算法”定義的新世界

對不確定性認知的分野:從哲學到科學

對於不確定性的認知,也是從哲學到科學分化的一個重要的因素。

我們如何來認知不確定性,從哲學來看,在古希臘一開始就分成了兩種不同的學派,到了近代形成了以笛卡爾為代表的確定性世界,認為這個世界是有序的、統一的、必然的、精確的及可預見的;而尼采、康德認為這個世界是無序的、差異的、隨機的、模糊的不確定性世界。

從科學來看,由哥白尼“日心說”到伽利略再到牛頓三大定律,近現代科學成就不斷強化人們基於確定性邏輯規律的認知,使得我們認為所有的世界,都可以用確定性據描述。然而,海森堡的“測不準”原理、哥德爾的不完全定理,阿羅社會選擇理論不可能性定理,並稱為二十世紀不確定性的三大發現。我們發現很多時候,這個世界並不是像牛頓定律所描述的那樣是確定可預測的。

從經濟學來看,對於不確定性的認知,始於芝加哥學派創始人奈特,將不確定性引入到經濟學,打破了經濟學研究中此前一般均衡分析為核心的對確定性環境的假設。對不確定性我們認為是信息經濟學、行為經濟學、制度經濟學、演化經濟學的一個基礎理論。

最後我們大家熟悉的,從信息論來看,信息是幹什麼的,克勞德·香農定義“信息是用來減少隨機不確定性的東西,信息的價值是確定性的增加”,信息最重要就是要減少不確定性而增加確定性。

擁抱“數據+算法”定義的新世界

什麼是企業?企業的本質是什麼?

我們今天討論的是工業大數據,那麼我們回到企業,什麼是企業?企業的本質是什麼?我認為在不確定性的世界中進行決策是企業最本質的屬性。

企業是一種組織,這種組織跟市場、政府是一樣的,它是一種配置資源效率的組織,政府可以配置資源,企業可以配置資源,市場也可以配置資源。企業競爭的本質是什麼?企業競爭的本質就是資源配置效率的競爭,就是以數據自動流動化解複雜系統的不確定性,優化製造企業的配置效率。企業面臨什麼樣的挑戰?我們走進工廠、車間、研發室,會發現企業在思考什麼問題:企業思考如何縮短一個產品的研發週期、如何提高一個班組產量、如何提高一個機床的使用精度、如何提高一組設備的使用效率,所有這些問題,都可以歸結為一個問題,就是如何提高資源配置效率。

擁抱“數據+算法”定義的新世界

面臨這些問題,企業有各種各樣的決策,在信息不完備、不確定性的環境中決策,包括:新品開發是決策,客戶定位是決策,營銷策略是決策,研發組織是決策,供應鏈選擇是決策,交付週期是決策,庫存管理是決策,排產計劃是決策,商業模式是決策,所有的都是決策。

那麼企業如何進行決策,對於應用工業大數據來說,怎麼支撐企業決策?就是要將正確的數據,在正確的時間,以正確的方式傳遞給正確的人和機器。這就是基於工業大數據,在不確定性的環境中如何形成決策。

談一個紅領的例子,青島紅領是一家個性化定製服裝企業,是國家智能製造的試點示範企業,有些企業高管參觀後感到非常失望,因為沒有想象中一排排機器人、一條條先進生產線、忙亂而有序的AGV小車,而是一排排的工人在用手工的方式加工衣服,是一個典型的勞動密集型企業生產場景。

企業家們感到困惑的是,這樣一個典型的勞動密集型企業為什麼是智能製造的試點示範企業?

有人說他跟富士康沒有區別,不是沒有區別,而是根本就比不上富士康,富士康的自動化生產線、切片機、機器人是非常先進,紅領跟富士康有什麼不同呢?

我認為自動化分為兩種。一種自動化是生產裝備自動化,叫做看得見自動化,機器換人,立體倉庫,忙碌而有序的AGV小車。還有一種叫做看不見的自動化,就是數據融合在物理世界裡面自動地去流動,把正確的數據在正確的時間傳遞給正確的人和機器。當你採集一個人上身的18個部位,22個指標之後,這一個指標首先自動生成一個適合這個人體型的一個版形,自動生成一個數控機床的加工指令,自動生成200個工序的加工工藝,定製化生產跟規模化生產相比,其複雜度、面臨的不確定性遠遠地超出幾個量級。

算法:將不確定性轉化為確定性的最優路徑

軟件如何解決這一個問題,我想最基本的一個語言就是“if…then…”,將不確定性轉化為確定性。“if:A”“if:B”是不確定性的,而“Then A1”“Then B1”就變成了一個確定性,這一轉變過程就需要算法。那麼把不確定性轉變為確定性是否準確呢?這取決於你的數據及時性、準確性、完整性。

擁抱“數據+算法”定義的新世界

從規模化生產演進到個性化定製,這其中不確定性在逐漸增加。就像一場射擊比賽,規模化生產是一個固定靶,大規模定製相當於移動靶,而個性化定製就像一個射擊空中飛碟。要不斷地感知它從哪飛起來,在哪拐彎,速度有多快,然後去分析、判斷,進而決策執行。

擁抱“數據+算法”定義的新世界

在過去的一兩百年已經完美地解決了產品的成本質量效率問題,而個性化定製出現的時候,過去已經解決了成本質量效率問題又重新冒出來的。不確定性又重新增加了,怎麼解決?需要“數據+算法”。美國國家標準與技術研究院,對智能製造有一個定義,這個定義的核心詞,我認為就是要對不確定性系統增加它的確定性。

做一個總結,如何能夠把正確的數據在正確的時間,以正確的方式傳遞給正確的人和機器,需要具備兩個條件:一是隱性數據的顯性化,實現數據的完整性、及時性、準確性,把大量蘊含在生產製造過程、經營管理、客戶行為、全生命週期服務的隱性數據不斷被採集、匯聚、加工。二是隱性知識的顯性化,就是對工業研發技術、生產工藝、業務流程、員工技能、管理理念等知識的邏輯化、數字化和模型化,使得大量隱性工業知識被固化在各類軟件和信息系統中。

擁抱“數據+算法”定義的新世界

一方面,我們有及時、完整、準確的數據,另一方面,我們有大量的隱性知識顯性化的軟件,不斷將這些數據輸送到這些軟件中間,進而將數據轉化為信息、信息轉化為知識、知識轉化為決策,再用決策去優化我們所看到的物理世界。

在這一過程中軟件是核心。那麼,軟件是什麼?軟件的本質是事物運行規律的代碼化,構造了數據自動流動的一套規則體系,無論是愛因斯坦的質能方程,還是牛頓的三大規律,都是我們認識這個物理世界的方式。我們把規律模型化、模型算法化、算法代碼化、代碼軟件化,再用軟件化去優化,我們構建了三個世界,物理世界、意識世界、數字世界。

過去,人類直接面對這一個物理世界,而今天,我們找了一個代理人,這一個代理人是誰呢?就是賽博空間。就像無人駕駛,過去我們要自己開車,現在你不需要自己開,你找一個代理人,這一個人叫無人駕駛,幫助你去感知、決策、執行。

數字經濟的本質:數據+模型=服務

兩年多前,我曾去過達索公司,達索公司有一個科學家給我們講心臟的構造,講心臟中離子濃度梯度穿過心肌細胞的脈衝變化,講心臟的某一塊肌肉的拉力極限是多少。

這樣一個我們認為的軟件公司,跟很多醫院一起研究心臟的構造、機理,他們要研究心臟的運動規律,物理的、化學的、生物的運動規律,他們把這一個運動規律模型化、模型算法化、算法代碼化,最終是要構建一個數字心臟。

研發這一個數字心臟的科學家就是達索公司的部門高級總監(Steve Levine)史蒂夫·勒溫博士,原因是他的女兒傑西(Jesse),一出生就被發現主動脈和心室存在異位的情況。在她兩歲時,由於心臟生理系統發生故障,傑西便安裝了心臟起搏器,並且每年需要做心臟手術。每次手術之前,醫生都需要讓史蒂夫簽字,並告訴他你的女兒推進手術室之後有可能會失去生命,史蒂夫每一次都深受煎熬,他夢想有一天能研發這樣一個數字心臟。

擁抱“數據+算法”定義的新世界

這一個數字心臟有什麼價值呢?用我的話說,就是“數據+算法=服務”,構建了一個數字心臟,首先對心臟做了一個造影,造影是幹什麼?採集數據,建立了一個數字模型,實現四類功能:一是描述,這一個物理世界發生了什麼在虛擬世界去描述,心臟的血管哪一個地方堵了,堵了多少,可以360度去觀察。二是診斷,為什麼會堵,是什麼樣的原因造成了心臟血管堵塞;三是預測,如果沒有人為去幹預,半年之後、一年之後、兩年之後,這一個血管從堵到30%發展到70%,另外一個旁支血管也會堵,它會告訴你將會發生什麼;四是決策,最後怎麼辦,是採取保守治療,還是去做搭橋手術,給醫生提供一個解決方案供參考。

在這一過程中,數字心臟可以幫助我們改進醫療設備的研發效率、預測器械植入心臟的功能、進行心臟複雜醫學教學、加快科研創新轉化為臨床醫學實踐。

所以“數據+模型”,或者“數據+算法”構造了我們認識這一個世界新的方法。

如果說我們把過去人類社會認識客觀世界的方法論做一個總結的話,可以有四個階段。一是理論推理,天才科學家通過“觀察+抽象”去認識這個世界,比如牛頓的定律,愛因斯坦的相對論;二是實驗驗證,愛迪生髮明電燈泡,我們現在發明汽車做二三十次碰撞實驗,飛機做風洞實驗驗證;三是模擬擇優,在虛擬世界裡面去實驗發現物理世界的規律,再反饋到現實世界指導人們的實踐,高鐵、飛機不用做幾千幾萬小時的風洞試驗,汽車不用做幾十次碰撞實驗,這些都可以在虛擬世界去完成,通過數字世界的模擬選擇最優化的結果;四是大數據分析,就是通過大數據發現物理世界新的規律。無論是模擬還是大數據分析,它背後的邏輯都在用“數據+算法”的模式。

擁抱“數據+算法”定義的新世界

2013年的諾貝爾化學獎,因發展了複雜化學體系中的多尺度模型,頒給了三位美國科學家馬丁·卡普魯斯、邁克爾·賴韋特和亞利耶·瓦謝爾因。這三位科學家的貢獻就是構建了一個做實驗的方法論,做化學實驗的方法論,這一個方法論就是在計算機裡邊去做實驗,它實際就是我們剛才說的“數據+算法”的另一種的表現形式。

過去你整天在實驗室做實驗,現在有一部分實驗可以在計算機裡面去做。對於製造業也是一樣,過去架飛機從立項到交付需要二十多年的設計製造過程,現在只需要五六年的時間,因為人們構建了一個新的認識和改造世界方法論。高鐵可以通過虛擬的高鐵在虛擬的京滬線上跑起來,運行到兩百公里、三百公里、五百公里時速,來測它的穩定性,通過快速迭代,構造了一個改造和認識世界的方法論即“數據+模型”這一新方法論。

擁抱“數據+算法”定義的新世界

數字化的邏輯殊途同歸:數字孿生

可以設想一下,未來十年、二十年、三十年之後,或者我們思考一個問題:數字化的終極版圖是什麼?從未來看現在,我們今天所看到的物聯網、大數據、雲計算、人工智能、工業軟件等技術,都是未來數字化終極版圖的一個碎片,ICT技術發展及應用的過程,就是我們不斷把這個碎片化的模塊拼一個幅完整版圖過程,我們都是拼圖人。

那麼形成的最終圖景是什麼呢?答案就是數字孿生,就是我們不斷地把碎片化物理世界數字化後,在CYBER空間構造成一個碎片化的數字孿生體,然後把這個碎片化的孿生體拼成一個完整的數字孿生體,直至構造一個數字孿生的世界,從我剛才講的數字孿生的心臟,數字孿生的飛機,數字孿生的建築,到數字孿生的城市,我們都走在構造數字孿生世界的大道上。

我們在虛擬世界構造一個數字孿生,並且不斷的與物理世界進行交互、優化,這樣的一個過程將會經歷三個階段,即局部的數字的孿生階段,靜態的數字孿生階段和動態的數字孿生階段

那麼動態的數字卵生階段需要什麼時候實現,可能需要二十年或者更長的時間,現在我們僅僅處於一個局部的數字孿生階段,而靜態的數字孿生,就是在虛擬世界裡構造一個物理世界,但數據不是實時的,需要一個週期。

我曾經與西門子技術專家交流過,如果從數字孿生的三個階段來看,他們已經實現了實驗室階段的靜態數字孿生,西門子做了一個咖啡壺數字孿生生產線,生產線當天的運行數據,在下班後輸送給數字孿生體進行優化,指導優化第二天的產品生產。而真正實現動態數字孿生還需要很長的一段時間。所以構造一個數字孿生,其背後的邏輯就是“數據+算法=服務”,它可以縮短產品的研發週期,可以提高建築物的資源優化效率,可以提供一種新的醫學分析途徑,可以構造一種城市的資源配置新模式。

擁抱“數據+算法”定義的新世界

最後做一個總結,數字經濟的本質,就是“數據+算法=服務”。這數據來自於機器數據、業務數據、產品模型數據,需要物聯網、傳感器等不斷獲取。算法部署在雲端,包括兩種形式。一種是機理模型、一種是人工智能模型或者叫做大數據模型。“數據+”,“+”是什麼?“+”就是網絡,5G、NB-IoT、TSN、以太網等等,數據+算法帶來了服務,這個服務包括四個層次:一是描述這個世界(發生了什麼?),二是診斷這個世界(為什麼發生),三是預測這個世界(將會發生什麼?),四是進行決策(應該怎麼辦?),最後實現優化資源配置效率。這是一種全新的認識和改造這個世界的方法論。

謝謝大家。


分享到:


相關文章: