聽五年大數據專家深度解析:大數據的大價值,大數據五大成功案例

前言

聽五年大數據專家深度解析:大數據的大價值,大數據五大成功案例

大數據的熱潮並未有消褪跡象,相反,包括航空、金融、電商、政府、電信、電力甚至F1賽車等各個行業的企業都在紛紛掘金大數據。可以看出,在推動大數據企業應用方面,真正看到大數據潛在商業價值的企業比大數據技術廠商還要著急。例如IT經理網曾經報道過沃爾瑪大數據實驗室直接參與到大數據工具的開發和開源工作中。但是在國內,雖然管理學界和財經媒體對大數據推崇備至,認為大數據是信息技術改變商業世界的殺手 應用,但是關於大數據中國企業的成功案例的報道卻出奇地少。

最近《中國企業家》的“大數據專題”特別報道採訪了農夫山泉、阿迪達斯中國和數家航班信息移動服務商(前兩家為SAP客戶),為我們帶來了詳實的大數據案例報道,非常有參考價值,原文轉載如下:

就在製作這期“大數據專題”時,編輯部發生熱烈討論:什麼是大數據?編輯記者們旁徵博引,試圖將數據堆砌的商業案例剔除,真正的、實用性強的數據挖掘故事留下。

我們報道的是偽大數據公司?我們是否成為《駕馭大數據》一書的作者Bill Franks所稱的“大數據騙局”中的一股力量?同樣的質疑發生在阿里巴巴身上。有消息稱,3月23日,阿里巴巴以7000萬美元收購了一家移動開發者數 據統計平臺。這引發了專家們熱烈討論,它收購的真是一家大數據公司嗎?

這些質疑並非沒有道理。

中國確實沒有大數據的 土壤。“差不多先生”、“大概齊”的文化標籤一直存在。很多時候,各級政府不太需要“大數據”,形成決策的關鍵性數據只有一個數字比率(GDP)而已;其 二,對於行業主管機構來說,它們擁有大量原始數據,但它們還在試探、摸索數據開放的尺度,比如說,是開放原始數據,還是開放經過各種加工的數據?是轉讓給 擁有更高級計算和儲存能力的大型數據公司,還是將數據開源,與各種各樣的企業共享?其三,數據挖掘的工具價值並沒有完全被認同。在這個領域,硬件和軟件的 發展並不十分成熟。

即便如此,沒有人否認數據革命的到來,尤其在互聯網行業。阿里巴巴的馬雲將大數據作為戰略方向,百度的李彥宏用“框計算”來謀劃未來。即便是CBA(中國男子籃球職業聯賽)也學起了NBA(美國男籃職業聯賽)五花八門的數據統計、分析與挖掘。

在過去兩年間,大量的資本投資一些新型數據工具公司,根據美國道瓊斯風險資源(Dow Jones VentureSource)的數據,在過去的兩年時間裡,11.7億美元流向了119家數據庫軟件公司。去年,SAP市值已經超過西門子,成為德國市值 最高的上市公司,而這樣的業績部分得益於其數據庫軟件HANA的商業化,去年一年時間裡HANA帶給SAP3.92億歐元的收入,增長了142%。

但是,大數據還沒法分析、挖掘出自己的直接變現能力。在截稿日時,我們再重新讀維克托·邁爾-舍恩伯格(Viktor Mayer-Sch鰊berger)的《大數據時代:生活、工作與思維的大變革》一書,作者相信,未來,數據會成為有價值的資產。假以時日,它會大搖大擺 地進入資產負債表裡。

案例1:農夫山泉用大數據賣礦泉水

聽五年大數據專家深度解析:大數據的大價值,大數據五大成功案例

  發揮你您的想象力,選擇您認為可是的答案

   這裡是上海城鄉結合部九亭鎮新華都超市的一個角落,農夫山泉的礦泉水堆頭靜靜地擺放在這裡。來自農夫山泉的業務員每天例行公事地來到這個點,拍攝10張 照片:水怎麼擺放、位置有什麼變化、高度如何……這樣的點每個業務員一天要跑15個,按照規定,下班之前150張照片就被傳回了杭州總部。每個業務員,每 天會產生的數據量在10M,這似乎並不是個大數字。

聽五年大數據專家深度解析:大數據的大價值,大數據五大成功案例

  但農夫山泉全國有10000個業務員,這樣每天的數據就是100G,每月為3TB。當這些圖片如雪片般進入農夫山泉在杭州的機房時,這家公司的CIO胡健就會有這麼一種感覺:守著一座金山,卻不知道從哪裡挖下第一鍬。

胡健想知道的問題包括:怎樣擺放水堆更能促進銷售?什麼年齡的消費者在水堆前停留更久,他們一次購買的量多大?氣溫的變化讓購買行為發生了哪些改變?競爭對手的新包裝對銷售產生了怎樣的影響?不少問題目前也可以回答,但它們更多是基於經驗,而不是基於數據。

從2008年開始,業務員拍攝的照片就這麼被收集起來,如果按照數據的屬性來分類,“圖片”屬於典型的非關係型數據,還包括視頻、音頻等。要系統地對非 關係型數據進行分析是胡健設想的下一步計劃,這是農夫山泉在“大數據時代”必須邁出的步驟。如果超市、金融公司與農夫山泉有某種渠道來分享信息,如果類似 圖像、視頻和音頻資料可以系統分析,如果人的位置有更多的方式可以被監測到,那麼攤開在胡健面前的就是一幅基於人消費行為的畫卷,而描繪畫卷的是一組組復 雜的“0、1、1、0”。

SAP全球執行副總裁、中國研究院院長孫小群接受《中國企業家》採訪時表示,企業對於數據的挖掘使用分三個階 段,“一開始是把數據變得透明,讓大家看到數據,能夠看到數據越來越多;第二步是可以提問題,可以形成互動,很多支持的工具來幫我們做出實時分析;而 3.0時代,信息流來指導物流和資金流,現在數據要告訴我們未來,告訴我們往什麼地方走。”

SAP從2003年開始與農夫山泉在企業管理軟件ERP方面進行合作。彼時,農夫山泉僅僅是一個軟件採購和使用者,而SAP還是服務商的角色。

而等到2011年6月,SAP和農夫山泉開始共同開發基於“飲用水”這個產業形態中,運輸環境的數據場景。

關於運輸的數據場景到底有多重要呢?將自己定位成“大自然搬運工”的農夫山泉,在全國有十多個水源地。農夫山泉把水灌裝、配送、上架,一瓶超市售價2元 的550ml飲用水,其中3毛錢花在了運輸上。在農夫山泉內部,有著“搬上搬下,銀子嘩嘩”的說法。如何根據不同的變量因素來控制自己的物流成本,成為問 題的核心。

基於上述場景,SAP團隊和農夫山泉團隊開始了場景開發,他們將很多數據納入了進來:高速公路的收費、道路等級、天氣、配送中心輻射半徑、季節性變化、不同市場的售價、不同渠道的費用、各地的人力成本、甚至突發性的需求(比如某城市召開一次大型運動會)。

在沒有數據實時支撐時,農夫山泉在物流領域花了很多冤枉錢。比如某個小品相的產品(350ml飲用水),在某個城市的銷量預測不到位時,公司以往通常的 做法是通過大區間的調運,來彌補終端貨源的不足。“華北往華南運,運到半道的時候,發現華東實際有富餘,從華東調運更便宜。但很快發現對華南的預測有偏 差,華北短缺更為嚴重,華東開始往華北運。此時如果太湖突發一次汙染事件,很可能華東又出現短缺。”

這種沒頭蒼蠅的狀況讓農夫山泉頭疼 不已。在採購、倉儲、配送這條線上,農夫山泉特別希望大數據獲取解決三個頑症:首先是解決生產和銷售的不平衡,準確獲知該產多少,送多少;其次,讓400 家辦事處、30個配送中心能夠納入到體系中來,形成一個動態網狀結構,而非簡單的樹狀結構;最後,讓退貨、殘次等問題與生產基地能夠實時連接起來。

也就是說,銷售的最前端成為一個個神經末梢,它的任何一個痛點,在大腦這裡都能快速感知到。

“日常運營中,我們會產生銷售、市場費用、物流、生產、財務等數據,這些數據都是通過工具定時抽取到SAP BW或Oracle DM,再通過Business Object展現。”胡健表示,這個“展現”的過程長達24小時,也就是說,在24小時後,物流、資金流和信息流才能匯聚到一起,彼此關聯形成一份有價值 的統計報告。當農夫山泉的每月數據積累達到3TB時,這樣的速度導致農夫山泉每個月財務結算都要推遲一天。更重要的是,胡健等農夫山泉的決策者們只能依靠 數據來驗證以往的決策是否正確,或者對已出現的問題作出糾正,仍舊無法預測未來。

2011年,SAP推出了創新性的數據庫平臺SAP Hana,農夫山泉則成為全球第三個、亞洲第一個上線該系統的企業,並在當年9月宣佈系統對接成功。

胡健選擇SAP Hana的目的只有一個,快些,再快些。採用SAP Hana後,同等數據量的計算速度從過去的24小時縮短到了0.67秒,幾乎可以做到實時計算結果,這讓很多不可能的事情變為了可能。

這些基於飲用水行業實際情況反映到孫小群這裡時,這位SAP全球研發的主要負責人非常興奮。基於飲用水的場景,SAP並非沒有案例,雀巢就是SAP在全 球範圍長期的合作伙伴。但是,歐美髮達市場的整個數據採集、梳理、報告已經相當成熟,上百年的運營經驗讓這些企業已經能從容面對任何突發狀況,他們對新數 據解決方案的渴求甚至還不如中國本土公司強烈。

這對農夫山泉董事長鍾目炎目炎而言,精準的管控物流成本將不再侷限於已有的項目,也可以 針對未來的項目。這位董事長將手指放在一臺平板電腦顯示的中國地圖上,隨著手指的移動,建立一個物流配送中心的成本隨之顯示出來。數據在不斷飛快地變化, 好像手指移動產生的數字漣漪。

以往,鍾目炎目炎的執行團隊也許要經過長期的考察、論證,再形成一份報告提交給董事長,給他幾個備選方案,到底設在哪座城市,還要憑藉經驗來再做判斷。但現在,起碼從成本方面已經一覽無遺。剩下的可能是當地政府與農夫山泉的友好程度,這些無法測量的因素。

有了強大的數據分析能力做支持後,農夫山泉近年以30%-40%的年增長率,在飲用水方面快速超越了原先的三甲:娃哈哈、樂百氏和可口可樂。根據國家統 計局公佈的數據,飲用水領域的市場份額,農夫山泉、康師傅、娃哈哈、可口可樂的冰露,分別為34.8%、16.1%、14.3%、4.7%,農夫山泉幾乎 是另外三家之和。對於胡健來說,下一步他希望那些業務員蒐集來的圖像、視頻資料可以被利用起來。

獲益的不僅僅是農夫山泉,在農夫山泉場 景中積累的經驗,SAP迅速將其複製到神州租車身上。“我們客戶的車輛使用率在達到一定百分比之後出現瓶頸,這意味著還有相當比率的車輛處於空置狀態,資 源尚有優化空間。通過合作創新,我們用SAP Hana為他們特製了一個算法,優化租用流程,幫助他們打破瓶頸,將車輛使用率再次提高了15%。”

案例2:阿迪達斯的“黃金羅盤”

聽五年大數據專家深度解析:大數據的大價值,大數據五大成功案例

  發揮你您的想象力,選擇您認為可是的答案

  看著同行大多仍身陷庫存泥潭,葉向陽慶幸自己選對了合作伙伴。

他的廈門育泰貿易有限公司與阿迪達斯合作已有13年,旗下擁有100多家阿迪達斯門店。他說,“2008年之後,庫存問題確實很嚴重,但我們合作解決問題,生意再次回到了正軌。”

在最初降價、打折等清庫存的“應急措施”結束後,基於外部環境、消費者調研和門店銷售數據的收集、分析,成為了將阿迪達斯和葉向陽們引向正軌的“黃金羅盤”。

聽五年大數據專家深度解析:大數據的大價值,大數據五大成功案例

  現在,葉向陽每天都會收集門店的銷售數據,並將它們上傳至阿迪達斯。收到數據後,阿迪達斯對數據做整合、分析,再用於指導經銷商賣貨。研究這些數據,讓阿迪達斯和經銷商們可以更準確瞭解當地消費者對商品顏色、款式、功能的偏好,同時知道什麼價位的產品更容易被接受。

阿迪達斯產品線豐富,過去,面對展廳裡各式各樣的產品,經銷商很容易按個人偏好下訂單。現在,阿迪達斯會用數據說話,幫助經銷商選擇最適合的產品。首 先,從宏觀上看,一、二線城市的消費者對品牌和時尚更為敏感,可以重點投放採用前沿科技的產品、運動經典系列的服裝以及設計師合作產品系列。在低線城市, 消費者更關注產品的價值與功能,諸如純棉製品這樣高性價比的產品,在這些市場會更受歡迎。其次,阿迪達斯會參照經銷商的終端數據,給予更具體的產品訂購建 議。比如,阿迪達斯可能會告訴某低線市場的經銷商,在其轄區,普通跑步鞋比添加了減震設備的跑鞋更好賣;至於顏色,比起紅色,當地消費者更偏愛藍色。

推動這種訂貨方式,阿迪達斯得到了經銷商們的認可。葉向陽說:“我們一起商定賣哪些產品、什麼產品又會熱賣。這樣,我們將來就不會再遇到庫存問題。”

挖掘大數據,讓阿迪達斯有了許多有趣的發現。同在中國南部,那裡部分城市受香港風尚影響非常大;而另一些地方,消費者更願意追隨韓國潮流。同為一線城 市,北京和上海消費趨勢不同,氣候是主要的原因。還有,高線城市消費者的消費品位和習慣更為成熟,當地消費者需要不同的服裝以應對不同場合的需要,上班、 吃飯、喝咖啡、去夜店,需要不同風格的多套衣服,但在低線城市,一位女性往往只要有應對上班、休閒、宴請的三種不同風格的服飾就可以。兩相對比,高線城 市,顯然為阿迪達斯提供了更多細分市場的選擇。

實際上,對大數據的運用,也順應了阿迪達斯大中華區戰略轉型的需要。

庫存危機後,阿迪達斯從“批發型”公司轉為“零售驅動型”公司,它從過去只關注把產品賣給經銷商,變成了將產品賣到終端消費者手中的有力推動者。而數據收集分析,恰恰能讓其更好地幫助經銷商提高售罄率。

“我們與經銷商夥伴展開了更加緊密的合作,以統計到更為確切可靠的終端消費數據,有效幫助我們重新定義了產品供給組合,從而使我們在適當的時機,將符合 消費者口味的產品投放到相應的區域市場。一方面降低了他們的庫存,另一方面增加了單店銷售率。賣得更多,售罄率更高,也意味著更高的利潤。”阿迪達斯大中 華區董事總經理高嘉禮對大數據的應用成果頗為滿意。

案例3:數據權之爭

 

聽五年大數據專家深度解析:大數據的大價值,大數據五大成功案例

發揮你您的想象力,選擇您認為可是的答案

  擁有了數據就等於奪取了行業制高點,飛友網絡科技公司CEO鄭洪峰深知箇中道理。

最近幾年,隨著移動互聯網的興起,一類關於航班動態的應用程序開始出現。通過一套算法,數據工程師們將機場航班實時動態轉換成直觀的信息,再傳遞給用戶,讓後者能夠及時瞭解到航班的起飛、到達、延誤、取消、返航、備降等狀態,從而幫助用戶更高效地安排行程計劃。

目前這個市場上主要有三款應用產品,分別是航班管家、飛常準和航旅縱橫,飛常準正是飛友科技推出的一款應用。三款應用中,航班管家和飛常準都是民營企 業,上線時間較早,用戶數較多;航旅縱橫雖然上線最晚,卻是由央企中國民航信息集團(中航信)開發,大有後來居上的趨勢。

隨著這個細分市場呈現三足鼎立的局面,一個問題浮出水面。鄭洪峰向《中國企業家》直言,數據是這個行業最重要的資源。但是目前中航信壟斷了大部分行業信息,使得飛常準必須通過購買和交換才能獲得自己所需要的數據。

聽五年大數據專家深度解析:大數據的大價值,大數據五大成功案例

  “我們的數據成本是非常高的。”鄭洪峰告訴本刊,“氣象、航班信息、空域流量等信息有些是公開發布的,有些則需要公司向空管局、機場和航空公司購買或交換。”

對於鄭來說,獲取數據的過程就是一部血汗創業史。據其回憶,早年的各大機場、航空公司之間的數據是割裂的,為了獲得準確的航班起降信息,鄭洪峰和他的團 隊就去為這些政府機構、大公司提供技術支持,以此來交換所需要的數據。“我們必須放下身段,他們需要什麼我們就做什麼。”鄭說道。因為飛常準是家小公司, 決策鏈條短,效率高,通過多年的積累,鄭洪峰打通了部分數據通道。

鄭洪峰在民航系統工作近12年,其人脈和常識的積累成為飛常準的重要 優勢。1999年,他創建了民航資源網。現在,這家網站是中國最大的民航門戶網站。2005年,他又創辦了飛友,主要為飛行旅客提供機票搜索引擎等服務。 從2008年開始,鄭洪峰團隊通過飛常準為用戶提供航班動態服務。早期,飛常準的用戶只是民航內部工作人員,很多機票代理商主動幫其推廣,機場方面也常常 用飛常準的應用來安撫因飛機延誤而憤怒不已的乘客,而業內資深人士也常提供很多有價值的反饋信息。鄭洪峰依靠民航內部的資源維持著自己的數據來源。但鄭知 道,這並不能長久。

鄭洪峰的故事並不是孤例。中國一家大型電子商務公司的數據挖掘專家接受本刊專訪時提到,現在,越來越多的電子商務公 司需要預測非一線城市的物流狀況。在這一過程中需要考慮當地交通擁堵程度和天氣情況,如果當地政府可以提供這方面的相關數據,可以大大提高運作的效率。以 交通數據為例,這位數據挖掘專家使用的是百度地圖和高德地圖,後來,他發現不能再用了:一方面,與這樣的公司合作存在商業機密問題;另一方面,由於交通數 據可能來自於這些公司的統計,失真度也是這位數據挖掘專家擔心的。“我們非常希望政府能開放一些原始數據。”他繼續說道,“我們也希望和領先者能平等地分 享數據權,而不是數據成本增加了二三倍。”

鄭洪峰和這位數據專家都擔心數據壟斷,希望政府公平公開地開放數據,這樣的做法並非沒有借 鑑。美國有一個叫做flyontime.us的網站,用戶可以從這個網站上獲得航班信息和天氣情況,其功能與國內的航班動態應用類似。但是值得一提的是, 這個網站的數據來源是一個公開的美國政府網站data.gov。目前在上面大約有超過40萬各種原始數據文件,涵蓋了農業、氣象、金融、就業、交通、能源 等近五十個分類。此外,data.gov還有一個地理信息的子站點,專門提供地理信息相關的數據。美國官方表示,這個網站的目的是“方便公眾更便捷地獲得 聯邦政府數據,並通過鼓勵創新來突破政府的圍牆而創造性地使用這些數據。”

2006年經濟學家唐·泰普斯科特(Don Tapscott)在《維基經濟學》中指出,人類已經進入了共享時代:“失敗者創建的是網頁,而勝利者創建的是生機勃勃的社區;失敗者創建的是有牆的花 園,而勝利者創建的則是一個公共的場所;失敗者精心守護他們的數據和軟件界面,而勝利者則將資源與每個人共享。”這一理念後來被認為是網絡2.0時代的核 心理念。以用戶為中心,注重用戶交互,讓用戶參與共同建設的網絡2.0同樣適用於政府,最近幾年各國政府的一系列舉措標誌著政府2.0時代的到來。

那麼在大數據時代,中國政府做好準備了嗎?

參考閱讀:數據解放宣言:美國政府大數據網站data.gov將開源

深藏的事實

飛常準的競爭對手也遇到了相同的困境。為了拿到第一手數據,航班管家非常賣力。它與各大機場合作,間接獲得自己所需要的航班起降信息。2012年6月, 航班管家與上海虹橋機場達成協議,航班管家可以直接從虹橋機場獲得信息,包括航班的延誤、取消以及登機口變更等一手信息,且提供的信息均與虹橋機場同步。 可以預見,機場是其重要的數據來源。

面對競爭對手的步步緊逼,鄭洪峰認為,正常的商業競爭並不是飛常準所焦慮的事。“開放與競爭對我們來說是好事。”

對於飛常準來說,央企中航信旗下的航旅縱橫才是最大的威脅。“在一定程度上,它有壟斷數據的嫌疑。”一位堅持匿名的專家說道。而面對記者的採訪要求,航 旅縱橫以不便透露為由拒絕。目前,中航信擁有中國所有終端旅客詳細的數據庫,包括姓名、手機、消費習慣等,這是中航信最核心的資源。由於與航旅縱橫母子公 司的關係,非市場化的利益輸送飽受詬病。

在有關民航信息的關鍵數據中,空域流量是影響中國航班正點率的主要原因,而這一數據掌握在空管局手裡。“空管局也願意將數據分享給航空公司、機場,甚至是一些小公司,它們這麼多年也在努力,可中國有自己特殊的情況。”上述專家說道。

在中國,不到30%的空域對民航開放。和其它國家相比,中國是空域管制最為嚴格的國家之一。“民航系統也很頭疼,七成多的空域屬於國家機密,所以機場、空域關閉根本無法預知,何來公開的數據?”上述專家說道。

在航班信息中,準點率是非常重要的一條數據。鄭洪峰以此對比中美兩國差異。“在國外,像準點率這些關鍵數據都是由政府全部公開的,因為準點率會決定哪家 航空公司可以獲得哪些航線,是航線資源分配一個非常重要的參數。但是,在中國,這個數據卻是各家公司自己蒐集的。”換句話說,相關政府部門並沒有掌握到第 一手的數據來源,遑論數據開放了。

在石油、電信、鐵路、民航等戰略行業中,民航業的數據開放遠遠走在了其它行業的前頭。上述電子商務公司的數據專家告訴本刊,設計物流工具時,他們更願意與民航系統合作,不僅僅是快,還因為如果找相對封閉的鐵路系統要一些關鍵性數據,“更難,更不靠譜。”數據專家說道。

“有時,政府也有擔心,你要數據做什麼?有時他們第一反應是,‘間諜’;第二反應是,你用來賺錢的,我會不會存在什麼風險。”上述民航專家說。這位民航 專家的一部分工作是為相關政府寫內部報告,有時需要跟民航系統要一些關鍵性數據,即便如此,也免不了遭遇相關政府部門的懷疑。

中國傳媒大學教授沈浩認為,現在的政府網站許多都是空架子,甚至大部分網站都很少更新,內容上也只是一些公告,而之前的決策過程並沒有反映出來;與此同時,由於中國政府缺少推動力,尚無法建立像data.gov的數據平臺。

另外,根據BNET商學院對中國政府部門的調查分析顯示,政府部門以數據分析作為決策支撐並沒有形成氣候,將數據分析作為核心競爭力的只佔5.6%,比起美國和英國等政府開源力度差距巨大。

此項調查的負責人,BNET商業英才網副總編周安利認為:政府部門依然缺乏對大數據的真正、全面的認識。在挖掘信息系統價值方面,數據分析也受制於管理 體制和職能制約,及長期傳統管理積累的習慣,業務驅動力不足,績效考核不配套。所以中國政府部門對大數據可能產生的價值,以及如何利用數據分析實現政府的 科學決策依然有相當長的距離要走。

數字生產力

如 今,飛常準已經擁有300萬月活躍用戶,覆蓋1萬個國內航班,5萬個國際航班。鄭洪峰直言,飛常準的優勢和主要收入來源就是利用大數據技術對數據進行收 集、分析和加工。比如利用獲得的收據,飛常準可以幫助保險公司制定航班延誤保險,而這些都是政府和保險公司以前無法完成的。

以前,航班 延誤險存在一個問題,就是保險公司讓用戶去舉證,用戶必須有各種各樣的紙質證明才能從保險公司拿到賠償,而賠償金額往往只有兩三百塊錢,因此用戶都不願意 買這個險。“而現在,航班一落地,通過我們的數據和服務,保險公司就知道是否超過保險閥值,沒超過的,用戶可以直接從保險公司拿到錢,過程非常簡單。”鄭 說道。與保險公司的合作,鄭洪峰得到的回報是收取一小部分服務佣金。

數據開放不僅可以讓小公司受益,而且可以讓政府更加透明、負責任。 美國政府前助理信息官、紐約大學法學院教授貝絲·諾維克(Beth Noveck)在她的《維基政府——運用互聯網技術提高政府管理能力》一書中闡述瞭如何在數字化背景下,運用網絡和大數據建立民主和高效的政府。“數據開 放可以讓體制內外的人一起參與進來,解決政府無法完成以及棘手的問題。”諾維克告訴《中國企業家》。

諾維克以感染率數據為例說明開放數 據的作用。美國的醫療部門蒐集了全美幾乎所有醫院的感染率,但是政府並沒有足夠的能力把這些數據轉化為有價值的信息。可是,當這些數據被放在 data.gov網站上以後,微軟和谷歌卻能夠運用自己強大的技術能力製作了一幅數據地圖。不管是研究機構或者是普通患者都能運用搜索引擎查找任何一家醫 院的感染率來決定是否住院。

而在中國互聯網領域,此前受到虛假廣告質疑的百度也開始與相關政府部門合作,利用後者的數據進行網絡打假。 百度相關負責人告訴《中國企業家》,以前百度需要從2000億網頁中篩查出有問題的假藥網站,屏蔽虛假醫療信息非常困難,單純依靠技術和管理手段的升級, 難以達到打擊假藥的最佳效果。同時,百度作為一家企業,並不具備相關監管資質,這也是百度無法進行獨立打擊假藥的問題所在。百度曾獨立打擊假藥,但效果十 分有限。

從2010年開始,百度聯合衛生部、國家藥監局等多個部委部門發起“陽光行動”,打擊各類互聯網不良及虛假信息,之後,百度與 國家藥監局正式達成戰略合作,國家藥監局的三大藥品數據庫,總計20餘萬個權威藥品信息向百度開放,而且這些數據庫將隨著藥監局的數據變化實時更新。用戶 可以通過通俗的商品名、專業的藥品名、批准文號等多個途徑,在百度搜索到藥品的權威信息。

“作為5億網民的互聯網入口,百度一直以來都希望能利用搜索入口和平臺優勢,與各傢俱有數據資源優勢的政府部門、權威機構聯手,讓權威信息全面入駐網絡。”這位負責人說道,“重要的是,數據治國,相關政府部門也獲得了很好的讚譽。”

中國傳媒大學教授沈浩認為,雖然中國政府在2007年就發佈了《政府信息公開條例》,但目前政府公佈的數據大部分還是報告和報表,沒有標準的格式,不能以數據的形式查到,因此也無法進行深入的分析、加工和挖掘。

“如果政府需要社會共享和分析這些數據,必須提供最原始的數據,這樣的數據學術和商業上才能去應用它。”沈浩說,“你看data.gov的網站,在上面的聯邦政府的數據庫,都是以電腦可讀取的格式發佈的。”

鄭洪峰也意識到這個難題。他有時候會給相關政府、大公司提供一些數據,他力求尋找一種標準格式。而在這樣的方向上,中國的一些公司也在與政府一起努力。

高德軟件有限公司三維應用事業部總經理趙珂告訴記者,以前的項目往往是政府立項再僱用公司去做,完成後政府擁有版權,這樣導致數據市場不是市場經濟而是 投資拉動型的經濟。而目前高德與地方測繪局採取的合作形式是授權模式,高德幫助政府採集數據。擁有了標準化的數據,相關政府就擁有了一個標準的基礎數據 庫。“這是國家測繪局比較有遠見的一個舉措,相信我們未來和政府這類合作會越來越多。”趙珂說。

鄭洪峰也相信,未來會更務實更市場化,歧視性的東西會越來越少。中國的數據會越來越開放,也會更加利用市場的機制去鼓勵更多的商業用戶用好航班的數據。

與此同時,鄭洪峰也在以不同形式回饋於給他提供數據的政府相關部門和大公司,最近,他的團隊正在撰寫一份報告,名為《航班正點提高率計劃》。


分享到:


相關文章: