10.04 大數據照耀中國網球公開賽

2013年中國網球公開賽在國慶期間開拍,觀眾又可以欣賞到頂尖世界高手的比拼。

中國網球公開賽創辦於2004年,每年一屆定期(每年第41周)在京舉行。賽事同時擁有國際女子職業網球協會(WTA)、國際男子職業網球協會(ATP)和國際網球聯合會(ITF)等三大國際網球組織的賽事舉辦權,是亞洲地區設置最全、級別最高、參賽球員最多的國際網球賽事。

2009年賽事全面升級,成為全球級別最高的八項頂級網球賽事之一,八大賽事包括澳網、法網、溫網和美網四大滿貫賽事,以及印第安維爾斯賽、邁阿密大師賽、馬德里大師賽、中網四大皇冠賽事。

從規格上來講,中網躋身的皇冠賽僅次於四大滿貫。按照規定,世界排名前50的女運動員必須參加中網比賽,世界排名前10的女運動員必須參加中網比賽。世界排名靠前的男運動員必須參加美網之後的四項重大賽事中的一項,其中包括中網大賽、東京、瑞士巴塞爾和西班牙瓦倫西亞大賽。從2009年開始,世界排名前10的女運動員和排名前20的大多數男運動員必須參加中網比賽。如果違背就會受到懲罰。

中網賽事經過9年的發展,已經逐漸發展成為中國推廣範圍最大、推廣週期最長的網球賽事,並且是亞洲最頂級的網球賽事。女子賽事為WTA皇冠明珠賽事(僅次於四大滿貫賽事,全球僅4站),男子賽事為ATP500賽事(僅次於四大滿貫賽事、ATP1000 賽事,全球11站)。2013中國網球公開賽獎金超過750萬美元,其中WTA獎金為5,185,625美元,ATP獎金為2,315,250美元;青少年 賽事為ITF青少年二級巡迴賽。

隨著中國網球公開賽影響力的與日俱增,有關方面正在致力於再提升一個臺階,成為繼四大滿貫之後,全球第五大網球公開賽。

大數據折射出的差距

中國網球公開賽什麼時候可以成為與四大滿貫並列的全球第五大滿貫賽事,中網距離全球第五還有多遠?這是一個饒有興趣的話題。

這涉及很多因素,以獎金為例,目前四大網球公開賽,每個賽事獎金總額都超過2000萬美元,冠軍積分2000分。相比中網獎金總額為750萬美元,冠軍1000積分;此外,中網比賽時間恰好處於美網之後,經過美網激戰,名將疲憊不堪,體力難有保障。目前四大滿貫都擁有百年以上歷史,底蘊深厚,相比中網僅有10年不到,尚處於孩提時代,資格尚淺。從商業經營看,中網還處於純粹賠錢階段,中網到何時才能賺錢,誰能長期為賠錢的比賽出資?在競技水平方面,以李娜為首的中國女子選手已步入世界一流行列,相比男子選手差距明顯,這都是中網成為全球第五的攔路虎。

體育因素之外,在賽事服務水平上中網也有些的差距,其中,大數據應用就很有代表性。以澳網為例,今年2月澳網期間,澳大利亞網球協會信息總監Samir Mahir透露一組統計資料:684457名球迷到現場觀看了比賽;澳網網站有1410萬絕對造訪人次;澳網Social Leaderboard追蹤到900多萬涉及球員的Twitter。此外,澳大利亞網球協會在比賽期間獲取了約60TB的數據和視頻資源,本次賽事男子抽籤127場比賽打了764盤。

Samir Mahir說:“作為技術總監,我為澳網的技術解決方案設定的一個長期重要目標是,使球迷更加深入地參與和享受比賽。數據正在創新球迷觀看大滿貫網球比賽和球員進行比賽的方式。”

據瞭解,Samir Mahir所說數據改變比賽是指在IBM的幫助下,通過分析八年來大滿貫比賽的4100萬個數據點的數據,據此推出的“Keys to the Match”。

談到“Keys to the Match”,IBM中國對外關係部孟巖說:我們在每場比賽,為對陣選手各找到三個獲勝關鍵指標。以德約科維奇對陣穆雷為例,通過大數據分析,系統給出小德獲勝的三個關鍵指標是:第4拍到第9拍獲勝率、Ace球數量、回球成功率;穆雷的三個指標是:回球得分率、二發成功率和發球成功率。Keys to the Match 不但找到這三個關鍵的指標,而且找到了量化及格線。

大数据照耀中国网球公开赛

2013年溫網決賽 Keys to the Match 界面

“同樣在今年法網女單決賽,Keys to the Match 告訴小威廉姆斯,要戰勝莎拉波娃,接對方一發的回球得分率要爭取超過36%,而反過來,莎拉波娃要打敗小威廉姆斯,接對方一發回球得分率要爭取超過28%。” 孟巖說。

孟巖指出,這三項關鍵指標並不都是司空見慣的普通指標。有些指標甚至有些匪夷所思,例如第4拍到第9拍勝率、接一發回球得分率,這些都不是在電視直播屏幕可找到的數據,可誰又能想到這些不起眼的指標,才是衡量戰局,決定成敗的關鍵點呢?

“不要說是普通球迷,就是最資深的網球專家,僅靠觀察和手工分析,很難找到這些關鍵指標,為每一個指標設定一個及格線,那更是不可思議的事情。” 孟巖說。

體育大數據不僅是 “Keys to the Match”,在籃球、高爾夫球、橄欖球,大數據都得到了廣泛應用。在美國超級聯賽十五人橄欖球賽中,萊斯特老虎隊就採用預測分析軟件預防受傷。

“如果你在球場上有最優秀的球員,那麼失利的可能性就小。這不是多麼高深複雜的事情,我們想要向下挖掘數據,確定如何才能防止球員受傷。” 萊斯特老虎隊運動科學主管Andrew Shelton說。

大数据照耀中国网球公开赛

大數據受傷預測分析軟件

不論是運動競技,還是賽事觀摩,大數據都在成為不可或缺的工具。

在中網官方網站,資料還僅限於賽程安排、新聞/圖片、球員名單、合作伙伴和在線訂票等少數信息,暫時還沒有看到大數據的身影。

大數據:工欲善其事,必先利其器

對於大數據,IBM將其分解為三個方向:數據採集傳輸、數據處理速度、分析和洞察。也就是說,首先要有效的收集數據、傳輸數據、存儲數據,再對數據進行篩選處理,然後進行分析,從中得到有價值的信息。大數據要用的好,這三個方面的工具都必不可少。雖然當前提供大數據工具的廠商已經不少,有些專注於提供數據採集,有些專注數據存儲,更有的專注於提升數據處理速度或分析,但是能完全覆蓋這三個層面的廠商並不多。

在數據傳輸方面,IBM今年推出了一個強大的工具:物聯網數據分析平臺MessageSight,以信息隊列遙測傳輸(Message Queuing Telemetry Transport,簡稱:MQTT)技術為基礎,能支持100萬臺併發傳感器或智能設備,消息處理量可擴展至每秒1300萬條。要處理大數據,首先要有好的採集和傳輸的方式,否則是無法進一步進行的。

IBM全球副總裁兼IBM中國開發中心總經理王陽博士表示,通過MQTT,企業能夠對移動端和傳感器發出的數據進行實時處理和集成,從而更加輕鬆便捷地蒐集、和分析獲取洞察:“MQTT非常小、非常安全又壓縮的,能夠在能耗非常低的情況下併發採集相當多的數據。”

在提升數據處理速度方面,IBM提供了BLU Acceleration分析加速技術和PureData for Hadoop系統。其中BLU Acceleration基於內存計算技術,並整合了大幅改善分析能力和簡化管理的一系列技術,能夠將報告生成和數據分析速度明顯提高。據IBM測試,使用BLU技術,很多查詢功能在分析負載中運行速度比以前要快1000倍,這意味著藉助BLU Acceleration,用戶可以更快速地抓取關鍵信息,從而做出更好的決策。

在提升數據處理速度方面IBM發佈的另一個重要新品是PureData for Hadoop系統。IBM去年發佈了PureData專家集成系統,包括事物系統、依託於Netezza技術的分析系統以及運營分析系統,而今又增加了專門面向Hadoop應用的新成員。PureData for Hadoop系統集成了IBM的InfoSphere BigInsights軟件,針對大數據應用進行深度優化,讓企業在使用企業級Hadoop技術時的加載時間從數週減少到數分鐘,並且提供了功能更強大的大數據工具,可用於監測和研發,同時加強版的大數據工具可以與更多企業系統相兼容。

在分析方面,IBM提供了全新Watson版本Watson Engagement Advisor,首度融合了大數據分析與IBM智慧商務的核心思想,能夠基於海量的知識庫儲備,幫助企業客服人員迅速提供回覆,直接通過雲端運送服務、在線聊天或移動設備送達客戶。通過一次簡單的點擊,“Ask Watson”應用就能夠快速地解決客戶的問題,發送反饋或排除故障。

目前IBM是四大網球公開賽的贊助商,日前也正式成為2013年中國網球公開賽白金信息科技贊助商,據悉IBM並專門為中網設計了具有實時大數據分析功能的MatchTracker(賽事追蹤系統),可以為球迷提供數據呈現、計分等功能。

MatchTracker(賽事追蹤系統)基於IBM SlamTracker分析技術,使球迷能夠利用歷史和實時性數據,洞悉比分之後的態勢和策略。

PureData:大數據應用“數碼相機”

從砂礫中淘得真金,需要專門的工具和設備,同樣,在大數據中甄選出有用的信息,也需要專業的工具和IT基礎設施。但是對於非專業人員來說,想搭建好這套工具可並不容易,其中涉及到硬件、操作系統、中間件、應用軟件等多個單元,想要將這些元素攢到一起,並調整到最佳狀態,即使企業有這樣的能力,也要花去不少時間。

IT不過是個工具,自然越簡單越好,就像做木工活一樣,如果有現成的工具,誰也不會從頭去做錘子斧子。大數據同理,如果有現成的大數據IT基礎架構,大數據應用起來就更加簡便了。於是,將基礎硬件、操作系統、數據庫、大數據分析工具等單元集成到一起的大數據一體機應運而生。

在IBM的大數據戰略中,一體機(IBM將其稱之為集成系統)是重要的一個部分。2012年12月,IBM推出了專門面向大數據應用的PureSystems集成系統——PureData,最初包括三個型號:分別是PureData System for Transactions(PureData事務系統,或PureData交易系統),PureData System for Analytics(PureData分析系統),PureData System for Operational Analytics(PureData運營分析系統)。

而為了簡化Hadoop應用,IBM在2013年5月又推出了專門的PureData for Hadoop系統。

大数据照耀中国网球公开赛

三款PureData產品

PureData顯然是為了解決大數據“如何用”問題而設計的,這套系統集成了服務器、存儲、網絡、管理等模塊,並且涵蓋了從大數據治理到核心大數據處理的Hadoop系統、流計算、數據倉庫,行業加速器以及最全面的業務分析工具,打包成一個針對負載優化的“Box”,省去了用戶自行構建大數據分析處理平臺中所需的軟硬件採購、組裝、優化、測試等步驟,讓大數據應用能夠“開箱即用”,省去了大量的部署管理時間,降低大數據應用的難度。

評價一套工具的好壞,首先是好不好用,大數據工具也是如此。如果IBM精心搭配的這套系統沒有讓用戶心動的地方,那就毫無意義了,IBM自然不希望如此。IBM首先為這套工具融入了自家對於大數據應用的理解和經驗,進行優化,讓大數據應用更加快速:

• 事務系統,在短短數分鐘內即可部署完成,無需耗時數個小時,能夠在一個系統中處理超過100個數據庫。

• 基於Netezza技術的分析系統,相比傳統定製系統的速度快10~100倍,與過去的Netezza技術相比,戰術性查詢的併發處理能力和吞吐量提高了20倍。

• 運營分析系統,能夠持續社區運營數據,最高支持1000多個併發運營查詢,利用主動壓縮技術,最高能夠節約10倍的存儲。

• 而PureData for Hadoop系統則集成了IBM的InfoSphere BigInsights軟件,針對大數據應用進行深度優化,讓企業在使用企業級Hadoop技術時的加載時間從數週減少到數分鐘。

在當前市場上,像PureData這樣將軟硬件集成在一起,並進行優化,讓數據分析處理更加簡單快速的一體化系統並不多見,但也並非是IBM的專屬產品,比如甲骨文Exadata等。那麼,PureData有何過人之處?

IBM全球副總裁兼IBM中國開發中心總經理王陽博士告訴筆者,包含了從硬件、軟件到數據倉庫的PureData並不僅僅是用於數據分析,它包含了交易、分析、運營三種不同的能力,而其他一體機系統往往功能比較單一。相比Exadata,PureData要更有“價值”:“Exadata除了要購買硬件,還要購買甲骨文軟件,價格非常昂貴;而PureData要更加便宜,它不僅包含了硬件,還預集成了數據管理軟件和系統管理軟件,它的價值要遠遠超過Exadata。另外,PureData是一個開放的系統,並且在硬件上有持續演進的路線圖。”

“開放”也是PureData的獨到之處,和其他一體機系統不同,PureData支持更加廣泛的軟硬件架構,支持x86和Power硬件架構,支持支持AIX、Sysi、Linux、Windows操作系統,支持PowerVM、KVM、VMware、Hyper-v虛擬化系統,並且可以混合搭配。對於這點,筆者還是比較認同,因為用戶的平臺未必是單一的,可能會混用x86和RISC平臺,可能兼有Unix或者Linux系統上的應用,這樣就減小了不同平臺之間遷移的風險和麻煩,也不會將用戶封閉在一個平臺之上,應用起來要更加靈活。

而Exadata軟硬件絕大多數自甲骨文,是一個相對封閉的架構。王陽博士認為,“封閉”的系統很難形成一個良好的生態圈:“我們認為在開放的系統當中,我們歡迎更多的全球不同的人才,他都可以在這上面貢獻他的智慧,寫出他們的應用。” IBM中國開發中心DB2 開發及客戶支持總監幹毅民則認為,PureData在擴展性和可靠性上也更有優勢:“PureData能夠實現線性的擴展,要優於Exadata;而在高可靠性方面,PureData移植了來自IBM主機的可靠性,要優於甲骨文系統。”

得益於這些優勢,PureData問世後很快有了用戶。2012年,青島銀行數據中心選用了剛剛推出不久的PureData交易系統,成為PureData在中國的第一個用戶,而這也成為PureData在全球金融行業的第一單。青島銀行計劃首先將業務流程中的部分數據庫遷移至PureData,未來會進一步整合更多交易系統的數據庫,實現數據庫整合管理。談及選擇PureData的原因,青島銀行認為PureData能夠提升交易性能,加速新業務上線速度,提升系統利用率,減少維護工作量,並且在供電和機房空間等方面有著明顯優勢。

PureData在中國還有一個典型的用例在聯動優勢。這家公司是由中國移動和中國銀聯在2003年合資成立,是中國移動手機銀行卡支付業務最主要的服務提供商。此前,聯動優勢使用的是基於傳統數據倉庫的經營分析系統,無法實現對分散在不同子系統中的數據進行快速的查詢和關聯數據整合,經營分析系統也無法高效應對公司多個業務線數據交叉分析的需求和企業內部精細化管理的要求,為業務人員提供更多維度、更精細的數據。採用PureData分析系統後,聯動優勢報表生成時間提高了一倍,而PureData只需要一天時間就可投入使用,實現了精細化管理和成本的降低。

這兩家最先“吃螃蟹”的用戶有著一些共同點,均屬於關鍵行業,金融和電信;數據構成上均具有較大的複雜性、維度多樣、實時性強;大量的數據分佈在不同的子系統中;傳統的數據倉庫很難對這些分散在不同系統中的數據進行查詢,迫切需要將數據整合;IT系統上線時間長,維護管理複雜,運營成本較高。從兩家採用PureData的收益來看,均獲得了交易性能提升、實現了更加快速的查詢,而更受兩家青睞的是,集成化的PureData部署時間和難度大大降低,維護工作量也明顯減低,在空間和能耗上也能提供更多優勢——兩個案例應該可以為體育大數據的應用提供一些參考,儘管後者注重的並不是交易而是分析,但是在數據複雜性、多維性、實時性等方面的需求是一致的;瞬息萬變的賽場需要IT系統快速就緒,能夠快速部署的集成系統自然有著明顯的優勢。

一直以來,IT都是以簡單為美,在大數據時代,IT的目的也應當是讓大數據應用變得更加簡單。大數據一體機的出現似乎代表了這種簡化的趨勢,讓使用IT系統就像使用數碼相機,消費者不需要專業的拍照技能,只需選擇預設的功能,就能拍出精美的照片,而無需去自行設置光圈、快門等複雜的參數。同理,如果選擇IT系統預置的功能,就能迅速展開大數據分析,這對大多數希望應用大數據的人來說,都是非常理想的,它大大降低了大數據應用的門檻,對推動大數據應用的落地有著非常積極的作用。

大數據改變世界

無論是從體育大數據,還是從大數據基礎設施,一個大數據時代已經到來。作為一種觀察和理解世界運行方式的全新方法,大數據所展現出的生命力只能用異常強大來形容。通過不斷的對數據進行採集和分析,大數據正在改變越來越多的行業,而不僅僅是體育。食品行業、互聯網行業、金融保險業、城市管理、交通運輸、醫療保健、公共事業等等,幾乎所有行業中的先行者都在試圖利用大數據來改變自身和行業的現狀。

歸根結底,大數據技術把人們從過去的工業時代中解放出來,使人們擺脫了對經驗和管理方式的迷信,讓一切決策都變得有根有據。就像網球賽事中的“Keys to the Match” ,大數據將人們從因果關心無盡探求中拉回了現實,以更加凝練的方式給出了達到目的的方法。

毋庸置疑,人類已經從舊有的工業化時代向著新的互聯網時代前進,網絡正在將越來越多的信息進行著彙集和傳播。但舊有的企業運行和管理方式卻仍然根深蒂固的影響著當代的企業。在這個新時代中仍然有很多人迷信那些在舊工業時代所慢慢積累起來的經驗和管理思路,相信這些知識能夠幫助企業繼續主宰這個新的時代。

但當大企業的運行效率越來越低,越來越多的新型草根企業開始衝破牢籠之時,人們便開始意識到了問題的存在。

在過去的工業化時代,當企業具備一定規模之後便開始花費大量的精力和資源去研究其在商業運營過程當中所遇到的現象,期望從這些現象中瞭解市場的動向和用戶的需求。但隨著互聯網時代的到來,這種企業所遇到的現象數量正在以指數及爆發。而探求這些現象背後所謂真諦的行為卻在無限制的消耗企業有限的資源。企業的效率不斷下降,而成本卻激增。

而大數據的出現卻將人們從這種固有的經營管理模式中解脫出來,倡導一種“不問因果,只求相關”的境界;通過日益發展的IT能力,企業有能力將經營活動中遇到的各種現象數據化,之後對其進行分析,找到其中的幾組相關數值,並以此作為企業經營和管理的方針。

這種“不求甚解”的管理思維似乎與我們傳統的刨根問底似的思路格格不入,但眾多的實際案例卻接連證明了其有效性和高效性。畢竟,無論多大,一個企業、一個組織或一個個人的精力和資源都是有限的,與其浪費在不斷探求為什麼的繁冗過程中,倒不如從海量數據中直接找到“正相關”來的實際與高效。

大數據的未來

隨著互聯大時代的開啟,數據已經無可爭辯的成為了這個時代的主角,而互聯網等技術則只是數據的的管道。

在這個新的、以數據為主角的時代中,之前那些看似起著決定性作用的技術都找到了自己應有的位置:

互聯網、與聯網:作為數據時代的基礎,互聯網與物聯網提供了一種全新的數據產生、彙集和傳遞的渠道。通過這一渠道,個人和組織能夠以更低的成本得到海量的數據。換句話說,互聯網與物聯網是數據流動的管道。

雲計算與虛擬化:由於目前技術條件的限制,我們無法造出符合成本預期的超級計算機,而且就算造出來我們也可能負擔不起他的電費和維護費用。而云計算和虛擬化技術的出現則為我們提供了一種廉價的計算能力。雲計算和虛擬化為我們提供了一種手段,讓我們能夠方便的將那些有限的、閒散的、分散的計算資源集中起來並加以有效的管理,從而讓我們有足夠的計算能力去完成“something big”。換句話說,雲計算與虛擬化技術的產生相當於給數據管道安裝了一個泵,讓數據在管道中能夠加速的流動。

大數據與智慧技術:現在,數據有了越來越寬的管道和越來越快的流速,而這些數據流向哪裡便成為了一個亟待解決的問題。而大數據技術的出現則就像一臺引擎,他的燃料就是這些源源不斷的數據,而且其排量相當的大;但這臺引擎輸出的則是寶貴的知識與價值;是驅動這一時代和整個社會不斷快速前行的力量。

誠然,我們目前的大數據引擎還不夠完美,運轉也不夠高效;我們仍然需要MessageSight、PureData、Engagement Advisor或類似的組合來組建我們的大數據引擎。但慶幸的是,我們已經找到了方法和思路,並且也證明了其有效性,當技術變得更加完美,一個嶄新的互聯網新時代也將正式到來,我們將藉助互聯網、雲計算、大數據以及類似技術創造一個又一個比工業時代更加偉大和璀璨的社會成就。

大數據時代並不遙遠,在金融、電信、零售、能源等行業,大數據及分析技術推動了行業轉型,委內瑞拉知名連鎖商店品牌Automercados Plaza’s通過部署IBM大數據解決方案,有效整合了整個企業範圍內的信息,優化的庫存管理,提高了迅速適應市場的能力,有效避免了近35%的庫存損失,收入增加了近30%,年利潤提高了700萬美元。丹麥致力於風力能源產業化的風輪機制造商維斯塔斯(Vestas Wind Systems),通過在世界上最大的超級計算機上部署IBM大數據解決方案,得以通過分析包括PB量級氣象報告、潮汐相位、地理空間、衛星圖像等結構化及非結構化的海量數據,優化風力渦輪機佈局,有效提高風力渦輪機的性能。所有這些都讓我們感知到大數據應用的力量。

一個充滿魅力的大數據時代正向我們走來!


分享到:


相關文章: