02.24 kaggle「瘋狂三月」:將 ML 用於籃球賽預測,獎金 $25,000

雷鋒網 AI 源創評論按:近日在 kaggle 官網上,谷歌雲與美國大學生體育協會(NCAA)再一次聯合推出「瘋狂三月」籃球冠軍預測大賽。

任何開發者只要能夠通過 AI 來預測 NCAA「瘋狂三月籃球賽」的冠軍,就有機會獲得由 Google 提供的$25,000 高額獎金。當然,該比賽屬於 Kaggle 上最著名的 Featured 比賽類型,難度可不低。

kaggle「疯狂三月」:将 ML 用于篮球赛预测,奖金 $25,000

圖片來源: DiAnte Squire on Unsplash

關於 Kaggle 競賽

相信大部分開發者都對 Kaggle 並不陌生,這是全球頂級的權威性數據科學競賽平臺,為全世界的數據科學和機器學習的愛好者、研究者和創業者提供了公平公正的競賽平臺。

不論你是數據科學小白,還是數據科學高手,在 kaggle 上都可以收穫到自己想要的知識、技巧、經驗、榮譽,或是高額獎金。

kaggle「疯狂三月」:将 ML 用于篮球赛预测,奖金 $25,000

kaggle 官網主頁

針對基礎入門參賽者,通常可以在 Started 類型比賽中,學習初學者項目以及積攢經驗;而針對高級數據科學玩家,高額獎金的 Featured 類型比賽,或者實驗研究為主的 Research 類型比賽,都是不錯的選擇。

除此之外,想招募合適人才的公司,也可在 kaggle 平臺上發表需求相關性強的 Recruitment 類型比賽。當然,平臺上也有少量超高難度的 Masters 類型比賽,適合大師級別人物參加。

Kaggle 官網地址:

https://www.kaggle.com/

「瘋狂三月」,將 ML 用於 NCAA 籃球賽冠軍預測

每年三月,有一項賽事將吸引全世界籃球迷的眼光,那就是 NCAA 的瘋狂三月。NCAA 男子籃球聯賽分為三個級別,瘋狂三月是 NCAA 男子籃球第一級別聯賽錦標賽,也就是季後賽,採用單場淘汰制。因而結合其每年在三月進行的時間特點,這一比賽獲得了「瘋狂三月」的稱號。

kaggle「疯狂三月」:将 ML 用于篮球赛预测,奖金 $25,000

作為如此大型的賽事,比賽最終的冠軍當然也是飽受關注。自 AI 迅速發展以來,研究學者們就一直希望能夠通過對大數據的科學分析,在金融、醫療、股市甚至偶然性極強的競技賽事中獲得準確的預測結果。而谷歌雲與 NCAA 聯合舉辦的「瘋狂三月」籃球冠軍 AI 預測大賽,也正是希望將數據科學與賽事預測完美結合,更好的發展數據科學領域。

本次比賽要求參賽者具有較高的數據科學研究水平,同時也提供了較高的獎金,屬於 Featured 類型的競賽。比賽分為了兩個階段,在第一階段內,參賽者可根據歷史數據構建和測試模型,這一階段不計入最終得分,截止日期為 3 月 14 日;而進入第二階段後,參賽者所提交結果將計入最終得分,並在 3 月 19 日前(格林尼治標準時間)需提交 2020 賽事最終預測結果。當然,選手也可跳過一階段直接進入二階段。

kaggle「疯狂三月」:将 ML 用于篮球赛预测,奖金 $25,000

數據分析圖表

但值得注意的是,「瘋狂三月」之所以讓球迷們極度瘋狂,其緊張激烈的淘汰賽制也是其中非常重要的原因之一。不同於常見的淘汰模式,該籃球賽形式採用的是「突然死亡法」——WIN OR GO HOME,也就「一場定勝負」。因此,即使是 NBA 巨星,如果在一場比賽中表現不佳,同樣會被淘汰出局,徹底無緣冠軍爭奪。正是這樣的賽制,也大大增加了結果預測的難度。

不過簡而言之,參與 AI 預測大賽的獲獎規則即:參賽者通過出題方給予的訓練集(包括:男籃與女籃.CSV 類型的文本數據集)建立模型,再利用測試集準確預測出本次籃球賽的詳細結果。

kaggle「疯狂三月」:将 ML 用于篮球赛预测,奖金 $25,000

籃球場建模示例

同時,Kaggle 團隊將在「瘋狂三月」整個籃球賽賽中刷新排行榜,最終排名前五參賽者將依次獲得:第一名$ 10,000、第二名$ 7,000、第三名$ 5,000、第四名$ 2,000、第五名$ 1,000 的獎金。

「瘋狂三月」籃球冠軍預測大賽地址:

https://www.kaggle.com/c/google-cloud-ncaa-march-madness-2020-division-1-mens-tournament

數據預測未來發展

目前,在比賽官網上已陸陸續續有一些通用代碼、EDA(電子設計自動化)以及其它預測模型相關的文章發佈,並向數據科學愛好者們提供瞭解讀。其中,Rmarkdown 向我們詳細展示了本次大賽介紹、賽前準備、使用數據以及預測規則等,而一些在數據科學領域還不夠老練的開發者,也可以從中獲益良多。

kaggle「疯狂三月」:将 ML 用于篮球赛预测,奖金 $25,000

在過去幾年人工智能還未取得較快發展的時候,已經出現了眾多采用大數據分析的方法,來對未來的一些結果進行預測,包括:股市、賽況、交易等領域,同時取得了較為科學準確的結果。

而現如今人工智能(AI)領域的快速發展,可以預見的是,數據科學也將對社會帶來更大的影響,甚至一些學者認為,它將驅動經濟增長,為改善生活質量帶來更多機會。

儘管我們暫時無法驗證數據科學發展的最終結果是好是壞,但對於 AI 預測這一功能的實力,依舊值得我們重視並加以利用。而這些具有商業意義的 AI 競賽,更是我們將技術與理論落地的極佳實踐環境。在今後的日子裡,雷鋒網 AI 源創評論也將持續報道更多相關賽事,期待你的關注。

Kaggle 官網詳細方案解讀:

https://www.kaggle.com/headsortails/jump-shot-to-conclusions-march-madness-eda

雷鋒網 AI 源創評論


分享到:


相關文章: