AI智能預測的世界盃爲什麼這麼不靠譜?

俄羅斯世界盃已經於北京時間7月15日星期日結束,法國成為世界冠軍,緊隨其後的是克羅地亞和比利時。但是就像之前的2014年世界盃一樣,許多研究人員都試圖提前預測俄羅斯賽場上的比賽結果。今年,國際足聯2018年世界盃也不例外,研究人員和科學家們試圖利用人工智能(AI)和統計數據來預測世界盃64場比賽的結果,可它又有多可靠呢?

在這篇文章中,我將談及人工智能在預測2018年世界盃結果的表現。無論你是否是人工智能領域的專家,我會盡可能讓這篇文章讀起來簡單易懂。

預測世界盃結果的方法有很多種,一種方法是從團隊的能力和獲勝的幾率上來成對模擬比較所有單場比賽。Zeileis,Leitner和Hornik(2018)使用了同樣的技術,他們預測巴西將以16.6%的概率贏得2018年世界盃,緊隨其後的是德國(15.8%)和西班牙(12.5%)。

瑞銀集團(UBS)也預測了三支球隊的排名,但順序不同。他們預測德國(24.0%)是冠軍,其次是巴西(19.80%)和西班牙(16.1%)。該模型的產生基於四項因素:一是Elo評級系統的評分;二是球隊在世界盃前的表現;三是球隊在之前的世界盃比賽中取得的成績;四是主場優勢。

該模型通過10000次蒙特卡羅模擬(Monte Carlo simulations)校準來確定球隊的獲勝概率和最後五場比賽的結果。

2018年6月8日,多特蒙德技術大學(德國)、根特大學(比利時)和慕尼黑工業大學(德國)的四名研究人員(A. Groll et al.等)在arXiv上發佈了一篇關於2018年世界盃結果預測的研究論文。他們使用是著名的人工智能算法:隨機森林(Random Forest)和泊松排名算法(Poisson ranking algorithm)。6月14日,在俄羅斯與沙特阿拉伯舉行的世界盃揭幕戰之前,這篇文章被髮表在網上。他們使用了一個數據集,該數據集能夠涵蓋過去四屆世界盃(2002-2014)的所有比賽。他們預測西班牙將成為冠軍,緊隨其後的是德國和巴西。以上三項研究都提及了西班牙、德國和巴西三個頂級團隊,只是順序不同。他們使用了三種不同的方法、數據和數據特性,但預測結果幾乎是一樣的。現在,世界盃已經結束了,我們可以看到,所有這些模型都未能正確預測世界盃的結果,也沒有任何預測真正發生。

在這些研究中,A. Groll et al等人的研究方法是我在這一領域的最愛。首先,他們使用了一個好的數據源;其次,他們考慮了許多訓練的特點和參數。第三,他們採用了隨機森林的算法。在本文的其餘部分中,我將討論其數據特性、錯誤以及在該領域失敗的原因。

數據特性

A.Groll et al.等人考慮了與團隊本身相關的各種特徵,例如:經濟因素(人均GDP、人口);體育因素(ODDSET概率,國際足聯排名);主場優勢(東道主、洲、聯盟);球隊的結構因素(每支球隊成員的最大數量、平均年齡、冠軍聯賽球員的數量);球隊的教練因素(年齡、任期、國籍)。總的來說,他們為每個隊和每屆世界盃總結了16個數據特性作為考慮因素。

分類模型

正如我前面提到的,他們使用了“隨機森林(Random Forest)”的方法,這是人工智能和數據挖掘中眾所周知的算法之一。該算法以“決策樹(Decision Tree)”為基礎,在許多案例中,決策樹在數據分類中表現出較高的性能。他們還使用泊松模型(Poisson models),根據球隊當前的能力對團隊進行排名。

AI智能预测的世界杯为什么这么不靠谱?

(圖1:由隨機森林算法預測的2018年世界盃足球賽結果——來源:參考文獻[3])

預測

在完成了10萬次比賽的模擬後,預計西班牙將以28.9%的幾率成為冠軍,緊隨其後的是德國(26.3%)和巴西(21.9%)。

錯誤

正如我們在2018年世界盃上所觀察到的,沒有任何一個預測排名領先的球隊進入了半決賽,更不用說總決賽了。根據世界盃的實際結果和預測,模型的根均方誤差(RMSE)和平均絕對誤差(MAE)計算如下:

RMSE:8.052

MAE:6.468

這兩個指標顯示了模型的錯誤,以及它在總體上能夠準確預測團隊排名的程度。RMSE和MAE的值都很高,這使得模型不可靠,儘管團隊使用了16個特性和大數據集(收集了過去4屆世界盃的數據),人工智能機器學習(特別是隨機森林)仍然無法可靠地預測結果。在本屆世界盃上,俄羅斯、日本和伊朗的表現明顯好於預期,而另一方面,德國未能晉級。

AI智能预测的世界杯为什么这么不靠谱?

(圖2:在2018年世界盃上,每個球隊的預測排名、實際排名和預測的誤差)

為什麼人工智能會失敗?

在人工智能和機器學習中,有適當的數據進行訓練和建模是非常重要的。但是在這種情況下,儘管有適當的數據、相對較大的數據、好的算法和正確的參數,訓練模型仍表現欠佳。這種失敗的原因在於,我們所預測事物的性質。

國際足聯世界盃就像任何其他基於人類的事件一樣,在比賽前((不只是16分鐘))和比賽期間(至少90分鐘)都依賴於太多的因素,這就是眾所周知的混淆變量(confounding variables)。為了正確地預測結果,應該模擬每一場比賽的每一分鐘。每個狀態的結果取決於前面的狀態。這也被稱為馬爾可夫鏈過程(Markov Chain Process)。

一個不正確的模擬狀態很容易導致比賽行進中狀態的不可靠結果。

除了內部因素外,足球比賽的結果也可能受到一些外部因素的影響,比如不公平的裁判、天氣、政治狀況、球員的個人問題等等。這些重要的特徵通常很難被測量和收集。此外,總有一些探索的機會和不確定性。例如,出現一個關鍵性錯誤或一個烏龍球,這是不容易預測的。簡單地說,像國際足聯世界盃或人類活動這樣的隨機和動態的環境是當今人工智能技術無法很好地發揮作用的領域。這是一個很好的例子,我們必須關注人工智能在類似的動態領域中的適用性。另外,由於有一個非常複雜的數據結構,對於任何潛在的偏見來說,對經過訓練的模型進行審查是非常困難的。人工智能中存在的偏見會導致對某一特定群體的歧視性決定。將這種預測系統作為唯一標準的決策者可能會給個人和公司帶來巨大的影響。建議政府和企業只把人工智能作為一個用於隨機和動態環境預測的輔助決策平臺。

想要了解更多有關科技類的新聞資訊 各類智能電器、手機測評信息 點擊進入 www.huahuo.com


分享到:


相關文章: