用來預測奧運會獎牌數量的數學公式

用來預測奧運會獎牌數量的數學公式

英文: plus.maths.org/content/harder-better-faster-stronger, 翻譯: 趙小翼 校對: Ada

每屆奧運會後,人們都在猜測哪個國家表現得最好。當擁有龐大人口的中國,和同時擁有高GDP和高人口數的美國在獎牌榜上名列前茅時,我們真的應該感到驚訝嗎?我們能否看看獎牌榜,看看那些國家的表現確實好於預期。

2000年悉尼奧運會和2004年雅典奧運會,獎牌總數前五名的國家是一樣的:

用來預測奧運會獎牌數量的數學公式

總的來說,每屆奧運會上排名靠前的國家相同,但如果快速瀏覽一下獎牌榜,就可以發現兩個明顯發揮重要作用的變量:人口數和國內生產總值(GDP)。高人口可以讓國家有更多的運動員供選拔;GDP可以被認為代表一個國家的經濟狀況,一個經濟繁榮的國家更有可能把錢花在諸如體育等非生存必需的活動上。以人口為單位作調整後,我們發現排名前5位的國家,除了澳大利亞,其它都發生了變化,澳大利亞的金牌數在以人口數為單位的計算方式下,依舊錶現優異。

用來預測奧運會獎牌數量的數學公式

印度人口眾多,但2004年表現不佳,每十億人才有一枚獎牌。然而我們可以預期,隨著GDP的上升,未來印度將出現在獎牌榜的前列。若以GDP為考量單位,我們將產生新的前5名,這次澳大利亞從名單中消失,但古巴、牙買加和巴哈馬依舊錶現良好。

用來預測奧運會獎牌數量的數學公式

有沒有方法可以預測一個國家在奧運會上贏得的獎牌數量?或者,我們可否至少設定一個基準線來判定一個國家在奧運會上的成功與否?讓我們來看看2004年獎牌數量和國家人口數、GDP的曲線關係圖,我們很容易就能發現,用線性模型來擬合這些點是比較困難的,也就是說,這些數據點並不是在某條直線附近聚集。

用來預測奧運會獎牌數量的數學公式

獎牌數與人口數的關係

用來預測奧運會獎牌數量的數學公式

獎牌數與GDP的關係

GDP和人口數量的極值表明我們應該使用對數。在對數座標系中,縱座標進行相應的變換,在新的座標系下,原座標系中的1-10之間的間隔,和10-100、100-1000等的間隔相同。這樣的變換具有現實意義——人口眾多的國家和人口較少的國家能夠派出參加奧運會的運動員人數是相同的,同時,人口眾多提供了一個選撥優秀運動員的好基礎,但隨著人口增長,這種效應將會減弱。

用來預測奧運會獎牌數量的數學公式

至於GDP,各國偶爾會出現天賦超群的運動員,對手接受再高花銷的訓練,也無法打敗他們。梅西大學商業系Simon Geoffrey,Martina Kerim,Peren Arinb,Nitha Palakshappac和Sylvie Chettyd的報告 Do elite sports systems mean more Olympic medals? 中的調查結果支持這一觀點,報告作者提出“獲得金牌所需的非凡才能是無法被精英體育訓練系統所替代和超越的。”以2004年獲得15枚以上獎牌的國家為例,獎牌數量的對數與人口數量的對數和GDP的對數之間呈線性關係。使用線性迴歸——一種通過最小化數據點和擬合曲線之間的距離來擬合出一條直線的分析形式——我們可以找到一條擬合良好的直線。我們發現這個擬合的R²值(R²是相關性的統計量度,值在0和1之間)高於0.5,雖然這不足以證明相關性,但或許我們可以做些什麼:

用來預測奧運會獎牌數量的數學公式

獎牌數的對數與人口數的對數之間的關係

用來預測奧運會獎牌數量的數學公式

獎牌數的對數與GDP的對數之間的關係

使用GDP對數和人口數對數的線性組合,我們可以得出一條擬合直線:

用來預測奧運會獎牌數量的數學公式

Ln(GDP)和 Ln(人口數)的線性組合與 Ln(獎牌數)之間的關係

我們可以看到古巴,澳大利亞和俄羅斯都位於最佳擬合曲線的上方區域,因此與其他獲得了超過15枚獎牌的國家相比,它們的表現良好。這可以用古巴著名的拳擊傳統以及澳大利亞和俄羅斯在體育方面的資金投入來解釋。備受指責的英國奧運隊的表現並不像評論中說的那麼糟糕

這種擬合模型的危險在於你可以在事件發生後擬合任意兩個事物之間的關係——真正的挑戰是提出一個有價值的代表模型,不僅可以讓奧運代表隊知道他們現在的表現如何,還可以預測他們將來的表現。

用來預測奧運會獎牌數量的數學公式

在論文 Who wins the Olympic games: Economic development and medal totals 中,國家經濟研究局的Andrew B. Bernard和Meghan R. Busse提出了一個模型,其中考慮了人口,GDP,該國是否為奧運會東道國,以及該國是否曾為蘇聯或東歐集團的一部分。他們發現東道國在本國獲得的獎牌數量比在其他國家多1.8%,同樣地,他們發現前蘇聯或東歐集團國家(強制向體育輸送資源),以及實行計劃經濟的國家,獲得的獎牌數比同等條件的西方國家多3%以上。模型公式如下:

用來預測奧運會獎牌數量的數學公式

其中M是一個國家的獎牌數,N是人口數,Y是GDP,C,α以及β是常數;Host, Soviet和Planned是等於零或其它值的常量,其值取決於該國是否為東道主,是否為蘇聯陣營的一部分,或者是否實行計劃經濟。

在他們更成熟的模型中,作者把各國在之前奧林匹比賽中的表現也作為考慮因素,也許是為了考慮參加多次比賽的運動員所獲得的經驗。他們的總體結論是,儘管GDP是預測獎牌數據的最佳單一變量,但是否作為東道主等其他因素也需要考慮在內。他們的模型預測澳大利亞在參加自己舉辦的悉尼奧運會時,將比參加其它國家主辦的奧運會時多獲得17枚獎牌——澳大利亞在悉尼奧運會上實際多獲得了18枚獎牌,該模型預測值僅比實際值少一枚。

考慮到這一點,此次中國作為東道主(2008年),並且將大量資金投入到奧林匹克運動中,易知它會在獎牌總數上名列前茅。

用來預測奧運會獎牌數量的數學公式

數據來源: 本文使用世界銀行和國際奧委會的數據做分析。由於事後查出興奮劑等因素,獎牌表可能會改變,但在撰寫本文時數據是準確的。


分享到:


相關文章: