自從F1誕生以來,關於誰是最快車手的討論就一直在進行著。現在,通過機器數據分析在某種程度上可能為這個問題提供了答案。F1和亞馬遜網絡服務合作,利用自1983年以來整理的數據,深入研究了誰是單圈速度最快的車手。
F1和亞馬遜花了整整一年時間來構建這個算法,最終形成了F1最快車手的結果。利用算法比較車手與他們的對手的排位賽成績,從而建立一個最終排名。這意味著無論位於歷史成績表前端或是後端的車手,都有相同的機會出現在榜單上。
AWS的機器軟件梳理了自1983年以來每一個排位賽的成績表,剔除了異常值並將數據正常化,從而創建了一個複雜的車手錶現與其隊友(以及隊友的其他隊友等)的關係網絡。
為了創建有意義的數據,必須遵循一些規則。在進行比較之前,隊友必須至少進行過5次排位賽。另外,年齡也是一個因素,而如果一位車手在時隔3個或更多賽季之後重返F1賽場,這些也將成為參考因素。
與此同時,這個算法也給那些在隊友爭鬥中處於領先地位或者在強大隊友面前表現優異的車手打出了更高的排名。
值得注意的是,我們這裡討論的是純粹的速度表現,而不是輪胎管理、比賽技巧等。最終,我們得到了以下結果。
F1最快車手前20名
自從1983年以來,無可爭議的排位賽之王就是塞納。這位巴西車手在他的職業生涯中取得過65次杆位,雖然後來舒馬赫和漢密爾頓都超過了該紀錄,但如果塞納沒有遭遇事故去世,他應該可以取得更多的杆位。
在西班牙大獎賽中,漢密爾頓將他的杆位數提升到92,所以也很容易理解舒馬赫和他作為F1歷史杆位數前二的車手分別排在該榜單的二三位。
你會注意到這個排名是基於單圈時間差距來完成的,這創造了一場很大的假想排位賽,想象所有車手都在同一輛賽車上進行飛馳圈,最終得到了前20名的成績表。
重新評價科瓦萊寧
在前20名單中最引人注目的名字之一是來自芬蘭的科瓦萊寧。
科瓦萊寧於2007年加盟雷諾車隊參加F1,而早在2004年時,名不見經傳的他就已經贏得了王中王爭霸賽的冠軍。
他和漢密爾頓在邁凱倫搭檔了兩個賽季,僅僅收穫了1次杆位和1次冠軍,之後他在路特斯和卡特漢姆車隊結束了自己的F1生涯。但是,他的原始速度在該榜單中得到了重新評價,這要歸功於他在F1中與漢密爾頓和特魯利擁有接近的單圈表現。
數據模型解讀
F1數據系統主管斯梅德利表示:“排位賽速度是我們可以清楚看到的東西,如果考慮正賽速度,正賽配速會有許多細微的差別,有時候很難區分開。排位賽中,讓兩位車手在駕駛相同的賽車上賽道跑一圈,更好的車手會有更好的圈速。對於這個單一的數據點沒有很多的歧義,所以這就是我們採用的數據點。”
“作為數學建模者,我們要做的就是查看哪些數據是可用的,然後確保我們能夠將這些數據在數年中標準化。”
“在團隊環境中,這種類型的模型可以被用來對車手的選擇做出關鍵決定。由於車手往往都是車隊寶貴的財產,因此選拔車手的過程保持全面是很重要的。”