“大數據”浪潮正在改變足球的方方面面

Adam Crafton / 2020-04-14


“大數據”浪潮正在改變足球的方方面面


經紀人基斯-普勒斯馬(Kees Ploegsma)眼見他的客戶德佩在曼聯流年不利,掙扎不堪,決定冒險採取一種激進的手段嘗試拯救德佩的職業生涯。


在穆里尼奧手下,範加爾籤來的德佩一下子就失寵了。2016-17賽季上半段,德佩沒有撈到一次在聯賽中首發的機會,他的狀態和信心跌到了谷底。普勒斯馬也是在這時決定放棄足球經紀人慣常的“包裝推銷賺中介費”手段,轉而擁抱大數據科學,以此為根據幫助球員選擇最佳的下家。


普勒斯馬與大數據公司SciSports進行了多次會談。SciSports的創始人兼首席創新官(CIO)吉爾斯-布勞沃(Giels Brouwer)告訴TheAthletic:“吉爾斯希望我們一同前往曼徹斯特和德佩談談。我們去了他家,坐在沙發上一起觀看了皇馬和多特蒙德的冠軍聯賽比賽。我們需要了解為什麼他無法融入曼聯的戰術風格。他告訴我們,他需要信心,也需要成為球隊重要的一份子。接著他說,‘我需要自由發揮的空間’。”


成立於2013年的SciSports為客戶們提供多種服務。第一種是面向俱樂部的在線球探系統服務。該服務收錄超過3600傢俱樂部的9萬餘名球員的各種數據,俱樂部可以支付訂閱費用來收到每月報告;同時,該公司也為經紀人提供類似的服務。除了這種數據庫服務外,該公司也為俱樂部和經紀人提供定製報告。在德佩的案例中,該公司需要回答德佩的一個簡單問題:你們能不能通過大數據研究,告訴我最合適的下家來拯救我的職業生涯?


布勞沃說道:“我們研究了德佩在埃因霍溫和荷蘭國家隊的比賽,發現他在曼聯期間被要求承擔了相當多的防守任務,因此無法在進攻中自由發揮。接著,我們把他後來提到的訴求比如‘我希望在左邊路突破’,‘我希望新球隊的比賽節奏比較快’,‘我希望我面前有足夠的空間’等等綜合起來,通過我們設計的算法建立了一套數學模型。最終我們找到了五家他可能比較適合的俱樂部,以及能夠滿足他的訴求的教練。而里昂是我們算出來的最優解。”


普勒斯馬帶著報告就奔向里昂,對里昂的技術官員詳細闡述了德佩有多麼適合球隊。而由於德佩在曼聯發揮不佳,身價也有所下跌,急於止損的曼聯自然很願意和里昂達成交易。雖然埃弗頓,費內巴切,德甲、西甲和意甲強隊都有意德佩,但報告指出,德佩和里昂才是天作之合。德佩至今已經在102場法甲中打進43球送出32次助攻,同時也重新收到了荷蘭國家隊的召喚。


經紀人和數據分析師之間的合作日趨普遍。假設有一名年輕的曼聯球員,他的經紀人可以要求一位數據科學家提供該球員的個性化報告,比較其當前水平和潛力,然後與歐洲相似球員的各項數據和合同待遇作對比,接著再進行研究以求在新合同的談判中更加有利可圖。


單單一家SciSports就和至少10家獨立經紀公司簽署了合作協議,其中就包括比利時的A-Group——旗下有費爾通亨和穆薩-登貝萊為代表的多名球員,以及荷蘭的SEG經紀公司——打理著德佩(之前還有范佩西)等球員的事務,還有擁有阿爾德韋雷爾德和默滕斯的Stirr Associates公司等等。


布勞沃解釋道:“我們通過多種方式協助經紀公司的工作:首先幫助他們尋找合適的球員,配置成合適的球員(形式的)資產,同時允許經紀人使用球探報告說服球員,使球員認可這份報告已經對他們進行了深入的研究;接著是幫助這些球員找到最合適的下家。經紀公司在拓展自身業務的時候也會與我們進行交流。比如他們計劃在斯洛伐克開設辦公室時,他們就會向我們要斯洛伐克最炙手可熱的10名新秀的報告,我們就可以設計一套算法來滿足他們的需求。”


SciSports不是唯一提供這些服務的數據服務商,Analytics FC公司作為競爭對手同樣提供了類似的平臺。創始人傑雷米-斯蒂勒(Jeremy Steele)表示,公司與 First Access Sports經紀公司的緊密合作使得他能夠為客戶提供定製化的服務,譬如公司已經為切爾西的哈德森-奧多伊的合同談判提供了幫助,之前還有耶雷米-博加(Jérémie Boga)和雅尼克-博拉西(Yannick Bolasie)也曾從相似的服務中獲益。


然而,大數據的參與也使得俱樂部和經紀人的談判可能變得更加困難。如果大數據分析指出經紀人——或者更直接地說,他們的最終客戶——被球員的身價給迷惑了呢?


斯蒂勒表示:“我們需要搞清楚身價和實力的關係,畢竟我們也不希望回過頭去說,啊,那個球員很不咋的。我們不能說謊,數字不會說謊。如果你問我們歐洲最有潛力的新秀是哪些,然而你收到的名單裡沒有得到你想要的結果,我只能說,很抱歉,這種情況下數據僅供參考,最好不要盲目採信。”


布勞沃對此表示同意:“我們最近對一位球員直白地說,‘我們無法為你找到下家’。如果我們為了安慰他,告訴他有五傢俱樂部有意,但實際上沒有俱樂部對他有興趣,那麼他的經紀人就不會再找我們要報告了。有的時候我們會對經紀人說,‘不要為了要報告而來要報告,結果你們不愛聽’。也許有人不愛聽這話,但經紀人也是分兩撥的。有一撥喜歡瞅機會撈一筆就跑,還有一撥希望成為球員的職業生涯規劃師,希望儘可能延長他們的職業壽命。當然,還有些球員挺難伺候的,因為他們都認為自己是最好的球員。於是他們的經紀人就可以通過我們詳盡的數據報告來判斷下一步該怎麼走。比如去皇馬前需要準備些什麼,或者為了加盟尤文圖斯,先去亞特蘭大打出名堂。我們的報告有助於從客觀的角度來安排最好的職業規劃。”


事實上,經紀人們正在努力以相似的方式趕上“大數據足球”的列車。在過去的二十年中,大數據分析在足球世界的應用得以迅猛發展。這對於足球的各個方面都至關重要——球員的表現,球員的狀態,球隊的戰術,定位球戰術和球員轉會。利物浦不僅在市場開發上大獲成功,也在大數據的應用積極推進著各方面的進步。俱樂部足球總監邁克爾-愛德華茲(Michael Edwards)的背後,有著擁有劍橋大學理論物理學博士學位的伊恩-格雷厄姆(Dr Ian Graham)和曾在哈佛大學歐洲研究中心(CERN)進行研究工作的哈佛大學高材生威爾-斯皮爾曼(Will Spearman)這樣的強力援手。


足球在某種意義上,終於成為了大數據浪潮中的一份子。不過,在足球數據大爆炸之前的很長一段時間裡,足球世界也不總是這樣。


在社交媒體初具規模的時候,戰場就已在醞釀。“可以這樣來想象,” 任職於英超前四俱樂部的一位球探這樣解釋道,“學校分兩種,職業學校和學術學校;球探也分兩個派別。用電影人物舉例的話那就是,你希望成為《曲線難題》(Trouble with the Curve,又名《人生決勝球》)中柯林特-伊斯特伍德(Clint Eastwood)飾演的古斯呢,還是《點球成金》(Moneyball)中布拉德-皮特飾演的比利呢?”


如果你沒看過這兩部電影,那麼請容許我先簡單介紹一番。伊斯特伍德飾演的古斯-洛貝爾(Gus Lobel)是一位傳統派的老球探,以自己的方式如獨行俠一般在各處運動場間巡迴觀察球員,堅決抵制在他眼中“沒有靈魂”的數字化現代社會對棒球的影響。而布拉德-皮特試驗的比利-比恩(Billy Beane)則使用精準的統計學模型以低廉的價格招攬未被髮掘的璞玉。在很長一段時間裡,這兩種流派一直水火不容,有人認為數據分析師就是被請來毀滅足球的。


在千禧年到來之際,“第一個吃螃蟹的人”震動了足壇,他們的存在也終於開始被人們所感知。成立於1996年的Prozone的第一個大客戶是時任德比郡助教的史蒂夫麥克拉倫,他也是第一位真正重視球員追蹤系統的教練。Prozone在德比郡主場四周設置了八臺攝像機,用以從不同的角度收集潛在有用各項數據。麥克拉倫在成為弗格森的助教理後,曼聯也成為Prozone的第一個付費客戶——不過條件是如果曼聯在1998-99賽季贏得任何一個獎盃,曼聯就承諾支付50000英鎊的費用(當然,該賽季曼聯舉起了三冠王)。到2000年末,又有6家英超俱樂部與Prozone簽約。而在其他國家,另一種形式的數據採集也開始出現。統計公司Opta誕生了。


Opta創始人艾丹-科尼(Aidan Cooney)最近談及創業早期作為“非官方合作伙伴”時是這麼說的:“足球數據分析從出現到被接受和廣泛應用是一個緩慢的過程。當時大多數媒體都還沒有準備好接受“球員表現數據”這個概念。我認為,如果對球員在球場上的表現進行定量分析,然後將其整理成可視化的報告給觀眾看,媒體就可以使讀者與比賽的聯繫更加親密,並吸引更多的球迷來觀看比賽。”


當他把他的報告呈交給《每日鏡報》時,他被指試圖將足球“美國化”。他說:“所謂的‘美國化’,他們的意思是整出一大堆乏味的數據丟給讀者看就好比在整一張乏味的公交時間表。這就是歐洲人認為美國式的體育所呈現給觀眾的東西。不過,我們動了動腦筋,我們說,我們不是單純地提供數據,我們是通過數據來給大家講述一系列故事,這可以成為人們茶餘飯後的談資——那種能成為噱頭的故事(water-cooler moment)。當《點球成金》上映之時,我買了20份DVD寄給時任的每一位英超主教練,並附上一封‘希望我們有機會可以談談’的親筆信。不過我收到的回覆基本都是大大的‘你傻啊’。新事物一開始總是不太容易被接受。但我還是認為,視頻分析總會有誇大之處,合理使用數據才更加有效。”


科尼的營銷並不太成功。他說:“要知道,足球比賽得分並不多,很多時候需要運氣,畢竟足球是圓的,球場上什麼都可能發生。在其他項目中,各項因素的相關性更強,也更容易得出因果關係。棒球和板球就是如此。在早期的比賽中,有那麼一些球員能打出很高的離群值(outlier)。在《泰晤士報》擁有的Fink Tank專欄的編輯丹尼爾-芬克爾斯坦(Daniel Finkelstein)看出了其中的價值。當然也有其他編輯看到了這些,但可能還沒準備好發掘這些價值千金的數據。”


到了2002年世界盃前夕,芬克爾斯坦作為《泰晤士報》專欄的政論作者坐進了廣播電臺。當聽到亨利-斯托特博士(Dr Henry Stott)介紹他自研用於預測足球比賽結果的學術模型時,他頗感興趣。


芬克爾斯坦對TheAthletic說:“我聽完後想道,‘當然,這就是您計算足球比賽結果的方式,您也會使用手頭的數據模擬並創建模型’。第二天我把他的模型帶到了報社,對同事們說我們將用教授的部分數據來為我們的世界盃數據庫作補充。也許很多人不相信,但根據教授的數據,我們模擬出的結果是塞內加爾有25%的機會可以擊敗衛冕冠軍法國。而結果正是1-0。不過,如果結果不是這樣,那麼在此之後就沒有人會對我們的數據感興趣了。最後,我們因為這個擁有了一個專欄。”


由於大部分轉播商,記者和俱樂部沒有能力進行數據分析,Fink Tank每週一次的數據分析成為了大部分人成為“Excel球迷”的契機。芬克爾斯坦繼續說道:“這聽上去確實誇張了些,但我們確實感覺到我們成為了‘新式足球報道’的弄潮兒。在我們早期工作中遇到的唯一一個瞭解平均水平概念的人是溫格。他會說:‘我對贏得下一場比賽不感興趣’。’ 沒錯,作為一名主教練,你應該對贏得一系列的比賽感興趣。我們除了預測,還會寫了一些有關足球奇聞或傳說的專欄。 我最喜歡的是,‘半場休息之前丟球是最糟糕的嗎?’ 從統計學上來說,答案是否定的。我還記得那次我與伊恩-賴特(Ian Wright)的精彩對話,他說:‘不,在半場休息之前丟球的確是最糟糕的,因為喬治-格雷厄姆(George Graham)會在更衣室給我們狠狠吹風。’ 阿勒代斯對我們的這些報道很感興趣。有人光記得我們的報道內容而忘了我們的專欄,他就會說:“哦,是Fink Tank專欄的內容啊!”


“許多人認為這樣的事情既有趣又離奇,但對於博彩商來說,這是他們設計賠率的要素之一。有人為蘭開斯特大學經濟系寫了一篇論文,論文展示了我們(大數據公司)的數據模型的計算結果是如何在特定的一段時間內擊敗了博彩公司的精算師們的。這篇文章運用了我們的模型對該時間段內每一場英超聯賽,冠軍聯賽或大型國際比賽進行了概率計算,但實際上我們的一個模型可以為歐洲的每場比賽計算概率。我們堅信其毫無偏見的立場能產生看似冰冷卻高度可信的數據。我是切爾西的球迷,我記得我計劃去看切爾西在2004-05賽季客場對博爾頓的比賽(2005年4月30日),只要切爾西贏球,就能提前3輪贏得英超聯賽冠軍。我對我的朋友說,那天我們有63%的機會贏得比賽,所以我們應該去博爾頓。除此之外,我沒有其他理由。我通過數據分析逐漸瞭解足球。既然你不會在沒有數據的情況下分析其他任何事物,那為什麼還不對足球進行大數據分析呢?”


“大數據”浪潮正在改變足球的方方面面

阿勒代斯從一開始就樂於擁抱新技術和大數據時代。


芬克爾斯坦還提出了一系列假設,給數學家們設立了一堆研究課題。斯托特曾經是奧利弗-懷曼論壇(Oliver Wyman)的主管,伊恩-格雷厄姆也曾在他的子公司決策科技(Decision Technology)任職。在任職期間,格雷厄姆就是做這些研究課題的,如今他成為了利物浦的調查研究主管。據《紐約時報》報道,克洛普就任利物浦主帥不到三週,就認為格雷厄姆是球隊不可或缺的一份子了。


2014-15賽季,克洛普還在執教多特蒙德。2014年9月20日,多特蒙德客場0-2不敵美因茨。格擁有劍橋大學理論物理學位的格雷厄姆雖然沒有看過這場比賽,但他通過自己的數學模型研究了這場比賽,在攻入對方半場和創造機會方面做了特別研究,最後得出多特蒙德理應贏下這場比賽,接著他就把研究結果整理成報告送到克洛普的辦公室。事實上,格雷厄姆的算法本來是用來幫助利物浦的老闆們決定下一任的主教練的。他通過算法向老闆們演示了克洛普的球隊——儘管那個賽季多特蒙德僅僅排名第7,但是就多特蒙德的整體表現而言,他們完全可以拿到亞軍的位置。


過去,俱樂部絕不會指望不看足球的人來決定足球方面的事宜,而現在這樣的事態已經習以為常。利物浦的一位消息人士解釋了格雷厄姆的工作:“他和他的團隊通過一系列算法分析各種趨勢,查找能夠適應球隊體系的球員。接著,我們會把這些要求傳給高級球探,而克洛普則會從高級球探的報告中篩選他需要的球員。這些研究人員實在不可思議,和他們下棋我是鐵定下不過的。更令人驚歎的是他們可以計算出對手移動和控制球的速度,這樣我們就可以找出對手的‘阿喀琉斯之踵’,朝他們最弱的環節不斷施壓。”


芬克爾斯坦回憶起和格雷厄姆的合作時光時說道:“Fink Tank的許多工作都是由他驅動的。伊恩,亨利和我都十分謹慎地對待這些數據。我們用於談論足球的語言對足球十分重要,我們也能理解到單純觀看比賽所無法瞭解到的事物。我們也很快認識到門將在財務價值上容易被低估,因此我們毫不驚訝於門將的轉會費也可以高到6000萬鎊。另外舉個例子,角球的成功率其實很低,因此角球的價值遠遠不如高質量的傳球——而後者事實上被低估了。”


“俱樂部很快就跟上了大數據的潮流。伊恩和亨利與熱刺簽訂了顧問合同幫助熱刺尋找合適的球員,而這也是為什麼熱刺當時招攬範德法特的緣故。伊恩後來去了利物浦,而他也是利物浦球迷。這是一段非凡的故事。當芬威體育買下利物浦後,掌門人J.W.亨利來到了決策科技公司,希望該公司能為Fink Tank撰文的同時也為利物浦提供服務——亨利也是看了《泰晤士報》的這個專欄才對此感興趣的。然而當時公司和熱刺有合作,亨利也不能直接插手。於是伊恩以個人身份,帶著所有人的祝福去了利物浦工作。他在公司積累了10多年的數學建模經驗,利物浦真的是挖到了一個大寶貝。”


本-史蒂文斯(Ben Stevens)是水晶宮績效和招聘分析部門的主管——這是許多俱樂部見到利物浦通過大數據獲得成績後,紛紛設立的部門。他說:“當利物浦僱用數據科學家進行工作時,許多人都對此強烈反對。但是有些俱樂部意識到他們內部也可以完成這項工作。我們雖然也使用大數據平臺,但我們還邀請了一位數據科學家、倫敦經濟學院(LSE)的頂級畢業生鮑比-紹賈伊(Bobby Shojai)協助我們工作。 他太聰明瞭。雖然他不會觀看任何視頻或分析足球本身,純粹是通過數據分析;同時他完全是金融背景出身,沒有足球環境的薰陶——儘管如此,但鮑比每天都能讓我震驚。”


不過,我們需要搞清楚的是,數據科學和數據研究不是一回事。數據科學家需要結合人工智能,計算機科學等工具,在數據分析師與視頻分析師一同研究和呈現最終數據之前得出結論。 數據科學家可能會創建一系列數學模型來模擬結果,但數據分析師隨後會將其轉換為體育主管或教練組可以理解的報告以供解讀。近年來,數據分析師的職位日趨關鍵。


史蒂文斯解釋道:“十年前老學院派的邁克爾-愛德華茲(Michael Edwards)為朴茨茅斯工作期間作出了卓越的貢獻,如今他是利物浦的體育主管;安迪-斯科爾丁(Andy Scoulding)在結束富勒姆的數據分析師工作後去了流浪者擔任球員招聘主管;勞倫斯-斯圖亞特(Lawrence Stewart)的背景是球員表現分析,現在則在薩爾茨堡紅牛擔任球員招聘主管。我在水晶宮也換到了這樣的崗位。我們的工作不總是一成不變的。克里斯-戴維斯(Chris Davies)曾是羅傑斯執教萊斯特城期間的助教,但我和他第一次見面時,他成了斯旺西的數據分析師。”


那麼,作為數據分析師最初的那段日子又是什麼感受呢?史蒂文斯微笑道:“那些老學院派的分析師們需要一點時間完成痛苦的轉變。當然,那樣的日子我是不想再來一次了,但那也是難忘的一次成長儀式。我們也許會被問,‘你怎麼有膽子跟我這麼說?你懂什麼足球?’ 對很多大學剛畢業,自認為很懂足球的人來說,艱難一些的經歷能讓他們快速成長。如此一來,我們就篩掉了一批缺少毅力又沒有良好心態的人。你來到俱樂部,作為俱樂部部門的一員,你可能會受到很大的壓力。每當我看到一些數據分析師抱怨這抱怨那時,我總會回想起過去的苦日子。


“那時候的任務可不輕鬆。我畢業後就作為南安普頓青訓學院的實習生工作,2008-09賽季開始為一線隊服務,從此我的生活開始鉅變。那時候我們還在使用VHS錄像帶,每到一個客場都要帶上一盒,賽後我需要把錄像翻錄成DVD。我們還用SCSI硬盤,等比賽結束後,你需要把東西整理到硬盤上,等著騎著輕便摩托車的傢伙來取,他再把錄像送到利茲的ProZone公司。那邊會在24小時內整理完畢再把東西寄回到俱樂部。那時候可沒有現在這麼發達的網絡。有的客場沒有快遞員,所有人都在教練那邊等著你和你的東西,等不到就回不了家。


“那是的南安普頓,我所在的部門只有兩個人。電腦壞了,是你的鍋;數據錯了,也是你的鍋。如今我們突然有了許多同事和分析師,我們可以全方位無死角全天候地觀察、分析,甚至可以即時把我們的分析傳達到替補席。”


如今,戴著耳機的數據分析師在場邊與教練組交流的場景已經司空見慣。史蒂文斯回憶道:“我曾經戴著耳機和阿勒代斯對話,那場景回想起來可滑稽了。我戴著耳機歡樂地看著比賽,突然間他就毛了,朝著你的耳朵瘋狂吹風。我就在想,‘他好像朝我說了什麼,但他說的是啥米碗糕?’ 我禮貌地問道:‘頭兒,您剛才說了些啥?’ 他再次朝我吹了一陣風,就走開了。我趕緊拿出筆胡寫了點什麼。他顯然以為我是在摸魚!”


長期以來,挑撥起數據派和觀察派之間的矛盾都不是什麼難事。不過近期受訪者都表示,兩派人員之間早已不是那麼水火不容的狀態了。還是拿利物浦舉例,他們雖然有一位哈佛核物理學家孜孜不倦地研究數學模型,但也派出大量球探在全世界的野球場上發掘苗子。不過,與其說他們是球探,倒不如說是“拓展專員”——他們要與當地俱樂部和經紀人搞好關係,以免意中人被競爭對手橫刀奪愛。


利物浦的數據分析人員和數據科學家在忙著剪輯視頻片段並創建模型時,利物浦仍然有眾多球探在世界各地奔忙。例如,利物浦的一名球探被指派“觀察即將交手的對手”多達23次,才能獲得足夠的可寫入報告的依據,然後才將其饋入分析。同時,是球探們的肉眼而不是算法指出布萊頓在防守任意球的時候,人牆總是傾向於跳起。於是2017年12月2日利物浦客場5-1大勝布萊頓的比賽中,庫蒂尼奧主罰的任意球一轉“桃花影落飛神劍”的風格,轉而打出一記“貼地斬”從人牆下方攻破布萊頓大門。同時,表現最好的俱樂部往往能將各部門有機且和諧地聯繫在一起。接受本報告採訪的人都沒有建議將數據科學用於招募球員的唯一依據。


前Opta市場營銷總監西蒙-巴努布(Simon Banoub)告訴“非官方合作伙伴”:“過去我們曾認為書呆子和‘足球專家’涇渭分明,毫無關係,而現在,時代變了,兩者的界限已經不再清晰。”


他笑道:“我還是感覺我們所做的一切都是告訴客戶不要僅憑表面現象就武斷地下結論。不過,現在數據專家和傳統球探所謂的‘爭端’都是好事者的炒作,他們事實上是相輔相成,互相促進的。比如最好的數據分析師就像是頂級的‘翻譯’,他們不會對著教練大談算法:他們從浩如煙海的數據中找到需要的結果,再轉化成簡單易懂的語言整理成報告交給教練或者球員招募部門,隨後一級一級往上傳遞。如此一來,文化的隔閡也就不復存在。俱樂部高層在聽完經紀人口若懸河的推銷或是‘第六感’描述後,再看看這份作為盡職調查兼顧了謹慎性和完備性的報告,就可以決定是否簽署這份可能價值數百萬甚至數千萬的合同。”


數據專家的作用很簡單,大部分俱樂部都無法把球探派到每一個角落(FM裡沒有人能把球探網刷到100%),依靠數據專家他們可以省下不小的球探費用。 曼聯是其中一個比較極端的例子。自弗格森退休後,他們朝30多個國家派出了超過45名球探,工資表的名單顯得特別長。但更多俱樂部有著不同想法。他們選擇訂閱一些專精視頻分析的網站和App比如Wyscout,Scout7,InStat等,它們包含了超過20萬個全世界範圍內的比賽視頻——使得他們可以足不出戶便閱覽天下。當然,他們也會選擇數據分析軟件比如SciSports和Analyics FC。這兩家明面上是對手,但卻也經常坐下來相互交流經驗,進行頭腦風暴。


Analytics FC公司為利茲聯,西漢姆聯,西部拉麵王以及諸多參加歐冠聯賽的俱樂部提供服務(出於保密原因此處不便透露其他俱樂部)。創始人斯蒂勒在2019年冬季轉會期開啟前給利茲聯的體育主管維克托-奧爾塔(Victor Orta)去電,表示他找到了一位“冠軍聯賽級別的明星球員”。


斯蒂勒回憶道:“對我們而言最好的例子是丹尼爾-詹姆斯(Daniel James)。儘管在最後時刻,我們的轉會談判因為斯旺西那邊的緣故最終沒能成行,但他後來在曼聯發展得很好。我們觀察他八九場的英冠比賽,就認為他是利茲聯必須馬上爭取到的球員。維克托當時回應道:‘我勒個去,你確信?’我們說:‘是的,絕對確定’。於是他們立刻著手經辦轉會報價事宜。維克托非常信任數據科學。”


那麼,斯蒂勒的這一套算法“看到”了什麼?要知道,這個電話打完以後,我們才在足總盃的比賽中見證了詹姆斯一個人就攪得曼城後防雞犬不寧。斯蒂勒說:“我們的數據是基於‘預測分析’的。我們為CEO們介紹的時候會強調:數據統計是基於歷史數據給出的結果。這些數據直接告訴我們的是球員過去的表現,但我們會預測哪些球員未來會表現得更出色。我們的算法會指出,如果這個球員繼續怎樣怎樣,那麼他未來可能為成為什麼樣什麼樣。我們的算法和利物浦使用的那一套很像。我們設立了一個總體框架,該框架考慮了球員的每一個動作。比如,‘球員在中圈拿球時,他的得分概率是0.0001%;而當他把球長傳到禁區,前鋒拿到了皮球,那麼球隊的得分概率就增加到了2%’,等等。無論得分概率在動作前後的變化有多大,最終都是增加了球隊的得分概率。而球員其他的動作都會對球隊的得分概率造成正面或負面的影響。 ”


“大數據”浪潮正在改變足球的方方面面

去年還在斯旺西的丹-詹姆斯驚豔了數據分析師。


斯蒂勒的個人背景也頗為有趣。他原本是切爾西的教練,帶過年輕的芒特和亞伯拉罕。後來成了布倫特福德的球探,最後成立了自己的大數據公司。在利茲聯體育主管奧爾塔的引薦下,斯蒂勒成為了同一老闆旗下三傢俱樂部帕福斯FC(Pafos FC),里加FC和莫斯科羅迪納(Rodina Moscow)的體育主管。得益於他過去的教練經歷,他可以將自己對足球的獨特嗅覺和數學建模有機結合。


不過,斯蒂勒也表示:“大數據也不是萬靈藥,你也不可能一加入‘大數據浪潮’就次次都能簽下頂級球員。大數據更像是通過降低風險的方式使你獲得一定的比較優勢,許多俱樂部也是通過大數據來進行球員的初篩。你可以使用Analytics FC提供的TransferLab中的軟件包,從多達90個聯賽的數據庫中通過各種條件篩選出你想要的信息。也許你會說,‘我可以通過球探團隊來篩選這些信息啊’,並不是這樣,我們的數據更加‘全球化’。當然,這也不是說有了這個數據庫,我們就不需要傳統球探團隊以及和經紀人們的關係網了。”


在克里斯托弗-比爾曼的著作《足球駭客》(Football Hacker)中,他詳細描述了多特蒙德首席球探斯文-米斯林塔特(Sven Mislintat)招攬到萊萬多夫斯基,香川真司和奧巴梅楊的成功故事。多特蒙德只有10位球探,相比其他冠軍盃八強常客而言少得多,但他們的球探顯然效果更佳出色。2017年,阿森納花費了超過100萬鎊的違約金才把他挖來擔任球員招募部的總管。比爾曼寫道,多特蒙德每年會收到超過2500份球員報告,因此他們需要更強大更高效的“過濾器”。有些豪門已經開始自行研發自己的數據庫和算法,但更多的俱樂部還是選擇Analaytics FC或者SciSports的服務。


在馬德里的一家酒店大堂裡,一個二十多歲的年輕德國人似乎看上去遊手好閒。他風趣幽默,擁有經濟學和管理學的幾個碩士學位,而且不誇張地說,他是一個鑽石級賣家。他是正SciSports的奧地利,德國和瑞士地區經理西蒙·羅德(Simon Rodder)。在這家酒店,Transfer Room正在組織一項活動。Transfer Room是可以使俱樂部之間可以直接協商轉會並最大程度地減少經紀人參與的一個平臺。羅德意識到將會有150多名俱樂部代表出席,他需要和每一位代表搭話推銷,將自己的公司推向歐洲知名的俱樂部。


我們做下來,羅德拿出了筆記本電腦為我們演示軟件——專業版的“FM”變成了現實。羅德解釋道:“我們和超過50傢俱樂部進行合作,包括里昂,阿賈克斯,比利時國家隊。而我個人則為巴塞爾,法蘭克福,沃爾夫斯堡和帕德伯恩提供技術支持。”


“帕德伯恩的主教練曾說,他們的成功很大程度上要歸功於SciSports。他們還在德丙的時候就選擇了我們,雖然預算很少,但他們相比於同級別的對手要更加聰明(所以升到了德甲)。看看他們都是從哪裡籤來的球員!如果他們還是按老方法派遣球探,那麼以他們小小的球探網絕不可能觸及到那麼遠的角落。”


那麼這個軟件是如何實現其功能的呢?“我們首先篩選出一個數據表格,比如,英格蘭的前6級聯賽,德國的前4級聯賽,以及巴西的前4級聯賽。‘數據跟蹤’下的聯賽中每一位球員都盡在掌握。總體上而言,比較簡單算法可以跟蹤球員在球場上的表現對球員的影響。我們與WyScout合作拍攝比賽視頻,然後我們會處理這些數據以簡化俱樂部之後的分析流程。比如說,你想要拿萊萬多夫斯基作為模板,為你所在的德乙球隊尋找一名類似的球員。我們的算法不僅可以提供球員當前表現的指標是否符合你的要求,而且還可以預測球員是否已經‘潛力到頭’,可以跟蹤該球員過去六個月的發展情況。


“這就像在辦公室裡足不出戶就能有一個‘適合球隊的球員名單’,然後你就可以派遣球探去觀察名單內的球員,而不是像沒頭蒼蠅一樣看一場比賽換一個地方。用大數據超越你的對手吧。”


我作為模擬客戶,希望能“試用”一下羅德的算法找出和萊萬多夫斯基類似的球員。軟件的搜索很快,雖然我們可以輸入更多具體的條件,但僅僅這樣就能找到相當多符合條件的球員。“米利克,卡斯珀-多爾貝里(Kasper Dolberg),吉魯,卡魯姆-威爾遜(Callum Wilson)都和萊萬的特徵類似,” 他指著屏幕說道。其中威爾遜相當值得關注。英格蘭媒體似乎很驚訝這個伯恩茅斯球員為何能得到切爾西和曼聯的青睞,然而研究表明他擁有成為天才球員的許多技能包。


不過,如果單純是買個數據庫,為什麼俱樂部不買便宜得多得多的FM呢?布勞沃表示,許多俱樂部的確是這麼做的。但他也認為:“儘管許多俱樂部因為成本原因會這麼選擇,但FM和FIFA都是業餘觀察員提供的數據,這就容易帶著主觀傾向——畢竟球迷總會更偏愛自家球員。我們提供的數據更加客觀。”


羅德繼續說道:“對於FM而言,他們的數據並非實時數據。他們每個聯賽都有專門的小組自行決定球員們的數值。而我們則利用人工智能‘觀看’全世界範圍內的足球錄像,可以翻來覆去地看上1000遍也不累——換句話說,我們的算法能識別球場上的每一個狀況,產生相對客觀公正的數據以供計算。”


“查找相似的人”在高級別聯賽也得到了應用。比如阿森納就是用了坎特的模板從桑普多利亞籤來的託雷拉。


2012年12月,阿森納花費210萬英鎊從美國的數據公司StatDNA購買了數據庫,建立起了內部數學統計系統。比爾曼在書中寫到:“這筆交易高度保密,甚至於俱樂部的年度賬目中都沒有提到公司的名字。這筆開支僅以縮寫形式記錄下來:AOH-USA LLC。”


很快,在俱樂部“足球運營部門”正式任職的亨裡克-阿姆斯塔特(Hendrik Almstadt)聲名鵲起。畢業於倫敦經濟學院的他曾在戈德曼-薩克斯投行(Goldman Sachs)工作三年,又從哈佛商學院取得了MBA證書。他告訴時任俱樂部CEO加齊迪斯要“把球隊看成30支不同價位的資產組成的一個投資組合”。阿姆斯塔特的工作是更加有效地利用轉會資金和工資預算。他通過StatDNA模擬出阿森納如早早使用此係統,便不會在沙馬赫和樸主永身上白白浪費大把銀子。比爾曼寫道:“數據顯示沙馬赫在波爾多的進球效率低於預期,主要是因為他總是在不合理的位置就起腳射門。同時數據還指出沙馬赫技術上的嚴重短板使得他在大開大合的比賽中無法對球隊做出足夠的貢獻。” 溫格最終被說服,同意俱樂部購買StatDNA的服務。


可以預見的是,越來越多的頂級聯賽的俱樂部可能會加入開發自己的“數字球探工具”中。羅德解釋道:“有的俱樂部嘗試自己開發一套系統。當然,如果你有自己的算法,那肯定更能滿足自己的需求。我們可以刻畫出一個典型的左後衛的‘框架’,但萊比錫紅牛卻對適合自己的左後衛有著清晰的認識。那些超級豪門也可能會拒絕我們,畢竟能入他們法眼的球員少之又少,那麼用眼睛也夠了。我曾在馬德里向尤文圖斯推銷這套系統。雖然他們仍然熱情接待了我們,但仍然對系統的必要性持保留意見。畢竟像這樣大的俱樂部,買成品球員總是一貫政策。”


如今,俱樂部似乎都在將直覺和洞察有機結合。布勞沃說:“大數據已經證明它自身就是一個省錢的妙招。沒錯,事實上過去計算機學家可能也認為我們這群玩數據的和他們是水火不容的。顯然這不是一個雙贏的想法。如今,一個成功且美妙的項目一定是多人合作進行創造,而不是閉門造車,那樣就算你的東西再好,也沒人使用。畢竟,足球不能只靠直覺或者單靠數據。”


斯蒂勒則保持了比較謹慎的態度:“目前的轉會中,並不是每一筆都是在數據的強力支撐下達成的。有趣的是,在會議上,總有人會站起來說數據分析中最重要的是交流。他總會說分析師需要和俱樂部內諸如體育主管,主教練或者CEO這樣的‘足球從業人員’交流。但從來沒有人提出‘足球從業人員需要了解數據分析並儘快掌握相關知識’。目前而言,人還是比數據更重要。”


然而,現實中的足球世界往往是那些與足球運動員和教練一起工作的人要“屈尊”適應他們的各種腦洞。視頻分析人員的工作是將數據科學家的數學報告轉換為球隊上下都能聽得懂的語言。


史蒂文斯解釋道:“球員表現分析專員必須像條變色龍一樣靈活應對各種情況。我們不過是足球行業的‘打工者’,我們所做的一切都是為時任主教練服務。不管水晶宮的主教練是阿勒代斯,是弗蘭克-德波爾還是霍奇森,我們本身不會變,做的事情要變。


“我們主要製作的是可視化教具——我們的目標是把所有必需的信息整理成冊呈現給主教練。有時候主教練要我們寫一份80頁的報告,我就會問:‘啥?您真會讀那麼多?’ 我們確實會做一些書面工作,畢竟這是我們的盡責調查。然而我們呈現給主教練的賽前準備報告加上封面頁一共也就13頁:包括對手的首發預測,隊伍信息;把對手在控球和無球權期間的各種戰術安排記錄成一頁,把定位球戰術變成一頁,實時戰術調整記錄(比如一球落後的時候是‘都給老子往上衝’還是‘穩一穩,彆著急’),以及每個球員的簡介,諸如此類。”


拿霍奇森來舉例,史蒂文斯的團隊的中心會放在為球員量身訂造一套“戰術手冊”。史蒂文斯繼續說道:“霍奇森很擅長在我們描述‘對手在控球時會這麼這麼做’時,說‘很好,但我們需要知道要那樣那樣做’,如果你不能給出方案那就沒有意義。類似地,你很容易看出對方的不足,但如何利用對方的不足又是一門學問——當對方門將持球的時候,我們如何組織防守陣型?如果我們排出了4-3-3陣型,那麼我們是不斷壓迫對方的1/3區域,還是我們快速退守到自己的半場?他們有一個拖後中場,我們是讓9號位球員去偷襲,還是讓8號位球員上去壓迫?我們需要給出具體建議。”


如果說主教練對此尚容易接受,那麼球員們對日趨重要的分析報告又怎麼看呢?埃梅里執教阿森納期間,鮮有球員喜歡埃梅里細緻入微的視頻分析課;而範加爾執教曼聯期間,球員們經常抱怨範加爾在冗長的總結會上猛烈吹風,使得他們經常畏首畏尾,到後來,有些球員甚至看都不看範加爾發來的郵件總結就直接刪掉。範加爾不得不引入一個插件來觀察球員是否閱讀了郵件,結果上有政策下有對策,球員們打開郵件的同時也打開了計時器,然後把手機丟掉一邊去幹其他事了。顯然,針對球員應用任何分析方法都要建立在良好的人員管理技巧基礎上。某些英俱樂部使用了一個名為Pushfor的應用程序(該應用程序主要在法律界使用),其中包含一項功能可以告訴發件人,收件人(在這種情況下,是球員)是否閱讀了每一頁報告。阿勒代斯還鼓勵他的研究團隊把素材發給球員。這些視頻素材對視頻研究專員而言也許能提起興致,但球員們提出各自的意見時,這樣的情形可能會讓球隊陷入尷尬。


史蒂文斯說:“你肯定不希望球員們懶洋洋地坐在那邊,隨聲附和著‘嗯,啊,哦’。你希望他們說出‘我覺得那樣不行’,‘我不太明白’,或者‘我那麼做會怎麼樣?’ 你不希望面對的是一群行屍走肉。而當他們再回來找你時,就是給分析師出難題了——畢竟這時候你也不希望說話太傷人。”


“現在我們使用的是Hudl這個平臺——所有在線視頻都可以通過球員們的手機觀看,從賽前到賽後,俱樂部自己製作的剪輯視頻,潛在對手的視頻,門將動作,定位球戰術,點球戰術,等等。我們還能記錄球員們看了什麼,看了多久。但我仍然認為你無法對球員們進行填鴨式教學。你應該清楚哪些球員更加渴望學習,哪些球員給他灌多一點就容易短路。有的球員並不適合在圓桌會議上吸取知識,所以你最好給他們開小灶,甚至一對一地談話。對症下藥才能讓所有球員的表現都得到提升。”


隨著俱樂部圍繞最具創新性的分析師和科學家展開爭奪,許多致力於大數據分析的年度會議都將重點放在下一個潛在“奇點”上。


數據“跟蹤”是數據分析界的流行詞之一,它指的是針對球員在場上的移動狀況和無球跑動情況的跟蹤和記錄。Opta,Statsbomb和Wyscout等平臺在球員有球狀態下的數據採集方面表現出色。這就是所謂的“事件”數據——與球相關的事件。


數據跟蹤成為了球員運動軌跡研究的最後一塊拼圖,不過它仍然沒有對球員對場上情況作出反應的原因和後果作出詳細解釋。


拿切爾西的若日尼奧作為一個具體的例子來說吧。我們可以精確地知道他每場比賽的成功傳球數量和傳出威脅球的數量,也可以知道他的跑動距離,根據隊友的數據測算出他衝刺了多少次。然而我們很難創造出一個數學模型來實時顯示若日尼奧帶球時是否錯過了一次絕佳的傳球機會。或者,有一名球員在面對使用高壓逼搶戰術的球隊時,通過數次手術刀般的傳球穿透了對手的防線,使得球隊能夠推進到對方腹地——然而我們的數學模型還無法辨別這樣的傳球和普通的長傳的區別——相比於喜歡高壓逼搶的球隊而言,喜歡收縮防守的球隊讓對手送出看似舒服卻效果不佳的長傳可容易多了。


所以,數據分析師們的挑戰是將“事件”數據和通過數據跟蹤採集到的數據進行結合,使得主教練們能夠更好地做出戰術安排,或者決定潛在的簽約對象。


巴努布說道:“新的浪潮即將到來——數據跟蹤技術使得我們能加上新的‘過濾條件’篩選球員:決定,持球傾向,球員決策的機會成本,等等。球員的勇敢傾向會從利弊兩方面分析寫入報告,這也將成為主流。當‘事件’數據和數據跟蹤採集結合到一起,我們將看到全新的足球世界。”


這個賽季,英超聯賽已經為各傢俱樂部提供了這方面的數據,但仍然不甚完善,遑論其他歐洲聯賽了。行業內認為利物浦正在研發自己的算法,阿森納也在通過StatDNA製作自己的模型。


同時,兩大數據源的集合也更好地反映出後衛的價值。直到最近,我們還能聽到人們對後衛在一場比賽中做出了多次的剷斷而稱讚有加,但更多的職業球員則對此不以為然。比爾曼的書中收錄了哈維-阿隆索的一段話:


“當我必須做出剷球動作的時候,是因為我之前犯下了錯,” 阿隆索說,“在利物浦的時候,我總會收看比賽日節目,也會看到青年隊的一名球員的訪談節目。記者會問他們的年齡,偶像和小球員的長處,小球員會回覆諸如‘射門’或者‘搶斷’之類的。我很不理解他們接受的足球教育中會把搶斷當成一種技術,還會教授搶斷的技巧,並將此奉為圭臬,將此標誌為球員的風格。這樣一來,怎麼可能正確閱讀比賽?搶斷應該是你不得已而為之的選擇,雖然你需要用到這項技能,但你不能抬高它的價值。”


史蒂文斯解釋道:“防守並不在於‘為’,而在於‘不為’。老派的防守指導就像‘不要倒地剷球,站直了,嘗試斷球’。然而只要我的位置站對了,那就意味著對手無法傳球給他們的前鋒,你把所有的路線都封死了。這樣一來,防守就不再是球隊戰術重心的一部分,也不會有‘漂亮的防守’這樣的評價——合適的站位本身就起到了防守的作用。而這也是我們引入數據跟蹤的原因之一。”


許多公司也努力將自己的產品推廣到足球以外的廣大市場。Sportlogiq似乎是最接近於普遍化應用的例子,然而我們已經發現眾多“李鬼”也悄然現身,打著名不副實的大旗招搖撞騙。TheAthletic披露有一傢俱樂部花費了數十萬美金給一家他們搜索到的“數據公司”購買球員表現數據,然而在實際應用中卻發現這個數據庫錯誤百出,完全沒有使用價值。


Analytics FC提供了一種針對後衛研究問題的解決方案,雖然該方案仍待完善,但已經可用。斯蒂勒說:“我們的模型可以使用跟蹤數據對後衛進行研究,但還不能把90個聯賽的球員一起同時研究。從球探的角度來看,我們把算法提供給俱樂部,是為了拓展球隊的‘視野’,補全各路信息,目前我們還在努力。當我們可以在更多聯賽中以更方便的方式獲得跟蹤數據時,我們可以將所有跟蹤數據整合起來。我們的算法確實在一定程度上可以評估防守的各個要素,而99.9%的模型卻沒有。從這個意義上講,我們‘顛覆’了傳統模型。在所有防守情形下,當你計算出從位置X得分的即時概率時,如果防守球員在該情況下做出了封堵,那麼球隊丟球的風險係數或者概率將和該封堵行為高度相關。如果防守球員在丟球高風險區域進行剷搶或攔截,這些行為會在指標中顯示。當然我們不是去統計剷斷數量,而是對手此時的得分可能性以及防守球員是如何阻止對手得分的。 ”


當數學家和經濟學家還在為其在足球界的地位“爭鬥”時,業界已經開始意識到俱樂部已經開始願意為數據科學埋單。然而在新冠疫情已經嚴重威脅數據平臺的財務收支平衡的情況下,有些俱樂部已經開始拖延付款,並且給球員招聘部門的工作人員放了長假。


布勞沃說道:“上週我們和三傢俱樂部簽訂了合同,但另有三家拒絕支付服務費。現在所有球隊都沒有比賽,我們也沒有了研究比賽對手的任務,收入自然會下降。包括歐冠在內的所有比賽停擺對像我們這樣的公司而言確實是個打擊。到歐洲盃期間,所有數據公司都會研發出自己的數學模型——儘管我不會透露更多細節,但我們‘東方不亮西方亮’,還能從國家隊這邊獲得足夠的收入。”


不過數據科學家的收入前景是樂觀的。儘管一些頂級俱樂部仍然只願支付3萬英鎊左右的薪水給他們,但投行和四大審計公司正在迅速拔高收入水平線。斯蒂勒說:“現在,大多數俱樂部都在招募數據科學家,這樣的情況與15年前的體育科學革命非常相似。當時,從拉夫堡大學或巴斯大學體育科學專業畢業的學生往往收入很低。他們會進入一傢俱樂部,只做一些體育訓練和球場維護之類的事情,而被教練完全忽略。人們會說,‘反正他做的事人畜無害,就讓他幹著吧。’


“如今,每傢俱樂部都設立了體育科學部門,擁有10名左右的專業人員協助球隊工作,甚至還有專門負責為球員裝備GPS系統採集數據研究結果的。這可是天翻地覆的變化,所以我相信數據科學將改變足球,改變人們的觀念。大多數俱樂部已經有一名視頻分析師,許多俱樂部也聘請了一名數據專家:不過其中許多人並沒有什麼數據科學背景:他們不是數學家,經濟學家或科學家。但是,頂級俱樂部現在需要物理學家,計算機工程師和數據工程師。而留住高水平的人要花錢,因為他們找一份高薪銀行工作易如反掌。看看哈佛大學核物理學家、卻在利物浦工作的斯皮爾曼吧,有多少人能達到他那個地位?所以他想要什麼,就能有什麼。”


我們能否看到俱樂部與一流大學合作,並讓數據科學家指導研究生計劃?斯蒂勒:“確實有可能。在其他體育項目中,各項目都在各自競爭。而在足球行業,高級數據建模公司,政府,四大審計都在搶數據科學家。有一件事永遠存在:在俱樂部工作可以給他們發稍低一些的工資,只因為這是足球。人們總是更喜歡有參與感的事情。”


芬克爾斯坦認為他17年前的大膽預測如今已成為現實。他總結道:“我最近和利物浦的伊恩談了談,他十分確信與亨利在Fink Tank的合作對足球分析的發展至關重要。我非常感謝他的這番話!”


分享到:


相關文章: