兩項高階數據告訴你:C羅並非“浪射王”


長篇引言:

什麼是“射門選擇提升值”?什麼是“射門精度提升值”?為什麼要引入這兩個算法?

兩項高階數據告訴你:C羅並非“浪射王”
<section>
<section>
<section>


為什麼要用數據?為什麼要用高階數據?因為數據應用的精髓在於“抽絲剝繭”,一層一層推翻我們過去固有的錯誤認知。當然,如我之前所一直強調的:數據和錄像本身並不衝突。事實上,多數情況下,數據進階程度越高,和你反覆觀看錄像的感覺,就越接近。但有沒有想過另一種情況?

你看錄像得出的結論,是建立在一個“錯誤參照系”的基礎上?

比如說C羅“浪射”的依據,是他的射門數,比其他人更多?

有沒有想過這樣一個問題:這些射門,到底是“壓根就不該射”,還是“可以射”?

要知道,每支球隊創造機會的能力是不同的;每個球員把握機會的能力也是不同的。當我們考量一名球員射門選擇與能力時,其實需要考慮的因素非常多,而絕不僅僅是射門數字的簡單對比。

這裡用一個我之前在討論禁區內觸球時用過的圖說明一下問題,這是本賽季英超,諾維奇隊的前鋒普基的一腳射門:

兩項高階數據告訴你:C羅並非“浪射王”
<section>


真空環境下,普基這腳射門其實根本就不該存在——射門角度本已很小的情況下再遭遇對手封堵和貼防,即便打上力量,門將只要不出現低級錯誤,也很容易將之封堵出去。但問題是,普基全程都處於孤立無援的狀態下,你讓他“不要急,先控球,別丟球”,那恐怕才是扯淡的要求。

當然,類似情況在C羅身上很少見,畢竟C羅長期處於頂級強隊,不大可能出現普基這種不得不單兵作戰的窘境。但另一個事實是:C羅自身也經常出現在比隊友更適合射門的位置,那麼,為什麼C羅不能借此轟出更多的射門?

誠然,他會在某些時候極不理智的打出一些殊無把握的遠射;但有沒有想過三個問題?


第一,這些不靠譜遠射,相對於其自身大量射門而言,是不是隻佔了很小一部分?也就是說,從總體上看,C羅的射門選擇並不差?


第二,這些不靠譜的遠射,可能是在球隊所有人(包括他自己)也沒有更好辦法的情況下,被迫做出的進攻嘗試?換言之,不這麼打,其實也沒有一定更好的策略?


第三,結合所有射門來看,你讓C羅打,比讓隊內其他人打,要好一些。或者說,只看隊內的情況,C羅的選擇其實還算是相對比較好的?


講白了,我們要解決的不是“你自己的表現如何”,而是“你的表現,相對於你所處的環境而言,怎麼樣”。

為此,我在今天特意創造了兩個新的算法:“射門選擇提升值”和“射門精度提升值”。

之前已經給大家介紹過“預期進球數”這個很多數據網站都在做的高階數據了,並且也給大家普及過我自創的“真實射門得分率”概念(每次射門實際進球數與預期進球數之間的差值,不明白的朋友可以點擊三張高階數據圖告訴你:本賽季三大聯賽,誰的射門有質又有量)。但這兩個算法都是直接針對球員個人的,沒有結合球隊環境。這就產生了一個疑問:


一個球員所做出的射門選擇,和他的射門把握程度,比隊內除了他之外的其他人,強多少?

為什麼要做這個考量呢?舉一個例子:

兩項高階數據告訴你:C羅並非“浪射王”
<section>


這其實是C羅在難度極大的情況下,硬是靠身體素質打進的一球。這球的預期進球數只有0.11。要知道,預期進球系統是對射門瞬間射門難度的量化,既不考慮射門質量,又不考慮射門是怎麼形成的。如果綜合考慮這次戰術,其實尤文在理論上的選擇是很不合理的——門前只有2人搶點,對手4人防守,長距離傳中找後點,對手也不大可能漏人;而為了傳中能夠中間不被攔截,又不得不把球打的很高,這種傳球,你換個彈跳差一點的人來,大概率是根本碰不到球。

那麼,你說C羅做出這樣一次預期進球只有0.11的射門選擇,是環境使然,還是自己“浪”?

為了解決這個問題,我特意以C羅的生涯軌跡為線索,抽取了15-18年三個賽季的西甲,以及18-20年兩個賽季的意甲,射門總數前10的球員,然後排除他們每個人的射門總數、進球總數和預期進球數後,再計算其所在球隊“每次射門的預期進球數”(射門選擇)和“真實射門得分率”(射門精度)。最終得出了這樣兩個公式:


射門選擇提升值=球員個人每次射門預期進球數-隊內其他球員每次射門預期進球數


射門精度提升值=球員個人真實射門得分率-隊內其他球員真實射門得分率


事實上,如果我們把討論對象集中到每個賽季聯賽射門次數最多的10個球員中,就會發現,其實C羅的選擇與把握度,其實還可以。

我們從15-16賽季的西甲看起。

15-16賽季——C羅近5年來最差的一年,有可能跟貝尼特斯的失敗經歷有關

兩項高階數據告訴你:C羅並非“浪射王”
<section>
<section>
<section>


橫軸為“射門精度提升值”,越靠右,表明該球員比隊友射門更準;

縱軸為“射門選擇提升值”,越靠上,表明該球員比隊友射門選擇更好;

圓點大小為球員每次射門預期進球數,越大表明該球員自身的射門選擇越好;

圓點顏色為球員真實射門得分率,越接近深藍色表明該球員自身的射門越準。

實話實說,15-16賽季確實是C羅的小年,無論是射門精度,還是射門選擇,都出現了不小的問題。不過這裡面很可能有貝尼特斯時代全隊亂七八糟的因素。那個賽季皇馬解僱了深得球員支持的安切洛蒂,稀裡糊塗的任用貝尼特斯,結果經歷了相當長一段時間的“貝大師亂政”。前期說是全隊“亂槍打鳥”都不為過。比較神奇的是本澤馬在那個賽季迎來大爆發(不知道是不是突然感受到了來自齊達內的關懷……)。其實你去對比一下真實射門得分率,本澤馬再15-16賽季的表現還要比本賽季更好。

熟悉我之前文章的朋友應該都知道,我自己是幾乎不談“心態”的,因為儘管我承認它很重要,但對這種搞不到一手資料的東西,還是“存而不論”的態度比較好。因此,C羅這賽季的表現,我也不想簡單歸咎於心態問題。不過一個事實是:在這個賽季,C羅的表現確實存在一個後續的突然攀升——你說這是不是皇馬換帥的結果?不知道。一方面C羅自己本身就有慢熱的習慣;但另一方面,皇馬後半程在齊達內帶領下“撥亂反正”、重回正軌也是事實。這裡把C羅那個賽季的真實射門得分率貼出來,後半程確實比開局階段要好得多:

兩項高階數據告訴你:C羅並非“浪射王”
<section>
<section>
<section>


另外值得注意的是,梅西在圖中的位置非常尷尬。但那個賽季梅西自己讓權給蘇亞雷斯和內馬爾,並且自身狀態不穩只是原因之一,還有一項不能忽略的因素是我們這兩項高階數據的算法。它們計算的是你和隊友之間的差距,是“相對值”而非“絕對值”。也就是說,如果你的隊友當中有一個射門選擇又好,射門精度又高,而且射門非常多導致其在全對射門總數中佔比極大的神人,那麼你的表現,幾乎就不可能好。梅西就是這個情況——15-16賽季,正值巔峰的蘇亞雷斯轟出了8.49%的超高真實射門得分率。

16-17賽季——C羅最近一個金球

兩項高階數據告訴你:C羅並非“浪射王”
<section>
<section>
<section>


橫軸為“射門精度提升值”,越靠右,表明該球員比隊友射門更準;

縱軸為“射門選擇提升值”,越靠上,表明該球員比隊友射門選擇更好;

圓點大小為球員每次射門預期進球數,越大表明該球員自身的射門選擇越好;

圓點顏色為球員真實射門得分率,越接近深藍色表明該球員自身的射門越準。

這次C羅的位置非常好,看上去只是在散點圖正中央而非更偏近右上角,只是因為西甲中下游球隊出“大腿級射手”的慣例下,安東內(拉科魯尼亞)和魯本·卡斯特羅(皇家貝蒂斯),人為的把兩項數據都給打高了而已——沒辦法,這倆隊也確實只能靠他倆幹,沒看他們的圓點顏色已經變成黃色麼?說白了他倆自己的射門精度其實很不怎麼樣,但隊內其他人更菜,所以……

那個賽季是皇馬歷年來表現最好的一季(這方面我專門寫過一個長文,可以點擊【數據透視歷史】16-17賽季,最好的皇馬)。C羅則確實是隊內進攻端最值得仰仗的射門者。從圖中的位置上看,讓他射門也確實比讓其他人接管好得多。其實從圖中幾個人的名字我們也能看出端倪:射門入圍西甲前10的球員裡,巴薩佔了3個,皇馬則只有一個C羅。儘管我歷來反對“最好球隊最好球員拿金球”的說法,但按照這個普遍存在的不成文標準,C羅最近一個金球,還是很沒懸念的。

另外那個賽季,蘇亞雷斯幾乎可以封神——此人打出了11.56%的真實射門得分率,今天中午還有朋友在微博給我說,那兩個賽季的蘇牙,是怎麼射怎麼有。圖中蘇亞雷斯的圓點也是顏色最深的。那為啥蘇亞雷斯並沒有出現在圖片右上角?還是那個原因,梅西和內馬爾表現都不差,尤其是梅西,真實射門得分率也達到了相當漂亮的7.05%。

17-18賽季——C羅自己表現不好,可問題是隊友表現更糟糕啊

兩項高階數據告訴你:C羅並非“浪射王”
<section>
<section>
<section>


橫軸為“射門精度提升值”,越靠右,表明該球員比隊友射門更準;

縱軸為“射門選擇提升值”,越靠上,表明該球員比隊友射門選擇更好;

圓點大小為球員每次射門預期進球數,越大表明該球員自身的射門選擇越好;

圓點顏色為球員真實射門得分率,越接近深藍色表明該球員自身的射門越準。

說實話,今天做圖的時候,我對著這張圖看了好久,因為它太魔幻了。

圖中除了拉斯帕爾馬斯的卡萊裡之外,只有C羅一個人的圓點是黃色,或者說“非藍色”,這說明,在射門數前10的球員當中,C羅的射門精度,確實是最差的之一。事實上他那個賽季的真實射門得分率是非常尷尬的-0.46%,這意味著他的射門把握,比結合大數據系統用幾十萬次射門計算出的預估值,是要更低的。

但問題是,C羅在圖中的位置卻並不算差,其真實射門得分率,甚至比其他隊友要高出13.66%,在射門前10的球員裡,排名第7。也就是說,C羅自己的表現並不好,可是隊友更差……

與此相對應的是圖片左下角的梅西——他的圓點顏色是很深的藍色,圓點也很大,這說明他的真實射門得分率非常高,射門選擇也很好,但為啥還是會在這個位置?因為隊友更好——注意右上角有一個蘇亞雷斯,梅西的兩項高階數據,就是被蘇牙給沖淡的(蘇亞雷斯真實射門得分率不如梅西,但射門更多,在算法中佔優)。

這裡就要提到這篇文章的主旨了——我們討論“浪射”時,一定要注意球隊環境。你現在拐回頭看17-18賽季皇馬的錄像,C羅確實低質量射門很多,可你再仔細想想,他不這麼打又能如何?那個賽季相當長一段時間,皇馬實際上是陷入了“攻而不克”的困境中。所謂的“歐冠三連冠”,其實是一個偷換概念的錯誤說法,因為這是三年的成果,不是一年的成果。實際上17-18賽季,皇馬是在聯賽落後巴薩接近20分的情況下,歐冠一路驚險啃下來了一個冠軍。大樣本下看,那個賽季的皇馬甚至連“虛假繁榮”都算不上。說白了,那個賽季皇馬的環境非常糟糕,C羅其實是比隊友表現更好的,那個表現不好的人。

這麼說,你總不能說他浪射了吧?如果他是浪射,那麼拉斯帕爾馬斯的那個卡萊裡算什麼?明明是球隊的頭號大腿,但猜猜這人當季的真實射門得分率是多少?-4.51%……

18-19賽季——其實整個意甲都不好

兩項高階數據告訴你:C羅並非“浪射王”
<section>
<section>
<section>


橫軸為“射門精度提升值”,越靠右,表明該球員比隊友射門更準;

縱軸為“射門選擇提升值”,越靠上,表明該球員比隊友射門選擇更好;

圓點大小為球員每次射門預期進球數,越大表明該球員自身的射門選擇越好;

圓點顏色為球員真實射門得分率,越接近深藍色表明該球員自身的射門越準。

18-19賽季,C羅在轉會市場和意大利股市掀起巨大波瀾,轉會尤文圖斯。那個賽季的故事大家都知道:C羅開局階段彷彿被下了降頭一般,天天遇到對手門將開掛——但沒辦法,預期進球數系統是“射門前”的數據,不考慮對手門將的表現,因此C羅的真實射門得分率必然會因此吃虧。最終C羅-1.73%的真實射門得分率也確實不好看。

不過,那個賽季的意甲不知為何,出現了一個相當詭異的現象——各隊射門多的進攻大腿,一個比一個萎。圖中選取的射門榜前10裡,居然只有誇利亞雷拉和薩帕塔的圓點是藍色,最嚇人的是基耶薩和哲科,都快成紅色了……

而且,尤文其他球員的射門把握也不怎麼樣,加上C羅一貫出眾的搶點意識,他在圖中的位置其實相當接近右上角。說實話,這個現象我也不知道如何評價,可能整個意甲在那個賽季都有點低迷。

不過既然我們討論的是“是否浪射”的問題,那麼C羅處於這個位置,無論如何我們都不能說他“浪射”。在轉會意甲的第一個賽季,儘管遇到了很多困難,但顯然,他仍舊比隊友射門選擇更好,射門也更準。

19-20賽季——已經開始呈現出慢熱跡象,C羅存在回調趨勢

兩項高階數據告訴你:C羅並非“浪射王”
<section>
<section>
<section>


坦白講,在12月中旬做“真實射門得分率”那篇文章時,我很猶豫要不要寫意甲。因為當時C羅的情況確實非常糟糕,如何應對如此龐大的球迷團體,我也完全沒有把握。但最後我還是寫了,批評之餘我也說了:C羅歷來有慢熱習慣,而且如果能增加搶點的話,把數據打回來其實非常容易。

事實也確實如此,當時為負的真實射門得分率,如今已經成功打到了體面的3.93%。這裡放一個折線圖大家看看,C羅射門精度回暖的趨勢還是很明顯的 :

兩項高階數據告訴你:C羅並非“浪射王”
<section>
<section>
<section>


那麼,為什麼C羅在圖中的位置還不如18-19賽季那麼好看呢?其實C羅的“射門選擇提升值”和“射門精度提升值”比上賽季還要進步了,之所以在圖中的位置離右上角反而更遠,原因在於意甲出了三尊大神,給數據標準打上去了——因莫比萊、盧卡庫和哲科。

這其中尤其要提到的是因莫比萊,此人這賽季確實是大爆發,射門又多又準,而且拉齊奧除他之外也真的拿不出什麼像樣的得分手。相比之下,盧卡庫身邊還有個勞塔羅,而哲科則乾脆自身的射門精度奇差(真實射門得分率-4.55%)。因莫比萊的表現也確實給C羅帶來了很多輿論壓力。然而很多人在拿因莫比萊指責C羅的時候,卻沒有意識到:因莫比萊本賽季打出的實際上是頂級前鋒的數據——他這賽季的真實射門得分率是恐怖的9.40%。如果你們對這個數字沒有概念,那我隨便提供幾個頂級前鋒的數據:

萊萬多夫斯基本賽季是7.13%;瓦爾迪是10.26%;梅西是5.66%。

C羅準確講不是“和因莫比萊對比”,而是“和最好賽季的因莫比萊去對比”。這本身實際上就隱含一個“C羅必須挑戰最好”的含義了。

要知道,就在今天,C羅已經35歲了。一個35歲的前鋒被輿論拿來和因莫比萊比射門,是不是這本身就意味著,輿論對他的要求,是“你要做到最好”?

相信我,如果你從事一個職業,到了這個職業圈裡多數人都在考慮退休甚至已經退休的年齡時,還在被要求“做到最好”,那無論你有沒有做到,你都已經是這個職業當中歷史級的王者了。

當然,文章的末尾還是要回歸主題——數據的最大魅力就在於,它能夠幫我們一層一層的去偽存真,去深究我們之前一些認知的正誤。而當我們換一個參考系,把“球員之間的直接對比”,變成“球員結合所在環境的對比”後,就會得出完全不同的數據結論。這是我第一次嘗試這樣做,在我平常看到的足球數據類文章中,也沒有發現哪個老外這麼嘗試。還是那句話,足球數據應用,目前的門檻非常低,每個人都可以去嘗試著做,我們完全不用妄自菲薄的等著歐洲人去做。

即便我們不能擁有最好的職業足球從業環境,但也至少可以率先擁有一個不斷求知,而非不斷撕逼的足球討論環境。這也是本專欄的最大追求。



分享到:


相關文章: