虛構的事實: 數據如何欺騙球迷讀者球迷。


虛構的事實: 數據如何欺騙球迷讀者球迷。

虛構的事實: 數據如何欺騙球迷讀者球迷。或多或少都會看到許多球員在社交媒體說stats don't lie之類的話,但是如果不考慮一些情景與數據的背後用意,很多時候我們都很容易被騙著,因此這篇主要來看數據統計的誤用將如何導致錯誤假設的案例。

數據分析已經成為運動中不可或缺的一環,各大球隊都靠著先進的軟件與器材來計算數據,進而轉變成對球隊有用的信息。但是數據真的能夠完整詮釋一位球員的價值嗎?中距離應該因為數據的計算,成為消失的藝術嗎?其實一切的運用,都非常取決於情境 (Context)。

本站的特約名家- 睿啃盒子 就有強調說,任何的數據使用都要考慮情景。唯有這樣才可以進一步讓此數據變成有意思(Meaningful)的信息。筆者相信 「Stats don't lie, but it won't tell the full story」,也就是說「數據不騙人,但亦不能詮釋全部」,說明了數據有些時候能夠「騙」到一些噱頭!

以下是3個關於NBA數據統計的誤用如何導致錯誤假設的案例,是在Hoops.Data網站所獲取並濃縮再翻譯,希望可以給球迷一些對數據使用更深層的理解。

原作者在之前用了得分/觸球率 (Point/Touch)的方式來計算NBA的前四最有效率得分球員,但只要稍微多瞭解得分/觸球率這項統計,球迷就會發現這並不適合套用在球星身上。舉例來說,LeBron James與Russell Westbrook在得分/觸球率這個統計中通常都會得低分,因為他們的每次觸球不限制在投籃,他們還得搶籃板、傳球和其他工作。

但當有人要將這個數據用來抹黑上述兩人時,就會出現「Russell Westbrook與LeBron James的每次觸球都產出低效率的得分,因此為了湖人的進攻可以更有效率,他們應該把球交給Anthony Davis或Kyle Kuzma」。而最後提出的那個解決方案明顯是一個謬論,不管是Kuzma、AD甚至McGee都有比LeBron更高的得分/觸球率數值,那是他們在進攻端除了AD之外都是「接球就投/灌」的綠葉球員,許多時候並不需要做組織或其他工作。因此這個例子說明了明白數據背後的計算目的非常重要。

Sabonis與Jokic這兩人,誰對各自的球隊更有價值?Sabonis在On/Off的統計中獲得了6.3分,而Jokic則是5.3分。事實是,Sabonis擁有比Jokic還好的On/Off數據;模糊視線的說法則是,Sabonis在各自球隊中比Jokic還有價值。 你肯定會想「這怎麼可能?!」,步行者事實上在Sabonis下場時的確表現得比金塊還糟糕,但這真的是衡量一個球員價值的最好數據嗎?

當Sabonis下場時,代替他上場的是新秀Goga Bitadze,一位尚未能與Sabonis相提並論的菜鳥。相反當Jokic被替換休息時,通常是Mason Plumlee上場,一位擁有相近傳球素質與不差的籃下進攻能力的中鋒。其實On/Off統計根本無法將兩位球員的價值與其團隊進行比較,反之它應該用來衡量一位球員如何影響其隊友。舉個例子,On/Off統計可以用來看Danilo Gallinari如何與Shai Gilgeous Alexander在場上相輔相成,而非用來比較前者與Paul George的價值。

虛構的事實: 數據如何欺騙球迷讀者球迷。


虛構的事實: 數據如何欺騙球迷讀者球迷。


這個例子證明了On/Off不該用來比較球員的價值,而勝利貢獻值(Win/Shares)會更適用於此用途。勝利貢獻值可以大約找出一位球員所貢獻的勝利次數,很多時候也非常準確。Jokic在這個環節擁有8分,而Sabonis則是6.2分。

繼續剛提到的勝利貢獻值,沒錯,它能夠找出價值,但也不是為球員做出實力排名的主要指標。Rudy Gobert長時間都在勝利貢獻值上領先整個聯盟,而Steven Adams在過去三個賽季也有出現在頭20的名單中。那問題來了,這能夠說明Gobert是NBA前5的球員嗎?Adams在過去三年也是NBA前20的球員嗎?

正確的答案是,這兩位球員一直都對他們的球隊有穩定貢獻。對於用此數據來爭辯說Adams在過去三年是NBA前20球員的人,要擊破這個說法,最直接的方式就是將技能和價值聯繫起來。但首先你必須明白他的價值從哪來,而勝利貢獻值並沒有衡量這一點!

虛構的事實: 數據如何欺騙球迷讀者球迷。


虛構的事實: 數據如何欺騙球迷讀者球迷。


Adams的價值源自於球隊的體系,這個賽季他在勝利貢獻值中排在第25位 (只差位居第20名的球員0.4的微差,而且Adams還缺席了不少比賽),而替補Nerlens Noel則是位於全聯盟的第52位。在加入雷霆之前,Noel整個賽季僅獲得4分的勝利貢獻值,而在這個尚未結束的賽季中他已經獲得了4.2分。

*這可以解讀為雷霆的陣容設置讓到Adams和Noel兩位長人能夠在各自的上場時間中做出有效貢獻,最終提升了球隊獲勝的機率。

虛構的事實: 數據如何欺騙球迷讀者球迷。


因此讀者可以看到球場位置和勝利貢獻值之間的關係。此例子也說明了勝利貢獻值不能測量一位球員的技能,但可以用來測算這位球員的價值。而這個價值也有可能來自於該球隊的體系,又或是此球員的個人能力,但勝利貢獻值無從而知,因為這些客觀因素無法被量化。

以上這三個例子,只要有心人士稍微利用能夠吸引注意的字眼,搭配上這些真實的數據,的確可以騙到不少球迷或讀者。筆者相信運動很多時候還是主觀的,所以數據最多可以用來解釋一些情況,而且還視情景而定。因此下次在閱讀文章,看到一些比較不熟悉的數據用詞時,不妨先去了解其用意及計算目的,避免被誤導相信Gobert是NBA前五的球員。


分享到:


相關文章: