《紙上籃球》第一章番外篇(2)CTG和synergy的球隊數據介紹

這個系列文章的本體部分,其中所涉及到的數據也都是以NBA官網和BBR所能查到的為主。整塊知識對於業餘愛好者來說已經夠用了。CTG和synergy這兩個需要付費的網站,也適合一些更硬核的愛好者、自媒體以及專業人士使用。

先說CTG。它是由法爾克從NBA球探圈離職以後創辦的。和官網或者BBR這種甭管有沒有用,把各種數據大雜燴先燉在一起再講的網站不同,法爾克是自己做過一番篩選的。我認為它首先代表著就是一種應用層面的思路,大家也可以透過數據的類別,去看看NBA的從業者究竟關心什麼。

CTG的各類統計,都是篩掉垃圾時間做的,具體標準就不細說了。他還會篩掉另一種回合,也就是比如時間只剩下1秒,A隊進球后B隊開啟進攻回合,來個全場長甩結束戰鬥。這個我們大致清楚就行。

CTG的拳頭產品,是關於各類數據的量化呈現。比如在球隊數據的部分,每項絕對值左邊,都有相應的排名以及色塊展示。大家可能會覺得球隊數據的量化沒有球員數據那麼重要,確實是這樣。畢竟球隊的對比對象只有30個,你在官網和BBR也可以按照升序和降序排列來得出答案。但那種形式必然會麻煩一些,比如進攻四要素你要點4次鼠標再去看具體排名,CTG就幫你省去了這些步驟。

《紙上籃球》第一章番外篇(2)CTG和synergy的球隊數據介紹

CTG在球隊數據方面沒有嘗試做大的創新,最核心的部分自然是我在本體篇介紹的那些,從百回合得失分,再到攻防四要素,再到攻防兩端的投籃分佈拆解。30隊的彙總頁面位於頂部LEAGUE裡的SUMMARY、FOUR FACTORS和SHOOTING,其中投籃分佈又會按照攻防的比重和命中率分成4個頁面。這些數據也可以在各自球隊的分頁面查到。

在統計投籃分佈時,CTG使用的標準是把4尺內計為籃下(NBA官網是5尺,BBR是3尺)。另一個比較方便的地方是,他對中間區域,也就是非籃下的兩分球比重和命中率做了合併計算。當你希望一目瞭然地得到這個性價比接近的區域的整體信息時,官網和BBR的強行切割反而會起到干擾作用——前者分兩塊,後者分三塊(CTG既有切割也有合併)。

另外CTG在單場比賽裡,也是有攻防效率、四要素和投籃分佈的,這個功能就不那麼好取代了,原因如下:

1.官網的習慣是在比賽結束之後,才出advanced stats的頁面,過程裡沒辦法查四要素。更致命的是他們算四要素時有一些無法解釋的錯誤。

2.BBR在北京時間5點以後才更新當日數據,自然也包括game log裡的四要素。

3.各大網站在做play by play時,大多都有投籃分佈圖。但那種一張圖上各種x和o的做法,你沒辦法知道各處的比重和命中率具體是多少。

4.CTG的王牌功能,量化對比在此處顯得更加重要。畢竟單場比賽的各項數據,對比對象已經不是30支球隊了,而是需要圈定一個範圍做比賽和比賽間的對比。

最後這個功能,全網還有的應該只有當年的onfire,以及現在的旋貓微博。當然微博沒辦法實時更新數據,我們也只能在每天下午的時候統一貼一次圖。

CTG在球隊數據方面還有用到的包括:

Exp W82,Exp W,Win Diff:這塊要結合我在番外篇關於關鍵球隨機性的文章來理解。Exp W82的意思就是,如果你按照百回合淨勝分表現,打82場應該會贏多少場。Exp W則是打到現在的場次應該會贏多少場。Win Diff是Exp W和實際勝場的差別。

果不其然,我們在榜單末尾看到了獨行俠的身影,它認為40勝的獨行俠按照淨勝分應該贏45場球,-5場的反差也是聯盟最大之一。

LAST 2 WEEKS:過去兩週各隊的百回合得失分和淨勝分。它就是一個關於球隊近期狀態的單獨呈現而已。另外我記得以前霍林格在ESPN有做過一個機算榜單,有意調大了近期表現的權重。他倒不是覺得近期表現真的就更加能說明球隊實力,而是整季的數據會忽略一些傷病和轉會因素。大家可以把近期表現和整季表現對照著來看。

Loc eFG%:在本體篇介紹投籃分佈的文章中,我們有提過關於出手數學期望的概念。Loc eFG%就是假設全聯盟各隊在每個區域的命中率都是一樣的,再根據各自不同的出手比重來計算預期的有效命中率。你可以理解成是一項衡量出手性價比的數據。

不用多說,那些更魔球的隊伍,通常Loc eFG%就更佔便宜。但Loc eFG%偏低的球隊,不見得實際打出的有效命中率就肯定低,反之亦然。

PLAY CONTEXT:法爾克根據球隊的陣地戰、快攻和二次進攻做了數據上的拆分,不過我們平時使用得不多。不是說它不是一個好東西,而是synergy在這方面有更細緻的拆解。


synergy這個網站兩句話總結就是:爛到極點的交互方式,不可取代的數據功能。

我最早接觸到synergy,應該是2013-14賽季。他們中途還對普通用戶關過一段時間,只讓NBA官網做延時極大的簡單抓取,再開起來就差不多是現在這個樣子了。這個網站給人的感覺就是,服務對象並不是普通網友,因此也沒必要把精力花在完善功能上,差不多夠用就行了。像官網和BBR那樣各個頁面都能互相跳轉,或者像CTG那樣恨不得每個重要信息都給你做量化對比,在synergy是看不到的。

但沒辦法,他們做的事情,和box score或者play by play為基礎的數據網站完全是兩種東西。synergy是把比賽場上的每種以投籃、罰球或者失誤結束的行為,按照錄像鏡頭切割成不同的play。

由於我們已經把possession翻譯成回合了,似乎play沒有特別合適的翻譯。possession和play的區別在於,possession不會以進攻方搶到進攻籃板為結束,也就是說你自投自搶3投1中,也只算一個possession。一場比賽下來雙方的possession是幾乎相等的。而play只要有投籃即為結束,自投自搶3投1中,會算成3個play。一場比賽下來雙方的play很可能有較大差別。

synergy歸類的play類型總共有11種,分別是:

面框單打:球員在外線有短暫停頓後,面框完成play,包括晃動半天沒運球的持球投籃。

持球擋拆:附近有掩護人隊友時,由持球球員完成play,持球球員不一定非要往掩護人方向移動。

低位背身:在近中距離區域背身接球后完成play。

擋拆接球:起始判斷標準與持球擋拆一樣,最終由掩護人接球完成play,包括順下、外拆和假掩護提前拆。

定點:不僅僅是傳統意義上的定點投籃,還包括各種上提和下沉的接球投籃,手遞手掩護人傳球后外拆再接球,以及沒有什麼停頓的定點突破(與面框單打區分)完成play。

無球掩護:附近有掩護人隊友時,由無球球員完成play。傳球人與掩護人不同。

手遞手:掩護人和傳球人為同一人,由接球球員完成play。

空切:在籃下附近的接球出手完成play,包括手遞手掩護人傳球后順下再接球。

二次進攻:搶到進攻籃板的球員完成play。

快攻:各種非陣地戰的搶攻完成play。

不可描述:其他難以歸類的play類型,包括砍人,技術犯規罰球,倒地爭搶後的亂戰投籃,切廣告不及時沒進轉播畫面的鏡頭等等。

其中面框單打、持球擋拆和低位背身這3大主攻方式,還有圍繞其發起的後續傳球相關統計。我的建議是大家如果真的有興趣研究這個網站,最好打開他們的play by play(頂部game裡選擇具體場次),對照著某場已經有的比賽錄像看一看,對分類方式會有更準確的理解(另一個辦法是多看我們做的每日球員集錦)。

synergy的交互有多麼不友好呢?比如他們在各個球隊頁面裡,只讓你看到每種進攻方式的比重和得分率(即得分數/play數),以及得分率的排名,注意比重是隻有數值沒有排名的。如果你想知道某隊某種play得分率高,是不是和佔比偏低有關係,要去彙總頁面裡查。

更可怕的是,synergy的彙總頁面裡,沒有提供類似於官網和BBR那種整合到一起,一鍵排名的功能。想看面框單打的比重,得點Leaderboards裡單項的%Time,它會生成一個獨立的頁面。

也就是說如果在沒有抓取技術支持的情況下,想知道湖人除了不可描述以外,攻防共10種方式的比重是聯盟多少,總共要開20個頁面才行……

這時候你肯定也不會指望他們再提供類似於日期範圍的篩選查詢了。實際上不知道什麼緣故,synergy在還算詳實的單場比賽頁面裡,只提供了各種play的次數,卻沒有提供得分。想得到結果要麼去數play by play(不太現實),要麼在比賽前把球隊頁面的總數據先記下來,再用比賽後的總數據手動減。


分享到:


相關文章: