□ 劉玥瑋(北京市海淀區育英學校高中二年級1班 北京 100039)
CBA正在如火如荼地進行,各支球隊都努力爭取每一場比賽的勝利,尤其是今年這個賽季,季后賽的隊數增加到12支,以前排名處于中下游的球隊都看到了晉級季后賽的希望,所以比賽的觀賞性也提高不少。
隨著每輪比賽的進行,每一場球都會產生大量的數據,比如得分、籃板、助攻、上場時間等等。結合到多個場次,更是有不同的統計數據產生:場均得分、場均上場時間、場均籃板等等。如果是整個賽季,則有賽季出場次數、首發次數、賽季平均上場時間、賽季平均得分、賽季平均助攻數等等。這些數據都可以從不同角度體現出球員的不同特點,例如從上場時間上可以看出該球員是核心球員還是角色球員,從場均得分、場均籃板、場均助攻、場均蓋帽以及場均犯規等數據上可以看出是主要得分球員還是藍領球員。
但這些數據都只是從一個或者多個方面反映了一位球員的能力、對球隊總的貢獻,并沒有體現出對球隊輸贏的影響,比如某一球員在一場球中爆發,得分很高,達到50多分甚至60多分,這只能說明該球員在這場球中對球隊總得分的貢獻很大,但不能說明球隊肯定能夠贏球。比如這個賽季11月11日北控主場對上海那一場比賽,上海球員弗雷戴特發揮大爆發得到75分,達到全隊總得分136的55%,但球隊卻輸了。
對于觀眾來講,大家更關注自己喜歡球隊的輸贏,這一點對于球隊的球員、教練和領導也更關心。如何將球員的各項指標數據和球隊的輸贏結合起來,讓我們在看熱鬧的同時,能夠看出一些門道,便成為一個關心的領域,作者正是在這樣的領域做了一個嘗試。
作者先是對2017-2018賽季北京首鋼男子籃球俱樂部 (以下簡稱北京首鋼)每場籃球數據進行采集,并對數據進行轉換整理,然后結合球隊的輸贏進行數據相關分析,最后給出了北京首鋼隊主要球員的特點及建議。
當前CAB共有20支球隊,每支球隊都有幾年的數據,鑒于時間上的限制,作者沒有對各個球隊都進行分析,這里只收集了北京首鋼在2017-18賽季的數據作為例子。
本文所有數據均來自于新浪網CBA頻道,詳細情況參見ht tp∶//spor ts.sina.com.cn/cba/。
采集的數據共有兩類。第一類是北京首鋼在2017-2018賽季各輪次比賽日期、對手、主客場和比分,這類數據總共一張表格。第二類是每一輪次北京首鋼球員上場情況、比賽中的各種數據,這類數據共38張表格。
數據采集共分兩步完成。
第一步:將新浪網頁上的數據手工拷貝到一個Excel文件中。這樣共有兩類數據共39個表格。
第二步:通過一段程序,將39個表格數據轉換成可供分析的數據,具體數據模型見下面的數據整理。
為了分析球員的各項指標數據對球隊輸贏的影響,結合實際數據情況,設計了這樣的數據模型:
(1)每一輪次的數據作為一個觀測值;
(2)輸贏作為目標變量;
(3)每一位球員在每一輪次中的各項數據都作為一個變量。
這樣得到一個38個觀測,366個變量的數據。下表列出了主要的變量列表:

表1
數據相關分析(Analysis of Cor relation)是對兩個或者多個變量之間的關系進行分析,發現其內在因素。在開始介紹相關分析之前,需要特別說明的是相關關系不等于因果關系。
相關分析的方法很多,初級的方法可以快速發現數據之間的關系,如正相關,負相關或不相關。中級的方法可以對數據間關系的強弱進行度量,如完全相關,不完全相關等。高級的方法可以將數據間的關系轉化為模型,并通過模型對未來的業務發展進行預測。
按照變量之間的類型不同,數據相關分析分為以下四種:
(1)自變量為數值型變量,因變量為數值型變量;
(2)自變量為數值型變量,因變量為分類變量;
(3)自變量為分類變量,因變量為數值型變量;
(4)自變量為分類變量,因變量為分類變量。
由于我們需要分析數據的自變量為數值型,而因變量只考慮輸贏,所以我們的分析屬于自變量為數值型變量,因變量為二元的分類變量。
分析過程比較簡單,就是將各個關心的球員指標數據分別與因變量進行比對,查看二者之間的關聯性。對于關聯性不強的,這里就不再贅述。另外我們只是分析了北京首鋼幾位重要球員的指標數據,其他球員要么出場次數太少,數據缺失嚴重,要么上場時間太短,多數指標數據為零,因此這里給出的是球隊的幾位重要球員分析的結果。
(1)7 號(杰克遜)分析。
①失誤次數多于3個(含3個)時,11場球贏了10場,相反,當少于3個時,20場球輸了9場;
②罰球出手次數5個(含5個)以上時,16場球贏了14場,相反,當少于5個時,15場球輸了8場;
③前場籃板個數在2個(含2個)以上時,7場球贏了6場;
④當搶斷個數3個(含3個)以上時,8場球贏了7場;
⑤當得分在18分(含18分)以上時,16場球贏了14場,相反,但得分在18分以下時,則是15場輸了8場。

注:“.”表示該球員未參加比賽,下同。
球員分析:失誤次數多反而贏球多,失誤次數少反而贏球少。失誤次數多說明杰克遜傳球多,失誤次數少一方面說明傳球好,更多的是說明傳球少。而當傳球多時,無論是否是失誤或者傳球成功,目的都達到了,那就是起到串聯的作用,通過傳球帶領全隊,而不是自己單打獨斗。至于罰球次數、搶斷和進攻籃板,則說明當杰克遜打的比較硬氣時,球隊往往贏多輸少。
(2)8 號(方碩)分析。
①三分球出手次數9個(含9個)以上,共有8場球,球隊全部贏了;
②兩分球出手次數小于4個(含4個),共有4場球,球隊全部贏了。


球員分析:典型的外線球員,多投三分,少投兩分。
(3)20 號(翟曉川)分析。
①蓋帽2次(含2次)以上就能夠贏球,共有5場球屬于這種情況,5場全贏;
②犯規5次(含5次)以上就能夠贏球,共有5場球屬于這種情況,5場全贏。


球員分析:拼命三郎,打球積極,球隊便能贏球。
(4)23 號(常林)分析。
只要有蓋帽就能夠贏球,共有5場球屬于這種情況,5場全贏。

球員分析:內線球員,以后就坐鎮內線,等著蓋別人的帽。
以上只是作者對于北京首鋼一支球隊、一個賽季的數據進行的分析,鑒于作者目前的水平,僅考慮了最簡單的一類相關分析。除此之外作者考慮了還可以進行以下幾種類型的分析:
(1)分析其他球隊的情況;
(2)分析多個賽季的情況;
(3)多個變量相互作用對球隊輸贏的分析,比如將主客場因素考慮到分析中去;
(4)其它類型的相關分析。