金映言 賈俊鋮 洪敏杰 李云飛
(蘇州大學(xué)計(jì)算機(jī)科學(xué)與技術(shù)系 江蘇 蘇州 215000)
籃球作為一種強(qiáng)對(duì)抗的運(yùn)動(dòng),具有刺激性、觀賞性、趣味性的特點(diǎn),深受人們的喜愛。籃球比賽中美國(guó)男子籃球職業(yè)聯(lián)賽(NBA)更是受到了廣大籃球愛好者的追捧。近年來,越來越多的研究人員都在對(duì)NBA比賽數(shù)據(jù)進(jìn)行分析。可是,大部分對(duì)籃球數(shù)據(jù)的分析都是基于某一個(gè)角度的數(shù)據(jù)來進(jìn)行分析,例如投籃命中率、出手機(jī)會(huì)等,很少有從各個(gè)角度綜合分析數(shù)據(jù)的工作。同時(shí),大多數(shù)的數(shù)據(jù)分析結(jié)果都是使用折線圖、柱狀圖等這些常見的顯示圖來表示數(shù)據(jù)分析結(jié)果,比較單一。
在可視化不斷發(fā)展的情況下,出現(xiàn)了很多可以表示數(shù)據(jù)的形式,也可以綜合多視圖做數(shù)據(jù)展示。通過對(duì)原始數(shù)據(jù)直接或間接映射為可視化表達(dá)方式,可以更直接地展示數(shù)據(jù)的規(guī)律和變化趨勢(shì),從結(jié)果中迅速發(fā)現(xiàn)數(shù)據(jù)異常,并可通過多視圖聯(lián)動(dòng)等交互方式輔助用戶分析問題的原因。
因此為了解決缺少數(shù)據(jù)分析及可視化結(jié)構(gòu)單一和在視圖方面圖例單一、圖與圖之間缺乏聯(lián)動(dòng)性的問題,本文系統(tǒng)利用獲得的NBA整個(gè)賽季的比賽數(shù)據(jù),多角度分析比賽數(shù)據(jù)并進(jìn)行多元可視化。本文系統(tǒng)對(duì)獲取的比賽數(shù)據(jù)進(jìn)行整理統(tǒng)計(jì),并進(jìn)行組合比較、歸一化等數(shù)據(jù)分析,然后分別從整個(gè)賽季和賽季中單場(chǎng)比賽這兩個(gè)角度對(duì)NBA球員的比賽能力做如下分析。
(1) 分析整個(gè)賽季的球員數(shù)據(jù):按照球員的位置進(jìn)行分類比較,因?yàn)橄嗤恢玫墓δ苁且粯拥模瑢?duì)球員的能力要求相同,在球隊(duì)中所扮演的角色也是一樣的,因此能夠清晰地看出每個(gè)球員之間的數(shù)據(jù)對(duì)比和差距。從上場(chǎng)時(shí)間、得分、投籃命中率、助攻、籃板球、失誤、犯規(guī)等各個(gè)角度來看每個(gè)選手的各項(xiàng)數(shù)據(jù)對(duì)比,可以分析出每個(gè)選手的特點(diǎn)。
(2) 分析選手的單場(chǎng)比賽數(shù)據(jù):按照上場(chǎng)時(shí)間、得分、投籃命中率、助攻、籃板球、失誤等各個(gè)角度來看該選手每場(chǎng)比賽的各項(xiàng)數(shù)據(jù)變化趨勢(shì),可以看出該選手的狀態(tài)或者能力變化。利用單場(chǎng)比賽中雙方球隊(duì)相同位置的球員進(jìn)行對(duì)比可以直觀地發(fā)現(xiàn)兩者在能力上的差距,發(fā)現(xiàn)該球員的不足之處。
文獻(xiàn)[1]將經(jīng)濟(jì)推理與大規(guī)模空間數(shù)據(jù)建模相結(jié)合,對(duì)NBA球隊(duì)與球員戰(zhàn)略進(jìn)行新的分析。文獻(xiàn)[2]通過比較國(guó)內(nèi)和國(guó)外的球員比賽能力數(shù)據(jù),雖然涉及了球員的得分、籃板球、助攻、搶斷、蓋帽、失誤、犯規(guī)等多個(gè)方面,但其只是單純地進(jìn)行數(shù)據(jù)大小比較,并沒有進(jìn)行深入的分析比較。文獻(xiàn)[3]用累積的勝利概率預(yù)測(cè)了籃球比賽中球隊(duì)和個(gè)體球員的表現(xiàn)。文獻(xiàn)[4]為了探討運(yùn)動(dòng)員能力評(píng)估模型,主要運(yùn)用多元分析的主成分分析和因子分析,借助SPSS軟件對(duì)數(shù)據(jù)進(jìn)行分析,從測(cè)量運(yùn)動(dòng)員技術(shù)水平的得分、助攻、投籃命中率等10個(gè)指標(biāo)入手,得出各項(xiàng)指標(biāo)和公因子表達(dá)式。文獻(xiàn)[5]提出了兩種用于分析NBA場(chǎng)地評(píng)分?jǐn)?shù)據(jù)的新設(shè)備,兩者都基于對(duì)加減統(tǒng)計(jì)量的簡(jiǎn)單概括,就是將正負(fù)值擴(kuò)展到團(tuán)隊(duì)級(jí)別。文獻(xiàn)[6]利用GPS設(shè)備實(shí)時(shí)獲取球員位置的數(shù)據(jù),通過統(tǒng)計(jì)和運(yùn)動(dòng)學(xué)來進(jìn)行對(duì)球員的位置追蹤,對(duì)于教練在團(tuán)隊(duì)和個(gè)人績(jī)效分析方面很有價(jià)值。
文獻(xiàn)[15]從學(xué)生成績(jī)及其影響因素角度分析對(duì)于優(yōu)化大學(xué)課程安排和提升教學(xué)質(zhì)量的意義,根據(jù)成績(jī)數(shù)據(jù)的特點(diǎn),設(shè)計(jì)了多視圖協(xié)同交互的學(xué)生成績(jī)可視分析系統(tǒng),通過矩陣熱力圖、平行坐標(biāo)系與弧長(zhǎng)鏈接圖、節(jié)點(diǎn)鏈接樹等多視圖實(shí)現(xiàn)分別從課程、學(xué)生和教師角度出發(fā)的交叉分析與連貫推理。文獻(xiàn)[17]提出了一個(gè)多視圖合作的網(wǎng)絡(luò)流量時(shí)序數(shù)據(jù)可視化分析原型系統(tǒng),該系統(tǒng)由平行坐標(biāo)系、矩陣視圖、柱狀圖、樹形結(jié)構(gòu)視圖四個(gè)協(xié)同交互、簡(jiǎn)單易用的可視圖實(shí)現(xiàn)可視化。
文獻(xiàn)[7]簡(jiǎn)述了根據(jù)不同體育項(xiàng)目的特性,設(shè)計(jì)了適合其體育項(xiàng)目的可視化圖像,敘述了利用文本數(shù)據(jù)、視頻數(shù)據(jù)等相關(guān)數(shù)據(jù)顯示籃球、棒球、乒乓球、足球、臺(tái)球的相關(guān)圖示,并且從運(yùn)動(dòng)員個(gè)人、團(tuán)隊(duì)、場(chǎng)地等多個(gè)方面分析并可視化該角度的特點(diǎn)和數(shù)據(jù)特征,用戶可以根據(jù)該視圖直觀地發(fā)現(xiàn)想要的結(jié)果。文獻(xiàn)[8]利用boxscore data、tracking data和meta-data三種數(shù)據(jù)使用不同的數(shù)據(jù)可視化方法研究各項(xiàng)運(yùn)動(dòng)的情況,通過不同的方式角度顯示各運(yùn)動(dòng)項(xiàng)目的數(shù)據(jù)。
iTTVis[9]是一種新穎的交互式乒乓球可視化系統(tǒng),是第一個(gè)用于分析和探索乒乓球數(shù)據(jù)的視覺分析系統(tǒng)。 iTTVis從時(shí)間導(dǎo)向、統(tǒng)計(jì)和戰(zhàn)術(shù)分析三個(gè)主要角度提供了整個(gè)比賽的整體可視化,具有多個(gè)協(xié)調(diào)視圖的系統(tǒng),不僅支持通過統(tǒng)計(jì)和模式檢測(cè)來確定相關(guān)性,還可以通過交叉分析獲得洞察。
Baseball Timeline[10]是一項(xiàng)關(guān)于如何在2D圖表上清楚地描繪玩家行為的研究,以時(shí)間軸的形式表示時(shí)空信息,即通過時(shí)間變化來展示棒球比賽中的運(yùn)動(dòng)員位置的移動(dòng)。
現(xiàn)有的很多籃球數(shù)據(jù)分析可視化很多都是與投籃技術(shù)相關(guān)。文獻(xiàn)[11]是從投籃的角度分析球員,它主要利用投籃的位置做可視化,表現(xiàn)出投籃位置與命中率的關(guān)系。文獻(xiàn)[12]也是從投籃的角度分析球員的能力,提出了一種量化NBA球員投籃范圍的新方法,并提出了衡量、繪制和揭示NBA球員投籃能力差異的方法,通過可視化讓用戶直觀地在圖上看到投籃位置、投籃命中率。文獻(xiàn)[13]引入了一套新的防守性指標(biāo),通過數(shù)據(jù)來判別防守情況,旨在通過豐富防守性的測(cè)量來提升籃球分析領(lǐng)域的水平,并通可視化的方法顯示防守站位情況和站位對(duì)防守成功率的影響程度。文獻(xiàn)[14]提供了一個(gè)可視化系統(tǒng),通過boxscore、play-by-play、視頻等資源數(shù)據(jù)從整個(gè)賽季、單場(chǎng)比賽、一節(jié)比賽這三個(gè)不同的角度顯示了每個(gè)球隊(duì)的比賽情況,而本文系統(tǒng)是從不同的角度分析球員的比賽數(shù)據(jù),分析球員的各項(xiàng)能力。GameViews[16]分別從體育工作者和球迷兩個(gè)角度,根據(jù)他們不同的需求對(duì)所獲取的比賽數(shù)據(jù)進(jìn)行展示。
基于上述研究,本文系統(tǒng)創(chuàng)新如下:
(1) 分析籃球數(shù)據(jù)的方法多數(shù)都是針對(duì)某一個(gè)方面的具體分析,而本文系統(tǒng)是從多方面來分析球員的比賽數(shù)據(jù)情況。通過賽季、單場(chǎng)比賽數(shù)據(jù)等多數(shù)據(jù)角度來分析球員的比賽表現(xiàn)。
(2) 本文系統(tǒng)不僅分析了每個(gè)球員綜合能力和在每場(chǎng)比賽中的個(gè)人能力及表現(xiàn),還比較比賽中相對(duì)位球員的表現(xiàn)及綜合表示,可以讓用戶對(duì)比類似球員的能力,并且可以比較球員在球隊(duì)中的表現(xiàn)及作用。
本系統(tǒng)從ESPN網(wǎng)站上獲取了2016—2017賽季賽的比賽數(shù)據(jù),包括所有比賽的單場(chǎng)球員數(shù)據(jù)boxscore和所有比賽的統(tǒng)計(jì)數(shù)據(jù)teamstats,其中boxscore數(shù)據(jù)如圖1所示。

圖1 ESPN上boxscore數(shù)據(jù)
本文系統(tǒng)利用爬蟲技術(shù)將所有球隊(duì)的所有比賽抓取下來,然后將爬取下來的數(shù)據(jù)按照球隊(duì)分類形成文件。
每個(gè)球隊(duì)有boxscore和teamstats兩張表,如圖2所示。boxscore表具體顯示整個(gè)賽季該球隊(duì)所有的比賽數(shù)據(jù),包含每場(chǎng)比賽的參賽隊(duì)伍及比分、每個(gè)球隊(duì)上場(chǎng)的球員名單及其表現(xiàn)數(shù)據(jù),如圖2(a)所示,其每一行顯示了上場(chǎng)球員的該場(chǎng)數(shù)據(jù)表現(xiàn),從左往右分別表示球員名、打球位置、是否首發(fā)、上場(chǎng)時(shí)間、投籃命中率、三分球投籃命中率、罰球投籃命中率、進(jìn)攻籃板、防守籃板、總籃板、助攻、搶斷、蓋帽、失誤、犯規(guī)、正負(fù)值、得分。teamstats顯示了該球隊(duì)賽季所有比賽的單場(chǎng)雙方球隊(duì)各項(xiàng)表現(xiàn)數(shù)據(jù),如圖2(b)所示,數(shù)據(jù)類型除了和boxscore表中的數(shù)據(jù)類型一樣之外,還包含不同失誤的數(shù)據(jù)統(tǒng)計(jì),包括個(gè)人犯規(guī)、技術(shù)犯規(guī)、惡意犯規(guī),但是在表中只顯示部分?jǐn)?shù)據(jù)。

(a) boxscore數(shù)據(jù)格式
利用各球隊(duì)的boxscore中每場(chǎng)比賽的上場(chǎng)隊(duì)員情況,整理出每隊(duì)每個(gè)球員的參賽情況及參賽的各項(xiàng)數(shù)據(jù)。如果該球員沒有上場(chǎng),則除了顯示基本的球員信息以外,在“上場(chǎng)”的這個(gè)類別上說明該球員未上場(chǎng)的原因并且令之后的數(shù)據(jù)表現(xiàn)類別為空,如表1所示。根據(jù)每個(gè)球員表,整理出每個(gè)球隊(duì)的隊(duì)員表和每個(gè)位置的球員表,如表2所示。并根據(jù)球員表,把每個(gè)人的賽季總成績(jī)除去沒有上場(chǎng)的情況,統(tǒng)計(jì)整個(gè)賽季的情況。

表1 球員所有比賽數(shù)據(jù)

表2 球員、球隊(duì)、位置表
利用整理完的球員表和球員位置表,將球員按照位置進(jìn)行分類,相同位置的球員所有比賽數(shù)據(jù)放在一張表中。為了便于比較,將所有除球員基本信息數(shù)據(jù)以外的各項(xiàng)比賽數(shù)據(jù)按列(數(shù)據(jù)類別)進(jìn)行歸一化:
(1)

由于數(shù)據(jù)類型及關(guān)系較復(fù)雜,本文設(shè)計(jì)了數(shù)據(jù)模型ER圖,如圖3所示,橢圓形加粗表示為該表的主鍵。

圖3 ER圖
本文把所有數(shù)據(jù)整理成球員表、球隊(duì)表和球賽表三張表。
(1) 球員表包含球員的信息,包括姓名、球隊(duì)名、打球位置、上場(chǎng)時(shí)間、罰球命中率、三分球命中率、投籃命中率、前場(chǎng)籃板、防守籃板、總籃板數(shù)、助攻、搶斷、蓋帽、失誤、犯規(guī)、得分。(2) 球隊(duì)表包含球隊(duì)信息,包括名稱和球員名。(3) 球賽表包含該場(chǎng)比賽的信息,包括編號(hào)、球隊(duì)名、球員名、上場(chǎng)時(shí)間、罰球命中率、三分球命中率、投籃命中率、前場(chǎng)籃板、防守籃板、總籃板數(shù)、助攻、搶斷、蓋帽、失誤、犯規(guī)、得分。
根據(jù)所獲取的不同角度的數(shù)據(jù),用戶可以分別從整個(gè)賽季和單場(chǎng)比賽情況兩個(gè)角度,來查看球員的能力情況和狀態(tài)變化,有利于更好地分析球員能力和狀態(tài)變化,可以給球員提供合適的訓(xùn)練方式。
2.3.1賽季分析
1) 球員、球隊(duì)、位置關(guān)系分析。描繪所有球員所屬球隊(duì)和打球位置關(guān)系,并且進(jìn)行顯示。用戶可以先從整體框架上了解這個(gè)球員的所屬情況,也可從這個(gè)框架里了解球員情況。
2) 按照打球位置分類,相同位置球員賽季能力比較。因?yàn)樗械那騿T人數(shù)太多,不利于排序比較和觀察,所以本系統(tǒng)選擇從打球位置的類別來進(jìn)行排序。這樣,由于相同位置對(duì)球員的能力要求基本也是一致的,這樣對(duì)于能力的比較也是一致的,有利于更加直觀地查看到球員的能力差別。
相同位置球員,按照球員名字排序,顯示球員在上場(chǎng)時(shí)間、得分、命中率、籃板數(shù)、助攻數(shù)、失誤率等不同方面的數(shù)據(jù),并且將每項(xiàng)數(shù)據(jù)都進(jìn)行排名,有利于用戶直觀地看出每個(gè)球員在各項(xiàng)數(shù)據(jù)上的排名和各項(xiàng)能力。
3) 球員賽季能力分析。通常對(duì)一個(gè)球員的能力表現(xiàn)主要以得分為主,但是這樣分析是不客觀的,應(yīng)該從多角度來評(píng)判球員的各項(xiàng)能力。所以,在本系統(tǒng)對(duì)分?jǐn)?shù)排序的基礎(chǔ)上,還對(duì)投球命中率、籃板球數(shù)、助攻次數(shù)、犯規(guī)次數(shù)等進(jìn)行分析。如此有利于用戶從球隊(duì)角度,來全面地了解球員的各項(xiàng)能力。
由于整個(gè)賽季每個(gè)人上場(chǎng)的場(chǎng)數(shù)和時(shí)間都不一樣,所以依照賽季總數(shù)據(jù)雖然能看到每個(gè)人的綜合數(shù)據(jù)對(duì)比,但是要是完全依據(jù)總成績(jī)來評(píng)判一個(gè)球員的能力是不合理的,基于此,本文系統(tǒng)又取了總成績(jī)按照上場(chǎng)時(shí)間的加權(quán)平均值進(jìn)行比較,可以看到球員的真實(shí)能力。可以從總成績(jī)和平均成績(jī)兩個(gè)角度來分析球員能力。Y球員第j項(xiàng)數(shù)據(jù)類別的加權(quán)平均值計(jì)算為:
(2)
式中:yij為球員Y個(gè)人數(shù)據(jù)表中的第i行第j列的數(shù)據(jù),即為第j個(gè)數(shù)據(jù)類別的第i個(gè)數(shù)據(jù);n為球員Y的數(shù)據(jù)條數(shù),即為其上場(chǎng)的次數(shù)。
2.3.2單場(chǎng)比賽分析
1) 單場(chǎng)比賽數(shù)據(jù)變化。本文系統(tǒng)根據(jù)每次單場(chǎng)比賽數(shù)據(jù),對(duì)該球員整個(gè)賽季的得分、投籃命中率、上場(chǎng)時(shí)間、籃板數(shù)、助攻數(shù)、搶斷數(shù)、失誤數(shù)、犯規(guī)數(shù)等各項(xiàng)數(shù)據(jù)進(jìn)行比較,發(fā)現(xiàn)該球員的狀態(tài)起伏和能力變化。
2) 單場(chǎng)比賽中,球員與對(duì)手的數(shù)據(jù)比較。本文系統(tǒng)根據(jù)單場(chǎng)比賽中,對(duì)方球隊(duì)相同位置的選手的能力對(duì)比,展現(xiàn)出雙方的實(shí)力差距。由于球隊(duì)比賽一般有多場(chǎng),用戶可以利用多場(chǎng)比賽數(shù)據(jù)來比較球員能力。
3) 單場(chǎng)比賽中,球員對(duì)球隊(duì)的作用。根據(jù)球員每場(chǎng)比賽的各項(xiàng)數(shù)據(jù)表現(xiàn)和球隊(duì)的各項(xiàng)數(shù)據(jù),分別將相同類別的數(shù)據(jù)進(jìn)行比較,可以清晰地看出該球員在該場(chǎng)比賽中對(duì)球隊(duì)的數(shù)據(jù)貢獻(xiàn)。
基于此,用戶可以比較同球隊(duì)同位置的球員們之間的能力情況和狀態(tài)變化,有利于后期的訓(xùn)練安排和選擇某個(gè)球員進(jìn)行著重培養(yǎng),也可以根據(jù)情況安排不同的球員上場(chǎng)。后期還可以根據(jù)打球位置的球員能力比較,買進(jìn)想要的、符合球隊(duì)要求的、適合球隊(duì)球員能力的球員,利于球隊(duì)的整體發(fā)展。
本文系統(tǒng)從不同角度設(shè)計(jì)了以球員為主體的可視化視圖,有利于用戶從多角度理解分析球員的能力和狀態(tài)變化。
同時(shí),在不同場(chǎng)景下,本文利用不同的可視化圖形來展示數(shù)據(jù)分析的結(jié)果。具體地,本文通過使用Echarts所含有的可視化圖形,包括桑基能量圖、平行坐標(biāo)系、雷達(dá)圖、餅圖、折線圖等圖形進(jìn)行整合,綜合多項(xiàng)數(shù)據(jù)通過多圖表的形式表現(xiàn)對(duì)球員在多種角度下的能力分析結(jié)果。
3.1.1球員、球隊(duì)、位置關(guān)系圖
為了直觀地表示球員所屬球隊(duì)、球隊(duì)中所擁有的球員、球員所打位置,本文系統(tǒng)基于桑基圖進(jìn)行表示。桑基圖即桑基能量分流圖,也叫桑基能量平衡圖,是一種特定類型的流程圖,圖中延伸的分支的寬度對(duì)應(yīng)數(shù)據(jù)流量的大小。
如圖4所示,第一列為total,作為起始,寬度為所有球員的數(shù)量,連接到所有球隊(duì);第三列是player,包含所有的球員名稱,寬度為其所打的位置,因?yàn)榍騿T打球的位置是一定的,所以寬度為1,連接到所屬位置;第四列是position,里面包含所有球員打球位置,寬度為所屬該位置的球員數(shù)量。

圖4 球員、球隊(duì)、位置關(guān)系
3.1.2賽季總體人員分析
本文系統(tǒng)整理了每個(gè)球員的賽季總成績(jī),包括上場(chǎng)次數(shù)、首發(fā)次數(shù)、上場(chǎng)時(shí)間、得分、命中率、 籃板數(shù)、助攻數(shù)、失誤數(shù)、犯規(guī)數(shù),同時(shí)去除掉球員沒有參賽的場(chǎng)次,并且記錄了該場(chǎng)次沒有上場(chǎng)的原因。雖然已經(jīng)從多角度反映球員本賽季的情況,但是用總成績(jī)來反映球員的實(shí)力還是不太合理,本系統(tǒng)還利用加權(quán)(利用上場(chǎng)時(shí)間來做加權(quán))平均成績(jī)的結(jié)果來反映球員的能力。
利用整理好的多項(xiàng)數(shù)據(jù)對(duì)球員數(shù)據(jù)進(jìn)行顯示,利用平行坐標(biāo)系來對(duì)球員的各項(xiàng)成績(jī)進(jìn)行排序,這樣可以從多個(gè)角度觀察一個(gè)球員的各項(xiàng)能力而不只是從單純的得分情況。但是,由于總的球員數(shù)有四百多個(gè),顯示在一幅圖上會(huì)很模糊,不能直觀地看出區(qū)別,所以可以根據(jù)球員的打球位置將球員分類,這樣不僅減少了比較數(shù)量,還因?yàn)槊總€(gè)位置所需要的能力相似,所以比較起來更合理、更明顯。
根據(jù)每個(gè)位置的特點(diǎn),本文系統(tǒng)總結(jié)出了與每個(gè)位置相關(guān)的最重要的數(shù)據(jù),并列出了前十名的排名,如圖5所示,其中C(中鋒)位置的重要數(shù)據(jù)就是籃板球次數(shù)。

圖5 球員賽季各項(xiàng)數(shù)據(jù)展示
3.1.3賽季球員能力分析
本文系統(tǒng)不僅利用了平行坐標(biāo)系來看比較球員之間的各項(xiàng)數(shù)據(jù)排名,還利用能力圖來直觀地展示球員的整體能力。使用歸一化的方法將每個(gè)數(shù)據(jù)都控制在[0,1]之內(nèi),以便更好地將所有球員的數(shù)據(jù)表現(xiàn)在能力圖中,有利于比較球員的總體能力。
根據(jù)球員賽季總體數(shù)據(jù)和平均數(shù)據(jù),使用如圖6所示的能力圖表現(xiàn)出在兩個(gè)角度的球員能力分布,可以發(fā)現(xiàn)即使是同一個(gè)球員在總體數(shù)據(jù)和平均數(shù)據(jù)上面都會(huì)存在一定的數(shù)據(jù)差異,說明該球員因?yàn)槠渖蠄?chǎng)時(shí)間足夠,所以他的總體數(shù)據(jù)就會(huì)很高,但是從平均成績(jī)上來看,就能發(fā)現(xiàn)一定的問題,其在上場(chǎng)時(shí)間內(nèi)的有效率可能沒那么高。

圖6 單人球員分析
3.2.1球員各單場(chǎng)數(shù)據(jù)比較
根據(jù)球員整個(gè)賽季的表現(xiàn),如圖6所示,利用折線圖反映出球員首發(fā)、上場(chǎng)時(shí)間、總投籃命中率、投籃數(shù)、三分球投籃命中率、三分球投籃數(shù)、罰球命中率、罰球數(shù)、籃板數(shù)、助攻數(shù)、搶斷數(shù)、失誤數(shù)、犯規(guī)數(shù)、得分?jǐn)?shù)等各項(xiàng)數(shù)據(jù)的整個(gè)賽季的表現(xiàn),可以發(fā)現(xiàn)球員的能力表現(xiàn)和狀態(tài)變化。圖中的零值點(diǎn)表示該球員并沒有上場(chǎng)。
3.2.2單場(chǎng)比賽球員對(duì)比
根據(jù)單場(chǎng)比賽的數(shù)據(jù),比較兩支球隊(duì)的相同位置的球員單場(chǎng)能力,如圖7所示,利用雷達(dá)圖來表現(xiàn)兩個(gè)球員在該場(chǎng)比賽中的能力表現(xiàn)。利用平行坐標(biāo)系來表現(xiàn)出該場(chǎng)比賽兩位球員各項(xiàng)能力的數(shù)據(jù)對(duì)比,這樣可以全面地看出兩位球員在次場(chǎng)比賽中的表現(xiàn)對(duì)比。并且比較他們?cè)谥匾獢?shù)據(jù)上的整個(gè)賽季數(shù)據(jù)變化,發(fā)現(xiàn)此場(chǎng)比賽在其以往的比賽中發(fā)揮情況,畢竟不能因?yàn)橐粓?chǎng)比賽就能比較出兩者的差距。

圖7 球員對(duì)比
根據(jù)此場(chǎng)比賽的兩支球隊(duì)勝負(fù)情況,將該場(chǎng)比賽輸?shù)年?duì)伍使用綠色表示,贏的則用紅色表示。
3.2.3單場(chǎng)比賽球員在球隊(duì)中表現(xiàn)
根據(jù)單場(chǎng)比賽球員數(shù)據(jù)和球隊(duì)數(shù)據(jù),總結(jié)出此場(chǎng)比賽中該球員在球隊(duì)中的各項(xiàng)表現(xiàn)。利用餅圖來顯示球員在比賽中投籃命中的次數(shù)、籃板、助攻、失誤、犯規(guī)、分?jǐn)?shù)在隊(duì)中的百分比,可以明顯看出該球員對(duì)球隊(duì)的作用。
以2016—2017賽季Cavaliers隊(duì)的LeBron James為例,Cavaliers隊(duì)一共比賽81場(chǎng),其中James報(bào)名參賽80場(chǎng),出場(chǎng)參賽73場(chǎng),并且首發(fā)出場(chǎng)73場(chǎng)。
從整個(gè)賽季來看,因?yàn)镴ames打得是SF(小前鋒)的位置,所以我們?cè)谖恢蒙线x擇SF。頁面展現(xiàn)出所有球員中這個(gè)位置的數(shù)據(jù)情況,如圖8所示,可以粗略地看出James的各項(xiàng)能力的數(shù)據(jù)排位。James在得分這一數(shù)據(jù)模塊上是最多的,表現(xiàn)出來他的得分能力是很強(qiáng)的。同時(shí),他的籃板數(shù)和助攻數(shù)也是在同位置球員中最多的,其他數(shù)據(jù)也在前列。但是,很明顯James的失誤量也是最大的,這就反映出他的不穩(wěn)定性,一定要注意失誤的產(chǎn)生,盡量減少失誤。

圖8 位置為SF(小前鋒)的所有球員的賽季各項(xiàng)數(shù)據(jù)比較圖
由于整圖數(shù)據(jù)量還是很大,所以可以選擇想要比較的一些球員,如圖9所示。Andrew Wiggins雖然上場(chǎng)時(shí)間是最長(zhǎng)的,分?jǐn)?shù)排第二,但是他的投籃命中率并不是那么高,而且其他數(shù)據(jù)都是比較平均的,說明他創(chuàng)造機(jī)會(huì)的能力比較強(qiáng),得分比較厲害。Trevor Ariza是搶斷最多的,其他的數(shù)據(jù)表現(xiàn)都一般,而且控球比較多,所以很明顯他的分工角色不是主要的得分點(diǎn)。

圖9 篩選球員比較

(a) 賽季總能力 (b) 賽季平均能力圖10 James賽季能力比較

(a) James賽季單場(chǎng)三分球命中率

(a) James在第一場(chǎng)比賽中對(duì)球隊(duì)的作用
對(duì)James賽季總能力進(jìn)行比較,本文系統(tǒng)通過兩個(gè)角度來分析James整個(gè)賽季的能力表現(xiàn),如圖10所示。可以看出,投籃命中率、助攻、搶斷和失誤并沒有因?yàn)樽隽似骄刀a(chǎn)生很大的改變,而籃板球和犯規(guī)值變化卻很大,很明顯上場(chǎng)的時(shí)間長(zhǎng)度影響了數(shù)據(jù)分析。單位時(shí)間內(nèi)James的籃板數(shù)并不是很高的,雖然這不能說明他的籃板能力不強(qiáng),但是也證明了有比他籃板能力更強(qiáng)的球員,一味地相信總數(shù)據(jù)也是不合理的。
很明顯,如果只依據(jù)總成績(jī)來分析個(gè)人能力的話,就會(huì)誤會(huì)James的失誤比較多,只是因?yàn)樯蠄?chǎng)時(shí)間過長(zhǎng),更加容易失誤,因此在同樣的單位時(shí)間上,James的失誤率并沒有那么高。
本文系統(tǒng)又分析了James整個(gè)賽季的所有單場(chǎng)比賽數(shù)據(jù),并且將不同角度數(shù)據(jù)顯示在不同的折線圖上,特別指出里面的零值為James沒有上場(chǎng)的場(chǎng)次。以總投籃為例,如圖11所示,為了有利于比較,本文系統(tǒng)將投籃命中率的折線圖和投籃次數(shù)的折線圖同時(shí)顯示。可以看出,總體的投籃數(shù)還算是比較穩(wěn)定的,基本上穩(wěn)定在每場(chǎng)比賽15~25次之間,投籃命中率在0.4~0.7之間波動(dòng)。但是仔細(xì)分析兩幅圖,可以發(fā)現(xiàn)當(dāng)投籃次數(shù)少的時(shí)候,投籃命中率也會(huì)較低,反之投籃次數(shù)多的時(shí)候,投籃命中率也會(huì)較高,所以當(dāng)投籃機(jī)會(huì)變多,手感也會(huì)變好,命中率也會(huì)較高。
以Cavaliers與Pacers這兩只球隊(duì)的比賽為例,這兩只球隊(duì)2016—2017常規(guī)賽階段總共比賽4次,但是由于其中一場(chǎng)James沒有上場(chǎng),本系統(tǒng)并沒有顯示此場(chǎng)比賽。以James和同位置的球員Paul George作比較,球員能力圖與前文所示類似,故不再展示。
由三場(chǎng)比賽的兩個(gè)人的能力圖可見,George的表現(xiàn)起伏比較大,而James相對(duì)來說比較穩(wěn)定。James的投籃命中率都高于George,在其他方面James總體都比George發(fā)揮得要好,主力球員的狀態(tài)和能力也決定了球隊(duì)的實(shí)力。
利用單場(chǎng)比賽的各項(xiàng)數(shù)據(jù),使用餅圖清晰地看出James的各項(xiàng)成績(jī)占球隊(duì)總成績(jī)的百分比,即在該場(chǎng)比賽中對(duì)球隊(duì)所做出的貢獻(xiàn)。
三場(chǎng)比賽的餅圖,如圖12所示。可以看出,James投籃數(shù)、助攻數(shù)和得分基本上占了全隊(duì)的25%,三分球的占比在逐漸提高,籃板在球隊(duì)中作用并沒有那么大,并不像總體數(shù)據(jù)顯示的那樣,也有可能是由于對(duì)手的緣故,這一方面還要做更多的研究。
通過對(duì)球員James的具體分析,詳細(xì)說明了本文系統(tǒng)的使用,以及能夠利用本系統(tǒng)從多角度分析球員能力,而不是單一的只著重其中一點(diǎn),本文系統(tǒng)能夠讓球員從數(shù)據(jù)方面意識(shí)到自身的不足之處。
為了對(duì)NBA球員的能力進(jìn)行全方位的分析,本文介紹了一個(gè)利用賽季數(shù)據(jù)從多角度分析NBA球員各方面能力的系統(tǒng)。該系統(tǒng)分別從賽季總數(shù)據(jù)和單場(chǎng)比賽數(shù)據(jù)角度分析了球員的包括上場(chǎng)時(shí)間、投籃命中率、籃板數(shù)、助攻數(shù)、搶斷數(shù)、失誤數(shù)、犯規(guī)數(shù)、得分?jǐn)?shù)等方面的能力,根據(jù)打球位置的不同綜合分析了各位置、各球員的能力差距。本文通過對(duì)球員James的數(shù)據(jù)分析,詳細(xì)介紹了系統(tǒng)的使用方法,體現(xiàn)了系統(tǒng)的實(shí)用型和有效性。該系統(tǒng)給籃球教練、分析師及球員提供了全面的球員數(shù)據(jù)分析,更加直觀地讓他們了解球員的各項(xiàng)能力,能給他們的訓(xùn)練和排兵布陣提供幫助。
未來將繼續(xù)豐富和加強(qiáng)該系統(tǒng)。一方面,將提高系統(tǒng)的數(shù)據(jù)量,不單單是一個(gè)賽季數(shù)據(jù),這樣有利于更全面更客觀地分析球員的各項(xiàng)能力;另一方面,將加強(qiáng)數(shù)據(jù)的維度,除了boxscore和teamstats數(shù)據(jù)之外,可以利用play-by-play這種單場(chǎng)比賽中發(fā)生的所有情況的數(shù)據(jù),將每場(chǎng)比賽進(jìn)行細(xì)化,還原每場(chǎng)比賽的實(shí)時(shí)數(shù)據(jù),使得對(duì)球員的能力分析更加細(xì)化。