張紹良,董芮,王星,張銘鑫,崔一雄
(1.清華大學 體育部,北京 100084;2.北京體育大學 中國籃球運動學院,北京 100084;3.上海體育學院 體育教育訓練學院,上海 200438;4.北京體育大學 體育工程學院,北京 100084)
籃球技戰術表現分析是指由技戰術分析師或助理教練借助視頻分析軟件或者比賽追蹤系統,觀察并標記訓練與比賽中團體和個人的技戰術行為和事件,通過數據分析和視頻反饋等手段,提供給教練員客觀和詳細的反饋報告,以此幫助教練員了解對手和自己團隊的優勢與不足,從而改進自己球員的運動表現和優化自己團隊的訓練計劃和比賽策略[1]。目前,技戰術表現分析師已經成為國外高水平職業籃球俱樂部中必不可少的重要角色,籃球技戰術表現分析相關研究也已經得到了廣泛的認可和應用[2]。
當今籃球技戰術分析報告主要包括視頻與數據分析報告兩種形式[3]。在籃球比賽表現分析中,視頻分析容易受到教練員的主觀認知和經驗的影響,從而導致關鍵技戰術特征的選擇和對應的分析報告帶有明顯的個人主觀傾向[4]。與之相比,數據分析建模的方式可提供較為客觀的反饋信息,糾正教練主觀認知的偏差,輔佐其查找比賽過程中遺漏的關鍵信息[5]。主觀與客觀的結合可有效地提升教練員團隊的工作效率,而數據建模的可視化分析則是當今球隊技戰術分析中必不可少的環節[5]。
近些年我國籃球比賽數據分析模型大多數采用簡單的描述分析、秩和比分析及回歸分析,其中一般和廣義線性模型是籃球定量分析中被廣泛采用的統計模型[6-9]。然而,線性模型描述和解釋的僅僅是自變量與因變量條件均值之間的關系,因變量條件均值以外非中心位置的情況是無法用自變量解釋的[10]。舉例來說,大多數職業籃球聯盟或者世界大賽的最終排名與球隊的勝率高度相關。當想探尋球隊的最終勝率(因變量)與技戰術指標(自變量)之間的關系時,教練最主要關注的是處于條件分布低尾的低勝率的球隊和分布高尾的高勝率球隊等處于因變量非中心位置的情況,而條件均值模型主要考慮的是因變量的均值(即勝率的條件均值與每個自變量的關系),難以擴展到這種非中心位置。因此,籃球比賽分析的研究需要應用更加完善的統計分析方法去解決類似的問題。
本研究以2019年國際籃聯(International Basketball Federation,FIBA)男子籃球世界杯32支球隊、92場比賽的比賽表現數據為研究樣本,運用分位數回歸方法探索不同勝率球隊的技戰術特點。本研究假設高勝率與低勝率球隊在技戰術應用上存在明顯差異,不同勝率的球隊強調不同的技戰術特點。
本研究技戰術數據來自于FIBA世界籃聯官方網站(http://www.fiba.basketball/basketballworldcup/2019/teamstats);高階數據來自于美國體育數據公司 Synergy Sports Technology (https://www.synergysportstech.com/synergy/)。Zhang等[11]已經對Synergy Sports Technology公司數據的信效度進行了實驗驗證,該公司所采集的籃球比賽數據與實際比賽中球員的技戰術行為存在良好的組間一致性。
根據相關研究的結果,將世界杯中32支參賽球隊的最終比賽勝率作為因變量,該變量服從正態分布。其中各參賽隊最終勝率(0~100%)所對應的百分位數點(Q10,Q25,Q50,Q75,Q90)呈現在表1中。

表1 2019年男籃世界杯各參賽球隊最終勝率分配
研究所選取自變量包括常規變量、高階變量和情境變量(見表2)。其中常規變量根據先前的研究基于球權進行了標準化處理[12]。高階變量是指影響籃球比賽結果的“四因素”,包括有效投籃命中率、進攻籃板球率、失誤率和罰球率,這4個指標反映了進攻和防守兩個方面對比賽結果的綜合影響因素[9]。此外,將對手實力、比賽節奏、比賽的類型作為情境變量,考慮它們對比賽勝率的影響[12]。

表2 自變量及對應分組
1)通過K型聚類分析將對手實力以最終比賽勝率為標準劃分為強隊(勝率(68±14)%)和弱隊(勝率(24±17)%);將比賽節奏根據球隊的球權分為快節奏比賽(球權=80.02±3.23)和慢節奏比賽(球權=72.13±2.76);將比賽的類型根據最終比賽分差分為平衡比賽(分差=10.67±6.88)和不平衡比賽(分差=43.21±9.21)[13-14]。
2)使用加權最小二乘法(以下簡稱 WLS)作為基礎模型去探尋常規變量、高階變量和情境變量與球隊勝率之間的關系,有一定的局限性:(1)該方法只能給出因變量條件分布的不完整描述,提供的信息有限;(2)該方法極易受到異常值的影響,不夠穩健[10]。本研究同時采取分位數回歸(以下簡稱QR)作為比較模型去解決上述問題。首先,分位數回歸能描述和解釋自變量對因變量不同位置的影響,從而能提供觀測變量之間更全面的信息[15]。其次,該方法使加權誤差絕對值之和最小來估計回歸參數,所以回歸系數更加穩健,對異常值的敏感程度也遠遠小于加權最小二乘回歸[16]。再次,分位數回歸模型對隨機誤差項的分布沒有假設,當誤差項不服從正態分布時,分位數回歸比加權最小二乘法回歸更有效[15]。最后,在回歸系數的解釋方面,加權最小二乘回歸解釋的是自變量對因變量平均值影響,而分位數回歸描述的是自變量對因變量特定分位數水平上影響的邊際效果,即分位數回歸可以提供不同分位點處的估計結果[10]。
上述所有的統計分析和數據可視化通過 R軟件(version 3.2.2,Vienna, Austria) 完成,其中分位數回歸模型建構使用的是‘quantreg’包中的“Ker”函數,兩個模型中,Alpha值均被設定為0.05[12]。
WLS和QR回歸系數的描述和對比呈現在表3中,顯著性變量總結呈現在圖1中。

圖1 WLS回歸和QR回歸區分比賽結果的顯著性變量示意圖
在Q10分位點上對應的是勝率最低的球隊,有科特迪瓦、塞內加爾、菲律賓、日本,這些球隊的勝率處于該條件分布的10分位數處。從QR回歸結果中可以看出,對手實力(?=-0.126,P<0.01)對于比賽勝率有顯著的負向影響,但是防守籃板(?=0.015,P<0.01)、助攻(?=0.010,P<0.05)、犯規(?=0.009,P<0.05)這 3 項指標對于比賽勝率有顯著的正向影響。
在Q25分位點上對應的是勝率較低的球隊,代表球隊有委內瑞拉、中國、波多黎各等,這些球隊的勝率處于該條件分布的25分位數處。從QR回歸結果中可以看出,對手實力(?=-0.181,P<0.01)與比賽勝率有顯著的負相關性,但是防守籃板(?=0.013,P<0.01)、助攻(?=0.006,P<0.05)對于比賽勝率有顯著的正相關性。
在Q50分位點上代表了本屆世界杯的平均水平,代表球隊有俄羅斯、尼日利亞、突尼斯等。從QR回歸結果中可以看出,對手實力(?=-0.198,P<0.01)、失誤(?=-0.169,P<0.01)、失誤率(?=-18.02,P<0.01)對于比賽勝率有顯著的負向影響,但是防守籃板(?=0.010,P<0.01)對于比賽勝率有顯著的正向影響。
在Q75分位點上對應的是勝率較高的球隊,有塞爾維亞、美國、法國、澳大利亞,這些球隊的勝率處于該條件分布的75分位數處。從QR回歸結果中可以看出,對手實力(?=-0.171,P<0.01)、失誤(?=-0.133,P<0.05)、失誤率(?=-13.62,P<0.05)與比賽勝率有負相關性,但是防守籃板(?=0.007,P<0.05)與比賽勝率有正相關性。
在Q90分位點上對應的是勝率最高的球隊,有阿根廷和西班牙,這些球隊的勝率處于該條件分布的90分位數處。從 QR回歸結果中可以看出,對手實力(?=-0.219,P<0.01)、犯規(?=-0.004,P<0.05)、失誤(?=-0.137,P<0.05)、失誤率(?=-13.66,P<0.05)對于比賽勝率有顯著的負向影響,但是防守籃板(?=0.011,P<0.05)的增加會導致勝率的增加。
值得注意的是,當將WLS和QR回歸模型進行比較時發現,在WLS回歸中犯規這項指標與比賽勝率的關系并無統計學意義,但是在QR回歸中發現,對于低勝率(Q10)和(Q25)球隊來說,增加犯規將會導致勝率的增加,然而對于高勝率(Q90)球隊來說,增加犯規將會導致勝率的減少。
本研究結果證實了最初的假設,在本屆世界杯中,高勝率球隊與低勝率球隊在技戰術應用上存在著相似和異同點。對于低勝率球隊,助攻和犯規的增加可以提高比賽獲勝的概率;對于高勝率球隊,減少犯規和失誤會導致勝率的提高;對于所有的球隊,防守籃板是關鍵的制勝指標,增加防守籃板會增加獲勝的概率。值得注意的是,對手實力對于比賽的結果有重要影響,這更加考驗球員在比賽過程中的應變能力和教練員技戰術的使用策略。此外,通過對比WLS和QR回歸模型發現,QR回歸結果進一步補充說明了WLS多元回歸的結果,并對各項技戰術指標對不同勝率的球隊所造成的影響給出了更詳盡的解釋。因此,從本研究結果可以看出,分位數回歸模型在籃球比賽表現分析的研究中具備較好的模型穩定性與結果可解釋性,可以幫助教練員實現更加有效的比賽總結和對手分析,從而進一步優化訓練和比賽策略。
從研究結果發現,對手實力這一情境變量和球隊的勝率存在著明顯的負相關關系,相比較對陣弱隊,各參賽隊在對陣強隊時,勝率會明顯降低。這種現象從低勝率球隊貫穿到高勝率球隊,這與 Anthony等[17]對于奧運會和世界籃球錦標賽的研究結果是一致的。該研究認為奧運會和世界籃球錦標賽與各個國家職業籃球聯賽的最大區別在于,球隊整體實力之間的差距呈現兩極分化,歐洲和美洲球隊的整體實力明顯高于亞洲和非洲的球隊。因此在世界杯等國際大賽中,實力較強的對手給教練員和球員在心理、體能和技戰術上帶來不同程度的壓力,從而影響球隊比賽的結果,這種現象對于亞洲和非洲球隊的影響更加明顯。
在本研究中,防守籃板與比賽獲勝的概率呈現顯著的正相關。防守籃板已經被證明是高水平籃球賽事中的關鍵制勝因素[13,17-21],Sampaio等[21]研究表明,教練員在國際大賽備戰過程中,要發展或者選擇具備侵略性防守意識的上線球員;防守后衛應在上線給予對位的進攻后衛強大的壓力,迫使他們造成失誤和被迫投籃;前鋒和中鋒需加強卡位意識,確保籃板球的成功率。同時后衛與中鋒和前鋒的有效交流是確保防守籃板球成功率和迅速發動快攻的關鍵。因此在國際大賽的備戰過程中,教練員需要從數據背后的關鍵細節出發,提升球員能力和球隊表現。
雖然 WLS回歸顯示助攻的增加導致比賽勝率的提高,但是結合QR回歸發現,這種現象僅僅對低勝率(Q10和Q25)的球隊有顯著性意義。這個研究結果與Zhang等[12]的研究結果是一致的:助攻是球隊整體有效配合的一個重要測試指標,這項指標不僅體現了幫助隊友得分事件的頻數統計,同時也反映了最后成功投籃前無球和有球隊員之間固定戰術配合的完成程度。上述發現也被Karol等[22]研究證實,強隊與弱隊在世界大賽中最主要的區別就是籃球技戰術整體配合熟練程度的差異。強隊在邊線球、底線球、半場配合、攻防轉換、暫停后、比賽最后時刻所執行的戰術成功率要明顯高于低勝率和實力較弱的球隊,同時在執行上述戰術固定配合的數量和質量上也遠遠高于后者。此外,WLS回歸顯示,失誤和失誤率的減少將會導致比賽獲勝概率的提高,但是QR回歸給出了更詳盡的解釋,這兩項指標對中等勝率(Q50)和高勝率(Q75和 Q90)的球隊有顯著性意義。該發現也與 Anthony等[17]的研究結果一致:在世界杯比賽中,強隊在體能和技戰術上雖然占有優勢,但是,如果在比賽中某階段頻繁的失誤會給球員帶來心理層面的壓力,如果單節失誤過于頻繁,教練員應該及時選擇換人和輪轉新的陣容以確保既定戰術的有效實施和重振球員信心。
值得注意的是,在WLS回歸結果顯示個人犯規與比賽勝率不存在相關關系,但是QR回歸發現,對于本屆世界杯中低勝率(Q10)球隊來說,增加犯規會提高比賽的勝率,而對于高勝率(Q90)球隊來說,卻會導致其比賽勝率的降低。Miguel等[24]研究也證實了這一點:在國際大賽中,低勝率球隊的教練可以更多地使用犯規戰術,打破進攻球隊原有的技戰術配合和比賽節奏,讓進攻球隊通過罰球的方式完成進攻。但高勝率球隊則要減少犯規,以保證先發球員的進攻優勢可以延續到比賽的最后階段和關鍵時刻。本研究結果一方面給低勝率和高勝率球隊提出了不同的比賽策略,另一方面也論證了在籃球比賽數據分析中,分位數回歸相比傳統回歸模型的優越性和實際應用價值。
這項研究可能是第一個將分位數回歸模型應用在籃球比賽分析領域的,存在一些局限性。首先,研究的樣本僅使用了 2019年男籃世界杯各參賽球隊的比賽表現數據,推薦未來的研究擴充樣本量或者從縱向研究的角度去探索比賽結果與比賽表現指標之間的關系。其次,研究考察了情境變量對技戰術行為的獨立影響,推薦未來的研究可以考察情境變量對技戰術行為的交互影響。最后,雖然新的數學模型擴展了傳統線性回歸模型的結果,但是籃球運動的本質是非線性的,未來研究可以考慮使用馬爾可夫鏈和卷積神經網絡等機器學習的方法,探索在比賽動態時間變化中,各項技戰術指標對于最終比賽結果的影響,以此提供給教練團隊更加詳細的賽事總結報告。
通過WLS回歸和QR回歸模型對2019年男籃世界杯比賽數據的分析可以得出:對于所有球隊,防守籃板是關鍵的制勝指標。相比較對陣弱隊,各參賽隊在對陣強隊時,勝率會明顯降低,增加防守籃板可以顯著增加比賽獲勝的概率。對于低勝率球隊,助攻和犯規與比賽的最終勝率存在正相關性,增強球隊的有效進攻配合以及合理的使用犯規改變進攻球隊的比賽節奏和既定戰術可能是取得最終勝利的關鍵。對于高勝率球隊,犯規和失誤與比賽的勝率存在負相關性。因此,在進攻和防守中,減少不必要的犯規和傳運球等配合的失誤有利于最終比賽的勝利。