張 瀅,余思龍
(華中師范大學 體育學院,湖北 武漢430079)
隨著信息時代的發展,數據作為基礎性資源,其分析和應用為各領域的發展提供了強有力的支撐,推動了人類社會運轉方式、載體和效率的變革。“大數據”自2012年被引入我國以來,熱度持續升溫。在2018年底召開的中央經濟工作會議上,國務院將“大數據”定位為“新型基礎建設”,將其視為重要的基礎性戰略資源[1]。2020年3月4日,中共中央政治局常委會會議明確表明,將“新基建”作為投資發力的主要抓手并且逐年增加比重[2]。由此可見,加快數字基礎建設,推動數據資源整合與共享對于促進我國經濟建設發展和優化治理體系有著不可或缺的作用。
2019年籃球世界杯在中國舉行,這是世界上競技水平最高、觀賞性最強的籃球賽事之一,匯聚了世界各國的頂級籃球強隊。但作為東道主,中國隊卻在家門口與進軍奧運會失之交臂,這給處于改革周期內的中國籃球沉重一擊。如何充分利用和分析本次世界杯的各項統計數據,厘清世界各強隊的制勝因素和技戰術特點無疑能為中國男籃提供技術層面的幫助。
數據分析與體育的深度融合對于測定運動員或運動隊的優劣并有針對性地制定和優化相應訓練計劃有著不可或缺的作用。本文運用回歸分析的方法來探討球隊的得分的影響因素,將“球隊得分”視為因變量,將14 項技術統計指標視為自變量,構建多元回歸模型,以期得出各技術統計指標對球隊得分的影響程度和作用方式。
1.1.1 文獻資料法
以 “2019 籃球世界杯”“籃球世錦賽”“技術統計”“回歸分析”等為關鍵詞在中外文數據庫進行檢索查找相關文獻資料。同時在FIBA 官網下載籃球技術統計手冊,在圖書館查閱了有關回歸分析方法的書籍。對搜集的論著、文獻進行仔細閱讀和分析,為本研究奠定了一定的理論基礎。
1.1.2 錄像觀察法
通過騰訊體育獲得92 場2019 籃球世界杯比賽的錄像資料。針對本文所涉及的各項技術統計指標進行抽樣統計,仔細觀看錄像,并結合FIBA 的官方技術統計標準,對所需統計數據進行校準,并且對統計數據進行多次重復統計來減少誤差,以確保統計數據的準確有效。
1.1.3 數理統計法
根據技術統計采集與論文需要,本研究采用數理統計法對2019 籃球世界杯球隊比賽的球隊得分與技術統計數據進行統計,技術統計標準以FIBA2018 版技術統計工作標準為依據。根據研究問題,運用EXCEL 和SPSS25.0 進行數據統計處理,為本研究提供論證依據。
實際比賽中,影響球隊得分的因素有多種,通過對影響球隊得分的因素進行研究,為球隊得分影響因素模型的建立和分析起到重要作用。本文綜合分析和總結當前國內外研究成果,以2019 籃球世界杯獲勝球隊的視角,以國際籃聯2019 籃球世界杯比賽官方技術統計標準化面板數據為基礎將球隊得分的影響因素劃分為進攻因素、防守因素兩個方面,并結合比賽技術統計數據特點進行數據的整理和校正,最終確定了以球隊得分作為因變量,以14 項技術統計指標作為自變量來研究其對球隊得分的影響機制?;谏鲜龇治觯瑯嫿ㄇ蜿牭梅钟绊懸蛩啬P涂蚣?,如圖1。
利用SPSS25.0,運用線性回歸分析,選擇球隊得分為因變量,兩分出手數、兩分命中率等14個技術統計指標作為自變量以“進入”的方法進行多元線性回歸分析,讓所有變量都進入回歸模型中。

圖1 球隊得分影響因素模型
2.1.1 回歸方程擬合優度評價

表1 多元線性回歸模型的估計結果
根據表1 的估計結果,回歸模型的相關系數為0.940,判定系數為0.884,表明此回歸模型可以解釋約88.4%的球隊得分變化;調整的判定系數為0.863,與0.884 接近;當自變量數量與研究樣本量的比值小于1/5 時,判定系數大概率會高估擬合度,鑒于本研究的自變量數目與樣本容量的比值小于1/5,因此傾向于用調節后的判定系數來評價模型的擬合度,即約有86.3%的球隊得分變化可以用該模型解釋??傮w來看,此線性回歸模型擬合效果較好。
2.1.2 顯著性檢驗
1)回歸方程的顯著性檢驗
在回歸方程的顯著性檢驗中,F統計量為41.889,相應的顯著性檢驗值等于0。當P值小于任意顯著性水平 (如0.1、0.05、0.01)時,則認為回歸方程通過了總檢驗[3],回歸系數同時為零的假設不成立,表明因變量球隊得分與自變量之間存在線性關系,自變量在預測球隊得分的多元回歸模型過程中數據擬合程度高,可以建立線性回歸方程。
2)回歸系數的顯著性檢驗
根據表2 的輸出內容可得到未經標準化的樣本回歸方程為:
Y=87.435+4.917X1+4.779X2+5.842X3+5.027X4+4.309X5+1.076X6-0.664X7+0.90X8+2.883X9-0.743X10+0.354X11+1.111X12+0.618X13+0.202X14。
公式中,X1 為A2 即兩分出手數,X2 為P2 即兩分命中率,X3 為A3 即 三 分 出 手 數,X4 為P3 即 三 分 命 中 率,X5 為FTA 即罰球出手數,X6 為FTP 即罰球命中率,X7 為OR 即進攻籃板,X8 為DR 即防守籃板,X9 為AS 即助攻,X10 為TO即失誤,X11 為ST 即搶斷,X12 為BS 封蓋,X13 為FO 即犯規,X14 為FD 即被犯規;通過觀察回歸方程的各項系數可知,兩分出手數、兩分命中率、三分出手數、三分命中率、罰球出手數、罰球命中率、助攻、封蓋的回歸系數分別通過了t 檢驗,它們的t統計量分別為6.533、7.266、7.216、8.210、3.735、2.168、2.242,相對應的P值依次為0.000、0.000、0.000、0.000、0.000、0.033、0.028,均小于顯著性水平0.05,因此推翻其回歸系數為零的原假設。而進攻籃板、防守籃板、失誤、搶斷、犯規、被犯規的t統 計 量 分 別 為-1.022、0.148、-1.294、0.668、1.152、0.183,相應的P值為0.310、0.883、0.200、0.506、0.253、0.855,大于最大的顯著性水平0.1,以0.05 的顯著性水平作為衡量標準,自變量進攻籃板、防守籃板、失誤、搶斷、犯規、被犯規可以認為無法拒絕其回歸系數等于零的假設。
綜合以上分析,通過觀察回歸系數顯著性中的概率P值,存在顯著性P值大于0.1 的情況,可以考慮除去這些不顯著變量對模型進行優化,已獲得更高擬合度的回歸方程。

表2 回歸系數a 表
2.1.3 回歸模型檢驗
圖2 的球隊得分的標準化殘差直方圖顯示,球隊得分的標準殘差分布狀況近似服從正態分布,在標準化殘差的正態P-P 圖(圖3)中,因變量的散點位置基本分布位于直線附近,近似一條直線,表明殘差近乎是正態的,進而證明誤差也近乎是正態的。

圖2 標準化殘差直方圖

圖3 標準化殘差的P-P 圖
為了進一步驗證殘差項的正態性,通過K-S 檢驗以及計算殘差統計量的方式來驗證殘差項的正態性。運用K-S 檢驗提出一對假設:原假設H0:樣本殘差服從正態分布;備用假設H1:樣本殘差不服從正態分布。

表3 殘差項的單樣本K-S 檢驗結果
由表3 中可以看出,樣本殘差項的均值為0,標準差為0.91986621,對應的P值等于0.08,大于顯著性水平0.05,因此必須接受原假設,認為殘差項服從正態分布。
在上文的研究中,經過多重檢驗,驗證了對于球隊得分的多元回歸模型是合適的。但回歸系數顯著性概率P 值存在大于給定的最大顯著性0.1 的情況,因此考慮除去這些不顯著變量,進一步優化回歸模型,本研究嘗試利用逐步回歸法對變量進行篩選。
回歸方程在進行變量篩選過程中,第一個模型由于助攻與球隊得分的相關性較強,率先進入回歸模型,助攻的t 統計量的觀測值為10.210,對應的P值小于給定的顯著性水平為0.05[4],因此,否定回歸系數檢驗的原假設,助攻與球隊得分之間存在顯著的線性關系。接著,自變量三分球命中率繼續加入到之前到一元回歸模型之中,t統計量為3.616,P值為0,在結合模型中已有的助攻的基礎上,三分命中率與球隊得分偏相關系數為0.358,存在顯著的線性關系。
由此,逐步加入自變量罰球出手、三分出手、兩分出手、兩分命中率、封蓋、罰球命中率到回歸模型中,結果顯示,t統計量相對應的P值均小于給定的顯著性水平0.05,因此拒絕原假設,回歸系數通過了顯著性檢驗。在去除了進攻籃板、防守籃板、失誤、搶斷、犯規、被犯規6個變量之后,球隊得分影響因素模型的自變量篩選過程完成。
根據標準化系數得出標準化的樣本回歸方程為:
Y=0.232X1+0.434X2+0.397X3+0.499X4+0.435X5+0.424X6+0.092X7+0.091X8。公式中,助攻、三分命中率、罰球出手數、三分出手數、兩分出手數、兩分命中率、封蓋、罰球命中率的標準化回歸系數分別為0.232、0.434、0.397、0.499、0.435、0.424、0.092、0.091,Beat 系數的大小可用來比較自變量對因變量的重要性大小。因此,球隊得分影響因素的重要程度由高到低依次為:A3>A2>P3>P2>FTA>AS>BS>FTP(OR、DR、TO、ST、FO、FD 等變量的重要程度排在FTP 之后)。
通過分析,回歸系數為正的進攻因素大多出現在了回歸方程中,這也與實際預期相符。更重要的是,我們得出對球隊得分影響顯著的因素并做出重要性的排序即三分球出手數>兩分球出手數>三分球命中率>兩分球命中率>罰球出手>助攻>封蓋>罰球命中率。從研究結果我們可以得出以下信息:
1)三分球、兩分球出手數對于球隊得分的影響要大于三分球、兩分球的命中率。在比賽時間固定的背景下,相較于投籃命中率,越多的投籃出手,將會為球隊帶來更多的得分。但如果根據研究結果對這些因素做出絕對的強調與忽略,這種無視教練球員主觀能動性以及比賽實際情況的做法將使比賽朝著不利的方向發展。因此我們可以理解為實際比賽中,在確保投籃選擇合理的條件下,適當增加投籃出手的次數可帶來更多的球隊得分,同時這也折射出當今世界籃球進攻節奏的加快。
2)三分球重要性突顯。在三分球與兩分球出手數、命中率的對比中,三分球都是更具優勢的一方。對球員的投射能力有了更高的要求,三分球與兩分球進攻區域的不同也反映出當今世界籃球潮流下,擴大進攻區域的覆蓋范圍提升遠距離投籃把握能力對球隊得分的影響重大。
3)助攻對球隊得分影響顯著。助攻數的增加說明在比賽過程中,球員在進攻回合積極地傳導球,分享進攻球權,使球到達合理的進攻區域與進攻球員的手中。與個人能力較強的球員持球單打相比,通過助攻得分的方式更為簡單有效,也充分體現球員之間的相互信任與團結協作。
4)罰球與罰球命中率與球隊得分成正相關,即一支球隊的罰球出手次數越多、罰球名命中率越高,一支球隊的得分也會越高。相較于罰球命中率,罰球出手次數對于球隊得分的影響更大,這與各支球隊罰球命中率差異較小有一定關系。對于罰球出手來講,由進攻球員的沖擊力、防守球員的防守能力以及裁判員水平所共同決定。從進攻球隊的角度來看,如何提升球隊進攻的侵略性以及利用對方防守的漏洞來獲得更多的罰球對與球隊得分乃至最終獲得勝利是有所幫助的。
5) 在2019 籃球世界杯中,通過對勝利球隊得分進行研究,發現封蓋對球隊得分影響顯著,封蓋作為唯一進入模型的防守因素,佐證了進攻與防守相互聯系的觀點,與其他防守因素類似,封蓋能最大限度地阻止對方得分并取得本方進攻的機會,與球隊得分成正相關,即越多的封蓋會為球隊帶來更多的得分。
通過對2019 籃球世界杯以球隊得分為因變量進行回歸分析,得出以下結論:
1)三分球出手數、三分球命中率、兩分球出手數、兩分球命中率、罰球出手、罰球命中率、助攻、封蓋與球隊得分之間線性關系顯著。對球隊得分影響的重要性排序為: 三分球出手數>兩分球出手數>三分球命中率>兩分球命中率>罰球出手>助攻>封蓋>罰球命中率。
2)在球隊得分回歸模型優化過程中,6個自變量沒有通過回歸系數顯著性檢驗,對于因變量的影響不顯著,即進攻籃板、防守籃板、失誤、搶斷、犯規、被犯規對球隊得分的影響不顯著。
3)在當今國際籃球的競爭格局下,對于球隊得分來講,三分球比兩分球擁有更重要的戰術地位。三分球出手數與三分球命中率對于球得分的影響分別高于兩分球出手數與兩分命中率。
4)封蓋作為防守端的技術統計指標仍對球隊得分的影響顯著,并與球隊得分成正相關。