黃曉敏
(天津大學 天津 300072)
基于計量模型的NBA籃球成績影響因素分析
黃曉敏
(天津大學 天津 300072)
美國NBA籃球聯賽深受廣大群體喜愛,對籃球這項體育運動有著重要影響,因此對于NBA球員的數據分析很有意義。文中首先介紹了背景意義,問題提出和描述;其次對NBA30名球員的數據進行了Spss因子分析;最后,對模型與實際之間做出了貼合度解釋,分析了球員籃球成績的影響因素。
因子分析;計量模型;影響因素;籃球
美國職業男子籃球聯賽(NBA,全稱 National Basketball Association)是最受廣大群體喜愛的籃球聯賽之一,其日益精進的球員技能與球場戰術對籃球運動的進步起了巨大的推動作用,因此對于NBA球員的數據分析很有意義[1]。
因子分析是指從研究相關矩陣內部的依賴關系出發,根據相關性大小把原始變量分組,使組內的變量之間相關性較高,而不同組變量的相關性則較低,把一些具有錯綜復雜關系的變量歸結為少數幾個綜合因子的一種多變量統計分析方法[2]。在研究NBA球員數據時,由于指標較多增加了分析問題的復雜性和難度,因此用因子分析法找到合理的個數較少的指標去替代眾多的指標[3]。
文中將會對抽取的30名球員在他們2010-2011年的各項指標的得分統計進行因子分析,來看這些指標間的相關性并進行指標分類,所有分析都采用了spss18程序。
本次數據來源于“搜狐NBA數據中心(2010—2011年)”,其中對原始變量進行了標準化:Z出場次數、Z場均時間、Z得分、Z二分命中(個數)、Z二分出手次數、Z二分命中率、Z三分命中(個數)、Z三分出手次數、Z三分命中率、Z罰球命中(個數)、Z罰球出手次數、Z罰球命中率。接下來的運行分析都是用對標準化后的變量進行的。
從搜集的數據中進行現實的邏輯推理,可以看出原始變量之間是有著不同的相關性的。例如,三分命中、三分出手次數和三分命中率之間應該是高度相關的。
在此,假設一個因子分析模型:

其中S代表因子總得分;λi代表第i個因子方差的百分比,(λ1+λ2+…λn)代表提取的n個因子累積百分比;Fi代表提取的第i個因子。
在輸入自變量之前,經過分析,初步認為“Z得分”變量與其他變量不容易區分,也不好分類解釋,因此在輸入時將其提前剔除。
進行KMO和Bartlett的檢驗,KMO的度量值為0.625大于0.5;Sig.的值為0.00遠小于0.05,說明這些變量可作因子分析。
公因子方差分析中的各個變量的因子共同度都在0.7之上,說明這11個變量很好的被3個因子解釋。在解釋的總方差中,第一個因子的特征值為5.061,大約占去方差的46.006%,基于過程內定取特征值大于1的原則,提取了前3個因子,這3個因子的特征值共占去方差的83.615%,所以提取的因子是合理的,并且放棄的其他9個因子解釋的方差占不到20%,因此,能夠說明前3個因子提供了原始數據的足夠信息。在得出的碎石圖中,前3個因子的特征根都大于1,從第4個主成分開始特征根就比較低,可以認為前3個因子能概括絕大部分信息。
在做出初始因子負荷矩陣后,發現前3個因子在原始變量上的載荷值相差不太大,故不能很明確的解釋各個公因子,因此需要下一步的因子旋轉。在得出的旋轉后的因子負荷矩陣中,因子系數已經明顯的出現分化。其中成分1中絕對值大的主要有:Z三分命中、Z三分出手次數、Z三分命中率、Z二分命中率、Z罰球命中率;成分2中:Z場均時間、Z二分命中、Z二分出手次數、Z罰球命中、Z罰球出手次數;成分3中:Z出場次數。
對以上的分類進行解釋時,發現成分3和成分2是有現實意義的,但是,在成分1中,發現Z二分命中率是呈負相關,與實際意義有偏頗;而Z罰球命中率在成分2中會更好解釋。基于此,下面會剔除這兩個變量(Z二分命中率、Z罰球命中率)進行第二次的因子分析。
從旋轉后的因子散點圖中可以看出成分1、成分2和成分3與11個原始變量之間的關系。并且在成分得分協方差矩陣中,旋轉后的成分1、成分2和成分3之間的相關系數為0,說明各因子間是互補相關的,提取的3個因子是合理的。
基于第一次的運算和分析,尤其是對初始因子負荷矩陣和旋轉后的因子負荷矩陣的分析,在這次的修正中決定剔除變量“Z二分命中率”“Z罰球命中率”。

表1 KMO和Bartlett的檢驗Tab.1 KMO and Bartlett’s test
從表1中可以得知,KMO度量值為0.665大于0.5,球形檢驗的Sig.值為0.00遠小于0.05,檢驗P值十分接近于0,這就說明變量之間有很強的相關關系[4]。因此說明可以進行因子分析。

表2 公因子方差Tab.2 Common factor variance
從表2中可以看出這9個變量的因子共同度均在0.7以上,可以很好的被3個因子解釋。
表3顯示:根據內定取特征值大于1的原則,提取了前3個因子。第一個因子的特征值為4.511,大約占去方差的50.118%,前3個因子共占去方差的87.416%,比第一次高,所以提取的因子是合理的,放棄的其余6個因子解釋的方差不到20%,更加說明前3個因子提供了原始數據的足夠多的信息。

表3 解釋的總方差Tab.3 Total variance explained
從圖1中可知,前3個因子的特征根都大于1,從第4個成分開始特征根就比較低,且特征值小于1,因此前3個因子能概括絕大部分信息。
表4是初始因子負荷矩陣,可以看出這3個成分在變量上的載荷值都相差不大,因此需要進一步進行因子旋轉以便更好的解釋。

圖1 碎石圖Fig.1 Scree piot

表4 成分矩陣Tab.4 Component matrix

表5 旋轉成分矩陣Tab.5 Rotating component matrix
從表5中得出,屬于成分1的變量有:Z場均時間、Z二分命中(個數)、Z二分出手次數、Z罰球命中(個數)、Z罰球出手次數;屬于成分2的變量有:Z三分命中(個數)、Z三分出手次數、Z三分命中率;屬于成分3的變量有:Z出場次數。
可以看出,經過這次的修正而得出因子分類更加具有實際理論意義,并且解釋也會更符合實際。
圖2為因子散點圖,可以形象看出成分1、2、3與9個變量之間的關系,此圖中的各個變量能比較明顯的劃分出3類。

圖2 旋轉空間中的成分圖Fig.2 Rotating components in space
表6中可以看出旋轉后的成分1、成分2和成分3之間的相關系數為0,很明顯各個因子互不相關,說明提取的3個因子是合理的、科學的。
基于本次修正的運算和分析,可以看到本次的因子分析不論是在指標數值上,還是實際意義上都是較好的,接下來,便是對得出的結論進行實際意義的解釋。
根據表9解釋的總方差,將得出的數值代入在第一節中建立的模型:



表6 成分得分協防差矩陣Tab.6 Ingredients of the covariance matrix
可以得出最終結果是:

其中F1即為成分1,包含變量:Z場均時間、Z二分命中(個數)、Z二分出手次數、Z罰球命中(個數)、Z罰球出手次數;F2即為成分2,包含變量:Z三分命中(個數)、Z三分出手次數、Z三分命中率;F3即為成分3,包含變量:Z出場次數。
結合整個分析,對3個成分的實際意義解釋如下:成分1為內線能力,內線的水平是一個球員得分的關鍵,籃下進攻成為最有效的得分手段[5],因此它的系數0.491也是最大的;成分2為外線能力,外線能力在球場上是僅次于內線能力的得分因素,三分命中率是影響球隊成績的一項重要技術指標[6],因此,其系數0.369也是僅次于成分1的系數;成分3為出場機會,顯然,一個球員的內外線水平再高也得在能有上場的前提下才能展現。
因此,在得出了實際解釋之后,可以將其借鑒應用于籃球的比賽戰略上,在球場上最關鍵的是要捉住內線進攻,這是得分的核心所在,其次是外線的三分球得分,同時要合理分配優秀球員的出場時間和次數。
[1]方博.基于NBA球員的聚類分析和因子分析[J].科技視界,2013(11):80-82.
FANG Bo.Cluster analysis and factor analysis based on NBA player[J].Science & Technology View,2013(11):80-82.
[2]賈俊平.統計學[M].北京:中國人民大學出版社,2011.
[3]彭大松,左從現.因子分析的統計思想及在體育科研中的應用[J].四川體育科學,2007(3):18-20,23.
PENG Da-song,ZUO Cong-xian.The thought of factor analysis and the applying in sports[J].Sichuan Sports Science,2007(3):18-20,23.
[4]于浩飛.因子分析、多元回歸分析與訓練管理體系的建立[C]//中國體育科學學會運動訓練學分會,中國體育科學學會運動訓練學分會第六屆全國田徑運動發展研究成果交流會論文集,2013:1342-1353.
[5]江巍,孫慶祝,易洪剛.因子分析、聚類分析對第28屆奧運會男子籃球比賽的應用研究[J].中國體育科技,2007(3):94-97.
JIANG Wei,SUN Qing-zhu,YI Hong-gang.Factor and cluster analysis on the applied research of man.s basketball match in the 28th olympics games[J].China Sport Science and Technology,2007(3):94-97.
[6]劉毅.因子分析法對第16屆女子籃球世錦賽各球隊技術指標的分析[J].體育科技文獻通報,2012(3):40-41.
LIU Yi.Factor analysis on technical indexes of each Team in the 16th women's basketball championship[J].Bulletin of Sport Science& Technology,2012(3):40-41.
The analysis of inf l uencing factors of the NBA basketball scores based on the measurement model
HUANG Xiao-min
(Tianjin University,Tianjin 300072, China)
NBA basketball league is very popular with the general population, and has an important influence for the basketball sports , therefore ,it is very meaningful for analysing the data of NBA players.This paper firstly introduces the background,and proposes and describes the problem.Secondly,using Spss factor analysis for the 30 players’ data of NBA .Finally, giving a rational explaination between the model and the practice, and analyses the influence factors of basketball players’ scores.
factor analysis;measurement model;influence factor;basketball
TN802
A
1674-6236(2014)14-0031-03
2013-09-27 稿件編號:201309210
黃曉敏(1988—),女,山東淄博人,碩士研究生。研究方向:創意經濟,計量經濟等。