殷倩 陸媛



【摘要】本文根據12—13賽季英超聯賽中20支球隊的12項技術指標數據,運用因子分析法對英超聯賽的成績與技術指標的關系進行研究,找到影響比賽成績的4個因子并且進行命名,然后通過聚類分析,把不同的球隊根據他們的相似程度分為幾個類別,從而研究足球隊各方面能力的特點和規律,為我國足球隊和不同球隊的比賽進行針對性的訓練提供了更多科學依據.
【關鍵詞】足球;因子分析;聚類分析
足球運動是一項歷史悠久的體育運動,現代足球來自英國,也是現在世界上影響力最大的體育項目之一,因其豐富的內涵和感染力被視為一門藝術.
本文選取了2012—2013賽季的英超20支球隊的12項比賽指標作為參考數據,對它們進行因子分析,提取反映球隊攻防技術的主因子,并且計算綜合得分對球隊進行排名,然后再基于主因子進行聚類分析,將不同球隊分類,最終得出了不同足球隊各方面能力的差異.
一、研究對象及評價指標的選取
本文選取2012-2013賽季的英超20支球隊作為研究對象,收集了比賽中的進球數、失球數、傳球數、助攻數、射門數、被射門數、射正數、越位、解圍、攔截、黃牌、犯規等12項指標,數據見表1.
二、因子分析
(一)因子分析方法
因子分析是將原始變量綜合為少數幾個與原始變量有相關關系的因子,這些綜合出來的因子能夠反映出原始變量中的絕大部分信息.一般來說,因子的個數會遠遠少于原始變量的個數.因子分析的基本步驟是:(1)對數據進行相關性檢驗;(2)提取出主要因子,也稱為公因子;(3)對提取的公因子進行命名和解釋;(4)計算因子得分并進行綜合評價.
(二)因子分析過程
本文運用SPSS17.0軟件進行因子分析,具體結果如下:
1.數據的相關性分析:Bartlett檢驗的P值接近0,說明12個變量之間有較強的相關關系.KMO統計量為0.660,接近0.7,說明適合進行因子分析.
2.變量共同度量都在70%以上,說明提取出的公因子對原始變量的解釋能力較強.
3.本文采用Varimax法進行因子旋轉,總共提取4個特征值大于1的公因子,這4個公因子的累計方差貢獻率達到83.631%,說明因子分析的效果理想.
4.從旋轉后的因子載荷矩陣可以看出,第一個因子與進球數、助攻數、傳球數、射門數、射正數這幾個變量的載荷系數關系較大,從實際意義上看,這幾個變量主要反映了球隊的射門能力,因此,可以把因子1命名為“射門能力因子”;而第二個因子與攔截這個變量的載荷系數關系較大,從實際意義看,這個變量主要反映了攔截影響,因此,可以將因子2命名為“攔截影響因子”;第三個因子與犯規、失球、解圍、黃牌這幾個變量的載荷系數關系較大,主要反映了阻止對手得分的能力,所以可以把因子3命名為“防守能力因子”;第四個因子與被射門數、越位這兩個變量的載荷系數關系較大,可以將因子4命名為“越位影響因子”.
5.根據SPSS按回歸法估計的因子得分系數矩陣,可以將4個公因子表示為12個變量的線性組合,從而計算出4個公因子得分,有了公因子得分,就可以對每個足球隊分別按照前面命名的“射門能力因子”“攔截影響因子”“防守能力因子”和“越位影響因子”進行評價和排序.
6.最后對20支足球隊的能力進行綜合評價.具體方法是:計算每個足球隊的總因子得分,然后按照總得分的多少進行排序,以反映各支球隊水平的差異.每支球隊的總因子得分計算方法是:用每支公因子的方差貢獻率做權數,對每個公因子得分進行加權,然后加總得到每支球隊的總因子得分.計算公式為:
根據表2中的排名,射門能力因子得分最高的球隊是曼城,得分最低的球隊是雷丁,這說明曼城的射門能力最強,雷丁的射門能力最弱;攔截影響因子得分最高的球隊是阿森納,得分最低的球隊是斯托克城,這說明阿森納的攔截能力最強,斯托克城的攔截能力最弱;防守能力因子得分最高的球隊是托特納姆熱刺,得分最低的球隊是西布朗維奇,這說明托特納姆熱刺的防守能力最強,西布朗維奇的防守能力最弱;越位影響因子得分最高的球隊是利物浦,得分最低的球隊是桑德蘭,這說明利物浦的越位手法最好,桑德蘭的越位手法最差.
三、基于主因子得分的聚類分析
(一)聚類分析方法
聚類分析就是根據對象之間的“相似度”把對象分為不同的類.根據變量對所觀察的樣本進行分類的叫作Q型聚類,根據樣本對多個變量進行分類的則叫作R型聚類.
本文研究的是Q型聚類,聚類方法采用層次聚類法.層次聚類又稱為系統聚類,它事先不確定要將樣本分成多少類,而是先把每一個對象都作為一類,然后一層一層進行聚類.在對樣本進行分類時,度量樣本之間的相似性用點間距離.在層次聚類法中,當類別多于1個時,就涉及如何定義兩個類別之間的距離問題.本文點間距離使用最常用的平方歐氏距離,類間距離使用實際中較常用的離差平方和法.
(二)聚類分析過程
根據上面的因子分析找出的4個主因子作為新變量,對20支球隊進行層次聚類分析.從運行的結果來看,將20支球隊分成五類比較合適,得到的結果見表3.
根據SPSS軟件得到的不同類別球隊4個因子得分的方差分析表可以看出,檢驗的P值均接近0,表明不同類別球隊的4個因子得分之間都有顯著差異,說明把20支球隊分成五類是合理的.根據表4中各類別球隊的4個因子得分的均值情況,可以得出以下結論:
(1)將曼城、阿森納、切爾西三支球隊分為第一類,他們的射門能力因子的平均值遠遠大于其他類別的球隊,因此,這類球隊的射門能力很強,另外,攔截能力也不錯.
(2)將利物浦、埃弗頓、曼聯、西布朗維奇、諾維奇五支球隊分為第二類,這五支球隊的越位影響因子的平均值遠遠高于其他類別的球隊,射門能力也相對較強.
(3)將南安普頓、斯旺西、富勒姆、雷丁四支球隊分為第三類,這四支球隊的攔截影響因子的平均值遠遠高于其他類別的球隊,由此可見這些球隊的攔截能力很強,另外防守能力也不弱,但是射門能力卻很弱.
(4)將紐卡斯爾、托特納姆熱刺、西漢姆聯、阿斯頓維拉、女王公園巡游者五支球隊分為第四類,這五支球隊的防守能力因子的平均值遠遠高于其他類別的球隊,射門能力一般,越位影響因子相對較高.
(5)第五類中的斯托克城、維岡、桑德蘭三支球隊的射門能力因子、攔截影響因子、越位影響因子的平均值都遠遠小于另外四個類別的球隊,防守能力也僅僅是一般.
四、結論與建議
本文通過因子分析方法從12項指標中提取了4個主因子:射門能力因子、攔截影響因子、防守能力因子和越位影響因子,建立了英超足球隊指標體系,基本能夠直觀地反映出英超足球隊的水平,同時還確立了較為直觀、簡便、實用、科學的綜合評價方法,并將4個主因子作為新變量對20支球隊利用層次聚類方法進行了分類,在方法上是可靠、有效、可行的,對及時了解世界競技足球的進攻情況、檢查訓練效果、制訂訓練計劃、有效控制訓練過程和選拔優秀足球運動員提供了科學的依據.
【參考文獻】
[1]孫飛,谷貽林.2007年中超聯賽進球特征分析與研究[J].體育成人教育學刊,2008(4):59-61.
[2]賈俊平.統計學:第四版[M].北京:中國人民大學出版社,2011:254-288.
[3]牛錦山.2009年歐洲冠軍足球聯賽攻擊性防守技術研究[J].成都體育學院學報,2010(5):63-66.
[4]龔明波,鐘平.尺度空間層次聚類在足球球隊技、戰術能力分類中的應用研究[J].體育科學,2005(1):87-90.
[5]唐峻峭,彭偉,毋洪飛.論現代足球戰術及其特征[J].成都體育學院學報,2007(1):78-80.
[6]楊輝.主成份分析法聚類分析法在對足球比賽綜合評價中的應用[J].湛江師范學院學報,2004(6):52-56.