李毅偉 宋松



摘 ?要: 通過查閱文獻以及依據2018年足球世界杯數據庫,選取了反映球隊技戰術綜合能力的14項指標,對2018年俄羅斯世界杯足球賽決賽階段32強,64場比賽的技戰術指標進行統計,使用主成分分析法和Q型聚類分析法對該屆世界杯各隊的技戰術數據進行分析,進一步使用斯皮爾曼相關系數法和方差分析法對上述分析進行了檢驗。結果表明,使用主成分分析法和Q型聚類分析法對足球隊的技戰術指標進行量化,具有較高的有效性及可靠性,能夠客觀的反映球隊的技戰術能力,可以作為各隊實力的重要參考。
關鍵詞: 2018年世界杯; 足球; 主成分分析; Q型聚類分析; 方差分析
中圖分類號:O212.4 ? ? ? ? ?文獻標識碼:A ? ? 文章編號:1006-8228(2020)01-57-05
Abstract: According to the literature review and the 2018 FIFA World Cup database, 14 indexes reflecting the comprehensive technical and tactical ability of the team are selected. The technical and tactical indexes of the most powerful 32 teams 64 matches in the final stage of the 2018 FIFA World Cup are statistically analyzed, and the technical and tactical data of each team in the 2018 World Cup are analyzed by principal component analysis and Q type cluster analysis, and the results are further verified by the method of Spearmans correlation coefficient and variance analysis. The result shows that the use of principal component analysis and Q type cluster analysis to quantify the technical and tactical indicators of the football team has high effectiveness and reliability, can objectively reflect the technical and tactical capabilities of the team, can be an important reference for the strength of each team.
Key words: the 2018 FIFA World Cup; football; principle component analysis; Q type cluster analysis; variance analysis
0 引言
足球世界杯是世界上最高水平的足球比賽,代表著世界足球運動發展的趨勢和潮流。每4年舉辦一次,2018年俄羅斯世界杯足球賽共有206個國家和地區的足球隊參賽,而獲得2018年俄羅斯世界杯決賽階段資格的僅有從預選賽中出現的31支球隊和東道主俄羅斯國家隊。決賽階段共32支球隊進行64場比賽,經過激烈的競爭,2018年7月16日,法國隊在決賽中4∶2擊敗了克羅地亞隊,獲得大力神杯。亞洲球隊表現依舊不容樂觀,只有日本隊小組出線。在此屆世界杯上,國際足聯專業分析團隊根據每一場比賽反映的技戰術指標做了科學的分析,其中涉及影響比賽的重要技術指標有進球、助攻、射門/射正、撲救、搶斷、控球率等14項指標。本文在此基礎上對這14項影響比賽的重要技術指標與比賽結果進行相關性分析,探索這些指標與比賽結果之間存在的關聯。揭示世界足球的技戰術發展趨勢,并探索出一種較為合理有效的量化評價球隊技戰術能力的方法,為亞洲球隊的發展提供參考,也為我國的足球發展方向提供依據。
1 研究對象
1.1 研究對象
以參加第21屆世界杯足球賽的32支球隊,共計64場比賽為研究對象。從網易世界杯數據中心網站[1]獲取2018年世界杯比賽相關數據,對進球、助攻、射正/射門、撲球、犯規、被侵犯、越位、角球、黃牌、紅牌、傳球、攔截、搶斷以及控球率等14項主要技術指標與球隊比賽的勝負結果進行相關性分析,分析各項技術指標對比賽勝負走勢的影響。研究影響比賽勝負的主要因素。
1.2 研究方法
文獻資料法:通過檢索和查閱有關2018年俄羅斯世界杯以及足球各種技戰術等相關文獻資料[2-7]。
數理統計法:1觀察和整理巴西世界杯參賽球隊的數據統計,采用EXCEL軟件對各項技術指標進行統計處理。2采用SPSS統計軟件對32支球隊的14項指標進行主成分分析和Q型聚類分析、等級相關分析以及方差分析[8-9]。
2 統計方法
2.1 主成分分析
由于原始數據較多,且存在一定的相關性,在使用高度相關的指標難以實現合理的聚類。因此,需要引入一組新的互不相關的,但又盡可能完整保留原始數據信息的新變量,同時達到降維的目的,使復雜問題簡單化[5],主成分分析很好的實現了這一目的。
主成分分析利用降維的思想,在力保數據信息損失最少的原則下,用幾個綜合性的指標替換掉原來的數據,使其盡可能的反應原來的變量信息。將轉化生成的綜合指標稱為“主成分”。主成分是原始變量的線性組合,且主成分之間相互獨立,這樣只需用少數幾個主成分研究復雜問題既不丟掉原始數據的主要信息,又容易抓住主要矛盾,避開變量之間共線性問題,便于進一步分析,提高效率[5,9]。
2.2 Q型聚類分析
原始數據經過主成分分析后得到彼此互不相關的主成分。在此基礎上,對這些新的主成分變量進行Q型聚類分析。Q型聚類分析是根據被觀測的樣品的各種特征,將特征相似的樣品歸為一類的方法。將不同樣本歸為一類的標準是樣本之間的距離。本文選用離差平方和法(Ward方法)來刻畫樣本之間距離。該方法適合處理小樣本數據,對異常值敏感,比較符合實際需要[8-9]。
3 數據處理與結果
3.1 主成分分析
首先對14個技戰術指標形成的統計數據進行主成分分析,求出指標的特征值和貢獻率,如表1所示,結果表明,特征值不小于1的因素一共有5個,前5個主成分的累計貢獻率超過74%,認為前5個主成分提供了足夠多的信息,因此選擇前5個主成分作為聚類分析的指標數據。
3.2 Q型聚類分析
使用主成分分析法得到的互不相關的5項能綜合反映本次世界杯技戰術主成分的指標后,使用Q型聚類對其進行分析[2-7]。這里采用離差平方和法(Ward法)進行聚類。聚類結果如圖1所示。
4 結果與分析
4.1 結果
從圖1可知,聚在第一類的有11支球隊,占參賽隊伍的34.38%。排名分別是1、2、5、6、聚在第四類的有9支球隊,占總數的28.12%。排名分別是4支16強,5支32強。以上結果表明,聚類結果與參賽隊伍的排名基本一致,傳球成功率高,射門效率高,反擊次數較多,以及搶斷能力強,犯規次數少的球隊比賽成績相對較好。
與聚類分析等級一樣,將研究的32支球隊按照成績等級分成四個等級,1至8名為第一等級;9至16位第二等級;17至24位第三等級,25至32為第四等級[6]。計算結果為[rs=0.989186]。表明聚類結果與比賽成績之間具有很強的相關性,聚類結果比較客觀真實的反應了比賽的結果。證明所采用的方法所得的指標是能夠有效反應球隊的進攻和防守的整體技戰術能力,因此,研究具有理論和實踐方面的雙重意義。
4.2 分析
4.2.1 總體分析
從統計結果來看,聚在第一類的球隊共進球82個,平均每隊每場進球1.53個,失球69個,平均每隊每場失球1.46個。進失球比率為1.05:1。聚在第二類的球隊共進球48個,平均每隊每場進球2.45,失球35個,平均每隊每場失球2.02,進失球比率為1.21:1。聚在第三類的球隊共進球36個,平均每隊每場進球1.02,失球43個,平均每隊每場失球1.46個,進失球比率為1:1.43。聚在第四類的球隊共進球29個,平均每隊每場進球0.9,失球個48,平均每隊每場失球1.57,進失球比率為1:1.74[6]。
前兩類都有較高的平均進球率。且進球率均高于失球率。由此可知攻守平衡是取得好成績的關鍵。雖然平均進球第一類低于第二類,但是平均失球率也低于第二類。且聚集在第一類的球隊有較高的射門轉化率,能將有限次的射門轉化為進球。且相較于第二類,第一類犯規次數少,紅牌少,平均每場傳球在四類中居首位,搶斷積極,控球率也高,正是這些原因使得第一類的球隊最后取得了相對較好的成績。
聚在第三類和第四類的球隊,明顯的進球少,失球多。這兩類球隊的攻守技戰術能力較弱,進攻能力差,且防守能力也不高。具體表現為控球率低,搶斷不積極,助攻少,角球機會少,黃牌、紅牌較前兩類多。從側面印證了攻守平衡是球隊取得好成績的根本所在。
4.2.2 技戰術水平的方差分析
如表3所示,在2018年世界杯決賽圈各支球隊的技戰術指標之間,進球平均、助攻平均、撲救平均、被侵犯平均、越位平均、角球平均等6項指標存在顯著性差異和非常顯著的差異,說明各隊之間能否取得好成績的主要差異反映在這6項指標上。進球越多球隊取勝的可能性就越大,強隊隊機會的把握更勝一籌。平均助攻次數越多表明球隊的技戰術豐富,隊員之間的配合也更加嫻熟。而撲救和被侵犯等防守型指標之間的差異和越位,角球等進攻性指標之間的差異再次表明一支球隊想要取得好的成績,必須在攻防兩端都有較好的表現[5-6]。
5 結束語
本文對2018年俄羅斯世界杯決賽圈64場比賽數據進行了多元統計分析,首先采用主成分分析法,將14項比賽因素降維成了5個相互獨立的主成分。
對得到的5個主成分進行聚類分析,將32支球隊分成四類,第一類和第二類的球隊平均進球率均高于平均失球率。而第三類和第四類,平均進球率則低于平均失球率。聚類結果表明具有較高進球率是一支球隊立足的根本。而要想取得好成績則需要攻守平衡,不能存在明顯的短板。借用斯皮爾曼相關系數對聚類前后的結果進行了驗證,表明聚類結果也與實際情況較為相符。
最后的方差分析的表明,強隊與弱隊的差距主要集中在進球平均、助攻平均、撲救平均、被侵犯平均、越位平均、角球平均等六項指標。提高進攻效率,大膽運用技術以及加強防守的穩定性是取得好成績的關鍵。這表明運用多元統計分析的相關理論方法,研究世界杯數據庫的各支球隊的數據,能夠較為客觀的反應出比賽中各隊的實際水平,并為球隊的發展提供一些有價值的建議[5]。
雖然借助主成分分析和Q型聚類分析可以為球隊提供一些有價值的參考數據,但是本文研究仍然存在一定的局限性以及待改進之處,這將是需要我們進一步做的工作。
參考文獻(References):
[1] 網易.2018俄羅斯世界杯數據庫. http://2018.163.com/
[2] 李峰,張冰,劉璐.基于主成分估計的2014年巴西世界杯足球賽各項技術指標與比賽結果的相關性分析[J]. 西南師范大學學報(自然科學版),2015.40(10):134-139
[3] 侯會生,臧鶴鵬,李鳳橋.對第18屆世界杯足球賽各隊進攻能力的綜合評價[J].北京體育大學學報,2008.31(1):138-207
[4] 張冉,張雪臨.第16屆世界杯足球賽進攻指標的Q型聚類分析[J].中國體育科技,1999.35(11):16-18
[5] 劉天彪,柯洪捷,曹雪薇.基于主成分分析和Q型聚類分析的2011賽季中超足球超級聯賽各隊的技戰術綜合分析[J].河北科技師范學院學報,2016.30(1):35-42
[6] 侯會生.第18屆世界杯足球賽各隊技戰術能力的綜合評價[J].西安體育學院學報,2007,24(6):77-81
[7] 李猛.第13屆亞洲足球俱樂部聯賽各球隊進攻能力的綜合評價[J].遼寧體育科技,2016.38(2):96-99
[8] 王學民.應用多元統計分析[M].第五版.上海:上海財經大學出版社,2017.
[9] 汪冬華,馬艷梅.多元統計分析與SPSS應用[M].第二版.上海:華東理工大學出版社,2018.