高長玉, 李 丹, 侯 文, 高清宇
(1.大連醫科大學 現代教育技術中心,遼寧 大連 116044; 2.遼寧師范大學 數學學院,遼寧 大連 116029;3.大連外國語大學 孔子學院工作處,遼寧 大連 116044)
?
基于Bradley-Terry模型的中國男子籃球職業聯賽球隊實力分析
高長玉1, 李 丹2, 侯 文2, 高清宇3
(1.大連醫科大學 現代教育技術中心,遼寧 大連 116044; 2.遼寧師范大學 數學學院,遼寧 大連 116029;3.大連外國語大學 孔子學院工作處,遼寧 大連 116044)
隨著體育事業及體育科學的發展,與體育相關的數據分析和統計工作也越來越得到重視.基于Bradley-Terry模型,對2015—2016賽季中國男子籃球職業聯賽數據進行分析,得到了20支參賽球隊的實力指數估計值和主場效應指數,基本反映了各支球隊真實的實力水平.此外,對籃球技術指標進行因素分析,得到籃板球、助攻和投籃命中率是影響球隊實力指數的主要技術指標,為今后預測體育賽事和提高球隊的技戰術水平提供依據.
成對比較數據;Bradley-Terry模型;實力指數
近幾年,隨著我國政府對體育事業發展的支持力度不斷加大,特別以中國男子籃球職業聯賽(以下簡稱CBA)為代表的職業體育賽事也得到了極大的發展,運動競技水平也在不斷提高,比賽精彩紛呈,吸引了廣大體育愛好者的關注.同時,與體育賽事相關的體育博彩業也得到了相應的發展.當2支球隊進行比賽,球隊的實力往往決定比賽的結果,當一個強隊同一個弱隊進行比賽時,我們理所當然會認為強隊贏或者得分率會高,機會只會在個別場次比賽中起或多或少的作用,這些都可以通過對比賽數據的統計分析來驗證.因此,對體育賽事結果進行數據分析是體育博彩業的基礎.
Bradley-Terry模型最早是由Bradley和Terry[1]在1952年提出的,是針對成對比較數據的模型.后來,Bradley[2-3]又詳細地討論了Bradley-Terry模型中的極大似然估計的漸近性、假設檢驗、置信空間等問題.由于Bradley-Terry模型在成對比較數據模型中具有良好的統計性質,因此,Bradley-Terry模型已應用到了生物醫學、經濟學、社會學等很多領域[4-7].而很多體育項目比賽結果數據屬于成對比較數據,Bradley-Terry模型也可應用其中.例如,Koehler和Ridpath[8]利用Bradley-Terry模型分析了1977—1978賽季美國男子籃球職業聯賽球隊的實力,并評估出每支球隊的主場優勢.Mchale和 Morton[9]利用Bradley-Terry模型對2000—2008賽季的國際男子職業網球巡回賽選手的排名進行了預測.Balreira、Miceli和Tegtmeyer[10]運用Bradley-Terry模型對2002—2013賽季的美國職業橄欖球比賽數據進行了擬合,給出了各支球隊獲勝的概率.我國在這方面研究的文獻很少.
本文采用Bradley-Terry模型擬合2015—2016賽季的CBA的賽事數據,估計各支參賽球隊的實力指數,以及球隊實力的影響因素分析.
1.1 Bradley-Terry模型
設有n個個體參與成對比較,記為“1,2,…,n”,假設個體r有真實的能力參數γr,令Pr,s表示個體r優于個體s的概率,Bradley-Terry模型將Pr,s表示為Logit模型形式
Pr,s=exp (γr-γs)/[1+exp (γr-γs)].
(1)

在體育比賽中,不失一般性,比賽結果有2種情況.設Yrs表示主隊ar與客隊as的比賽結果,Yrs=1,表示主隊ar獲勝,Yrs=0,表示客隊as獲勝.如果考慮比賽的主場因素,就需要在Bradley-Terry模型(1)中加入所有球隊主場效應參數η,模型表示為
P(Yrs=1)=exp (η+γr-γs)/[1+exp (η+γr-γs)].
(2)
1.2 模型的解釋變量
為了能夠解釋一些個體優于其他個體的原因,就需要找出可能影響個體能力差異的一些因素,然后建立回歸模型,這些因素就是個體能力的解釋變量.
以γr表示個體ar的能力參數,如果每一個個體的能力都與解釋變量xr1,xr2,…,xrm有關,β1,β2,…,βm是解釋變量的系數,Ur是獨立的誤差項,并且Ur~N(0,σ2).個體能力γr與各解釋變量的模型為
個體ar與個體as的能力值之間差異的模型為
(3)
將式(3)帶入式(1)就構成一個廣義線性混合模型,可以用懲罰擬似然方法對模型參數進行估計[11].
CBA聯賽開始于1995年,創辦之初有12支球隊參賽,發展到現在有20支球隊參賽.賽季比賽分常規賽和季后賽2個階段進行,每年聯賽最后2名降級,下級聯賽的前2名升入CBA聯賽.在常規賽中,所有參賽球隊進行雙循環比賽,即每支球隊要打38場比賽,分別在主場和客場各進行19場比賽,所有比賽的總場數為380場.比賽計分方式為勝1場得2分,負1場得1分,棄權得0分.常規賽按比賽勝場數/負場數比率確定常規賽總排名,勝場率高者名次列前.2015—2016賽季參賽的20支球隊按它們在常規賽的積分順序列于表1的第1列和第2列.
近幾個賽季,各支球隊為營造主場球市氛圍,球隊在主場實力都得到充分展示,主場勝率較高,所以用帶有主場效應的Bradley-Terry模型(2)擬合2015—2016賽季常規賽380場比賽結果數據.由模型識別條件,設定八一隊實力指數為0,其他各隊實力指數的估計值及其對應的標準誤分別列于表1的第3列和第4列.由于需要比較各支球隊實力間的差異,故要計算擬標準誤,其定義和計算方法見Firth和Menezes[12]的論著,主要用于分類數據中類別之間比較.各支球隊擬標準誤的值見第5列.根據實力參數的估計值及其標準誤計算得到的檢驗統計量Z值列于第6列,其對應的概率在第7列,根據各支球隊實力估計值排名見第8列.

表1 2015—2016賽季CBA聯賽球隊實力估計結果
注:數據來源于文獻[13]

球隊的實力往往決定比賽的結果,那么影響球隊實力的因素是什么呢?根據葉慶暉和鄧飛[14]以及張斌[15]對籃球技術特點的研究文獻, 選擇可能影響球隊實力的7項技術指標代入模型(3)中進行影響因素的分析,具體技術指標及其參數估計結果見表2.
廣義線性混合模型中包括固定效應和隨機效應2部分.在隨機效應檢驗中,剩余標準差為0.891 1(0.260 4),非常顯著,說明混合模型是成立的.固定效應分析結果見表2.在表2中,固定效應中顯著影響球隊實力的技術指標有投籃命中率、籃板球和助攻3項,其他技術指標對球隊實力沒有顯著性影響.

表2 影響因素估計結果
基于Bradley-Terry模型分析了中國職業體育比賽中具有影響的CBA聯賽賽事數據,探討了參賽球隊的實力指數及其影響因素,該方法也可以用于其他項目的賽事數據分析.
對CBA球隊實力影響較大的常規技術指標分別是總投籃命中率、籃板球和助攻,這為球隊有針對性訓練,提高球隊實力提供參考依據.不過本研究只局限于一個賽季數據,影響球隊實力的技術指標只是在本賽季是顯著的,在其他賽季這種影響是否顯著,是否還有其他技術指標對球隊實力也有影響還需進一步研究.同時,在不同國家聯賽球隊的技戰術水平和特點不同,影響球隊實力的技術指標也會有所差異.
一般運營成熟有影響的體育賽事賽季時間都比較長,各支球隊的實力會受傷病、疲勞、客場的地域環境等各種因素的影響,球隊實力會產生波動.如何能在基本Bradley-Terry模型中附加一些參數,能夠反映這些因素造成的球隊實力變化,是需要研究的課題.
[1] BRADLEY R A,TERRY M E.Rank analysis of incomplete block designs Ⅰ. The method of paired comparisons[J].Biometrika,1952,39(3):324.
[2] BRADLEY R A.Incomplete block rank analysis:on the appropriateness of the model for a method of paired comparisons[J].Biometrics,1954,10(3):375-390.
[3] BRADLEY R A.Rank analysis of incomplete block designs Ⅲ. Some large-sample results on estimation and power for a method of paired comparisons[J].Biometrika,1955,42(3):450-470.
[4] ATKINSON D R,WAMPOLD B E,LOWE S M,et al.Asian American preferences for counselor characteristics:application of the Bradley-Terry-Luce model to paired comparison data[J].Counseling Psychologist,1998,26(1):101-123.
[5] MCMANUS I C,RICHARDS P,WINDER B C.Do UK medical school applicants prefer interviewing to non-interviewing schools?[J].Advances in Health Sciences Education,1999,4(2):155-165.
[6] ZEITHAML V A.Service quality,profitability, and the economic worth of customers:what we know and what we need to learn[J].Journal of the Academy of Marketing Science,2000,28(1):67-85.
[7] SINSHEIMER J S, MCKENZIE C A,KEAVNEY B,et al.SNPs and snails and puppy dogs'tails:analysis of SNP haplotype data using the gamete competition model[J].Annals of Human Genetics,2001,65(5):483-490.
[8] KOEHLER K J, RIDPATH H.An application of a biased version of the Bradley-Terry-Luce model to professional basketball results[J].Journal of Mathematical Psychology,1982,25(3):187-205.
[9] MCHALE I, MORTON A.A Bradley-Terry type model for forecasting tennis match results[J].International Journal of Forecasting,2011,27(2):619-630.
[10] BALREIRA E C,MICELI B K,TEGTMEYER T.An oracle method to predict NFL games[J].Journal of Quantitative Analysis in Sports,2014,10(2):183-196.
[11] BRESLOW N E,CLAYTON D G.Approximate inference in generalized linear mixed models[J].Journal of the American Statistical Association,1993,88(421):9-25.
[12] FIRTH D,MENEZES R X.Quasi-variances[J].Biometrika,2004,91(1):65-80.
[13] 新浪竟技風暴.中國籃球數據庫[EB/OL].(2016-06-09)[2016-12-28].http://cba.sports.sina.com.cn/cba/schedule?qleagueid=171&qmonth=&qteamid=2016-06-09.
[14] 葉慶暉,鄧飛.男子籃球比賽常規技術統計指標與比賽名次相關關系的分析研究[J].中國體育科技,1999,35(12):28-29.
[15] 張斌.亞、歐洲男子籃球技術戰術特點研究[J].北京體育大學學報, 2010,33(7):137-141.
Analysis of ability about China Basketball Association team based on Bradley-Terry model
GAOChangyu1,LIDan2,HOUWen2,GAOQingyu3
(1.Modem Educational Technology Center, Dalian Medical University, Dalian 116044, China; 2.School of Mathematics, Liaoning Normal University, Dalian 116029, China; 3.Confucius College Office, Dalian University of Foreign Languages, Dalian 116044, China)
With the development of sports cause and sports science in China, data analysis and statistical works on sports have attracted more and more concerns. We analyze the data of the ability index about 20 teams and technical indicators factors affecting team’s ability index within the Bradley-Terry model about China Basketball Association in 2015—2016,and the results reflect the true ability level of each team. In addition, we find that for rebound of basketball, assisting and shooting average are the main technical indicators which affect team’s ability index which provide some evidence for predicting sports events and improving skills and tactics of sport teams.
paired comparison data;Bradley-Terry model;ability index
2017-01-20
高長玉(1963-),男,遼寧營口人,大連醫科大學教授研究員級高級工程師.
1000-1735(2017)02-0145-05
10.11679/lsxblk2017020145
O213
A