劉龍祥
(東平明湖中學 山東 泰安 271000)
奧林匹克運動會,簡稱奧運會,它是競技體育頂級盛會,引得全世界最頂尖的運動員紛紛角逐。其所獲獎牌數及國家排名不僅是一個國家體育運動競技水平的反映,也是國家經濟、政治和綜合實力的體現。面臨即將到來的第三十二屆東京奧運會,獎牌榜前十名是大家普遍關注的話題。
對于奧運會獎牌榜預測方面的研究,國內外已有一些學者對此進行了嘗試。較早關于這方面的研究是以社會學和經濟學角度展開的,有Ball[1]、Gimes A R等人。然而直到30年后這方面的理論研究才重新為人所關注,Shyghart[2]首度重新利用過渡形經濟方法預測分析了世界各國在奧運會上取得的成績,近來Bernard等[3]得出人口數顯著影響一個國家的奧運成績;雷桂成[4]初步提出奧運會獎牌與綜合國力的密切聯系;李力研[5]分析人種特征對運動成績優劣的影響。
然而在過去的這些研究中,學者們普遍只采用了時間序列預測或者多元線性回歸之一的方法,進行了單一維度的考量,卻沒有綜合地應用多個模型進行探究。故此本文綜合地應用時間序列模型和多元非線性回歸模型,系統地對該問題展開研究。
首先討論歷屆奧運會成績和本次成績的關系,是研究金牌數y自身的發展規律,可以通過多種現有模型或自建模型來進行預測。一般可以做時間序列分析。時間序列分析的理論基礎為:設若時間序列(或隨機過程)的任一元素與其前期元素(等)之間存在著某種關聯,則我們可以根據該時間序列的既往觀測值來預測其未來的取值。本文中應用的模型如下描述:
(1)自回歸模型(AR):p階的自回歸模型簡記為AP(p),指的是如下形式的隨機過程:
其中為待求的參數,p是滯后期限的數據,而為白噪聲,也就是滿足經典計量經濟模型要求的隨機誤差項。在本文的研究中,首先使用二階的自回歸模型建模,進行初步的預測分析。
(2)自回歸移動平均模型(ARMA):該模型是將自回歸過程AR與移動平均過程MA結合起來,在數學上,我們總可以把一個高階的AR過程分解為某個低階AR和另一個高階AR過程之和,而這個分解出來的高階AR又可以用一個較低階的MA過程來替代,所以原本的隨機過程可以轉化為低階AR過程和低階MA過程之和。一般來說,ARMA(p,q)帶有兩個參數,其中AR(p)為p階自回歸模型,MA(q)為q階移動平均模型。在本文的研究中,使用ARMA(1,1)作為優化的時間序列模型,做進一步求解。
本文采用的世界各國在歷屆奧運會獲得獎牌數據來源于中國奧委會官方網站上公布的成績。依照國際奧林匹克委員會的官方排名榜排列,首先衡量金牌枚數的多少,銀牌次之,最后對比銅牌枚數。因此筆者在這里只研究對各國家奧運會金牌數的預測。
本文中筆者將采用自回歸滑動平均模型進行預測,為了模型的精確度,1988,1992年的奧運會成績不作為預測樣本數據。最終,選取1996年—2008年作為訓練集(即第一組數據為1996—1992—1988),2012和2016年作為預測集。在國家選擇上,選取2016里約奧運會金牌榜前三十八名的國家作為研究對象。(第28~38名并列獲取兩枚金牌)
假設某國家某屆奧運會成績主要與此國家在前兩屆奧運會中的成績有關。雖然此論文只研究對金牌數的預測,但很明顯,往屆的銀牌數,銅牌數也與本屆的金牌數會有關聯性。例如,某運動員在此屆奧運會中獲得銀牌,那么他是有沖擊金牌的潛力的,一個國家本屆奧運會獲得銀牌甚至銅牌的人越多,此國運動員中下屆可能獲得金牌的人就越多。因此,選取前兩屆的金牌數,銀牌數,銅牌數作為特征。同時由于歷屆奧運會設置的項目數不同,每屆奧運會的金、銀、銅牌數也不相同。因此,將獎牌數全部換算為所占百分比。
通過AR(2)模型的求解和驗證,發現第t屆的金牌比例,主要受上一屆金銀銅牌比例及上上屆金牌比例的影響。在此基礎上,建立更加完善的ARMA(1,1)模型,并利用MATLAB進行求解。以2012年和2016年的奧運會金牌數量作為測試集,可以得到如下結果:
(1)2012年的預測結果序列與真實金牌序列的相關系數為0.96422,均方誤差為10.89382;
(2)2016年的預測結果序列與真實金牌序列的相關系數為0.98327,均方誤差為6.38375。
根據以往的學者研究發現,國家綜合實力明顯影響奧運會成績。一般來說,國家綜合實力強的國家普遍比綜合實力弱的國家在奧運會上取得的成績更好。這里,筆者嘗試用多元非線性回歸來探究它們之間的定量關系。假設國家綜合實力可以由以下幾個方面反映
4.1.1 經濟水平 國內生產總值(GDP=Gross Domestic Product)是指一個國家(國界范圍內)所有常駐單位在一定時期內生產的所有最終產品和勞務的市場價值。GDP是國民經濟核算的核心指標,也是衡量一個國家或地區總體經濟狀況重要指標。
4.1.2 工業發展水平 衡量一個國家基礎工業發展水平的重要標志是鋼鐵工業,因此選用年鋼產量來衡量。通常用來衡量一個國家的石油化學工業發展水平的標志是乙烯的產量,因此選用年乙烯的產量來衡量。
4.1.3 科技水平 以各國每年發表的科技期刊文章數量作為一個國家科技發展水平的衡量標準。
4.1.4 國土 國土越廣闊,一般來說,蘊含的各種自然資源就越豐富。國土面積的大小是區分大國小國的主要尺度。可以說國土是一個國家強弱的天然條件。
4.1.5 人口 一個國家的人口越多,它的勞動力越多。人口數量的多少必定會影響國家的實力。人口越多,潛在的優秀運動員數量越多,從而影響金牌的數量。
4.1.6 基礎設施 隨著時代的發展,互聯網(包括電腦,手機等上網工具)已經成為一些發展水平較高的國家國民的生活必備。選取每一百人中互聯網用戶數量來衡量一個國家基礎設施的完備水平。
4.2.1 醫療水平 好的醫療水平可有效降低運動員傷病對其造成的不可逆的影響,以及指導運動員以科學合理的方式進行訓練。以嬰兒死亡率來衡量醫療水平。
4.2.2 東道主效應與次場效應 東道主國家對飲食、氣候、場地、環境都非常適應,且東道主國家在觀眾支持程度上有明顯優勢。
4.2.3 國家體制 社會主義國家與資本主義國家的政府號召力、對國家資源的整合能力不同,以至于對奧運成績有所影響。用虛擬變量Socialism表示,當國家為社會主義國家,Socialism=1,否則Socialism=0。
4.2.4 人種與文化傳統 不同的人種體能不同,在不同的運動項目上各有優勢。而不同的文化傳統導致各國對體育的重視程度不同。
本文使用到的數據均來自世界銀行。包括總GDP,人均GDP,人均能源使用量,各國每年發表的科技期刊文章數量,國土面積,人口數,每一百人中互聯網用戶數量。
綜合以上兩章的模型,在此建立一個更加綜合的預測模型,即考慮往期奧運會成績的因素,又考慮國家綜合實力等方面的五大因素,將模型綜合描述為:
將38個國家的數據進行訓練,對2020年的奧運成績做出預測,最終得到預測結果見表1。
總結前文內容,本文先利用時間序列預測的方法,使用自回歸模型和ARMA模型進行預測,之后利用多元非線性回歸模型,對獎牌的諸多影響因素進行了考量。能夠看出,國家的經濟發展、工業發展和人口數量的提高,都對獎牌的取得有著正面的促進作用;同時奧運會的成績中,東道主的主場優勢不可忽略,社會主義制度本身也會對該國在奧運會中的表現有著促進作用。

表1 2020年奧運會金牌榜預測結果
[1] Ball Donald W.Olympic Games Competition:Structural Correlates ofNational Success[J].International Journal of Comparative Sociologu,1972,12:86- 200.
[2] Grimes A Ray,William J.Kelly,Paul H,Rubin. A Socioeconomic Modelof National Olympic Performance[J].Social Science Quarterly,1974,55,777-782.
[3] Levine Ned.Why Do Countries Win Olympic Medals? Some Structural Correlates of Olympic Games Success:1972[J].Sociology and SocialResearch,1974,58:353- 360.
[4]藺銀萍,王建軍.運用時間序列法預測2008 年奧運會獎牌數[J].南京體育學院學報,2007,6(1):31- 32.
[5]范珣,齊輝.運用趨勢直線外推法預測2008 年奧運會中國獲獎牌數[J].遼寧體育科技,2007,29(4):57- 58.