朱夢楠 彭濤 陳軻
(江蘇大學能源與動力工程學院 江蘇鎮江 212013)
奧運會獎牌榜影響因素的數學分析①
朱夢楠 彭濤 陳軻
(江蘇大學能源與動力工程學院 江蘇鎮江 212013)
利用第26~31屆夏季奧運會獎牌榜排名前10位國家的相關數據,使用多元線性回歸法建立了奧運會獎牌榜排名在影響因素:國家綜合實力、人口數量、國家體制和東道主效應作用下的線性回歸方程。運用基于GM(1,1)模型的灰色預測,利用前6屆國家影響獎牌榜排名相關數據,預測出了2020年相應影響因素對應的數值,采用加權求和和定量計算的方式預測了2020年東京奧運會的獎牌榜前10名的排名。
獎牌榜排名 影響因素 多元線性回歸 灰色預測
2016年里約奧運會已經落下帷幕,中國代表隊取得了金牌榜第三,獎牌榜第二的好成績。2020年東京奧運在即,一旦比賽敲響,一切準備與喧嘩都將化為賽場上的真實較量。哪個國家將在本次奧運會上爭奪最多的獎牌?哪個國家的國歌將最頻繁地在奧運領獎臺上響起?這些問題也成為人們期待中的熱點[1]。一個國家所獲得的獎牌數不僅僅受到運動員競技水平單一要素的影響,更受到國家經濟實力、人口數量、政治結構等多因素的影響。對于奧運會獎牌榜排名的影響因素,已經有學者開始相關的研究工作。但是相關文獻研究大多只進行定性分析,而不進行定量分析。在定量分析的研究中,存在著相關影響因素少、分析方法單一的問題。本文在借鑒以前相關研究的基礎上,通過多元線性回歸模型,建立了2020年東京奧運會獎牌榜排名預測的數學模型。影響2020年東京奧運會的因素有國家綜合實力、人口數量、政治體制和東道主組成,本文分別選用人均GDP,人口規模等級,同時將政治體制和東道主用虛擬變量1,0表示,分別作為相應因素的指標,采用加權求和和定量計算的方式預測了2020年東京奧運會的獎牌榜排名。
預測奧運會的獎牌榜排名這一問題,本質上為統計學問題,即運用一些基于客觀變量的數學模型對奧運比賽進行預測,問題的關鍵在于找到各個影響因素對于獲得獎牌事件影響作用的大小。影響獎牌榜排名的因素分為國家綜合實力、人口、政治環境、舉辦地四個指標,分別以人均GDP,人口規模等級,政治體制以及東道主效應作為反映以上4點影響因素的指標。這4個指標的影響系數分別為人均GDP對獎牌榜的影響系數β1,人口總量對獎牌榜的影響系數β2,政治環境對獎牌榜的影響系數β3,東道主對獎牌榜的影響系數β4。
總的說來,國家的綜合實力E是否雄厚,決定這個國家對體育事業資金投入的多少。如果各個國家各種人才的概率分布是相同的,那么在其他條件相同的情況下,人口規模等級P大的國家將擁有絕對數量更多的優秀運動員,大大提高一個國家在奧運會得獎的概率。人口規模與等級的關系見表1所示。國家性質決定政府職能,政府制定什么樣的政策取決于一個國家用的是什么樣的體制。這里把國家體制G作為政府政策的主要影響因素。而國家體制G是指一個國家采取的社會制度,主要分為社會主義國家和資本主義國家兩類。通常社會主義國家的中央政府比資本主義國家有更高的號召力和對全國資源的整合能力。這里把國家體制G作為虛擬變量,取值0或1,1表示社會主義,0表示資本主義。東道主H擁有主場優勢的同時,本國運動員對本國的氣候、食物等條件比外國運動員更加適應[2],這里東道主效應H為虛擬變量,取值0或1,1表示有東道主效應,0表示無東道主效應。

表1 人口規模與等級的關系

表2 6屆獎牌榜前10名國家獎牌榜影響因素加權值

表3 2020年獎牌榜排名影響因素預測值
利用獎牌積分作為獎牌榜排名確定的依據,其中獎牌積分計算方法為:Y=金牌數×5+銀牌數×3+銅牌數×1(即金牌權重為5分,銀牌權重為3分,銅牌的權重為1分)。
一般而言,設系統變量y與k個自變量x1,x2…xk之間存在統計線性相關關系,且給定n組樣本數據點如下:

多元線性回歸模型可以表示為:

解上面的方程組即可得到a0,a1,…,ak的估計值,系統值獎牌榜排名Y即是在4個自變量:人均GDP、人口規模等級、政治體制以及東道主效應作用下的線性回歸問題。可以認為每屆奧運會獲得獎牌榜前10名的國家基本不變,即可以認為每屆奧運會獎牌榜的前10名從以前得過奧運會獎牌榜前10名的國家中產生。這種假設符合實際情況的同時,減少了數據收集和分析的工作量。收集1996—2016年得過奧運會獎牌榜前10名的16個國家的人均GDP、人口規模等級、政治體制以及東道主效應,按照獎牌榜積分值計算方法得到表2的數據。
利用MATLAB中regress多元線性回歸分析得到的結果為:Y=-201.2233+23.5087×E+96.5315×P+33.3057×G+1.0899×H。
灰色預測模型是通過少量的、不完全的信息,建立數學模型并做出預測的一種預測方法。當我們應用運籌學的思想方法解決實際問題,制定發展戰略和政策、進行重大問題的決策時,都必須對未來進行科學的預測。預測是根據客觀事物的過去和現在的發展規律,借助于科學的方法對其未來的發展趨勢和狀況進行描述和分析,并形成科學的假設和判斷。所以,基于我們收集到的有限的數據,我們利用灰色預測模型,分別預測出2020年的參賽國家的人均GDP以及人口數量的變化。灰色預測的一般步驟如下文所示:

表4 2020年東京奧運會獎牌榜預測排名

表5 模型綜述

表6 參數估計值
在此我們依據x(0)數據建立GM(1,1)實現預測功能,具體步驟如此下:記x(1)為生成數列:


對x(1)(t)建立x(1)(t)的一階線性微分方程:

其中a,b為待定系數,分別為發展系數和灰色作用量,a的區間為(-2,2),記a,b組成的矩陣為求出參數a,b,就能求出進而求出的預測值。
對累加生成數據做均值生成B與常數項向量yn,即:

用最小二乘法,通過最小誤差的平方和尋找數據函數的最佳匹配求解灰參數a':

將灰色參數a'代入進行求解,得:



利用MATLAB軟件實現GM(1,1)灰色預測,得出2020年16個相關國家的影響奧運會獎牌榜排名因素的權值,見表3。
根據多元線性回歸表達式:

可得,2020年各個國家的獎牌榜排名見表4。
從模型可得2020年東京奧運會的獎牌榜前10名預測結果為:中國、美國、英國、日本、德國、法國、澳大利亞、俄羅斯、韓國、西班牙。
模型的回歸系數分析見表5。
F分布的顯著性概率為0,即檢驗假設“H0:回歸系數B=0”成立的概率為0,從而拒絕0假設,說明因變量與自變量的線性關系是顯著的,可建立線性模型,見表6。
復相關系數檢驗如下:
y的每次取值yk(k=1,2,3…)是有波動的,這種波動稱為變差。每次觀測值yk的變差大小常用該次觀測值與n次觀測值的平均值的差來表示,稱為離差,而全部觀測值的總變差可由總的離差的平方和用Syy表示。
Q稱為剩余平方和(或稱殘差平方和),是實測值yk與回歸值之差的平方和,它是由試驗誤差及其他因素引起的,其自由度fQ=n-m-1(n為數據個數,該線性回歸數據個數為16個,m為自變量個數,為4個),
引入無量綱指標復相關系數R(0<R<1)作為檢驗總的回歸效果的指標,回歸平方和U實際上是反映回歸方程中全部自變量的“方差貢獻”,因此R就是這種貢獻在總回歸平方和中所占的比例,因此R表示全部自變量與因變量y的相關程度。復相關系數越接近1,回歸效果就越好。記Ra為臨界復相關系數,
當R>Ra時,稱線性回歸方程顯著,則在4個影響因素作用下的奧運會獎牌榜排名積分線性回歸方程顯著。
F檢驗分析如下:
要檢驗y與x1,x2…是否存在線性關系, 就是要檢驗假設H0:β1=β2=……=0。
當假設H0成立時,則無線性關系,否則認為線性關系顯著。所以應該拒絕假設H0。檢驗假設H0應用統計量這是兩個方差之比,它服從自由度為m及n-m-1的F分布,即
用此統計量可檢驗回歸的總體效果。如果假設成立,則當給定檢驗水平α=0.01下,統計量F應有對于給定的置信度α=0.01,由F分布表可查得的值,如果根據統計量算得的值為則拒絕假設H0, 即不能認為全部βi為0,即m個自變量的總體回歸效果是顯著的, 否則認為回歸效果不顯著。查表可得,則,則F檢驗通過。
利用多元線性回歸方法得出了在國家綜合實力、人口數量、國家體制和東道主效應4個影響因素作用下的奧運會獎牌榜積分的線性回歸方程,使用灰色預測克服了數據少且規律性不強的特點[3],預測得出了2020年東京奧運會的獎牌榜積分前10名的國家為:中國、美國、英國、日本、德國、法國、澳大利亞、俄羅斯、韓國、西班牙。綜合以上分析,可以得出以下幾點結論。
(1)對回歸系數進行檢驗,利用復相關系數檢驗和F檢驗,說明基于多元線性回歸方法得出的回歸方程具備合理性和科學性。采用多元線性回歸的方法,將復雜的問題分解成能夠被量化分析的簡單問題。
(2)上述所建立的模型具有一定的推廣性,可用于以后多屆奧運會的結果。
(3)除了上述文中已經考慮到的因素,還有其他因素可能影響最終的結果。日后的研究中,可將更多的因素考慮進去,做出更合理、有效地預測。
[1]王雅平.國家之間的體育角逐?——經濟學家運用經濟模式預測各國奧運獎牌總數[EB/OL].http://carnegieendowment.org/2008/07/01/zhpub-47475.2017.5.14.
[2]王宇鵬,許健,張媛媛.奧運會獎牌榜影響因素的實證分析[J].統計研究,2008,25(10):138-139.
[3]王道林,樊新生.奧運金牌數預測的灰色模型[J].山東體育科技,2005,27(2):45.
Use the 5 Olympic Games medal table data since the 26th Olympic Game and the multiple linear regression to establish the linear regression equation, based on the relevant factors: national comprehensive strength, population, state system and effects of the host. Based the grey forecasting model, predict the relevant data influencing the medal table. Use the weighted sum and quantitative calculate and forecast the result of the Tokyo Olympic Game medal table.
Olympic medals;Factors;Multiple linear regression;Grey forecasting model
G812
A
2095-2813(2017)09(c)-0239-05
10.16655/j.cnki.2095-2813.2017.27.239
朱夢楠(1995,9—),男,漢族,江蘇徐州人,本科,研究方向:流體機械,計算機應用。