999精品在线视频,手机成人午夜在线视频,久久不卡国产精品无码,中日无码在线观看,成人av手机在线观看,日韩精品亚洲一区中文字幕,亚洲av无码人妻,四虎国产在线观看 ?

基于GA和回歸分析的奧運會成績預測研究

2011-03-06 14:38:22王國凡劉徐軍豐淑慧薛二劍
中國體育科技 2011年1期
關鍵詞:體育模型

王國凡,趙 武,劉徐軍,豐淑慧,薛二劍,陳 林,王 波

1 引言

目前,奧運會成績預測方法主要有時間序列模型、以計量經濟學原理建立的經驗模型和神經網絡模型。其中,基于計量經濟學原理建立的回歸分析模型能綜合分析奧運會成績的影響因素,為定量預測奧運會成績提供了依據,也最受廣大學者關注[8]。經筆者研究發現,單純運用經濟學原理提出的預測模型可能適合一個或若干個國家,但把它應用到所有國家是缺乏依據的,其預測結果也往往不能令人滿意[9]。為此,本研究提出了一種將遺傳算法(Genetic Algorithm,簡稱 GA)、競技體育實力評估和回歸分析有機結合的預測方法。基于 GA對競技體育實力進行動態優化且實現有監督評估,在此基礎上,依據回歸分析建立奧運會成績預測模型。計算結果表明,該模型是一種較高精度的預測方法。

2 預測模型分析

關于奧運會成績預測模型的研究目前主要可歸納為基于時間序列預測模型、經驗模型及神經網絡模型。時間序列預測模型由于沒有考慮其他任何影響因素,預測結果偶然性大[8];神經網絡預測模型雖優于多元線性回歸模型[13],但神經網絡模型容易陷入局部最優和“黑箱”式學習模式等缺陷;基于計量經濟學原理建立的經驗模型是當前國內、外研究的熱點。奧運會成績預測的計量經濟學模型是基于計量經濟學原理研究體育問題,根據影響因素集建立的經驗模型。較早關于這方面的研究成果有 Ball (1972)[11]、Grimes A Ray等 (1974)[15]和 Levine N (1974)[16],即根據國家性質與經濟水平等因素集研究對國家在奧運會競賽中成績的影響。隨后的研究案例中,由Bernard與Busse(2004)[12]提出利用柯布—道格拉斯生產函數建立了獎牌數分部的多元非線性模型:

式中:

Me表示第i個國家在當屆奧運會取得的獎牌數(medalsi)與當屆奧運會總獎牌數(∑imedalsi)的比值。

(1)式中,t為時間趨勢;POP為當年參賽國人口數; PGDP為當年參賽國人均 GDP;Home為虛擬變量,Home=1表示奧運會主辦國,Home=0表示非主辦國;P為虛擬變量,P=1為社會主義國家,P=0為資本主義國家;β0為常數;βj(j=1,…,5)為各解釋變量的系數。

此后,更多人們的目光聚集到該研究上,也使奧運會成績預測一直為研究熱點[14]。王國凡等人(2010)[9]指出,傳統模型的缺陷在于:單純運用經濟學原理建立的預測模型可能適合一個或若干個國家,但把它應用到所有國家是缺乏依據的,提出參賽國的競技體育實力對奧運會成績存在重要的影響,并以此為依據,在以Bernard與Busse的模型基礎上,建立了基于競技體育實力評估的多元非線性模型:

式中:C為參賽國競技體育實力等級,其他參數與式(1)、(2)相同;各個國家的競技體育實力等級C是利用聚類分析獲得的。研究結果表明,此方法比傳統的回歸分析預測精度高,具有較高的可行性。

從模型(3)可以發現,參賽國競技體育實力評估是該預測研究的重點也是難點。但現有的關于競技體育實力評估均是無監督聚類方法[1-4,6],此方法的缺陷在于利用什么的數據集作為聚類分析、選擇何種聚類分析方法、金牌與獎牌數評估是否等同、聚類數為多少等確定非常困難,往往只能根據經驗估計確定,這些憑主觀估值的方法必將帶來算法精確度的下降。

考慮到以上案例存在的缺陷,筆者考慮使用 GA對競技體育實力進行監督評估,GA將目標函數轉化為基因組群,以適應度函數為優化目標,通過基因操作得到下一代優化基因組合,如此反復迭代,直到滿足最優收斂目標為止。

3 基于 GA的有監督競技體育實力評估

3.1 GA優化競技體育實力評估總描述

GA能得以廣泛應用的一個重要原因,是它的全局收斂性,由于 GA群體的多樣性,使其盡可能在全方向上搜索,這比以往的梯度法只在單方向上搜索有很大改進,而且 GA在優化問題上無需有連續性和可微性的限制[17]。最終可實現競技體育實力等級評估的動態優化,在此基礎上,依據競技體育實力的多元非線性模型進行預測,保證了預測精度高、客觀性強。

本研究提出的基于 GA優化競技體育實力評估的預測模型流程如圖1所示:

圖1 預測模型算法流程圖

GA是以擬合優度 R2來評價競技體育實力評估的好壞及預測精度,并將此目標函數轉化為適應度函數。算法開始先隨機產生群體,群體中的每組染色體代表參賽國的競技體育實力等級,根據適應度函數對每1組染色體進行評價,得到相應的適應度值,染色體的適應度越大,則染色體所代表的競技體育實力評估得到了優化且預測效果越好。根據適應值可以算出每一條染色體在選擇操作中被選中的概率。根據選擇概率,選擇使用隨機遍歷抽樣法選出一群染色體,構成新種群。根據交叉概率,選擇染色體進行 GA交叉操作,最后根據變異概率,對染色體上部分基因位進行變異操作,該操作使得在整個搜索過程中染色體代表的競技體育實力等級集具有多樣性,對競技體育實力起到了優化作用,從而保證能夠找到最優解。算法的結束條件是設置一個最大迭代次數 Epochmax,方能保證 GA在結束條件達到以后求得的解是最優解。

3.2 染色體編碼方案

編碼是 GA求解問題的前提,本研究對競技體育實力等級采用整數型編碼。在進行染色體編碼前,首先,應確定所有參賽國競技體育實力等級數 C值的范圍[Cmin, Cmax]。一般情況下,最佳的聚類數不會超過 Cmax≤(N為數據集總數)[10],因而,C的取值范圍可以設定為[2,]。

每條染色體所代表的是參賽國競技體育實力等級集,染色體長度就是參賽國家數,染色體中的基因表示競技體育實力等級,具有相同基因表示競技體育實力等級為同一類。在C的取值范圍內取一個整數k,表示該集合中參賽國含有k個競技體育實力等級,染色體可表示為:

染色體:[Z1,Z2,Z3,…,ZN],0≤Zi≤k-1,且Zi為整數。

例如,在本研究中選取N=62個參賽國家作為研究對象(表3),故最佳競技體育實力等級數為2≤C≤8,若k= 6,那么,染色體編碼為:

3.3 適應度函數

根據染色體的編碼,將此編碼轉換為虛擬變量,為了避免“虛擬變量陷阱”,利用k-1個虛擬變量D1,D2,…,D(k-1)分別表示k個類別(如表1所示),根據模型(3)進行多元非線性回歸分析,將回歸模型擬合優度R2轉化為如(4)所示的目標函數:

式中:yi為觀測值,^yi為擬合值,為均值[18]。

表1 參賽國競技體育實力等級的虛擬變量設定一覽表

適應度函數通常是用于轉換目標函數值為相對適應度值。為了防止過早收斂,可根據目標函數值在種群中的排序計算適應度值。根據個體的目標函數值obj由小到大的順序進行排序,根據排序的序號,給每一個等級的個體一個適應度值,具有相同排序的非支配解分配相同的適應度值,適應度值按式(5)計算出:

式中:MAX表示選擇壓差,一般為[1,2]之間;xi是個體i在有序種群中的位置;Nid為種群數;FinV(i)表示i位置上個體的適應度值。本研究中選擇壓差設定為MAX=2。

由于R2值越高,預測越準[5],那么,適應度函數對于最終預測結果好的染色體給予一個較高的適應值;反之,預測精度效果不好的染色體給予一個較低的適應值。利用 GA對預測進行優化時其實質就是要使擬合優度R2優化。

3.4 選擇算子

選擇算子是確定如何從父代群體中根據設定的代溝GGAP選出一定數目的優良個體遺傳到下一代群體中的一種 GA,為了提高全局收斂性和計算效率,選擇方法采用隨機遍歷抽樣(SUS)。SUS是具有零偏差和最小個體擴展的單狀態抽樣算法,替代用于輪盤方法的單個選擇指針, SUS使用S個相等距離的指針,這里S是指要求選擇的個數。種群被隨機排列,S個指針[ptr,ptr+1,ptr+2,…,ptr+S-1]確定S個個體,指針ptr+i(i=0,1,…,S-1)由在[1/S,i+1/S]內產生的隨機數確定。

假定從10個個體中選擇S=6個個體且第一個指針的隨機位置為0.04(圖2),那么,指針間的距離為1/6= 0.17,故可根據指針ptr的位置和累計概率區間即可確定被選中的個體為:1,2,3,4,7,8。

圖2 隨機遍歷抽樣示意圖

3.5 變異算子

采用均勻變異(Simple Mutation),其操作是指分別用符合某一范圍內均勻分布的隨機數,以某一較小的概率來替換個體編碼串中各個基因座上的原有基因值,即對父代個體依變異概率Pm進行操作,目的是防止過早收斂產生局部最優解而非整體最優解。

均勻變異的具體操作過程是:

1.依次指定個體編碼串中的每個基因座為變異點;

2.對每一個變異點,以變異概率Pm從對應基因的取值范圍內取一隨機數來替代原有值。

3.6 交叉算子

采用單點交叉,是指在個體編碼串中只隨機設置一個交叉點,然后,在該點相互交換兩個配對個體的部分染色體。這里首先對群體中的個體隨機設定一個交叉位置,根據交叉概率Pc進行操作,對兩個相互配對的染色體在交叉位置按單點交叉相互交換其部分基因,通過交換產生新一代群體。圖3為單點交叉運算的示意圖。

單點交叉的具體執行過程:

1.對個體進行兩兩隨機配對,若群體大小為M,則共有[M/2]對相互配對的個體組;

2.對每一對相互配對的個體,隨機設置某一基因座之后的位置為交叉點,若染色體的長度為N,則共有N-1個可能的交叉點位置;

3.對每一對相互配對的個體,依設定的交叉概率Pc在其交叉點處相互交換兩個個體的部分染色體,從而產生出兩個新的個體。

圖3 單點交叉運算示意圖

4 預測能力評價指標

為了評價預測精度及模型優劣,本研究引入以下幾種誤差:

1.均方根誤差:

2.平均絕對百分比誤差:

3.平均絕對誤差:

4.Pearson相關系數:

式(6)~(9)中:yi,^yi分別為實際值和預測值。

5 應用實例及結果分析

本研究所采用的數據來源同文獻[9],利用1992—2004年奧運會實際數據為樣本數據,選取62個國家(地區)作為研究對象,以2008年北京奧運會成績檢驗預測模型的效果。

實現算法的軟件為MATLAB軟件,GA的各控制參數設置為:初始種群數M=50;染色體長度為N=62;交叉率Pc=0.7;變異率Pm=0.01;代溝為GGAP=0.9。

5.1 競技體育實力等級數確定

為了比較競技體育實力等級數對多元回歸模型的影響,采用 GA優化多元回歸非線性模型計算出競技體育實力等級個數C范圍內所有最優擬合優度R2,計算結果如圖4所示。

從圖4中可以看出,對于獎牌數預測,競技體育實力等級個數為C=7時,擬合優度R2最大,即參賽國(地區)獲獎牌數的最優競技體育實力等級應分為7類;對于金牌數預測,競技體育實力等級C=4時,擬合優度R2最大,即參賽國(地區)獲金牌數的最優競技體育實力等級應分為4類。

5.2 預測結果

根據上述分析,將參賽國(地區)獎牌數預測模型的競技體育實力等級數設為7;金牌預測模型競技體育實力等級數設為4,對樣本數據進行回歸分析(表2)。

圖4 競技體育實力等級數與擬合優度R2的關系示意圖

表2 1992—2004年間奧運會獎牌與金牌占有率回歸結果一覽表

根據表2的結果,可對2008年北京奧運會獎牌數、金牌數進行預測(表3)。

最后,分別計算文獻[9]的預測結果與本研究提出預測結果的預測能力評價指標(表4)。

從表4中可以看出,本研究提出的預測模型在對獎牌預測能力方面有明顯優勢;在對金牌預測結果中除MAE指標略小,其他指標均優于前者。

從表4中可以發現,對于FCM-regression模型,由于基于無監督模糊C均值聚類的競技體育實力評估難以客觀地描述,從而對參賽國(地區)競技體育實力有效優化組合能力有限,其預測能力自然無法保證,使得預測精確度相對較低。

對于本研究所提出的 GA-regression模型通過 GA可實現對參賽國(地區)競技體育實力等級進行監督計算,能動態挖掘最優競技體育實力評估,使得基于競技體育實力的預測模型達到最優化。同時,降低了預測模型的主觀性,在獎牌、金牌數預測中精度更高、穩定性更好。

表3 各個國家(地區)獎牌數、金牌數和競技體育實力歸類結果一覽表

表4 兩種模型預測統計指標結果一覽表

6 結論

1.本文提出的 GA-regression模型

通過 GA可實現對參賽國(地區)競技體育實力等級進行有效監督計算,能動態挖掘最優競技體育實力評估,使得基于競技體育實力的預測模型(3)達到最優化。同時,提高了預測模型的客觀性,在獎牌(金牌)數預測中精度高、穩定性好。

2.采用 GA優化多元回歸非線性模型,能夠計算得出奧運會參賽國(地區)競技體育實力等級數。在參賽國(地區)獎牌數預測中,其競技體育實力等級數為7;在參賽國(地區)金牌數預測中,其競技體育實力等級數為4。

[1]白海波,郭權.我國與奧運強國競技體育實力的比較研究[J].沈陽體育學院學報,2004,23(2):163-117.

[2]鮑勇,劉新剛,劉偉.應對第11屆全運會我國主要省(市)區域競技實力分析[J].北京體育大學學報,2009,32(2):127-128.

[3]陳紹艷,楊風華.奧運會對承辦國競技體育實力的影響[J].體育學刊,2006,13(4):119-121.

[4]高鴻輝.我國全運會田徑競技實力各等級區域構成的動態演變研究[J].西安體育學院學報,2009,26(1):86-91.

[5]古扎拉蒂.計量經濟學[M].林少宮譯.北京:中國人民大學出版社,2000:333.

[6]雷英杰,張善文,李續武,等.MA TLAB遺傳算法工具箱及應用[M].西安:西安電子科技大學出版,2005.

[7]李真.中國競技體育實力的地區格局分布與對比分析——對十運會排行榜的分析[J].北京體育大學學報,2006,29(8):1137-1139.

[8]王國凡,唐學峰.奧運會獎牌預測國內、外研究動態及發展趨勢[J].中國體育科技,2009,45(6):3-7.

[9]王國凡,薛二劍,唐學峰.對大型國際綜合性運動會獎牌數的預測研究——以北京奧運會為例[J].天津體育學院學報,2010,25 (1):86-90.

[10]于劍,程乾生.模糊聚類方法中的最佳聚類數的搜索范圍[J].中國科學E輯,2002,32(2):274-280.

[11]BALL,DONALD W.Olympic games competition:structural correlates of national success[J].Int JComparative Soc,1972, 12:186-200.

[12]BERNARD,ANDREW B,M EGHAN R BUSSE.W ho w ins the olympic games:economic resources and medals totals[J].Rev Eco Statistics,2004,86(1):413-417.

[13]CONDON E M,GOLDEN B L,WASIL E A.Predicting the success of nations at the summer olympics using neural netwo rks[J].Computer Operations Res,1999,26:1243-1265.

[14]FORREST,DAV ID,SANZ,ISMAEL,TENA J D.Forecasting national team medal totals at the summer Olympic games[J]. Int J Forecasting,2010,26:576-588.

[15]GRIMES,A RA Y,W ILL IAM J KELLY,etal.A socioeconomic model of national Olympic performance[J].Soc Sci Q,1974, 55:777-782.

[16]LEV INE NED.Why do countries win olympic medals?some structural co rrelates of olympic games success:1972[J].Sociology Social Res,1974,58:353-360.

[17]LUCB,STEFAN S.Genetic algorithms:theory and application [J].J A,1997,38(2):13-23.

[18]Samp rit Chatterjee,A li S Hadi,Bertram Price.例解回歸分析(第3版)[M].鄭明,徐勤豐,胡瑾瑾譯.北京:中國統計出版社,2004.

猜你喜歡
體育模型
一半模型
重要模型『一線三等角』
提倡體育100分 也需未雨綢繆
甘肅教育(2020年2期)2020-11-25 00:50:04
重尾非線性自回歸模型自加權M-估計的漸近分布
我為體育狂
論清末體育熱
2016體育年
3D打印中的模型分割與打包
我們的“體育夢”
FLUKA幾何模型到CAD幾何模型轉換方法初步研究
主站蜘蛛池模板: 色婷婷成人网| 又爽又大又黄a级毛片在线视频| 久久这里只精品国产99热8| 欧美色亚洲| 国产色网站| 熟妇丰满人妻av无码区| 国内精自视频品线一二区| 91外围女在线观看| 日韩人妻无码制服丝袜视频| 久久免费成人| 国产乱人伦AV在线A| 日本高清成本人视频一区| 青青久视频| 国产精品任我爽爆在线播放6080| 国产人妖视频一区在线观看| 国产情侣一区| 婷婷六月在线| 在线a网站| 99视频在线免费看| 欧美激情二区三区| 亚洲资源站av无码网址| 高清乱码精品福利在线视频| 91免费国产高清观看| 亚洲三级影院| www.国产福利| 亚洲Av激情网五月天| 国产成人综合欧美精品久久| 国产欧美在线视频免费| 中国国语毛片免费观看视频| 久久综合九九亚洲一区| 亚洲人精品亚洲人成在线| 一本大道香蕉高清久久| 亚洲人成网站在线观看播放不卡| 国产精品短篇二区| 欧美国产在线看| 久久无码av一区二区三区| 亚洲中文字幕在线精品一区| 成人午夜视频免费看欧美| 亚洲中文字幕久久精品无码一区| 亚洲va视频| 免费国产高清视频| 亚洲无码精彩视频在线观看| 性欧美在线| 亚洲综合九九| 天天干天天色综合网| 蜜桃视频一区二区| 精品国产一区二区三区在线观看 | 亚洲欧洲日产国码无码av喷潮| 精品黑人一区二区三区| 亚洲国产系列| 欧洲av毛片| 亚洲视频在线网| 亚洲人成网址| 在线观看国产黄色| 99激情网| 欧美人与动牲交a欧美精品| 成人免费午间影院在线观看| 18禁不卡免费网站| 日本色综合网| 国产一二三区视频| 国产成人av大片在线播放| 久久a级片| 久久久四虎成人永久免费网站| 老司机午夜精品视频你懂的| 国产成人亚洲无码淙合青草| 久久精品午夜视频| 精品99在线观看| 在线观看无码a∨| 国产精品视频猛进猛出| 国产性生大片免费观看性欧美| 日韩美毛片| 国产丰满成熟女性性满足视频 | 九九热视频精品在线| 天天色综网| 日韩精品一区二区三区大桥未久 | 欧美自拍另类欧美综合图区| 老司机精品久久| 欧美啪啪视频免码| 久久九九热视频| 国产视频a| 国内精品免费| 国产一区二区福利|