王娟娟
摘 要: 為了獲得更好的運動員成績預測結果,提出最小二乘支持向量機和預測誤差校正的運動員成績預測模型。首先通過提升小波和最小二乘支持向量機對運動員成績進行建模和預測,然后通過誤差校正方式對運動員成績的預測結果進行校正,最后通過運動員成績預測實例對模型的有效性進行測試,并與其他運動員預測模型進行對比實驗,驗證其優越性,結果表明,所提模型降低了運動員成績的預測誤差,并且通過誤差校正提高了運動員成績預測結果的穩定性,預測精度要優于其他運動員成績預測模型。
關鍵詞: 運動員成績; 最小二乘支持向量機; 誤差校正; 預測模型; 預測誤差; 預測精度
中圖分類號: TN911.1?34 文獻標識碼: A 文章編號: 1004?373X(2018)05?0163?04
Abstract: In order to get better performance prediction results of athletes, an athletes′ performance prediction model based on least square support vector machine and prediction error correction is proposed. The lifting wavelet and least square support vector machine are used to model and predict the athletes′ performance. And then the error correction method is used to correct the prediction result of athletes′ performance. The validity of the model was tested with the prediction instance of the athletes′ performance. The superiority of the model was verified by means of contrast experiment of other athletes′ performance prediction models. The results show this model can reduce the prediction error of the athletes′ performance, improve the stability of athletes′ performance result by means of error correction, and its prediction accuracy is higher than that of other athletes′ performance prediction models.
Keywords: athletes′ performance; least square support vector machine; error correction; prediction model; prediction error; prediction accuracy
0 引 言
近年來,隨著國民經濟水平的不斷提升,運動員水平也不斷提高,運動員成績引起了人們的廣泛關注。運動員成績預測可以幫助教練、運動員了解自己的競技水平,可以根據運動員成績制定相應的訓練方案,因此運動員成績預測發揮著越來越重要的作用。
根據建模方法的不同,運動員成績預測模型可以劃分為兩類:線性預測模型和非線性預測模型。由于運動員成績受到多種因素的影響,如測試環境、運動員心理等,運動員成績具有一定的非線性變化特點,因此,線性預測模型的運動員預測誤差大,無法保證運動員成績的預測精度。而非線性模型可以描述影響因素和運動員成績間的變化關系,成為當前的主要研究方向。非線性運動員預測模型可以分為兩類:第一類為基于時間序列的運動員成績預測模型,通過運動員成績的歷史數據分析運動員成績變化特點,根據數據在時間上的相關性實現運動員成績預測,主要包括:ARMA、指數平滑法等;第二類是基于機器學習算法的運動員成績預測模型,主要有:神經網絡、支持向量機回歸等,兩類模型有各自的優點,同時也存在一定的局限性,如ARMA模型要求運動員成績變化比較平穩,而指數平滑法需要大量的歷史數據。而神經網絡的網絡結構難以確定,支持向量機的核函數和參數有待優化,它們的運動員成績預測精度難以滿足實際應用要求。因此,當前急需要針對運動員成績的隨機性和非穩定性建立一種有效的運動員成績預測模型。
為了提高運動員成績的預測精度,提出最小二乘支持向量機和預測誤差校正的運動員成績預測模型。結果表明,本文模型是一種有效的運動員成績預測模型,通過誤差校正具有較高的運動員成績預測精度。
1 相關理論
1.1 提升小波
提升小波算法是一種改進的小波算法,通過預測和更新算子實現小波變換的提升,屬于第二代小波。相對于標準小波變換,提升小波基的構造與傅里葉變換無關,同時不要進行頻譜分析,通過非平移就可以構造小波,可以用于隨機性變化較強烈的運動員成績數據分析,提取主要變化特征,基本工作步驟如下:
1) 將運動員成績劃分為獨立的奇偶兩部分,其中偶部分用表示,奇部分用表示,則有:
2) 用對進行預測,預測結果為與之間的差值為,其又稱為小波系數,與原始信號的高頻部分相對應,預測過程可以描述為:
式中,表示預測算子,可以采用 進行描述,可得:
3) 運動員成績經過分裂后,子集的某些整體特征與原始運動成績有一定的差異,為了維持運動員成績的整體特征,需要進行一定更新,將更新過程用算子代替,則有:endprint
式中表示原始數據的低頻部分。
更新算子也可以取不同函數,如:
運動員成績經過提升小波分解后,得到低頻和高頻兩部分;對于低頻部分還可以進一步分解,得到和進行次分解后,運動員成績可以描述為,具體流程如圖1所示。
運動員成績的提升小波重構可以表示為:
1.2 最小二乘支持向量機
采用提升小波對運動員數據進行處理后,最小二乘支持向量機對處理后的數據進行訓練和建模。設其中表示運動員成績的特征,表示輸出結果,最小二乘支持向量機分類問題可表示為:
基于KKT理論可知,從而可得:
最小二乘支持向量機的最優決策函數變為:
式中是核函數。
選擇RBF徑向基函數作為核函數,具體為:
式中表示寬度參數。
最小二乘支持向量機的最優決策函數基于RBF徑向基函數的最小二乘支持向量機的最優決策函數,最終為:
由于運動員成績變化的隨機性,采用最小二乘支持向量機對其進行歸一化處理,具體為:
式中和分別表示運動員成績的最大值和最小值。
最后運動員成績的最終預測值要進行反歸一化處理,即:
2 最小二乘支持向量機和預測誤差校正的運動員成績預測模型
雖然最小二乘支持向量機具有優秀的泛化性能,而運動員成績變化具有一定的規律性,同時也有一定的隨機性,是一種復雜多變的數據,采用單一最小二乘支持向量機只能對運動員成績的非線性特點進行擬合,對運動員成績的非平穩性無法有效進行擬合。
采用提升小波的多尺度分解特性,可以從運動員成績中提取不同成分,不同成分對應不同的運動員成績變化特性,實現運動員成績變化特征的有效性分離,有利于最小二乘向量機分開預測,為此,本文首先采用提升小波對運動員成績進行分解,然后采用最小二乘支持向量機對不同成分分別進行建模預測,最后采用提升小波重構得到運動員成績的預測結果。最小二乘支持向量機的運動員成績預測結果,大多數樣本預測精度可以滿足實際應用要求,但是有部分樣本點會出現較大的誤差值,需要進行校正。為了進一步提高運動員成績預測精度,采用誤差預測方法實現預測結果校正。基于最小二乘支持向量機和預測誤差校正的運動員成績預測模型的工作流程如圖2所示。
3 運動員成績預測的應用實例
3.1 運動員成績
運動員成績來自一個運動3年的100 m跑訓練成績(單位:s),共有450個樣本,最后100個樣本組成運動員成績建模的驗證樣本集,對建立的運動員成績預測模型泛化能力進行測試,具體數據如圖3所示。
3.2 網絡流量的小波分解
采用提升小波對圖3中的運動員成績進行分解,得到的結果如圖4所示。從圖4可以看出,經過提升小波分解,運動員成績的變化特征更加清楚,便于后續最小二乘支持向量機的建模。
3.3 結果與分析
對于不同分量,采用最小二乘支持向量機進行訓練,運動員成績的低頻分量的參數為:100.78,8.62,運動員成績的高頻分量的參數為:187.15,2.96,建立低頻分量和高頻分量的運動員成績預測模型,最終運動員成績預測結果如圖5所示。從運動員成績預測結果可以看出,本文模型獲得了較高的運動員成績預測精度,主要是因為可以描述運動員成績的隨機性和非平穩性,并通過誤差校正改善了運動員成績的預測結果。
3.4 與經典運動員預測模型的精度比較
選擇當前經典運動員預測模型作為對比模型,具體為:BP神經網絡(BPNN)、支持向量機(SVM)、小波分析+最小二乘支持向量機(W?LSSVM1)、沒有誤差校正的提升小波分析+最小二乘支持向量機(W?LSSVM2),采用運動員成績的預測精度作為評價指標,所有模型的運動員成績預測精度如表1所示。在所有模型中,本文模型的運動員成績預測精度最高,主要是因為對比模型存在一定的局限性,無法準確描述運動員成績變化特點,對比結果證明了本文模型建模思路的正確性,并驗證了本文模型的優越性。
4 結 語
針對運動員成績的隨機性和規律性,本文建立了基于最小二乘支持向量機和預測誤差校正的運動員成績預測模型,采用提升小波對運動員成績進行建模,通過最小二乘支持向量機對不同分量進行預測,然后通過誤差校正對樣本點進行校正,提高運動員成績預測結果的穩定性,并且可以有效提高運動員成績的預測精度。
參考文獻
[1] 趙波.十項全能世界頂尖男子運動員成績分析及預測研究[J].體育文化導刊,2013(3):76?79.
ZHAO Bo. Analysis and prediction of the results of ten all?around world top male athletes [J]. Journal of sport history and culture, 2013(3): 76?79.
[2] 趙丙軍.運用多元回歸方法建立我國男子跳遠項目訓練模型的研究[J].西安體育學院學報,2011,18(1):81?82.
ZHAO Bingjun. Model system on main training targets of men′s jumping [J]. Journal of Xian Institute of Physical Education, 2011, 18(1): 81?82.
[3] 魏春玲.我國十項全能運動成績的因子分析及灰色系統回歸預測研究[J].體育科學,2004,24(11):66?69.
WEI Chunling. Factor analysis and grey system regression prediction study on the performance of ten all?around sports in China [J]. China sport science, 2004, 24(11): 66?69.endprint
[4] 王宗平,孫光.應用BP神經網絡算法對運動成績預測的實證研究[J].南京體育學院學報,2006,20(4):109?111.
WANG Zongping, SUN Guang. Demonstration on the athletic achievements forecasting based on back propagation neural network [J]. Journal of Nanjing Institute of Physical Education, 2006, 20(4): 109?111.
[5] 陳志強,楊德芳,黃明教.建立體育多因素聚類的灰色系統回歸預測模型方法研究[J].中國體育科技,2001,37(2):13?16.
CHEN Zhiqiang, YANG Defang, HUANG Mingjiao. The research on model of gray system regress prediction of multivariate cluster on physical education [J]. China sport science and technology, 2001, 37(2): 13?16.
[6] 莊沖,王宗平.灰色系統模型與BP神經網絡模型在體育成績預測方面的比較研究[J].南京體育學院學報,2006,20(6):134?135.
ZHUANG Chong, WANG Zongping. Comparing of gray and neural network model of forecasting in athletic achievements [J]. Journal of Nanjing Institute of Physical Education, 2006, 20(6): 134?135.
[7] 李征宇,閆生.神經網絡模型在運動成績預測中的應用[J].哈爾濱體育學院學報,2009,27(2):110?113.
LI Zhengyu, YAN Sheng. The nerve network model application in the forecast of sports result [J]. Journal of Harbin Institute of Physical Education, 2009, 27(2): 110?113.
[8] 戴敏,黃亞樓.基于數據挖掘的運動員體能測試數據分析[J].計算機工程與應用,2003,9(2):38?40.
DAI Min, HUANG Yalou. Data analysis of athletes′ physical fitness test based on data mining [J]. Computer engineering and applications, 2003, 9(2): 38?40.
[9] 龍斌.基于支持向量機的劉翔110 m欄成績預測[J].天津體育學院學報,2009,24(4):330?333.
LONG Bin. SVM?based prediction of Liu Xiang′s achievements in 110 m hurdle [J]. Journal of Tianjin Institute of Physical Education, 2009, 24(4): 330?333.
[10] 孫群,劉國璧,程偉,等.基于模糊神經網絡的劉翔110 m欄成績預測[J].重慶科技學院學報(自然科學版),2011,10(2):104?107.
SUN Qun, LIU Guobi, CHENG Wei, et al. Research on Liu Xiang′s achievements in 110 m hurdle based on fuzzy neural network [J]. Journal of Chongqing University of Science and Technology (natural science edition), 2011, 10(2): 104?107.endprint