岳志強
(上海建橋學院,上海 201306)
運動員日常訓練是提升運動員比賽成績的重要途徑,運動員日常訓練有助于教練明確運動員狀態和競技水平[1],依據運動員訓練情況制定訓練方案,訓練效果精準評估是提升運動員比賽成績的重要部分。評估受運動員心理狀態、訓練環境等眾多因素影響,主要分為線性評估以及非線性評估。運動員訓練效果評估存在非線性變化特點[2],線性評估方法無法保證訓練效果評估的精準性,而非線性評估方法可充分考慮運動員訓練的影響因素,已成為評估領域研究的主要方向。機器學習算法是非線性評估方法中的高效算法,其中支持向量機方法具有較好的評估效果[3],支持向量機核函數以及參數可有效提升運動員訓練效果的評估精度。針對運動員訓練效果評估存在的非穩定性以及隨機性,研究高效的評估方法具有較強的現實意義。
將生理狀態指標應用于運動員訓練效果評估中,提升運動員訓練過程的科學性[4]。運動員身體機能狀態決定運動員機能的發揮情況,依據運動員身體機能狀態評估運動員訓練效果具有較高的科學性[5],通過運動員身體狀態調整運動員訓練任務,科學化地制定訓練全過程。
文獻[6]研究了我國優秀男子健美運動員體能評價模型的構建及現狀,文獻[7]研究了青少年男子羽毛球運動員專項運動能力的評價指標,分別評價了健美運動員以及羽毛球運動員的運動能力。研究機器學習算法的運動員訓練效果評估,將機器學習算法中的支持向量機方法應用于運動員訓練效果評估中,有助于分析運動員訓練效果,利用科學合理的訓練計劃提升運動員競技比賽成績。
設F(z)為存在于空間z內的概率測度,存在函數集合分別為Q(z,a)以及a∈∧,可實現最小化風險泛函即機器學習目標[8],其公式如下:

式中,概率測度F(z)未知,但存在固定的獨立分布樣本。設y為訓練器輸出,可取值為0 或1,設存在f(x,a),其中a∈∧表示指示函數集合,獲取損失函數公式如下:

通過風險泛函明確指示函數f(x,a)以及訓練器輸出概率,需在已知訓練集的基礎上獲取最低分類錯誤概率的函數。
支持向量機方法依據有限樣本信息尋求存在最佳學習能力且較低復雜度模型的最終結果,具有較高的推廣水平[9]。支持向量機方法適用于高維度、小樣本以及非線性數據空間內,泛化水平較高。選取支持向量機作為運動員訓練效果評估方法,可充分發揮支持向量機對小樣本數據處理的優勢,通過小數量樣本獲取最佳分類面[10],所獲取分類面令運動員訓練效果評估結果所付出代價最低,推廣性最高。
用(xi,yi)表示訓練數據,且滿足i=1,2,…,l,x∈Rd,y∈{-1,1},其中l表示樣本數量。設存在超平面H,有如下公式:

式(3)中,w與b分別表示超平面法線以及超平面至原點的正交距離,利用超平面H分離正負兩類數據,超平面間隔公式如下:

式中,‖w‖與d1、d2分別表示w的歐幾里得范數以及與H距離最近的兩類樣本。

令對錯分樣本懲罰程度的懲罰因子C>0 為常數,此時對偶問題條件轉化為0 ≤αi≤C。
當評估問題為非線性問題時,將輸入特征x依據已設定的非線性映射轉化至高維特征空間中,從映射的高維特征空間內建立最優分類超平面[11]。
符合Mercer 條件的核函數K(xi·xj)即可將非線性分類問題于最優分類面中轉變為線性分類問題,獲取目標函數如下:

此時最優分類函數如下:

不同類型的非線性決策面支持向量機可通過差異核函數實現[12],選取徑向基核函數作為運動員訓練效果評估的核函數,其公式如下:

運動員訓練過程中的生理信息可體現訓練效果[13],展示以往運動員訓練效果評價體系無法評估的更多信息。
用X={x1,x2,…,xn} 與Y={y1,y2,…,yn} 分別表示運動員訓練樣本集以及可體現運動員訓練效果生理指標(如心率、攝氧量、血紅蛋白、肌酸激酶等)的測試指標集。矩陣A=(aij)n×m表示運動員訓練樣本集X針對測量指標集Y的指標矩陣,運動員訓練樣本xi針對測量指標yj的指標值用aij=yj(xi)(i=1,2,…,n;j=1,2,…,m)表示,規范化指標矩陣A至R=(rrj)n×m,消除不同物理量綱對評估效果的影響。
運動員訓練效果評估的輸入單元是運動員訓練樣本xi在生理測量指標yj下的測量值向量(ri1,ri2,…,rim),將運動員訓練效果xi的評估結果ui作為輸出單元,則存在規范化矩陣R至評估結果間的非線性映射,用F表示,其公式如下:

選取運動員訓練效果樣本xi=(ri1,ri2,…,rim)作為支持向量機的輸入向量,選取訓練效果樣本評估值作為支持向量機的回歸目標值[14],建立學習樣本集,用表示,獲取回歸函數如下:

式中,xk與s分別表示支持向量以及支持向量數量,αk表示拉格朗日乘子,xk=(rk1,rk2,…,rkm),k=1,2,…,s。
通過以上過程實現運動員訓練樣本xi在測量生理指標yj下的指標測量值向量(ri1,ri2,…,rim)以及訓練效果評估值ui之間的非線性映射F。
采用機器學習算法中的支持向量機方法評估運動員訓練效果結構圖如圖1 所示。

圖1 運動員訓練效果評估結構圖
運動員訓練效果評估過程如下:
1)依據影響運動員訓練效果的生理指標確定運動員訓練效果評估指標矩陣A;
2)將評估運動員訓練效果的指標矩陣A轉換至規范化矩陣R;
3)利用運動員訓練效果樣本xi=(ri1,ri2,…,rim)以及評估值ui建立學習樣本集G={(xi,ui)},從學習樣本集內隨機選取樣本建立可供支持向量機學習的訓練集以及驗證集[15]。
4)選取徑向基核函數作為支持向量機核函數,獲取回歸函數式。設置運動員訓練效果評估選取參數判斷準則,如下:

式中,MAE與MSE分別表示驗證樣本的平均絕對誤差以及均方差,分別表示驗證樣本的專家評估值以及驗證樣本的支持向量機計算值,l表示待評估樣本總數量。
5)獲取理想參數后,結束支持向量機學習過程[16],通過已訓練完成的支持向量機評估運動員訓練效果。輸入待評估運動員訓練效果樣本xi的生理測試指標向量(ri1,ri2,…,rim),即可獲取最終支持向量機的運動員訓練效果評估結果
選取某體育大學運動訓練專業的10 名運動員作為研究對象,令10 名運動員分別進行足球、籃球、排球、游泳、跑步5 項運動訓練,采用文中方法評估10 名運動員的訓練效果,運動員每次運動訓練前后分別采集心率、肺活量兩項指標,針對訓練周期采集清晨靜脈血。實驗共采集實驗樣本10 000 個,其中2 000 個作為學習樣本集,其余8 000 個作為測試樣本集。選取徑向基核函數作為支持向量機核函數,利用winSVM 軟件實現支持向量機求解,該軟件可良好適應Windows 操作系統,快速實現支持向量機分類以及回歸問題。將學習樣本分為10組,每組200個,最終確定支持向量機參數為C=150,σ2=0.016,利用最終確定參數訓練支持向量機,獲取回歸函數式的支持向量數量以及參數b分別為30 以及-0.228。
選取心率、最大攝氧量、血紅蛋白、肌酸激酶、血乳酸作為運動員訓練效果評估的生理測試指標。統計采用文中方法在僅采用心率單項作為生理測試指標、采用心率、最大攝氧量、血紅蛋白3 項作為生理測試指標以及5 項生理測試指標全部使用時,各項運動的運動員訓練效果評估相對誤差,統計結果如圖2 所示。從圖2 實驗結果可以看出,隨著生理測試指標數量的增加,運動員訓練效果評估結果相對誤差有所降低,說明將更多的生理指標加入機器學習算法中可有效提升運動員訓練效果評估的正確率,主要原因是多項生理指標可提升運動員訓練效果評估的多元化效果,對運動員訓練效果評估準確率有所提升。

圖2 不同指標數量時相對誤差
采用文中方法評估10 名運動員5 項運動訓練效果輸出結果如圖3 所示。

圖3 運動員訓練效果評估結果
依據圖3 運動員訓練效果評估結果,選取專家評估值作為運動員訓練效果評估精準性判斷指標,統計文中方法在運動員進行足球、籃球、排球、游泳以及射箭5 項運動項目中的訓練效果評估性能。為直觀展示文中方法評估性能,選取體能方法[6]以及專項運動能力方法[7]作為對比方法,不同方法評估運動員5 項運動訓練效果相對誤差對比結果如圖4所示。從圖4 對比結果可以看出,選取專家評估值作為評估性能判斷依據時,文中方法評估運動員各項運動訓練效果的相對誤差均為1%以下;體能方法以及專項運動能力方法評估運動員各項運動訓練效果相對誤差均為1%以上。對比結果說明,文中方法具有較高的運動員訓練效果評估性能,分析文中方法評估結果有助于教練員針對運動員訓練效果制定訓練計劃,該方法可應用于運動員訓練效果實際評估中。

圖4 不同運動項目評估相對誤差
運動員訓練效果決定了運動員最終競技成績,運動員競技成績受訓練手段、自身素質等因素的影響,運動員成績波動范圍較大。利用運動員生理指標評估運動員訓練效果,通過機器學習算法中評估性能較高的支持向量機方法實現運動員訓練效果評估,支持向量機具有較高的學習和泛化能力,通過足球等運動項目驗證采用所提方法評估運動員運動效果的有效性,對提升運動員訓練效果具有較高的指導意義。