畢楷明
摘 要:美國大學生體育聯盟中有許多知名教練,選取恰當的標準去全面的評價一個教練是很重要的。文章基于主成分分析法和核主成分分析法建立了一個可以評價多種因素的教練評分方式,利用該評分方式能夠對教練評價得出更精確的結論。
關鍵詞:主成分分析法 核主成分分析法 教練評分
中圖分類號:G647 文獻標識碼:A 文章編號:1674-098X(2014)09(b)-0253-02
1 基礎模型
1.1 基于主成分分析的評價模型
為了能夠更加精確地衡量一個教練的執教經歷、影響力和戰績,需要建立一套科學有效的評價模型和評價方式。筆者首先通過搜集一名教練所獲得的冠軍數,參加四強賽的場次數,四強賽的勝率,總勝率,教齡搜索到的谷歌詞條數以及總勝場數等項目作為教練評價模型的評價因素[1]。
在建立評價因素的基礎上,筆者利用主成分分析的方法來實現評價因素的排序:對每個因素ci按照它們彼此間相關性進行分析,相關性越大說明該因素對于教練評價的影響越大,進而確定系數ai。其中,數據中的因素看作ci。
首先對c1,c2…ci…c7進行標準正交化:
其中
將轉化為
,且xi的平均值為0。
再構建有關的協方差矩陣X
X==
=
利用matlab軟件求出X矩陣的特征值λ以及對應的特征向量ε,對每一個特征值λ進行升序排列,并將每一個特征向量ε與之對應。考慮貢獻率Cr和累計貢獻率Cra:
通常取p,使累積貢獻率Cra達到85%以上,此時的模型是可靠的[2],針對于所列數據的情況可知當p取3時累積貢獻率Cra超過85%。于是主成分為總勝率,四強比賽場數以及勝場數,得出每個教練利用主成分分析的排名。
1.2 核主成分分析評價模型
再考慮過主成分分析方法后,進一步引入其衍生方法核主成分分析。將利用標準正交化轉化為
引入高斯核函數k
δ值由經驗可知取值為2[3],同樣將每一個因素向量的數據帶入計算相關性,可得出高斯核函數矩陣K
K=
再利用matlab軟件求出K矩陣的特征值λ以及對應的特征向量ε,考慮K矩陣的貢獻率Cr和累計貢獻率Cra,同樣取Cra在85%以上的情況,得出基于核主成分分析的教練排名。
主成分分析是一種很好的降維方法,但本質上是利用不同因素之間的線性映射解決問題,如不同因素之間有某種非線性關系時,便不易解釋它們其中的關系。
根據模式識別的理論,低維空間中線性不可分的模式通過非線性映射到高維空間可實現線性可分,主成分分析法會在非線性函數的形式和參數中出現問題,而最大的障礙則是高維特征空間運算時存在的“維數災難”[4],利用核主成分分析技術則能盡可能的避免此類問題。
2 綜合評價模型
2.1 不同年代對模型的影響
對于同一聯賽,不同的賽季對于教練員來說會有不同的難度,教練在一個競爭激烈的賽季取得成功的難度必然大于在一個強弱差距懸殊的賽季。為量化不同年份的競爭性,搜集不同賽季的聯賽平均技術統計,通過核主成分分析方法,得出綜合考慮所有因素在上述不同年份競爭力因子,在基礎模型的基礎上,將時間作為重要的參評依據加入核主成分分析模型中。
可知ky在1989年時取得最大值,觀察數據可知1989年各球隊的平均得分、平均命中數都屬于歷史最高值,說明這一年的比賽競爭激烈,也說明該年教練競爭力強,說明ky與教練的評分呈正相關。為了便于數據處理,需要將ky歸為正數。為此,考慮直線映射,將ky的范圍歸0~1的閉區間內。即將minky通過線性變換取到1;minky通過線性變換取到0,此時經過改進后的年份競爭力因子ky,但由于擴大了ky的取值范圍,增大了了不同ky取值之間的差異度,造成了一種不公平的現象。為解決該問題,引入偏大型柯西隸屬分布函數[5]
根據定義可得:
利用matlab軟件代入求解可以得出解:
又由于ky系數需要作為系數乘在前一個模型中的Skp上
再將年份系數考慮到核主成分分析模型中,由于一個教練不止執教一個賽季,這里考慮的年份系數應對該教練所執教的年份加權取平均值
此種平均值綜合考慮了年份系數的權重影響,減小了極端的年份對數據的影響,更能體現一個教練的真實水平。
2.2 不同性別對模型的影響
按照基礎模型所述的過程,將女子運動教練員的數據進行核主成分分析處理,再調用女子項目的不同賽季的聯賽平均技術統計計算出女子項目每一年的競爭力因子ky,進而計算每個教練的所有執教賽季的加權平均值,得出改進后的教練評分Skp。
考慮到同項目男子項目和女子項目的水平是不同的,間接導致了男子教練和女子教練的執教難度不同,于是引入不同性別的競爭力因子ks。
借助ky指數考慮所有分男女的主要球類項目,將其中的所有性別的項目的再取均值得到ks。
ks(m)=
≈1.4976
同理可得1.4152,將所得的ks(m)、ks(w)分別與對應性別的Skp求積,得到考慮性別的Skp。
2.3 不同體育項目對模型的影響
由于不同項目的各項 技術統計是不同的,通過核主成分分析方法,得出綜合考慮所有因素上述不同年份競爭力因子ky通過BP神經網絡的方法,遍歷各項目歷年的ky,進而歸納出每個項目的總體ky趨勢,分析該趨勢得出不同項目的競爭力因子k8。
通過BP神經網絡自身的提取數據能力,利用Matlab得到并儲存其趨勢
再將從低到高排序,并計算各年度平均競爭力因子的=0.0528,將其帶入進行對比,得出其所在的位置占總體的百分比定義為該項目的競爭系數。endprint
3 模型的改進
通過綜合評價模型,能夠綜合考慮不同年代、性別和運動項目對評價教練的影響,但僅能得到一個改進的Skp值,它只能用于排名,卻不能進一步地分析出每名教練的特性。為了分析每名教練的特性,需要搜集每名教練每年的數據,通過分析找出傳奇教練們的共性與特性。
繪出Skp圖像后,利用擬合的方法,用不同類型的擬合度分別代表職業生涯晚期的教練表現指數;職業生涯中期的教練表現指數;職業生涯早期的教練表現指數;教練表現的波動指數。
先分析每個教練的職業生涯晚期的教練表現指數,當Skp隨年份增加而有較強的遞增趨勢時,稱該教練的職業生涯晚期的教練表現指數較高,以Pat Summitt教練為例。
其中對一次函數斜率a進行t統計量分析。
由于t分布趨近于正態分布,因此取顯著性水平為0.05,近似地有
而=0.999>0.95,符合判定要求。再進行Jarque-Bera檢驗。
由=41.18%≥5%,也符合判定要求,即通過了Jarque-Bera檢驗。從而得出Pat Summitt的Skp是整體遞增的,說明改教練在生涯晚期的戰績比生涯早期的戰績好。
同理將教練的Skp曲線分別與,,進行擬合,用擬合度P對應出其它波動指數。
4 結語
基于核主成分分析模型建立了綜合評價模型,該模型同時考慮了不同年代和不同性別項目對模型的影響。再利用直線映射和柯西隸屬函數,得到了不同年份的競爭力曲線;進而利用均值方法,得到男女項運動的競爭力指數,再根據BP神經網絡求出不同項目的競爭力指數,再將不同的競爭力指數帶入核主成分分析模型,得出改進后的綜合評價模型。分析綜合評價模型篩選后的每一名優秀教練,利用Matlab擬合和參差項檢驗,通過圖像匹配得到每一名教練的戰績平穩性指數、戰績提升指數和教練類型。Matlab實驗分析數據表明,基于核主成分的教練評價模型能夠得到更加精確的傳奇教練評價。
參考文獻
[1] Coach Data source fromhttp://www.ncaa.com,2014-02-07/2014-02-09.
[2] Scholkopf B, Smola A, Muller K B. Nonlinear Component Analysis as a Kernel Eignenvalue Problem [J].Neural Computer,1998(2).
[3] Chen S, Cowan C F N, Grant P M. Orthogonal Least Square Learning Algorithm for Radial Basis Function Networks[J].IEEE Transactions on Neural Networks,1991(3).
[4] Minh Hoai Nguyen.Robust Kernel Principal Component Analysis[D].Carnegie Mellon University,2008.
[5] Wang C H,Wang W Y,Lee T T,et al. Fuzzy B-spline membership function(BMF) and its application in fuzzy-neural contral[J].IEEE Trans on system,Man and Cybernetics,1995,25(5):841-851.endprint
3 模型的改進
通過綜合評價模型,能夠綜合考慮不同年代、性別和運動項目對評價教練的影響,但僅能得到一個改進的Skp值,它只能用于排名,卻不能進一步地分析出每名教練的特性。為了分析每名教練的特性,需要搜集每名教練每年的數據,通過分析找出傳奇教練們的共性與特性。
繪出Skp圖像后,利用擬合的方法,用不同類型的擬合度分別代表職業生涯晚期的教練表現指數;職業生涯中期的教練表現指數;職業生涯早期的教練表現指數;教練表現的波動指數。
先分析每個教練的職業生涯晚期的教練表現指數,當Skp隨年份增加而有較強的遞增趨勢時,稱該教練的職業生涯晚期的教練表現指數較高,以Pat Summitt教練為例。
其中對一次函數斜率a進行t統計量分析。
由于t分布趨近于正態分布,因此取顯著性水平為0.05,近似地有
而=0.999>0.95,符合判定要求。再進行Jarque-Bera檢驗。
由=41.18%≥5%,也符合判定要求,即通過了Jarque-Bera檢驗。從而得出Pat Summitt的Skp是整體遞增的,說明改教練在生涯晚期的戰績比生涯早期的戰績好。
同理將教練的Skp曲線分別與,,進行擬合,用擬合度P對應出其它波動指數。
4 結語
基于核主成分分析模型建立了綜合評價模型,該模型同時考慮了不同年代和不同性別項目對模型的影響。再利用直線映射和柯西隸屬函數,得到了不同年份的競爭力曲線;進而利用均值方法,得到男女項運動的競爭力指數,再根據BP神經網絡求出不同項目的競爭力指數,再將不同的競爭力指數帶入核主成分分析模型,得出改進后的綜合評價模型。分析綜合評價模型篩選后的每一名優秀教練,利用Matlab擬合和參差項檢驗,通過圖像匹配得到每一名教練的戰績平穩性指數、戰績提升指數和教練類型。Matlab實驗分析數據表明,基于核主成分的教練評價模型能夠得到更加精確的傳奇教練評價。
參考文獻
[1] Coach Data source fromhttp://www.ncaa.com,2014-02-07/2014-02-09.
[2] Scholkopf B, Smola A, Muller K B. Nonlinear Component Analysis as a Kernel Eignenvalue Problem [J].Neural Computer,1998(2).
[3] Chen S, Cowan C F N, Grant P M. Orthogonal Least Square Learning Algorithm for Radial Basis Function Networks[J].IEEE Transactions on Neural Networks,1991(3).
[4] Minh Hoai Nguyen.Robust Kernel Principal Component Analysis[D].Carnegie Mellon University,2008.
[5] Wang C H,Wang W Y,Lee T T,et al. Fuzzy B-spline membership function(BMF) and its application in fuzzy-neural contral[J].IEEE Trans on system,Man and Cybernetics,1995,25(5):841-851.endprint
3 模型的改進
通過綜合評價模型,能夠綜合考慮不同年代、性別和運動項目對評價教練的影響,但僅能得到一個改進的Skp值,它只能用于排名,卻不能進一步地分析出每名教練的特性。為了分析每名教練的特性,需要搜集每名教練每年的數據,通過分析找出傳奇教練們的共性與特性。
繪出Skp圖像后,利用擬合的方法,用不同類型的擬合度分別代表職業生涯晚期的教練表現指數;職業生涯中期的教練表現指數;職業生涯早期的教練表現指數;教練表現的波動指數。
先分析每個教練的職業生涯晚期的教練表現指數,當Skp隨年份增加而有較強的遞增趨勢時,稱該教練的職業生涯晚期的教練表現指數較高,以Pat Summitt教練為例。
其中對一次函數斜率a進行t統計量分析。
由于t分布趨近于正態分布,因此取顯著性水平為0.05,近似地有
而=0.999>0.95,符合判定要求。再進行Jarque-Bera檢驗。
由=41.18%≥5%,也符合判定要求,即通過了Jarque-Bera檢驗。從而得出Pat Summitt的Skp是整體遞增的,說明改教練在生涯晚期的戰績比生涯早期的戰績好。
同理將教練的Skp曲線分別與,,進行擬合,用擬合度P對應出其它波動指數。
4 結語
基于核主成分分析模型建立了綜合評價模型,該模型同時考慮了不同年代和不同性別項目對模型的影響。再利用直線映射和柯西隸屬函數,得到了不同年份的競爭力曲線;進而利用均值方法,得到男女項運動的競爭力指數,再根據BP神經網絡求出不同項目的競爭力指數,再將不同的競爭力指數帶入核主成分分析模型,得出改進后的綜合評價模型。分析綜合評價模型篩選后的每一名優秀教練,利用Matlab擬合和參差項檢驗,通過圖像匹配得到每一名教練的戰績平穩性指數、戰績提升指數和教練類型。Matlab實驗分析數據表明,基于核主成分的教練評價模型能夠得到更加精確的傳奇教練評價。
參考文獻
[1] Coach Data source fromhttp://www.ncaa.com,2014-02-07/2014-02-09.
[2] Scholkopf B, Smola A, Muller K B. Nonlinear Component Analysis as a Kernel Eignenvalue Problem [J].Neural Computer,1998(2).
[3] Chen S, Cowan C F N, Grant P M. Orthogonal Least Square Learning Algorithm for Radial Basis Function Networks[J].IEEE Transactions on Neural Networks,1991(3).
[4] Minh Hoai Nguyen.Robust Kernel Principal Component Analysis[D].Carnegie Mellon University,2008.
[5] Wang C H,Wang W Y,Lee T T,et al. Fuzzy B-spline membership function(BMF) and its application in fuzzy-neural contral[J].IEEE Trans on system,Man and Cybernetics,1995,25(5):841-851.endprint