張曉丹,楊倩倩
(1. 天津體育學院體質檢測中心 天津 300381;2. 天津體育學院研究生部 天津 300381)
基于聚類分析的天津市大學生體質健康評價分級模型研究
張曉丹1,楊倩倩2
(1. 天津體育學院體質檢測中心 天津 300381;2. 天津體育學院研究生部 天津 300381)
為完成對大學生體質健康狀況快速有效的評價,運用聚類分析構建原始數據的分級模型。按照國家規定標準對天津 49所大學的全日制大一、大二在校大學生進行體質健康測試,結果顯示,采用聚類分析構建的分級模型對大學生體質健康進行評價可以提高評價效率和精確程度,說明運用本模型可對學生個體或群體進行綜合評價,實現對學生體質健康類別的科學快速分類。
聚類分析 體質健康 大學生 分級模型
開展學生個體或群體體質健康分級綜合評價,對于了解大學生體質健康狀況有著重要意義。大學生體質健康綜合評價分級模型的構建,旨在研究一種具有定性、定量功能的大學生體質健康狀況的評價方法,對大學生體質健康狀況數據進行處理,免去查找各指標得分并進行權重計算[1]的繁雜過程。該模型能夠克服人為評價的局限性,完成大學生體質發展趨勢的定量分析,為制定大學生運動處方、促進大學生自我評價、加強大學生體育鍛煉和促進學校體育教學改革奠定基礎。
以參加 2013年全國學生體質健康測試的天津49所大學的大一、大二全日制在校大學生為研究對象,采取整群抽樣方法,從身體健康、無重大疾病的在校本、專科學生中抽取1,965人。剔除無效數據(測試項目不全的、離散程度超過 3,S),其中有效數據為1,833人。
對所選取的大學生分別進行了身高、體重、肺活量、1,000,m(女生為 800,m)、引體向上(女生為 1,min仰臥起坐)、坐位體前屈、立定跳遠、50,m等8個項目的測試。[2]所有學生體質測試數據由 Microsoft Excel儲存,進行異常數據(測試項目不全的、離散程度超過3,S)篩選以后,建立數據庫。利用SPSS 17.0數據統計軟件對篩選后的有效數據進行處理,運用聚類分析對原始數據進行分類,并運用判別分析法建立判別函數,最后計算判別方程的回代符合率。
在構建分級模型的過程中,考慮到大學男生與大學女生體質健康評分標準不同,故將男生女生區別開來,分別建立相應的判別模型。
2.1 聚類分析
聚類分析[3]是直接比較各事物之間的性質,將性質相近的歸為一類,將性質差別較大的歸入不同的類。由于樣本數量較多,我們采用 K-Means Cluster聚類分析對樣本進行分類。本研究欲將天津市大學生體質分為4個級別,通過聚類分析確定天津市大學生體質的4個起止區間。其結果如表1、2所示。

表1 男生聚類分析結果Tab.1 Clustering analysis result of male students

表2 女生聚類分析結果Tab.2 Clustering analysis result of female students
2.2 Fisher線性判別函數的建立
在對原始數據進行處理的基礎上,進行判別分析[4]的操作,可以得到標準化正規判別函數系數(見表 3、4),包括各獨立變量對應的 4個判別函數的標準化的系數值。
根據表3的Fisher線性判別函數系數表,可以得到判定男大學生體質優秀、良好、及格與不及格的 4個線性判別函數:


注:上述公式中的 X1~X8分別代表身高、體重、肺活量、1,000,m、引體向上、坐位體前屈、立定跳遠、50,m等8項指標。

表3 男生Fisher線性判別系數表Tab.3 Fisher linear discriminant analysis coefficients of male students

表4 女生Fisher線性判別系數表Tab.4 Fisher linear discriminant analysis coefficients of female students
同理,根據表4的Fisher線性判別函數系數表,可以得到判定女大學生體質優秀、良好、及格與不及格的4個線性判別函數:


注:上述公式中的 X1~X8分別代表身高、體重、肺活量、800,m、仰臥起坐、坐位體前屈、立定跳遠、50,m等8項指標。
2.3 判別函數的應用
隨機選取任意男生樣本,將其身高、體重、1,000,m 跑、引體向上、坐位體前屈等 6項指標分別代入上述男生的 4個判別函數中,同理,隨機選取任意女生樣本,將其身高、體重、800,m 跑、1,min仰臥起坐、立定跳遠等6項指標分別代入上述女生的4個判別函數中,可以得到相應的判別得分 F值,然后再根據判別規則,將所得的4個F值進行比較,哪個最大,就將其歸入哪類。
2.4 判別效果評估和檢驗
構建了判別模型后,用所建立的判別函數對已知類別的樣品進行判別,計算判對率和判錯率,可用來描述判別函數的判別效果。把原始數值帶入到模型中可以看到男生體質總體的判對率為 97.5%,錯判率為 2.5%;女生體質總體的判對率為 98.2%,錯判率為1.8%。同樣,模型的總判對率為 97.85%,總錯判率為2.25%。由此可見,所構建的判別函數的判別效果是很顯著的。
我們亦選取了未參與建模的15名男大學和16名女大學生,利用已經構建成的分級模型,對其進行體質判定。總判對率為 92.40%,總判錯率為 7.60%。據此,我們認為判別函數整體擬合較好,各類分級較為顯著。
在男生人數為927個的總體樣本中,第一類別即體質優秀者為110人,所占比重為11.87%;第二類別即體質良好者為273人,所占比重為29.45%;第三類別即體質及格者為412人,所占比重為44.44%;第四類別即體質不及格者為132人,所占比重為14.24%。顯然,體質及格者所占比重最大,體質優秀者與體質良好者比重之和比體質及格者略少一些為 41.32%,體質不及格者比重也較高。
而在女生人數為906的總體樣本中,第一類別即體質優秀者為108人,所占比重為11.92%;第二類別即體質良好者為233人,所占比重為25.72%;第三類別即體質及格者為350人,所占比重為38.63%;第四類別即體質不及格者為 215,所占比重為 23.73%。可見,體質及格者所占比重最大,體質優秀者與體質良好者比重之和居于其次,體質不及格者比重明顯高于男生。
在天津在校大學生體質監測人數為 1,833的總體樣本中,體質優秀者所占比重為 11.89%,體質良好者所占比重為 27.61%,體質及格者所占比重為41.57%,體質不及格者所占比重為18.93%。
由以上的數據分析結果可知,學生體質大部分集中在及格等級,優秀與良好者所占比例也較大,而不及格等級所占比例相對偏小。這說明,天津市在校大學生男女生的體質狀況總體上尚佳。并且,在優秀與良好兩個等級中,女生所占比例和男生所占比例近似;在不及格等級中,女生所占比例高于男生。這說明男生體質要優于女生。
本文選用聚類分析中的 K-Means Cluster聚類法,用“評價模型”對學生個體進行定量評價具有較高的靈敏性,其設計思想與大學生體質健康水平分布的實際情況相符合。運用本模型可對學生個體或群體進行綜合評價,實現對學生體質類別的科學快速分類。與《國家學生體質健康標準》的綜合評價方法相比,它減少了程序,只需要進行一次數學運算,便能得出學生個體或群體的體質健康等級,[5]免去了查找各指標得分并要進行權重計算的繁雜過程。同時,這種方法能夠充分考慮到人在評估過程中的主觀能動作用。
[1]《國家學生體質健康標準解讀》編委會. 國家學生體質健康標準解讀[M]. 北京:人民教育出版社,2007.
[2]Joanne E. Arsenault,Mercedes Mora-Plazas,Yibby Forero,et al. Micronutrient and anthropometric status indicators are associated with physical fitness in Colombian schoolchildren[J]. British Journal of Nutrition,2011(105):1832-1842.
[3]侯彩虹. 基于模糊聚類分析的織物質量分級方法[J].東華大學學報,2005(2):54- 58.
[4]李衛東. 應用多元統計分析[M]. 北京:北京大學出版社,2008:155-176.
[5]Jerrold S. Greenberg,George B. Dintiman,Barbee Myers Oakes. Physical Fitness and Wellness:Changing the Way You Look,Feel and Perform[M]. Champaign:Human Kinetics Publishers,2004.
Study on an Evaluation Classification Model of Physical Health of University Students in Tianjin based on Clustering Analysis
ZHANG Xiaodan1,YANG Qianqian2
(1. Tianjin Municipality Physical Fitness Surveillance Center,Tianjin University of Sport,Tianjin 300381,China;2. School of Graduate,Tianjin University of Sport,Tianjin 300381,China)
In order to realize fast and effective evaluation on physical health of university students in Tianjin,a physical health test for freshmen and sophomores from 49 universities and colleges in Tianjin,which was in accordance with the physical health of national standard,was carried out. The result showed that,the adoption of constructed clustering model improved the efficiency and accuracy of the evaluation on university students’ physical health. It was concluded that it was feasible to classify physical health of university students through application of this classification model,which can evaluate physical health of either individuals or groups.
cluster analysis;physical health;college students;hierarchical model
R851.3
A
1006-8945(2014)08-0076-04
天津市科委科普項目(13KPXM01SY004)。
2014-07-06