華冬芳,武 斌
(無錫科技職業學院,江蘇 無錫 214028)
基于主成分分析的高校學生體質狀況研究
華冬芳,武 斌
(無錫科技職業學院,江蘇 無錫 214028)
論文依托無錫科技職業學院2010級、2011級高職學生的體質測試數據,運用主成分分析法,得出學生體質的主要影響因素及影響程度,尋求學生體質差異的主要原因,為高校有效地指導大學生鍛煉身體提供堅實基礎。
主成因分析;大學生;體質
2010年國民體質監測公報結果表明,我國國民體質的總體合格率呈現持續上升的態勢,中小學生的身體素質也有效改善,但我國大學生的身體素質仍在繼續緩慢下降。有專家表明,一方面與他們在高中期間忽視體育鍛煉或體育鍛煉不做有著直接關系,高考的壓力直接影響了學生必需要進行的體育鍛煉,導致學生素質的下降;另一方面,大學生對體育鍛煉的意義、方式方法認識不足,加上現在很多大學體育教育都采取體育俱樂部形式,缺乏科學的體育指導和運動知識的普及,從而導致大學生的身體素質得不到全面、均衡、有效的鍛煉和提高。在此背景下,了解高校學生的體質狀況,有的放矢地指導他們進行科學有效的體育鍛煉,是當前高校體育工作刻不容緩的一部分。
在高校學生的體質綜合評價中,評價指標的選擇以及權重的確定往往帶有較強的主觀意愿。在加權法中,各評價指標的客觀性較差;專家咨詢法得到的權重因子也具有不確定性和模糊性;層次分析法雖然采用較為精確的數學方法來計算權重,但判斷各因素的定性成分居多,主觀因素仍較大。但各指標的權重對學生體質評價的影響卻很大,論文試圖采用主成分分析法,將多個指標整合成少數幾個綜合指標,但保持原有指標所涵蓋的信息量來分析得出影響學生體質的主要影響因素及其影響程度,科學有效地指導大學生進行身體鍛煉。
1.指標說明
論文選取的指標變量主要依據是《大學生體質健康標準》中重要的體質考核測試項目:身高(x1)、體重(x2)、肺活量(x3)、耐力類項目(x4)、柔韌、力量類(x5)、速度、靈巧類(x6)六個變量。
2.分析方法
主成分分析(principal component analysis,簡稱PCA)是由霍特林(Hotelling)于1933年首先提出的。它是一種通過數據降維技術把多個變量化為少數幾個主成分的統計分析方法。
由于許多變量之間往往存在著一定程度的相關性,導致增加問題分析的復雜性,而盲目地減少變量則會損失很多信息,人們自然就希望通過線性組合的方式,在損失較少數據信息的基礎上把多個指標轉化為幾個有代表意義的綜合指標,而這些綜合指標之間彼此不相關、信息不重疊,這就是主成分分析的思想,通過主成分既可以降低數據“維數”,又保留了原數據的大部分信息。
3.數據說明
論文所用數據樣本為無錫科技職業學院2010級和2011級學生(合計4858人)的體質健康測試數據,測試時間為2011年11月。
1.適應性檢驗及主成分選取
首先對樣本數據進行主成分分析適合性檢驗,運用SPSS17.0軟件進行巴特利(Bartlett)球形檢驗統計量的觀察值為11604.3,相應的概率P值接近0,在a=0.01水平上顯著。同時,KMO檢驗系數為0.809,根據Kaiser給出的KM0度量標準大于0.5可知,樣本數據很適合進行主成分分析。
將前述數據代入SPSS17.0進行標準化處理,得出相關系數矩陣,求解相關矩陣的特征值,并根據累計貢獻率在一個較好的百分比(80%-90%)標準內,從六個變量中提取四個主成分因子,進行主成分分析。
從表1中可以看到,四個主成分因子的累計貢獻率達到了89.658%,表明了這四個主成分因子包括了6個變量的大部分信息總量,很好地概括了原始變量,即這4個主成分顯著地反映了該校大學生體質健康狀況。(見表1)
2.主成分因子旋轉及解釋
為了使每個主成分因子在不同原始變量上的載荷有明顯的差別,借助旋轉技術,旋轉調整初始因子載荷矩陣,將同一因子較高載荷的評價指標排列在一起,得到旋轉后的因子矩陣,更便于解釋因子,如表2所示。
(1)主成分1(以F1表示)在身高(x1)、肺活量(x3)、速度、靈巧類項目(x6)三個方面皆有很高的載荷系數,反映的是大學生身體的基本成長發育狀況,稱第一主成分為“成長因子”。
(2)主成分2(以F2表示)在體重(x2)方面有很高的載荷系數,在身高(x1)方面也有中等程度的載荷系數,第二主成分反映的是大學生的“胖瘦狀況”,可稱為“胖瘦因子”。
(3)主成分3(以F3表示)在柔韌、力量類項目(x5)方面有很高的載荷系數,它反映的是大學生的“柔韌性狀況”,稱為“柔韌性因子”。
(4)主成分4(以F4表示)在耐力類項目(x4)方面有很高的載荷系數,而在其余變量上的載荷都很小,它反映的是學生的耐力狀況,可以稱為“耐力因子”。
3.評價結果
為了計算主成分因子的得分,利用回歸法將主成分對指標變量做線性回歸,得到系數的最小二乘估計,即成分得分系數。根據成分得分系數,可以得到主成分F1、F2、F3、F4的得分模型。
F1=0.522x1-0.393x2+0.443x3-0.109x4-0.413x5+0.644x6
F2=0.179x1+0.969x2+0.024x3+0.079x4+0.027x5-0.482x6
F3=-0.457x1+0.064x2-0.143x3-0.017x4+1.152x5+0.051x6
F4=-0.002x1+0.048x2-0.037x3+1.014x4-0.009x5-0.067x6
同時,以旋轉后累計方差貢獻表中的各成分對應方差貢獻率作為各主成分的權重,構造出如下大學生體質狀況得分模型:
F=32.259%F1+21.892%F2+18.686%F3+16.82%F4
然后,我們可以根據F的值大小對學生的整體體能進行排序,并指導學生進行針對性的體育鍛煉。
1.主成分分析法運用于高校學生體質狀況分析,可以有效地規避在體質狀況研究中各測量指標權重設置的主觀因素的影響,再通過選取主成分因子,計算出各成分的貢獻率,從而科學地分配各成分因子的權重。
2.在大學生體質健康測試項目數據的四個主成分中,依貢獻率大小排序,分別為成長因子(身高、肺活量、速度靈巧類項目)、胖瘦因子(身高、體重)、柔韌性因子(柔韌、力量類項目)和耐力因子(耐力類項目),所以我們在評價體系中應注意考慮和調整相應的權重。
3.根據主成分綜合得分值,我們不僅可以對學生體質總體水平的優劣進行排序,并能較為準確地分析出每一個學生體質上的特點與不足,從而達到按個體差異性開具運動健身處方的目的,科學地指導學生進行體育鍛煉。
[1]王曉芬.體育統計與SPSS[M].北京:人民體育出版社,2001.
[2]何曉群.多元統計分析[M].北京:中國人民大學出版社,2004.
[3]朱建平.應用多元統計分析[M].北京:科學出版社,2006.
[4]袁運平.我國男子百米跑一級運動員體能水平的評價與診斷[J].北京體育大學學報,2002,(4):547-549.
[5]譚玉霞,蔡瑞廣,董新陽,崔伍增.應用灰色理論對大學生體質因素結構的初步研究 [J].河北體育學院學報,2002,(2).
[6]董艷國,黃愛武,白海軍,自明.基于多元統計分析方法對大學生身體素質的動態分析[J].首都師范大學學報(自然科學版),2007,(6).
[7]譚磊.湖南理工學院大學生體質健康的測試分析與對策[J].湖南理工學院學報(自然科學版),2009,(1).
[8]張亞平,芮飛龍,郭衛.主成分分析法在西北五所高校學生體質測試中的應用[J].甘肅聯合大學學報(自然科學版),2010,(4).
[9]李進華,繆仕暉.大學生體質與健康標準測試數據結果分析[J].寧德師范學院學報(自然科學版),2011,(3).

表1 變量的累計方差貢獻率

表2 旋轉后的因子載荷矩陣
G64
A
1673-0046(2012)6-0160-02
江蘇省2010年高等學校大學生實踐創新訓練項目:《高校學生體質狀況調研及有效改善過程的數理建模研究》研究成果(張奇、張龍平等負責數據采集等工作)