陳向陽 胡曉倩 吳永祥 畢淑峰 董麗麗 陳艷榮



摘要 以生物技術專業59名學生13門課程的原始成績作為數據樣本,應用DPS數據處理軟件進行主成分分析,并對學生的成績進行綜合評價,認為生物化學、細胞生物學、分子生物學、酶工程、細胞工程等課程成績最能代表該專業學生的綜合學習效果,同時給出了學生綜合得分排名的方法。
關鍵詞 主成分分析;生物技術;專業核心課程
中圖分類號 S-01 文獻標識碼 A
文章編號 0517-6611(2020)16-0262-03
doi:10.3969/j.issn.0517-6611.2020.16.075
Application of Principal Component Analysis in the Grade Evaluation of Core Courses of Biotechnology Specialty
CHEN Xiang-yang,HU Xiao-qian, WU Yong-xiang et al (College of Life and Environment Sciences,Huangshan University,Huangshan,Anhui? 245041)
Abstract With original scores of 13 courses of 59 students in biotechnology specialty as data sample, the principal component analysis method was used to conduct a comprehensive evaluation of student performance by using DPS statistic software. The results showed the most representative courses of the students comprehensive learning effect were biochemistry, cell biology, molecular biology, enzyme engineering, and cell engineering,and? the ranking method of students comprehensive score was given.
Key words Principal component analysis;Biotechnology;Core courses of specialty
基金項目 安徽省省級重大教學研究項目(2016jyxm0981);安徽省省級教學研究項目 (2018jyxm1246);黃山學院校級教學研究項目(2013JXYJ21)。
作者簡介 陳向陽(1970—),男,安徽祁門人,副教授,碩士,從事酶工程教學和生物技術專業實踐方面的研究。*通信作者,教授,碩士,從事生物化學教學和生物技術專業改革建設研究。
收稿日期 2019-12-31
我國高等教育隨著國家經濟的快速發展也日新月異,學生成績的評定對于高校的班級管理來說至關重要,多數高校采用求總和或加權求平均值的方法,然而通過此方法不能了解學生各門課程之間的優勢與劣勢??陀^、公正、有效地評估學生的狀況也是一件很難的事,近幾年很多學者在這方面做了大量研究,主要集中體現在基于多元統計分析和正態分析的評價體系構建,尤以多元統計分析中的主成分分析的評價居多,并且也在不斷改進。學生在大學四年學習的課程一般至少60門以上,然而現在很多高校對學生課程考試成績的綜合評價主要通過期末考試結束以后分課程進行,從而獲得自己想要的結果,以便為未來教學質量的提高提出改進和創新,然而通過以往的教學經驗可以發現這種分課程進行成績的統計分析,造成不同課程成績之間的相關性容易被忽視。為了能更好地對學生成績進行綜合評價,筆者以黃山學院2015級生物技術專業59名學生在大學四年期間所學的13門核心主干課程的考試成績為原始樣本數據,運用DPS統計軟件,采用主成分分析法分析13門課程之間的相關性,從而得出一些具有啟發性的結論,探討學生成績背后掩藏的內在教學規律,為生物技術專業學生的綜合成績評價體系的構建以及教育教學改革提供參考和科學依據[1-4]。
1 主成分分析法
1.1 主成分分析法的定義
主成分分析是一種降維的多元統計方法,將多個具有某種關聯性的指標進行重新組合成一組新的相互之間不相關的綜合指標替代原來的指標[5],也就是研究如何通過少數幾個主成分來揭示多個變量間的內部結構,使它們盡可能多地保留原始變量的信息,且彼此間互不相關[1,6]。
1.2 主成分分析法的具體步驟[6-7] ①建立觀測數據矩陣,對原始數據進行標準化處理;②建立相關系數矩陣并計算各主成分的特征值λ與對應的特征向量;③依據特征值和累積貢獻率,確定所需主成分的個數;④計算主成分得分,并依據主成分得分對學生的綜合成績進行排序。
2 專業核心課程成績分析
以黃山學院生物技術專業2015級學生在校大學四年的專業核心課程成績為例,運用主成分分析法對學生的總體學習情況進行評估。該班共有59名學生按時畢業,將他們的課程成績作為總體,即研究對象。該專業共開設了60多門課程,從生物技術專業視角進行初步遴選,確定以13門專業核心課程成績作為統計分析變量。比如大學英語(X1)、大學物理(X2??? )、高等數學(X3)可視為公共必修課的代表,有機化學(X4)、生物化學(X5)、微生物學(X6)、細胞生物學(X7)、分子生物學(X8)可作為專業基礎課的代表,酶工程(X9)、發酵工程(X10)、細胞工程(X11)、基因工程 (X12)、生物技術創新創業(X13)可作為專業課方面的代表,如此可得到一個59×13的原始各科成績的樣本數據矩陣,運用DPS統計軟件進行主成分分析,得到專業核心課程間的線性相關系數矩陣(表1),各主成分的特征值、方差貢獻率和累計貢獻率見表2,前5個主成分分別對應的特征向量見表3。
由表1可知,被統計的13門專業核心課程成績間的相關系數只有大學英語(X1)和高等數學(X3)之間表現為負相關,但負相關不顯著,這也說明了大學英語和高等數學之間不具有相互依賴性,其余各門課程之間的相關系數為正值,即正相關,且它們之間的相關性大多達到極顯著水平(P=0.01時,r=0.332 8),這表明這些課程成績間具有很強的可比性,也就是說某
門課程成績的高低可通過其他課程的成績來大
致推測,如果某一門課程的成績較低,與其相關性高的課程的成績一般也較低,反之亦如此。以分子生物學(X8)和發酵工程(X10)為例,二者之間的相關系數達到最高(0.829),這表明分子生物學掌握較好的同學其發酵工程掌握得也較好。此外,從生物技術專業的視角來看,開設的專業核心課程對化學的依賴性較重,而有機化學(X4)和生物化學(X5)與絕大多數專業核心課程的相關系數都在0.500以上,相關性均達到極顯著水平,這有力驗證了在大學低年級時學好這2門課程對生物技術專業本科生后期專業課程的學習以及專業綜合素質的提高具有重要的影響。專業基礎課和專業課之間的相關系數均在0.350以上,再一次驗證學生總體上對專業基礎課和專業課學習的重視程度較高。生物技術創新創業(X13)與3門公共必修課成績的相關系數較小,相關性均不顯著,然而這3門公共必修課對學生的進一步深造和未來工作深入有著重要的作用,這就要求教師在合理引導學生轉變觀念、改進學習方法等方面還有待提高。
表2是運用DPS數據處理軟件由13門課程間的線性相關系數矩陣計算出的各主成分的特征值、方差貢獻率和累積貢獻率。由表2可知,第一主成分的方差貢獻率高達58.259%,即原指標53.410%的信息量可由第一主成分進行反映,它承載了學生成績的主要綜合信息[6]。若按照85%的判斷標準,表中給出的前5個主成分的累積方差貢獻率高達85.479%,即前5個主成分就能很好地反映樣本數據所包含信息量的85.479%,從而實現了高維分析轉為低維數據分析,大大簡化了數據結構。
表3給出了前5個主成分的特征向量。第一主成分對應的特征向量均為正值,數值上也相差較小,即第一主成分可以代表學生的總體學習水平,即可用第一主成分來評價學生的綜合學習能力與成績。第一主成分在生物化學、細胞生物學、分子生物學、酶工程、細胞工程等課程上的特征向量分量值較大,對第一主成分有較大的權重貢獻,即承載的信息量較大,也可認為這5門課程能反映學生綜合學習成績的好壞程度,因此在大二和大三這5門課學得好壞直接影響學生的專業綜合素質。剩下的4個主成分對學生的綜合成績評價的方差貢獻率較小,且特征向量在各門課程上也有正有負,對于評價學生的綜合學習成績容易產生偏差,也可只用第一主成分對學生綜合成績進行分析。
第一主成分的得分可依據表3由以下公式計算(其他主成分得分計算以此類推):
y1=0.133x1+0.190x2+0.175x3+0.275x4+0.318x5+0.307x6+0.319x7+0.330x8+0.327x9+0.300x10+0.312x11+0.289x12+0.236x13
學生大學四年學習綜合成績的優劣程度可通過主成分綜合得分來體現,其計算公式如下[4]:
Y=7.574y1+1.349y2+0.878y3+0.753y4+0.559y5
將每位學生的課程成績標準化后的數據代入y1、y2、y3、y4、y5和Y的計算公式中,從而得出每一位學生在各個主成分因子上的得分、綜合得分。將59位學生的主成分因子得分、綜合得分、平均分排名進行對比,結果見表4。由表4可知,第一主成分得分排名、5個主成分的綜合得分排名以及平均分排名都十分接近,這是因為在整個因子貢獻率上y1因子占絕大部分比重。只有個別學生(學號1)在第一主成分的排名與綜合得分排名、平均分排名符合度較小,主要原因是該學生在公共必修課大學物理上的得分稍低,但這位學生在第五主成分上的得分較高,即在生物技術創新創業這門課程具有明顯的優勢,以后在就業方面可以往創業方向考慮。顯然,即使是第一主成分給出的信息,也能夠全面反映原始數據的主要信息,同時可滿足分析評價學生的綜合學習能力。主成分分析結果提供的信息量比各課程單獨分析更加豐富,也對學生的綜合評價更具科學性和客觀性[8]。
3 結論與建議
通過數據分析的方法將相關性和主成分分析的多元統計思想應用到學生成績評價中,從學生課程成績原始樣本數據出發,從枯燥的課程成績中挖掘出多條有價值的信息,從而發現核心主干課程之間的關聯性,生物化學、細胞生物學、分子生物學、酶工程、細胞工程等課程對于生物技術專業學生的重要性。對學生成績進行綜合評價,不再以課程平均成績的表面呈現作為衡量學生專業學習好壞程度的依據,而是依據學生在5個主成分方面得分、綜合得分的排名進行綜合權衡,客觀地了解學生對各個核心主干課程的知識掌握情況,因材施教[9-10],可為今后的生物技術專業教育教學改革工作提供參考,隨著教學的不斷創新和不斷深入,將會產生良好的效果。
參考文獻
[1]周三玲,童一飛.主成分分析法在工業工程專業學生成績評估中的應用[J].當代教育理論與實踐,2018,10(3):79-84.
[2] 閻利.土木工程專業本科生課程成績多元統計分析[J].高等建筑教育,2010,19(4):118-121.
[3] 陳向陽. 主成分分析法在生物科學專業學生成績評價中的應用[J].黃山學院學報,2013,15(3):127-131.
[4] 陳忠維,惠淑榮,董建國.主成分分析法在專業基礎課成績分析中的應用[J].高等農業教育,2011(6):42-44,50.
[5] 李婷.河北省太陽能發電企業科技創新實力評價[J].經濟研究導刊,2019(3):6-7.
[6] 唐啟義,馮明光.實用統計分析及其DPS數據處理系統[M].北京:科學出版社,2009:761-771.
[7] 楊園.基于多元統計分析的學生綜合素質評價[D].北京:清華大學,2013.
[8] 李暢.基于主成分分析法的學生成績綜合評價[J].現代經濟信息,2013(14):408-410.
[9] 唐江花.主成分分析在高校學生成績評價中的應用:以安徽新華學院為例[J].桂林航天工業學院學報,2018,23(4):495-498.
[10] 孫果,馬艷英.主成分分析在大學生成績中的研究與應用[J].吉林工程技術師范學院學報,2017,33(6):96-98.