【摘要】本文以重慶市某理工高校的某專業的學生畢業情況為例,根據成績將學生進行相應的分類,尋找每一類學生的學習成績的特征.學校可以根據學生的狀況和社會的需求調整課程的設置,構建分層培養的一個動態系統,實現菜單式的培養模式,增加高等教育培養模式中的柔性。文中提出了一種基于多元統計分析的高校學生分層培養模型。根據學生的畢業情況,以在校期間成績為指標,采用層次聚類方法把學生分為三類,得出三個大類學生的成績特征。
【關鍵詞】高校學生成績;層次培養;多元統計方法;聚類
1 問題提出
隨著教育工作,尤其是高等教育倍受廣大民眾、政府機構以及各級媒體的重視,現在很多的高校越來越重視學生成績管理工作。這就要求學校更好的,更全面的了解學生當前的學習情況,還要了解學生將來成績的某些趨勢,以便學校更有效,更合理的對在校學生進行分層培養。本文提出用多元統計的分析方法對已畢業的某屆學生歷年成績和畢業情況的相關數據進行較為全面的分析研究,進行聚類分析將學生分類研究學生成績呈現的特征,深入研究高校學生真實的學習情況,并且通過分析,了解到學生的當前的學習定位和將來的發展傾向。
2 數據收集與處理
2.1數據來源
本文采用的數據來源于重慶某理工類高校數學專業學生本科期間四年的各科成績和畢業設計完成情況,畢業實習表現情況以及就業單位情況。
2.2數據處理
原始數據包括40多個變量(即40多個課程),其中多個變量存在明顯的相關性,還有各變量的權重是不同的。由于這些情況,在根據這些變量進行聚類時可能會使得運算結果失真。所以首先要對數據整理和一些必要的處理。處理如下:
(1)根據課程培養計劃,課程劃分為五大類,分別記為:A專業基礎課,B專業平臺課,C金融方向課,D計算方向課,E公共基礎課。這樣既能夠有效地壓縮指標數量還可以減弱各項變量的共線性。
(2)根據各個變量的不同的權重(即學分),將各科的成績進行權重處理,得到新的成績數據。
3聚類分析過程
3.1聚類軟件、指標、類型的選擇
聚類分析利用的軟件是SPSS統計軟件;分析對象是對學生(即樣本)進行聚類;分析數據是五個指標,分別是專業基礎課,專業平臺課,金融方向課,計算方向課,公共基礎課。利用SPSS層次聚類方法中的Q型聚類對學生進行分類分析,其中將平方歐式距離作為聚類分析的個體距離,平均組間連鎖距離作為類間距離。
3.2聚類結果
通過SPSS軟件,聚類運算得到層次聚類分析中的凝聚狀態表(見表2)。
情況說明:
第一列說明聚類分析過程中第幾步;第二、三列反映在該步分析中其中有哪兩個樣本(這里指學生)或是小類合成一大類;系數則表示距離,可能是樣本間距離,也可能是小類之間的距離;第五、六列則說明參與該步聚類的兩個元素是樣本(即單個學生)還是小類(即已經合為一類的學生組),這里的0和自然數x分別表示樣本和第x步新和成的小類;最后一列反映該次聚類的結果會出現在下面的哪一步。
凝聚狀態表反映的是聚類分析的動態過程,能夠通過表內容了解41個樣本變量(即學生)是如何逐步的成和小類,再有若干小類合成最終的幾個大類;而層次聚類分析中的類成員,則是反映聚類分析最終的結果,根據軟件操作步驟,可以控制最后聚類的個數范圍,本次聚類是將聚類個數控制在3至5個。
Q型聚類分析操作中,在”繪圖”選項欄選定”樹狀圖”,從而還可以得到更加直觀、形象的聚類結果效果圖——樹狀圖(見圖1)。
表1凝聚狀態表
Table1condensed state table
* * * * * * H I E R A R C H I C A LC L U S T E R A N A L Y S I S * * * * * *
Dendrogram using Average Linkage(Between Groups)
Rescaled Distance Cluster Combine
圖1 41個學生層次聚類分析結果
Table 141 students hierarchical cluster analysis results
3.3對聚類結果的分析和解釋
經過聚類分析將該專業學生分了為3至5類,結合他們實際的畢業情況分析聚類的結果:
分析一:以5群列列情況下的聚類結果,此次聚類方法將41個學生分為了五大類如下表(見表2):
表 2 5群列情況下的聚類結果
Table 4 clustering results of 5 series case
類別第一大類第二大類第三大類第四大類第五大類
學生代碼學生1學生2學生3學生26學生11學生18
學生8學生4學生5學生27
學生12學生6學生7學生28
學生13學生10學生9學生29
學生24學生16學生14學生30
學生32學生17學生15學生31
學生36學生22學生19學生34
學生40學生38學生20學生35
學生39學生21學生33
學生23學生37
學生25學生41
計數892211
實際的情況也根據他們的畢業情況劃分了五類,結合原始數據分析,此次聚類結果,盡管也是將畢業生分出了五大類型,不過每一類的組合人數與實際情況有偏差。
分析二:上面對聚類5群列分類情況進行了分析,并將聚類結果數據與實際情況對比,盡管部分體現和反映了實際的畢業情況,但還明顯看到聚類結果具有生偏差性和不準確性。現在再對聚類3群列分類情況進行分析,此次聚類方法將41個學生劃分為了三大類如下表(見表3):
表 3 3群列情況下的聚類結果
Table5 clustering results of 3 series case
類別第一大類第二大類第三大類
學生代碼學生1學生2學生3學生26
學生8學生4學生5學生27
學生11學生6學生7學生28
學生12學生10學生9學生29
學生13學生16學生14學生30
學生18學生17學生15學生31
學生24學生22學生19學生34
學生32學生38學生20學生35
學生36學生39學生21學生33
學生40學生23學生37
學生25學生41
計數10922
從表中看出,第一大類的分類情況與上面5群列聚類結果沒有變動,人數一致,類成員有差異。將該類成員代碼結合原始數據,可以看出該類基本上都是讀研的學生,可以定義第二大類為讀研學生群組。第二大類成員中大部分是個體或是待業肄業情況,通過原始數據觀察,該類學生的成績相對不好;從整體上分析此次聚類結果,基本上把讀研學生,企業工作學生和個體創業肄業的學生劃分為了三大類。
聚類并不是最后的目的,聚類是為了更好的了解每一類學生的成績情況,所以下面要對每一類的數據進行描述分析。
分析一:對第一大類學生(即讀研學生)的成績描述分析,可以在表中(見表4)看出,專業基礎課和公共基礎課明顯優異于其他學生;其中專業基礎課是在所有課程中成績最好的;而平臺課和兩門方向課相對于其他大類沒有明顯的優勢,甚至低于第三大類的學生。
表4第一大類成績描述表
Table 4performance description table of the first class
描述統計量
N極小值極大值均值標準差
專業基礎課790.0096.0093.14292.11570
專業平臺課779.0082.0080.4286.97590
金融方向課773.0076.0074.5714.97590
計算方向課772.0074.0073.2857.75593
公共基礎課789.0092.0090.4286.97590
有效的 N(列表狀態)7
分析二:對第二大類(即待業或肄業的學生)進行成績描述分析,如下表(見表5),可以觀察到,就情況相對較差的學生各科的成績都不是很好,各科的成績均值都在70分以下;其中平臺課和計算方向課的平均分數甚至低于60分的及格標準。
表5 第二大類成績描述表
Table7performance description table of the second class
描述統計量
N極小值極大值均值標準差
專業基礎課964.0070.0067.66671.93649
專業平臺課955.0061.0058.33332.34521
金融方向課960.0067.0063.88892.66667
計算方向課958.0061.0059.77781.20185
公共基礎課960.0064.0061.88891.45297
有效的 N(列表狀態)9
分析三:對第三大類的成績進行描述分析,明顯看出該類學生的各科成績都處在中等水平(見表6)。除此之外,實際中進入央企或大型國企的學生的成績并沒有表現出成績優勢,說明影響因素還存在很多,比如個人的交際能力實踐能力等成績之外的影響因素。
表6 第三大類成績描述表
Table 8performance description table of the third class
描述統計量
N極小值極大值均值標準差
專業基礎課2378.0085.0081.30432.22455
專業平臺課2374.0080.0077.60871.72519
金融方向課2369.0077.0072.34782.63902
計算方向課2370.0076.0073.39131.97114
公共基礎課2378.0083.0080.52171.44189
有效的 N(列表狀態)23
4小結
將學生的成績數據作為聚類指標變量,利用相應的統計軟件對學生聚類分析,然后將聚類結果與實際畢業情況對比,本次聚類結果基本與實際相符。利用聚類的辦法,高校可以根據學生在校期間各科目成績呈現的特點,參照對聚類結果產生各類的成績的描述分析,對每一個學生進行判別歸類。這樣可以為學校定向培養方案的制定提供較科學的依據;同時也可以為學生學習計劃的制定提供參考;此外,還可以根據第二大類呈現的數據特征劃出“就業困難預警線”,這樣可以給予成績處在第二大類或可能要滑進第二大類學生及時的警示,從而達到趨利避害的效果。
參考文獻:
[1]鄧秀勤.聚類分析在股票市場板塊分析中的應用[J].數理統計與管理,1999.
[2]何曉群.多元統計分析[M].北京:中國人民大學出版社,2004.
[3]周興華.基于主成分分析的中原城市群城市發展水平研究[J].重慶科技學院學報:社會科學版,2012(5).
[4]柯冰,錢省三.聚類分析和因子分析在股票研究中的應用[J].上海理工大學學報,2004.
[5]向東進.實用多元統計分析[M].北京:中國地質大學出版.2005.
[6]章文波,陳紅艷.實用數據統計分析及SPSS 12.0應用[M].北京:人民郵電出版社,2006.
[7]余建英,何旭宏.數據統計分析與SPSS應用[M].北京:人民郵電出版社,2003,4.