陳宇 潘瑩瑩 王嫻 祖冠群 孫曉松 艾玉波
摘 要:文中利用SPSS軟件對統計專業學生的成績進行聚類分析,將學生分為四類,分析了每類學生的能力傾向,并進行了相應的就業指導。
關鍵字:SPSS;聚類分析;能力傾向;就業指導
注:本文為江蘇省2013年大學生實踐創新項目論文。
1 聚類分析原理
聚類分析是統計學中研究“物以類聚”問題的多元統計分析方法,它能夠將一批樣本(或變量)數據根據其諸多特征,按照在性質上的親疏程度在沒有先驗知識的情況下進行自動分類,產生多個分類結果。類內部個體特征具有相似性,不同類個體特征的差異性較大。
聚類分析中,個體之間的“親疏程度”是極為重要的,它將直接影響最終的聚類結果。對“親疏程度”的測度一般有兩個角度:第一,個體間的相似程度;第二,個體間的差異程度。衡量個體間的相似程度通常可采用簡單相關系數或等級相關系數等。個體間的差異程度通常通過某種距離來測度。
定義個體間距離的方法也有很多,比如:歐氏距離、平方歐氏距離、切比雪夫距離、Block距離、明考斯基距離等。
常見的聚類分析方法有層次聚類和K-Means聚類。
2 數據來源
本文選取了08級統計班31名學生的24門主干課程,分別為:思想道德修養與法律基礎、大學生體育、統計學原理、微積分、政治經濟學、心理健康教育、線性代數、大學英語、應用統計學、國民經濟統計學、線性規劃、普通話口語、統計預測與決策、統計信息管理、管理信息系統、調查數據分析、統計實務、概率論與數理統計、運籌學、抽樣技術、企業經濟統計學、財務管理、SPSS在統計中的應用、消費者行為學。
將這24門課程的成績輸入SPSS19.0軟件對其進行聚類分析。
3 實證檢驗
本文采用層次聚類方法進行聚類分析,那么,在衡量數據間的親疏程度時涉及兩個方面的問題,一是度量個體間的親疏程度,本文采用平方歐氏距離;二是度量個體與小類之間、小類和小類之間的親疏程度,這方面的度量也是通過距離來測度的,并且,這里的距離是在個體間距離的基礎上定義的,常見的距離有最近鄰居距離、最遠鄰居距離、組間平均鏈鎖、組內平均鏈鎖、重心距離和離差平方和法。本文的類間距離采用平均組間鏈鎖距離。
并且,因為數據不存在數量級上的差異,因此無須進行標準化處理。
3.1 聚類分析樹形圖
聚類分析的樹形圖如圖1所示。
從樹形圖可以看出:全班31名同學可以分成四類,周利靜、朱瀟瀟、夏玉濤這三位同學為一類,郭勇一人為一類,夏正娟、楊歡為一類,剩余25位同學為一類。
3.2 各類別能力傾向分析
圖1 生成的聚類分析樹形圖
通過比較各類別的成績,解釋各類別的學生能力傾向特點。
各類別的成績分布如表1所示。(考慮到頁面的限制,表1的課程只列舉了其中的一部分。)
從表1的成績,可以得到如下的分析結果:
第一類:有周利靜、朱瀟瀟、夏玉濤三位同學。這三名學生各科成績都普遍不錯,有多門功課成績都是名列前茅,總平均成績也是全班的前三名。她們是各科普遍優秀的典型代表,因此可以定義她們為“優秀型學生”。
第二類:有陳佩佩等25位同學,是最大的一個類別。從成績看,他們的各科成績比較平均。基本上沒有特別好的也沒有特別差的,都維持在中游的水平,因此可以定義他們為“良好型學生”。
第三類:只有郭勇一位同學。他的成績沒有高分但也沒有不及格的,但是縱向比較可以看出,比如他的《大學英語》課程,考了68分,但是排在班級倒數第二,再比如說,《統計信息管理》課程,考了63分,全班倒數第一。因此,雖然他的總平均分也能達到75分,但他跟第二類的同學們顯然還是有差距的。因此,可以定義他為“合格型學生”。
第四類:有夏正娟和楊歡兩位同學。這兩位同學都存在著課程不及格現象,夏正娟的《應用統計學》和《國民經濟統計學》兩門課程不及格,楊歡《應用統計學》和《統計實務》不及格,且不及格成績很低。他們都屬于統計學方面的應用實務方面掌握得很差。因此可以定義她們為“不及格學生”。
3.3 相應就業指導
對于“優秀型學生”,不論是理論、實踐還是技能操作,她們都能夠勝任。應該努力培養她們成為統計工作崗位的骨干力量。
對于“良好型學生”,他們具備良好的統計知識和技能,只是學得不太精,這部分同學應該根據自身愛好,發揮各自所長,培養成為統計工作崗位的技術能手。
對于“合格型學生”,他的統計專業素養不是很好,但他的統計軟件動手操作能力不錯,建議在統計工作崗位中成長為數據分析軟件能手。但要想走得遠,必須還要進一步地重溫統計專業基礎知識。
對于“不合格學生”,她們的統計應用型課程存在不及格,且其他課程成績一般,因此建議她們可以改選其他方面工作,不要拘泥在統計工作崗位上。
參考文獻
[1]薛薇.基于SPSS的數據分析[M].北京:中國人民大學出版社,2006.
[2]周蕾.聚類分析在學生成績分析中的應用[J].農業網絡信息,2010(5).
[3]林治.聚類分析在學生成績管理中的應用探析[J].福建電腦,2009(12).
[4]王亮紅,宋代清,徐娜.聚類分析在學生成績分析中的應用[J].東北電力大學學報,2009(4).
[5]劉璐,楊景明,趙會仁,李丹丹,田玉民.主成分聚類分析在學生成績綜合評價中的應用[J].遼寧工業大學學報(自然科學版),2012(3).
[6]羅家國,羅浩,仲佳嘉.基于SPSS的學生能力傾向聚類分析研究[J].高等工程教育研究,2012(6).