肖永良 羅永恒 李香寶 劉文彬 賀燦衛
[摘 ? ?要] 全面、客觀、科學地對高校大學生綜合素質進行評價是高校素質教育一個棘手的問題。現在較為常見的評價方案是把評價結果和評價指標視為一個線性的關系,實際上兩者之間是一個非常復雜的非線性關系,把各個評價指標進行加權處理而獲得評價結果的做法明顯與實際不符。針對此問題,文章提出利用機器學習方法構建大學生綜合素質評價模型,通過學習已有知識經驗獲得評價結果和評價指標之間的非線性關系,為科學評價大學生綜合素質提供了新的理論支持。
[關鍵詞] 綜合素質;機器學習;支持向量機;半監督理論
doi : 10 . 3969 / j . issn . 1673 - 0194 . 2020. 23. 089
[中圖分類號] G642.3 ? [文獻標識碼] ?A ? ? ?[文章編號] ?1673 - 0194(2020)23- 0221- 02
0 ? ? ?引 ? ?言
互聯網時代提供給我們海量信息的同時也給我們的學習和生活帶來更多的誘惑,特別是自控能力較差的在校大學生。如何充分利用互聯網汲取更多有助于自身發展的知識和信息,這要求高校學生必須具有更高的綜合素質。我們對高校學生綜合素質進行評價的目的就是要幫助大學生正確認識自己的優點和缺點,通過不斷探索改進找到適合自己的學習思路和學習方法,而不是僅僅根據評價指標對高校學生的學習情況進行分析。本文通過對大學生綜合素質評價過程進行深入研究,構建出符合實際情況的綜合素質評價框架,可以在此基礎上幫助大學生了解在成長過程中存在的某些問題,進而剖析產生這些問題的可能原因,不斷尋找解決這些問題的對策,最終有效促進大學生綜合素質的全面提升。
1 ? ? ?研究現狀
我國高校對大學生綜合素質的提升相當重視,各高校不僅可以根據評價指標對大學生進行一系列的評優評先,而且還可以將評價結果反饋給學生,不斷促使廣大學生發現自身的優勢和不足,不斷提高自身的綜合素質,進而為國家和社會提供高質量的綜合性人才。特別是近幾年,隨著互聯網時代的到來,各行各業的就業壓力不斷增大,而高校大學生由于缺乏實踐經驗,其就業的壓力與日俱增,因此對大學生綜合素質進行客觀評價進而提升自身素質的研究也越來越多。許多學者對高校大學生綜合素質評價的理論和方法進行了深入研究和分析。周曉晶等人在考慮多方協同創新人才培養的基礎上,創建了包括有12個二級指標的綜合素質評價指標。而董卓寧等人為了區別不同指標的重要程度,根據經驗把思想政治、專業知識、實踐創新、人文和身心等分配了不同的權值。趙曦等人通過分析學生行為數據與綜合素質發展之間的聯系,提出了基于行為大數據的綜合素質評價系統。為了解決當前評價系統與學生實際情況之間的誤差,徐雪麗等人提出一種多級模糊綜合評判的方法。毛軍權等人則結合層次分析和模糊綜合提出了新的綜合素質評價方法。這些優秀的研究成果為我們研究大學生綜合素質評價提供了很好的理論和技術支持。
2 ? ? ?評價框架
2.1 ? 評價特征提取
常見的大學生綜合素質評價方案是把各個評價指標進行加權處理而獲得評價結果,其缺點是無法準確描述兩者之間存在的非線性關系,因此一般采用主成分分析方法,從眾高校大學生綜合素質評價指標中獲取有效的信息。主成分分析方法的思路是把高維空間投影到低維空間去分析,這些低維空間的數據之間互不相關,同時又能保留高維空間數據中包含的重要信息。
我們假設高維空間中有大學生綜合素質數據集X=[x1,x2,…,xl,xl+1,…,xl+u],l+u=N,其中前面的l個樣本X是有標簽的數據樣本,各類樣本數為Ni,l=(1,2,…,c),c為類別數,后面的u個樣本Xu為無標簽的數據樣本。
對比以上兩個式子可知,半監督主成分分析方法在提取大學生綜合素質評價指標信息時,不僅考慮了整個數據樣本的分布情況,同時還綜合了已知樣本的標簽信息來指導信息的提取,保留了指標特征之間存在的非線性關系。很明顯,綜合利用樣本的分類標簽信息和全局結構信息構建的半監督模型更加符合大學生綜合素質評價的現實情況。
2.2 ? 評價模型構建
支持向量機模型是數據分析中的一項新技術,它通過統計學習理論和優化理論解決機器學習的相關問題,已經成功地運用于各種模式識別的領域。其核心思想就是通過構建一個具有最優分類面的判別函數,把已有標簽的數據樣本準確地進行區分,同時還要滿足樣本間隔最大的約束條件。該模型的優點是只需少量的已知標簽樣本,構建出符合大學生綜合素質評價要求的非線性模型。
在對大學生綜合素質評價進行評價時,假設給定訓練樣本:X={(xi,yi),i=1,2,…,n},xi∈Rd,yi∈{+1,-1},n為訓練樣本個數,d為每個訓練樣本向量的維數,y為分類類別。在線性可分的情況下,求解決策函數需要構造如下優化問題:
很明顯,我們在已知類別的樣本基礎上,還充分利用未標記數據進行輔助訓練。其優點是半監督支持向量機不但利用了有標簽樣本對單個樣本精確描述的優勢,而且發揮了無標簽樣本對樣本集整體描述的重要作用。與常用的對評價指標進行加權處理方法明顯不同的是,半監督支持向量機通過學習算法可以獲得評價結果與評價指標之間的非線性關系,這更有助于對大學生綜合素質進行科學的評價。
3 ? ? ?總 ? ?結
本文對高校大學生綜合素質評價的現狀進行了深入研究,在最新機器學習理論基礎上提出了用于評價高校學生綜合素質的理論框架。在有效指標提取和評價模型構建的兩個階段,充分利用了有標簽樣本的類別信息和無標簽樣本的整體結構信息,提出的大學生綜合素質評價框架可以很好地描述評價結果與評價指標之間存在的非線性關系,與常用的指標加權處理方法相比,可以獲得更為精確的高校大學生綜合素質定量評價。下一步的研究計劃是將提出的綜合素質評價模型進行實證分析,不斷修正評價模型再進行推廣試驗。
主要參考文獻
[1]周曉晶, 于曉秋, 于飛躍, 等. 大學生綜合素質評價指標體系及評價方法研究——基于多方協同育人視角[J]. 大慶社會科學, 2017(4): 138-140.
[2]董卓寧, 張江, 張弛. 大學生綜合素質評價體系構建與實施方法研究[J]. 教育探索, 2012(12): 120-121.
[3]趙曦. 基于行為大數據的學生綜合素質評價系統設計與研究[J]. 現代信息科技, 2020, 4(1): 9-11.
[4]徐雪麗, 施佳熙, 焦龍強. 基于多級模糊評判的大學生綜合素質評價系統研究[J]. 西安文理學院學報:自然科學版, 2019, 22(4):8-14.
[5]毛軍權. 大學生綜合素質評價系統的設計與評價方法的研究[J].上海理工大學學報:社會科學版, 2002, 24(2):10-13.
[6]張曉濤. 基于半監督PCA-LPP流形學習算法的故障降維辨識[J].中南大學學報:自然科學版, 2016(5):1559-1564.
[7]皋軍, 王士同, 鄧趙紅. 基于全局和局部保持的半監督支持向量機[J]. 電子學報,2010, 38(7):1626-1633.
[8]王永,程燦,戴明軍, 等. 一種半監督支持向量機優化方法[J]. 工礦自動化,2010,36(12):47-50.