田文祥
(合肥工業大學 管理學院,合肥 230009)
學業預警通常是指學校通過學生在學習進度推進的不同階段,密切關注學生學習進展,對學習效果不理想達到一定程度的學生采取提醒、教育等預先警示方式并責令改正,幫助學生順利完成學業的一種教育和干預手段[1]。高校學業預警中學生學分數的取得通常是學生畢業資格中最基本的要素之一,學分數或課程數是高校學業預警機制中最常見的量化指標,同時學業績點或平均學分績點(GPA)也是衡量學生學習質量的常見指標,也是學業預警中常用的篩查指標。對在校學生進行學業預警篩查時,一般會根據學生學業問題的嚴重程度設置幾個不同的預警等級,如模仿氣象預警等級的黃色預警(較嚴重)、橙色預警(嚴重)、紅色預警(非常嚴重)。借助于數據挖掘技術對高校學生學業數據進行處理,從大量的數據中發現潛在育人價值體系[2]。離群數據[3]具有空間稀疏性、小樣本、屬性點異常現象等顯著特點,與高校學生學業預警管理體系[4]狀態分布特點接近,基于統計學的方法和已獲得數據,選擇采用離群數據挖掘技術作為技術手段。
以合肥工業大學管理學院會計學專業學生學年度文化課成績為樣本,運用離群數據挖掘技術[5]進行處理,通過分析相關指標,對數據進行以下定義與處理:得分90分以上的科目所獲成績劃分為一類成績,并通過SQL語言、數據庫系統進行數據處理,計算單個學生90分以上科目學分總和。
將數據進行預處理后,通過Rapidminer軟件對預處理后的數據進行數據聚類,進而分析學生平均成績與一類成績之間的關系。
本次聚類主要通過K-Means算法進行聚類分析,具體步驟如下:將數據導入Rapidminer軟件;建立規則,將學號設為ID;建立K-Means算法,將K值設為4;鏈接各個輸入端,運行算法;將輸出方式設置為“散點圖”。
通過上述步驟進行聚類數據,得到以下輸出結果,如圖1所示。

圖1 平均成績散點圖Fig.1 Scatter diagram of average scores
通過散點圖的分布狀況可判定此聚類是有效聚類,該散點圖中的左下角紅色標點的學生為一級學業預警對象[6],暫定為D類學生,隨著其分布逐漸向右上方移動,認為其學習狀態比前一層次更好,其相應的預警程度也就越低。
數據結果表明,A類學生在各個科目中都獲得了相對高分,其平均成績也是位于專業前茅。與此同時,D類學生表現出各個科目的成績都不是很好,其最終成績排名也不太理想。對于B類學生,可能存在個別科目不太擅長,其他科目學習成果較好,存在略微的偏科現象。對于C類同學,更偏向于部分學科能達到良好水平,但是總體不是很優秀,每一門科目都屬于中等水平,可能由于學習熱情不夠高或者不夠認真導致此結果。
第一,成績標準改變對結果的影響。
成績標準劃分的不同對最后結果會產生不同影響,將一類成績的標準降低到85分以及80分,通過Rapidminer軟件進行相似步驟的分析,結果如圖2、圖3所示。

圖2 以80分作為一類標準Fig.2 80 scores as a category

圖3 以85分作為一類標準Fig.3 85 scores as a category
研究結果表明,調整一類成績的標準后,整體趨勢并沒有發生顯著變化,但是每一聚類所包含點的數量則發生了一定程度上的改變。在實際應用中,可以根據各個樣本的實際水平及客觀因素的影響(如考試的難度、評卷的標準)來對這一標準進行設定。
第二,德、體、能三因素間的關聯。
用同樣的辦法,將同一樣本中學生的德、體、能所獲得的成績進行標準化處理,并利用Rapidminer軟件對其進行聚類分析,結果如圖4~圖6所示。

圖4 智—德關系圖Fig.4 Wisdom-ethics relationship

圖5 智—體關系圖Fig.5 Wisdom-physics relationship

圖6 智—能關系圖Fig.6 Wisdom-ability relationship
研究結果表明,學業預警模型散點圖[7]呈現出倒直角三角型式的排列,即智力分數越高的學生,在德、體、能方面的表現相對來說也更為突出。這與高校學生日常教育管理服務工作中所觀察到的學生日常表現具有較高的一致性,在學業成績上能取得較好表現的學生,通常對于班級日常活動的參與有著更高的積極性,也更注重于自身對日常良好習慣的保持。
在基于離群數據挖掘技術分析處理中,對學生年度學業成績進行分析,建立了適合于該群體學生的預警模型,根據學生日常表現驗證了該學業預警模型的可靠性,同時表明了基于離群數據挖掘分析的學業預警模型的可行性。
在驗證了基于離群數據挖掘分析的學業預警模型可行性的基礎上,研究發現學業預警除了可針對學生的學業成績指標外,該模型還可以在學生的日常學習生活中給予更加全面和生動的預警與建議,使學業預警模型更加科學化、系統化與規范化,在幫助學生順利完成學業的基礎上,更好地促進學生成長成才。
對學生的日常學習行為和過程表現進行記錄,如學生出勤情況、課堂參與度、課后作業完成情況、課程難易程度等方面,對學生的學業狀態進行及時提醒,動態跟進,提前預警研判。