韓鳳霞
(北京信息科技大學(xué) 工程訓(xùn)練中心,北京100192)
當(dāng)今大學(xué)生成長在以互聯(lián)網(wǎng)和手機(jī)通信為代表的現(xiàn)代傳媒手段蓬勃興起的時(shí)代,雖然可以開拓國際視野,但也缺乏自制力,容易迷失方向,無法自拔;還有部分學(xué)生由于其人生觀、價(jià)值觀在成長過程中發(fā)生偏差,崇尚享樂主義,主要精力不放在學(xué)習(xí)上,學(xué)生的自主能力差,不能正確的處理學(xué)習(xí)和交友,學(xué)習(xí)與休息,學(xué)習(xí)與娛樂等的關(guān)系。自我控制能力差,紀(jì)律松懈,作風(fēng)散漫。從而導(dǎo)致了多門課程重修,學(xué)習(xí)進(jìn)入了惡性循環(huán)。2012年中國社會(huì)科學(xué)院在國內(nèi)教育發(fā)展研究報(bào)告中指出,目前國內(nèi)每年平均有50萬大學(xué)生選擇了退學(xué),其達(dá)到了大學(xué)招生的0.75%左右。其中主要原因是由于成績差,對(duì)個(gè)人學(xué)業(yè)或是對(duì)學(xué)校教學(xué)環(huán)境喪失信心[1]。大學(xué)生選擇退學(xué)的結(jié)果給社會(huì)、學(xué)校、家庭帶來了很大負(fù)面影響。
從學(xué)校的管理角度出發(fā),若能建立動(dòng)態(tài)的預(yù)警教育機(jī)制,對(duì)大學(xué)生的不良思想、行為做到事先警示教育、事后跟蹤管理,對(duì)學(xué)生可以起到“揚(yáng)鞭奮起”的警示與鞭策作用。學(xué)籍異常都是逐漸產(chǎn)生的,怎樣在產(chǎn)生惡果之前及時(shí)介入干預(yù)和幫扶,怎樣才能做到“防微杜漸”、是急待解決的問題[2][3]。
目前,高校學(xué)籍管理一般分為校院兩級(jí)管理模式,學(xué)校級(jí)別的管理主要靠建立規(guī)章制度和執(zhí)行規(guī)章制度,而學(xué)院對(duì)學(xué)生的管理主要靠學(xué)籍監(jiān)控及預(yù)警指導(dǎo)為主。教務(wù)工作與學(xué)生思想政治工作在學(xué)生管理方面相對(duì)獨(dú)立,主要是事后預(yù)警。
(1)成績預(yù)警:根據(jù)教學(xué)管理系統(tǒng),統(tǒng)計(jì)學(xué)生完成的學(xué)分及學(xué)分績點(diǎn)和教學(xué)計(jì)劃要求的進(jìn)程比對(duì),評(píng)估學(xué)生學(xué)習(xí)情況,并預(yù)測學(xué)生完成培養(yǎng)方案的趨勢,將可能無法完成培養(yǎng)方案的學(xué)生整理匯總,并將其交給學(xué)院輔導(dǎo)員。輔導(dǎo)員針對(duì)學(xué)生的具體情況進(jìn)行干預(yù)并對(duì)其預(yù)警。
(2)日常預(yù)警:可以借助教師定期對(duì)學(xué)生考勤記錄、作業(yè)是否按時(shí)完成、以及課堂學(xué)習(xí)狀態(tài)等進(jìn)行分析,學(xué)院教學(xué)管理者收集到相關(guān)信息后進(jìn)行整理及篩選后反饋給輔導(dǎo)員,由輔導(dǎo)員進(jìn)行預(yù)警處理。
由此可見,目前的預(yù)警主要是單方向的,孤立的事后預(yù)警,具有遲滯性。只有出現(xiàn)嚴(yán)重的學(xué)籍異常后,才采取相應(yīng)的對(duì)策解決問題,但是對(duì)于一些潛在的問題,學(xué)生不能發(fā)現(xiàn),比如對(duì)處于網(wǎng)癮狀態(tài)而上學(xué)期表現(xiàn)良好的學(xué)生不能及時(shí)發(fā)現(xiàn)。現(xiàn)有的學(xué)籍預(yù)警系統(tǒng)無法做到對(duì)學(xué)生的學(xué)習(xí)和生活狀況的實(shí)時(shí)監(jiān)管,對(duì)問題的根源無法追蹤。要以“學(xué)生為本”構(gòu)建全方位預(yù)警方式的構(gòu)架,將大數(shù)據(jù)挖掘技術(shù)和傳統(tǒng)的人力管理相結(jié)合,做到“防微杜漸”,減少產(chǎn)生惡劣的后果。
隨著大數(shù)據(jù)時(shí)代的到來,學(xué)生的所有行為在高校面前幾乎全是“可視化”的。許多高校開始研究如何有效的利用大數(shù)據(jù)技術(shù)為人才培養(yǎng)服務(wù),挖掘?qū)W校海量數(shù)據(jù)潛在的巨大價(jià)值,進(jìn)而提出“學(xué)生畫像”的概念。學(xué)生畫像即學(xué)生特征進(jìn)行標(biāo)簽化處理,是高校利用采集到學(xué)生的各方面數(shù)據(jù),構(gòu)建一個(gè)學(xué)生數(shù)據(jù)抽取模型。通過分析其個(gè)人基本屬性、學(xué)籍信息、考勤信息、上網(wǎng)行為、借閱圖書信息、校內(nèi)消費(fèi)行為及個(gè)人興趣愛好等重要特征,進(jìn)而抽象出學(xué)生的在校畫像,該畫像可以作為是學(xué)校教學(xué)管理的重要依據(jù)。學(xué)生畫像可以為學(xué)校提供了充足的學(xué)生數(shù)據(jù),對(duì)學(xué)生特征數(shù)據(jù)進(jìn)行降維及聚類分析,能夠幫助學(xué)校快速準(zhǔn)確的了解各個(gè)學(xué)生的學(xué)籍狀態(tài),依據(jù)評(píng)價(jià)結(jié)果,有針對(duì)性的對(duì)相關(guān)學(xué)校有關(guān)部門、教師、家長和學(xué)生傳遞預(yù)警信號(hào),必要時(shí)采取干預(yù)措施,對(duì)學(xué)籍狀態(tài)出現(xiàn)異常的學(xué)生給予有針對(duì)性的引導(dǎo),避免因各種原因?qū)е聦W(xué)生無法完成學(xué)業(yè)或產(chǎn)生其他不良結(jié)果的事情發(fā)生。
隨著信息化建設(shè)的不斷推進(jìn),高校在各種管理系統(tǒng)中采集并保存了有關(guān)學(xué)生信息的海量數(shù)據(jù),并逐步形成了一個(gè)從學(xué)生基本信息、學(xué)籍信息、校內(nèi)消費(fèi)、圖書借閱到上網(wǎng)行為的多維度數(shù)據(jù)存儲(chǔ)體系。如果能夠根據(jù)學(xué)校管理決策的需要構(gòu)建一個(gè)數(shù)據(jù)倉庫,對(duì)該存儲(chǔ)體系統(tǒng)的數(shù)據(jù)進(jìn)行抽取、清洗、轉(zhuǎn)換并載入數(shù)據(jù)倉庫中,進(jìn)而形成一個(gè)高質(zhì)量的數(shù)據(jù)中心,學(xué)生畫像是在學(xué)校數(shù)據(jù)倉庫中進(jìn)行數(shù)據(jù)挖掘,通過其中多維度的數(shù)據(jù)信息,分析學(xué)生的有關(guān)信息,還原學(xué)生的基本屬性、學(xué)習(xí)成績、上課考勤、圖書借閱行為、上網(wǎng)行為以及校內(nèi)消費(fèi)行為等屬性。了解學(xué)生的各種特征及需求,精準(zhǔn)描述學(xué)生群體特征,針對(duì)特定場景進(jìn)行學(xué)生不同維度的聚類分析,將雜亂無章的海量數(shù)據(jù)轉(zhuǎn)變?yōu)殍蜩蛉缟膶W(xué)生畫象,進(jìn)而監(jiān)控學(xué)生的學(xué)籍狀態(tài),并預(yù)測學(xué)生學(xué)業(yè)走向,必要時(shí)管理者可以干預(yù)學(xué)籍異常學(xué)生行為,對(duì)其進(jìn)行有效的管理。
學(xué)生畫像的主要任務(wù)是給學(xué)生貼“標(biāo)簽”,標(biāo)簽是指可以準(zhǔn)確精煉的描述學(xué)生的特征標(biāo)識(shí),比如性別、年齡、民族、興趣愛好等,將學(xué)生的所有標(biāo)簽綜合在一起,就可以構(gòu)成學(xué)生的“畫像”了。本文主要從學(xué)生的基本屬性、學(xué)習(xí)成績、上課考勤、圖書借閱行為、上網(wǎng)行為以及校內(nèi)消費(fèi)行為對(duì)學(xué)生特征進(jìn)行研究。學(xué)生畫像主要分三步:①采集學(xué)生數(shù)據(jù);②統(tǒng)計(jì)分析,生成學(xué)生特征標(biāo)簽;③生成學(xué)生畫像。流程如圖1所示。

圖1 學(xué)生畫像流程
首先,對(duì)學(xué)校各個(gè)數(shù)據(jù)源進(jìn)行數(shù)據(jù)抽取、清洗、轉(zhuǎn)換、裝載入學(xué)生數(shù)據(jù)倉庫中,采集到的學(xué)生數(shù)據(jù)分為靜態(tài)特征數(shù)據(jù)和動(dòng)態(tài)特征數(shù)據(jù),所謂靜態(tài)特征數(shù)據(jù)是學(xué)生相對(duì)固定不變的特征信息,如姓名、性別出生日期、民族等特征,動(dòng)態(tài)特征數(shù)據(jù)就是學(xué)生隨時(shí)間的推移不斷變化的行為特征,如學(xué)習(xí)成績、上課考勤、圖書借閱行為、校內(nèi)消費(fèi)行為及上網(wǎng)行為等。
其次,利用收集到的學(xué)生特征屬性信息,通過統(tǒng)計(jì)分析為學(xué)生在不同緯度特征上貼上標(biāo)簽。其中,對(duì)于學(xué)生靜態(tài)屬性,例如學(xué)號(hào)、姓名、性別、出生日期、民族籍貫等,通過對(duì)采集到的特征數(shù)據(jù)進(jìn)行抽取、清洗及轉(zhuǎn)換,可以直接為學(xué)生貼上標(biāo)簽。 對(duì)學(xué)生動(dòng)態(tài)屬性貼標(biāo)簽時(shí),需要根據(jù)具體需求進(jìn)行統(tǒng)計(jì)分析。比如對(duì)學(xué)生學(xué)習(xí)狀況分析時(shí),需要對(duì)學(xué)生學(xué)年學(xué)期不同課程性質(zhì)課程獲取的成績標(biāo)準(zhǔn)化處理,然后進(jìn)行統(tǒng)計(jì)分析,生成學(xué)生學(xué)期不同課程性質(zhì)獲取的平均成績,從而為該生貼上學(xué)習(xí)狀況標(biāo)簽。依據(jù)同樣方式為學(xué)生貼上上課出勤特征、上網(wǎng)特征及借閱圖書特征等。
最后,根據(jù)學(xué)生的所有標(biāo)簽為學(xué)生畫像,通過畫像可以直觀地呈現(xiàn)學(xué)生特征屬性。

圖2 學(xué)生畫像框架圖
高校為學(xué)生特征生成畫像后,通過分析學(xué)生畫像可以實(shí)時(shí)準(zhǔn)確了解學(xué)生的各方面特征,掌握其基本學(xué)籍狀態(tài)。考慮到學(xué)生畫像中不同特征間具有某種相關(guān)性,而相關(guān)性會(huì)增加統(tǒng)計(jì)分析的復(fù)雜程度,采用主成分分析法對(duì)學(xué)生畫像進(jìn)行分析,將最初具有關(guān)系的屬性用新的相互獨(dú)立的屬性來替代。選取盡可能少的屬性來反映學(xué)生的所有特征。分析學(xué)生畫像主要包括以下步驟:
(1)將n個(gè)學(xué)生畫像數(shù)據(jù)按列生成矩陣S,如公式(1),該矩陣由n行m列組成


(2)對(duì)矩陣S每行(學(xué)生特征)進(jìn)行標(biāo)準(zhǔn)化處理,即將學(xué)生特征值歸一化處理,利用公式(2)進(jìn)行特征標(biāo)準(zhǔn)化。

(3)學(xué)生特征矩陣計(jì)算,輸出協(xié)方差矩陣R(公式(3));

對(duì)學(xué)生特征矩陣進(jìn)行標(biāo)準(zhǔn)化處理后,用處理后的矩陣替代原學(xué)生特征矩陣S,從而使得統(tǒng)計(jì)分析輸出的結(jié)果具有更好的質(zhì)量,利用公式(4)計(jì)算學(xué)生特征矩陣S的相關(guān)系數(shù)。

(4)計(jì)算協(xié)方差矩陣R的特征值(λ1,λ2…λm)以及特征向量ɑi=(ɑi1,ɑi2,…ɑim),i=1,2…m,并利用公式(5)計(jì)算貢獻(xiàn)率。

其中w表示特征值λi的貢獻(xiàn)率。
(5)選擇主成分
根據(jù)標(biāo)準(zhǔn)化的學(xué)生特征數(shù)據(jù),根據(jù)特征貢獻(xiàn)率將學(xué)生特征值按降序排列,根據(jù)統(tǒng)計(jì)需求取前若干行(特征),形成降維后的學(xué)生特征矩陣
(6)對(duì)矩陣進(jìn)行聚類分析,采用KHM(K-Harmonic Means)對(duì)矩陣聚類,該算法將每個(gè)學(xué)生特征數(shù)據(jù)到各聚類中心的調(diào)和平均值的和看作目標(biāo)函數(shù)公式(6)。

通過對(duì)北京信息科技大學(xué)31個(gè)專業(yè)2個(gè)年級(jí)5367名學(xué)生靜態(tài)數(shù)據(jù)及動(dòng)態(tài)特征數(shù)據(jù)采集、整理、過濾分析,形成學(xué)生畫像。其中包括靜態(tài)特征(基本屬性)24個(gè),動(dòng)態(tài)特征5個(gè),總計(jì)29個(gè)特征信息。針對(duì)學(xué)生的特征數(shù)據(jù)生成學(xué)生特征矩陣,進(jìn)而對(duì)學(xué)生特征矩陣進(jìn)行主成分分析法進(jìn)行降維處理,動(dòng)態(tài)提取學(xué)生關(guān)鍵特征值,從而生成新的學(xué)生特征矩陣,然后利用基于距離的聚類分析法,將學(xué)生進(jìn)行聚類,將嚴(yán)重偏離中心點(diǎn)的學(xué)生特征信息提取出來,如圖3所示,離群點(diǎn)的學(xué)生信息有可能為學(xué)籍狀態(tài)異常,進(jìn)而生成學(xué)籍異常學(xué)生信息,通過將模型提取的學(xué)籍異常學(xué)生信息與學(xué)院核對(duì),結(jié)果發(fā)現(xiàn)95%的學(xué)生確實(shí)存在學(xué)籍異常特征。

圖3 學(xué)生學(xué)籍狀態(tài)聚類圖
在分析過程中產(chǎn)生了一些急待解決的新問題,為進(jìn)一步動(dòng)態(tài)地監(jiān)控學(xué)生學(xué)籍的狀態(tài),需要教務(wù)處、學(xué)生處、學(xué)院、任課教師、輔導(dǎo)員及學(xué)生多方形成合力,缺少任何一方的積極推進(jìn),都無法順利完成預(yù)警工作并取得實(shí)效。必須在以下幾方面進(jìn)行加強(qiáng)建設(shè):①及時(shí)上報(bào)課堂考勤數(shù)據(jù)。任課教師考勤是考勤預(yù)警的最準(zhǔn)確、全面的數(shù)據(jù)來源,數(shù)據(jù)匯總要及時(shí),以免錯(cuò)失最佳干預(yù)期。②各個(gè)信息系統(tǒng)數(shù)據(jù)充分共享。各個(gè)應(yīng)用系統(tǒng)之間的信息避免出現(xiàn)孤島現(xiàn)狀,實(shí)行實(shí)時(shí)的共享和同步。
采用學(xué)生畫像的方法監(jiān)控學(xué)籍狀態(tài),構(gòu)造學(xué)生特征矩陣,并經(jīng)過降維處理,簡化特征,能夠?qū)崟r(shí)掌握學(xué)生學(xué)籍的動(dòng)態(tài)生特征信息,及時(shí)的發(fā)現(xiàn)問題,未雨綢繆的采用預(yù)警措施,利于學(xué)校的學(xué)風(fēng)建設(shè),對(duì)于學(xué)籍信息不穩(wěn)定的學(xué)生,采取實(shí)時(shí)預(yù)警措施。在有大量信息的教育領(lǐng)域,將基于學(xué)生特征畫像方法應(yīng)用于學(xué)籍狀態(tài)監(jiān)測,在高校學(xué)生管理中加以推廣應(yīng)實(shí)驗(yàn)結(jié)果表明,所得出的結(jié)論對(duì)高校教學(xué)和人才培養(yǎng)具有一定的指導(dǎo)意義。
[1]楊東平.中國教育發(fā)展報(bào)告2012[M].北京:社會(huì)科學(xué)文獻(xiàn)出版社,2012.
[2]張紅云.高校學(xué)習(xí)預(yù)警機(jī)制探索[J].科技信息,2010(1):801.
[3]章東飛.大學(xué)生學(xué)籍預(yù)警機(jī)制探索[J].教育學(xué)術(shù)月刊,2010(5):75-76.
[4]袁安府,張娜,沈海霞.大學(xué)生學(xué)業(yè)預(yù)警評(píng)價(jià)指標(biāo)體系的構(gòu)建與應(yīng)用研究[J].黑龍江高教研究,2014(3):79-83.
[5]吳青芳,胡欣敏.高校學(xué)籍管理與學(xué)風(fēng)建設(shè)關(guān)系研究[J].化工高等教育,2010(4):21-24.
[6]李愛鳳,劉葵,唐連章等.數(shù)據(jù)挖掘技術(shù)在數(shù)字化校園共享數(shù)據(jù)中心的應(yīng)用[J].實(shí)驗(yàn)室研究與探索,2013(11):232-236.
[7]黃曉霞,程論.綜合評(píng)價(jià)與數(shù)據(jù)挖掘的比較[J].上海海市大學(xué)學(xué)報(bào),2007(12):54-58.
[8]劉昕,鄭莆燕,劉莉.學(xué)分制下二級(jí)學(xué)院學(xué)生預(yù)警機(jī)制的探索與實(shí)踐[J].教育與職業(yè),2013(1中):174-175.
[9]林靜,陶愛萍.我國近二十年高校學(xué)籍管理制度理論研究綜述[J].江蘇高教,2012(1):60-62.
[10]曾麗.學(xué)分制條件下學(xué)籍管理的完善[J].鞍山科技大學(xué)學(xué)報(bào),2006(6).
[11]張波,耿在丹,杜保強(qiáng).基于數(shù)據(jù)倉庫的學(xué)生信息管理決策系統(tǒng)[J].實(shí)驗(yàn)室研究與探索,2009,28(12):60-62.
[12]華金秋.臺(tái)灣高校學(xué)習(xí)預(yù)警制度及其借鑒[J].江蘇高教,2007(5):136-137.
[13]趙力,王濤,金代志等.高等院校學(xué)籍管理系統(tǒng)功能設(shè)計(jì),2009(8):107-108.
[14]別紅桂.高校學(xué)籍管理工作的改革與探索[J].教育探索,2011(1):88-89.
[15]趙雄輝,聶娟.高等學(xué)校學(xué)籍管理制度建設(shè)原則探討[J].高等教育研究學(xué)報(bào),2006(3):78-80.
[16]Li Y,Tang SD,Lu J,et al.A survery of contentbased image retrieval with high-level semantics[J].Pattern Recognition.2008,10(1):12-18.
[17]MORGAN STANLEY.Cloud Computing Takes O ff M arket Set to Boom as Migration Accelerates[R].2011.