劉杰逾
(吉利學院,四川 成都 610000)
作為當前熱門的技術之一,大數據給人們的生活、學習帶來了極大的便利,同時也對高校管理產生了革命性改變。當前高校校園管理主要采用的是說教與事后分析的方法,存在一定的滯后性,對學生思想動態變化及行為缺乏有效的預測與評估[1]。大數據時代的到來,打破了傳統高校校園管理的弊端,其能夠從海量數據中挖掘出有價值的學生信息,為校園管理提供客觀的、準確的、全面的依據,預測學生行為,提升校園管理的針對性,對于學生教育管理水平的提升以及數字化校園建設有著重要的意義。
信息化時代背景下,數字化校園建設受到了高校的高度重視,在日常教學活動及教育管理工作中會產生大量數據,主要來源于微博論壇、圖書借閱、網絡行為等,數據類型包括結構化與非結構化兩種,這些數據與學校的教學活動及管理密切相關。隨著數字化校園建設的不斷推進,數據量越來越大,形成了一個具有潛在價值的數據集合[2]。高校學生行為數據復雜多樣,整合困難,相互之間難以建立起關聯性,再加上工作人員缺乏專業數據處理經驗,難以滿足數據挖掘需求。互聯網信息時代背景下,高校多建立校園網,通過“一卡通”、校園網絡以及基礎教育數據均能夠實現對學生行為的分析。
本研究基于學生管理工作實際,在大數據技術支持下,利用教務系統對學生成績信息進行采集,利用考勤系統采集學生上課、出勤數據,挖掘綜合素質系統中學生對第二課堂的參與情況。與此同時,校園一卡通涵蓋學生的圖書借閱信息,采用ETL工具將上述各個平臺數據進行抽取,并予以轉換,在Oracle數據庫中裝載,實現對數據的儲存與管理,按照校園管理制度設計相應的規則庫,包括評獎評優、違規違紀處分、成績預警等,實施數據挖掘,構建基于學院、班級及個人三個維度的可視化過程,其主要涉及考勤、獎懲、綜合素質與成績管理4個方面,構建的可視化系統總體架構如圖1所示。

圖1 大數據下高校學生行為分析可視化系統整體架構
可視化系統主要包括硬件系統與軟件系統兩個部分。硬件系統由服務器、處理器組成,同時配備了2個64核2.1 G的內存,硬盤為256 G,型號為Barracuda 7200.7 plus;軟件系統包括MySQL、Hadoop2.7.1。
目前,關于海量數據的處理方法多種多樣,其中Hadoop技術是最為成熟的一種,其由Apache軟件基金研發,形成完善的生態系統,在大數據分析處理領域有著舉足輕重的地位。在Hadoop技術支持下,系統可實現數據的存儲與分析,且便于數據管理,有利于維護數據安全,具有鮮明的優勢[3]。本研究利用大數據Hadoop平臺,在集成環境MyEclipse下,開發了大數據學生管理平臺,涉及系統管理、個人信息與班級信息分析、地區關聯性分析等,系統功能如圖2所示。

圖2 平臺功能架構分析
2.3.1 系統管理模塊
基于校園的大數據學生行為分析系統主要包括登錄、數據管理與退出3個層面。登錄用戶包括系統管理員與普通用戶。用戶選擇相應身份,將用戶名、密碼輸入后能夠完成登錄,學生成績、考勤相關數據接口均需要數據管理。系統能夠幫助數據清洗、存儲。(1)系統管理員的主要職責為維護管理數據,如數據導入、導出、分析,并定期更新數據,對日志予以維護、管理。數據主要來源于入學基本信息、學習成績、考勤數據、綜合素質評分等。新生入學1個月內便能夠完成數據采集,可以將其作為學生原始信息數據[4]。在之后的學習活動中,每次考試、補考成績均會錄入學生成績系統;考勤系統中主要記錄的是學生請假、曠課、遲到情況,將其作為考勤信息。綜合素質評分則從學生綜合評估體系中導出,經過整理與計算獲得可靠的數據信息。(2)輔導員作為班級與學生的管理者,需要對學生成績、考勤及綜合素質評分等進行綜合管理。輔導員可推薦優秀的學生參與評獎、評優,并能夠根據學生成績、考勤、違紀情況預警學生的行為,予以跟蹤、反饋[5]。(3)班主任承擔著班級管理的重任,需要對學生的基礎成績、考勤及綜合素質評估情況等進行查看,在評獎、評優方面有著重要的參與作用。當發現學生存在違規、違紀、考勤異常或其他異常行為應予以預警。(4)學生利用大數據可視化系統主要查看自身的基本信息、考勤、成績等,了解自身存在的不足及努力的方向,能夠對違規、違紀起到警示作用。
2.3.2 學生與班級信息分析
對學生信息的分析主要包括5個方面:(1)選擇對應的班級后,只需在人員姓名上點擊便能夠獲得學生總分、平均分及排名等相關數據。(2)考勤分析,操作方法同(1),點開對應學生姓名后,能夠自動顯示出學生請假、曠課及遲到次數等,不僅如此還與缺課的課程相對應,數據詳細、全面。(3)綜合素質分析,其主要涉及思想政治教育、創新創業及勞動實踐等多個方面,按照相應的評分規則,對每項作出評分,并計算出總分,對綜合素質評分進行排名。(4)預警分析,當需要查看某位學生的行為數據時,可以點擊姓名查看其曠課、遲到及成績等相關數據。(5)評獎評優,按照學生成績及綜合素質評分對學生進行排名,并推薦優秀的人選,同時學生的曠課、遲到、補考等也是評獎評優的重要依據。
2.3.3 地區信息分析
為了解不同地域學生成績的差異性,教師可以對每學期排名靠前的20%學生進行篩選,根據生源地不同進行劃分,計算不同生源地在總學生中的比例,并進行排名,以了解全國各個地區生源質量。綜合素質排名與預警總體排名方法同上。
在互聯網、云計算及Web等技術支持下,學生校園行為相關數據大量產生,高校管理人員在分析學生校園行為時多采用的是關聯法、特征分析法、異常分析法等,需要大量數據作為支撐。“一卡通”“圖書借閱卡”“網絡監控”均屬于結構化數據,在信息采集的同時能夠對信息予以轉化。互聯網、社區論壇及貼吧則為半結構化數據的主要來源,通常需要利用ETL工具進行處理,數據采集多采用網絡爬蟲工具。在提取學生行為特征方面,包括顯特征與隱特征兩個方面,在分析學生群體生活方面,可以輸入學生刷卡次數、消費金額、平均消費金額、上網時間等,隱特征的提取需要借助社交網絡平臺,提取學生上網類型、一卡通使用頻率等[6]。另外,學生特征提取還包括行為規律、社交情況、消費特征、圖書借閱數量及圖書借閱類型等。學生社交網絡作為學生行為異常的重要指標,具有預警作用,通過社交網絡刷卡事件的提取分類,可以進行如下排序(見表1)。

表1 學生事件發生排序
學生校園行為常見挖掘方法包括預測、聚類、關系挖掘等,依據以上信息,高校管理人員需要構建學生離群對學生行為及情感分析,數據關聯性分析內容主要包括家庭背景、情感態度及人際關系等。本研究采用關聯分析法,利用個體在時間、空間、生活特征等方面的相似性,對學生在特定時間范圍內的相關數據如時間、時空重疊性,空間相似相進行分析,進而獲得學生之間移動模式相似性。在分析中需要對不同模塊分級指標、權重比例予以設計,對學生的個性特征、行為規律等進行深入分析,構建集影像、文本、圖形等為一體的校園行為安全預警模型,預測學生的行為,防微杜漸,實現和諧校園的建設。預警模型的構建采用“1+1+4+N”模式,2個1分別表示基礎數據源、大數據運行平臺,4指的是4個管理平臺,N主要表示多種分析挖掘技術,如智能預警、多維分析、專題分析等。數據采集存儲平臺如圖3所示。

圖3 數據采集存儲平臺
大數據可視化模式主要利用SAS工具與SPSS,其能夠實現對大學生行為數據的可視化管理,使得用戶數據信息的呈現更加直觀、方便。利用離群點分析能夠形成學生相似行為特征值聚類,并樹立成多個主題的數據分析模塊。教師可以以曲線圖的形式將學生在校期間的考試成績、出勤情況、及格率等予以動態反應。教師可直觀地掌握學生的學習情況[7]。教師通過網絡行為監控能夠了解學生群體的熱點話題及對政治敏感問題的關注情況等。利用系統分析安全數據,能使學生的情感與態度可視化,掌握學生行動、行為軌跡,制定干預計劃。當在監測系統中出現超出常規的跡象時,系統會發出預警,應密切跟蹤學生行為,并積極采取措施,避免不良行為的發生。
大數據時代為高校學生管理提供了新的技術支持,學生行為分析可視化系統的構建能夠實現對學生學情、違法違紀行為等的精準分析診斷,有利于前置預警,促進了學生管理水平的提升,保障了高校對學生的安全管控,推動了智慧數字化校園的實現。學生行為分析可視化系統擁有廣闊的發展前景。