王莉莉

摘要:高校智慧校園建設(shè)的推進產(chǎn)生了教育大數(shù)據(jù),為大學(xué)生校園行為分析與預(yù)警提供了有力的數(shù)據(jù)支持。針對當前高校大學(xué)生校園行為分析預(yù)警管理平臺建設(shè)滯后問題,文章利用大數(shù)據(jù)分析關(guān)鍵技術(shù),搭建集數(shù)據(jù)采集與存儲、行為分析與挖掘、畫像生成與預(yù)警、安全管控等多功能模塊于一體的大學(xué)生校園行為分析預(yù)警管理平臺,為加強學(xué)習(xí)行為安全預(yù)警與管控、促進學(xué)生管理水平的持續(xù)提升提供助力。
關(guān)鍵詞:智慧校園;大數(shù)據(jù);校園行為;分析預(yù)警管理平臺
2015年8月31日,國務(wù)院發(fā)布了《促進大數(shù)據(jù)發(fā)展行動綱要》,強調(diào)大數(shù)據(jù)已成為國家經(jīng)濟發(fā)展與創(chuàng)新驅(qū)動的基礎(chǔ)性、前瞻性技術(shù)。為了適應(yīng)大數(shù)據(jù)時代發(fā)展,高校紛紛推進智慧校園建設(shè),并積極推進教育大數(shù)據(jù)的收集、分析、應(yīng)用、共享,充分發(fā)揮教育大數(shù)據(jù)對深化高等教育改革,提高人才培養(yǎng)質(zhì)量的支撐作用。
學(xué)生行為大數(shù)據(jù)作為教育大數(shù)據(jù)的重要組成部分,內(nèi)蘊學(xué)生的行為規(guī)律與個體特征。高校全面捕捉、深度挖掘和提取數(shù)據(jù)中的潛在信息進行學(xué)生畫像,能及時洞察學(xué)生的不良行為并進行預(yù)警,對有效防范校園安全事件發(fā)生、精準把握學(xué)生思想動態(tài)、提高學(xué)生管理工作水平具有重要意義。
但是,當前大學(xué)生校園行為監(jiān)管大多集中在宣傳說教與定期排查方面,管理模式仍停留在事后定性分析層面,缺乏高效的技術(shù)支持,與智慧校園智能管控的要求有所差異。因此,高校需立足智慧校園建設(shè)背景,基于大數(shù)據(jù)技術(shù)推進大學(xué)生校園行為分析預(yù)警管理平臺建設(shè),建立健全預(yù)警決策機制,以此探索多維度、動態(tài)化、立體式的教育管理模式,對學(xué)生不良行為進行全面跟蹤與警示教育,確保大學(xué)生成長成才。
一、大學(xué)生校園行為大數(shù)據(jù)的產(chǎn)生與價值
為了響應(yīng)國家《教育信息化“十三五”規(guī)劃》《教育信息化2.0行動計劃》等政策的要求,高校紛紛推進智慧校園建設(shè),并將其作為治校育人的“重器”,全面推進校園信息化建設(shè),著力打造以大數(shù)據(jù)技術(shù)為手段、數(shù)據(jù)中心為核心、業(yè)務(wù)應(yīng)用系統(tǒng)為支撐的智慧校園建設(shè)格局。
隨著智慧校園建設(shè)的推進,通過教學(xué)活動和教育管理產(chǎn)生了大量的結(jié)構(gòu)化與非結(jié)構(gòu)化教育大數(shù)據(jù),其中包括種類繁多的校園行為數(shù)據(jù)。校園行為大數(shù)據(jù)涉及學(xué)生上課考勤、實驗室出入、寢室門禁等,全面記錄了大學(xué)生遲到、早退、曠課、活動參與、各科成績等信息。通過技術(shù)支持,高校能夠結(jié)合不同教學(xué)場景進行分析建模,全程跟蹤大學(xué)生校園行為,一旦不良行為累計數(shù)據(jù)超出閾值,便會自動向教育管理人員發(fā)送預(yù)警,以提高學(xué)生管理的針對性和實效性。
大學(xué)生校園行為數(shù)據(jù)異常復(fù)雜,不易精確整合和建立相互間的關(guān)聯(lián)性。因此,傳統(tǒng)淺表層面的大數(shù)據(jù)應(yīng)用已無法滿足大學(xué)生校園行為大數(shù)據(jù)的分析、整合與利用所需,亟須依托智慧校園各應(yīng)用系統(tǒng)、人工智能、大數(shù)據(jù)等技術(shù)融合支持,經(jīng)過數(shù)據(jù)抽取、洗滌和加工,抽象出全面反映大學(xué)生性格、態(tài)度、行為偏好等多維度行為特征畫像,由此開展大學(xué)生全周期、全過程、全空間的跟蹤監(jiān)管,強化大學(xué)生校園行為的研判預(yù)測、引導(dǎo)干預(yù),以此有針對性地引導(dǎo)大學(xué)生端正思想、規(guī)范行為,保障大學(xué)生健康發(fā)展。
二、大學(xué)生校園行為大數(shù)據(jù)分析的關(guān)鍵技術(shù)
傳統(tǒng)大學(xué)生行為管理多依賴于經(jīng)驗,屬于事后應(yīng)對模式,而大數(shù)據(jù)技術(shù)的引入為事前研判、預(yù)測與監(jiān)管提供了支持。從整體來看,大學(xué)生校園行為大數(shù)據(jù)分析涉及的技術(shù)很多,本文主要運用Hadoop大數(shù)據(jù)處理框架,配合Apache Kafka、Flume數(shù)據(jù)采集技術(shù),HDFS數(shù)據(jù)存儲技術(shù),MapReduce數(shù)據(jù)運算分析等技術(shù),實現(xiàn)對大學(xué)生多維軌跡及行為大數(shù)據(jù)的數(shù)據(jù)采集、清洗、建模、降維分析與可視化呈現(xiàn)。
具體而言,Hadoop大數(shù)據(jù)處理框架能夠?qū)⒁慌_計算機的計算能力無限次、高速率地復(fù)制到集群機上,賦予集群機強大的計算運行能力;HDFS數(shù)據(jù)存儲技術(shù)提供海量數(shù)據(jù)的存儲與管理功能,支持非結(jié)構(gòu)化數(shù)據(jù)處理;MapReduce數(shù)據(jù)運算分析提供分布式并行計算,并支持動態(tài)的大學(xué)生校內(nèi)行為軌跡地圖與查詢服務(wù),其與HDFS數(shù)據(jù)存儲技術(shù)的融合,賦予Hadoop大數(shù)據(jù)處理框架強大的存儲與計算功能,使之能夠有效存儲和處理PB級大數(shù)據(jù);Apache Kafka數(shù)據(jù)采集技術(shù)作為一個分布式消息隊列系統(tǒng),能提供高性能、高可靠性的數(shù)據(jù)傳輸與處理能力,支持實時數(shù)據(jù)處理與大數(shù)據(jù)場景;Flume數(shù)據(jù)采集技術(shù)提供海量日志的采集、聚合與傳輸,支持日志系統(tǒng)對各類數(shù)據(jù)的收集、定制與發(fā)送。此外,基于Echart、D3.Js的可視化呈現(xiàn)與SaaS交付形式,促進了學(xué)生畫像的生成,打通了大學(xué)生校園行為監(jiān)控、預(yù)警、根源分析的閉環(huán)管理路徑,并以Html5技術(shù)進行預(yù)警信息定向推送,為智慧校園大學(xué)生行為管理提供了智能化技術(shù)手段支持。
三、大學(xué)生校園行為分析預(yù)警管理平臺的開發(fā)與實現(xiàn)
(一)平臺架構(gòu)搭建
本文所開發(fā)的基于大數(shù)據(jù)的大學(xué)生校園行為分析預(yù)警平臺,采用的是典型的大數(shù)據(jù)技術(shù)架構(gòu),包括數(shù)據(jù)源、運行數(shù)據(jù)、核心能力與場景應(yīng)用四層結(jié)構(gòu),如圖1所示。其中,數(shù)據(jù)源層依托云化ETL工具、流數(shù)據(jù)處理、網(wǎng)絡(luò)爬蟲、主數(shù)據(jù)倉庫等,負責(zé)大學(xué)生校園多維軌跡及行為數(shù)據(jù)的采集與存儲,包括“一卡通”系統(tǒng)、教務(wù)系統(tǒng)、門禁系統(tǒng)等自動采集,以及源自互聯(lián)網(wǎng)與文檔等學(xué)生歷史數(shù)據(jù),點擊流,實時日志等結(jié)構(gòu)化、非結(jié)構(gòu)化及半結(jié)構(gòu)化數(shù)據(jù);核心能力層是依托Hadoop集群、云存儲、分布式數(shù)據(jù)庫等,對數(shù)據(jù)源層所采集的多維大數(shù)據(jù)進行運算處理;運行數(shù)據(jù)層是借助數(shù)據(jù)清洗、數(shù)據(jù)建模、多維分析等多元組件的支持,對計算后的數(shù)據(jù)進行清洗、建模與分析,實現(xiàn)信息的即時查詢;場景應(yīng)用層是利用數(shù)據(jù)網(wǎng)關(guān)、BI組件、可視化技術(shù)等,實現(xiàn)對數(shù)據(jù)的可視化呈現(xiàn)與預(yù)警發(fā)送。高校通過四層平臺架構(gòu),可以實現(xiàn)大學(xué)生校園足跡、行為軌跡的實時監(jiān)控及畫像生成,提供預(yù)警反饋、預(yù)警信息推送等服務(wù)功能。
(二)功能模塊設(shè)計
在大學(xué)生校園行為分析預(yù)警平臺架構(gòu)的基礎(chǔ)上,利用Hadoop開源平臺進行二次開發(fā),是底層數(shù)據(jù)采集與存儲模塊的設(shè)計,負責(zé)各類結(jié)構(gòu)化、非結(jié)構(gòu)化與半結(jié)構(gòu)化數(shù)據(jù)的采集與文本化存儲,隨后以主流架構(gòu)及分析算法開發(fā),實現(xiàn)行為分析與挖掘、畫像生成與預(yù)警、系統(tǒng)安全運行管控等功能模塊,進一步對各數(shù)據(jù)進行挖掘與分析,并對分析結(jié)果進行圖形化直觀呈現(xiàn),幫助管理人員分析學(xué)生行為和心理問題,協(xié)助開展教學(xué)管理宏觀決策,輔助校園安全管控,為智慧校園智能化管控提供支持。
1.數(shù)據(jù)采集與存儲模塊
數(shù)據(jù)采集與存儲模塊是在Apache Kafka、Flume數(shù)據(jù)采集技術(shù)的支持下,通過智慧校園數(shù)字化基建及物聯(lián)網(wǎng)、云計算等平臺,全面抓取和收集高校管理基礎(chǔ)信息、大學(xué)生動靜態(tài)特征屬性等校園行為大數(shù)據(jù),包括教務(wù)系統(tǒng)、一卡通系統(tǒng)、寢室門禁系統(tǒng)、圖書館借閱系統(tǒng)、校園網(wǎng)等關(guān)聯(lián)數(shù)據(jù),以及大學(xué)生身份信息、興趣愛好等內(nèi)容,并將多維大數(shù)據(jù)進行集成分類存儲,生成大學(xué)生校園畫像屬性值,并將數(shù)據(jù)屬性值樣本進行清洗,利用曼哈頓函數(shù)對目標區(qū)域半徑外的數(shù)據(jù)偏離距離進行計算,利用排序設(shè)定合理的閾值,將離群點偏離度展開對比,獲取各屬性值的異常度。
2.行為分析與挖掘模塊
行為分析與挖掘模塊借助HDFS、MapReduce技術(shù)的支持,通過分布式文件系統(tǒng)與并行計算,將上一模塊采集到的大數(shù)據(jù)進行分析建模,并實現(xiàn)數(shù)據(jù)的深入挖掘和智能分析。具體而言,高校利用Hadoop大數(shù)據(jù)處理框架的支持,將采集的大學(xué)生校園行為數(shù)據(jù)屬性特征分別貼上標簽,在主成分分析法的支持下,利用降維思想及線性變換法,將所給定的一組相關(guān)變量轉(zhuǎn)換為另一組不相關(guān)變量,轉(zhuǎn)換后的新變量依循方差遞減的順次排列,據(jù)此生成協(xié)方差特征矩陣的對應(yīng)特征值及行向量,獲取關(guān)鍵特征值,并基于距離進行聚類分析,實現(xiàn)數(shù)據(jù)歸一化處理,將高偏離度的異常信息提取出來,繼而針對學(xué)生的異常行為狀態(tài)進行研測。
3.畫像生成與預(yù)警模塊
畫像生成與預(yù)警模塊在Echart、D3.Js的支持下,使用“七觀(人生觀、政治觀、道德觀、學(xué)習(xí)觀、消費觀、 交際觀、就業(yè)與發(fā)展觀)”與“六維(思想政治行為、道德行為、學(xué)習(xí)行為、社交行為、經(jīng)濟行為、求職行為)”學(xué)生肖像法生成學(xué)生個人畫像及班級、專業(yè)群體畫像,并支持學(xué)生校內(nèi)行為軌跡與即時查詢服務(wù),結(jié)合行為分析與挖掘模塊分析結(jié)論,建立大學(xué)生學(xué)業(yè)、心理、思想、群體突發(fā)事件等影響學(xué)生行為養(yǎng)成因子的預(yù)警機制,實現(xiàn)對學(xué)生異常行為的自動化預(yù)警,同時制訂有針對性的安全監(jiān)督措施。管理人員通過預(yù)警信息,能夠?qū)崟r感知并監(jiān)控在校學(xué)生的考試表現(xiàn)、上網(wǎng)行為、課堂表現(xiàn)、日常行為、活動參與、心理健康等方面的狀態(tài),挖掘?qū)W生異常數(shù)據(jù),反饋學(xué)生異常行為,做好事前防范工作,避免異常事態(tài)惡化,實現(xiàn)對異常事件的可查、可控、可追溯,切實保障學(xué)生在校的安全、健康與學(xué)習(xí)效果。
4.系統(tǒng)安全運行管控模塊
大學(xué)生校園行為大數(shù)據(jù)是高校重要的數(shù)據(jù)資產(chǎn),為了保障學(xué)生信息及隱私的安全性,高校需要開發(fā)系統(tǒng)安全運行管控模塊,在iPaas、Ldap和Kerberos等安全認證的支持下,做好大學(xué)生校園行為分析預(yù)警管理平臺的數(shù)據(jù)監(jiān)控與數(shù)據(jù)管理,從運維監(jiān)控、調(diào)度管理、安全管理、數(shù)據(jù)質(zhì)量、元數(shù)據(jù)管理等方面出發(fā),切實保障高校數(shù)據(jù)資產(chǎn)的安全性和可控性。
四、結(jié)語
綜上所述,智慧校園各類智能終端、傳感設(shè)備可以實時、動態(tài)、全面獲取大學(xué)生海量的活動軌跡及校園行為大數(shù)據(jù),而基于大數(shù)據(jù)關(guān)鍵技術(shù)所開發(fā)和搭建的大學(xué)生校園行為分析預(yù)警管理平臺,可以高效完成大學(xué)生校園行為大數(shù)據(jù)的收集與存儲、關(guān)聯(lián)分類與聚類分析,生成完整的學(xué)生畫像。
參考文獻:
[1]趙濤.基于智慧校園的高職學(xué)生行為數(shù)據(jù)采集與分析策略[J].襄陽職業(yè)技術(shù)學(xué)院學(xué)報,2022(6).
[2]喻宏偉.基于動態(tài)語義時空圖卷積網(wǎng)絡(luò)的大學(xué)生行為預(yù)測與分析[D].武漢:華中師范大學(xué),2022.
[3]喻宏偉,周東波,徐雯慧,等.基于多片段語義時空圖卷積網(wǎng)絡(luò)的大學(xué)生校園日常行為預(yù)測[J].清華大學(xué)學(xué)報(自然科學(xué)版),2022(1).
[4]葛蘇慧,萬泉,白成杰.基于Hadoop的高校學(xué)生行為預(yù)警決策系統(tǒng)研究[J].計算機應(yīng)用與軟件,2021(1).
[5]楊光瑩,杜敏,楊東梅,等.基于校園行為數(shù)據(jù)分析的學(xué)生畫像系統(tǒng)初步構(gòu)建研究[J].教育教學(xué)論壇,2020(41).
[6]施明毅,楊光瑩,杜敏,等.基于校園行為大數(shù)據(jù)分析的學(xué)生畫像系統(tǒng)構(gòu)建探析[J].中國多媒體與網(wǎng)絡(luò)教學(xué)學(xué)報(上旬刊),2020(4).
基金項目:2022年第一批教育部協(xié)同育人項目“突發(fā)公共事件下大學(xué)生網(wǎng)絡(luò)心理服務(wù)平臺建設(shè)研究”,項目編號:220602036230254。
(作者單位:江西宜春職業(yè)技術(shù)學(xué)院)