徐博
DOI:10.16661/j.cnki.1672-3791.2017.30.017
摘 要:新的時期下如何更好地做好高校學生工作,是擺在高校教育工作者面前新的問題。同時,我們也應該可以看到,目前高校的信息化系統越來越完善,信息化水平越來越高,大量的學生行數據被學校的各個部門采集到,這些數據匯集在一起會對學生工作帶來什么影響呢?本文利用大數據技術,結合學生工作的要求和特點,重點提出了學生預警系統建設的思路和方法。
關鍵詞:大數據 高校 學生預警
中圖分類號:G444 文獻標識碼:A 文章編號:1672-3791(2017)10(c)-0017-02
為了實現高校從信息化過渡到智慧化的目標,引入大數據的體系,是關鍵性的一步。以往的開發模式是以高校業務為導向,流程運轉使得高效沉淀下來大量的業務數據。比如一卡通系統、教務系統、門禁系統、圖書館系統等。這些數據的特征鮮明,結構單一,是目前高校的核心數據資產,也是大數據實施的基礎。這類數據的存儲普遍采用傳統的關系型數據庫,比如Oracle、SqlServer等,以單個應用為主題進行設計,比如一卡通、教務、門禁等系統中都有記錄學生相關的數據,只是記錄的維度不一樣,而要實施大數據的項目,則需將這些數據綜合利用起來,從單維數據變為多維數據,以支持復雜的數據分析與調取。
但是數據本身而言,對于學校是寶貴的財富,我們要充分利用現有的數據,同時納入更多的數據源,真正構建智慧化校園的生態圈。
目前高校的能夠利用的數據一共分為三大塊,業務數據、機器數據以及互聯網數據。其中前面兩塊屬于校內數據,后面的互聯網數據屬于校外。
當前大部分高校還在整合第一塊的業務數據,通過建立傳統的數據倉庫/數據中心來將這些數據進行統一和集中的管理。這一步的建設,可以直接橫向打通各個業務系統的壁壘,應該來說這個路是正確的。但是對于后面兩塊的數據,重視程度不夠。機器數據實際上也是學校要實現智慧校園所不可獲取的數據基礎,廣泛分布于學校的無線網、門禁、視頻等,都屬于這一類數據,機器數據不僅僅數量龐大,同時記錄的信息也足夠全,合理整合及利用機器數據,是智慧校園建設的重中之重。而互聯網媒體數據則是存在于校園網之外,但是又跟學校緊密程度比較高的一類數據,在利用好業務數據和機器數據的同時,將互聯網數據也納入到整個學校的數據體系中,也是智慧校園建設的一個關鍵指標。
綜上所述,為了智慧校園的建設目標,我們需要打通業務數據,開發利用現有的機器數據,同時再納入互聯網數據,構建一個符合要求的大數據平臺。
1 架構設計
傳統的數據中心和數據倉庫的架構目標比較明確,但相對作用也很單一,就是針對學校各個業務系統所存儲的結構化數據,并且由于其采用的集中式存儲架構,對于PB級以上的數據規模處理起來已經十分吃力,同時對于非結構化數據,特別是軟硬件設備所產生的海量日志無法處理,而我們選用的平臺則實現了復雜的多平臺異構環境下,校園數據的融合及海量數據的存儲挖掘,是校園大數據應用的基礎設施。
1.1 數據流轉架構
數據是大數據存儲交換平臺核心處理對象,如何進行數據識別、抽取、存儲、計算、調取、呈現,激活高校數據價值,釋放高校沉淀數據紅利,是平臺數據流轉架構必須要解決的問題。
1.1.1 數據源
數據源主要包含高校各種業務系統的數據、機器的日志數據以及外部互聯網的數據。
(1)業務數據。
主要包含高校的一卡通系統、學工系統、門禁系統、教務系統、科研系統和圖書館系統等業務數據。主要是各個業務系統所對應的關系型數據庫中存放的基礎數據。
(2)機器數據。
主要包含高校無線上網日志、網絡日志和URL日志,這里包括主流廠商如華為、華三、銳捷、Aruba、深信服等設備的日志。銳捷的SAM身份認證日志和無線AP的記錄,記錄了用戶上網的身份認證信息以及各個無線AP設備所記錄的用戶連接信息。
(3)互聯網數據。
主要包含各大門戶網站、新聞、微博、社交、論壇以及貼吧等數據。針對這些數據可以利用爬蟲引擎采集數據,經過清洗處理后存入大數據平臺中。
1.1.2 數據采集
為了智慧校園的建設目標,我們需要打通業務數據,開發利用現有的機器數據,同時再納入互聯網數據,這里我們需要將各種數據進行采集,經過清洗合并后存入到大數據平臺中。
針對高校的一卡通系統、學工系統、門禁系統、教務系統、科研系統和圖書館系統等業務數據通過ETL引擎定期推送到MySQL集群的大數據基礎平臺中。這里一般采用比較常用的ODI工具來進行推送。
針對高校無線上網日志、網絡日志和URL日志,這里包括主流廠商如華為、華三、銳捷、Aruba、深信服等設備的日志,通過開源軟件Flume去接收,并存放至NFS集群中。利用Ruby語言寫一個程序實時從NFS集群中讀取數據,經過清洗轉換然后分別寫入MySQL集群、Redis集群和Elasticsearch集群的大數據基礎平臺中。
但是從設備接收的日志中,不包括用戶與用戶設備的對應關系,這導致無法進行關聯查詢。高校上網認證系統有很多,常用的認證系統有SAM,SAM中包括了用戶與用戶設備的對應關系,所以這里通過Webservice接口從SAM系統中獲取我們關注的信息然后清洗轉換直接存放至MySQL集群中。
根據數據的規模和類別,對于數據計算分為離線的數據處理和在線實時數據處理。其中離線數據處理即采用傳統的Hadoop的MapReduce計算方式,通過大量廉價的硬件服務器分解海量的數據到單個節點進行計算,之后將結果匯總給客戶端。
1.2 業務應用類場景endprint
1.2.1 學生異常行為
隨著外部社會環境的日益復雜,高校對于學生的學習、生活情況需要異常關注。依據調查分析,平均1名高校輔導員管理的學生有300人,在數據無法及時分析處理的情況下,輔導員遇到的問題越來越多。
(1)輔導員工作繁忙,還需要花大量的時間用巡查的方式了解學生狀態。
(2)學生在跨越一段時間內的多個細微異常舉動很容易被忽略,留下隱患。
(3)信息分散在各個業務系統中,了解學生的情況需要登錄多個系統,耗時費力。
(4)大事發生,學校先知道,學院最后知道!小事發生,輔導員無從察覺,事態嚴重,學校才知道。
(5)學生辦理事務,各層級掌握信息不同,一件事要多個層級確認。
(6)各院系,以及輔導員日常學生安全管理工作成效很難被量化。
學生安全行為管理系統專為這種場景所定制,匯集多業務系統數據,通過合理的數據建模方式,加強管理水平,確保校園安全,提高學生安全感。
平臺價值如下。
(1)校領導:學生安全一目了然。通過報表、圖形、態勢圖了解學生校內生活、學習情況。
(2)學工處:由被動管理轉化為主動服務。落實“以人為本、服務為先、學生至上”的服務理念。
(3)輔導員:傳統意義上的學生管理,每名輔導員少則管理200~300名學生、多則管理500~600名學生。輔導員幾乎將全部的時間和精力放在學生安全管理上,無法為學生提供其他服務,同時也未必會取得良好的效果,在及時性和有效性方面都有所欠缺。
使用學生安全管理平臺后,系統篩選出存在風險的問題學生,輔導員可以將精力放在重點的1~20名學生身上,在學生安全方面會減少約90%的工作量,便于輔導員將更多的時間和精力投入到為學生提供更優質的服務中去。
1.2.2 學生心理健康
學校心理健康中心的心理輔導專家,每天會接到很多輔導員和家長的電話咨詢。由于缺少數據支撐,只能通過談話溝通、問卷調查獲取信息,信息缺失非常難以判斷學生的心理波動。
(1)校領導。通過大數據建模分析手段,大大減少因為學生心理問題帶來的極端事件從而對學校造成較大影響事件的概率。
(2)學工處。龐大而復雜的學生管理工作從以前的被動轉變為主動,面對數以萬計的在校學生,通過數據的綜合分析獲取普遍學生對于學校管理方式的反饋,及時修正管理措施,針對個別學生會出現的心理變化問題,及時捕捉、重點監管的范圍縮小90%以上,同時對于已經確定的人群則可以進行實時重點關注。
(3)輔導員。利用數據資源,縮小異常表現學生的范圍,提升輔導員監管效率和減輕工作量。
參考文獻
[1] 范玉朋.基于高校公共數據中心的大學生預警平臺設計研究[J].赤峰學院學報,2017(6):37-38.
[2] 李國俊,劉雪琳.高校應對學生突發事件的預警能力評價研究[J].高教學刊,2017(16).
[3] 張晶華,丁福興,陳永靜.大學生學業風險管理:預警評估與干預幫扶[J].牡丹江大學學報,2017(4):166-168.
[4] 貝虹.大學生心理問題及其預警干預機制研究[J].東方教育,2015(8).endprint