鐘達彬,何鑒榮
(職業技術學院,廣東 佛山 528137)
新形勢下,高校要緊跟時代發展,積極進行數字化校園的建設,不僅有利于高校深化改革的推進,還有利于智能化校園管理和提升服務水平。因此,對高校數字化校園大數據綜合分析研究對構建智慧校園具有重大的現實意義。
高校數字化校園以校園網為基礎,結合校園工作教學情況來構建數字空間,它方便高校管理,使復雜的校園管理工作變得簡單而高效。例如,目前高校中普遍使用校園一卡通,學生只要有一張校園卡,就可以輕松實現在整個校園內進行各種活動,包括食堂吃飯、便利店購物、圖書館借閱等。同時,對于高校來說,學生的一切日常消費活動都會通過校園卡來體現。高校可以根據學生消費記錄以及消費習慣來綜合評定學生的生活情況,這也是進行貧困生評選的重要參考,能夠使真正貧困的學生獲得應有的幫助。
“互聯網+”背景下,高校學生思維更加活躍,視野更加開闊,對新生事物的訴求也更加多樣化。高校在進行學生管理工作時,不僅要滿足學生學習和物資方面的需求,而且要關注學生的精神和心理方面。數字化校園的一個重要作用就是能夠為學生和教師之間搭建一個相互溝通的橋梁,學生的網絡行為會在校內網中以網絡日志的形式進行記錄。因此,研究人員可以利用Hadoop大數據技術分析這些日志內容,以充分了解學生上網習慣、作息規律以及心理需求等,及時發掘學生的一些異常網絡行為,針對性地進行引導學生,確保學生身心健康,從而更好地提升學生管理服務水平,為學生做好保障工作,構建和諧、健康的校園環境。
高校數字化校園包含了大量的數據信息。高校內所有的教學資源、科研數據、規則制度信息等涉及高校教學和管理活動的方方面面,統一構成了高校巨大的數據信息。這些數據信息有許多具有重要價值的信息,例如:高校財務數據信息、人事管理信息、學生個人基礎信息等,龐大的數據信息背后隱藏著巨大的價值意義。因此,高校需要深化改革,對這些數據信息進行充分利用、科學分析、深入挖掘,以數據信息為基礎對高校各項工作進行有效的管理,將數據信息轉化為管理工具,發揮其重要作用,為高校教學、管理以及服務提供更多的幫助。
目前,高校數字化校園建設過程中,普遍存在數據的規模不斷增大而數據質量不高的問題,具體表現為:首先,數據格式沒有統一標準。由于高校中不同的崗位或者部門在工作中對于數據的使用習慣不同而造成數據的格式不一致,并且也沒有相關的標準作為參考;其次,數據維護不到位。隨著高校數字化校園建設的不斷深入,高校在管理方面確實感受到了極大的便利性,但是同時對于數據維護工作沒有進行科學管理,缺乏對其重要性的認識;最后,對于無用的數據缺乏科學的處理方法。高校在日常工作中會產生大量的數據信息以及緩存文件。其中,大部分數據復用價值不高,而有些數據對于后期工作的開展具有一定的指導意義,而高校并沒有對這些數據進行整理和利用,造成高校信息系統數據規模不斷增大,而同時數據質量又不高,造成了數據資源的浪費。
高校數字化校園對數據資源缺乏充分利用體現在:一是,存在數據孤島。部分系統之間難以進行實時查詢和調取。高校師生需要根據需求登錄不同的業務系統進行相關消費記錄、圖書借閱情況、教師的教學情況以及科研成果等的查詢;二是,高校對于數據資源缺乏深入挖掘。大數據時代,數據資源潛藏著巨大的價值,它包含了高校師生的一些基礎信息,同時對于這些信息的提取和分析能夠有效指導高校管理工作。然而,目前高校在對數據的深入挖掘和科學分析方面做得還不夠,嚴重影響數據資源的價值發揮。
隨著大數據分析技術的不斷發展,傳統的分析工具難以跟得上實際需求。目前,人們對數據分析工具的開發還不夠成熟,開發出可以滿足絕大部分數據分享需求的通用技術軟件目前來說還難以實現。然而,隨著大數據技術的發展,人們對于專業分析工具的需求會不斷提高,在不久的將來,很有可能因為專業分析工具的開發不足對大數據的發展造成一定的制約,甚至會在一段時間內停滯不前,影響各行各業大數據的應用發展。
由于數字化校園建設的推進,高校在日常工作管理中不可避免會產生大量的數據信息,可以建立數據庫采集系統對這些數據進行記錄,將數據庫采集系統直接與校園網業務后臺服務器結合,將學校日常工作中產生的相關記錄寫入數據庫,再由特定的處理分析系統進行系統分析。對于大數據采集技術可以通過Hive來實現,它是一種建立在Hadoop之上的開源數據倉庫解決方案,支持使用PB級別的可伸縮性的數據倉庫[1]。Hive技術極大地降低了用戶學習門檻,能夠實現對數據庫中的數據進行簡要分析與計算。此外,高校在進行數字化校園建設中,還需要制定統一的數據采集標準,對符合條件的數據進行單獨留存,并對無效數據進行及時清理、粉碎。統一篩選流程,在進行數據的采集、儲存、整理和分類等方面都需要按流程進行,以此做好數據信息管理,使數據信息能夠發揮更大作用,服務校園建設。
數據資源潛藏著巨大的價值信息,高校數字化校園的建設中勢必會有大量的數據信息產生。因此,高校方面應當對這些數據進行整理和分析,利用信息技術挖掘數據信息更深層的價值,發揮數據資源更多的價值,以此為高校在進行學生管理、科研工作以及教學改革等諸多方面提供指導。對于數據的分析模塊和處理模塊可以在一個Hadoop集群系統中部署完成,在具體的應用中,Hive部署在Hadoop 集群系統中的NameNode節點上。在數據分析模塊中,Hive可以將校園中非結構化數據進行轉換,映射成數據庫表,同時能夠提高類SQL查詢功能,將SQL語句轉化為MapRe-duce任務進行運行,同時能夠對用戶發出的查詢請求進行接受,并提供查詢服務,將查詢結果通過輸出模塊進行查詢結果的輸出。查詢結果通過Hive數據分析模塊后,Hive對這些數據進行編譯和解析,最終將生成的MapReduce任務交給數據存儲模塊[2],經過處理后再通過數據分析模塊返回給結果輸出模塊,最終為用戶呈現出網頁、圖表、表格等多種形式。教師可以通過對這些數據進行分析來更好地進行教學計劃的調整和改革。
數字化校園可以利用大數據技術了解學生的網絡行為,例如:可以通過對校內網絡日志文件進行深度分析。首先,利用7臺相同的服務器組成Hadoop/Hive集群,并在這些服務器中部署centos 7操作系統,同時配置Hadoop 2.8.4,采用Hadoop和zookeeper搭建大數據集群,同時配置Hive-0. 7.0以及Flume數據采集工具[3]。在進行數據分析時,首先輸入高校校園內網絡日志,從學生宿舍流量、一周內搜索次數、發帖次數、網購次數等多方面進行分析,最終呈現出相應的分析結果,針對其中數據過高的學生宿舍應當給予高度關注,并及時把相關情況同步至學生處與班級輔導員。
高校數字化校園大數據的應用已取得了一定的發展,通過數據采集技術以及數據挖掘技術,大數據技術為校園管理者提供了更多有價值的信息,為數字化校園建設提供了新方法、新突破,促進了高校數字化發展,為新時代高校高質量發展提供良好支撐。