方勇
摘要:該文介紹了大數據的概念,分析了高校學生行為數據的特點,對大數據在高校學生行為數據分析中的應用進行了闡述。
關鍵詞:大數據;機器學習;高校學生行為
中圖分類號:TP31 文獻標識碼:A
文章編號:1009-3044(2019)30-0005-02
1大數據技術介紹
隨著信息技術和互聯網行業的飛速發展,人們各項日常生活產生了大量種類繁多的數據,這些數據非常復雜和龐大,迫切需要大數據技術來管理和挖掘有價值的信息。大數據的定義各式各樣,比較有權威性的是麥肯錫咨詢公司給出的:大數據指的是在大小超出常規的數據庫工具獲取、存儲、管理和分析能力的數據集,具有海量的數據規模、快速的數據流轉、多樣的數據類型和價值密度低四大特征。
當前,大數據作為一種寶貴的信息資產,正在全球飛速發展,引起了各行各業的極大關注。通過有效管理和分析大數據,提取其價值,能夠為行業提供優質的服務,實現極其巨大的經濟和社會價值。高校在信息化過程中產生了大量與學生相關的數據,形成了龐大的數據資源。很顯然,應用大數據技術,整合教育教學管理等方面信息,將對“智慧校園”建設產生重大而深遠的影響。
2高校學生行為數據的采集
目前各高校都圍繞智慧校園建設了學習管理、教務管理、財務管理等系統,每個應用系統都有海量的非結構化、半結構化或者結構化的歷史數據信息,加工處理這些大數據,可以產生很好的應用效果。
(1)采集大學生日常生活的一些數據,包括網絡通信數據、學生生活消費數據、學生及財務數據等,實現海量數據的辨別、轉換、傳輸和管理等功能。大數據平臺的建立采用虛擬服務器,實現各類數據的獨立處理和分析。
(2)數據抽取挖掘,包括對不完整、有雜音的不同類型數據的梳理、抽取、轉換。它是大數據處理之前非常重要的一步,可以用Hadoop大數據處理技術中的Hive工具作為數據抽取工具,HBase作為數據存儲庫,MapReduce作為數據處理技術。
(3)數據清洗及匯總,包括對不同來源的各類復雜、無序數據的清洗,它是完成大數據原始匯集的最后一步。大數據來源眾多,不一定是系統所需的目標數據,為避免某些數據在數據分析過程中影響分析結果,需要對它們做清洗、除燥,這樣未來的分析結果會更準確。
3大數據在高校學生行為數據分析中的應用
3.1學生行為數據分析的核心技術
(1)機器學習
機器學習是一門涉及多領域交叉學科,它通過對已知的大量數據進行分類器或算法的訓練,實現自我完善,求出決策函數,快速準確的對未知樣本預測,逐步實現機器代替人工的工作。常用的機器學習算法有決策樹、K-means、SVM、貝葉斯分類器等。
(2)大數據技術
傳統技術難以滿足對海量數據實現實時分析和處理,迫切需要由大數據技術來協調各部分之間的關系,實現對數據分析與挖掘。Spark作為一種開源通用并行框架,更好地利用了內存,相比于Hadoop更加適用于數據挖掘和機器學習等需要反復迭代的算法。
(3)輿情分析技術
學生的對于某些事件的評論無處不在,這些評論帶有主觀的感情色彩。利用大數據技術對他們的觀點及評論進行分析,判斷評論者的態度及情感性質。目前對于這類文字的分析可以從詞語、句子及篇章三個方面進行,初期通過詞語分析,對其詞性的情感進行判斷,而后逐步通過句子的形式及特點,結合一定的算法,判斷文章的性質。
3.2應用大數據分析高校學生行為數據
學生行為數據眾多,可以從以下幾個方面應用大數據進行分析:
(1)在學習方面,通過大數據分析在校學生的選課及考試數據,一方面對成績優異的學生建立學習榜樣模板,研究其學習、生活行為規律,廣泛在其他學生中宣傳應用,提升教師的教學水平和學生的學業成績。另一方面對有成績異動波動的學生進行監控,引起教師和管理人員警覺,找出異動的原因,對癥下藥。
(2)在學生就業方面,通過大數據分析學生的綜合測評數據、就業反饋信息,通過對學生就業情況的分析以及在校表現綜合分析,總結教學中的優缺點,對不同專業的學生,重點加大對影響學生成長就業的關鍵點進行投資,大力度發展學生社會實踐,提高教學質量和就業率。
(3)在消費方面,通過大數據分析學生的飯堂消費數據、小賣部消費數據以及水電費消費數據,挖掘學生的頻繁出入地點,繪制學生每日熱點活動區域,總結學生的業余生活規律,供輔導員管理,及時指導改善。
(4)在德行方面,通過大數據分析學生的圖書館信用積分、師生評價、獎助信息、社會實踐活動記錄等,分析學生的思想道德和行為準則,對某些學生改進思想教育工作。
(5)在心理方面,通過大數據分析學生的日常消費數據、教師教學反饋信息、輔導員反饋信息,及時重點關注類似于孤僻、偏激、妄想等異常學生動態,采取有效措施,保障學生心理健康發展。這方面的例子很多,例如某學生某段時間內心比較孤僻,導致課堂表現差,成績不好,就可以通過教學及消費數據分析預警。
4結束語
隨著校園信息化和大數據技術應用的飛速發展,采用大數據分析學生的行為,為教師因材施教提供支持,能提升高校學生管理人員的工作效率、服務質量,相信將來會產生更加深遠的影響。