董婧

摘要:綜合應用教育學、計算機科學、統計學、信息學等多學科理論可以實現對高校教育大數據的深層次挖掘和應用。采用Hadoop大數據挖掘云服務,構建了高校教育大數據挖掘系統,應用數據挖掘技術和統計方法處理曲靖師范學院本科教學評估期間收集的海量數據,可以實現對大學更加精準高效的管理以及智慧教與學,提高教育教學質量。
關鍵詞:教育大數據;數據挖掘;云服務;地方高等院校;Hadoop
中圖分類號:G642? ? ? ? 文獻標識碼:A? ? ? ? 文章編號:1009-3044(2018)34-0139-02
大數據時代的教育數據與傳統教育數據相比,具備實時性高、顆粒度細、真實性和決策性強等特點。教育大數據產生在教與學的各個環節[1],包括了各種類型的結構化、半結構化和非結構化的具有大數據特征的數據集,如教學數據、管理數據和科研數據,通過數據挖掘和分析、云計算等信息技術展現教育大數據的價值,各高等院校需要利用有效的信息技術來處理海量數據,挖掘出對高校教育教學管理決策有價值的信息[2]。教育數據挖掘主要采用了數據挖掘、數學統計和機器學習等技術對海量教育數據進行處理和分析并建立科學的數據模型[3],從中發現學習者學習結果與學習內容、學習資源和教學行為等一系列變量之間的相關關系,挖掘學生的學習習慣、學習興趣和學習偏好。
我國大數據在高等教育領域應用的原理性研究較少,有些支持理論尚處于初生階段缺乏相關的資料支持。隨著教育機構的信息化系統中積累的數據量日益增多,教育行業的管理人員在選擇資源時無法得到有效、優質的信息,導致部分有效的信息得不到發掘利用,出現“信息孤島”的現象[4]。數據挖掘技術可以從教育信息海量數據中發現有用的信息,讓教育系統中的各個參與者受益,為解決教育領域中存在的半結構化以及非結構化的決策問題提供依據。
1教育大數據關鍵技術
1.1交叉學科
利用教育大數據實現對高校教育大數據的深層次挖掘和應用,需要綜合應用教育學、計算機科學、統計學、信息學等多學科理論。近幾年來,教育領域和信息領域發生了歷史性的變革,各種在線學習平臺、智能手機應用和社交網絡為研究者提供了大量的應用和海量數據,但是這些數據還沒有被許多地方高校足夠重視與合理運用,利用許多新型的信息技術,如云計算技術、物聯網、移動計算和大數據技術,為分析和挖掘教育大數據提供了技術支持,可以將這些閑置數據變廢為寶,實現數據技術的有效處理,挖掘出蘊含的隱藏價值。
云計算服務解決了高校信息化建設中的信息孤島現象[5-6],可以集中整合分散的教育資源,使教師和學生能夠共享存儲在云服務端的教育資源,并且與各類終端設備無縫連接,將云服務端的各種分散的關系化、結構化和非結構化數據利用數據挖掘技術、數據分析和數學統計等方法進行分析和挖掘[7-8],通過數據挖掘技術得到的信息,可以準確分析評價課堂教學的質量。
1.2數據來源
地方高校目前普遍存在教育經費使用效率不高,教育投入產出比低;在教學組織形式方面,沿襲工業化時代的標準化教學內容、教學方法、考試制度、學科設置及人才培養模式,忽視學生的個性特征和認知發展等問題。曲靖師范學院剛完成普通高等學校本科教學工作審核評估,各個學院以及教輔部門收集整理了各個方面的資料,如教學設施、課程資源、社會資源、教學改革、課堂教學、實踐教學、第二課堂、招生及生源情況、學生指導與服務、學風與學習效果、就業與發展、教學質量保障體系、質量監控、質量信息與利用和質量改進等,涵蓋了學校教學與服務的方方面面,針對這些海量數據,如何為我校師生做到精準的教與學以及質量評價是一個難題。本研究主要以曲靖師范學院本科教學評估期間收集得到的最新教學狀態數據、學生網上學習的日志數據、用戶產生的UGC數據,比如微信、微博、論壇等數據為主,另外學校已開設了公共關系禮儀實務等10門爾雅通識課、唐詩宋詞人文解讀等9門好大學在線等多達幾十門MOOC課程,這些教學的過程數據可以實現全程采集,利用這些數據來為我校師生做精準化分析服務。
其中,基礎數據包括學生基本信息、招生及生源情況;管理數據包括學風與學習效果、教學質量保障體系、質量監控、教學評價;教學數據包括教學設施、課堂教學、教學改革、課程資源、MOOC課程和網絡課程教學平臺;科研數據包括教師各項科研成果、第二課堂、實踐教學、大學生創新創業項目;服務數據包括學生指導與服務、圖書檔案服務、學生網上學習日志數據;輿情數據包括UGC數據,如微信、微博、論壇等數據。
2教育大數據挖掘應用實現
2.1教育大數據分析系統框架
教育大數據分析系統采用Hadoop大數據挖掘云服務,它是一個開放的主要面向互聯網海量非結構化數據的分析和挖掘平臺,也支持結構化和半結構化數據,集成了多種基于Hadoop的并行數據預處理和挖掘算法,如K-means算法,系統框架如圖所示:
2.2數據挖掘與數學分析
數據挖掘是從大量的、有噪聲的、不完備的、隨機的數據中,發現隱含在其中的、人們事先不知道的、但是是潛在有用的信息和知識的過程。原數據通常是大量的、真實有效的、含噪聲的;數據挖掘的主要特點是對數據庫中的大量數據進行提取、轉換、分析以及其它模型化處理,挖掘出用戶感興趣的以及有助于管理者決策的重要信息。本文以曲靖師范學院的高校辦學狀態等數據為原始數據源,采用數據挖掘技術中的統計方法、機器學習方法和仿生物法建立模型,獲取教育大數據中隱藏的潛在信息。統計方法用到了回歸分析、聚類分析、主成分分析和關聯規則挖掘,機器學習方法主要用到支持向量機等相關算法,仿生物法主要用到神經網絡,使用SPSS Clementine數據挖掘軟件對學生特征行為分析模塊、學生就業因素分析模塊、學習結果預測模塊、教學質量監控評測、高校管理發展影響因素分析模塊等進行模型構建,進行實例仿真,相關的教育數據挖掘研究結果如下:
3 結論
采集高校和各學院的辦學狀態數據,通過數據挖掘技術,可以消除信息孤島,實現橫向關聯比較,縱向歷史分析,提供精準服務,支持科學決策。通過數據挖掘技術得到的信息,可以準確分析評價課堂教學的質量,實現對大學更加精準高效的管理,使得教和學更加智慧,具體來說,對本校各學院學生學習過程進行跟蹤,實現興趣、個性、情感等方面的動態分析與挖掘,兩者結合起來,建立基于用戶興趣和個性的資源推薦,最后實現個性化精準過濾;同時對教師的教學質量和效果可以進行綜合、動態和客觀的評價。通過數據挖掘、分析、可視化等技術展現教育大數據的價值,推動教育發展創新,提高教育教學質量。
參考文獻:
[1]周慶,牟超,楊丹.教育數據挖掘研究進展綜述[J]. 軟件學報, 2015,26(11):3026-3042.
[2]張燕南. 大數據的教育領域應用之研究——基于美國的應用實踐[D],華東師范大學, 2016.
[3]馬秀麟,衷克定,劉立超. 從大數據挖掘的視角分析學生評教的有效性[J].中國電化教育, 2014(333):78-84.
[4]彭濤,丁凌云.基于教育數據挖掘學生表現預測模型構建研究[J].黑龍江高教研究, 2015(11):55-58.
[5]崔杰,李陶深,蘭紅星.基于Hadoop的海量數據存儲平臺設計與開發[J].計算機研究與發展, 2012(49):12-18.
[6]何清,敖翔,莊福振,羅平.一種基于Hadoop的大數據挖掘云服務及應用[J].信息通信技術, 2015(6):42-49.
[7] Chen X, Vorvoreanu M, Madhavan KPC. Mining social media data for understanding students learning experiences[C]. IEEE Trans. on Learning Technologies, 2014, 7(3):246?259.
[8] Chang MM, Lin MC. The effect of reflective learning e-journals on reading comprehension and communication in language learning. Computers & Education, 2014(71):124?132.
【通聯編輯:王力】