

摘 要:隨著移動學習和在線學習的普及,教育數據也進入了大數據時代,教育大數據應用一般有教育數據挖掘和學習分析兩類。文章分析了教育數據挖掘的工作流程和常見數據挖掘技術,探討了學習分析關鍵技術,分析了自適應系統并總結出該系統會越來越受歡迎。
關鍵詞:大數據;教育數據挖掘;學習分析;自適應系統
作者簡介:王若明(1979— ),男,湖北荊州人,講師,高級項目經理,信息系統項目管理師,碩士;研究方向:大數據。
隨著互聯網、物聯網、云計算技術的發展,社會進入了大數據(Big Data)時代。在教育界,大規模開放式在線課程(Massive Open Online Courses,MOOC)的推廣、以智能手機為代表的移動學習的普及,使數據呈爆炸性的增長,形成了教育大數據。大數據一般有3V特征:大規模性(Volume)、多樣性(Variety)和高速性(Velocity)[1],目前教育大數據應用主要有教育數據挖掘和學習分析兩類。
1 教育數據挖掘
數據挖掘(Data Mining)的作用是從數據中獲取隱藏的模式與知識,教育數據挖掘是從教育大數據中獲取隱藏的模式與知識。教育數據挖掘應用了計算機科學與教育學的理論和技術,可以促進學生有效學習,改進和優化教學資源和教學順序,判斷學生的學習趨勢。
1.1 工作流程
數據挖掘一般有預處理、數據挖掘和評估3個階段。教育數據挖掘是在教育環境下進行數據挖掘,包括教育環境、數據、預處理等,工作流程如圖1所示。
圖1 教育數據挖掘工作流程
1.2 常見數據挖掘技術
常見數據挖掘技術有關聯規則、聚類分類、協作過濾等。
(1)關聯規則技術,找出數據集中相關數據項之間隱藏的依賴關系,最終用關聯規則的形式表示。最經典的案例是沃爾瑪超市“尿布與啤酒”故事,經典的算法有Apriori等。
(2)聚類分類技術,根據數據的相似程度,將數據集中分成許多組,組內數據具有較高的相似度,組外數據幾乎不相似,該技術的特點是無監督學習,有K-meas等算法。
(3)協作過濾算法(Collaborative Filtering,CF),挖掘與用戶興趣相似的鄰居用戶,同時將鄰居用戶喜歡的對象推薦給用戶,CF利用“用戶—項目評分矩陣”對用戶興趣進行建模。
2 學習分析
學習分析是測量、收集、分析和報告有關學生及其學習環境的數據,用以理解和優化學習及其產生的環境的技術[2],對后續的學習給予預測與建議。目前流行的學習分析關鍵技術有網絡分析法、話語分析法和可視化技術等。
網絡分析法主要研究兩部分:節點和節點間的聯系,在教育環境中,利用網絡分析法來分析學習者之間的聯系對其學習效果的影響,目前網絡分析法工具有很多,如SNAPP,Gephi,UCINET等。
話語分析法是研究人們交流過程中使用的話語,即基于語言學的話語分析,在教育環境中,主要是研究學習過程中學習者學習交流所使用的話語。話語分析法可以應用不少工具,如WMatrix和Wordle等。
可視化技術是利用計算機的高速運算和處理能力,從海量數據中發現相關規律,并用散點圖、思維導圖、動態熱度圖等圖形向用戶呈現,幫助用戶分析。
3 自適應學習系統
自適應學習系統是教育數據挖掘和學習分析兩類技術的綜合應用,利用在線學習系統(如“學堂在線”等MOOC平臺)內存儲的學習行為數據,結合教育數據挖掘和學習分析兩項技術,為學習者提供高效的學習資源,也為教學中的其他相關人員提供幫助,提高教學效果和改善教學流程[3]。
3.1 工作流程
自適應學習系統有6部分:內容傳遞模塊、學習者數據庫、預測模塊、顯示模塊、自適應模塊和干預模塊,其流程如圖2所示[4]。
3.2 自適應方法
自適應學習系統最關鍵是生成自適應方法,本文研究的自適應方法均是基于模型的。
Alferez等[5]基于非功能性要求(Non-Functional Requirement,NFR)模型,是對非功能性需求進行建模與分析,并進行精化分解,另外在模型中添加了“度量標準”,這些標準一一對應非功能性目標。
Alferez等[6]研究了基于目標模型,目標模型不僅描述系統的功能需求,還描述系統的非功能需求。在該模型中,目標分解成一個個子目標,子目標代表一種方案,許多子目標可以組成一個個合適的自適應方案。
Elkhodary等[7]研究了基于特征模型,對功能性需求進行建模,一般用特征模型來建模軟件配置的空間,自適應操作其實是組合一系列合適的特征。
Pietschmann[8]研究了基于體系結構模型,對系統的構件與構件之間的交互進行建模,構件一般代表系統的主要計算元素,也可以代表系統的數據存儲。
4 結語
現在,教育數據挖掘和學習分析技術在教育中的應用,受到很多學習者的熱愛,隨著大數據技術的發展,尤其是在線教育的推廣,自適應學習系統或個性化學習模式會越來越受歡迎。
[參考文獻]
[1]孟小峰.大數據管理:概念、技術與挑戰[J].計算機研究與發展,2013(1):146-169.
[2]SIEMENS G.What are learning analytics[EB/OL].(2010-08-25)[2019-12-20].http://www.elearnspace.org/blog.
[3]李艷燕,馬韶茜,黃榮懷.學習分析技術:服務學習過程設計和優化[J].開放教育研究,2012(5):18-24.
[4]徐鵬.大數據視角分析學習變革:美國《通過教育數據挖掘和學習分析促進教與學》報告解讀及啟示[J].遠程教育雜志,2013(6):11-17.
[5]ALFEREZ G H,PELECHANO V.Context-Aware autonomous Web services in software product lines[C].Beijing:International Software Product Line Conference,2011.
[6]BENCOMO N,BELAGGOUN A.Supporting decision-making for self-adaptive systems:from goal models to dynamic decision networks[C].Springer:International Conference on Requirements Engineering:Foundation for Software Quality,2013.
[7]ELKHODARY A,ESFAHANI N,MALEK S.Fusion:a framework for engineering self-tuning self-adapive software systesms[C].Santa Fe:Proceedings of the 18th ACM SIGSOFT International Symposium on Foundations of Software Engineering,2010.
[8]PIETSCHMANN S.A model-driven development process and runtime platform for adaptive composite Web applications[J].Journal on Advances in Internet Technology,2010(2):277-299.
Design of education big data adaptive system based on data mining and learning analysis
Wang Ruoming
(Department of Computer Science, Guangdong Huali Technician College, Guangzhou 511325, China)
Abstract:With the popularization of mobile learning and on-line learning, education data has also entered the age of big data. This paper analyzes the working process and the common data mining technology of educational data mining, discusses the key technology of learning and analysis, analyzes the self-adaptive system and summarizes the more and more popular the system.
Key words:big data; educational data mining; learning analysis; adaptive system