999精品在线视频,手机成人午夜在线视频,久久不卡国产精品无码,中日无码在线观看,成人av手机在线观看,日韩精品亚洲一区中文字幕,亚洲av无码人妻,四虎国产在线观看 ?

網絡學習行為與成績的預測及學習干預模型的設計

2019-04-01 06:23:04王改花傅鋼善
中國遠程教育 2019年2期
關鍵詞:數據挖掘模型研究

王改花 傅鋼善

【摘要】網絡學習已成為互聯網+時代教育發展的重要組成,如何對網絡學習者的學習行為與成績進行預測,依據預測結果實施學業預警,并為教學決策提供依據,是網絡教育需要解決的問題之一,也是教育大數據研究的重要問題。本研究采用數據挖掘技術中的決策樹方法對網絡學習者的學習行為與成績進行了預測,構建了適應性學習系統學習干預模型,研究發現總成績不及格的最高概率是男生、學習時間跨度表現較差的最高概率是碩士生、學習總時長表現較差的最高概率是男生、平均每次在線學習停留時長表現較差的最高概率是男理科生、討論交流表現較差的最高概率是藝術生、學習筆記表現較差的最高概率是女藝術生、接受反饋數量較高的最高概率是男生。

【關鍵詞】? 決策樹;數據挖掘;網絡學習;學習行為;學習成績;學習干預;適應性學習;學業預警;教學決策

【中圖分類號】? G434? ? ? 【文獻標識碼】? A? ? ? 【文章編號】 1009-458x(2019)2-0039-10

一、引言

截至2017年12月,中國在線教育用戶規模達1.55億,較2016年底增加1,754萬人,年增長率為18.8%;在線教育使用率為20.1%,年增長率為12.7%(中國互聯網絡信息中心, 2018)。網絡學習已成為互聯網+時代教育發展的重要組成。《教育信息化“十三五”規劃》明確指出,依托網絡學習空間逐步實現對學生日常學習情況的大數據采集和分析,優化教學模式(中華人民共和國教育部, 2016)。目前關于教育大數據的研究與實踐正處于起步探索階段,推進教育大數據普及應用是當前的研究熱點。教育大數據研究與實踐一方面對掌握教育發展現狀、制定科學教育政策、配置合理的教育資源等具有重要意義;另一方面對實現個性化學習、優化教學、多元學業評價、實時學習預警等具有重要意義。如何對網絡學習者的學習行為與成績進行預測,依據預測結果實施學業預警,并為教學決策提供依據,是網絡教育需要解決的問題之一(徐鵬, 等, 2013; Macfadyen & Dawson, 2010),也是教育大數據研究的重要問題(Kostopoulos, et al., 2017)。數據挖掘是大數據采集和分析的重要技術手段。

二、研究綜述

對采用數據挖掘方法預測網絡學習者學習表現的研究進行分析,可發現如下特點:第一,已有研究主要采用決策樹、回歸分析、神經網絡、樸素貝葉斯、支持向量機、時序分析、聚類等算法,其中決策樹與回歸分析用得最多。第二,研究內容主要集中在成績預測理論模型的構建、成績預測模型的實證研究、算法準確性的對比、算法的開發、預警因素研究、綜述研究等。關于成績預測理論模型的構建,這類研究主要采用數據挖掘技術從理論上構建成績預測模型(Ohia, 2011;武法提, 2016; 王林麗, 等, 2016; 牟智佳, 等, 2017a);關于成績預測模型的實證研究,這類研究主要開發成績預測系統或實現成績預測模型,并將其應用于教學實踐中(Macfadyen & Dawson, 2010; Xing, et al., 2015; 馬杰, 等, 2014; 王亮, 2015; 孫力, 等, 2015, 2016; 陳子健, 等, 2017);關于算法準確性的對比研究,這類研究主要是通過對比幾種不同的預測算法,來發現預測準確性最高的算法(Kostopoulos, et al., 2017; Romero, et al., 2013; Costa, et al., 2017; 牟智佳, 等, 2017b);關于算法開發,這類研究主要是結合幾種數據挖掘的算法構建一種集成分類器,從而提升分類的準確性(Kotsiantis, et al., 2010; Huang & Fang, 2013);關于預警因素研究,這類研究主要是探索哪些屬性和因素能夠較好地預測學習者學習績效(Romero, et al., 2013; Pursel, et al., 2016; Barba, et al., 2016; 傅鋼善, 等, 2014; 趙慧瓊, 等, 2017; 牟智佳, 等, 2017b);關于綜述研究,這類研究主要是對基于數據挖掘的學習預警研究進行文獻綜述(肖巍, 等, 2018)。第三,研究工具主要是Weka,其次還有SPSS、SQL Sever 2008 Data Mining、SSAS等。第四,使用的預測分析變量主要有人口學變量、個人背景信息、學習行為參與變量,用這些變量來預測學習者的總成績(通過或未通過),對學習者行為表現的預測相對較少。第五,研究對象主要是大學生,數量大多數是介于100~500人之間,數量相對較小。第六,研究正處于起步階段,是未來重要的研究領域,但國內研究與國外研究相比,國內研究相對起步要晚,研究的廣度與深度有待加強。因此本研究采用數據挖掘技術中的決策樹方法對網絡學習者的學習行為與成績進行預測,設計適應性學習系統學習干預模型,以期為教師了解學習者的群體特征與改善教學決策提供數據依據,同時為適應性推送服務和有效學習提供理論基礎。

三、研究方法

(一)研究對象

自2002年以來,“現代教育技術”大規模在線開放課程與時俱進、不斷更新,先后以國家精品網絡課程、國家精品資源共享課、中國大學MOOC、國家精品在線開放課程等多種形式的大規模在線開放課程開展網絡學習。2017年被認定為首批國家精品在線開放課程。課程豐富的特色資源,靈活多樣的教學方法和行之有效的學習活動,受到學習者的普遍好評。

本研究對象為2012~2013學年第二學期參加“現代教育技術”在線開放課程學習的陜西師范大學2,687名大三師范類本科生和210名教育碩士,共計2,897名。在實際學習過程中,有56名學習者由于種種原因沒有成功注冊參與在線開放課程的學習,因此有效學習人數為2,841名。通過前期數據清洗(即處理原始數據中的噪聲數據、無關數據、缺失值、臟數據、孤立點等),研究對象共剩余2,801名,其中性別分布為943名男生,1,858名女生;學科背景分布為1,399名理科生,995名文科生,407名藝術生;學歷分布為2,657名本科生,144名碩士。為了確保研究結果的可信,本研究還進行了兩次驗證,驗證結果與本研究結果一致,本文呈現的是第一次的驗證結果。

(二)數據收集與分析

決策樹是一種常用的數據挖掘分類方法,常用于預測模型,它通過將大量數據有目的地分類,從中找到一些具有商業價值的、潛在的信息。決策樹的結構,顧名思義,就像一棵樹,它利用樹結構將數據記錄進行分類,樹的一個葉節點就代表某個條件下的一個記錄集,根據記錄字段的不同取值建立樹的分支;在每個分支子集中重復建立下層節點和分支,便可生成一棵決策樹(唐華松, 等, 2001)。決策樹方法的優點在于形式簡單,計算復雜度不高,易于實現,輸出結果易于理解;數據的準備工作簡單,能夠同時處理數據型和常規型屬性,在相對短的時間內能夠對大型數據源做出可行且效果良好的結果;易于通過靜態測試來對模型進行評測,可以測定模型可信度(王國平, 2014, p.142)。基于文獻綜述與決策樹的優點,本研究采用決策樹方法對網絡學習行為與成績進行預測。

本研究的研究工具為SQL Sever 2008 Data Mining,采用Microsoft SQL Server Analysis Services中的Microsoft決策樹算法。該算法是一種混合決策樹算法,支持分類與回歸兩種任務,可以對離散屬性或連續屬性進行預測性建模,本研究對離散屬性進行預測性建模。數據挖掘的過程為問題定義、數據準備、數據預處理、數據挖掘、模型評價。

1. 問題定義

本研究采用決策樹挖掘模型對不同性別(UserSex,男、女)、不同學科背景(Department,文科、理科、藝術)、不同學歷(Edulevel,本科、碩士)的學習者群體學習行為特征及總成績進行評估與預測,以期讓教師能夠更加清晰深入地了解每類學習者群體的特征,為教育決策提供實證數據依據。

2. 數據準備

為了建立學習者模型,必須收集大量的學習者信息數據,進行數據預處理。因此,需要對模型中所有需要的歷史數據進行分析和處理,以便充分挖掘出學習者的關鍵行為特征。本研究選取了三類特征數據:①學習者基本特征,即學習者資料數據,該特征數據集包括2,841條記錄,每條記錄包括21個特征;②學習者行為特征,即學習者的學習行為特征數據,該特征數據集包含9張表、2,548,709條記錄、137個行為特征;③學習者學習效果特征,即學習者成績,該特征集包含6張表、55,957條記錄。

3. 數據預處理

數據預處理是數據挖掘前期重要的、不可忽視的環節。據統計,在完整的數據挖掘過程中,數據預處理要花費60%左右的時間,而后的挖掘工作僅占總工作量的10%左右(元昌安, 2009, p. 40)。數據預處理主要包括數據清洗、數據集成、數據變換、數據規約。通過數據預處理,本研究提取了9個特征,分別為學習時間跨度(TotalTime,簡稱TT),即學習者從第一次登錄系統到最后一次退出系統的時間周期;學習總時長(OnlineMinute,簡稱OM),即學習者在該網絡學習平臺上累積的學習時間長短;學習次數(LoginNum,簡稱LN),即學習者登錄學習平臺的次數;平均每次在線學習停留時長(AverageTimePerLogin,簡稱ATPL),即學習者平均每次學習持續的時間長度;重復學習率(KnowledgePerRepeat,簡稱KPR),即學習者平均對每個知識點重復學習的次數;討論交流(簡稱BBS),即參與BBS討論交流的特征;學習筆記(簡稱Blog),即學習者參與數字學習筆記的特征;接收反饋數量(SmsInfo,簡稱SI),即學習者在學習過程中接收督促學習信息的數量;總成績(ScoreTotal,簡稱ST),即學習者學習總成績。

數據清洗,即處理原始數據中的噪聲數據、無關數據、缺失值、臟數據、孤立點等。例如:教育碩士的學歷信息有誤,通過SQL語言改正;刪除只注冊但并未進行學習的學習者信息、交換生與休學生信息、考試權限為0的學習者信息;刪除教師、其他用戶(除陜西師范大學)、管理者信息;刪除空缺值信息等。

數據集成,即將兩個或多個數據源中的數據,存放在一個一致的數據庫中,重點考慮數據一致性和冗余。

數據變換,即將數據變換為適合于數據挖掘的形式。包括數據泛化、數據規范化、特征構造、數據離散化。①數據泛化,即使用概念分層,用高層概念替換低層或原始數據。本研究對專業通過高層概念學科背景“理科、文科、藝術”實現泛化。文科包括歷史文化學院、文學院、外國語學院、政治經濟學院、心理學院、教育學院,理科包括化學化工學院、計算機科學學院、旅游與環境學院、數學與信息科學學院、物理學與信息技術學院、生命科學學院、新聞與傳播學院(教育技術學專業),藝術包括音樂學院、美術學院、體育學院。②數據規范化,即將原來的度量值轉換為無量綱的值。本研究選取最大—最小規范化,使連續型數據取值范圍為[0-1]。③特征構造,即利用已知屬性,構造新的屬性,以便更好地刻畫數據的特性,幫助數據挖掘過程。其目的是幫助提高精度和對高維數據結構的理解。但數據集的特征維數并非越高越好,維數太高容易導致維災難,維數太低又不能有效獲取數據集中的重要信息。本研究構造的特征包括學習時間跨度(如公式1)、平均每次在線學習停留時長(如公式2)、重復學習率(如公式3)、討論交流(討論交流與學習者的發主帖數量、點擊量、被回帖數量以及回帖數量、點擊量特征密切相關,且考慮到不同低維特征反映高維特征的重要性不同,為其設置不同的權重,如公式4)、學習筆記(學習筆記與學習者的學習筆記數量、更新量、點擊量密切相關,且考慮到不同低維特征反映高維特征的重要性不同,為其設置不同的權重,如公式5)、總成績(總成績由網上作業成績、實踐技能成績、網上考試成績、期末筆試成績構成,如公式6)。④數據離散化,決策樹要求數據是分類屬性,因此需要對數值進行離散化。無監督離散化方法主要有等寬離散化、等頻離散化、K均值離散化,K均值性能最好,因此本研究選取K均值離散化方法,結果如表1、表2所示。

公式1:學習時間跨度=學習者最后一次退出平臺時間-學習者第一次登陸平臺時間…(1)

公式2:平均每次在線學習停留時長=學習總時長/學習次數…(2)

公式3:重復學習率[=k=0n]學習者每個知識點重復學習次數/學習者學習知識點總數…(3)

公式4:討論交流=0.6×(0.4×發主題帖數量+0.3×主題帖點擊量+0.3×主題帖被回帖數量)+0.4×(0.4×回帖數量+0.6×回帖點擊量)…(4)

公式5:學習筆記=0.5×數量+0.3×更新量+0.2×點擊量…(5)

公式6:總成績=0.1×網上作業成績+0.2×實踐技能成績+0.2×網上考試成績+0.5×期末筆試成績…(6)

數據規約,即通過使用編碼或變換,得到原始數據的歸約或壓縮表示。例如將在線總時長數據進行無損歸約,將原始數據“005-01-01 17∶09∶03.877”變換單位為分鐘的數據。

四、研究結果

(一)總成績決策樹數據挖掘結果

1. 挖掘結構

挖掘結構如圖1所示。

2. 挖掘模型

將UserNum設為“鍵”列,用于唯一標識事例表中的每條記錄;將UserSex、Department、EduLevel作為“輸入”列,作為發現數據模式的基礎;將ScoreTotal作為“可預測”列,對學習者的學習成績進行預測。將測試事例的百分比設定為30%,即記錄中的70%將被用于定型該數據挖掘,30%被用于測試模型。如圖2所示。

3. 數據挖掘結果

Microsoft 決策樹查看器提供兩種視圖“決策樹”“依賴關系網絡”。“決策樹”視圖結果如圖3、圖4、圖5、圖6所示,特點是生成一棵形如二叉或多叉樹的決策樹。該樹是水平布局,根節點在最左邊,每一個節點包含一個柱狀條,用不同顏色來代表不同的狀態。樹的葉子節點代表某一類別值,非葉子節點代表某個一般屬性的一個測試,測試的輸出構成該非葉子節點的多個分支。從根節點到葉子節點的每條路徑形成一條分類規則,一棵決策樹能夠方便地轉化為一系列分類規則。可以依據分類規則直觀地對未知類別進行預測。各節點的背景色表示所選狀態的事例的密集程度,顏色越深表示該事例越多。通過決策樹的樹形可視化,可以了解每個葉子節點的分類規則所需要的最重要的變量。“依賴關系網絡”視圖結果,如圖7所示,特點是可以顯示挖掘模型中輸入屬性和預測屬性間的依賴關系。每條邊有一個權值,它與左邊的滑塊相關。通過調整查看器左側的滑塊可以查看依賴關系強度,若向下拉動滑塊,則查看器中只會顯示最強鏈接。通過調整左側滑塊,可以發現,成績與學科背景的關系最密切,其次是性別,最后是學歷。

圖3是學習者總成績為A的決策樹,所提取的最重要的規則為1條:IF UserSex='女'AND Edulevel='碩士 ' THEN ScoreTotal='A'。得到以下結論:總成績得A的最高概率是女碩士生;性別是最重要的變量,其次是學歷變量,最后是學科背景。

圖4為總成績為B的決策樹,所提取的最重要的規則為2條:①IF Department= '文科' AND UserSex= '女 ' THEN TotalScore= ' B ';②IF Department= '理科' AND UserSex= '非男 ' THEN TotalScore= ' B '。得到以下結論:總成績得B的最高概率是文科女生,其次是理科女生;學科背景是最重要的變量,其次是性別變量,與學歷變量沒有關系。

圖5所示為總成績為C的決策樹,所提取的最重要的規則為1條:IF Department= '藝術 ' THEN TotalScore= ' C? '。得到以下結論:總成績得C的最高概率是藝術生;學科背景是最重要的變量,其次是性別變量,與學歷變量沒有關系。

圖6為總成績為D的決策樹,所提取的最重要的規則為2條:①IF UserSex= ' 男? '? THEN TotalScore= ' D ' ;②IF UserSex= ' 女 '? AND Department= ' 藝術 ' THEN TotalScore=' D ' 。 得到以下結論:總成績為D的最高概率是男生,其次是女藝術生;性別是最重要的變量,其次是學科背景變量,與學歷變量沒有關系。

圖7為總成績決策樹依賴關系圖。

通過上述“決策樹”和“依賴關系網絡”能得到以下結論:成績與學科背景的關系最密切,文科生得較高分的概率高,藝術生得低分的概率高;其次是性別,女生得較高分的概率高,男生得較低分的概率高;學歷對總成績的影響很小,僅與總成績得A的關系密切,本科生與碩士生并沒有顯著差異。

根據數據挖掘結果,小結如表3。

(二)行為特征決策樹數據挖掘結果

學習者學習時間跨度決策樹、學習總時長決策樹、學習次數決策樹、平均每次在線學習停留時長決策樹、重復學習率決策樹、學習筆記決策樹、討論交流決策樹、接收反饋數量決策樹的數據挖掘過程與方法和總成績決策樹的數據挖掘過程與方法一致。由于數據挖掘結果圖片與規則較多,故在此不再詳細呈現,小結如表4,具體結論如下:

學習時間跨度決策樹結論:①學習時間跨度為“高”的最高概率是本科生;學歷是最重要的變量,與學科背景、性別無關。②學習時間跨度為“中”的最高概率是本科生;學歷是最重要的變量,其次是性別變量,最后是學科背景。③學習時間跨度為“低”的最高概率是碩士生;學歷是最重要的變量,其次是學科背景變量,與性別無關。

學習總時長決策樹結論:①學習總時長為“高”的最高概率是女文科碩士與女理科碩士,其次是女藝術生;性別是最重要的變量,其次是學科背景變量,最后是學歷。②學習總時長為“中”的決策樹找不到任何拆分,即學習總時長為“中”與學歷、學科背景、性別均無關。③學習總時長為“低”的最高概率是男生;性別是最重要的變量,其次是學科背景變量,最后是學歷。

學習次數決策樹結論:學習次數決策樹找不到任何拆分,即學習次數與性別、學科背景、學歷并無關系。

平均每次在線學習停留時長決策樹結論:①平均每次在線學習停留時長為“高”的最高概率是女生,其次是男文科生與男藝術生;性別是最重要的變量,其次是學科背景,與學歷無關。②平均每次在線學習停留時長為“中”的決策樹,找不到任何拆分,即平均每次在線學習停留時長為“中”與學歷、學科背景、性別均無關。③平均每次在線學習停留時長為“低”的最高概率是男理科生;性別是最重要的變量,其次是學科背景變量,與學歷無關。

重復學習率決策樹結論:①重復學習率為“高”的最高概率是文科生與理科生;學科背景是最重要的變量,與性別、學歷無關。②重復學習率為“中”決策樹找不到任何拆分,即重復學習率為“中”與學歷、學科背景、性別均無關。③重復學習率為“低”的最高概率是藝術生;學科背景是最重要的變量,與性別、學歷無關。

討論交流決策樹結論:①討論交流為“高”的最高概率是文科生與理科生;學科背景是最重要的變量,與性別、學歷無關。②討論交流為“中”的決策樹與討論交流為“低”的決策樹找不到任何拆分,即討論交流為“中”或“低”與學歷、學科背景、性別均無關。③討論交流為“無”的最高概率是藝術生,其次是文科女碩士與理科女碩士;學科背景是最重要的變量,其次是性別變量,最后是學歷。

學習筆記決策樹結論:①學習筆記為“高”的最高概率是女文科生與女理科生;性別是最重要的變量,其次是學科背景變量,與學歷無關。②學習筆記為“中”的決策樹與學習筆記為“低”的決策樹找不到任何拆分,即學習筆記為“中”或“低”與學歷、學科背景、性別均無關。③學習筆記為“無”的最高概率是女藝術生;性別是最重要的變量,其次是學科背景變量,與學歷無關。

接收反饋數量決策樹結論:①接收反饋數量為“高”的最高概率是男生;性別是最重要的變量,與學科背景、學歷無關。②接收反饋數量為“中”的決策樹找不到任何拆分,即接收反饋數量為“中”與學歷、學科背景、性別均無關。③接收反饋數量為“低”的最高概率是男碩士生,其次是女文科生與女理科生;性別是最重要的變量,其次是學歷、學科背景。

(三)數據挖掘模型評估

由于數據挖掘選取的測試數據可能存在一定的偶然性和必然性,并不能保證挖掘出的結果是正確和適用的,因此需要對挖掘出的模型進行評估和檢驗。在Microsoft SQL Server Analysis Services的挖掘準確性圖表中提供了用來度量所創建模型質量和精確性的工具,可以通過提升圖來進行模型驗證。本研究所有挖掘模型的預測概率介于70.25%~95.10%之間,說明建立的所有挖掘模型具有比較高的可靠性和準確性。

五、研究結論與討論

(一)數據挖掘結果原因分析與討論

本研究通過建立數據挖掘模型、結果分析、模型驗證,發現采用決策樹方法可以較好地預測網絡學習行為與成績,能夠較好地解釋目前網絡學習中的一些現象,例如男生或藝術生總成績容易出現危機,男生接受反饋數量較多等;同時也有一些新的發現,例如女碩士生與文科女生學業成績表現較好,藝術生討論交流表現較差,女藝術生學習筆記表現較差等。依據研究結果,下面將從數據挖掘結果原因分析與在線學習群體干預策略角度展開討論。

第一,男生或藝術生總成績存在危機的概率高,總成績與學科背景的關系最密切,其次是性別。已有研究表明沉浸狀態對學習有積極影響(Salanova, 2006),本研究行為特征數據挖掘結果表明男生與藝術生的行為參與度相對較差,男生與藝術生總成績表現較差,容易出現學習危機。對藝術生和男生的干預策略是在課程內容方面提供更多的干預和幫助,為其提供小步調的學習推送服務,包括學習通知、課程內容、學習資源、學習基本情況、學業風險評估等,提高其學習行為參與度,從而提高學業成績。

第二,碩士生的學習時間跨度表現較差。本研究中的碩士是成人聯考碩士,需要兼顧工作、學業與家庭,因此參與網絡學習的時間和精力非常有限。對碩士生的干預策略是在碩士生注冊學習之后,持續通過短信、微信、郵件等形式提醒碩士生及時參與課程學習。

第三,男生的學習總時長表現較差、接受反饋數量較多,男理科生的平均每次在線學習停留時長表現較差。調查發現男生對待網絡學習的態度、自覺性、認真與努力程度相對較弱,且在網絡學習中更容易注意力分散,易被無關信息干擾(如網絡游戲、新聞、社交等),自控能力較弱。因此對這類學習者就要給其推送更多有意思的資源和活動,提高其對學習課程的興趣和學習動機,同時通過各種途徑加大對其學習的監控與調節力度。

第四,藝術生的重復學習率、討論交流表現較差,女藝術生的學習筆記表現較差。原因并非藝術生認知能力差,而是學習習慣較差,自我調控能力較弱,因此藝術生在網絡學習過程中互動表現也較弱(傅鋼善, 等, 2014)。因此,對藝術生的干預策略是設計更多的協作學習活動,采用基于問題的學習、基于項目的學習、基于探究的學習等方法增加交互行為,讓其體驗協作的樂趣和好處,同時增加參與討論交流的提醒或獎懲措施;對女藝術生的干預策略是改進學習策略,尤其是提供反思策略的指導與幫助,并設置提醒和獎懲措施提醒其參加學習筆記活動。

(二)創建適應性學習干預模型

通過數據挖掘結果,可以為學習者創建適應性學習系統,在適應性學習系統中搭建學習干預模型,如圖8所示。傳統學習管理系統通常為所有學習者呈現完全相同的課程,而不考慮學習者的個體特征、情況和需求,這種一刀切的方法往往導致挫敗感、學習困難和高輟學率(Dagger, et al., 2005)。適應性學習系統為探索個性化、適應性的學習干預提供了可能。

1. 時間維度視角

在學習的不同階段(學習前、學習中、學習后)提供不同的干預策略。適應性學習系統中的學習干預模型是不斷更新、實時分析、循環進行的,伴隨著學習的不同階段(學習前、學習中、學習后)提供不同的干預策略。學習者在學習的某一階段不存在學習危機,但有可能在下一階段存在學習危機。一旦出現學習危機,及時給予恰當的干預,從而實現學習者的有效學習,提高學習效果。在學習前,干預的方式是群體干預。適應性學習系統內僅有學習者的人口學特征數據,根據已有研究(表3與表4)中的學習者群體差異特征給予群體干預,具體干預策略見本文數據挖掘結果原因分析與討論部分。在學習中,干預的方式有群體干預和個體干預。通過學習者的人口學特征和行為特征進行數據挖掘,根據預測結果,對存在學習危機的學習群體和個體,教師及時做出教學決策并制定干預措施,教學決策包括群體差異指導、因材施教、不同獎懲機制等,干預措施包括學習進度提示器、數字儀表盤、彈幕、提示窗口、資源推送、短信、微信、電子郵件、學習策略指導等。在學習后,干預的方式有群體干預和個體干預,一方面,根據數據挖掘結果與學習者的表現,對學習者的學業成績進行多元評價;另一方面,對學習者模型進行調節,完善數據挖掘模型,進入新一輪的數據挖掘循環。

2. 課程開發者視角

開發適應性學習系統,完善干預措施小工具,包括學習進度提示器、數字儀表盤、彈幕、提示窗口、資源推送、短信、微信、電子郵件、學習策略指導等。學習進度提示器能夠清晰地顯示學習進度,并提醒學習是否達標。數字儀表盤能夠可視化地呈現學習者學習活動和任務完成情況,幫助學習者自我反思和評價;同時學習者也可以看到其他學習者的數字儀表盤,以便學習者之間互相督促學習。彈幕、提示窗口能夠實時或間斷地為學習者提供提醒反饋和適應性資源推送,與短信、微信、電子郵件等無縫對接,通過多種途徑給學習者以提醒和監督,尤其是對存在學習危機的學習者,提醒其學習活動的表現、知識內容的表現、行為特征的表現。學習策略指導為學習者提供包括信息素養策略、反思總結策略、資源管理策略、合作交流策略、自我調節策略等學習策略的指導,尤其是為容易出現學習危機或行為參與度低的學習者提供學習策略資源推送。

3. 教師視角

首先,教師應實施群體差異指導、因材施教、不同獎懲機制等教學策略。具體干預策略見本文數據挖掘結果原因分析與討論部分。其次,充分發揮教師的主導作用。網絡學習的優勢是能夠實現自主學習,但是其弊端是弱控制性,包括學習資格獲取的弱控制性、管理方式的弱控制性、教學過程的弱控制性、師生關系的弱控制性、考核方式的弱控制性等(衷克定, 2011, pp. 21-25)。網絡學習使學習者缺乏時間認知、容易產生惰性、交互行為存在滯后、提交作業存在抄襲等,這些不僅會影響學習者的行為狀態,而且會影響網絡學習效果。因此要充分發揮教師的主導作用,教師要及時回復學習者的留言,可適當安排即時交流時間或直播,積極對學習者的行為狀態進行調控,采用多種途徑激發學習者的學習動機等。

4. 學習者視角

首先,建議學習者自覺提高網絡學習參與度,增加學習時間跨度,養成記錄反思筆記的良好習慣,對于復雜的知識增加重復學習次數,積極參與討論交流,提高自己對網絡學習的歸屬感和沉浸性以及自身學習效果。其次,建議學習者自覺改進學習策略:根據教師教學安排循序漸進地完成學習任務,在網絡學習前確立明確的學習目標,制定明確的學習計劃(尤其是學習時間、學習內容等的制定),并嚴格按照學習計劃完成學習任務;積極對自己的情感體驗進行調控,尤其是那些對網絡學習持消極態度的學習者,要經常參與討論交流、反思筆記等交互,從中獲得學習的成功感和歸屬感;對自己的行為和心理進行及時控制、調節和評價。

六、結語

本研究采用數據挖掘技術中的決策樹方法對網絡學習者的學習行為與成績進行了預測,構建了適應性學習系統學習干預模型,為適應性學習系統提供了實證依據。當然,本研究還存在一些不足,有待改進。首先,研究結論有待進一步驗證。本研究的研究對象僅是陜西師范大學參加“現代教育技術”在線開放課程學習的學習者,研究對象的范圍有局限性,應在后續研究中擴大研究對象范圍,對研究結論進行驗證與完善,得到更科學可靠的研究結論。其次,適應性學習系統的學習干預模型有待進一步完善。本研究僅根據實證研究數據從理論上設計了學習干預模型,并沒有在網絡學習中實際使用,在后續研究中有待開發適應性學習系統,對學習干預模型進行驗證與完善,并提高預測的準確性。最后,研究數據有待進一步深度挖掘。本研究尚未對“現代教育技術”在線開放課程后臺數據進行完整的數據挖掘,仍然有大量的潛在模式沒有被發現,未來研究的重點應該關注多種數據挖掘技術,如利用Web數據挖掘技術對文本信息進行知識發現,利用異常檢驗技術發現一些特殊的學習者(如網絡學習欺詐行為)、利用時間序列分析發現學習者隨時間變化而變化的規律等。

[參考文獻]

陳子健,朱曉亮. 2017. 基于教育數據挖掘的在線學習者學業成績預測建模研究[J]. 中國電化教育(12):75-81,89.

傅鋼善,王改花. 2014. 基于數據挖掘的網絡學習行為與學習效果研究[J]. 電化教育研究(9):53-57.

馬杰,趙蔚,張潔,等. 2014. 基于學習分析技術的預測模型構建與實證研究[J]. 現代教育技術(11):30-38.

牟智佳,武法提. 2017a. 教育大數據背景下學習結果預測研究的內容解析與設計取向[J]. 中國電化教育(7):26-32.

牟智佳,武法提. 2017b. MOOC學習結果預測指標探索與學習群體特征分析[J]. 現代遠程教育研究(3):58-66,93.

孫力,程玉霞. 2015. 大數據時代網絡教育學習成績預測的研究與實現——以本科公共課程統考英語為例[J]. 開放教育研究(3):74-80.

孫力,張凱,丁波. 2016. 基于數據挖掘的網絡教育學習成績細分預測的研究與實現——以本科成人學位英語考試為例[J]. 中國遠程教育(12):22-29.

唐華松,姚耀文. 2001. 數據挖掘中決策樹算法的探討[J]. 計算機應用研究(8):21-22,25.

王國平,郭偉宸,汪若君. 2014. IBM SPSS Modeler數據與文本挖掘實戰[M]. 北京:清華大學出版社:142.

王亮. 2015. 學習分析技術建立學習預測模型[J]. 實驗室研究與探索(1):215-218,246.

王林麗,葉洋,楊現民. 2016. 基于大數據的在線學習預警模型設計——“教育大數據研究與實踐專欄”之學習預警篇[J]. 現代教育技術(7):5-11.

武法提,牟智佳. 2016. 基于學習者個性行為分析的學習結果預測框架設計研究[J]. 中國電化教育(1):41-48.

肖巍,倪傳斌,李銳. 2018. 國外基于數據挖掘的學習預警研究:回顧與展望[J]. 中國遠程教育(2):70-78.

徐鵬,王以寧. 2013. 大數據視角分析學習變革——美國《通過教育數據挖掘和學習分析促進教與學》報告解讀及啟示[J]. 遠程教育雜志(6):11-17.

元昌安. 2009. 數據挖掘原理與SPSS Clementine應用寶典[M]. 北京:電子工業出版社:40.

趙慧瓊,姜強,趙蔚,等. 2017. 基于大數據學習分析的在線學習績效預警因素及干預對策的實證研究[J]. 電化教育研究(1):62-69.

中國互聯網絡信息中心. 2018-03-05. 第41次《中國互聯網絡發展狀況統計報告》[EB/OL]. [2018-05-15]. http://www.cnnic.net.cn/hlwfzyj/hlwxzbg/hlwtjbg/201803/t20180305_70249.htm

中華人民共和國教育部. 2016-06-07. 教育部關于印發《教育信息化“十三五”規劃》的通知(教技〔2016〕2號)[EB/OL]. [2018-03-14].http://www.moe.edu.cn/srcsite/A16/s3342/201606/t20160622_2693 67. html

衷克定, 2011. 在線學習與發展[M]. 北京:高等教育出版社:21-25.

Barba, P. G., Kennedy, G. E. & Ainley, M. D. (2016). The role of students motivation and participation in predicting performance in a MOOC motivation and participation in MOOCs. Journal of Computer Assisted Learning, 32(3), 218-231.

Costa, E. B., Fonseca, B., Santana, M. A., de Araújo, F. F. & Rego, J. (2017). Evaluating the effectiveness of educational data mining techniques for early prediction of students academic failure in introductory programming courses. Computers in Human Behavior, 73, 247-256.

Dagger, D., Wade, V. & Conlan, O. (2005). Personalisation for all: making adaptive course composition easy. Educational Technology & Society, 8(3), 9-25.

Huang, S. & Fang, N. (2013). Predicting student academic performance in an engineering dynamics course: a comparison of four types of predictive mathematical models. Computer & Education, 61, 133-145.

Karampiperis, P., & Sampson, D. G. (2005). Adaptive learning resources sequencing in educational hypermedia systems. Educational Technology & Society, 8 (4), 128-147.

Kostopoulos, G., Lipitakis, A. D., Kotsiantis, S. & Gravvanis, G. (2017). Predicting Student Performance in Distance Higher Education Using Active Learning. In G. Boracchi, L. Iliadis, C. Jayne & A. Likas (Eds.) Communications in Computer and Information Science (pp. 75- 86). Cham: Springer.

Kotsiantis, S., Patriarcheas, K. & Xenos, M. (2010). A combinational incremental ensemble of classifiers as a technique for predicting students performance in distance education. Knowledge-Based Systems, 23 (6), 529-535.

Macfadyen, L. P. & Dawson, S. (2010). Mining LMS data to develop an “early warning system” for educators: a proof of concept. Computer & Education, 54 (2), 588-599.

Ohia U. O. (2011). A model for effectively assessing student learning outcomes. Contemporary Issues in Education Research, 4 (3), 25-32.

Pursel, B. K., Zhang, L., Jablokow, K. W., Choi G.W. & Velegol, D. (2016). Understanding MOOC students: motivations and behaviours indicative of MOOC completion. Journal of Computer Assisted Learning, 32(3), 202-217.

Romero, C., López, M. I., Luna, J. M. & Ventura, S. (2013). Predicting students final performance from participation in on-line discussion forums. Computer & Education, 68, 458-472.

Salanova, M., Bakker, A. B. & Llorens, S. (2006). Flow at work: evidence for an upward spiral of personal and organizational resources. Journal of Happiness Studies, 7(1), 1-22.

Xing, W., Guo, R., Petakovic, E. & Goggins, S. (2015). Participation-based student final performance prediction model through interpretable genetic programming: integrating learning analytics, educational data mining and theory. Computers in Human Behavior, 47(C), 168-181.

收稿日期:2018-03-15

定稿日期:2018-08-09

作者簡介:王改花,博士研究生,實驗師;傅鋼善,教授,博士生導師。陜西師范大學教育學院(710062)。

責任編輯 張志禎

猜你喜歡
數據挖掘模型研究
一半模型
FMS與YBT相關性的實證研究
遼代千人邑研究述論
探討人工智能與數據挖掘發展趨勢
重要模型『一線三等角』
重尾非線性自回歸模型自加權M-估計的漸近分布
視錯覺在平面設計中的應用與研究
科技傳播(2019年22期)2020-01-14 03:06:54
EMA伺服控制系統研究
基于并行計算的大數據挖掘在電網中的應用
電力與能源(2017年6期)2017-05-14 06:19:37
3D打印中的模型分割與打包
主站蜘蛛池模板: 九月婷婷亚洲综合在线| 色综合热无码热国产| 日韩成人高清无码| 国产精品亚洲日韩AⅤ在线观看| 色偷偷一区| 在线国产综合一区二区三区| 国产视频入口| 亚洲无码电影| 久久精品嫩草研究院| 国产情精品嫩草影院88av| 88av在线看| 91精品久久久久久无码人妻| 国产福利在线观看精品| 亚洲自拍另类| 国产精品流白浆在线观看| 日韩小视频在线观看| 黄色国产在线| 国产香蕉在线视频| 毛片一区二区在线看| 98精品全国免费观看视频| 国产91小视频| 2020国产精品视频| 激情综合五月网| 亚洲欧美在线综合一区二区三区| 深夜福利视频一区二区| 99r在线精品视频在线播放| 一本一道波多野结衣av黑人在线| 色综合日本| 亚洲伦理一区二区| 成人国产精品一级毛片天堂 | 欧美激情综合| 日韩国产一区二区三区无码| 91久久精品国产| 欧美成人免费午夜全| 中字无码av在线电影| 在线色国产| 婷婷综合缴情亚洲五月伊| 草草线在成年免费视频2| 成人中文字幕在线| 久久久成年黄色视频| 色婷婷色丁香| 亚洲精品国产成人7777| 久久久久青草线综合超碰| 欧美日韩午夜| 国产产在线精品亚洲aavv| 国产91小视频| 在线观看免费AV网| 精品丝袜美腿国产一区| 日韩视频精品在线| 精品一区二区三区无码视频无码| 欧美日韩理论| 国产精品专区第1页| 国产凹凸一区在线观看视频| 538国产在线| 亚洲熟妇AV日韩熟妇在线| 午夜成人在线视频| 国产精品99一区不卡| 亚洲AⅤ综合在线欧美一区| 午夜毛片免费观看视频 | 国产精品林美惠子在线观看| 久久综合九色综合97网| 国产你懂得| 色成人综合| 亚洲专区一区二区在线观看| 97青草最新免费精品视频| 成人亚洲天堂| 国产第二十一页| 免费国产高清视频| 久久婷婷色综合老司机| 日韩欧美国产精品| 国产精品成人第一区| www.精品国产| 91精品人妻互换| av一区二区三区高清久久| 亚洲人成在线精品| 999国内精品视频免费| 亚洲综合激情另类专区| 国内精品免费| 高清色本在线www| 日韩欧美中文在线| 女人天堂av免费| 国产噜噜噜|