張 曄
(南京科技職業(yè)學(xué)院 江蘇南京 210044)
隨著教育改革的不斷深入和教育信息化的持續(xù)推進(jìn),在線學(xué)習(xí)能夠幫助學(xué)習(xí)者實現(xiàn)溝通交流和資源共享,它已經(jīng)成為變革“教”與“學(xué)”模式的重要實踐形態(tài)。 然而,因在線學(xué)習(xí)資源泛濫、師生互動缺乏和導(dǎo)航設(shè)計不良等問題,學(xué)習(xí)者很容易陷入學(xué)習(xí)迷航。 如何診斷和干預(yù)學(xué)習(xí)迷航成為亟待解決的問題,隨著大數(shù)據(jù)在教育領(lǐng)域的應(yīng)用,融合數(shù)據(jù)生成的迷航狀態(tài)分析方法為解決在線學(xué)習(xí)迷航提供了新思路。
1)在線學(xué)習(xí)
在線學(xué)習(xí)(Online Learning)是由電子通信技術(shù)、網(wǎng)絡(luò)技術(shù)和多媒體技術(shù)等核心互聯(lián)技術(shù)衍生出來的一種重要遠(yuǎn)程實踐形式[1]。 在線學(xué)習(xí)的開放性、靈活性、互動性、均等性、協(xié)作性、個性化、自主性等特點,使我們在充分滿足不同學(xué)習(xí)者個性化需求的同時,不再受時空、管理、資源等方面對傳統(tǒng)課堂教學(xué)的限制,有效地提高了學(xué)習(xí)效果。
2)數(shù)據(jù)驅(qū)動
數(shù)據(jù)驅(qū)動的概念隨著大數(shù)據(jù)的興起受到廣泛關(guān)注和頻繁使用,被解釋為通過移動互聯(lián)網(wǎng)或者其他平臺軟件采集海量的數(shù)據(jù),然后將數(shù)據(jù)轉(zhuǎn)化為信息,再經(jīng)過一系列過程,將相關(guān)信息進(jìn)行整合、提煉、自動擬合為一個有效的決策模型。 有效的數(shù)據(jù)驅(qū)動機制能夠?qū)崿F(xiàn)在線學(xué)習(xí)中隱性知識顯性化,顯性知識結(jié)構(gòu)化,可以為教育診斷與決策提供相應(yīng)指導(dǎo)。
3)學(xué)習(xí)迷航
學(xué)習(xí)者在學(xué)習(xí)過程中陷入的一種類似船舶、飛機迷失航向的負(fù)面學(xué)習(xí)狀態(tài)。 處于學(xué)習(xí)迷航的學(xué)習(xí)者無法辨識自身遇到的學(xué)習(xí)問題,無法選取學(xué)習(xí)資源完成學(xué)習(xí)任務(wù),而是處于一種漫游、困惑、挫折狀態(tài),不能及時解決問題,學(xué)習(xí)成績和效率都會受到影響。
在線學(xué)習(xí)過程中,由于師生間的“空間分離”和網(wǎng)絡(luò)學(xué)習(xí)環(huán)境的復(fù)雜性,容易存在教師情感激勵與學(xué)習(xí)指導(dǎo)不足[2]、同伴交流互動匱乏和網(wǎng)絡(luò)資源泛濫且質(zhì)量不均衡等問題[3],既提高了學(xué)習(xí)者發(fā)生學(xué)習(xí)迷航的概率也容易阻礙他們的學(xué)習(xí)進(jìn)展。
2011 年,學(xué)習(xí)分析與知識國際會議(The Inter?national Conference on Learning Analytics and Knowl?edge, LAK)定義學(xué)習(xí)分析為“對學(xué)習(xí)者及其學(xué)習(xí)情境的數(shù)據(jù)進(jìn)行測量、收集、分析和報告,進(jìn)而了解和優(yōu)化學(xué)習(xí)和學(xué)習(xí)發(fā)生的情境的一種應(yīng)用”[5]。
Brown[6]和Siemens[7]教授都是學(xué)習(xí)分析領(lǐng)域的專家,他們依據(jù)學(xué)習(xí)分析內(nèi)涵提出了線性學(xué)習(xí)過程分析模型,如圖1 所示。 基于模型明確的基本要素,重塑學(xué)習(xí)分析結(jié)構(gòu)和線性實施流程。 交互網(wǎng)狀學(xué)習(xí)分析模型、多因素學(xué)習(xí)分析模型、反饋環(huán)狀學(xué)習(xí)分析模型等幾類代表性模型在后續(xù)學(xué)習(xí)分析領(lǐng)域的研究過程中逐步形成。
反饋環(huán)狀學(xué)習(xí)分析模型的代表人物有加拿大阿塞巴斯卡大學(xué)的Elias 等,該模型提出了持續(xù)改進(jìn)環(huán)模型,如圖2 所示,其基礎(chǔ)是學(xué)習(xí)分析和數(shù)據(jù)分析五步法、知識管理框架等。 機構(gòu)、人力、計算機和理論等技術(shù)資源價值都是該模型所著重強調(diào)的,并通過選擇、收集、聚合、預(yù)測、優(yōu)化、使用、分享等循環(huán)實現(xiàn)數(shù)據(jù)采集、數(shù)據(jù)處理和結(jié)果應(yīng)用的過程。技術(shù)資源推動“教”與“學(xué)”效果的不斷提高,使三個循環(huán)階段處于持續(xù)發(fā)展中,體現(xiàn)了學(xué)習(xí)分析過程的動態(tài)循環(huán)特性。

圖2 Elias 的持續(xù)改進(jìn)環(huán)模型
在線學(xué)習(xí)的核心是學(xué)習(xí)者個人訴求,借助互聯(lián)網(wǎng)絡(luò)技術(shù)為學(xué)習(xí)過程提供方便快捷的支持服務(wù)[8]。 離開教師管控下的學(xué)習(xí)過程容易受不同多維因素的影響,比如個體、環(huán)境等都會導(dǎo)致學(xué)習(xí)者陷入在線學(xué)習(xí)迷航狀態(tài)。
在線學(xué)習(xí)迷航診斷過程是基于數(shù)據(jù)分析方法,依據(jù)迷航診斷指標(biāo),嘗試?yán)脤W(xué)習(xí)平臺充分提取在線學(xué)習(xí)者的相關(guān)行為數(shù)據(jù)和特征,對大量繁雜冗余的原始數(shù)據(jù)進(jìn)行清洗整理,并借助機器學(xué)習(xí)中的XGBoost 分類算法分析得出學(xué)習(xí)者行為特征去支撐在線學(xué)習(xí)迷航診斷,構(gòu)建迷航狀態(tài)檢測器,為幫助學(xué)習(xí)者擺脫學(xué)習(xí)迷航奠定數(shù)據(jù)基礎(chǔ),精準(zhǔn)識別迷航狀態(tài),提供個性化服務(wù)。
結(jié)合Siemens 的學(xué)習(xí)分析過程模型和Elias 的持續(xù)改進(jìn)環(huán)模型,嘗試構(gòu)建數(shù)據(jù)驅(qū)動下的在線學(xué)習(xí)迷航診斷模型。
1)XGBoost 算法
研究借助機器學(xué)習(xí)XGBoost 算法實現(xiàn)精準(zhǔn)識別迷航狀態(tài),構(gòu)建迷航狀態(tài)檢測器,學(xué)習(xí)迷航狀態(tài)檢測器的核心功能基于XGBoost 算法的狀態(tài)分類能力[9],從而在學(xué)習(xí)狀態(tài)中將迷航狀態(tài)識別出來。
XGBoost 算法是保留了GBDT 中的一些優(yōu)點,又在GBDT 算法基礎(chǔ)上改進(jìn)而來的,如:集成了多個弱分類器,使用了健壯的損失函數(shù),異常值具有非常強的魯棒性(穩(wěn)定性)等;XGBoost 算法與GB?DT 相比,由于GBDT 只涉及損失函數(shù)優(yōu)化時的一階導(dǎo)數(shù),而XGBoost 可以針對損失函數(shù)展開二階泰勒公式,因此損失函數(shù)更加精確和精確;同時,在避免模型過擬合的同時,對損失函數(shù)和模型復(fù)雜度進(jìn)行權(quán)衡,XGBoost 算法還增加了正則項控制模型的復(fù)雜度。
2)XGBoost 算法在線學(xué)習(xí)迷航診斷流程
XGBoost 算法的實質(zhì)模型是將多個弱分類器集合在一起。 對在線學(xué)習(xí)迷航狀態(tài)診斷的模型為:
診斷模型中的x是第i條的學(xué)習(xí)行為與特征,用來預(yù)測第xi處學(xué)習(xí)狀態(tài)的結(jié)果,K 表示集成弱學(xué)習(xí)器的總數(shù),意思是由K 棵樹集成的模型;fk是第k棵樹。 因此,基于XGBoost 的在線學(xué)習(xí)迷航診斷模型中的損失是:
損失也是預(yù)測模型的誤差,ζ 是真實值與度量的預(yù)測值之間的差距,其中yi是在線學(xué)習(xí)者的實際真實學(xué)習(xí)狀態(tài),則是通過診斷模型預(yù)測預(yù)估的學(xué)習(xí)狀態(tài),L(yi,)則用來記錄在xi處出現(xiàn)的錯誤估計學(xué)習(xí)狀態(tài)的情形情況。 Ω(fk)表示樹的復(fù)雜度,它是正則項,用來懲罰模型復(fù)雜程度。 懲罰項對損失函數(shù)起到了補充調(diào)節(jié)和約束的作用,因此將也就是K 棵樹的復(fù)雜度的和添加至目標(biāo)函數(shù)中,就可以避免模型的過度擬合。
研究收集了在線開放課程平臺中《市場調(diào)查與分析》課程的服務(wù)器日志記錄,其中包含了192名在線學(xué)習(xí)者的基本信息、文本學(xué)習(xí)、視頻學(xué)習(xí)以及在其他相關(guān)的學(xué)習(xí)行為數(shù)據(jù)和列表,總計3770條原始數(shù)據(jù)。 每次在線學(xué)習(xí)完成后,都要求學(xué)習(xí)者進(jìn)行在線填寫內(nèi)容、提交在線調(diào)查問卷,在線學(xué)習(xí)者的學(xué)習(xí)行為數(shù)據(jù)如表1 所示,形成匯總為各項在線學(xué)習(xí)行為特征的指標(biāo)。

表1 在線學(xué)習(xí)行為數(shù)據(jù)源
基于韋伯分析量表,設(shè)計了在線學(xué)習(xí)狀態(tài)的調(diào)查問卷以獲取學(xué)習(xí)者每次學(xué)習(xí)行為所對應(yīng)的學(xué)習(xí)狀態(tài)和學(xué)習(xí)結(jié)果,劃分了正常狀態(tài)、信息迷航和思維迷航三個維度,每個維度上分別設(shè)計了5 道題,共15 題。 基于Likert 的五點量表設(shè)計問卷選項,1至5 分別表示“完全不認(rèn)同”,“不認(rèn)同”,“不確定”,“認(rèn)同”,“完全認(rèn)同”。 為了驗證問卷的可靠性和有效性,利用SPSS 軟件進(jìn)行問卷信效度分析,Cronbach’s α 系數(shù)系數(shù)為0.803, Cronbach’sα系數(shù)在各個維度分別為0.776、0.770 和0.831;調(diào)查問卷的KMO 值為0.866,Bartlett 球形檢驗Sig 值為0.000,數(shù)據(jù)顯示該問卷具有較好的信度和效度。
將3770 條學(xué)習(xí)記錄進(jìn)行整理匯總,作為在線學(xué)習(xí)者的學(xué)習(xí)狀態(tài)數(shù)據(jù)集,數(shù)據(jù)集在經(jīng)過處理后作為在線學(xué)習(xí)迷航狀態(tài)檢測器的數(shù)據(jù)支撐。
實驗抽取了市場營銷專業(yè)大一學(xué)生72 名在線學(xué)習(xí)者作為研究對象。 在開展實驗調(diào)查前,大部分學(xué)習(xí)者已經(jīng)掌握了《市場調(diào)查與分析》中的一部分課程知識,也能夠試著回答簡單問題。 根據(jù)實驗調(diào)查的科學(xué)性原則,根據(jù)調(diào)查對象知識水平前測結(jié)果,平均地將72 名在線學(xué)習(xí)者分為實驗組和對照組,分別稱為A 組36 人和B 組36 人,用來保證實驗組和對照組中的學(xué)習(xí)者他們初始知識水平和能力盡量保持大體一致。
接下來,通過對兩組成員學(xué)習(xí)迷航程度的前測試結(jié)果進(jìn)行獨立樣本T 檢驗來完成測試,實驗組和對照組學(xué)習(xí)者的初始在線學(xué)習(xí)迷航程度是否一致也有待進(jìn)一步驗證,結(jié)果見表2。

表2 實驗組和對照組學(xué)習(xí)者迷航程度前測結(jié)果獨立樣本t 檢驗
t 檢驗結(jié)果顯示,萊文方差等同性檢驗p =0.167>0.05 實驗組和對照組的方差并無顯著差異,Sig.值(雙側(cè)) p =0.576>0.05)學(xué)習(xí)者在線學(xué)習(xí)的迷航程度也無明顯差異。
因此得出根據(jù)知識水平進(jìn)行平均分組之后,實驗組與對照組兩組學(xué)習(xí)者在線學(xué)習(xí)的迷航程度也趨于一致,是可以繼續(xù)開展后續(xù)迷航程度的相關(guān)調(diào)查的。
緩解學(xué)習(xí)者在線學(xué)習(xí)的迷航程度和提升學(xué)習(xí)者的學(xué)習(xí)效率效果是本次應(yīng)用迷航診斷模型的實驗主要目的。 在互聯(lián)網(wǎng)學(xué)習(xí)迷航診斷系統(tǒng)的技術(shù)支持下,開展實驗,實驗過程如圖4 所示。

圖4 實驗過程
實驗共開展8 周,分為一、二兩個階段。 在階段一,實驗組和對照組的學(xué)習(xí)者都在網(wǎng)絡(luò)學(xué)習(xí)平臺進(jìn)行3 周學(xué)習(xí),以此來驗證在未使用學(xué)習(xí)迷航診斷系統(tǒng)的情境下,對照組與實驗組他們的知識水平和迷航程度是否還能保持一致;在階段二,我們將開展5 周學(xué)習(xí),實驗組A 組學(xué)習(xí)者將使用帶有學(xué)習(xí)迷航診斷系統(tǒng)的平臺,對照組B 組學(xué)習(xí)者仍然使用之前的在線學(xué)習(xí)平臺,主要是用來驗證使用了學(xué)習(xí)迷航診斷系統(tǒng)的平臺是否能夠減輕在線學(xué)習(xí)迷航程度和提升學(xué)習(xí)者學(xué)習(xí)效率與成績。 需要注意的是,8 周的實驗,要進(jìn)行三次知識水平測試來觀察學(xué)習(xí)者們知識水平的變化,其次,每周還應(yīng)測量在線學(xué)習(xí)迷航程度,分析實驗組和對照組在線學(xué)習(xí)迷航程度的變化。
兩組學(xué)習(xí)者在線學(xué)習(xí)時的學(xué)習(xí)狀態(tài)分布情況以及學(xué)習(xí)狀態(tài)分布的變化情況都是通過XGBoost 算法進(jìn)行診斷,分析在線學(xué)習(xí)過程中產(chǎn)生的行為數(shù)據(jù)。
圖5 所示,在第一階段(1-3 周) 實驗組中的各維度人數(shù)占比沒有明顯變化,表示一般的在線平臺學(xué)習(xí)不會影響學(xué)習(xí)者迷航狀態(tài);在第二階段(4-8 周),當(dāng)實驗組開始利用帶有迷航系統(tǒng)的在線學(xué)習(xí)平臺后,正常狀態(tài)學(xué)習(xí)者的比例有了明顯增加,信息迷航和思維迷航的人數(shù)比例顯著減少。

圖5 實驗組學(xué)習(xí)者學(xué)習(xí)狀態(tài)分布情況圖
通過圖6 可以看出,在實驗的第二階段開始后,在線學(xué)習(xí)迷航診斷系統(tǒng)發(fā)揮了一定的干預(yù)作用,實驗組學(xué)習(xí)狀態(tài)分布變化顯著。

圖6 實驗組學(xué)習(xí)者學(xué)習(xí)狀態(tài)分布情況圖
在實驗過程中,每周還應(yīng)測量在線學(xué)習(xí)迷航程度,測量結(jié)果生成兩組學(xué)習(xí)者迷航程度的變化折線圖,可以直接觀察迷航程度的變化情況,如圖7 所示。

圖7 迷航程度變化情況
由圖7-(a)可知,實驗組與對比組在1-3 周的學(xué)習(xí)迷航程度總體上并無明顯差異,但實驗組在4-8 周的實驗開始后,學(xué)習(xí)者進(jìn)入帶有在線學(xué)習(xí)迷航診斷系統(tǒng)的平臺學(xué)習(xí),迷航程度明顯低于對照組,且效果相對顯著。 圖7-(b)和圖7-(c)的結(jié)果顯示,實驗組的信息迷航和思維迷航的程度都有較大緩解,對照組則幾乎沒有變化。
1)實驗組和對照組中測成績分析
成績反映對知識的掌握情況,研究分別在實驗前、第一階段結(jié)束時、第二階段結(jié)束時進(jìn)行,對學(xué)習(xí)者進(jìn)行了前測、中測和后測。 兩組學(xué)習(xí)者的知識水平在前測時并沒有太大差異,因此僅對中測和后測成績展開分析。
對中測成績做獨立樣本t 檢驗,判斷兩組的知識水平是否在未用系統(tǒng)前保持一致,表3 結(jié)果顯示兩組的中測結(jié)果(p =0.671>0.05)無明顯差異。

表3 實驗組和對照組的中測成績獨立樣本t 檢驗
2)實驗組和對照組后測成績分析
采用協(xié)方差對兩組學(xué)生后測成績進(jìn)行分析,協(xié)變量設(shè)為中測成績,因變量設(shè)為后測成績,組別為固定因子,經(jīng)過調(diào)整,表4 結(jié)果說明實驗組和對照組的成績均值相差6.66,成績存在明顯差異(p =0.016<0.05),數(shù)據(jù)表明實驗組的學(xué)習(xí)者在使用在線學(xué)習(xí)迷航診斷系統(tǒng)后,學(xué)習(xí)成績比對照組學(xué)習(xí)者有著明顯提高。

表4 實驗組和對照組的后測成績差異
以在線學(xué)習(xí)迷航模型的有效落地作為研究目的,設(shè)計迷航診斷系統(tǒng),通過應(yīng)用效果分析,說明在線學(xué)習(xí)迷航診斷系統(tǒng)確實能夠有效降低學(xué)習(xí)者的迷航程度,提升學(xué)習(xí)者的學(xué)習(xí)效率、成績和效用,表明在線學(xué)習(xí)迷航模型在實際應(yīng)用中的可行性和有效性。