賈靖怡,李玉斌,姚巧紅,袁子涵
(遼寧師范大學(xué)計算機(jī)與信息技術(shù)學(xué)院,遼寧大連 116081)
從最初的網(wǎng)絡(luò)課程、虛擬學(xué)習(xí)社區(qū)、精品課程到現(xiàn)在的視頻公開課、資源共享課以及大規(guī)模在線開放課程(MOOC),在線教育方式始終存在學(xué)生參與度低、輟學(xué)率高、學(xué)習(xí)效果不理想等問題[1-2]。為在輟學(xué)前識別出有風(fēng)險或問題傾向的學(xué)習(xí)者,從而進(jìn)行有針對性的指導(dǎo)、干預(yù)和預(yù)警,MOOC 環(huán)境下的學(xué)習(xí)預(yù)測研究成為熱點(diǎn)。預(yù)測研究的價值主要體現(xiàn)在3 個方面[3]:①教師可預(yù)測學(xué)習(xí)者可能遇到的問題,通過調(diào)整課程或教學(xué)方法提升學(xué)習(xí)體驗;②教師或機(jī)構(gòu)可使用預(yù)測結(jié)果決定課程設(shè)計及實(shí)施學(xué)習(xí)干預(yù);③學(xué)習(xí)者可獲得學(xué)習(xí)過程信息,使其反思自己是如何做的,從而提升學(xué)習(xí)表現(xiàn)。
當(dāng)前的MOOC 在線學(xué)習(xí)預(yù)測研究主要集中在學(xué)習(xí)者流失率、輟學(xué)率、退課率、完成率、學(xué)習(xí)參與度等方面[4-6],對學(xué)業(yè)成績、學(xué)習(xí)缺陷、認(rèn)知障礙等主題研究相對偏少。流失率、輟學(xué)率、退課率等主題研究雖然引起廣泛關(guān)注,但還處于初級階段,并不成熟,單從預(yù)測指標(biāo)數(shù)量就能窺見一斑。范逸洲等[7]在《MOOC 中學(xué)習(xí)者流失問題的預(yù)測分析——基于24 篇中英文文獻(xiàn)的綜述》中指出,有的研究預(yù)測指標(biāo)數(shù)僅4 項,有的多達(dá)37 項。因此,在MOOC 學(xué)習(xí)者預(yù)測研究上還需要更多的實(shí)證工作,構(gòu)建更加穩(wěn)健和精準(zhǔn)的預(yù)測模型,從而助力在線教育向更智能化方向發(fā)展。
MOOC 的主要特點(diǎn)之一就是注冊人數(shù)眾多,通常會有成千上萬的注冊者,可收集大量的信息了解課程情況,以便進(jìn)一步分析。目前,大多數(shù)平臺都記錄或存儲“學(xué)習(xí)者與平臺交互”“學(xué)習(xí)者與課程交互”“學(xué)習(xí)者與學(xué)習(xí)者或教師的社會性交互”數(shù)據(jù),分析這些數(shù)據(jù)不僅可發(fā)現(xiàn)問題,還可用來預(yù)測學(xué)習(xí)者學(xué)習(xí)情況與學(xué)習(xí)結(jié)果。
Yang 等[8]利用學(xué)生觀看授課視頻點(diǎn)擊流和以前的評估成績數(shù)據(jù),采用訓(xùn)練時間序列神經(jīng)網(wǎng)絡(luò)方法預(yù)測學(xué)習(xí)成績。對兩個MOOC 數(shù)據(jù)集的評估顯示,該算法比以往平均性能的基線高出60% 以上,比lasso 回歸基線高出15% 以上。當(dāng)學(xué)生回答較少問題時,該算法也具有較強(qiáng)的預(yù)測能力;Ren 等[9]采用個性化線性多元回歸(PLMR)模型,通過跟蹤學(xué)生在MOOC 上的參與情況預(yù)測學(xué)生下一階段表現(xiàn)。分析結(jié)果表明,最好的成績在課程進(jìn)行到一半時取得,評分前的測驗次數(shù)是相關(guān)性最高的變量;Sinha 等[10]基于每天的課程交互信息,包括學(xué)習(xí)者播放視頻數(shù)量、章節(jié)交互次數(shù)和論壇發(fā)帖數(shù)量,利用條件隨機(jī)域(CRF)概率框架對學(xué)習(xí)成績進(jìn)行預(yù)測。對交互特征組合進(jìn)行對比分析得到模型最佳精度為58.1%,召回率為66.0%,加權(quán)F-score 為56.0%,超過了應(yīng)用于每個序列位置的多個基線鑒別分類器;Brinton 等[11]提出帶有因數(shù)分解機(jī)和K-NN 的算法,目的是預(yù)測用戶在回答一個問題時第一次嘗試(CFA)是否正確,測試結(jié)果顯示該算法和預(yù)測指標(biāo)具有早期檢測能力;郝巧龍等[12]利用多元線性回歸分析構(gòu)建模型,識別出持續(xù)時間、學(xué)習(xí)進(jìn)度、觀看時長、筆記數(shù)、作業(yè)成績、發(fā)帖數(shù)、回帖數(shù)、得分帖數(shù)等預(yù)測變量;王鳳芹等[13]利用登錄次數(shù)、在線時間、視頻觀看時間、看帖數(shù)、發(fā)帖數(shù)、回帖數(shù)、在線測驗次數(shù)、每次在線測驗成績、作業(yè)提交次數(shù)、每次作業(yè)成績等10 個預(yù)測指標(biāo),驗證K 近鄰優(yōu)化算法在預(yù)測MOOC 學(xué)習(xí)成績的有效性;趙帥等[14]基于情感詞典統(tǒng)計學(xué)習(xí)者論壇討論發(fā)言中積極、消極情感詞語及詞頻,通過回歸分析方法研究情感指數(shù)是否能有效預(yù)測成績;金夢甜[15]構(gòu)建基于深度神經(jīng)因子分解機(jī)的學(xué)習(xí)效果預(yù)測模型。
上述研究雖然嘗試?yán)酶鞣N技術(shù)預(yù)測MOOC 學(xué)習(xí)結(jié)果,既有經(jīng)典的線性回歸方程模型,也有當(dāng)前非常流行的神經(jīng)網(wǎng)絡(luò),但至今沒有明確的主導(dǎo)預(yù)測技術(shù)。決策樹、神經(jīng)網(wǎng)絡(luò)、支持向量機(jī)等這些基礎(chǔ)模型與集成增強(qiáng)方法一起使用,也許可以獲得更高的預(yù)測能力。從預(yù)測指標(biāo)來看,三大范疇(學(xué)習(xí)者與平臺交互、學(xué)習(xí)者與課程交互以及學(xué)習(xí)者的社會性交互)雖均有涉及,但主要是對時域(如在線時長、視頻觀看時間)和頻域(如發(fā)帖條數(shù)、登陸次數(shù))等“數(shù)量”型指標(biāo)的統(tǒng)計,體現(xiàn)內(nèi)容的“質(zhì)量”型指標(biāo)占比明顯偏低。以帖子為例,僅考慮條數(shù)、不考慮發(fā)帖內(nèi)容,一定會損失有價值的預(yù)測信息。另外,對“及格學(xué)習(xí)者”和“不及格學(xué)習(xí)者”預(yù)測,是用一套指標(biāo)還是應(yīng)該區(qū)別對待,似乎沒有明確結(jié)論。本文將結(jié)合這些問題開展研究設(shè)計與實(shí)證。
在文獻(xiàn)分析基礎(chǔ)上,本研究從“學(xué)習(xí)者與平臺交互”“學(xué)習(xí)者與課程交互”和“學(xué)習(xí)者與學(xué)習(xí)者或教師的社會性交互”三大范疇、“時域”和“頻域”兩個向度,匯集“登錄次數(shù)、在線時長、瀏覽課程資源次數(shù)、瀏覽課程資源時長、查看課程信息次數(shù)、查看課程信息時長、瀏覽視頻次數(shù)、作業(yè)提交次數(shù)、參與測驗次數(shù)、發(fā)布帖子條數(shù)、發(fā)布帖子字?jǐn)?shù)、回評帖子條數(shù)、回評帖子字?jǐn)?shù)”等13 個數(shù)量型指標(biāo),針對質(zhì)性指標(biāo)缺乏問題,構(gòu)建“登錄間隔、登錄間隔標(biāo)準(zhǔn)差、發(fā)布帖子質(zhì)量、回評帖子質(zhì)量”4 個質(zhì)量型指標(biāo),總計17 個預(yù)測指標(biāo),如表1 所示。
2.1.1 TF-IDF 累計值
TF-IDF 即詞頻逆文檔頻率,在自然語言處理中應(yīng)用十分廣泛,本研究用其衡量學(xué)者發(fā)帖質(zhì)量。TF 表示詞頻數(shù),指某個詞語在學(xué)習(xí)者帖子中出現(xiàn)的總次數(shù)。在文本分析過程中,由于出現(xiàn)次數(shù)最多、頻率最高的詞語不一定代表帖子的內(nèi)容特征,因此使用IDF 屬性。IDF 表示逆文檔詞頻,用以區(qū)分不同學(xué)習(xí)者帖子內(nèi)容的差異性。TF-IDF 計算公式如下:

其中,TF -IDFi表示第j位學(xué)習(xí)者的TF-IDF 累計值;tfik是詞語k在第j位學(xué)習(xí)者帖子詞頻數(shù)量+0.01是詞語k在學(xué)習(xí)者帖子集合中的逆文檔詞頻值,N 為總帖子文檔數(shù)目,nk為包含詞語k的帖子文檔數(shù)量,m為整個帖子詞向量空間維度。在計算過程中,每位學(xué)習(xí)者帖子合并為一個文檔,使用結(jié)合jieba 中文分詞工具和Python 語言自行編寫的程序進(jìn)行處理。
2.1.2 Δt 均值和標(biāo)準(zhǔn)差
Δt 表示學(xué)習(xí)者兩次相鄰登錄的時間間隔。學(xué)習(xí)者多次登錄平臺后會有一系列的Δt 值。用Δt 的平均值表示學(xué)習(xí)者登錄間隔屬性,Δt 的標(biāo)準(zhǔn)差表示學(xué)習(xí)者登錄離散情況,反映一定的行為規(guī)律。

Table 1 Description of prediction indicators表1 預(yù)測指標(biāo)說明
Δt 均值計算公式如下:

Δt 標(biāo)準(zhǔn)差計算公式如下:

AdaBoost 屬于集成學(xué)習(xí)Boosting 算法的一種。集成學(xué)習(xí)算法核心思想是在訓(xùn)練集上使用一系列基礎(chǔ)模型(如決策樹、支持向量機(jī)、神經(jīng)網(wǎng)絡(luò)等)進(jìn)行分類,然后采用一定的規(guī)則(如投票法)集成出一個模型,從而解決模型最優(yōu)化問題。AdaBoost 作為Boosting 最受歡迎的實(shí)現(xiàn)方法,具有極強(qiáng)的適應(yīng)能力[16]。因為AdaBoost 不僅根據(jù)基礎(chǔ)模型的準(zhǔn)度為每個模型附上權(quán)重值(α),還根據(jù)數(shù)學(xué)預(yù)測結(jié)果是否正確為每一個樣本附上權(quán)重值(Wi),并經(jīng)過多次迭代產(chǎn)生一個預(yù)測模型序列,最后采用加權(quán)平均法得到最終優(yōu)化的預(yù)測模型。算法如下:
輸入:訓(xùn)練集DT={(xi,yi)},i=1,2,…,n,yi∈{0,1}。其中,xi 為預(yù)測指標(biāo);yi 為學(xué)業(yè)成績能否及格,0=不及格,1=及格
輸出:預(yù)測模型:B(x)
(1)給訓(xùn)練集DT 每一個樣本附上初始權(quán)重:

(2)for j=1 to k
(3)基于訓(xùn)練集DT 和初始權(quán)重Wi,訓(xùn)練出第一個學(xué)業(yè)成績預(yù)測基礎(chǔ)模型bk(x)
(4)計算模型bk(x)誤差率,公式如下:

其中,如果預(yù)測結(jié)果正確,I(x)=1,否則I(x)=0
(5)計算分類bk(x)權(quán)重,公式如下:

(6)根據(jù)公式(6)更新所有訓(xùn)練集的權(quán)重值,并歸一化Wi。

(7)end for
選取2017-2018 學(xué)年春季和秋季兩期參與中國大學(xué)MOOC 平臺《互聯(lián)網(wǎng)+教師知識個人管理》課程學(xué)習(xí)者相關(guān)數(shù)據(jù)進(jìn)行效果驗證。本課程兩期注冊總?cè)藬?shù)為11 126 人,導(dǎo)出其中有過發(fā)帖或回帖行為的319 位學(xué)習(xí)者數(shù)據(jù)作為研究樣本。在數(shù)據(jù)提取和清洗過程中,嚴(yán)格按照平臺提供的后臺數(shù)據(jù)說明文檔進(jìn)行。由于17 個預(yù)測指標(biāo)的量綱不同(如次數(shù)、時間、TF-IDF 值),不能直接計算,因此對數(shù)據(jù)進(jìn)行歸一化處理,轉(zhuǎn)換到從0 到1 的同一區(qū)間。

其中,xjk是原始數(shù)據(jù),是歸一化數(shù)據(jù),xmin是第k 個指標(biāo)的最小值,xmax是第k 個指標(biāo)的最大值。
RapidMiner 是由RapidMiner 公司開發(fā)、維護(hù)的一個開源大數(shù)據(jù)挖掘GUI 軟件平臺,該平臺自帶1 500 多個函數(shù),可以搭建并部署數(shù)據(jù)挖掘與預(yù)測分析的各種流程。本實(shí)驗使用RapidMiner9.4 運(yùn)行AdaBoost 算法模型,基礎(chǔ)模型是決策樹,實(shí)驗流程框架如圖1 所示。

Fig.1 Experimental flow frame of AdaBoost algorithm圖1 AdaBoost 算法實(shí)驗流程框架
對及格學(xué)習(xí)者和不及格學(xué)習(xí)者預(yù)測,是用一套指標(biāo)還是區(qū)別對待,本研究通過特征向量選擇對預(yù)測指標(biāo)進(jìn)行分組并加以驗證。特征向量選擇方法主要有主成分分析、卡方檢驗、信息增益等。由于本研究的所有指標(biāo)經(jīng)過標(biāo)準(zhǔn)化后全部為無量綱數(shù)值型數(shù)據(jù),所以可以采用主成分分析法進(jìn)行選擇。首先把數(shù)據(jù)集導(dǎo)入SPSS22.0,然后調(diào)用Factor Analyze 過程進(jìn)行分析,設(shè)置特征值大于1,采用最大方差法分析相關(guān)性矩陣。分析結(jié)果顯示,KMO(Kaiser-Meyer-Olkin)檢驗統(tǒng)計量0.845,Bartlett 球形度檢驗的近似卡方值為4 787.54,主成分累計方差為79.16%,可以進(jìn)行指標(biāo)分組和精簡。依據(jù)各主成分因子負(fù)荷不同,形成A、B、C、D 4個特征指標(biāo)組,如表2 所示。

Table 2 Characteristic indicator groups表2 特征指標(biāo)組
基于實(shí)驗平臺輸出的混淆矩陣,通過正精度(TP/(TP+FP))、負(fù)精度(TN/(TN+FN))和綜合準(zhǔn)度((TP+TN)/(TP+TN+FP+FN))3 個指標(biāo),對本文提出的基于AdaBoost 挖掘算法的MOOC 學(xué)習(xí)成績預(yù)測模型進(jìn)行全面評估。其中,TP代表真及格類,TN 代表真不及格類,F(xiàn)N 代表假及格類,F(xiàn)P代表假不及格類,實(shí)驗結(jié)果如表3 所示。

Table 3 Index of prediction ability of model表3 模型預(yù)測能力指標(biāo)(%)
綜合準(zhǔn)度用來衡量模型的綜合預(yù)測能力,對及格學(xué)習(xí)者和不及格學(xué)習(xí)者兩種情況的預(yù)測精準(zhǔn)度進(jìn)行檢測。從表3 可以看出,綜合預(yù)測能力指標(biāo)中C 特征組的綜合準(zhǔn)度為86.39%,預(yù)測能力最強(qiáng);B 特征組和D 特征組的預(yù)測能力基本一樣,A 特征組的預(yù)測能力最弱,綜合準(zhǔn)度為66.37%。
如果僅對“哪些學(xué)習(xí)者的學(xué)習(xí)成績可能會不及格”情況進(jìn)行預(yù)測,A 特征組的負(fù)精度為93.94%,數(shù)值最高,預(yù)測能力最強(qiáng),也就是說利用X13、X14、X31、X32、和X35 這5個指標(biāo)判斷效果最好。如果僅對“哪些學(xué)習(xí)者的學(xué)習(xí)成績可能會及格”情況進(jìn)行預(yù)測,C 特征組的正精度為86.27%,數(shù)值最高,預(yù)測能力最強(qiáng)。
利用學(xué)習(xí)者數(shù)據(jù)挖掘出有價值信息,是當(dāng)前在線學(xué)習(xí)分析領(lǐng)域的研究熱點(diǎn)。本文從學(xué)習(xí)者與平臺交互、學(xué)習(xí)者與課程交互和學(xué)習(xí)者的社會性交互等多個方面匯集17 個特征指標(biāo),使用中國大學(xué)MOOC 平臺的《互聯(lián)網(wǎng)+教師知識個人管理》課程數(shù)據(jù),對基于AdaBoost 算法的MOOC 學(xué)習(xí)者學(xué)習(xí)結(jié)果預(yù)測模型進(jìn)行了驗證。
本文構(gòu)建的基于AdaBoost 算法的MOOC 學(xué)習(xí)者學(xué)習(xí)成績預(yù)測模型具有較強(qiáng)的預(yù)測能力,綜合預(yù)測精度為86.39%,具有實(shí)際應(yīng)用價值。對“哪些學(xué)習(xí)者的學(xué)習(xí)成績可能會及格”和“哪些學(xué)習(xí)者的學(xué)習(xí)成績可能會不及格”兩種情況進(jìn)行預(yù)測,應(yīng)該區(qū)別對待。對“不及格”情況進(jìn)行預(yù)測,使用“登錄間隔、登錄間隔標(biāo)準(zhǔn)差、發(fā)布帖子條數(shù)、發(fā)布帖子字?jǐn)?shù)、發(fā)布帖子質(zhì)量”等5 個指標(biāo),預(yù)測精度更高;對“及格”情況進(jìn)行預(yù)測,需要更多的預(yù)測指標(biāo),使用“在線時長、登錄間隔、登錄間隔標(biāo)準(zhǔn)差、瀏覽課程資源次數(shù)、瀏覽課程資源時長、查看課程信息次數(shù)、查看課程信息時長、瀏覽視頻次數(shù)、作業(yè)提交次數(shù)、發(fā)布帖子條數(shù)、發(fā)布帖子字?jǐn)?shù)、回評帖子條數(shù)、回評帖子字?jǐn)?shù)、發(fā)布帖子質(zhì)量、回評帖子質(zhì)量”等15 特征指標(biāo)預(yù)測效果更好,預(yù)測精度可達(dá)86.27%。TF-IDF 累計值、△t 標(biāo)準(zhǔn)差等體現(xiàn)質(zhì)量的“質(zhì)”型預(yù)測指標(biāo)不但具有很高的因子負(fù)荷,而且全部進(jìn)入預(yù)測模型,十分重要,今后應(yīng)重視這類指標(biāo)開發(fā)。
本研究不足之處是僅用一門課程數(shù)據(jù)對預(yù)測模型進(jìn)行驗證。為提高模型的泛化程度和穩(wěn)健性,還需要更多數(shù)據(jù)集驗證。另外,更多指標(biāo)雖然有助于提升模型預(yù)測精準(zhǔn)度,但不利于模型可解釋性,后續(xù)要進(jìn)一步尋求通過更少的指標(biāo)對“及格”情況進(jìn)行精準(zhǔn)預(yù)測。