王全蕊 任建京 韓菲 謝鵬超 欽佳燕



摘要:通過(guò)借助深度學(xué)習(xí)技術(shù)對(duì)思政課教學(xué)過(guò)程中學(xué)習(xí)者進(jìn)行建模分析,達(dá)到知識(shí)追蹤的目的。考慮到每個(gè)學(xué)習(xí)者的能力和其他外力因素的影響會(huì)導(dǎo)致學(xué)習(xí)者的思政知識(shí)水平不一致、輸入數(shù)據(jù)中存在差異性,在深度知識(shí)追蹤中使用自然聚類算法對(duì)學(xué)習(xí)者的思政知識(shí)水平進(jìn)行動(dòng)態(tài)捕捉和聚類操作,并且在貝葉斯知識(shí)追蹤模型中引入學(xué)習(xí)者學(xué)習(xí)情況分類標(biāo)簽,使得模型在學(xué)習(xí)過(guò)程中重點(diǎn)關(guān)注以往特定時(shí)間段內(nèi)的信息,而不是只依靠上一時(shí)刻的輸出狀態(tài),由此提高對(duì)學(xué)習(xí)者思政課知識(shí)點(diǎn)掌握程度的預(yù)測(cè)結(jié)果。
關(guān)鍵詞:大數(shù)據(jù);思政教育;深度學(xué)習(xí);知識(shí)追蹤
引言
基于深度學(xué)習(xí)的知識(shí)追蹤方法,為學(xué)習(xí)者的思政教育認(rèn)知程度和思政知識(shí)掌握情況進(jìn)行動(dòng)態(tài)追蹤評(píng)估提供了一種有效的手段。通過(guò)該方法的應(yīng)用,教師可以更加精準(zhǔn)地了解學(xué)生的學(xué)習(xí)狀況,制定個(gè)性化的教學(xué)策略,提高思政教育的質(zhì)量和效果。同時(shí),學(xué)生也可以通過(guò)該方法獲得及時(shí)的學(xué)習(xí)反饋和指導(dǎo),提升學(xué)習(xí)效果和學(xué)習(xí)成績(jī)。
1. 知識(shí)追蹤研究現(xiàn)狀
隨著教育信息化的不斷推進(jìn)和“互聯(lián)網(wǎng)+”課堂教學(xué)的迅猛發(fā)展,思政課在線教學(xué)已成為高校思想政治教育的重要手段,同時(shí)也產(chǎn)生了大量的在線教學(xué)數(shù)據(jù)。許多教育研究者們?cè)噲D采用數(shù)據(jù)挖掘、人工智能等信息技術(shù)來(lái)獲取學(xué)習(xí)者的思政認(rèn)知情況。知識(shí)追蹤模型為教育研究者預(yù)測(cè)學(xué)習(xí)者知識(shí)狀態(tài)提供了便捷的途徑,也是教育數(shù)據(jù)挖掘領(lǐng)域的研究熱點(diǎn)[1]。
知識(shí)追蹤作為智能輔導(dǎo)體系的一個(gè)重要組成部分,目前被廣泛應(yīng)用于各個(gè)在線教育平臺(tái)和智能輔助系統(tǒng)。貝葉斯知識(shí)追蹤模型是目前最流行的知識(shí)追蹤模型之一,但由于貝葉斯知識(shí)追蹤所使用的隱馬爾可夫模型假設(shè)當(dāng)前題目和上一次答題的狀態(tài)有所聯(lián)系,這就導(dǎo)致貝葉斯知識(shí)追蹤模型難以模擬較長(zhǎng)的序列[2]。因此學(xué)者將具有強(qiáng)大特征提取能力的深度學(xué)習(xí)應(yīng)用于知識(shí)追蹤領(lǐng)域,能很好地解決該問(wèn)題,同時(shí)也能捕捉到更復(fù)雜的學(xué)習(xí)者的知識(shí)表征,還可以用來(lái)發(fā)現(xiàn)知識(shí)成分之間的關(guān)聯(lián)信息[3]。
隨著深度學(xué)習(xí)技術(shù)不斷加強(qiáng),基于深度學(xué)習(xí)的知識(shí)追蹤研究已經(jīng)成為知識(shí)追蹤領(lǐng)域的一個(gè)重要分支,并且取得了豐碩的成果。由Piech Chris(2015)[4]等學(xué)者提出的深度知識(shí)追蹤模型,被看成深度學(xué)習(xí)知識(shí)追蹤領(lǐng)域中取得的開(kāi)創(chuàng)性成果。此后,學(xué)者開(kāi)始致力于研究深度知識(shí)跟蹤學(xué)習(xí)的模型改進(jìn)。Williams(1990)[5]等人提出在連續(xù)采樣時(shí)間內(nèi)運(yùn)行完全遞歸網(wǎng)絡(luò)的梯度跟蹤學(xué)習(xí)算法,可對(duì)學(xué)習(xí)者的輸入數(shù)據(jù)進(jìn)行降維操作,實(shí)驗(yàn)表明在一定程度上能提高深度學(xué)習(xí)知識(shí)追蹤模型的效果。
2. 知識(shí)追蹤問(wèn)題描述
2.1 知識(shí)追蹤定義
知識(shí)追蹤的任務(wù)就是根據(jù)學(xué)習(xí)者對(duì)相關(guān)練習(xí)的歷史學(xué)習(xí)記錄,預(yù)測(cè)下一次學(xué)習(xí)者練習(xí)交互的正確率。知識(shí)追蹤的任務(wù)可以被形式化為有監(jiān)督的序列學(xué)習(xí)任務(wù),使用Xt= (et, at) 表示學(xué)習(xí)者在t時(shí)刻對(duì)et所表示的練習(xí)給出的答案at。雖然將學(xué)習(xí)者學(xué)習(xí)交互活動(dòng)Xt用顯式表示出來(lái),但是學(xué)習(xí)者對(duì)知識(shí)概念的掌握狀態(tài)卻是內(nèi)隱的,很難準(zhǔn)確地對(duì)學(xué)習(xí)者實(shí)際學(xué)習(xí)狀態(tài)進(jìn)行量化,因此可以將知識(shí)追蹤任務(wù)轉(zhuǎn)換為預(yù)測(cè)學(xué)習(xí)者將來(lái)練習(xí)的正確率。
2.2 基于深度學(xué)習(xí)的知識(shí)追蹤模型
為了改進(jìn)深度知識(shí)追蹤,學(xué)者們提出了許多基于深度知識(shí)追蹤的擴(kuò)展模型。深度知識(shí)追蹤模型的改進(jìn)和擴(kuò)展,需要打破該模型對(duì)學(xué)習(xí)者練習(xí)環(huán)節(jié)中引入文本信息、練習(xí)難易程度、概念層次以及概念之間的依賴性等先決條件的限制。受記憶增強(qiáng)神經(jīng)網(wǎng)絡(luò)的啟發(fā),學(xué)者們采用補(bǔ)充外部記憶結(jié)構(gòu)來(lái)改進(jìn)深度知識(shí)追蹤模型,由此能更好地追蹤學(xué)習(xí)者對(duì)復(fù)雜概念的掌握程度。其中使用鍵值記憶元來(lái)表示學(xué)習(xí)者學(xué)習(xí)知識(shí)狀態(tài)的KVMN模型,比深度知識(shí)追蹤的隱藏變量具有更大的表達(dá)能力。由于許多研究人員對(duì)深度知識(shí)追蹤的可解釋性提出了批評(píng),因此學(xué)者們嘗試使用其他方法來(lái)解決該問(wèn)題。最終學(xué)者發(fā)現(xiàn)模型的固有可解釋性可以通過(guò)構(gòu)建學(xué)習(xí)模型來(lái)實(shí)現(xiàn),該學(xué)習(xí)模型將可解釋性直接包括到特定模型結(jié)構(gòu)中,以提高深度知識(shí)追蹤的可解釋性。
3. 基于時(shí)空序列和特征嵌入的深度知識(shí)跟蹤模型SSFE-DKT
3.1 模型框架
基于時(shí)空序列和特征嵌入的深度知識(shí)跟蹤模型包括三個(gè)部分:采用卷積神經(jīng)網(wǎng)絡(luò)提取學(xué)習(xí)者答題序列的空間特征的部分、中間數(shù)據(jù)處理的部分、通過(guò)長(zhǎng)短期記憶網(wǎng)絡(luò)提取學(xué)習(xí)者答題過(guò)程中的時(shí)間和空間特征的部分。如圖1所示。該模型直接使用LSTM從學(xué)習(xí)者的答題歷史中提取序列的時(shí)間特征,該特征表示為學(xué)習(xí)者的隱藏知識(shí)狀態(tài),然后輸出下一段時(shí)間的預(yù)測(cè)結(jié)果。SSFE-DKT模型從兩個(gè)方面進(jìn)行了改進(jìn)。一是從序列特征中提取的信息數(shù)據(jù)不只包含原始學(xué)習(xí)者答題記錄,還包括使用卷積神經(jīng)網(wǎng)絡(luò)從學(xué)習(xí)者答題序列中提取的空間特征數(shù)據(jù)。二是模型中時(shí)間特征學(xué)習(xí)結(jié)構(gòu)采用LSTM可以學(xué)習(xí)正向?qū)W習(xí)者互動(dòng)答題序列中的特征,由此既能夠預(yù)測(cè)學(xué)習(xí)者的未來(lái)表現(xiàn)還能兼顧他們的過(guò)去表現(xiàn),這使得在分析學(xué)習(xí)者在每個(gè)時(shí)間步驟的知識(shí)掌握時(shí)能夠獲得更準(zhǔn)確的判斷。
3.2 特征分類
嵌入的特征分為三類:基本特征、互動(dòng)特征和其他特征。基本特征主要指在線教學(xué)平臺(tái)已加入課程的學(xué)習(xí)者的基本信息、課程相關(guān)知識(shí)點(diǎn)信息、課程發(fā)布的練習(xí)題信息;互動(dòng)特征主要指學(xué)習(xí)者學(xué)習(xí)過(guò)程中的學(xué)習(xí)信息,由于此類特征具有動(dòng)態(tài)性,因此需要嵌入時(shí)間信息,即設(shè)定時(shí)間跨度;除了基本特征和互動(dòng)特征,還提取了其他具有一定輔助的特征,這些特征中隱含了學(xué)習(xí)者的答題前后序列信息,有助于提高學(xué)習(xí)者對(duì)其答題行為的可解釋性和可預(yù)測(cè)性。
4. 實(shí)證分析
4.1 數(shù)據(jù)來(lái)源和預(yù)處理
4.1.1 數(shù)據(jù)來(lái)源
本研究的數(shù)據(jù)來(lái)源于在線教育平臺(tái)學(xué)習(xí)者選修的四門思政課,包括“馬克思主義基本原理概論”“新時(shí)代中國(guó)特色社會(huì)主義理論與實(shí)踐”“中國(guó)近現(xiàn)代史綱要”以及“思想道德修養(yǎng)和法律基礎(chǔ)”。學(xué)習(xí)者在2022年春季(數(shù)據(jù)集記為D)、2022年秋季(數(shù)據(jù)集記為D)兩個(gè)自然學(xué)期的答題歷史數(shù)據(jù),共有10431人次參加學(xué)習(xí)。每個(gè)數(shù)據(jù)集的統(tǒng)計(jì)屬性分別為學(xué)習(xí)者用戶數(shù)量和答題互動(dòng)次數(shù),如表1所示。
4.1.2 預(yù)處理
首先,對(duì)原始數(shù)據(jù)集D和D進(jìn)行清洗,若某條數(shù)據(jù)的缺失值比例大于等于50%,則去除該條數(shù)據(jù),否則保留該條數(shù)據(jù),并進(jìn)行缺失值填充。其次,去除兩個(gè)數(shù)據(jù)集中的異常值,對(duì)于同一個(gè)學(xué)習(xí)者ID的同一道練習(xí)題的答題次數(shù)高于10次的,視為異常數(shù)據(jù)。再次,對(duì)兩個(gè)數(shù)據(jù)集進(jìn)行歸一化處理。最后,對(duì)同一學(xué)習(xí)者的多條重復(fù)數(shù)據(jù)進(jìn)行合并,根據(jù)學(xué)習(xí)者ID進(jìn)行身份識(shí)別,得到同時(shí)學(xué)習(xí)四門課程的學(xué)習(xí)者用戶共有3711名,且有效答題次數(shù)為12620。
4.2 實(shí)驗(yàn)驗(yàn)證及分析
4.2.1 數(shù)據(jù)訓(xùn)練實(shí)驗(yàn)
本研究使用基于時(shí)空序列和特征嵌入的深度知識(shí)跟蹤模型在處理后的2022年春季四門課程數(shù)據(jù)D和2022年秋季四門課程數(shù)據(jù)D'上進(jìn)行訓(xùn)練測(cè)試。采用將數(shù)據(jù)集隨機(jī)按照8:2比例劃分為訓(xùn)練集和測(cè)試集,然后使用訓(xùn)練集來(lái)生成模型,再用測(cè)試集來(lái)測(cè)試模型的AUC和R2的值。模型使用期望最大化將參數(shù)擬合到訓(xùn)練集,所有模型使用相同的ad-hoc初始參數(shù)值集:p(Lo)=0.20,p(T)=0.10,p(G)=0.10、p(S)=0.15。由于評(píng)估時(shí)數(shù)據(jù)僅限于有限數(shù)量的計(jì)算資源,因此將EM迭代次數(shù)設(shè)置為5,以便在分配的時(shí)間段內(nèi)進(jìn)行交叉評(píng)估。使用SSFE-DKT模型對(duì)數(shù)據(jù)進(jìn)行訓(xùn)練,同時(shí)也在其他知識(shí)追蹤模型如DKT、SKVMN、Bi-CLKT上分別進(jìn)行訓(xùn)練,模型的AUC和R2測(cè)試結(jié)果分別如表2和表3所示。
4.2.2 實(shí)驗(yàn)結(jié)果分析
通過(guò)四種知識(shí)追蹤模型對(duì)數(shù)據(jù)進(jìn)行訓(xùn)練測(cè)試,在學(xué)習(xí)者層面進(jìn)行了5倍的交叉驗(yàn)證,使用曲線下面積作為度量,同時(shí)也使用R2用來(lái)描述數(shù)據(jù)對(duì)模型的擬合程度的好壞。根據(jù)數(shù)據(jù)結(jié)果顯示,具有合并特征的SSFE-DKT模型優(yōu)于原始DKT模型。由于SSFE-DKT模型可以捕捉學(xué)習(xí)者提交的多個(gè)練習(xí)之間的關(guān)系,因此在多粒度上AUC有顯著的提高。在D2數(shù)據(jù)集上,添加時(shí)間序列和正確性的交叉特征后,AUC值從80.9提高到86.7,R2值從0.373增加到0.416。在D3數(shù)據(jù)集上,AUC值從四種模型的均值76.2增加到81.2,R2值從0.132增加到0.141。事實(shí)上,如果只結(jié)合時(shí)間序列和正確交叉特征,則輸入層的維度僅增加4×2=8(時(shí)間×正確性),因此與原始DKT模型相比,SSFE-DKT模型的運(yùn)行效率更高,且預(yù)測(cè)效果也有所提高,即如果學(xué)習(xí)者在上一次提交中的答案已經(jīng)正確,他們更有可能做出正確的回答。
結(jié)語(yǔ)
越來(lái)越多的學(xué)習(xí)者通過(guò)在線教育平臺(tái)進(jìn)行學(xué)習(xí),由此產(chǎn)生了大量的學(xué)習(xí)和互動(dòng)數(shù)據(jù),促進(jìn)了人工智能輔助教育系統(tǒng)的快速發(fā)展。在學(xué)習(xí)者互動(dòng)數(shù)據(jù)急劇增長(zhǎng)的同時(shí),需要不斷優(yōu)化學(xué)習(xí)者的認(rèn)知判斷和學(xué)習(xí)策略,以提高教育系統(tǒng)的整體效率。因此人工智能輔助的教育應(yīng)用,如基于深度學(xué)習(xí)的知識(shí)追蹤,獲得了越來(lái)越多的關(guān)注。由于深度學(xué)習(xí)尚未解決可解釋性問(wèn)題,因此深度知識(shí)追蹤的三種方法即嵌入、損失函數(shù)限制和新結(jié)構(gòu)都有自身的缺點(diǎn)。未來(lái)對(duì)于知識(shí)追蹤的研究可以借鑒這三種方法,在嵌入學(xué)習(xí)信息的基礎(chǔ)上通過(guò)設(shè)置損失函數(shù)自適應(yīng)保留和丟失數(shù)據(jù),最后結(jié)合知識(shí)圖譜這種圖模型來(lái)直觀體現(xiàn)學(xué)習(xí)者學(xué)習(xí)過(guò)程中知識(shí)的遷移,從而實(shí)現(xiàn)知識(shí)追蹤的目的。
參考文獻(xiàn):
[1]梁琨,任依夢(mèng),尚余虎,等.深度學(xué)習(xí)驅(qū)動(dòng)的知識(shí)追蹤研究進(jìn)展綜述[J].計(jì)算機(jī)工程與應(yīng)用,2021,57(21):41-58.
[2]李夢(mèng)琦.基于深度學(xué)習(xí)的學(xué)習(xí)者知識(shí)追蹤方法研究[D].長(zhǎng)春:東北師范大學(xué),2020.
[3]劉鐵園,陳威,常亮,等.基于深度學(xué)習(xí)的知識(shí)追蹤研究進(jìn)展[J].計(jì)算機(jī)研究與發(fā)展,2022,59(1):81-104.
[4]Piech C,Spencer J,Huang J,et al.Deep Knowledge Tracing[J].Computer Science, 2015,3(3):19-23.
[5]Williams RJ, Zipser D.A Learning Algorithm for Continually Running Fully Recurrent Neural Networks[J].Neural Computation,1990:270-280.
作者簡(jiǎn)介:王全蕊,碩士研究生,講師,研究方向:智慧教育、知識(shí)圖譜構(gòu)建。
基金項(xiàng)目:2023年河南省科技攻關(guān)項(xiàng)目:教育大數(shù)據(jù)視域下基于學(xué)習(xí)反饋?zhàn)赃m應(yīng)的知識(shí)圖譜構(gòu)建(編號(hào):232102211083);河南科技學(xué)院2023年教師教育課程改革研究項(xiàng)目:基于智慧教育理念的中學(xué)線上線下混合式校本課程開(kāi)發(fā)與實(shí)踐研究(編號(hào):2023JSJY10);河南科技學(xué)院2023年第一批教育教學(xué)改革研究與實(shí)踐項(xiàng)目:智慧教育趨向下的融合式教學(xué)實(shí)踐研究——以《操作系統(tǒng)》課程為例(編號(hào):2023YG04)。