








摘 要:現(xiàn)有知識(shí)追蹤方法未能深入探索知識(shí)點(diǎn)間多種關(guān)系并同時(shí)考慮知識(shí)相互作用和時(shí)間對(duì)知識(shí)狀態(tài)的影響。鑒于此,從知識(shí)間多種關(guān)系和學(xué)習(xí)遺忘規(guī)律兩方面改進(jìn)知識(shí)追蹤模型,提出多關(guān)系和時(shí)間增強(qiáng)的知識(shí)追蹤模型(MRTKT)。首先,根據(jù)認(rèn)知同化理論豐富了知識(shí)間關(guān)系,使用統(tǒng)計(jì)學(xué)方法構(gòu)建了包含上位學(xué)習(xí)、下位學(xué)習(xí)以及并列組合學(xué)習(xí)三種關(guān)系的知識(shí)結(jié)構(gòu)圖;其次,對(duì)知識(shí)間相互作用進(jìn)行建模,根據(jù)上述三種關(guān)系聚集節(jié)點(diǎn)特征,使得模型可以更好地模擬知識(shí)間的影響傳播行為;然后,構(gòu)建融入三種時(shí)間信息的GRU門更新學(xué)生知識(shí)狀態(tài),以模擬學(xué)習(xí)和遺忘對(duì)知識(shí)狀態(tài)的影響,使得各節(jié)點(diǎn)特征包含知識(shí)間相互作用信息和時(shí)間信息,為預(yù)測(cè)學(xué)習(xí)者答題表現(xiàn)提供更全面豐富的信息。在多個(gè)公開(kāi)數(shù)據(jù)集上進(jìn)行實(shí)驗(yàn),結(jié)果表明MRTKT比現(xiàn)有模型具有更優(yōu)越的性能以及更好的可解釋性。
關(guān)鍵詞:知識(shí)追蹤; 門控圖神經(jīng)網(wǎng)絡(luò); GRU; 知識(shí)間多種關(guān)系; 學(xué)習(xí)遺忘
中圖分類號(hào):TP391"" 文獻(xiàn)標(biāo)志碼:A
文章編號(hào):1001-3695(2025)03-011-0728-07
doi:10.19734/j.issn.1001-3695.2024.07.0301
Multiple relations and time enhanced knowledge tracing model
Zhang Wei, Luo Peihua, Gong Zhongwei, Li Zhixin, Song Lingling
(Faculty of Artificial Intelligence Education, Central China Normal University, Wuhan 430079, China)
Abstract:Existing knowledge tracing methods fail to effectively explore and utilize the multiple relations between concepts and simultaneously consider the effects of interactions between concepts as well as time on the knowledge state. This paper improved the knowledge tracing model in terms of multiple relations between concepts and learning-forgetting patterns, and proposed a multiple relations and time enhanced knowledge tracing model(MRTKT) . Firstly, it enriched the relations between concepts according to assimilation theory, and constructed a knowledge structure containing three relationships of superordinate learning, subordinate learning, and combinatorial learning by using a statistical methodology. Secondly, it modeled the inte-raction between concepts enables the aggregation of node features based on the above three relationships. This enables the model to better simulate influence propagation among concepts. Then, it updated knowledge states using a gate mechanism incorporating three temporal factors in order to simulate the learning-forgetting effect. This ensures that each node feature contains both interactions between concepts and time information, providing more comprehensive and rich information for predicting learners’ responses. It conducted experiments on three real-world datasets, and the results show that MRTKT has superior performance and better interpretability than existing models.
Key words:knowledge tracing; GGNN; GRU; multiple relations between concepts; learning and forgetting
0 引言
智能輔導(dǎo)系統(tǒng)(ITS)加速發(fā)展,為實(shí)現(xiàn)個(gè)性化學(xué)習(xí)創(chuàng)造了機(jī)會(huì)。知識(shí)追蹤作為實(shí)現(xiàn)個(gè)性化學(xué)習(xí)的重要技術(shù),旨在精確追蹤學(xué)習(xí)者知識(shí)掌握水平并預(yù)測(cè)學(xué)習(xí)者答題反饋,從而為智能輔導(dǎo)系統(tǒng)提供技術(shù)支撐[1]。
預(yù)測(cè)學(xué)習(xí)者知識(shí)狀態(tài)是知識(shí)追蹤的重要環(huán)節(jié),其受知識(shí)相互作用和時(shí)間的影響。知識(shí)相互作用方面,認(rèn)知同化理論認(rèn)為新知識(shí)與原有知識(shí)之間存在三種相互作用,分別是上位學(xué)習(xí)、下位學(xué)習(xí)以及并列組合學(xué)習(xí)[2]。具體地,上位學(xué)習(xí)指通過(guò)綜合歸納獲得意義的學(xué)習(xí);下位學(xué)習(xí)指把新知識(shí)歸屬于原有知識(shí)并使之相互聯(lián)系的過(guò)程;并列組合學(xué)習(xí)是在新知識(shí)與原有知識(shí)既非類屬關(guān)系又非總括關(guān)系時(shí)產(chǎn)生的。如圖1所示,假設(shè)有知識(shí)k1、k2、k3、k4分別為面積S、長(zhǎng)方形面積Srectangle=ab、正方形面積Ssquare=a2、長(zhǎng)度L,k2比k3包含的范圍更廣,因此k2是k3的上位知識(shí),k3是k2的下位知識(shí),兩者間存在上位和下位關(guān)系;k1和k4間不存在包含關(guān)系,但經(jīng)常需要組合理解,因此k1和k4存在并列組合關(guān)系。學(xué)習(xí)者練習(xí)k1,可以加深對(duì)k4的理解,加強(qiáng)對(duì)k2的掌握。此外,時(shí)間方面,知識(shí)掌握程度會(huì)隨著時(shí)間的推移而衰減[3],即學(xué)習(xí)者對(duì)知識(shí)的掌握程度會(huì)由于缺乏練習(xí)導(dǎo)致生疏和遺忘,也能通過(guò)練習(xí)得到鞏固和強(qiáng)化[4]。如圖1所示,k1長(zhǎng)時(shí)間未得到練習(xí),因而時(shí)間步t4時(shí)k1的知識(shí)掌握水平低于時(shí)間步t1時(shí)的知識(shí)掌握水平。
如上所述,知識(shí)狀態(tài)受知識(shí)相互作用和時(shí)間的雙重影響。知識(shí)相互作用方面,知識(shí)認(rèn)知任務(wù)中的知識(shí)結(jié)構(gòu)蘊(yùn)涵知識(shí)間相似性、依賴性等豐富信息,使用明確的結(jié)構(gòu)有助于提高模型性能和可解釋性[5]。例如,KSGKT[6]和HIN-KT[7]引入知識(shí)結(jié)構(gòu)緩解數(shù)據(jù)稀疏性問(wèn)題,GKT[8]基于知識(shí)結(jié)構(gòu)建模知識(shí)間的相互作用。上述模型在構(gòu)建知識(shí)結(jié)構(gòu)時(shí)只考慮了先決條件,沒(méi)有深入探索概念間的多種關(guān)系。DKTMR[9]和SKT[10]構(gòu)建了包含有向和無(wú)向關(guān)系的知識(shí)結(jié)構(gòu)圖,但是忽略了知識(shí)間上位學(xué)習(xí)和并列組合學(xué)習(xí)兩種關(guān)系。其次,建模影響傳播的模型僅使用簡(jiǎn)單門控機(jī)制建模遺忘,忽視了時(shí)間信息的影響。時(shí)間方面,考慮時(shí)間因素有助于準(zhǔn)確模擬學(xué)習(xí)者知識(shí)狀態(tài)演化過(guò)程[11]。例如,HawkesKT[12]和RKT[13]使用核函數(shù)模擬時(shí)間效應(yīng);LPKT[14]和GFLDKT[15]改進(jìn)門控機(jī)制。然而,有意義的學(xué)習(xí)和遺忘依賴于建立新舊知識(shí)間的聯(lián)系[2],上述模型主要關(guān)注單個(gè)知識(shí)的時(shí)間信息,并未對(duì)交互序列中涉及的知識(shí)關(guān)系建模??偟膩?lái)說(shuō),現(xiàn)有研究存在以下三個(gè)問(wèn)題:a)未建模上位學(xué)習(xí)和并列組合學(xué)習(xí)兩種相互作用;b)建模知識(shí)相互作用的模型未考慮時(shí)間信息;c)建模學(xué)習(xí)遺忘的模型未考慮知識(shí)相互作用。
為了解決上述問(wèn)題,本文存在以下挑戰(zhàn):a)如何從數(shù)據(jù)集中挖掘三種關(guān)系。概念間的三種關(guān)系是學(xué)習(xí)者認(rèn)知同化的三種主要方式,但數(shù)據(jù)集中并未明確給出三種關(guān)系信息,因此如何根據(jù)三種關(guān)系的定義構(gòu)建概率統(tǒng)計(jì)公式以挖掘交互序列中蘊(yùn)涵的概念間關(guān)系信息是本文有待解決的挑戰(zhàn)之一。b)如何建模概念間的多種相互作用。概念間的影響多樣且復(fù)雜,現(xiàn)有研究要么只考慮一種影響,要么通過(guò)構(gòu)建多個(gè)圖以建模多種影響,本文引入門控圖神經(jīng)網(wǎng)絡(luò)(GGNN)[16],利用表示概念間關(guān)系的邊類型建模對(duì)應(yīng)影響傳播方式。該方法具有兩個(gè)優(yōu)點(diǎn):(a)使用邊類型能有效表示不同關(guān)系類型并便于創(chuàng)建不同影響傳播方式;(b)GGNN允許每個(gè)節(jié)點(diǎn)對(duì)相鄰節(jié)點(diǎn)既接收信息又發(fā)送信息,可應(yīng)用于有向圖和無(wú)向圖的影響傳播,無(wú)須建構(gòu)多個(gè)圖。c)如何建模知識(shí)狀態(tài)受知識(shí)相互作用和時(shí)間兩方面影響。知識(shí)相互作用和時(shí)間是影響學(xué)習(xí)者知識(shí)掌握程度的兩個(gè)關(guān)鍵認(rèn)知過(guò)程,本文在聚合概念節(jié)點(diǎn)特征的基礎(chǔ)上加入時(shí)間信息以更新節(jié)點(diǎn)特征,能夠有效且合理地建模學(xué)習(xí)者認(rèn)知過(guò)程,提高模型的預(yù)測(cè)精度。
為此,本文提出了一種新的知識(shí)追蹤方法,即多關(guān)系和時(shí)間增強(qiáng)的知識(shí)追蹤模型(MRTKT)。具體地說(shuō),建模知識(shí)相互作用方面,首先根據(jù)認(rèn)知同化理論對(duì)三種關(guān)系的定義,基于數(shù)據(jù)集信息以統(tǒng)計(jì)學(xué)的方式深入挖掘知識(shí)間關(guān)系,給出三種關(guān)系的計(jì)算方式;其次引入GGNN,利用表示知識(shí)間不同關(guān)系類型的邊建模對(duì)應(yīng)影響傳播方式。建模學(xué)習(xí)遺忘作用方面,使用融合時(shí)間信息的門控機(jī)制更新受知識(shí)相互作用影響后的知識(shí)狀態(tài)。
綜上,本研究的主要貢獻(xiàn)可以總結(jié)為
a)本文利用認(rèn)知同化理論豐富了現(xiàn)有知識(shí)追蹤任務(wù)中知識(shí)結(jié)構(gòu)的拓?fù)湫畔?,引入上位學(xué)習(xí)、下位學(xué)習(xí)以及并列組合學(xué)習(xí)三種知識(shí)間關(guān)系,并給出使用統(tǒng)計(jì)學(xué)方式計(jì)算得到這三種關(guān)系的方法,更好地構(gòu)建了知識(shí)結(jié)構(gòu)。
b)模型通過(guò)顯式建模三種知識(shí)間相互作用以追蹤學(xué)習(xí)者知識(shí)狀態(tài)隨交互行為的演變過(guò)程。為了對(duì)知識(shí)間的多種關(guān)系進(jìn)行建模,利用邊類型表示不同影響傳播關(guān)系,使用GGNN網(wǎng)絡(luò)建模知識(shí)狀態(tài)受知識(shí)相互作用影響的演化過(guò)程。
c)在建模知識(shí)相互作用的基礎(chǔ)上同時(shí)考慮遺忘和學(xué)習(xí)規(guī)律,使用門控機(jī)制融合時(shí)間特征模擬時(shí)間影響。從知識(shí)相互作用和時(shí)間兩方面充分挖掘?qū)W習(xí)者學(xué)習(xí)過(guò)程的特征,從而更合理有效地建模學(xué)習(xí)者知識(shí)狀態(tài)演化過(guò)程。
d)在真實(shí)世界數(shù)據(jù)集上進(jìn)行大量實(shí)驗(yàn),結(jié)果表明MRTKT的性能顯著優(yōu)于當(dāng)前主流知識(shí)追蹤模型。消融實(shí)驗(yàn)證明建模知識(shí)相互作用以及學(xué)習(xí)遺忘作用的有效性,模型為理解學(xué)習(xí)者知識(shí)狀態(tài)提供可信服解釋。
1 相關(guān)工作
BKT[17]、DKT[18]和DKVMN[19]分別使用隱馬爾可夫模型(HMM)、循環(huán)神經(jīng)網(wǎng)絡(luò)(RNN)和改進(jìn)的記憶增強(qiáng)網(wǎng)絡(luò)(MANN)動(dòng)態(tài)追蹤學(xué)習(xí)者知識(shí)狀態(tài),在結(jié)果預(yù)測(cè)方面取得良好效果。但上述模型仍然存在兩方面不足:a)不能處理知識(shí)結(jié)構(gòu)表示,造成知識(shí)間關(guān)系信息遺失;b)沒(méi)有建?;蛘邇H通過(guò)簡(jiǎn)單的門控機(jī)制模擬學(xué)習(xí)遺忘過(guò)程,導(dǎo)致時(shí)間信息并未充分利用。本章將從建模知識(shí)間關(guān)系的知識(shí)追蹤模型、建模學(xué)習(xí)遺忘的知識(shí)追蹤模型以及門控圖神經(jīng)網(wǎng)絡(luò)三方面進(jìn)行相關(guān)工作回顧,旨在討論現(xiàn)有模型的局限以及與本文工作的不同之處,同時(shí)介紹門控圖神經(jīng)網(wǎng)絡(luò)在知識(shí)追蹤中的應(yīng)用。
1.1 考慮知識(shí)間關(guān)系的知識(shí)追蹤模型
為了解決數(shù)據(jù)稀疏性和信息丟失問(wèn)題,PDKT-C[20]將知識(shí)間先決關(guān)系建模為約束條件,KSGKT[6]和Bi-CLKT[21]構(gòu)建包含知識(shí)間關(guān)聯(lián)關(guān)系的圖并分別通過(guò)Metapath2Vec方式和對(duì)比自監(jiān)督學(xué)習(xí)技術(shù)獲得問(wèn)題嵌入。這些模型取得顯著成效,但其有效性局限于利用知識(shí)結(jié)構(gòu)豐富問(wèn)題表征。有研究深入探索并應(yīng)用知識(shí)間結(jié)構(gòu)關(guān)系,APGKT[22]對(duì)技能圖和問(wèn)題圖應(yīng)用圖卷積神經(jīng)網(wǎng)絡(luò)(GCN)獲得聚合的問(wèn)題嵌入,DGMN[23]基于動(dòng)態(tài)值矩陣構(gòu)建潛在知識(shí)圖并使用GCN動(dòng)態(tài)學(xué)習(xí)潛在知識(shí)之間的關(guān)系。這些模型在利用結(jié)構(gòu)關(guān)系信息方面更加深入,但沒(méi)有細(xì)分知識(shí)間不同關(guān)系的相互影響。少數(shù)研究建模知識(shí)間相互作用,GKT[8]直接建模每個(gè)知識(shí)的知識(shí)狀態(tài),引入圖神經(jīng)網(wǎng)絡(luò)(GNN)根據(jù)知識(shí)間關(guān)系聚合信息;SKT[10]通過(guò)構(gòu)建有向圖和無(wú)向圖來(lái)表示不同學(xué)習(xí)遷移方式,并分別對(duì)兩個(gè)圖使用部分傳播和同步傳播的方式聚合節(jié)點(diǎn)信息。這兩個(gè)模型僅考慮了上位概念對(duì)下位概念的影響,且并未深入挖掘數(shù)據(jù)集中的時(shí)間信息,不能準(zhǔn)確模擬學(xué)習(xí)者認(rèn)知過(guò)程,導(dǎo)致預(yù)測(cè)結(jié)果不準(zhǔn)確。
1.2 考慮學(xué)習(xí)遺忘的知識(shí)追蹤模型
有研究關(guān)注記憶的內(nèi)容隨時(shí)間推移遞減的過(guò)程,ERL[24]集成包括遺忘行為等四種特征生成嵌入接口,HawkesKT[12]和RKT[13]采用指數(shù)函數(shù)作為核函數(shù)。有研究關(guān)注記憶內(nèi)容隨練習(xí)次數(shù)而逐漸鞏固的過(guò)程,CAKT[25]顯式建模學(xué)習(xí)曲線理論,使用三維卷積神經(jīng)網(wǎng)絡(luò)獲取學(xué)習(xí)者近期對(duì)知識(shí)的掌握水平。也有研究綜合考慮學(xué)習(xí)和遺忘對(duì)記憶的影響,KPT[26]定義了學(xué)習(xí)和遺忘因子計(jì)算公式,并使用參數(shù)平衡兩者以捕捉學(xué)習(xí)特點(diǎn),KTM-DLF[27]利用因子分解機(jī)來(lái)整合學(xué)習(xí)遺忘因素,DKT+Forgetting[28]簡(jiǎn)單地將時(shí)間因素整合到RNN中,LPKT[14]基于時(shí)間信息、知識(shí)狀態(tài)以及學(xué)習(xí)增益設(shè)計(jì)學(xué)習(xí)門和遺忘門,CF-DKD[29]使用學(xué)習(xí)門和遺忘門自適應(yīng)融合學(xué)習(xí)特征和遺忘特征,GFLDKT[15]通過(guò)設(shè)計(jì)兩種門控機(jī)制來(lái)明確建模遺忘和學(xué)習(xí)行為。上述模型均未考慮知識(shí)間相互影響,對(duì)學(xué)習(xí)者認(rèn)知過(guò)程的建模不全面。
1.3 GGNN
Gilmer等[30]通過(guò)抽象圖形結(jié)構(gòu)數(shù)據(jù)模型的共性提出消息傳遞神經(jīng)網(wǎng)絡(luò)(MPNN),指出圖神經(jīng)網(wǎng)絡(luò)是一個(gè)鄰居聚合策略,表示節(jié)點(diǎn)的向量由其鄰居節(jié)點(diǎn)通過(guò)聚合計(jì)算得來(lái)。GGNN作為一種經(jīng)典的消息傳遞模型,具有能夠雙向傳遞信息和允許多關(guān)系傳播的優(yōu)點(diǎn),并已在多個(gè)領(lǐng)域得到成功運(yùn)用。例如,SR-GNN[31]基于會(huì)話圖使用GGNN捕捉上下文之間項(xiàng)目的復(fù)雜轉(zhuǎn)換,解決了以往推薦模型中連續(xù)項(xiàng)目之間的單向轉(zhuǎn)換問(wèn)題;Gilmer等人[30]將MPNN應(yīng)用于分子性質(zhì)預(yù)測(cè),根據(jù)化學(xué)鍵類型模擬原子之間的消息傳遞過(guò)程,取得成功。類似消息傳遞過(guò)程,認(rèn)知過(guò)程中學(xué)習(xí)者通過(guò)整合相關(guān)舊知識(shí)更新并獲得新知識(shí)。SGKT[32]利用GGNN能夠雙向傳遞信息的優(yōu)點(diǎn)將GGNN應(yīng)用于會(huì)話圖以獲取學(xué)習(xí)者知識(shí)隱藏狀態(tài)。
1.4 本研究與現(xiàn)有研究的不同
綜上,知識(shí)相互作用方面,建模知識(shí)間影響傳播的研究未建模知識(shí)間上位學(xué)習(xí)以及并列組合學(xué)習(xí)兩種相互作用,且并未挖掘時(shí)間信息建模遺忘過(guò)程,限制了模型表現(xiàn);時(shí)間方面,上述模型在建模學(xué)習(xí)遺忘作用時(shí)未考慮知識(shí)間關(guān)系,影響模型表現(xiàn);GGNN應(yīng)用方面,目前尚未有知識(shí)追蹤研究將GGNN應(yīng)用于建模知識(shí)間多種影響傳播。
本文方法與現(xiàn)有研究的不同之處如下:首先,本文方法從數(shù)據(jù)集中挖掘知識(shí)點(diǎn)間上位學(xué)習(xí)、下位學(xué)習(xí)以及并列組合學(xué)習(xí)三種關(guān)系。其次,本文方法充分利用GGNN允許多種邊類型的優(yōu)點(diǎn),以邊表示概念間關(guān)系類型,建模知識(shí)間三種相互作用,當(dāng)前節(jié)點(diǎn)及其鄰居節(jié)點(diǎn)通過(guò)邊相互傳遞信息,使得每個(gè)節(jié)點(diǎn)同時(shí)捕獲當(dāng)前時(shí)間步長(zhǎng)中自身的特征及鄰居節(jié)點(diǎn)的特征。最后,本文方法應(yīng)用融合時(shí)間特征的門控機(jī)制更新節(jié)點(diǎn)信息。
綜上所述,本文基于教育心理學(xué)的認(rèn)知同化理論,提出從數(shù)據(jù)集中自動(dòng)挖掘三種關(guān)聯(lián)關(guān)系的方法,并引入GGNN建模概念間的多種影響傳播,增強(qiáng)了模型的可解釋性;此外,基于遺忘和學(xué)習(xí)規(guī)律,本文在建模知識(shí)相互作用的基礎(chǔ)上融入時(shí)間信息以更新節(jié)點(diǎn)特征,能更合理有效地建模學(xué)習(xí)者認(rèn)知過(guò)程,提高模型預(yù)測(cè)性能。
2 前置工作
2.1 問(wèn)題定義
MRTKT使用監(jiān)督學(xué)習(xí)框架,通過(guò)預(yù)測(cè)學(xué)習(xí)者作答情況追蹤學(xué)習(xí)者知識(shí)狀態(tài),其任務(wù)描述如下:給定學(xué)習(xí)者i的T次作答交互序列Xi=(x1,x2,…,xT),其中xt是一個(gè)包含題目和答題結(jié)果的作答交互元組(et,at),et表示在時(shí)間戳t處作答的題目,at∈{0,1}表示題目et是否回答正確(1表示回答正確,0表示回答錯(cuò)誤)。MRTKT假設(shè)學(xué)習(xí)者答題過(guò)程為有意義學(xué)習(xí),模型目標(biāo)如下:a)追蹤學(xué)習(xí)者知識(shí)狀態(tài)ht,即建模知識(shí)掌握程度隨時(shí)間的演變;b)預(yù)測(cè)學(xué)習(xí)者對(duì)題目et的作答情況at,即預(yù)測(cè)學(xué)習(xí)者正確作答題目et的概率p=(at=1|et,X)。
2.2 知識(shí)結(jié)構(gòu)
2.3 知識(shí)間關(guān)系
下位關(guān)系即知識(shí)間的類屬關(guān)系可以由專家手動(dòng)標(biāo)記[20],也可以通過(guò)統(tǒng)計(jì)等方法自動(dòng)完成[8,33]。由于專家標(biāo)注方法耗時(shí)耗力且?guī)в兄饔^偏見(jiàn),本文選擇統(tǒng)計(jì)方法識(shí)別知識(shí)關(guān)系。類屬關(guān)系可以根據(jù)當(dāng)一個(gè)知識(shí)被掌握時(shí),它被轉(zhuǎn)移到另一個(gè)知識(shí)的概率獲得,例如表示長(zhǎng)方形面積Srectangle=ab、正方形面積Ssquare=a2的知識(shí)i、j間存在類屬關(guān)系,當(dāng)學(xué)習(xí)者掌握知識(shí)i后可以幫助理解知識(shí)j。具體計(jì)算如式(1)所示,Nij表示在學(xué)習(xí)者作答交互序列中知識(shí)j在i被正確回答后被正確回答的次數(shù),Tij表示知識(shí)i到j(luò)的轉(zhuǎn)換概率,即知識(shí)i對(duì)j的影響。將閾值設(shè)置為λ1以獲得邊,刪除圖中的循環(huán)以獲得有向無(wú)環(huán)圖。上位關(guān)系即知識(shí)間的總括關(guān)系,由于每個(gè)節(jié)點(diǎn)的入邊被表示下位關(guān)系,直觀地,每個(gè)節(jié)點(diǎn)的出邊則表示上位關(guān)系。
并列組合關(guān)系表示知識(shí)間的并列關(guān)系,可以根據(jù)各知識(shí)被同時(shí)包含于同一題目的概率構(gòu)建,例如對(duì)具有并列組合關(guān)系的知識(shí)面積S、長(zhǎng)度L的考察通常包括在同一題目中,因此選擇計(jì)算共現(xiàn)概率。參考SEEP[34]計(jì)算如式(2)所示,Q表示題目-知識(shí)矩陣,每一行表示每道題目所涉及的知識(shí),Q:,i表示Q的第i列,C表示共現(xiàn)視角下知識(shí)間的關(guān)系,即C的每個(gè)元素表示知識(shí)i和知識(shí)j同時(shí)出現(xiàn)在同一道題目的概率,表示逐元素乘積,·1表示1范式。由于并列組合學(xué)習(xí)是在新知識(shí)與原有知識(shí)既非類屬關(guān)系又非總括關(guān)系時(shí)產(chǎn)生的,所以刪除表示上位關(guān)系和下位關(guān)系的邊。對(duì)C進(jìn)行最大值-最小值縮放歸一化得到∈{0,1}|V|×|V|,設(shè)置閾值為λ2。
(2)
3 MRTKT模型
MRTKT模型主要由特征嵌入、知識(shí)間多種關(guān)系的消息傳播、學(xué)習(xí)遺忘作用更新模塊和預(yù)測(cè)模塊四部分組成。具體來(lái)說(shuō),特征嵌入模塊集成知識(shí)和對(duì)應(yīng)狀態(tài)嵌入作為輸入向量,并將重復(fù)延遲、序列延遲以及重復(fù)次數(shù)三個(gè)時(shí)間特征通過(guò)2個(gè)多層感知機(jī)分別生成2個(gè)特征向量作為門控機(jī)制輸入向量;知識(shí)間多種關(guān)系的消息傳播模塊使用GGNN根據(jù)邊類型聚合相關(guān)知識(shí)信息,模擬知識(shí)間相互作用;學(xué)習(xí)遺忘作用更新模塊使用類似GRU的機(jī)制并考慮時(shí)間特征更新隱藏狀態(tài);預(yù)測(cè)模塊預(yù)測(cè)學(xué)習(xí)者作答反饋。圖3展示,MRTKT的模型體系結(jié)構(gòu)。
3.1 特征嵌入
現(xiàn)有研究表明[24,28,29],影響學(xué)習(xí)者對(duì)知識(shí)掌握程度的時(shí)間特征主要為重復(fù)時(shí)間間隔Δrt、序列時(shí)間間隔Δst和過(guò)去重復(fù)次數(shù)Δct。重復(fù)時(shí)間間隔指同一知識(shí)重復(fù)時(shí)間間隔;序列時(shí)間間隔指學(xué)習(xí)交互序列中相鄰知識(shí)時(shí)間間隔;過(guò)去重復(fù)次數(shù)指同一知識(shí)在當(dāng)前時(shí)刻前交互總數(shù)。為了將時(shí)間特征引入門控機(jī)制以更好地建模學(xué)生的遺忘過(guò)程,本文由上述三個(gè)特征計(jì)算得到兩個(gè)與時(shí)間有關(guān)的向量ttz和ttr。具體地說(shuō),把三個(gè)時(shí)間特征拼接并通過(guò)線性層后得到更新門時(shí)間特征
3.5 實(shí)現(xiàn)方法
MRTKT將概念、作答情況、時(shí)間信息等作為模型輸入,并輸出預(yù)測(cè)的作答情況,具體實(shí)驗(yàn)步驟如下:
a)構(gòu)建包含三種知識(shí)間關(guān)系的知識(shí)結(jié)構(gòu)。利用學(xué)習(xí)者作答交互序列得到轉(zhuǎn)移概率,據(jù)此得到知識(shí)間的上位關(guān)系和下位關(guān)系。然后,根據(jù)數(shù)據(jù)集中給出的題目和概念信息計(jì)算得到共現(xiàn)概率,據(jù)此得到知識(shí)間的并列組合關(guān)系。根據(jù)上述得到的知識(shí)間關(guān)系可以構(gòu)建包含上位關(guān)系、下位關(guān)系和并列組合關(guān)系的知識(shí)結(jié)構(gòu)鄰接矩陣。
b)獲取特征嵌入向量。對(duì)數(shù)據(jù)集中學(xué)習(xí)者作答交互記錄進(jìn)行編碼,得到交互向量。將從數(shù)據(jù)集中計(jì)算得到的時(shí)間信息輸入多層感知機(jī)得到兩個(gè)時(shí)間向量。
c)建模根據(jù)多種關(guān)系進(jìn)行消息傳播。根據(jù)構(gòu)建的知識(shí)結(jié)構(gòu)中包含的關(guān)系信息,利用式(2)計(jì)算得到每個(gè)概念對(duì)應(yīng)的消息向量mtk。
d)建模根據(jù)學(xué)習(xí)遺忘效應(yīng)進(jìn)行知識(shí)狀態(tài)更新。將時(shí)間特征和消息向量輸入GRU中,結(jié)合學(xué)習(xí)者交互向量和前一刻知識(shí)狀態(tài),通過(guò)式(6)(7)計(jì)算得到當(dāng)前時(shí)刻的知識(shí)狀態(tài)htk。
e)預(yù)測(cè)學(xué)習(xí)者答題情況。利用式(8)將學(xué)習(xí)者當(dāng)前時(shí)刻知識(shí)狀態(tài)輸入全連接層,使用非激活函數(shù)將值映射到0~1,得到學(xué)習(xí)者正確作答題目的概率。
4 實(shí)驗(yàn)與結(jié)果分析
實(shí)驗(yàn)旨在回答以下研究問(wèn)題:a)MRTKT模型與最先進(jìn)的知識(shí)追蹤模型相比表現(xiàn)如何?b)MRTKT模型中的不同組件(即知識(shí)相互作用和時(shí)間因素)對(duì)性能的影響如何?c)MRTKT模型的預(yù)測(cè)結(jié)果是否具有可解釋性?
4.1 數(shù)據(jù)集
使用以下三個(gè)公開(kāi)數(shù)據(jù)集評(píng)估模型預(yù)測(cè)學(xué)習(xí)者回答新習(xí)題的表現(xiàn),數(shù)據(jù)集包含習(xí)題和學(xué)習(xí)者交互的豐富信息,表1為總結(jié)數(shù)據(jù)集的統(tǒng)計(jì)數(shù)據(jù)。
a)ASSIST2009:ASSISTment系統(tǒng)2009年到2010年收集的練習(xí)日志,包含4 163名學(xué)習(xí)者的交互記錄、17 751道與123個(gè)知識(shí)相關(guān)的習(xí)題信息,形成283 105條互動(dòng)記錄。
b)ASSIST2017:ASSISTment系統(tǒng)收集的練習(xí)日志,用于2017數(shù)據(jù)挖掘競(jìng)賽,包含1 709名學(xué)習(xí)者的交互記錄、3 162道與102個(gè)知識(shí)相關(guān)的習(xí)題信息,形成942 816條互動(dòng)記錄。相較于其他ASSISTment數(shù)據(jù)集,該數(shù)據(jù)集具有更為豐富的練習(xí)記錄以及更高程度的完整性和正態(tài)性。
c)Algebra2005:認(rèn)知代數(shù)輔導(dǎo)系統(tǒng)2005年至2006年收集的練習(xí)日志,用于KDDcup 2010教育數(shù)據(jù)挖掘挑戰(zhàn)賽,包含574名學(xué)習(xí)者的交互記錄、1 084道與436個(gè)知識(shí)相關(guān)的習(xí)題信息,形成607 025條互動(dòng)記錄。
4.2 訓(xùn)練細(xì)節(jié)和評(píng)估指標(biāo)
a)數(shù)據(jù)集設(shè)置。每個(gè)數(shù)據(jù)集按照9∶1分為訓(xùn)練集和測(cè)試集,使用訓(xùn)練集學(xué)習(xí)模型參數(shù),測(cè)試集驗(yàn)證模型效果。由于數(shù)據(jù)集中沒(méi)有提供知識(shí)間上位關(guān)系、下位關(guān)系和并列組合關(guān)系的數(shù)據(jù)信息,本文提供構(gòu)建上述三種關(guān)系的實(shí)現(xiàn)(3.3節(jié))。
b)訓(xùn)練參數(shù)設(shè)置。隱藏狀態(tài)的嵌入維度d被設(shè)置為32,處理批次設(shè)置為32,交互序列最長(zhǎng)長(zhǎng)度設(shè)置為100,使用Adam優(yōu)化器優(yōu)化模型參數(shù),其中l(wèi)r=0.001。在ASSIST2009和ASSIST2017中,λ1和λ2設(shè)置為0.2;在Algebra2005中,λ1和λ2分別設(shè)置為0.04和0.5。本文模型使用PyTorch實(shí)現(xiàn)。
c)評(píng)估指標(biāo)選取。從分類角度,選擇現(xiàn)有研究中廣泛使用的曲線下面積(AUC)和精度(ACC)作為評(píng)估預(yù)測(cè)結(jié)果有效性的指標(biāo)[36],設(shè)置0.5作為精度計(jì)算的閾值;從比較模型性能角度,選擇Delong檢驗(yàn)計(jì)算次優(yōu)模型和本模型的z-score和p-value作為檢驗(yàn)AUC顯著性的指標(biāo)[37]。其中,AUC以及ACC的值越大,表示模型性能越好;|z|gt;1.96且plt;0.05表示兩模型的AUC具有顯著性差別。
4.3 對(duì)比模型
MRTKT模型與以下8個(gè)模型進(jìn)行比較。
a)DKT[18]:使用循環(huán)神經(jīng)網(wǎng)絡(luò)追蹤學(xué)生知識(shí)狀態(tài)。
b)DKVMN[19]:受記憶增強(qiáng)神經(jīng)網(wǎng)絡(luò)啟發(fā),設(shè)置靜態(tài)鍵矩陣和動(dòng)態(tài)值矩陣追蹤學(xué)生知識(shí)狀態(tài)。
c)GKT[8]:引入圖神經(jīng)網(wǎng)絡(luò)捕獲知識(shí)關(guān)聯(lián)關(guān)系。
d)DKT+Forgetting[28]:在DKT的基礎(chǔ)上添加遺忘特征優(yōu)化遺忘機(jī)制。
e)SAKT[38]:使用自注意力機(jī)制追蹤學(xué)生知識(shí)狀態(tài)。
f)SKT[10]:在GKT的基礎(chǔ)上融入學(xué)習(xí)遷移理論改進(jìn)知識(shí)間相互影響方式。
g)HawkesKT[12]:引入霍克斯過(guò)程解決時(shí)間交叉效應(yīng)。
h)CL4KT[39]:引入對(duì)比學(xué)習(xí)技術(shù)以增強(qiáng)隱藏狀態(tài)表示。
4.4 實(shí)驗(yàn)結(jié)果(RQ1)
模型性能是衡量模型可靠性的重要指標(biāo),為了評(píng)估MRTKT是否具有優(yōu)越的性能,本文從精度、可擴(kuò)展性、過(guò)擬合三方面設(shè)計(jì)實(shí)驗(yàn)進(jìn)行探討。
本實(shí)驗(yàn)在三個(gè)公開(kāi)數(shù)據(jù)集上比較了MRTKT與其他八個(gè)基線模型,得到性能預(yù)測(cè)任務(wù)的RMSE、r2、AUC和ACC結(jié)果如表2所示,通過(guò)觀察和分析可知:a)相比其他基線模型,MRTKT在所有數(shù)據(jù)集和評(píng)價(jià)指標(biāo)上均取得更為優(yōu)秀的結(jié)果,且其AUC的p值均小于0.05,結(jié)果表明考慮知識(shí)相互作用和時(shí)間的MRTKT更貼合學(xué)習(xí)者認(rèn)知過(guò)程,能更好地提高預(yù)測(cè)性能。b)從建模知識(shí)相互作用角度分析,顯式地利用知識(shí)結(jié)構(gòu)和影響傳播的GKT和SKT是對(duì)比模型中表現(xiàn)較好的兩個(gè)模型,結(jié)果表明知識(shí)關(guān)系及其相互影響確實(shí)為估計(jì)學(xué)習(xí)者知識(shí)狀態(tài)提供了豐富的有效信息。此外,構(gòu)建三種關(guān)系的MRTKT比僅構(gòu)建先決關(guān)系的GKT、僅構(gòu)建有向關(guān)系及無(wú)向關(guān)系的SKT表現(xiàn)更好,說(shuō)明引入知識(shí)間上位學(xué)習(xí)、下位學(xué)習(xí)以及并列組合學(xué)習(xí)三種關(guān)系確實(shí)豐富了知識(shí)結(jié)構(gòu)的拓?fù)湫畔?,并能夠有效改善模型性能。c)從建模時(shí)間的角度分析,考慮遺忘特征的DKT+Forgetting和MRTKT比原來(lái)的DKT和GKT表現(xiàn)更好,驗(yàn)證了引入時(shí)間相關(guān)因素對(duì)合理建模知識(shí)狀態(tài)演化的有效性。d)從綜合考慮兩個(gè)角度分析,相比DKT+Forgetting和HawkesKT只考慮遺忘特征、GKT和SKT只考慮知識(shí)間影響傳播而忽略遺忘特征,MRTKT通過(guò)利用GGNN實(shí)現(xiàn)知識(shí)間多種關(guān)系的影響傳播和融合時(shí)間信息的門控機(jī)制突出了MRTKT的性能優(yōu)勢(shì)。最后,觀察到所有模型對(duì)ASSIST2017數(shù)據(jù)集預(yù)測(cè)的AUC值是所有數(shù)據(jù)集中最低的,原因是該數(shù)據(jù)集包含的學(xué)習(xí)者行為差異較大,對(duì)知識(shí)追蹤任務(wù)提出更高要求,增加任務(wù)難度和復(fù)雜性。
此外,為了評(píng)估MRTKT是否具有可擴(kuò)展性,在三個(gè)數(shù)據(jù)集上進(jìn)行實(shí)驗(yàn),對(duì)每個(gè)數(shù)據(jù)集設(shè)置了五種劃分比例(50%、60%、70%、80%、90%)以比較不同比例的模型預(yù)測(cè)性能,得到圖4所示結(jié)果,其中x軸表示數(shù)據(jù)集劃分比例,y軸表示對(duì)應(yīng)的評(píng)價(jià)指標(biāo)值。觀察圖4可知,隨著訓(xùn)練數(shù)據(jù)比例的增加,AUC、ACC以及皮爾森相關(guān)系數(shù)(r2)的值逐漸升高,均方根誤差(RMSE)的值逐漸降低,實(shí)驗(yàn)結(jié)果得到改善,說(shuō)明MRTKT在不同數(shù)據(jù)集的特征分布上均具有良好的可擴(kuò)展性。
最后,為了探究MRTKT是否存在過(guò)擬合問(wèn)題,實(shí)驗(yàn)選擇表現(xiàn)最好的對(duì)比模型SKT作為對(duì)照,圖5顯示了模型在三個(gè)數(shù)據(jù)集上訓(xùn)練集和測(cè)試集的損失值變化趨勢(shì),其中x軸表示迭代次數(shù),y軸表示損失值,觀察可得如下兩個(gè)結(jié)果。a)雖然SKT的訓(xùn)練損失值與MRTKT基本重合,但測(cè)試損失值間仍有差距,尤其在ASSIST2017數(shù)據(jù)集上表現(xiàn)明顯(SKT訓(xùn)練損失值與測(cè)試損失值之間的距離為0.013 9,MRTKT為0.006 2),可知MRTKT能更好地避免過(guò)擬合問(wèn)題。b)MRTKT的曲線平滑下降,沒(méi)有明顯波動(dòng)??傮w而言,MRTKT的損失值平穩(wěn)下降,在第100步時(shí)達(dá)到穩(wěn)定的收斂值,能夠有效緩解過(guò)擬合問(wèn)題,具有更好的泛化能力和更強(qiáng)的魯棒性。
4.5 消融實(shí)驗(yàn)(RQ2)
為了評(píng)估MRTKT中知識(shí)間影響傳播和遺忘特征對(duì)性能的影響,設(shè)置兩種模型變體,每種變體分別只考慮完整模型中的知識(shí)相互作用或時(shí)間因素。具體地說(shuō),MRTKT w/o time表示只考慮知識(shí)間多種關(guān)系的影響傳播,目的是評(píng)估時(shí)間因素對(duì)MRTKT性能的影響;MRTKT w/o relation表示只考慮學(xué)習(xí)遺忘特征,目的是評(píng)估考慮知識(shí)相互作用對(duì)MRTKT性能的影響。其中,MRTKT w/o time的門控機(jī)制輸入向量不包含重復(fù)時(shí)間間隔Δrt、序列時(shí)間間隔Δst和過(guò)去重復(fù)次數(shù)Δct三個(gè)時(shí)間信息,對(duì)學(xué)習(xí)遺忘的模擬只依賴簡(jiǎn)單的類GRU門控機(jī)制;MRTKT w/o relation不建模知識(shí)結(jié)構(gòu)以及知識(shí)間多種關(guān)系的影響傳播,假設(shè)知識(shí)間彼此獨(dú)立互不影響。
實(shí)驗(yàn)結(jié)果記錄于表3,分析可得如下三個(gè)觀察結(jié)果。a)通過(guò)比較MRTKT和MRTKT w/o relation可得知識(shí)相互作用的影響,在ASSIST2009、ASSIST2017和Algebra2005三個(gè)數(shù)據(jù)集中,AUC分別提高了0.34%、1.39%和0.5%,說(shuō)明盡管時(shí)間信息能影響學(xué)習(xí)者認(rèn)知過(guò)程,但知識(shí)彼此獨(dú)立假設(shè)違背了知識(shí)相互影響的常識(shí),忽略知識(shí)相互作用會(huì)導(dǎo)致預(yù)測(cè)結(jié)果的不準(zhǔn)確。b)通過(guò)比較MRTKT和MRTKT w/o time可得時(shí)間因素的影響,在ASSIST2009、ASSIST2017和Algebra2005三個(gè)數(shù)據(jù)集中,AUC分別提高了0.39%、1.83%和0.72%,說(shuō)明學(xué)習(xí)遺忘現(xiàn)象是刻畫(huà)知識(shí)狀態(tài)演化的重要因素,使用簡(jiǎn)單的門控機(jī)制限制了模型捕捉更精確的學(xué)習(xí)過(guò)程和遺忘過(guò)程的能力,可以通過(guò)加入時(shí)間信息來(lái)改善。c)MRTKT在三個(gè)模型中表現(xiàn)最好,說(shuō)明在建立知識(shí)追蹤模型時(shí),考慮知識(shí)間相互作用和時(shí)間至關(guān)重要。
4.6 模型可解釋性(RQ3)
為了探究知識(shí)狀態(tài)在知識(shí)相互作用和時(shí)間下演化的合理性,實(shí)驗(yàn)隨機(jī)選擇ASSIST2009數(shù)據(jù)集中的一條交互序列,使用熱圖可視化學(xué)習(xí)者知識(shí)狀態(tài)演化過(guò)程。圖6左圖的x軸顯示由知識(shí)編號(hào)及相應(yīng)回答所組成的元組,y軸顯示交互序列中涉及的知識(shí)編號(hào),圖6右圖表示交互序列中涉及的知識(shí)點(diǎn)的知識(shí)結(jié)構(gòu)。
由圖6左圖可得MRTKT對(duì)知識(shí)狀態(tài)的建模合理且一致。a)熱圖顯示的演化過(guò)程過(guò)渡相對(duì)平穩(wěn),沒(méi)有劇烈振蕩,表明學(xué)生知識(shí)狀態(tài)的演化符合常識(shí),是連續(xù)且合理的。b)從知識(shí)相互作用的角度分析,知識(shí)狀態(tài)的變化并不孤立,而是相互關(guān)聯(lián)的,表明MRTKT能夠很好地捕捉知識(shí)間相互影響。例如,區(qū)域Ⅰ中知識(shí)48和24、31間存在并列組合關(guān)系,當(dāng)48的熟練度得到提升,24和31的熟練度也得到不同程度的提升。類似的變化過(guò)程又如區(qū)域Ⅱ,知識(shí)44和1存在上下位學(xué)習(xí)關(guān)系,當(dāng)44的熟練度由于答對(duì)而提高時(shí),1的熟練度也相應(yīng)提高。c)從時(shí)間角度分析,知識(shí)狀態(tài)的掌握程度并非一成不變的,而是隨練習(xí)次數(shù)及時(shí)間變化的,表明MRTKT能夠很好地捕捉學(xué)習(xí)遺忘影響。例如,區(qū)域Ⅲ和Ⅳ中知識(shí)89和13與其他知識(shí)間不存在關(guān)聯(lián)關(guān)系,當(dāng)學(xué)習(xí)者練習(xí)該知識(shí)時(shí),知識(shí)狀態(tài)隨學(xué)習(xí)者作答反映變化,當(dāng)學(xué)習(xí)者不練習(xí)該知識(shí)時(shí),知識(shí)狀態(tài)由于遺忘作用導(dǎo)致熟練度遞減。因此,MRTKT可以有效建模知識(shí)狀態(tài)演化過(guò)程,能夠?yàn)橹R(shí)追蹤提供可解釋的預(yù)測(cè)結(jié)果。
有意義的知識(shí)嵌入有能力發(fā)現(xiàn)知識(shí)之間的關(guān)系,可以將相關(guān)或相似知識(shí)聚類到一組,幫助教育者改進(jìn)教學(xué)設(shè)計(jì)、優(yōu)化課程安排。實(shí)驗(yàn)選擇ASSIST2017數(shù)據(jù)集發(fā)現(xiàn)相似知識(shí),并聚類到不同集合中,如圖7所示。首先利用t-SNE方法將知識(shí)嵌入向量維度降維至2,其次使用K-means++方法將知識(shí)聚類為10組,最后可視化聚類結(jié)果。
由圖7可知,同一聚類中的知識(shí)基于某些特征彼此相似,聚類結(jié)果顯示出良好的意義。例如,“11:application: order of operations”“27:equation-solving”“62:order-of-operations”和“84:simple-calculation”被分到同一組,其皆與等式計(jì)算有關(guān)。類似的聚類又如,“25:division”“28:equivalent-fractions-decimals-percents”“67:percents”和“71:probability”被聚類為一組,其皆與概率百分比有關(guān)。盡管聚類結(jié)果并非全部準(zhǔn)確無(wú)誤,但可以證明MRTKT在發(fā)現(xiàn)相似知識(shí)方面是有效的,教育者可以參考聚類結(jié)果安排相近知識(shí)的教學(xué)活動(dòng)以促進(jìn)學(xué)習(xí)者理解掌握,將模型自動(dòng)學(xué)習(xí)的知識(shí)表示作為計(jì)算機(jī)輔助教育教學(xué)的有力補(bǔ)充。
5 結(jié)束語(yǔ)
本文提出了一種新的解決知識(shí)追蹤問(wèn)題的方法,該方法綜合考慮知識(shí)相互作用和時(shí)間對(duì)學(xué)習(xí)者知識(shí)狀態(tài)的影響,兼具高性能和可解釋性。MRTKT在傳統(tǒng)關(guān)注知識(shí)結(jié)構(gòu)的知識(shí)追蹤模型基礎(chǔ)上,引入三種知識(shí)間相互作用和學(xué)習(xí)遺忘作用作為補(bǔ)充,同時(shí)從兩個(gè)角度分析學(xué)習(xí)過(guò)程。知識(shí)相互作用方面,首先根據(jù)數(shù)據(jù)集信息計(jì)算得到概念間三種關(guān)系,其次使用GGNN模擬知識(shí)點(diǎn)間三種相互作用的影響傳播行為;時(shí)間方面,構(gòu)建融入三種時(shí)間信息的類GRU門模擬學(xué)習(xí)和遺忘對(duì)知識(shí)掌握的影響。本文在三個(gè)數(shù)據(jù)集上進(jìn)行多項(xiàng)實(shí)驗(yàn),結(jié)果表明MRTKT可以追蹤到更符合真實(shí)情況的學(xué)習(xí)者知識(shí)狀態(tài)變化,在追蹤預(yù)測(cè)任務(wù)上有更好的表現(xiàn)。
未來(lái)研究筆者將進(jìn)一步探索影響學(xué)習(xí)者認(rèn)知演化的因素,以期提出更貼合學(xué)習(xí)者認(rèn)知過(guò)程的方法,提升模型性能。宏觀層面,精準(zhǔn)教學(xué)可以高效地促進(jìn)學(xué)習(xí)者個(gè)性化成長(zhǎng),是當(dāng)前教育界的理想訴求,知識(shí)追蹤作為實(shí)施精準(zhǔn)教學(xué)的重要工具,對(duì)學(xué)習(xí)者知識(shí)狀態(tài)的細(xì)粒度診斷能夠?yàn)榫珳?zhǔn)教學(xué)的實(shí)施和學(xué)習(xí)者的個(gè)性化培養(yǎng)提供更為全面的數(shù)據(jù)支撐,因此本文工作具有長(zhǎng)遠(yuǎn)意義。
參考文獻(xiàn):
[1]Abdelrahman G, Wang Qing, Nunes B. Knowledge tracing: a survey[J]. ACM Computing Surveys, 2023, 55(11): 1-37.
[2]Ausubel D P. The acquisition and retention of knowledge: a cognitive view[M]. Springer Science amp; Business Media, 2012.
[3]Averell L, Heathcote A. The form of the forgetting curve and the fate of memories[J]. Journal of mathematical psychology, 2011, 55(1): 25-35.
[4]Anzanello M J, Fogliatto F S. Learning curve models and applications: literature review and research directions[J]. International Journal of Industrial Ergonomics, 2011, 41(5): 573-583.
[5]Battaglia P W, Hamrick J B, Bapst V, et al. Relational inductive bia-ses, deep learning, and graph networks[EB/OL]. (2018-06-04). https://arxiv.org/abs/806.01261.
[6]Gan Wenbin, Sun Yuan, Sun Yi. Knowledge structure enhanced graph representation learning model for attentive knowledge tracing[J]. International Journal of Intelligent Systems, 2022, 37(3): 2012-2045.
[7]Xu Jia, Huang Xinyue, Xiao Teng, et al. Improving knowledge tra-cing via a heterogeneous information network enhanced by student interactions[J]. Expert Systems with Applications, 2023, 232: 120853.
[8]Nakagawa H, Iwasawa Y, Matsuo Y. Graph-based knowledge tra-cing: modeling student proficiency using graph neural network[C]//Proc of IEEE/WIC/ACM International Conference on Web Intelligence. 2019: 156-163.
[9]Duan Zhiyi, Dong Xiaoxiao, Gu Hengnian, et al. Towards more accurate and interpretable model: fusing multiple knowledge relations into deep knowledge tracing[J]. Expert Systems with Applications, 2024, 243: 122573.
[10]Tong Shiwei, Liu Qi, Huang Wei, et al. Structure-based knowledge tracing: an influence propagation view[C]//Proc of IEEE International Conference on Data Mining. Piscataway,NJ:IEEE Press, 2020: 541-550.
[11]Pelánek R. Modeling students’ memory for application in adaptive educational systems[M]// International Educational Data Mining Society. 2015.
[12]Wang Chenyang, Ma Weizhi, Zhang Min, et al. Temporal cross-effects in knowledge tracing[C]//Proc of the 14th ACM International Conference on Web Search and Data Mining. 2021: 517-525.
[13]Pandey S, Srivastava J. RKT: relation-aware self-attention for know-ledge tracing[C]//Proc of the 29th ACM International Conference on Information amp; Knowledge Management. New York:ACM Press, 2020: 1205-1214.
[14]Shen Shuanghong, Liu Qi, Chen Enhong, et al. Learning process-consistent knowledge tracing[C]//Proc of the 27th ACM SIGKDD Conference on Knowledge Discovery amp; Data Mining. New York:ACM Press, 2021: 1452-1460.
[15]Zhao Weizhong, Xia Jun, Jiang Xingpeng, et al. A novel framework for deep knowledge tracing via gating-controlled forgetting and learning mechanisms[J]. Information Processing amp; Management, 2023, 60(1): 103114.
[16]Ruiz L, Gama F, Ribeiro A. Gated graph recurrent neural networks[J]. IEEE Trans on Signal Processing, 2020, 68: 6303-6318.
[17]Corbett A T, Anderson J R. Knowledge tracing: modeling the acquisition of procedural knowledge[J]. User Modeling and User-Adapted Interaction, 1994, 4: 253-278.
[18]Piech C, Bassen J, Huang J, et al. Deep knowledge tracing[C]//Proc of Advances in Neural Information Processing Systems. 2015.
[19]Zhang Jiani, Shi Xingjian, King I, et al. Dynamic key-value memory networks for knowledge tracing[C]//Proc of the 26th International Conference on World Wide Web. 2017: 765-774.
[20]Chen Penghe, Lu Yu, Zheng V W, et al. Prerequisite-driven deep knowledge tracing[C]//Proc of IEEE International Conference on Data Mining. Piscataway,NJ:IEEE Press, 2018: 39-48.
[21]Song Xiangyu, Li Jianxin, Lei Qi, et al. Bi-CLKT: bi-graph contrastive learning based knowledge tracing[J]. Knowledge-Based Systems, 2022, 241: 108274.
[22]Zhang Haotian, Bu Chenyang, Liu Fei, et al. APGKT: exploiting associative path on skills graph for knowledge tracing[C]//Proc of Pacific Rim International Conference on Artificial Intelligence. Cham: Springer, 2022: 353-365.
[23]Abdelrahman G, Wang Qing. Deep graph memory networks for forgetting-robust knowledge tracing[J]. IEEE Trans on Knowledge and Data Engineering, 2022, 35(8): 7844-7855.
[24]He Liangliang, Tang Jintao, Li Xiao, et al. Multi-type factors representation learning for deep learning-based knowledge tracing[J]. World Wide Web, 2022, 25(3): 1343-1372.
[25]Su Hang, Liu Xin, Yang Shanghui, et al. Deep knowledge tracing with learning curves[J]. Frontiers in Psychology, 2023, 14: 1150329.
[26]Huang Zhenya, Liu Qi, Chen Yuying, et al. Learning or forgetting? A dynamic approach for tracking the knowledge proficiency of students[J]. ACM Trans on Information Systems, 2020, 38(2): 1-33.
[27]Gan Wenbin, Sun Yuan, Peng Xian, et al. Modeling learner’s dynamic knowledge construction procedure and cognitive item difficulty for knowledge tracing[J]. Applied Intelligence, 2020, 50: 3894-3912.
[28]Nagatani K, Zhang Qian, Sato M, et al. Augmenting knowledge tra-cing by considering forgetting behavior[C]//Proc of World Wide Web Conference. 2019: 3101-3107.
[29]Huang Tao, Yang Huali, Li Zhi, et al. A dynamic knowledge diagnosis approach integrating cognitive features[J]. IEEE Access, 2021, 9: 116814-116829.
[30]Gilmer J, Schoenholz S S, Riley P F, et al. Neural message passing for quantum chemistry[C]//Proc of International Conference on Machine Learning. [S.l.]:PMLR, 2017: 1263-1272.
[31]Wu Shu, Tang Yuyuan, Zhu Yanqiao, et al. Session-based recommendation with graph neural networks[C]//Proc of AAAI Conference on Artificial Intelligence. 2019: 346-353.
[32]Wu Zhengyang, Huang Li, Huang Qionghao, et al. SGKT: session graph-based knowledge tracing for student performance prediction[J]. Expert Systems with Applications, 2022, 206: 117681.
[33]Shen Shuanghong, Chen Enhong, Liu Qi, et al. Monitoring student progress for learning process-consistent knowledge tracing[J]. IEEE Trans on Knowledge and Data Engineering, 2022, 35(8): 8213-8227.
[34]Wang Wentao, Ma Huifang, Zhao Yan, et al. SEEP: Semantic-enhanced question embeddings pre-training for improving knowledge tracing[J]. Information Sciences, 2022, 614: 153-169.
[35]張鵬, 文磊. F-TCKT:融合遺忘因素的深度時(shí)序卷積知識(shí)追蹤模型[J]. 計(jì)算機(jī)應(yīng)用研究, 2023, 40(4): 1070-1074. (Zhang Peng, Wen Lei. F-TCKT: deep temporal convolutional knowledge tracking model with forgetting factors [J]. Application Research of Computers, 2023, 40(4): 1070-1074.)
[36]張維,李志新,龔中偉,等. 練習(xí)嵌入和學(xué)習(xí)遺忘特征增強(qiáng)的知識(shí)追蹤模型[J].計(jì)算機(jī)應(yīng)用研究, 2024, 41(11): 3265-3271. (Zhang Wei, Li Zhixin, Gong Zhongwei, et al. Exercise embeddings and learning-forgetting features boosted knowledge tracing [J]. Application Research of Computers, 2024, 41(11): 3265-3271.)
[37]DeLong E R, DeLong D M, Clarke-Pearson D L. Comparing the areas under two or more correlated receiver operating characteristic curves: a nonparametric approach[J]. Biometrics, 1988,8: 837-845.
[38]Pandey S, Karypis G. A self-attentive model for knowledge tracing[EB/OL]. (2019-07-16). https://arxiv.org/abs/1907.06837.
[39]Lee W, Chun J, Lee Y, et al. Contrastive learning for knowledge tracing[C]//Proc of ACM Web Conference. New York:ACM Press, 2022: 2330-2338.