認知診斷模型研究綜述

2024-07-24 00:00:00過珺

電腦知識與技術 2024年17期

摘要：信息技術的發展，尤其是信息技術與教育的結合，使得教育領域一直提倡的因材施教成為可能。認知診斷通過分析學習者的學習數據，進而挖掘學習者的認知狀態，為教師實施針對性教學提供支持。認知診斷的常規模型有傳統模型、模糊診斷模型、基于神經網絡模型和基于深度學習模型。文章首先對當前各類模型的常規算法及其優化算法進行了詳細的闡述，然后總結了各類模型的優缺點，最后對未來可能的研究方向進行了預測。

關鍵詞：認知診斷；IRT；DINA；Fuzzy CDF；神經網絡認知診斷；深度學習

中圖分類號：TP301 文獻標識碼：A

文章編號：1009-3044（2024）17-0001-05 開放科學（資源服務）標識碼（OSID）：

0 引言

兩千多年前，孔子提出了“有教無類，因材施教”的教育理念，而我們也一直在嘗試如何能有效做到因材施教。在日常教學中，教師教學任務繁重，班級學生人數眾多，教師利用常規的信息化手段已無法高效、準確地找出每個學習者的知識盲點，無法給予學習者精準化、個性化的學習指導。

隨著信息技術的深入發展，數字技術已經成為引領未來的新支柱，數字與教育的結合，為目前教育中出現的困局，提出了新的解題思路。認知診斷通過分析學習者答題結果，挖掘學習者對題目所涉及的知識點的掌握情況，為教師在教學活動中實現針對性的輔導提供依據。

1 認知診斷概述

認知診斷是指對學習者認知過程、加工技能或知識結構進行的診斷和評估。可通過采集、分析學習者的測試數據，借助概率統計模型或機器學習算法，獲得學習者在問題解決過程中所用到的知識技能，及其對知識技能的掌握狀態[1]。隨著人工智能的發展，認知診斷模型不斷豐富，它的診斷精確度不斷提升，應用場景不斷擴大。認知診斷最開始僅限于線上學習的使用，但在“智學網”等一批線上學習平臺在中小學進行推廣使用后，平臺的線上、線下數據有效結合、不斷擴充，給線下教學提供了很好的數據支撐和教學依據；同時認知診斷的應用領域也從最開始的僅用于學習者的答題預測，到現在應用于對學習者認知狀態的評估、對學習者學習心理因素的分析等。

目前認知診斷模型主要分為傳統模型、模糊認知診斷模型和基于神經網絡的認知診斷模型等。

2 傳統的認知診斷理論

2.1 項目反應理論（Item Response Theory， IRT）

IRT是常用的單維連續型認知診斷模型，模型認為學習者對某一知識點的掌握程度可以用一種非線性函數來擬合，學習者對知識點的掌握程度是自身學習因素、試題區分度、試題難度等多因素共同影響的結果；模型中的單維，表示試題測量的是學習者的一種潛在特質；連續是指學習者能力值是連續型數據；該模型假設學習者對試題的作答結果服從獨立同分布[2]。

當模型考慮試題的區分度、試題難度、試題的猜測度時，模型即變為三參數模型，如公式（1）所示。公式1表示學習者i 正確回答試題j 的概率。該理論根據參數的不同及其應用場景的變化，還有雙參數模型和單參數模型。雙參數模型為不考慮猜測系數時的函數狀態，如公式（2）所示；單參數模型為不考慮猜測系數和試題區分度時的函數狀態，如公式（3）所示。為了更好地對模型解釋，模型所用參數的數學符號和含義如表1所示。

IRT實現了對學習者單個能力特質的診斷，但無法實現對學習者多個能力特質的測量。因此有學者將IRT理論進行多維度改進，即將學習者的能力值以向量的形式呈現。如公式（4）所示：

公式中θ'i =（θi1，θi2，θi3 ...θik ）′表示學習者i 的k 維能力向量；α'j =（αj1，αj2，αj3 ... αjk ）′表示試題j 的k 維區分度向量。

胡心穎[3]認為多維的IRT理論依然無法將學習者的能力與具體的知識點一一對應，因此她將Q矩陣引入模型，使得改進后的IRT模型實現了對學習者具體知識點掌握情況的判斷，如公式（5）所示。公式中qjk表示試題j 是否考察了知識點k；如果qjk=1，表示試題j考察了知識點k；qjk=0，表示沒有考查知識點k；d 是k維的截距參數。

2.2 確定性輸入噪音與門模型（Deterministic Inputs Noisy And Gate，DINA）

DINA模型是常用的多維離散型認知診斷模型，模型假設學習者只有掌握了試題考查的所有知識點才能答對該試題。為了模擬真實場景中答題者可能因為僥幸，在不掌握相關知識點的前提下，答對題；或因為失誤而答錯了會做的題，模型引入了猜測參數和失誤參數。模型的項目特征函數如公式（6）、公式（7）所示。Pj （θi ）表示當學習者的知識點掌握情況為 θi 的前提下，學習者答對試題 j 的概率。為方便對模型進行闡述，模型所用參數的數學符號和含義如表2所示。

DINA模型通過引入Q矩陣，很好地詮釋了試題和知識點之間的關系，使模型不僅實現了對學習者學習能力的多維測量，同時也讓模型具有更好的解釋性。但是DINA模型對于大規模在線數據的處理存在收斂速度較慢的問題，雖然有學者試圖通過增加超參來提升收斂速度，但這影響了模型的可解釋性。為此王超[4]嘗試了三種方案以提升數據的收斂速度。一是增量DINA模型，它是將學習者數據進行分組，每次只對其中一組學習者的數據進行遍歷；二是最大熵DINA模型，它嘗試將數據分為對參數貢獻大的變化集Xc 和對參數貢獻小的懶惰集Xl，在完整遍歷時對數據不斷篩選，確定變化集和懶惰集。在部分遍歷時，只對變化集進行遍歷；三是增量最大熵DINA模型，它在數據遍歷時不僅考慮變化集和懶惰集，而且在變化集中還對學習者進行分組。實驗證明三種方法都有效提升了數據的處理速度，但由于方法三集方法一和方法二的優勢，因此方法三對算法的穩定性和快速性貢獻度最大。

除了對算法的速度有改進之外，也有學者從實際應用角度對DINA模型提出了改進。湯成[5]將學習者在學習中的遺忘因素和答題次數對正確答題的影響引入到DINA模型中，對DINA模型的正確回答率進行了完善。Tj 是時間函數，用于模擬學習者學習過程中的遺忘效果和做題次數對于正確回答試題的鞏固效果。α，β 是擬合艾賓浩斯遺忘曲線的常量參數；γ 為學習者回答試題j 的情況，當學習者正確作答時γ 為1，否則為0。Count（γ）為學習者回答試題j 的次數。算法如公式（8）、公式（9）所示。

3 模糊認知診斷理論（Fuzzy Cognitive Diag?nostic Framework， Fuzzy CDF）

傳統的認知診斷模型對客觀題的預測有較好的效果，但在處理主觀題時效果不理想，因此又產生了基于模糊集理論的模糊認知診斷模型；并且各位學者基于教學實際場景又在模糊認知診斷模型的基礎上進行了各種完善。

模型首先考慮了學習者自身的潛在特質，認為潛在特質的存在會影響學習者對知識點的掌握情況；其次，模型考慮到學習者對技能已形成的認知狀態；第三，模型結合專家標注的Q矩陣將主觀題和客觀題分別建模。客觀題利用聯結型知識點假設，使用模糊交建模，而主觀題使用補償型知識點假設，采用模糊并建模。因為客觀題如果要正確，需要學習者完全掌握試題中涉及的所有知識點，因此采用聯結型假設，而主觀題對學習者來說只要掌握部分知識點即可得分，因此采用補償型假設；第四，模型還考慮了失誤參數和猜測參數對分值的影響。模型所用參數的數學符號和含義如表3所示。

模型假設每個知識點k 都有一個模糊集（I，μk）與之對應（I為學習者集合，μk 為知識點k 對應的隸屬度函數），集合I中的每個學習者i 在知識點k 上的認知水平αik 就是學習者i 在模糊集（I，μk）中的隸屬度，如公式（10）所示。

學習者i 在試題j 上的掌握程度為ηij，其中qjk = 1表示試題j 中考察了知識點k；qjk = 0表示試題j 沒有考查知識點k；當表示學習者i 對客觀題j 的掌握程度如公式（11）所示；當表示學習者i 對主觀題j 的掌握程度如公式（12）所示。

學習者i 在試題j 上的得分，如果考慮到猜測參數（gj）和失誤參數（sj）時，對于客觀題得分預測如公式（13）所示，其中客觀題的得分為伯努利分布；主觀題得分預測如公式（14）、公式（15）所示，主觀題采用高斯分布，σ2為主觀題得分的方差。

P （Xij = 1|ηij，gj，sj ）=（1-sj）ηij+gj （1 - ηij ）（13）

P （Xij|ηij，gj，sj ）=N（Xij|[（1-sj）ηij+gj （1 - ηij ）]，σ2）（14）

Xij=Σk = 1Kαik qjk （15）

李憂喜[6]認為主觀題中知識點的重要性影響著知識點在試題中的出現次數，知識點高頻次的出現會提升學習者答題的正確率，因此他在模型中以知識點出現的比例來模擬知識點的重要性。將學習者對知識點的掌握程度αik 修改為αik = 1/1 + exp [-1.7 ∝ ik （θi - βik × nm） ] ，其中n 為知識點在試題集中出現的次數，m 為試題集的總數；同時基于主觀題是補償型知識點假設，隨著知識點掌握的數量增多，正確回答試題的概率會增加，因此他又將學習者i 對主觀題j 的掌握程度改為了ηij= αik/Σk = 1Kqjk，取值范圍是0到1的連續值，qjk=1，1≤ k ≤ K。

4 基于深度學習的認知診斷理論

4.1 神經網絡認知診斷模型

傳統認知模型是利用學習者的歷史答題數據來訓練參數，用簡單線性模型來模擬學習者與學習資源的交互。但是學習者在與學習資料的交互中，其認知狀態是動態提升的，因此隨著深度神經網絡的不斷發展，以深度學習為基礎的神經網絡認知診斷框架（Neu?ral Cognitive Diagnose， Neural CD）[7]誕生了。它不僅可以解決數據稀疏問題，而且對不規則數據、稀疏回答記錄也具有較好的預測能力[8]。模型伴隨式地挖掘學習者的各類參數，建立學習者、知識、學習資源之間的聯系，達到對學習者進行成績預測的目的。

模型用一個連續變量hs 表示學生對相關知識點的熟練掌握程度，hs=sigmoid （xs × A）。其中xs 為學生答題記錄的one-hot向量，A 為學生能力矩陣的待訓練參數，A ∈ RN × K；N 為學生數，K 為知識點數。

Qe 是試題因素，表示試題與知識點的關聯向量，Qe=xe×Q，其中xe為試題的one-hot向量。

試題的難度系數：hdiff=sigmoid（xe × B） B ∈ RM × KM為練習數，hdiff 表示每道試題所涉及知識點的難度系數矩陣。

試題的區分度系數：hdisc = sigmoid （xe × D）D ∈ RM × 1

模型用三層全連接網絡來表示學生與題目間的交互，y = Qe × （hs - hdiff）×hdisc，y 為預測學生答對試題的概率。

4.2 基于深度項目反應理論的靜態認知診斷方法（Deep RIT，DRIT）

程松[9]基于深度學習和項目反應理論（IRT）提出了基于深度項目反應理論的靜態認知診斷方法（DRIT）。模型通過給學習者初始化知識點掌握向量，利用深度神經網絡來挖掘學習者的認知狀態和試題的區分度；采用注意力機制和循環神經網絡挖掘試題難度；最后利用模型函數預測學習者得分，模型所用參數的數學符號和含義如表4所示。

對于試題Qj，用word2vec模型將試題中所包含的數量為U 的單詞轉化為同一維度的向量，即QTj= {w1，w2...w } u ，假設每個詞都有d0 維向量；對試題中的每個知識點v 用一個p 維的onehot 向量來表示即Kv ∈ {0，1}p，因此QKj={K1，K2...K } v ;接著利用kv = KvWk將kv變成一個全連接的d1維向量。

學習者認知狀態及試題區分度：學習者認知狀態和試題區分度都是通過深度神經網絡自行習得。認知狀態是通過給每個學習者初始化一個知識水平向量α；然后用Kq 乘以α，得到一個向量Φ，使其作為深度神經網絡的輸入，θ = DNNθ（Φ），即可求出學習者的能力參數θ；試題區分度是對試題所考察的知識點進行累加求和，得到一個結果向量A，然后以A 作為深度神經網絡DNNa 的輸入，即A=Σkv ∈ Kvkv，其后系統將自動學習試題的區分度。由于IRT模型對試題區分度的要求是在[-4，4]之間，因此在系統得出A 值之后，再通過數學縮放，將A 值調整到規定范圍之內。

試題的難度系數：試題的難度系數由試題文本信息的難度和試題所考查的知識點共同決定。試題文本信息具有時間序列性，為此DIRT模型使用循環神經網絡來學習試題文本難度數據；試題所考察的知識點難度可通過試題文本信息與知識點之間的相似度衡量，因此系統使用基于注意力機制的循環神經網絡來計算試題的難度。

首先，根據試題文本信息向量QTj={w1，w2...w } u 與試題里所包含的每個知識點Kq = {k1，k2...k } v ，求出它們的相似性以表示試題的難度，即ξj = wTtkv。

然后，再利用試題文本信息向量QTj={w1，w2...w } u與試題里所包含的知識點向量Kq = {k1，k2...k } v ，根據自注意機制的注意力值計分函數xt =Σkv ∈ Kqsoft max（ ξj/根號下d0 ） kv + wt（xt 是指每個時刻的輸入）得到序列x =（x1，x2...xN）。

最后將（x1，x2...xN）作為輸入導入到循環神經網絡中，循環神經網絡輸出具有難度特征的隱向量h=（h1，h2...hN）。再將h 進行池化和縮放，即b = 8×（sigmoid（averagepooling（hN）） -0.5）使難度系數b 被控制在[-4，4]中。

模型求解：根據以上算法，在求出學生的認知狀態、試題區分度、試題的難度系數之后，將其帶入項目反應理論中，求得學生在某題上的得分情況。

4.3 基于注意力的概念提升認知診斷模型

苑冬雪[10]等針對目前大部分認知診斷模型還不能有效挖掘概念之間隱含關系對正確答題的影響，因此嘗試對學生因素、試題因素、概念因素分別建模，設計出基于注意力機制的概念提升認知診斷模型。模型分為嵌入層、概念提升層、診斷層。

嵌入層將學習者、試題、概念的one-hot向量轉變為d 維的特征向量，各參數計算公式及含義如表5所示；再針對每個知識點會對應不同難度的試題，設計了試題的區分度函數hdisc ∈ [ 0，1]，hdisc = sigmoid （xq ×D） D ∈ RM × 1 D 為可訓練矩陣。

概念提升層是通過自注意力機制，自動學習各概念間的隱含關系，即各概念之間的權重。然后再根據各概念的權重，將它們整合，形成一個增強型概念模型。首先k 個概念經過線性變化得到三個矩陣：

Q =C× Wq、K =C × Wk、V =C × Wv，其中 Wq、Wk、Wv均為可通過學習而自動更新的權重矩陣。然后通過A = soft max（（Q × KT ） × 1d ）獲得各概念間的隱含關系。最后通過C' = sigmoid （AV ）獲得整合后的增強型概念模型。

診斷層通過全連接神經網絡，得到學習者對概念的掌握程度hs 和試題的難度向量hdiff；同時利用試題因素和概念因素的交互來代替Q矩陣，使Q矩陣可以自動變化，以此來降低傳統認知診斷模型中人工標注Q矩陣的誤差。?代表對應元素相乘。

hs = sigmoid （Wsc × （su?C′） + bsc ） Wsc ∈ R2d × 1

hdiff = sigmoid （Wec × （eq?C′） + bec Wec ∈ R2d × 1

Q′q = soft max（eq × C′T ） x = Q′q⊙（hs - hdiff）×hdisc

最后通過sigmoid函數實現對學習者在試題上的答題預測：

f1 = sigmoid （W1 × xT + b1 ）

f2 = sigmoid （W2 × f1 + b2 ）

y = sigmoid （W3 × f2 + b3 ）

5 結論

傳統認知診斷解決了對學習者進行能力值的預測；模糊認知診斷解決了對學習者主、客觀題的分別建模；神經網絡則擺脫了人工標記的問題，利用神經網絡的自我學習功能，挖掘試題的難度系數、區分度系數等參數，進而求出學習者答對試題的概率。

早期認知診斷主要是除了對傳統認知診斷的算法進行改進外，更多的是對其進行的應用改進。孫晨輝[11]將學習者對知識點的掌握情況分為知道、運用、綜合難度三個層次，使得DINA更貼合學習場景；齊斌[12] 等以PH-DINA（Polytomous Hierarchical DINA）模型結合協同過濾算法在同時考慮了個體的知識屬性和種群的知識共性的前提下，實現了試題的精準推薦。

近年認知診斷主要是對基于模糊概念、神經網絡的認知診斷模型的應用研究。張雨婷[13]等針對編程課程，提出了基于模糊認知診斷的P-FuzzyCDF（Programming-performance-based fuzzy cognitive diag?nosis framework）的認知模型；王煉紅[14]等考慮到學習者努力因素對知識點掌握的影響程度，提出了在模糊認知診斷的基礎上，基于能力特征與努力特征相融合的特征參數來建模學習者知識水平。另外還構建了知識點弱項特征參數來提升模型預測準確性的認知反應模型（Cognitive and Response Model，C&RM）。張所娟[15]等針對當前各類模型中并未考慮知識點間相互關系的問題，構想出基于多個知識點的權重學習，并結合深度神經網絡構建認知診斷模型，即融合知識交互的認知診斷模型。

目前認知診斷模型的預測準確度比之前更高，各類應用研究也更貼近現實教學場景。但是在知識遷移和試題文本信息表示上還有一些工作可做。比如：很多課程之間是相互聯系的，知識也是可以遷移的。但我們目前的研究更多的是針對一門課程進行的診斷。未來可以挖掘不同課程之間的知識遷移現象，以實現跨課程的認知狀態分析；目前對于試題文本信息的研究，多從文本的角度去進行算法設計，并沒有考慮到音視頻、圖片等題面信息的表示，未來可以更多地對試題信息的多元化表示進行研究，以豐富試題表示類型的研究。

參考文獻：

[1] 李振，周東岱.基于學科知識圖譜的智能化認知診斷評估方法[J].現代教育技術，2022，32（11）：118-126.

[2] 劉淇，陳恩紅，朱天宇，等.面向在線智慧學習的教育數據挖掘技術研究[J].模式識別與人工智能，2018，31（1）：77-90.

[3] 胡心穎.基于認知診斷方法的計算機教育數據挖掘問題研究[D].合肥：中國科學技術大學，2021：54-56.

[4] 王超，劉淇，陳恩紅，等.面向大規模認知診斷的DINA模型快速計算方法研究[J].電子學報，2018，46（5）：1047-1055.

[5] 湯成.基于深度學習與認知診斷的教學資源推薦算法研究[D].廣州：華南理工大學，2020：22-31.

[6] 李憂喜，文益民，易新河，等.一種改進的模糊認知診斷模型[J].數據采集與處理，2017，32（5）：958-969.

[7] 陳恩紅，劉淇，王士進，等.面向智能教育的自適應學習關鍵技術與應用[J].智能系統學報，2021，16（5）：885-898.

[8] 田剛鴻.面向長周期測評的認知診斷方法研究及應用[D].武漢：華中師范大學，2022：16-17.

[9] 程松.基于深度學習的學生認知水平診斷方法與應用研究[D].合肥：中國科學技術大學，2021：18-20.

[10] 苑冬雪，孫權森，傅鵬.基于注意力機制的概念增強認知診斷模型[J].計算機科學，2023，50（11）：241-247.

[11] 孫晨輝.基于知識圖譜的JAVA自適應學習平臺設計與實現[D].武漢：華中師范大學，2020：17-21.

[12] 齊斌，鄒紅霞，王宇，等.基于協同過濾和認知診斷的試題推薦方法[J].計算機科學，2019，46（11）：235-240.

[13] 張雨婷，李征，劉勇，等.基于編程認知診斷模型的學生表現預測[J].計算機系統應用，2023，32（9）：239-247.

[14] 王煉紅，羅志輝，劉暢.面向慕課學習者評估的認知反應模型[J].電子學報，2023，51（1）：18-25.

[15] 張所娟，余曉晗，陳恩紅，等.融合知識交互關系的認知診斷深度模型[J].模式識別與人工智能，2023，36（1）：22-33.

【通聯編輯：王力】

基金項目：2022 校級自然科學重點項目《基于知識圖譜的認知診斷研究》（項目編號：ZRKXZ202203）；2020 年安徽省教育廳高校優秀青年骨干教師國內訪問研修項目（項目編號：gxgnfx2020138）

電腦知識與技術2024年17期

電腦知識與技術的其它文章: 基于混合式教學的計算思維與程序設計基礎課程思政建設實踐探索; 矢量圖形與版式設計示范課程建設的實踐與探索; JSP 程序設計課程思政教學設計與實踐研究; 浮點數的教與學; 基于OBE 理念的Java程序設計課程教學改革實踐探究; 基于對分課堂與博弈論的C 語言課程教學設計研究