一、前言
近年來,隨著教育信息化的發(fā)展,地方高校教學(xué)管理平臺逐步引入數(shù)據(jù)挖掘技術(shù),以提升個性化教學(xué)水平。在線教育平臺(如MOOC、智能導(dǎo)學(xué)系統(tǒng)等)積累了海量學(xué)習(xí)行為數(shù)據(jù),為分析學(xué)生認(rèn)知狀態(tài)、優(yōu)化習(xí)題推薦提供了基礎(chǔ)[-2]。然而,現(xiàn)有平臺在習(xí)題難度動態(tài)評估和個性化推薦精準(zhǔn)度方面仍存在不足,尤其是針對地方高校學(xué)生的適應(yīng)性較差[3]。
教育數(shù)據(jù)挖掘(EDM)技術(shù)通過分析學(xué)生答題記錄,可構(gòu)建認(rèn)知診斷模型(如DINA模型[4),但傳統(tǒng)方法難以動態(tài)反映學(xué)生對知識點的掌握程度。為此,本文結(jié)合地方高校教學(xué)管理平臺的實際需求,提出一種基于自適應(yīng)認(rèn)知診斷(ACDF)的個性化習(xí)題推薦算法,重點解決以下問題。
習(xí)題難度動態(tài)計算:根據(jù)學(xué)生答題數(shù)據(jù)自適應(yīng)調(diào)整題目難度系數(shù)。
學(xué)生知識缺陷量化:通過錯誤率分析精準(zhǔn)診斷知識點掌握水平。
個性化推薦優(yōu)化:結(jié)合難度適配與缺陷預(yù)測生成針對性習(xí)題集。
本文研究結(jié)果可為地方高校教學(xué)管理平臺的智能化升級提供技術(shù)支撐,推動數(shù)據(jù)驅(qū)動型個性化教學(xué)的實踐應(yīng)用。
二、在線教學(xué)的數(shù)據(jù)挖掘
(一)本文研究框架如圖1所示,圍繞三個維度展開。
試題維度:采用自適應(yīng)習(xí)題難度計算方法,動態(tài)優(yōu)化題目難度系數(shù),以更準(zhǔn)確反映學(xué)生實際學(xué)習(xí)水平。
學(xué)生維度:構(gòu)建自適應(yīng)認(rèn)知診斷框架(ACDF),通過量化知識缺陷指數(shù),實現(xiàn)對學(xué)生知識點掌握程度的連續(xù)化評估。
教學(xué)維度:設(shè)計個性化習(xí)題推薦算法,結(jié)合動態(tài)難度調(diào)整與認(rèn)知狀態(tài)分析,生成適配學(xué)生個體需求的習(xí)題集。
(二)習(xí)題分析
習(xí)題是教學(xué)過程中的核心資源,其科學(xué)表征直接影響學(xué)習(xí)效果評估。本研究以“C語言程序設(shè)計”課程為例,構(gòu)建了基于知識點的習(xí)題表征體系。
初始難度標(biāo)定:由教師預(yù)設(shè),并通過自適應(yīng)算法動態(tài)修正。
知識點關(guān)聯(lián)建模:采用Q矩陣表示習(xí)題一知識點映射關(guān)系,由領(lǐng)域?qū)<覙?biāo)注,如圖2所示。
如圖2所示,該題所關(guān)聯(lián)的知識點為“函數(shù)的定義”。
習(xí)題 p1 關(guān)聯(lián)知識點 k2 和 k5 見表1。
學(xué)生認(rèn)知診斷研究:學(xué)生認(rèn)知狀態(tài)的精準(zhǔn)評估是在線教育系統(tǒng)實現(xiàn)個性化教學(xué)的核心基礎(chǔ)。本研究基于認(rèn)知診斷評價(CognitiveDiagnosisAssessment,CDA)理論框架,重點解決傳統(tǒng)模型的局限性問題。
圖1研究的基本框架


傳統(tǒng)DINA模型采用二元表征評估知識點掌握狀態(tài),即輸出的1、0值分別表示學(xué)生在某個知識點上掌握或未掌握,存在離散化局限,如表2所示。
針對高等教育中知識點復(fù)雜度高、離散化診斷不準(zhǔn)確的問題,本文提出自適應(yīng)認(rèn)知診斷框架(AdaptiveCognitiveDiagnosticFramework,ACDF)。通過知識缺陷指數(shù)(Dij)量化學(xué)生對知識點的連續(xù)掌握程度,并實現(xiàn)認(rèn)知狀態(tài)的動態(tài)追蹤,隨著學(xué)生的不斷學(xué)習(xí),對知識點的缺陷指數(shù)會不斷發(fā)生變化,從而克服傳統(tǒng)二元診斷模型的不足。
表1習(xí)題一知識點關(guān)聯(lián)矩陣Q示例

表2學(xué)生一知識點掌握矩陣示例

表3學(xué)生知識缺陷矩陣D示例

1.建立用戶的知識缺陷模型
知識缺陷指數(shù) Dij 為第i個學(xué)生在第j個知識點上的缺陷指數(shù),定義如下:

其中: N 為當(dāng)天用戶進(jìn)行答題的總次數(shù); mkj 為當(dāng)天用戶進(jìn)行第 k 次答題時,與第j個知識點有關(guān)的錯題數(shù);Mkj 為當(dāng)天用戶進(jìn)行第 k 次答題時,與第j個知識點有關(guān)的所有習(xí)題數(shù)。
Dij 越大意味著用戶對第j個知識越不了解,缺陷越大。同時也是第i個學(xué)生做錯和第j個知識點有關(guān)題目的概率。
表3為兩位學(xué)生在知識點上的掌握程度示例。
在ACDF模型中,可以定義學(xué)生i對知識點j的掌握度(即第i個學(xué)生答對與第j個知識點有關(guān)題目的概率)為:
Yij=1-Dij
對于一個包含K個知識點的習(xí)題t,學(xué)生i答對的概率 Fit 可以表示為:

圖3基于ACDF模型認(rèn)知診斷的個性化習(xí)題推薦框架

即ACDF模型認(rèn)為,學(xué)生i正確回答習(xí)題t是學(xué)生i正確回答與習(xí)題t包含的總共K個知識點相關(guān)習(xí)題的積事件。
2.自適應(yīng)難度計算
在系統(tǒng)中,習(xí)題的初始難度系數(shù)由專家給定,針對專家預(yù)設(shè)難度與學(xué)生實際表現(xiàn)的偏差,基于答題數(shù)據(jù)的自適應(yīng)難度計算方法,通過動態(tài)調(diào)整習(xí)題難度系數(shù),使其更準(zhǔn)確反映學(xué)生的真實認(rèn)知水平。
3.習(xí)題預(yù)測矩陣
為實現(xiàn)精準(zhǔn)的習(xí)題推薦與學(xué)生答題結(jié)果預(yù)測,構(gòu)造習(xí)題預(yù)測矩陣F,該矩陣為 k×d 矩陣,k為系統(tǒng)中的學(xué)生人數(shù),d為系統(tǒng)中的題目總數(shù)(k,d均為正整數(shù))。F中的第i行、第j列的元素 Fij 即為第i個學(xué)生答對第j個題目的概率 Fij
4.自適應(yīng)計算習(xí)題難度系數(shù)
在完成習(xí)題預(yù)測矩陣F后,根據(jù)矩陣計算習(xí)題t的自定義難度系數(shù) Ft ,即為系統(tǒng)中所有學(xué)生做錯該題的平均概率,難度系數(shù)越大,意味著學(xué)生做錯的概率越大。F的定義如下:

其中,N為學(xué)生總?cè)藬?shù), Fit 為習(xí)題預(yù)測矩陣中第i行、第t列的元素。
(三)基于ACDF模型認(rèn)知診斷的個性化習(xí)題推薦
針對ACDF模型在個性化教學(xué)中的應(yīng)用,其個性化習(xí)題推薦框架如圖3所示。
基于ACDF模型認(rèn)知診斷的個性化習(xí)題推薦主要包括數(shù)據(jù)輸入、學(xué)生認(rèn)知診斷、生成預(yù)推送習(xí)題集及輸出等四個步驟。首先利用知識缺陷矩陣D對學(xué)生的認(rèn)知狀態(tài)進(jìn)行量化評估。系統(tǒng)采用自適應(yīng)算法動態(tài)計算習(xí)題難度,并結(jié)合預(yù)設(shè)的期望分?jǐn)?shù)生成初步推薦習(xí)題集,通過預(yù)測模型評估學(xué)生的潛在得分表現(xiàn)。在最終推薦階段,系統(tǒng)根據(jù)個性化難度閾值對習(xí)題進(jìn)行篩選,同時支持智能推薦與自主選擇兩種模式。智能模式基于預(yù)測得分與期望自標(biāo)的匹配度自動優(yōu)化題自難度,手動模式則允許學(xué)生根據(jù)自身需求選擇基礎(chǔ)鞏固或能力提升等不同難度等級,從而實現(xiàn)教學(xué)精準(zhǔn)性與學(xué)習(xí)自主性的有機(jī)結(jié)合[7]。該推薦機(jī)制有效解決了傳統(tǒng)方法在難度適配和個性化需求響應(yīng)方面的不足,為智能化教學(xué)提供了可靠的技術(shù)支持。
三、實驗仿真
實驗將基于ACDF模型認(rèn)知診斷的個性化習(xí)題推薦框架應(yīng)用于兩組高校電子信息科學(xué)與技術(shù)專業(yè)的學(xué)生在“C語言程序設(shè)計”課程上的實際答題記錄,并進(jìn)行個性化的習(xí)題推薦。從圖4(a)(b)所示結(jié)果均可看出,基于ACDF框架向?qū)W生推薦不同期望分?jǐn)?shù)的習(xí)題時,實際得分與期望分?jǐn)?shù)最吻合,意味著推薦的效果最好(即基于ACDF框架的推薦結(jié)果更符合學(xué)生的實際學(xué)習(xí)水平)。
四、結(jié)語
高等教育智能化的深入推進(jìn)催生了自適應(yīng)學(xué)習(xí)和個性化教學(xué)等新型智慧學(xué)習(xí)需求,而在線教育平臺的快速發(fā)展則為教育數(shù)據(jù)挖掘研究提供了重要支撐。本研究通過融合教育心理學(xué)、認(rèn)知心理學(xué)與計算科學(xué)技術(shù),構(gòu)建了基于ACDF模型的自適應(yīng)認(rèn)知診斷框架,從習(xí)題難度動態(tài)計算和學(xué)生認(rèn)知狀態(tài)評估兩個維度,提出了高等教育智能化背景下數(shù)據(jù)挖掘的創(chuàng)新解決方案。
圖4不同推薦方式的效果對比

該領(lǐng)域的下一步研究可在以下方向持續(xù)深化:建立更完善的多維認(rèn)知因素模型,除答題正確率外,還需整合答題時間、粗心程度和猜測概率等影響因素,以提升知識缺陷診斷的精確度。跨學(xué)科知識圖譜構(gòu)建與學(xué)習(xí)分析的研究,通過挖掘?qū)I(yè)課程間的內(nèi)在關(guān)聯(lián),實現(xiàn)對學(xué)生綜合學(xué)習(xí)能力的全面評估。智能技術(shù)與傳統(tǒng)教學(xué)深度融合,既發(fā)揮線上系統(tǒng)的數(shù)據(jù)分析優(yōu)勢,又保留教師線下教學(xué)的核心價值,形成人機(jī)協(xié)同的新型教學(xué)模式。
隨著教育信息化建設(shè)的持續(xù)推進(jìn),數(shù)據(jù)挖掘技術(shù)在教育領(lǐng)域的應(yīng)用前景廣闊。未來研究應(yīng)著力突破現(xiàn)有認(rèn)知診斷技術(shù)的局限,構(gòu)建更加智能化、個性化的學(xué)習(xí)支持系統(tǒng),為高等教育質(zhì)量提升提供堅實的技術(shù)保障。這一交叉學(xué)科領(lǐng)域的發(fā)展,不僅需要技術(shù)創(chuàng)新,更需要教育理論研究者與技術(shù)開發(fā)者的深度合作,共同推進(jìn)智慧教育的變革與創(chuàng)新[8]。
參考文獻(xiàn)
[1]BRESLOW L,PRITCHARD D E,DEBOER J,et al.Studying learning in the worldwide classroom:Research into edX's first MOOC[J].Researchamp;Practice in Assessment,2013(08):13-25.
[2]POLSON M, RICHARDSON J J. The role of human-computer interaction in intelligent tutoring systems[M]/omputer science andeducation,2013.
[3]陳池,王宇鵬,李超,等.面向在線教育領(lǐng)域的大數(shù)據(jù)研究及應(yīng)用[J].計算機(jī)研究與發(fā)展,2014,51(S1):67-74.
[4]管佳,李奇濤.中國在線教育發(fā)展現(xiàn)狀、趨勢及經(jīng)驗借鑒[J].中國電化教育,2014(08):62-66.
[5]DIBELLO L V,ROUSSOS L A,STOUT W.31A reviewof cognitively diagnostic assessment and a summary of psychometric models[M]//Handbook of statistics.2006,26:979-1030.
[6]DE_ LA TORRE J.DINA model and parameter estimation:A didactic[J].Journalof Educational andBehavioral Statistics,2009, 34(01): 115-130.
[7]劉淇,陳恩紅,黃振亞,等.面向個性化學(xué)習(xí)的學(xué)生認(rèn)知能力分析[J].中國計算機(jī)學(xué)會通訊,20174(13):28-34.
[8]劉淇,陳恩紅,黃振亞,等.面向在線智慧學(xué)習(xí)的教育數(shù)據(jù)挖掘技術(shù)研究[J].模式識別與人工智能,2018.31(01):77-90
基金項目:2022年度廣西高校中青年教師科研基礎(chǔ)能力提升項目教育信息化專項項目“數(shù)據(jù)治理背景下地方高校的教學(xué)管理服務(wù)平臺研究”(項目編號:2022XXH0002)
作者單位:桂林理工大學(xué)
責(zé)任編輯:王穎振鄭凱津