摘要:教育數字化轉型背景下,學情分析作為基于教育大數據分析診斷結果幫助教師了解學生學習過程的重要手段,是開展精準教學的必要前提,而認知負荷水平一直是衡量學習者個性化學習需求與深度學習發生的重要指標。為了協助學習者調整學習過程中的認知負荷水平進而將認知資源有效投入高階問題解決過程,該文梳理了學情分析的一般過程,構建了包含數據采集、負荷識別與分析干預三個層級的基于認知負荷水平的學習者學情分析框架。接著,該文通過便攜式手環采集了300名學生完成在線測試時的多模態生理數據,應用特征工程方法構建了認知負荷水平識別模型,綜合認知負荷水平與學習績效進行學情狀態解讀,并設計了學習分析儀表盤呈現學情分析結果與干預建議。該文從認知負荷視角構建了學情分析框架并通過實證研究檢驗了其可行性,以期為認知負荷相關研究與教學實踐提供參考。
關鍵詞:認知負荷;學情分析;多模態學習分析;干預設計
中圖分類號:G434 文獻標識碼:A
* 本文系國家自然科學基金面上項目“同步直播課堂中基于多模態數據的學習者專注度評估及其演化機制研究”(項目編號:62177008)階段性研究成果。
學情分析指為了優化教師教學設計與提升學生學習效果而開展的對學生學習情況的診斷、評估與分析,是開展精準教學的必要前提[1]。隨著以人工智能、大數據為代表的數字技術高速發展,學情分析的相關研究得到了高度重視。已有大量研究從知識技能掌握維度,基于課程通過率(是或否)[2]、期末考試等級(A-D五個級別)[3]與題目作答水平(高-低兩個級別)[4]等結果性指標精準診斷學生學情;也有研究從情緒狀態維度,采集學生學習過程中的多模態數據,基于學業情緒(積極情緒與消極情緒,各七個等級)[5]與答題狀態(掙扎、發呆等五種狀態)[6]等過程性指標完成學生學情診斷;為了豐富學情分析研究內容與維度,拓展對學生能力層面的分析,本研究試圖從認知維度的視角,基于學習者認知負荷水平進行學情分析。
認知負荷理論是誕生于20世紀80年代的重要認知心理學理論,它強調人類認知結構及其演變,最終目的是利用對人類認知的了解來為教學設計提供指導[7],已廣泛應用于教育教學研究。例如,李爽等[8]與王舒等[9]分別在混合學習情境與英語單詞學習場景開展實驗,發現學習者認知負荷水平對其學習投入、學習滿意度、學業表現與心流體驗等均有顯著影響;而Patrick團隊[10]與Zhong團隊[11]均以中學生為研究對象,從認知負荷視角分別探究了虛擬現實學習環境下添加文字注釋的學習材料對學生回憶、理解與遷移所學知識的促進作用,以及機器人學習課程中四種支架策略(有無過程信息,有無解決方案)對學生編程技能與故障排除能力的培養。分析已有研究可知,基于認知負荷水平分析學情是設計優質教學活動、布置高水平學習任務的前提,然而,大多研究只遵循“降低認知負荷有益教學”的簡單線性邏輯,且多通過量表測評認知負荷水平,存在一定主觀性與滯后性。本研究認為,力求降低學習者認知負荷水平并非是最適合有效學習發生的目標導向,當學習任務難度與數量處于學習者的合理認知負荷區間時,更能夠鍛煉學習者高階思維能力,并在一定程度滿足其個性化學習需求,進而有效促進深度學習的發生。 鑒于此,本研究從認知負荷視角開展學習者學情分析,先構建了基于認知負荷水平的學情分析框架,接著通過實證闡述了應用學習者認知維度的多模態數據診斷認知負荷水平技術路線,進行了認知負荷視角下的學情狀態解讀并依據學情分析結果給出教學干預設計,以期從認知負荷視角指導學情分析實踐。
(一)認知負荷及其測量研究
認知負荷是加工特定數量信息時所需要的“心理能量”水平,會隨著人類需要加工信息量的增加而相應提升[12],其本質上是在衡量大腦工作記憶中有多少“空間”正在被使用。認知負荷一般分為外在認知負荷、內在認知負荷與相關認知負荷三類[13],其中內在認知負荷取決于知識點難度、相關認知負荷取決于學習者知識水平并體現為將知識點內化進入自身知識結構的過程,而外在認知負荷則由教學設計不當造成,需要盡量降低。
認知負荷研究的最終目的是利用對人類認知的了解來指導教學設計,因此其測量研究尤其重要。心理學領域認知負荷測量的方法主要包括自我報告法、雙任務法與生理信號測量法?;谧晕覉蟾娴闹饔^測量是獲取認知負荷水平的主要方式之一,具有成本低廉、分析便捷以及對實驗任務干擾程度較低等優點[14],當前PAAS、SWAT、NASA-TLX等量表已經是較為成熟的認知負荷測量工具,而Leppink等[15]開發的包含10個題項的問卷更是有潛力區分并分別測量三種認知負荷類型。此外,任務績效是最直接反映學習者完成任務時其認知負荷水平的重要指標,當前研究中通常使用雙任務測量法,即學習者在一定時間內完成主要任務的同時,在固定間隔時間執行與主要任務無關的次要任務,并使用次要任務的準確率、反應時間等直接映射認知負荷水平。然而,此方法存在輔助任務干擾性過強的缺陷,且主次任務選擇的衡量標準待定,目前還處于在實驗室環境中探究應用階段。生理信號測量法中,腦電信號憑借其時間分辨率高、便攜性好等優點成為評估認知負荷的重要技術手段,早期基于腦電信號的認知負荷評估為觀察被試事件相關電位等關鍵特征在不同認知狀態下的變化模式,現如今則是通過提取信號的多種特征,使用機器學習方法進行認知負荷評估。此外,心率變異性、瞳孔反應等生理信號也對認知負荷水平敏感,皮膚電活動近年來也成為了認知負荷和情緒狀態的前瞻性生理指標[16]。
多模態方法測量認知負荷是近年來隨著大數據技術而發展起來的新方法,在教育教學領域應用廣泛。相關研究證實,基于學習者日常學習生活過程中的大量行為動作數據能夠發掘學習者的認知模式。例如,在線學習環境中鼠標在不同區域內的操作行為能夠反映學習者認知過程的變化[17],而在作業或考試任務中,握筆力度、寫字速度等書寫特征也能夠反應學習者認知負荷水平[18]。此外,在講話過程中,當個體處于高認知負荷狀態時,語速、音量和振幅等聲音特征會有所增加[19],而在行走過程中,步頻、步長等個人步態模式是表征認知負荷的潛在指標[20]。隨著輕量級便攜式生理數據采集設備的興起,使得在真實課堂下基于多模態生理數據分析學習者認知負荷水平成為可能,綜合使用多種傳感器、融合多模態數據能夠克服單一傳感器易受噪聲影響的問題,增強分析模型的精度與魯棒性。例如,研究者Aghajani綜合使用腦電信號與功能性近紅外光譜探究不同任務級別下學習者的認知負荷水平,充分發揮兩種信號分別在時間與空間分辨率上的互補優勢提取多模態特征,相比單模態取得了更好的認知負荷評估結果[21];于海斌等也通過系列實驗證明,基于腦電信號與光電容積脈搏波信號信息并結合特征提取、選擇和融合算法建立的多生理信號認知負荷評估模型效果優于兩種單模態信號模型[22]。
(二)學情分析及其一般過程
學情分析是對學習者及其環境的數據進行測量、收集、分析與報告,旨在優化學習及其環境[23],進一步聚焦于學習者的學情狀態分析,其流程可以劃分為如圖1所示的五個階段。

1.確定學情診斷指標
學情分析首先需要在精準理解學習場景的前提下確定相應的學情診斷標準。例如,課堂教學場景下對教師的板書內容[24]、行動軌跡以及與學生交互時長[25]等交互行為分析能夠揭示師生交互關系和教學現象[26];在線學習場景中學習者在行為、認知與情感三個維度的學習投入是線上學習質量的重要憑據[27];混合學習場景中,研究者們則從學習焦慮[28]、認知負荷[29]、學習效能感[30]等豐富的角度分析學情狀態。
2.明確數據分析方法
其次,學情分析需要以實際教育問題為導向明確數據分析方法。例如,研究課堂交互行為時通?;谝曨l數據采用弗蘭德斯互動分析、S-T分析等人工編碼方法與以各種卷積神經網絡為代表的深度學習方法實現量化分析;研究學習投入水平則多使用文本數據,既可通過量化方法提取、輸出語義特征或借助詞嵌入技術生成詞向量特征,也可通過質性編碼解讀文本內容;探索其他復雜教學問題時,多模態學習分析方法被認為是打開黑箱的鑰匙[31]。
3.解讀學情分析結果
如何從學情分析的結果中解讀出有意義的教育信息,是連接理論與實踐的重要橋梁。例如有研究證明,教師的技術知識與其對技術的感知有用性存在正相關,但實則二者同時受到技術的感知易用性這一要素的共同影響[32],可見,學情數據結果仍需借助理論,通過增強數據代表性、發掘中介變量等方法排除“無意義相關”與“偽相關”[33],探究學情分析結果的背后原因。
4.呈現學情分析內容
學習分析儀表盤是一種能夠精密追蹤學習者在線學習行為、記錄整合個體學情信息、按照使用者需求分析并呈現數據的教學干預工具[34],需要結合相關理論采用符合學習者認知特點的形式呈現學情分析內容。例如依據成就目標定向理論,掌握目標定向者看重能力提升和任務掌握情況,需向其多呈現任務完成進度、認知能力圖譜等要素;成就目標定向者更加重視他人認可程度,則需要著重呈現與他人學習成績的對比,以及教師評語等信息[35]。
5.改進教育教學實踐
切實賦能學習干預、改進教學實踐是學情分析研究的最終目的和落腳點。面對實際教育場景中復雜的教學問題,僅局限于學情分析結果的機械干預很難奏效。人機智能協同的精準學習干預在精準診斷學習問題的基礎上形成“問題-策略”知識圖譜,綜合考量干預對象、時機、強度與頻率并設計匹配具體教育場景實施干預,并基于有限狀態機的思路實現干預效果驗證,是破解教學訴求與教育實踐難題的有效路徑[36]。
(三)認知負荷視角下的學情分析框架
認知負荷理論認為個體工作記憶容量存在極限,學習發生時其認知負荷總和不宜超過記憶資源的總量。認知負荷過高會導致學習者快速疲勞、靈活性降低,產生挫敗情緒,進而引起信息獲取分析的失誤和決策錯誤,認知負荷過低也會造成工作記憶資源浪費,同樣不利于高效學習[37]。因此,指向深度學習的認知負荷最佳管理方式為盡量減少與學習無關、優化與學習密切相關的認知加工,始終保持學習者現有認知能力的極限,讓學習者在適宜認知負荷水平出色地完成學習任務[38]。研究表明,認知負荷水平與學習或工作績效通常呈現出倒“U”型曲線關系[39],Fang等[40]在專著中將二者關系描繪如圖2所示。
在教學材料設計合理、能夠保證學習者外在認知負荷水平處于較低水平的前提下,當學習者總體認知負荷水平較低時(圖2橫坐標“低負荷”對應范圍),可能由于厭倦或缺乏動力導致其績效表現不佳,但先驗知識充

足的學習者,其在長時記憶中的圖式可以根據所面臨的情景進行快速而正確的自動化歸類以降低工作記憶資源的消耗[41],通常經過適當的努力即可在認知負荷保持在較低水平時出色完成任務、取得高績效;當學習者認知負荷水平較高時(圖2橫坐標“高負荷”對應范圍),通過自身的不懈努力可以使績效達到較高水平,然而當認知負荷水平繼續升高時(橫坐標“負荷過載”對應范圍),學習者自身努力也無法阻止績效水平的下降。于是,本研究基于認知負荷水平并參考學業成績指標,形成認知負荷視角下學習者學情診斷標準(如圖3所示)。其中,“L”與“H”兩個字母分別表示認知負荷與學業成績的“低”與“高”,例如“L-H”表示學生完成任務過程中表現為“負荷低-成績高”的狀態,本文將此類學生稱為“尖子生”。

綜上,本文依據學情分析的一般過程與認知負荷視角下的學情診斷標準,梳理得到基于認知負荷水平的學情分析框架,如下頁圖4所示。在實現學習者認知維度多模態數據的伴隨式采集后,需進行不同維度的特征提取、融合并應用分類算法識別認知負荷水平,而后從認知負荷視角依次完成學情診斷、結果解讀與教學干預,形成學情分析閉環。
數據層是分析模型的基礎,采集學習過程中的認知維度多模態數據是開展認知負荷水平識別與學情分析的前提。認知是個體通過經驗和感官等加工信息獲取知識的最基本心理過程[42],相關心理測量量表與自我報告數據,以及面部表情、話語內容等反映師生教學情感態度的數據可直接用于分析表征認知狀態。生理信號也是探究認知水平的重要數據,隨著教育神經科學的發展,可應用腦神經分析技術與新一代人工智能技術對腦電、心率及皮膚電等認知敏感的生理信號數據開展分析。此外,認知心理學領域的諸多研究聚焦外顯行為,應用統計分析或質性分析方法探索個體認知過程,具體包括在線平臺日志中的點擊流數據、點陣筆記錄的書寫行為數據以及攝像頭捕獲的身體姿態數據等等。未來有待進一步探索其他多源數據,并應用多學科交叉研究方法與技術路徑實現對學習者認知機理的深層次剖析。

計算層是分析模型的核心。常態化采集的學習者過程性多模態數據主要以生理、視頻與文本形式存儲,在先后經過數據預處理、特征提取與特征融合后,將數據特征集輸入分類算法模型可實現認知負荷水平識別。其中,數據預處理主要包含數據清洗與數據標注兩個重要模塊,前者旨在清理、糾正數據集中的異常數值與基本錯誤,把關數據質量,例如對生理數據濾波降噪、將視頻圖像數據進行圖像增強與分割、去除本文數據中的停用詞與標點并進行分詞等等;后者是對原始數據賦予“真值”的過程,幫助算法模型理解數據的含義,現有研究對認知負荷狀態的標注主要參考量表結果、任務準確率或不同任務難度梯度等指標完成。特征提取是從原始數據中提取出最能代表其特性的部分并進行量化的過程,有助于簡化問題、增強算法模型的準確性。生理信號數據中,平均心率、心跳間期標準差[43]等時域特征與皮膚電信號中的平均振幅、持續時間[44]等頻域特征用于反映生理喚醒水平,可通過小波變換(Wavelet Transform,WT)與快速傅里葉變換(Fast Fourier Transform,FFT)方法提取;之于視頻圖像數據,當前最常使用的特征提取方法為卷積神經網絡,其經典網絡架構包括AlexNet、VGG、ResNet等等,同時邊緣檢測、特征點檢測等預處理步驟也可幫助突出圖像中的重要結構,為卷積神經網絡處理打下基礎;學習者書寫內容以及談話語音轉錄形成的文本是反映其認知狀態的重要證據,早期的文本特征為通過詞袋模型(Bag of Word,BoW)提取的關鍵詞詞頻,TF-IDF方法則在其基礎上增加了逆文檔頻率特征,詞嵌入模型(Word2Ve、BERT等)則是通過將每個詞語表示為一個實數向量進而捕捉詞之間的語義和語法關系。將不同模態信號進行融合能夠增強識別模型的準確性與魯棒性,通常在數據、特征和決策三個水平上進行?;诙嗄B數據的認知負荷相關研究多應用特征級融合,即把不同模態來源的特征基于時間序列對齊、組合,形成統一的特征向量或特征矩陣,而后輸入模型分析。聚焦教育領域,相關識別研究多為將學習者認知負荷水平進行二分類,并應用多種機器學習算法或深度學習算法進行識別。
應用層是分析模型的導向,實現將分析結果指向教學干預、賦能教學實踐,其基本步驟如下。首先,將能夠反應學習者認知資源分配過程的認知負荷水平指標與以學業成績為代表的結果性評價指標結合,依據圖3標準應用統計分析方法判斷學情狀態;其次,借助教育學與心理學相關理論對學習者學情狀態進行解讀,例如參考期望價值理論建議認知負荷水平較低且學業成績不理想的學習者酌情降低學業目標,再如依據最近發展區理論提議認知負荷水平較高但學業成績不佳的學習者向負荷低且成績出色的尖子生群體請教問題;最后,可通過學習分析儀表盤等方式將學習者的學情結果、解讀內容與干預建議等呈現給師生。當然,真實教育教學過程是一個復雜系統,干預建議與實施方案除參考學情結果外,還需要依據場景需求、學習者規模與知識內容不斷調整干預的對象、方式、時機與強度,例如課堂學習場景下當班級大多數學生難以跟上知識進度時,教師有必要立刻調整教學內容完成群體干預,協作學習場景下通過學習平臺或移動終端延后為學習者提供建議是可行的方案,而自主學習場景下教師或AI智能學習助手則可以提前為可能存在困難的學生搭建支架。
(一)實驗設計與數據采集
本研究以北京市某高校300名(46男,254女)本科生為研究對象,在高校教室開展測試實驗。其中測試題目為水資源相關的地理學科選擇題(30道單選題,10道多選題,滿分50分),被試答題全程佩戴生理手環。實驗整體流程如下:首先學生簽署知情同意書,之后佩戴生理手環并采集5分鐘的基線數據;接著學生打開平板電腦點擊題目鏈接,限時15分鐘獨自閉卷答題;作答結束后學生自行點擊“提交”按鍵,系統即刻生成本次測試得分,查看分數后立即填寫認知負荷量表并提交,至此實驗結束。
研究過程應用了NASA-TLX量表與E4手環兩種工具,前者為美國國家航天局開發的認知負荷量表,后者為意大利Empatica公司研發的生理手環。標準版NASA-TLX量表包含“心理需求”“時間需求”“努力程度”“體力需求”“自我績效”與“受挫程度”六個維度、每個維度一個題項,有21個等級[45],具有評價時間較短和對總認知負荷水平敏感的優點。結合本實驗的任務與場景特點,剔除關聯程度較低的“體力需求”維度,保留其余五個維度,量表在改編后的Cronbach’s α系數值為0.73,信度較好。
(二)基于多模態數據的認知負荷水平識別
1.認知負荷測量結果
本研究使用的NASA-TLX量表在認知負荷測評的相關研究中應用廣泛,其得分計算方法主要為直接相加各維度得分與兩兩配對計算各維度加權總分兩種方式,前者測量粒度較粗,后者基于被試賦權故結果遷移性不強。于是,本研究對量表采取專家賦權,邀請18位教育領域專家填寫《NASA-TLX打分表》(詳細描述了測驗任務,專家對5個子維度的重要性判斷矩陣根據T.L.Saaty的1—9標度法[46]打分),而后應用層次分析法得到各指標權重并計算出認知負荷水平。各維度指標權重的計算過程如下:首先,計算所有判斷矩陣的一致性比率CR,剔除系數大于0.1(即未通過一致性檢驗的樣本)后得到12個有效判斷矩陣;其次,統計有效判斷矩陣的權重分配結果,依據四分位距異常值識別標準,剔除了“努力程度”維度的一個異常值(超過下四分位距1.5倍);最后,計算5個維度剩余權重的算術平均值(剔除了異常值,故權重相加后不完全等于100%)得到最終指標權重(如表1所示)。被試在量表每個維度的打分(“自我績效”維度得分取反)加權求和即為其認知負荷總分。

2.學習者認知負荷水平識別
認知負荷分數是學習者完成當前任務狀態的直觀體現,但很難針對每個具體數字本身均給出教育教學層面的解讀,參考分層教學思想按照認知負荷分數將學習者分為有限幾類是切實可行的方案。本研究將學習者認知負荷水平分為高與低兩類,并基于生理手環采集的學習者心率(HR)、心跳間期(IBI)、皮膚電(EDA)、與皮膚溫度(ST)四種多模態生理信號數據,實現學習者認知負荷水平識別。
(1)數據清洗與標注
本研究的數據清洗遵循兩條標準,一是統計各被試的認知負荷水平得分,將暫時無法判斷認知負荷水平的19名被試數據(得分恰好是中位數)剔除;二是檢驗采集的多模態生理數據,刪除質量不達標條目。最終,整理獲得266個有效樣本。檢驗樣本分布,發現認知負荷得分(峰度0.594,偏度-0.597)的統計直方圖均呈現鐘型,證明其基本可接受為正態分布,于是計算得分中位數,判定分數位于前(后)50%的學習者認知負荷水平為高(低)。
(2)生理特征提取
生理信號是人作為生物體的自發反應,不易受主觀意志控制[47],因此能夠較為真實、客觀地反映出人類某時間段的心理活動狀態。研究從四類生理信號數據中提取了相應的時域、頻域以及非線性特征共23項,如表2所示。其中,HR信號與ST信號的基本統計特征提取利用IBM SPSS Statistics完成,IBI特征使用Kubios軟件提取,對數據偽影使用插值法進行了校正,EDA特征則應用集成于Matlab的Bio-SP工具箱,勾選高斯濾波器完成噪聲去除與平滑處理后提取了相應特征。此外,由于各特征的量綱不同導致實際數值之間差異較大、無法直接進行比較,統一使用Z-Score標準化方法將提取的各特征取值轉化為標準分數。

(3)特征融合與篩選
完成生理特征的量化工作后,先將所有特征串聯形成一個總體特征向量,而后對特征集合進行篩選,刪除效果不佳的特征。本研究使用隨機森林特征重要性排序方法,采用Gini系數評估特征,篩選出了重要性排名前50%的特征(如圖5所示),形成優質特征集。

(4)識別效果分析
研究采用常見的七種監督學習算法訓練優質特征集得到認知負荷水平識別模型,并通過十折交叉檢驗方法規避過擬合問題,使用分類任務中常見的準確率、召回率、精確率與F1值檢驗模型性能(如表3所示)。分析可知,除KNN外,其余算法的四項指標均高于或接近75%,其中隨機森林(RF)的預測性能最佳,四項指標均接近或超過80%。參考過往教育領域中使用機器學習算法完成分類任務的相關研究,準確率達到70%被認為結果可以接受,證明本實驗基于多模態生理數據構建的認知負荷水平識別模型效果較好。

(三)認知負荷視角下的學情分析與干預
1.學情診斷結果
在實現認知負荷水平識別后,本文參照圖3標準將認知負荷水平與學習績效結合完成學情診斷。本次實驗以測試得分代表學習績效,其判別方式與上文認知負荷水平判別類似,先檢驗樣本分布(峰度-0.036,偏度-0.636,統計直方圖呈現鐘型可接受為正態分布),而后計算得分中位數,判定分數位于前(后)50%的學習者成績為高(低)。最終綜合認知負荷與學習績效兩個指標統計得到“成長型學習者”(高負荷-高成績)57人,“尖子生”(低負荷-高成績)80人,“潛力型學習者”(高負荷-低成績)83人以及“游離型學習者”(低負荷-低成績)61人。
2.結果解讀
為了充分解讀學情分析結果,研究分別分析測試得分較高的“尖子生”與“成長型學習者”以及測試得分較低的“潛力型學習者”與“游離型學習者”群體在認知負荷子維度的差異,即分別對兩個群體在5個認知負荷維度上的得分進行了獨立樣本T檢驗(如表4所示)。

高測試得分群體中,兩類學習者在“心理需求”“努力程度”與“受挫程度”三個維度上存在大幅度差異(Cohen’s d > 0.8)。由此可見,相比80名“尖子生”群體,57名“成長型學習者”在測試任務中更加努力、投入了更多的腦力資源,也在任務過程中夾雜了更多的沮喪或煩惱情緒。依據最近發展區理論,測試題目的知識水平基本落在了“成長型學習者”的最近發展區內,相應學生在投入大量精力、時間與情感后可以達到較好的分數,即“跳一跳,夠得著”,此類學習者通過自身努力取得了較好的成績,學習狀態十分理想;至于“尖子生”群體,他們面對任務表現得游刃有余,投入較少精力即可獲得相對優異的成績,顯然此類型學習者先驗知識水平充足,題目難度未達到其最近發展區上限。此外,雖然兩類學習者的測驗分數都較高,但在“自我績效”維度的打分沒有顯著差異,且該維度的打分均值都不高,這意味著多數學習者對自己有著更高的預期,并不滿意自己本次題目取得的成績。
低測試得分群體中,兩類學習者在“心理需求”“時間需求”“努力程度”“受挫程度”四個維度存在大幅度差異。這意味著83名“潛力型學習者”在任務過程中對完成題目表現出了更強的學習動機,于是也付出了更多腦力活動與更高努力程度。這些被試認為測試用時緊張,或許是由于面對不同難度題目時間分配策略不得當,此外測試題目難度很可能逼近甚至超過了被試們的最近發展區上限,導致其在知識技能層面遇到了較大困難而產生了畏難、緊張情緒,日常教學中此類學習者僅憑自身努力已經很難改變學習成績不佳的事實,需要為其提供腳手架或其他形式的人工干預;相比而言,61名“游離型學習者”在任務過程中付出的腦力活動與努力程度都不高,所以也并不具備時間緊迫感,不會因任務而感到煩惱受挫。依據期望價值理論,這些被試對完成測試任務缺乏動機、效能期望較低,也許是由于題目難度遠超最近發展區上限導致其無從下手,抑或由于不認可本次任務的價值進而出現態度不佳的現象,在真實教學活動中這類學習者需要重點特殊關照。
3.分析結果呈現與教學干預建議
學習分析儀表盤是一種應用場景廣泛的干預工具,可記錄學習過程中產生的諸多數據,并在按需分析數據后將分析結果可視化呈現,從而為師生、研究者和管理者提供幫助[48],其構建方法通常包括交互式方法或編程式方法兩個類型[49]。參考在線測試實驗的學情分析結果,本研究以中小學完成作業場景為例,通過“即時設計”交互工具快速設計并完成了師生雙端學習分析儀表盤的可視化原型界面搭建,擬在課后分別為師生呈現學情內容與干預建議。
研究結合相關文獻調研內容以及對七位專家的啟發式評估結果,遵循“匹配用戶認知習慣”“美觀精煉”與“提供必要輔助說明”三條原則,設計了包含“任務安排”“學情分布”“學生名單”與“資源推薦”四個主要功能模塊的儀表盤系統原型。教師端儀表盤涉及全部四個功能,其部分頁面如圖6所示。“任務安排”模塊呈現教師近日上課班級的作業安排;“學情分布”模塊從群體、小組與個體層面向教師呈現認知負荷視角下學生完成某作業任務的學情類型,方便教師日后針對性的布置分層作業;“學生名單”模塊,包括“光榮榜”與“特別關注”兩個部分,分別向教師報告近期作業表現出色和作業任務遇到困難的學生,供其提出表揚和單獨答疑,開展個性化輔導;“資源推薦”模塊則定期推送有益于作業管理的工具以及高效輔導學生的視頻資源,協助教師提高作業批改效率、學習掌握最新干預工具。

學生端儀表盤涉及“任務安排”“學情分布”與“學生名單”三個功能模塊,其部分頁面如下頁圖7所示?!叭蝿瞻才拧蹦K呈現了學生自己所在班級的作業安排;“學情分布”模塊報告了認知負荷視角下每個作業任務的班級整體學情狀態,指出學生自己的學情類型,并且提供了特定時間范圍內(例如:一個月)個人作業完成情況的縱向學情類型統計,力求幫助學生及時掌握集體及個人的作業學情,進而促進其開展自我反思;“學生名單”模塊除了包含與教師端相似的“光榮榜”外,還會依據個體學情向學生推薦學習伙伴,幫助知識水平層面存在明顯差異的學生之間開展互助學習,例如向“潛力型學習者”推薦有余力開展同伴互助的“尖子生”,或幫助“游離型學習者”鏈接到學習狀態上佳的“成長型學習者”,分享學習經驗。

本研究使用自研的系統設計評價問卷以及Brooke編制的系統可用性量表(System Usability Scale,SUS),從滿意度與用戶可用性兩個角度初步考察儀表盤原型及教學干預建議效果。其中系統設計評價問卷包含系統架構設計、功能指標設計、系統設計有效性與系統使用意向四個維度,每個維度有2個題項,量表的KMO系數為0.614,Bartlett球形檢驗顯著,cronbach’s α系數達到0.773,證明其效度與信度均可以接受;SUS包含易學性與可用性兩個維度,其中易學性維度包含2個題項,可用性維度包含8個題項,cronbach’s α達到0.839,信度較好。問卷面向32人(12男,20女,學生老師各占一半)發放,全部成功回收。系統設計評價問卷的四個維度評分均超過80分,總體評分達到86.875分(滿分為100分),證明用戶對儀表盤設計與干預建議的滿意度較高;SUS結果可換算為0—100分,對應“Poor”“OK”與“Good”等評價等級,本研究設計的儀表盤在易學性、可用性與總體評價的分數分別為71.09、80.57與75.83分,達到“OK”“GOOD”與“GOOD”水平,具備較好的用戶可用性。
學情分析聚焦對學生學習情況的診斷、評估與分析,指向精準教學,而認知負荷則是衡量學習者個性化學習需求與深度學習發生的重要指標。本研究梳理了學情分析及其一般過程,基于認知負荷水平與學習績效兩個重要指標形成了學習者學情診斷標準,并從認知負荷視角構建了包含數據層、計算層與應用層三個層次的學情分析框架。同時,研究以在線測試場景為例,通過具體案例實現了基于多模態生理數據的認知負荷水平識別、學情分析結果解讀與教學干預設計,理清了基于認知負荷水平的學情分析實踐路徑。未來研究中,可進一步分別聚焦內在認知負荷、外在認知負荷與相關認知負荷三種具體認知負荷類型實現更細粒度的學情分析,并融合學習行為、書寫文本等學習者認知維度多模態信息,拓展認知負荷視角下的學情分析研究與實踐,進而推動精準教學的實施。
參考文獻:
[1] 劉崗,田靜.學情分析的價值意蘊、實踐困境與改進路徑[J].教學與管理,2020,(27):18-21.
[2] Bertolini R,Finch S J,et al.An application of Bayesian inference to examine student retention and attrition in the STEM classroom [J].Frontiers in Education,2023,8(2):1-16.
[3] 武法提,田浩.挖掘有意義學習行為特征:學習結果預測框架[J].開放教育研究,2019,25(6):75-82.
[4] Geden M,Emerson A,et al.Predictive student modeling in gamebased learning environments with word embedding representations of reflection [J].International Journal of Artificial Intelligence in Education,2021,31:1-23.
[5] Ramakrishnan A,Zylich B,et al.Toward automated classroom observation:Multimodal machine learning to estimate class positive climate and negative climate [J].IEEE transactions on affective computing,2021,14(1):664-679.
[6] Holstein K,McLaren B M,et al.Co-designing a real-time classroom orchestration tool to support teacher-AI complementarity [J].Grantee Submission,2019,6(2):27-52.
[7] Sweller J,Ayres P,et al.Cognitive load theory [M].New York:Springer,2011.
[8][29] 李爽,黃治霞等.混合學習情境下認知負荷對學習投入機制的調節作用[J].開放教育研究,2023,29(4):90-100.
[9] 王舒,殷悅等.教學設計中的成績表現和心流體驗:基于認知負荷視角[J].心理發展與教育,2019,35(3):329-337.
[10] Albus P,Vogt A,et al.Signaling in virtual reality influences learning outcome and cognitive load [J].Computers & Education,2021,166:1-16.
[11] Zhong B,Si Q.Troubleshooting to learn via scaffolds:Effect on students’ ability and cognitive load in a robotics course [J].Journal of Educational Computing Research,2021,59(1):95-118.
[12] 辛自強,林崇德.認知負荷與認知技能和圖式獲得的關系及其教學意義[J].華東師范大學學報(教育科學版),2002,(4):55-60+77.
[13] Sweller J,Van Merrienboer J J G,et al.Cognitive Architecture and Instructional Design [J].Educational Psychology Review,1998,10(3):251-296.
[14] Paas F,Tuovinen J E,et al.Cognitive Load Measurement as a Means to Advance Cognitive Load Theory [J].Educational Psychologist,2003,38(1):63-71.
[15] Leppink J,Paas F,et al.Effects of Pairs of Problems and Examples on Task Performance and Different Types of Cognitive Load [J].Learning and Instruction,2014,30(4):32-42.
[16][39] Fang C,Jianlong Z,et al.Robust Multimodal Cognitive Load Measurement [M].Cham:Springer,2016.
[17] Spivey M J,Grosjean M,et al.Continuous attraction toward phonological competitors [J].Proceedings of the National Academy of Sciences,2005,102 (29):10393-10398.
[18] Barz M,Altmeyer K,et al.Digital pen features predict task difficulty and user performance of cognitive tests [C].New York:Association for Computing Machinery,2020.23-32.
[19] Lively S E,Pisoni D B,et al.Effects of cognitive workload on speech production:Acoustic analyses and perceptual consequences [J].The Journal of the Acoustical Society of America,1993,93(5):2962-2973.
[20] Verrel J,L vdén M,et al.Interacting effects of cognitive load and adult age on the regularity of whole-body motion during treadmill walking [J]. Psychology and aging,2009,24(1):75-81.
[21] Aghajani H,Garbey M,et al.Measuring mental workload with EEG + fNIRS [J].Frontiers in human neuroscience,2017,11(7):1-20.
[22] 于海斌.基于多生理信號的認知負荷評估研究[D].北京:北京師范大學,2019.
[23] Siemens G,Gasevic D,et al.Open Learning Analytics:an integrated & modularized platform [D].Edmonton AB Canada:Monash University,2011.4-18.
[24] 周鵬霄,鄧偉等.課堂教學視頻中的S-T行為智能識別研究[J].現代教育技術,2018,28(6):54-59.
[25] Saquib N,Bose A,et al.Sensei:sensing educational interaction [J]. Proceedings of the ACM on Interactive,Mobile,Wearable and Ubiquitous Technologies,2018,1(4):1-27.
[26] 方海光,孔新梅等.一種智慧課堂交互行為數據的標準分數常模計算方法研究——基于改進型弗蘭德斯互動分析系統iFIAS[J].遠程教育雜志,2023,41(5):67-75.
[27] 蔡旻君.學習者在線學習行為投入新探索——基于點、線、面方法的評估模型構建[J].中國電化教育,2023,(8):84-93.
[28] 戰雙鵑,許文麗.SPOC混合教學模式下高校外語課程學習焦慮研究[J].當代外語研究,2023,(6):118-126.
[30] 彭紅超,趙佳斌.混合學習團隊類型及其學習效果:學習力和學習效能感視角[J].現代遠程教育研究,2022,34(6):102-111.
[31] 田浩,武法提.混合場景下協作認知投入的多模態表征與分析路徑研究[J].遠程教育雜志,2022,40(4):35-44.
[32] 尤佳鑫,孫眾等.數字教材的技術接受度與教師TPACK能力的相關分 析——基于結構方程模型的實證研究[J].電化教育研究,2014,35(11):102- 108.
[33] 劉東亮,閆玥蓉.大數據分析中的相關性和因果關系[J].國家檢察官學院學報,2023,31(2):23-41.
[34] 張振虹,劉文等.學習儀表盤:大數據時代的新型學習支持工具[J].現代遠程教育研究,2014,(3):100-107.
[35] Sedrakyan G,Malmberg J,et al.Linking learning behavior analytics and learning science concepts:Designing a learning analytics dashboard for feedback to support learning regulation [J].Computers in Human Behavior,2020,107:1-15.
[36] 武法提,高姝睿等.人機智能協同的精準學習干預:動因、模型與路向[J].電化教育研究,2022,43(4):70-76.
[37] Van Merri nboer J J G,Kester L,et al.Teaching Complex Rather than Simple Tasks:Balancing Intrinsic and Germane Load to Enhance Transfer of Learning [J].Applied Cognitive Psychology,2006,20(3):343-352.
[38] 車敬上,孫海龍等.為什么信息超載損害決策 基于有限認知資源的解釋[J].心理科學進展,2019,27(10):1758-1768.
[40] Kirschner P A.Cognitive Load Theory:Implications of Cognitive Load Theory on the Design of Learning [J].Learning and Instruction,2002,12(1):1-10.
[41] Wolpert L.Cognition:evolution does help to explain how minds work [J]. Nature,2009,459(7246):506.
[42] Kim J,Jo I-H.Feasibility and Use of Psychophysiological Responses Based on Cognitive Load Theory [J].Australasian Journal of Educational Technology,2019,35(3):1-16.
[43] Boucsein W.Electrodermal Activity (Second Edition) [M].New York:Springer,2012.
[44] Hilbert T S,Renkl A.Learning How to Use a Computer-Based ConceptMapping Tool:Self-Explaining Examples Helps [J].Computers in Human Behavior,2009,25(2):267-274.
[45] Saaty T L.The analytic hierarchy and analytic network processes for the measurement of intangible criteria and for decision-making [M].New York,Springer,2016.363-419.
[46] 韓穎,董玉琦等.學習分析中情緒的生理數據表征——皮膚電反應的應用前瞻[J].現代教育技術,2018,28(10):12—19.
[47] Bangor A,Kortum P,et al.Determining what individual SUS scores mean:Adding an adjective rating scale [J].Journal of usability studies,2009,4(3):114-123.
[48] 肖睿,肖海明,尚俊杰.人工智能與教育變革:前景、困難和策略[J].中國電化教育,2020,(4):75-86.
[49] 鄭婭峰,趙亞寧等.教育大數據可視化研究綜述[J].計算機科學與探索,2021,15(3):403-422.
作者簡介:
武法提:教授,博士,博士生導師,研究方向為智能學習系統、教育數據挖掘與學習分析。
任偉祎:碩士,研究方向為多模態學習分析。
Analysis of Learning Situation Based on Cognitive Load Level: Representation Framework and Practical Path
Wu Fati1, Ren Weiyi2
1.Engineering Research Center of Digital Learning and Educational Public Service, Ministry of Education, Beijing Normal University, Beijing 100875 2.School of Educational Technology, Faculty of Education, Beijing Normal University, Beijing 100875
Abstract: Under the background of digital education transformation, learning situation analysis, as an important means of helping teachers understand the learning process of students based on educational big data analysis and diagnostic results, is a necessary prerequisite for carrying out precise teaching. Cognitive load level has always been an important indicator for measuring personalized learning needs and deep learning occurrence of learners. In order to assist learners in adjusting their cognitive load levels during the learning process and effectively investing cognitive resources into higher-order problem-solving processes, this article outlines the general process of learning situation analysis and constructs a learner learning situation analysis framework based on cognitive load levels, which includes three levels: data collection, load identification, and analysis intervention. Subsequently, the article collected multimodal physiological data from 300 students who completed online tests using a portable wristband, and applied feature engineering methods to construct a cognitive load level recognition model. The study status was interpreted by integrating cognitive load levels and learning performance, and a learning analysis dashboard was designed to present the results of the study analysis and intervention suggestions. The article constructs a learning situation analysis framework from the perspective of cognitive load and verifies its feasibility through empirical research, in order to provide reference for research and teaching practice related to cognitive load.
Keywords: cognitive load; learning situation analysis; multimodal learning analysis; intervention design
責任編輯:李雅瑄