單美賢,上官晨雨
(南京郵電大學教育科學與技術學院,江蘇 南京 210023)
近年來在人工智能快速發展的影響下,探討如何利用信息技術支持協作學習(Computer Supported Collaborative Learning,CSCL)已成為信息科學和學習科學交叉融合的重要研究領域。CSCL 研究領域認為協作的成功取決于建設性、富有成效的社交互動。Adeniran[1]認為情感會影響協作學習環境中的個人績效與團隊互動,在線協作學習環境需要激活個體和團隊成員的情感調節,增強協作團體內部的互動與溝通。因此,幫助學習者理解協作學習過程中自身和同伴的情感狀態,并給予情感反饋,有助于增強協作團體內部互動與溝通,推動協作知識的建構。
目前CSCL 系統設計的情感反饋研究停留在通過情感可視化方式幫助學習者了解合作過程中的情感狀態,或通過情感代理提供激勵信息反應困惑、沮喪等負面情感[2],如何反應協作學習環境中學習者豐富的情感狀態,并自動作出最佳反應仍鮮有研究。本文通過分析CSCL 環境中情感反饋框架系統的構成和關鍵技術,為計算機支持協作學習中的情感反饋研究提供清晰的研究線索與方向,為學習者提供有效的情感反饋支持。
協作學習的情感交互過程是不可見的。在傳統的面對面協作學習環境中,小組成員可通過表情、語言、姿勢等方面直觀、及時地察覺協作同伴的情感狀態,并實時調整協作任務空間的認知活動和關系空間的社交情感狀態,協調團隊成員之間的關系,提高團隊凝聚力,保持良好的協作關系。對于CSCL 系統而言,亟需嵌入情感狀態檢測與分析,以“看到”協作學習過程中情感交互的復雜現象,從而幫助學習者了解協作學習過程中自身與小組成員的情感狀態,提高情感調節能力,為學習者提供有效的情感反饋,使其處于最佳情感狀態,進而改善協作者之間的社交互動。
CSCL 學習系統中關于情感反饋的設計,首先需要實時檢測協作學習過程中學習者的情感狀態,然后對情感狀態進行分析,選擇適當的反饋策略反應學習者的情感狀態,提供情感反饋,使學習者以最佳狀態投入在線學習中?;谇楦星度霑挻恚‥motional Embodied Conversational Agents,EECA)系統框架[3]和學習伴侶系統[4]設計了CSCL的情感反饋系統框架。如圖1 所示,框架主要包括3 個組成部分:情感狀態獲取、情感狀態分析及情感反饋處理。

Fig.1 The framework of affective feedback in CSCL圖1 CSCL 的情感反饋系統框架
(1)情感狀態獲取基于多種特征識別用戶的情感狀態,包括面部表情、身體姿勢、文本輸入、行為模式、生理參數等。大多數情況下,CSCL 系統通常只依靠文本輸入和行為模式,很少依賴聲音通道。由于面部表情是情感信息的基本載體,隨著技術的發展CSCL 系統可通過圖像采集、面部跟蹤等技術捕獲面部表情,并結合情感識別解決方案和情感表示模型,生成有效的解決方案。
(2)情感狀態分析,即分析和診斷感知的學習者情緒狀態。目的是理解CSCL 環境中學習者的情感狀態(比如滿意、自信、困惑、沮喪等),然后解釋情感狀態,確定導致該情感狀態的原因(比如練習的成功或失敗、任務的難度、知識的缺失等)。這一模塊主要基于文本情感分析、交互行為分析、情感可視化分析等技術實現。
(3)情感反饋處理是情感反饋框架系統的行動層,根據情感反饋推理規則,推理分析協作學習情境中學習者的情感狀態和學習狀態,根據協作學習情境實例化反饋決策網絡的認知和情感狀態節點,得到相應場景所需的情感和認知反饋策略組合,最后選擇最優的反饋策略組合。行動層將預先定義所有必要的任務,這些任務會依據協作學習過程中的情感狀態,借助情感反饋處理機制,使學習者能夠高效汲取知識并保持有效的協作學習狀態。
總體上,CSCL 情感狀態的檢測與分析最具挑戰性,因為情感模糊邊界使得情感狀態無法被直接測量。一方面,人類情感的表達和體驗過程具有顯著的個體差異性,另外情感感知的涉身性也是一個復雜問題,如何利用情感計算技術客觀、科學地采集情感信息是目前的主要研究難點;另一方面,團隊層面的情感不同于個體,學習者在協作互動中呈現的情感表現和波動更為豐富,情感特征更多樣化,個體情感與團隊情感相互作用對情感狀態的檢測和分析造成了困難,這些都是CSCL 研究領域中的核心問題。
其次是情感反饋與干預,Santos[5]分析了26 個使用情感計算的在線學習系統,發現這些系統未能提供情感干預。因為,自動對學習者的情感狀態作出最佳反應是一項艱巨的任務,個人的認知和情感之間存在著相互影響的復雜關系,如何將情感模型與基于情感計算技術的情感反饋機制相互結合,解決“什么時候應該提供情感支持、情感支持應該包含哪些內容、如何提供情感支持”是CSCL 情感反饋研究最終需要解決的核心問題。
情感識別是情感計算的重點研究方向,現已在面部表情、姿勢、聲音等方面取得了重大進展。在情感計算研究中,情感模型可分為“離散情感分類體系”和“連續維度方法”;數據模態可以分為單模態和多模態,多模態融合提高了情感識別的魯棒性和準確性;根據用戶目標數量可將情感識別分為個體或群體情感識別。
現有情感表示模型主要有2 種:
(1)離散情感分類體系。代表人物:保羅·艾克曼(Paul Ekman)、勒奈·笛卡爾(Rene Descartes)和斯爾萬·湯姆金(Silvan Tomkins)。該體系認為情感是離散的、具體的實體或類別,在生物學上是固定、共有的基本情感,包括生氣、厭惡、害怕、高興、傷心、驚訝等[6]。這些基本情感能引發更復雜的情感,如內疚、驕傲、羞愧等,且每類情感都存在閾值,當情感強度超過該閾值時,才會對一些外在行為起作用。盡管艾克曼的六種基本情感模型最初并不是為情感識別而提出,但它卻是在線學習情感感知解決方案所最為常用的模型。此外,由于在線學習環境中情感識別解決方案更復雜,因此常使用自己的離散標簽集解決實際問題[7]。
(2)維度分類體系。代表人物:威廉·馮特(Wilhelm Wundt)、詹姆斯·拉塞爾(James Russell)和麗莎·巴雷特(Lisa Feldman Barrett)。該體系認為情感并非個人或具有特定范疇,而是不同心理維度的組合體。情感反應有2 個維度:效價維度和喚醒/激勵維度。維度模型將情感狀態表示為多維空間的一個點,使用二維空間的情感坐標表示個體情感。在此基礎上,Mehrabian[8]提出了PAD 三維情感模型,認為情感具有愉悅度、激活度和優勢度3 個維度,PAD模型可以解釋42 種情感量表中的絕大部分內容,而且這3個維度并不限于描述情感的主觀體驗,它與情感的外部表現、生理喚醒之間存在映射關系。
在梳理代表性情感模型時不難發現,神經生理學是理解情感的基礎。然而,僅憑其不足以理解情感,還需結合專注認知心理學方面。Lazarus 的“認知—評價理論”認為情感是人與環境相互作用的產物,認知是情感的必要元素,強調認知評價在確定刺激意義及其應對方式中的重要性。1970 年以來,為了確定隱含在情感中的認知評價標準,開展了大量研究工作[9]。其中最著名的是OCC 模型[10],OCC 模型描述了22 種情感類型的認知結構。與離散情感模型或維度情感模型相比,OCC 模型考慮了情感產生的過程。由此概念衍生出如Picard 根據隱馬爾可夫模型提出的HMM 情感模型[11]、Kesteren 等[12]針對外界刺激建立了一種分布式情感模型。
考慮到CSCL 協作交互中情感分析對情感量化有著更高要求,目前艾克曼的六種基本情感模型和OCC 模型在表示復雜情感狀態方面依然存在一定的局限性。本文擬采用基于維度理論的PAD 模型進行連續情感狀態識別,并借助模糊邏輯推理和專家規則,對協作交互過程中主體及主體間的情感狀態進行科學合理的建模與計算。
學習者的情感狀態可通過多種不同方法獲取,如分析生理信號、臉部表情、姿態行為等后進行提取,或采用情感認知模型進行推理?;诓煌B的情感識別方法如表1所示。
多模態的情感計算主要有2 個步驟:①基于單模態的數據處理與情感計算;②進行多模態融合。多模態情感信息融合包括特征級融合與決策級融合2 種方式:①特征級融合首先對來自傳感器的原始信息進行特征提取,然后對特征信息進行綜合分析和處理;②決策級融合必須從問題的需求出發,充分利用特征級融合提取的測量對象的各類特征信息,采用適合的融合技術實現,通常采用的方法包括貝葉斯推理、Dempster-Shafer 證據理論等[13]。

Table 1 Emotion recognition methods under different model conditions表1 不同單模態條件下的情感識別方法
CSCL 系統中學習者情感狀態信息的獲取方法主要有:
(1)心理學工具——自我報告。該方法成本較低,可直接獲取用戶的主觀感受。①口頭自我報告:受試者使用預定義的開放式問題和量表,口頭表達自身情緒。另外,為了便于受試者表達情感狀態,還增加了訪談和日志的采集方式。如學業情感問卷、語義差異量表、情感風格、Geneva 情感環等;②非語言自我報告:包括不引人注意的、與語言無關的工具,如SAM、PrEmo 等[19]。相對于口頭自我報告而言,因為不受詞匯量的限制,主觀因素影響較小,但可評估的情緒范圍有限。
(2)生理學工具——利用生理傳感器測量生理信號。生理信號大多基于腦、心臟、肌肉和皮膚產生的信號,與面部表情、手勢、語言等方面信息的來源相比,生理信號是自發的,不存在欺騙性。另外,它可在任務的執行的過程中連續測量用戶的情感狀態。但該方法存在的缺陷在于:生理傳感器是外在的,可能會影響用戶的體驗。
(3)運動行為方法——通過測量運動行為和身體的變化反應人的情感體驗。該方法是評估日常生活中每個人情感狀態的常用技術。通過借助特殊軟件,使用PC 攝像頭、麥克風、鼠標鍵盤等傳統設備測量用戶的情感狀態,該方法可收集自我報告或生理信號無法采集的情緒線索,但要求分析人員具有一定的操作經驗。
情感信號的采集過程中,由于會使用到昂貴的傳感器和復雜的計算機智能設備,因此要求研究人員具有專業知識。測試過程中外在傳感器可能會影響用戶體驗,但如果使用單一、主觀的自我報告方式,則無法有效識別情感狀態。為此,情感信號檢測系統需要注意以下3 個方面:①客觀性,生理信號比自我報告更客觀;②侵入及干擾性,用于記錄面部表情的網絡攝像頭、測量鍵盤壓力、日志文件的鼠標點擊量等標準個人電腦設備不存在干擾性,而使用如專業相機或人工實驗室等額外設備、問卷式自我報告則存在一定的干擾;③任務相關性,測量應與用戶的實時任務并行進行。表2 羅列了一些情感輔助系統中用于識別情感的方法。

Table 2 Methods for recognizing emotion in affective tutoring system表2 情感輔助系統中用于識別情感的方法
一般情況下,CSCL 研究者常使用多模態整合方法,如通過生理信號、日志文件、眼動追蹤、面部表情等進行特征提取。然而,多通道跟蹤和分析方法仍然存在一些問題,包括多通道數據時間對齊問題(如對人工agent 提示和腳手架情感反應、外部調節對學習者認知和情感過程監控的影響等)、確定哪些多渠道數據應該作為數據分析的基礎等。
CSCL 團隊情感狀態由個體情感狀態和多模態情感特征組成,其中個體情感狀態在PAD 情感模型中用三個屬性即愉悅度P、喚醒度A 和控制感D 表示,每個屬性再設置5個標度。為了實現PAD 情感空間坐標到團隊情感模型三維空間的映射推理,需要將PAD 情感空間坐標值的取值范圍歸一化。計算公式如式(1)所示。

其中,E是情感狀態;epleasure,earousal,edominance分別是愉悅度、喚醒度和控制感在坐標軸的值,取值范圍為-1~+1。
CSCL 團隊情感狀態模型中,采用模糊推理結合專家規則實現個體情感狀態到團隊情感狀態的映射推理。首先,通過多模態情感識別和情感融合得到每個協作者的情感狀態,并將其映射到PAD 模型空間中;然后采用專家規則和模糊推理方法建立個體PAD 情感模型和團隊情感狀態模型之間的對應關系;最后融合CSCL 協作團隊中所有成員個體情感狀態。具體過程如圖2 所示。
CSCL 團隊情感狀態是一個連續變量,在時刻t時情感狀態的變化不僅與t-1 時刻的狀態相關,還與協作者的當前情感狀態有關。故團隊情感狀態的計算公式如式(2)所示。

其中,f為所有個體情感狀態Ei在時間t的函數;n為協作者個體的數量;λ為相關系數,取值范圍為0≤λ≤1。
團隊情感狀態有三個屬性,分別為活躍度activity、友好度friendly、親和度affinity。集合R是個體情感狀態與團隊情感狀態之間的模糊關系,通過模糊推理得到PAD 個體情感狀態映射到團隊情感狀態三維空間。

Fig.2 Team emotional statement model in CSCL environment圖2 CSCL 環境的團隊情感狀態模型
CSCL 環境的情感狀態分析常采用的技術有文本情感分析、情感可視化分析與情感交互行為分析。文本情感分析是一種相對成熟且容易操作的方法;與圖2 中團隊情感狀態空間的坐標軸相比,情感可視化是一種更易理解和感知的方法;情感交互行為主要研究復雜時空環境與交互式條件下情感隨時間的動態變化規律。
情感識別負責自動識別學生的情感狀態。最理想狀態是以客觀且不干擾用戶的方式連續、定量測量用戶的情感體驗。有研究者指出,檢測文本情感是一種侵入性最小的測量方法,因為語言和文本在傳遞信息的同時也傳遞情感[25],在測量過程中僅對語言和文本進行測量,無需接觸用戶。考慮到CSCL 研究人員很難掌握現有的文本分類技術,且不具備把文本分類技術應用于分析任務的能力,Rosé等[26]開發了一個易于使用的自適應編碼接口——TagHelper,基于菜單自適應界面向分析人員展示自動預測、分析每段文本的結果,幫助CSCL 研究人員分析語料數據內容。Pontarolo 等[27]基于認知方法提出情感模型,該模型把情感視為參與者對情境認知、評估后產生的感知,并把同伴行為作為情境信息來源。然后,根據OCC 模型的歸因情緒組推斷四種同伴關系的情感。在此基礎上,借助貝葉斯網絡建模技術,將學生的人格特質、目標、行為標準、互動和情感之間的因果關系進行映射。
將情感識別階段獲取的數據進行分析處理,然后通過圖、表等工具進行呈現。在很多場景下,如果可以“看見”自身與他人的情感,則可增強用戶之間的交互體驗,使人們可以直觀地了解互動過程的情感,進而作出更好的決策。在協作環境中對情感狀態意識進行反思非常重要,因為團隊自我意識是團隊能力的關鍵部分,有助于提高團隊效能[28]。此外,團隊內部情感狀態的認知與改善溝通、決策和緩解團隊沖突密切相關,能夠提供豐富的環境信息支持協作學習。由此可見,CSCL 環境中的情感可視化信息,一方面可以激勵個體根據團隊協作情況調整自身狀態;另一方面,如果協作過程中能安慰對方并解釋為什么認為是在正確的方向上解決問題,則有助于緩解學生的畏難情緒。
情感可視化研究主要為:
(1)McDuff 等[29]設計了一個支持情感自我意識的可視化工具——AffectAura。Kao 等[30]創建了一種獨立于情感獲取技術的情感表示方法——情感打?。‥motion-Prints),該方法能用于多點觸控系統環境中顯示用戶情緒效價和喚醒度。此外,該方法支持與任何實時解釋情感狀態方法相互結合使用。情感打印的目標是提供一種標準化技術,實現在互動發生時呈現用戶的情感狀態,以增強協作環境中用戶對自身情感的感知,并通過情感可視化方式提升用戶體驗。
(2)Borth 等[31]根據Plutchik 情感輪提出視覺情感分析框架模型SentiBank:首先對普魯奇克理論中每種情感進行數據挖掘找到相關標簽,然后使用文本分析和基于詞法情感分析工具查找“極化的”形容詞,最后使用情感輪、樹狀圖等可視化工具沿高維情感概念空間對數據集進行交互式探索,并對視覺內容中的情感進行預測。
(3)通過顏色、幾何形狀和長度分別表示圖2 中團隊情感狀態三維空間模型中活躍度、友好度和親和度這三個屬性。圖3 為通過顏色表示團隊情感狀態的活躍度。

Fig.3 The color axis of the activeness of the team's emotional statement圖3 團隊情感狀態的活躍度顏色坐標軸
當前CSCL 交互分析主要集中在認知過程的知識建構維度,通過構建合適的交互過程模型開展認知交互行為分析。相關研究主要分為基于變量或基于事件的過程模型,基于變量的過程模型常用技術有:回歸分析、序列分析法、凝聚子群分析等,通過計算交互行為相關屬性之間的比率構建矩陣或概率圖,抽象展示協作學習過程特征或學習輸出狀態;基于事件過程模型常采用的技術有:隱馬爾科夫鏈、樸素貝葉斯分類、序列模式挖掘算法等,通過借助計算機龐大的數據處理能力實現交互行為模式的抽取與識別。
CSCL 交互分析在歸納、總結認知交互行為、協作學習進程或協作組實施效能之間關聯規律的同時,需要開展情感交互行為分析研究,因為情感交互活動不僅影響著小組成員的積極性和主動性,還影響協作過程中認知交互活動的進程。情感交互行為研究復雜時空環境與交互式條件下情感隨時間動態變化的規律,這種情感時空特征一般具有2 種基本特征:①情感本身所具有的時序演化特征,反映情感的內在變化規律;②用于情感分析的言語、面部表情、生理特征等因素在動態交互過程的時序特征,反映情感外在觀測因素的變化規律。情感作為連接學習者內部心理狀態與外部環境狀態的橋梁,影響著協作學習的全過程。因此,如何在特定的CSCL 時空環境約束下有效融合多種方法挖掘、分析協作過程中學習者的情感交互行為模式和變化趨勢是亟須解決的關鍵問題。
目前CSCL 環境中的情感交互分析研究常采用的方法為基于時空條件下的情感交互計算。首先,使用貝葉斯網絡根據圖2 的情感模型對檢測的個體情感狀態和團隊情感狀態進行分類,構建多模態情感交互行為數據集;然后,針對協作學習過程中的交互行為序列、文本內容、面部表情等過程性數據,采用長短期記憶網絡(Long Short-Term Memory,LSTM)對實際協作學習場景中的個體情感狀態特征數據和團隊情感狀態進行時序建模,實時判斷和預測學習者當前的情感交互行為特征以及變化趨勢,提升情感預測的準確率。具體過程如圖4 所示。
目的在于修改學習者的下一步行動,減少當前理解與期望之間的差距,本文基于情感認知評價理論的相關計算模型[32],提出了如圖5 所示的情感推理模型。
4.1.1 認知網絡
情感評估不是獨立的,需高度依賴認知信息,旨在模擬前額葉皮層中的執行功能。認知網絡被設計為基于Q 學習的認知架構,稱為時差融合結構(TD-FALCON)。其中,TD-FALCON 是自組織的神經網絡,使用時序差分算法估計和學習Q(s,a)函數的值,即給定當前狀態s,認知網絡基于特定策略選擇將要執行的動作a,在執行動作后,可獲得獎勵。然后,認知網絡將觀察下一個狀態s’,并預先選擇具有最大Q(s’,a’)值的動作a’。

Fig.4 LSTM network analyzing the emotional state in collaboration interaction圖4 LSTM 網絡分析同伴協作互動中的情感狀態
4.1.2 評價層
提供從認知空間到情感空間的信息單向轉換,包括4個評估因素:
(1)期望E 是情感評估的關鍵,代表人們在特定環境中采取行動時最可能發生的事情。一般認為,隨著對積極結果或消極回避的期望增加,情緒強度也會增加。因此,期望應該與情境、行動相關聯,并且必須基于學習者的個人體驗。期望是根據上下文(包括學習者的體驗和當前表現)動態評估的,本文對期望定義如式(3)所示。

其中,Q(s,a)是基于Q學習算法計算在狀態s下采取行動a的預期獎勵。

Fig.5 Emotional reasoning model圖5 情感推理模型
(2)獎勵R 是指從環境或行為過程中感知的反饋刺激。通常,獎勵在采取行動后發生,被認為是認知學習和情感過程中不可或缺的組成部分。最近研究證明,杏仁核是人腦情感的核心區域,它起到調節獎勵的喚醒作用,并聯系獎勵的感官特性與情感。獎勵信號由環境提供的實時反饋If所感測,即R=If。
(3)力量P 是指個人信心的內在狀態,被描述為對實現目標充滿信心的狀態。力量是建立在自身經驗的基礎上,并受感知反饋和先前力量水平影響。因此,根據反饋信息和當前自信心水平,通過時序差分方程式實時更新P。計算方式如式(4)所示。

其中,參數α∈[0,1]和γ∈[0,1]分別是衰減指數和增益指數。
(4)匹配M 用于衡量期望值與實際反饋信息之間的差異,說明結果滿足期望的程度。為此,根據上下文的性能和感知反饋計算匹配度,評估該動作滿足期望的程度。并通過式(5)進行實時更新。

4.1.3 情感網絡
旨在模擬杏仁核的情感決策,與評價層共同構成情感評估網絡。計算方式如式(6)所示。

4.2.1 模糊邏輯系統
模糊邏輯系統為CSCL 系統處理學生各種認知和情感狀態的行為方式,模糊系統處理情感值來源于神經網絡識別的學生情感狀態。例如在Java Sensie 系統中[33],首先從語料庫的面部圖像中提取特征訓練神經網絡;接下來,使用神經網絡實現情感分類。本文使用RAFD 語料庫的數據訓練和測試神經網絡,該數據庫具有8 040 種不同表情的數據庫,包含了67 種男女模型。神經網絡提取學生的情感狀態后,立即將結果發送至模糊系統。然后將特征提取、情感識別與模糊系統相互集成。Java Sensie 系統使用了4個模糊輸入以及3 個輸出,并使用模糊控制語言建立了144條模糊規則。模糊系統從反向傳播神經網絡中獲取學生當前的情感狀態,通過模糊算法計算反饋策略,再將反饋策略發送至教學代理起到調節學生情緒的作用。
4.2.2 線性回歸模型
多用于CSCL 系統中學生的情感預測。通過大量的數據集線性回歸學生在每個任務的情感狀態,并以此模型檢測學生在后續任務中的情感狀態。Rajendran 等[34]將線性回歸模型用于檢測沮喪模型中,對挫折特征形成新的線性回歸模型。該模型在檢測學習者交互過程的挫折感時,首先確定學習者與系統互動的目標,確定每個目標的阻塞因子,基于目標阻塞行為,用前i-1 個狀態進行線性回歸,建立學生在第i 個狀態的挫折指數線性回歸模型。挫折指數閾值用于檢測學生是否感到沮喪,若感到沮喪則作出反饋。
4.2.3 效用最優情感反饋策略決策算法
該算法使用貝葉斯決策技術選擇效用最優的反饋策略組合,如圖6 所示。首先根據協作學習情境實例化反饋決策網絡中的認知和情感狀態節點,并根據協作學習情境中的情感交互行為規律輸入決策網絡,然后按時間順序依次實例化決策變量,計算條件期望效用值,當遍歷完各認知反饋和情感反饋組合后,得到最大條件期望效用值所對應的認知和情感反饋策略組合即為最優解。

Fig.6 Affective and cognitive feedback decision model description圖6 情感和認知反饋決策模型描述
Lazarus[35]認為有2 種策略可用于管理個體的情感狀態:以問題為中心和以情感為中心的策略。
(1)傳統的情感框架通常采用以問題為中心的策略。該策略基于學習者任務反饋,學習者情感通常在學習過程中產生,根據情感狀態為其提供適當的建議和策略,有助于提高學習效率。Cabestrero 等[36]認為基于任務反饋保持適當的水平是至關重要的,因為任務難度水平過高會導致學習者產生焦慮,而任務難度太低則無法激起學習者的興趣。因此,基于相關領域的情感反饋需要動態調整任務的難易程度,使每個學習者都能產生更高層次的情感價態。
(2)以情感為中心的策略是指與課程領域無關的策略和技術。CSCL 系統的領域無關情感反饋策略基于學習者情感的反饋,即情感反饋系統檢測到學習者情感狀態后,直接給予學習者鼓勵、祝賀或積極的情緒提升學習者的學習動力,從而使學習者處于更適宜的情感狀態中完成學習任務。
Arevalillo-Herraˊez 等[37]使 用PAD 模 型 從 三 個 獨 立 的兩極維度描述情感,每個維度都通過SAM(Self Assessment Manikin)進行評估,旨在根據與學習者情感相關的兩個特定意圖選擇最佳的腳手架水平,進而在每次需要系統干預時觸發指導性決策。通過分析訓練數據證明,快樂度和支配水平取決于解決問題時提供的腳手架水平,可通過學習主題背景信息和學習者試圖解決的問題預測愉悅度和支配度變化。
Wang 等[38]把POMDP(Partially Observable Markov Decision Process)模型中用戶的狀態空間分為認知狀態(目標狀態Su與對話狀態Du)和情感狀態Eu,即S=(Su,Du,Eu);系統的動作空間A =(As,Ae),如圖7 所示。
其中,As是目標響應,具體表示檢查學習者是否理解概念、向學習者解釋概念、判斷學習者的答案是否正確;Ae是情感響應,例如贊美、鼓勵、引導、同理心等。
用戶的狀態轉移函數表示在給定狀態s和動作a的條件下轉換為狀態s'的轉換概率。計算公式如式(7)所示:

獎勵值函數計算公式如式(8):

其中,R(su,du,as),R(eu,ae)是行動目標響應和情感響應的獎勵;ws,we是權重系數,ws+we=1。

Fig.7 POMDP model(the circle in the dashed frame represents the state that is not observed,the circle in the solid frame represents the observation result,the square represents the action node,and the diamond represents the reward node)圖7 POMDP 模型
綜上,目前情感反饋研究大多以個體學習者為研究對象,采用情感計算技術實現:①借助機器學習或深度學習技術,構建基于深度神經網絡的情感反饋策略模型,開發的情感反饋系統直接映射學生的人格特性、目標、行為標準、互動和情感之間的因果關系,并據此推斷情感包含的內容;②采取反饋回路方式:計算機將測得的感知數據映射為情感變量,然后根據識別的情感持續調整用戶行為。在情感反饋回路中目前使用的主要方法為監督機器學習,將記錄數據分類為一組離散類別,然后根據類別執行特定的命令。此外,本研究團隊提出的ATS 系統的情感反饋實施規則同樣適用于CSCL 系統,如表3 所示。

Table 3 Affective feedback implementation rules表3 情感反饋實施規則
注:目標是保持高的效價V(為學習者提供支持和積極的體驗)、防止喚醒度A 過高或過低(A 過高->焦慮,A 過低->無聊),并為學習者提供一種控制任務的控制感(P)。E(投入參與水平)由V、A 和P 推斷得出(2:高投入,1:一般投入,0:不投入)。IA(指示性操作):增加或降低下一個問題的難度級別。情感反饋規則如下:1-當情感狀態為中性,不采取措施;2-當學習表現不佳,則觸發“提供調節和幫助”;3-當檢測到負面效價,則觸發情感支持;4-當檢測到高激活狀態,則給予激勵響應。
本文從情感狀態獲取、情感狀態分析和情感反饋處理這三個方面分析了CSCL 環境的情感反饋系統框架:首先從情感狀態的表征入手,分析CSCL 中使用多模態情感識別技術的要點;然后介紹了情感狀態分析的關鍵技術,主要包括基于文本的情感分析、情感可視化分析、交互行為分析;最后從情感反饋推理模型、情感反饋策略生成算法和情感反饋策略深入介紹了目前的研究進展,以期為本領域的研究梳理一個相對清晰的整體研究框架視。在認知科學與腦科學的研究基礎上,隨著深度學習、情感技術等新技術、新方法在學習科學中應用研究的深入,將會進一步推動CSCL 情感反饋研究的理論發展和實踐應用,最具突破性的研究工作主要體現為以下4 個方面:
(1)研究CSCL 環境的情感協作學習本體,以描述計算機支持協作學習過程中團隊情感的形成及演化特征,形式化描述CSCL 環境中與學習者情感相關要素。
(2)在腦科學與情感計算的研究基礎上,通過多模態情感感知方式獲取CSCL 環境中學習者的情感狀態數據,并通過情感交互行為分析,深入解釋協作學習過程中學習者情感狀態的產生與變化原因。
(3)研究基于深度神經網絡的情感反饋策略生成算法,解決計算機支持協作學習環境中由“情感觸發”引起的情感理解和情感反饋策略的生成問題。
(4)加強技術支持下情感反饋對在線協作學習和學生發展重要性的認識,重視協作學習環境中反饋機制的研究,設計融情感、認知、行為等綜合一體的、人機協同互惠的雙向反饋模型及系統實現。