999精品在线视频,手机成人午夜在线视频,久久不卡国产精品无码,中日无码在线观看,成人av手机在线观看,日韩精品亚洲一区中文字幕,亚洲av无码人妻,四虎国产在线观看 ?

面向智能教育的自適應學習關鍵技術與應用

2021-11-30 05:18:42陳恩紅劉淇王士進黃振亞蘇喻丁鵬馬建輝竺博
智能系統學報 2021年5期
關鍵詞:教學資源智能教育

陳恩紅,劉淇,王士進,黃振亞,蘇喻,,丁鵬,馬建輝,竺博

(1. 中國科學技術大學 計算機科學與技術學院 大數據分析與應用安徽省重點實驗室,安徽 合肥 230027; 2. 科大訊飛股份有限公司,安徽 合肥 230088)

黨的十九大報告中,習近平總書記將“科教興國”確定為決勝全面建成小康社會需要堅定實施的七大戰略之一,并指出“建設教育強國是中華民族偉大復興的基礎工程”。發展能夠融合大數據和人工智能技術的智能教育則是建設教育強國的必由之路[1]。作為智能教育的核心,自適應學習旨在根據學習者個體的認知水平、學習能力等,動態調整相適應的教學資源與學習方式,提升學習者的學習效率,使其獲得最佳發展。早在春秋末期,我國古代著名教育家孔子就開創了“因材施教,有教無類”的全新教育理念。這一理念也是自適應學習思想的開端,即使在兩千余年后的今天依然指導著教育現代化發展的方向。遵循這一思想,聯合國教科文組織在《教育2030行動綱領》中將教育質量的提升作為未來十幾年內全世界教育改革發展的關鍵之一。與此同時,我國各級政府與教育主管部門也制定了多項教育政策來促進智能教育和自適應學習的發展。2019年,中共中央、國務院印發《中國教育現代化2035》,指出“利用現代技術加快推動人才培養模式改革,實現規模化教育與個性化培養的有機結合”。同時印發的《加快推進教育現代化實施方案(2018-2022年)》則具體指出“促進信息技術與教育教學深度融合,加快推進智慧教育創新發展”。

在傳統的課堂教學模式下,由于時間和空間的限制,教師無法為每一個學生都制定自適應的學習方案。近年來,伴隨著教育現代化程度的不斷加深,互聯網技術涌入到了教育教學的各個環節當中,新興的在線學習模式方興未艾[2],國內外涌現出一系列優秀的在線學習系統,例如:Coursera、智學網、學堂在線等。特別地,在2020年初,受新型冠狀病毒引發的肺炎疫情影響,約2.5億學生利用網絡、電視等在線工具學習知識,在線教育平臺保障了正常的教育學習秩序。目前,我國在線教育用戶規模已達4.23億,規模空前[3]。在線教育模式已經成為了教育現代化的重要組成部分,它突破了傳統課堂教學中的時空約束限制,實現了優質教學資源共享,使得融合大數據和人工智能等先進技術來促進智能教育的發展成為了可能。

智能教育的核心之一是自適應學習,它以數據為基礎,利用相關理論與方法,旨在實現更加精準、規?;囊虿氖┙痰慕逃繕?。盡管在線教育模式為真正實現自適應學習帶來了新的機遇,但其市場高度自由和開放的特點還無法滿足智能教育的要求[4]。一方面,盡管在線教育平臺提供了開放共享、頗具規模的教學資源,但這些資源大多缺乏有效標記,使得自適應學習面臨教學資源表示困難的技術難題[5-7]。另一方面,由于學習者的學習狀態隱蔽易變,如何精準地診斷每一個學習者的認知狀態是又一技術難題。此外,學習目標的復雜多樣性也對自適應學習的學習策略設計造成了很大的困難。因此,研究自適應學習關鍵技術具有重要意義。

1 本文研究介紹

總結起來,自適應學習的關鍵是要解決教學過程中教學資源的理解難、學習者知識的診斷難、學習策略的設計難等三大難題。針對上述關鍵技術難題,本文成果構建了教學資源表示新框架,提出了學習者認知診斷新方法,設計了自適應推薦新技術,研發了面向基礎教育的智能教育系統?智學網,已在全國推廣使用,對我國智能教育發展具有積極意義。本文成果的研究應用方案如圖1所示。具體來說,針對智能教育涉及的3類主要對象,即教學資源、學習者和學習策略,本文成果分別提出系列模型算法以解決現有分析技術面臨的困難。首先,針對海量教學資源多源異構、語義豐富、標記缺失等特點導致的教學資源理解難題,本文成果構建了一種數據驅動的教學資源無監督表示新框架,提出“深度表征?精準評估?高效檢索”的教學資源表示和應用新模式,揭示教學資源與知識空間的深層關系,解決專家評估操作低效、主觀有偏的問題,提高了教學資源質量評估和內容檢索的精度和效率。其次,針對學習者學習活動自由、狀態隱蔽易變等特點帶來的學習狀態診斷難題,本文成果提出一系列基于深度學習的學習者認知診斷新方法,通過直接挖掘學習者的作答表現,闡明了“學習者?知識/興趣?資源”的高階交互和潛在關聯,突破以量表為基礎的教育測量理論研究范式,增強學習者認知建模的可解釋性。最后,針對自適應學習推薦任務中場景多樣、目標復雜等特點導致的學習策略設計困難,基于上述建立的教學資源表示框架和提出的學習者認知診斷方法,本文成果設計了基于知識匹配的個性化推薦新技術以及多目標匹配的自適應推薦新技術,分別解決了在靜態學習場景和交互式學習場景中,如何將教學資源質量與學習者認知狀態進行智能匹配的難題。進一步,本文成果集成上述關鍵技術難題,攻關所研發的創新方法,研發了面向基礎教育的智能教育系統?“智學網”,已在全國推廣使用?!爸菍W網”通過伴隨式地采集日?!敖膛c學”過程性的動態數據,建立了面向中小學的大規模高質量教學資源庫,構建了以學習者為中心的學業評價體系,實現了優質資源精準推薦,提供了智能環境與服務。

圖1 研究總體介紹Fig.1 General introduction of the research

2 教學資源表示新框架

教學資源的理解是發展智能教育系統的基礎。針對海量教學資源多源異構、語義豐富、標記缺失等特點導致的教學資源理解難題,本文成果構建了一種數據驅動的教學資源無監督表示新框架,提出“深度表征?精準評估?高效檢索”的教學資源表示和應用新模式,揭示了教學資源與知識空間的深層關系,解決專家評估操作低效、主觀有偏的問題,顯著提高了教學資源質量評估和內容檢索的精度和效率。

2.1 基于語義理解的教學資源無監督表征框架

教學資源一般由文本、圖像和語音等多種不同類型的數據組成,具有明顯的多源異構特征。此外,教學資源通?;谝欢ǖ慕虒W目的編寫,如用于評估或提高學習者對于特定知識或技能的掌握水平,因此往往蘊含著豐富的語義信息,并且具有更深層次的邏輯知識特征,以數學試題為例,計算題通常與代數知識相關,幾何證明題則更關注幾何知識,而傳統自然語言理解方法難以精準建模這些邏輯特征[8-10]。此外,教學資源的難度、知識點、相似資源等信息的標注對專家的經驗具有較高要求,導致了教學資源的標簽數據有限,標簽缺失現象嚴重,具有明顯的數據稀疏性特征。如何對多源異構、語義豐富且標簽稀疏的教學資源進行充分理解與刻畫,建立統一的數學表征,在教學資源的組織與自動標注、教學資源與學習者學習需求的自適應匹配等實際應用中具有重要價值,是教學資源表示技術研究中亟需解決的關鍵問題。

為解決上所述問題,本文成果提出一種多源異構教學資源的統一表征框架?QuesNet。QuesNet設計了教學試題(一類典型的教學資源)中異構信息的統一表征方法,提出結合低層次語義和高層次邏輯知識的表征方法,利用無監督的預訓練技術實現對海量無標簽教學試題的深度理解和表征[11]。

圖2是QuesNet框架示意[11]。該框架主要由3個部分構成,分別是嵌入層、內容表示層以及語義學習層。具體地,在嵌入層,QuesNet通過不同的嵌入表征模塊將試題(如幾何題)不同類型的輸入信息(文本、圖像以及元信息)映射為等長的數學向量表示,通過映射表將詞映射為嵌入向量,通過卷積和池化層將圖像編碼為數學向量,通過全連接神經網絡將元信息(如章節、知識點等)編碼為特征向量。嵌入層將不同類型的試題內容映射到統一的數學空間,使模型能處理不同類型的輸入。在內容表示層,QuesNet使用雙向長短期記憶網絡(long short-term memory networks,LSTM)建模題目內容局部性特征,捕獲題目的深層次上下文語義信息與內容關聯,生成試題內容的表征序列。最后,在語義學習層,在建模低層次語言特征的基礎上,QuesNet通過多頭自注意力機制聚合試題的表征序列,生成統一的試題向量,挖掘復雜的全局關聯,捕獲資源的高層次邏輯與知識特征。

圖2 QuesNet框架示意Fig.2 Overview of QuesNet framework

QuesNet通過無監督任務在海量無標簽試題數據上預訓練模型。在嵌入層,QuesNet利用Word2Vec工具從數據中生成試題詞嵌入向量的映射表,通過自編碼器的重建損失函數預訓練圖像(如幾何圖形)與元信息如知識點的編碼模型。在內容層,通過掩碼語言模型進行預訓練,隨機掩蓋或替換部分輸入內容,以預測被掩蓋的部分作為預訓練任務,使內容層模型能夠從大量訓練數據中學習建模資源的語言特征。在語義學習層,以與領域特定的邏輯和知識相關的任務進行模型預訓練,在選擇題中,以預測選項是否為問題的正確答案作為預訓練任務,使模型能夠捕獲資源的高層次邏輯與知識特征。本文成果將QuesNet學習試題表征向量應用于如知識點預測、難度預測等多個基于教學資源的應用任務中。特別地,以知識點預測任務為例,如表1所示,QuesNet模型的準確率(ACC)指標較現有預訓練方法相對提升近10%,F1指標較現有方法也有5%以上的提升。

表1 知識點映射任務實驗結果Table 1 Experimental result of knowledge mapping

2.2 數據驅動的教學資源質量精準評估方法

評估教學資源的質量,如試題、課程的難度與知識點,不僅為教學資源的表征方法提供一種有效的驗證方案,也為教學資源的檢索與匹配等相關應用提供了支撐。難度與知識點是試題等教學資源的重要屬性,在資源檢索、測試評估與個性化推薦等應用中具有重要的意義。例如,在線教育平臺中經常會根據學生在練習上的作答情況,檢索具有特定難度與知識點的試題以鞏固或加強訓練。在能力評估測試等允許學生重復參加且選取最高成績的測試中,每一次測試的試題需要具有基本一致的難度,以保證成績的穩定性與公平性[12]。在個性化推薦應用中,難度與知識點屬性具有重要的價值,通常情況下,難度過低或過高的練習都無法使學習者提高知識掌握程度,而知識點屬性不合適的練習無法使學習者進行針對性的提高。因此,難度和知識點等教學資源質量的精準評估是一個具有重要價值的研究課題。

傳統方法通過專家對教學資源(如試題)的質量進行標注。然而,對大量的教學資源進行標注需要花費大量的時間與人力,并且對標注人員的專業經驗具有較高要求,難以通過傳統的眾包等方法進行大范圍推廣。此外,教學資源的質量標準難以通過具體標準準確給出,評估結果依賴專家經驗,由不同專家評估的結果不統一,具有明顯的強主觀性特征。為了解決以上瓶頸問題,本文成果提出一種數據驅動的教學資源質量自動化評估方法,構建了資源屬性預測模型,在知識結構多層依賴關系刻畫的基礎上,準確預測教學資源的屬性特征,形成了高效且有數據依據的資源質量評估新模式。

首先,本文成果針對教學資源的知識點屬性評估任務進行研究。教學資源具有多個知識點標簽,且多個知識點具有層級組織結構,如“代數”、“函數”、“一次函數”。教學資源的多個知識點標簽分布于層級結構的不同層上,不同層間的標簽具有依賴關系。針對這一特征,本文成果提出HARNN(hierarchical attention-based recurrent neural network)框架結合教學資源文本與知識點的層級結構,提出基于層級注意力的循環層以自頂向下的方式建模不同層間的依賴關系,并設計混合方法準確預測各層的標簽,在層級結構上逐層預測與資源最相關的知識點標簽。在試題多標簽知識點預測任務上,HARNN框架的正確率較現有方法具有明顯提高[13]。

在教學試題的難度屬性評估任務中,本文成果針對英語閱讀理解試題提出如圖3所示的TACNN(test-aware attention-based convolutional neural network)框架進行難度評估[14]。TACNN框架能夠結合試題的閱讀材料、問題與選項等不同部分文本的語義進行試題難度預測,并創新性地提出了測試感知的訓練方法以解決不同測試的難度偏差。

圖3 TACNN框架示意Fig.3 Overview of TACNN framework

具體地,TACNN框架主要由輸入層、語句理解層、語義依賴層與預測層4部分構成。輸入層將試題的閱讀材料作為語句序列,問題以及每個選項作為單獨的語句,將每個語句中的單詞映射為固定長度的嵌入向量表示。語句理解層通過卷積層和最大池化層以從局部到全局的方式捕獲每個語句中的關鍵信息,從詞嵌入向量中學習語句表征,將每個語句表示為固定長度的向量。語義依賴層針對閱讀材料中不同語句對問題貢獻不同的特點,通過加權求和的方式聚合語句表示向量,生成閱讀材料和選項的注意力向量表征,以余弦相似度作為閱讀材料和選項中每個句子對問題的重要性的度量。預測層拼接閱讀材料和選項的注意力向量以及問題的向量表征,通過全連接神經網絡學習試題的難度表征并預測問題的難度值。

由于試題難度標簽無法直接獲得,TACNN依據試題的學生作答平均得分作為試題的難度屬性進行模型訓練。由于參與不同測試的學生不同,不同測試的試題難度無法直接比較,但同一測試的試題難度可以直接比較,針對這一問題,TACNN提出測試依賴的損失函數訓練模型,而訓練后的模型僅需要試題的文本信息對試題難度屬性進行評估。在英語閱讀理解試題難度預測任務上,TACNN較現有方法在皮爾遜相關系數指標上平均提升約10%, 如表2[14]所示,與專家評估結果對比,TACNN預測難度的穩定性(平均方差std小)更高。

表2 TACNN與專家結果對比Table 2 Comparison between TACNN and experts

續表2

2.3 大規模教學資源的高效檢索技術

現有在線教育平臺一般具有大量的用戶以及海量的教學資源,不同用戶的學習需求存在巨大的差異,滿足其需求的教學資源也各不相同,因此為了支撐大規模教學資源的智能應用,需要解決“如何精準檢索滿足學習需求的資源”以及“如何從海量資源中高效獲得檢索結果”兩個關鍵問題。

傳統檢索技術僅基于教學資源的文本內容進行檢索[15-18],無法利用教學資源中的圖像、知識等非文本內容,難以理解學習者的檢索意圖,難以從海量教學資源中精準檢索滿足學習者需求的資源,導致檢索的精度差、效率低等不足。

針對以上問題,本文成果分別提出基于教學資源語義表征的相似資源檢索方法和高效檢索技術,不僅能夠利用教學資源異構信息的內在含義,還能充分理解學習者的檢索意圖,進而提高教學資源表示的效率和資源檢索的精度。在相似試題檢索任務中,本文成果提出MANN(multimodal attention-based neural network)框架通過從異構數據中學習統一的語義表征進而在大規模教學資源中精準檢索與目標試題相似的教學試題[19]。MANN通過卷積神經網絡編碼圖像數據,通過嵌入模型編碼知識點數據,從而利用試題的文本、圖像、知識點的異構信息,通過基于注意力的長短期記憶網絡從異構信息中學習統一的語義表征,通過注意力機制捕獲試題的文本與圖像、知識間的內在聯系,并通過相似注意力評估目標試題與候選試題的相似部分,提高方法的可解釋性。在相似試題檢索任務中,MANN的檢索精度較現有方法相對提升約30%,并且檢索結果具有較好的可解釋性。

3 學習者認知診斷新方法

學習者作為學習的主體,分析其學習狀態具有重要的意義。然而,由于學習者學習活動自由、狀態隱蔽易變等特點,對其學習狀態的診斷是非常困難的。為此,本文成果提出了基于深度學習的學習者認知診斷新方法,通過直接挖掘學習者的作答表現,闡明了“學習者?知識/興趣?資源”的高階交互和潛在關聯,突破了以量表為基礎的教育測量理論研究范式,增強了學習者認知建模的可解釋性,為個性化學習推薦提供理論和技術支撐。

3.1 基于深度學習的認知診斷通用框架

學習者的知識狀態是影響其表現的根本因素,學習者答對已掌握的知識相關的試題的可能性很高,而答對未掌握的知識相關的試題的可能性則很低,因此準確診斷學習者的知識狀態是認知診斷的核心目標,同時也是自適應學習研究的關鍵課題。然而,學習者、知識、教學資源三者間存在復雜的交互關系。具體來說,學習者對不同的知識有著不同的掌握狀態,這直接影響學習者與相關的教學資源的交互結果。學習者的知識狀態也會在其與相關教學資源的交互中不斷更新。此外,不同知識間、教學資源與知識間都存在多種多樣的復雜關聯。學習者、知識、教學資源三者間的復雜交互關系與學習者的認知診斷結果密切相關。而現有的教育測量理論研究大多基于IRT[20]或DINA[21]等傳統認知診斷模型,需要人工設計學習者的認知特征并定義學習者與教學資源的交互關系,通常使用簡單的線性關系對其進行建模,模型表達能力弱,難以捕獲“學習者?知識?資源”間的復雜交互關系。因此如何建模這種交互關系一直是現有認知診斷技術的瓶頸。針對這一問題,本文成果首次構建了基于深度學習的通用認知診斷框架NeuralCD(neural cognitive diagnosis),通過伴隨式地挖掘學習者在各類試題上的作答表現,利用深度學習技術自動發現學習者與試題間的復雜交互關系,建立“學習者?知識?資源”之間的高階交互和潛在關聯。通過利用深度神經網絡強大的特征學習能力,NeuralCD模型突破了以人工量表為基礎的教育測量理論研究范式表達能力弱的缺陷,提高了對學習者的建模能力。

如圖4[22]所示,NeuralCD框架考慮認知診斷過程中的3個因素:學習者因素、試題因素與兩者的交互。對每條作答記錄,NeuralCD通過獨熱編碼對應的學習者與試題作為輸入并獲得兩者的診斷因素。學習者因素建模學生的特征,通過連續向量建模學習者在各知識上的掌握程度;試題因素建模試題的特征,并分為與知識相關的特征以及與知識無關的特征兩種,前者是知識試題與知識概念間的關聯,并與學習者因素對應,通過非負向量建模試題與每個知識概念的相關程度,而后者并非認知診斷所必需但可以與其結合,如知識的難度與試題難度、區分度等。在此基礎上,交互層通過神經網絡學習兩個診斷因素的交互函數并輸出學習者正確作答試題的概率。進一步,為了保證診斷結果的可解釋性,NeuralCD引入單調性假設在訓練中約束交互函數,即學習者正確作答試題的概率隨其知識掌握度向量任一維的提高單調上升。經過模型訓練,以學生的知識掌握度向量作為診斷結果。

圖4 NeuralCD框架示意Fig.4 Overview of NeuralCD framework

NeuralCD是一個泛化的通用認知診斷框架,在該框架下,許多傳統認知診斷模型可以視為NeuralCD框架的特例,如MF[23]、IRT、MIRT[24]及其變種。例如設定學習者診斷因素為一維、試題診斷因素為一維以及交互函數為sigmoid函數,NeuralCD可以退化為傳統IRT模型。因此NeuralCD框架統一了多種傳統教育測量學技術。更進一步,本文成果基于NeuralCD框架實現了一個具體的認知診斷模型NeuralCDM。如表3[22]所示,在學習者認知診斷任務上,誤差較現有方法相對降低約5%。

表3 認知診斷任務實驗結果Table 3 Experimental result of cognitive diagnosis

3.2 多角度的學習者學習興趣模型

學習者的學習興趣是影響其學習表現的潛在因素,因此,如何識別學習者的學習興趣是認知診斷的重要任務。然而,學習興趣是個人隱性特征,難以直接測量,且影響因素眾多。為此,本文成果提出了“學習者?興趣?資源”的多角度建模方法,從學習者的“同質化特點”、“長短期行為”和“心理活動”等3個影響學習興趣的重要因素著手,數值化建模不同因素對于學習者興趣的影響程度,增強學習興趣建模的可解釋性。為研究“游戲行為”(gaming behavior)等行為活動對學習者學習興趣的影響,本文提出了KPGRM(knowledge plus gaming response model)模型,對在線學習中的學生“游戲行為”進行診斷和分析[25-26]。針對學生答題過程中不同的答題行為,KPGRM通過分析學生在多次答題(multiple-attempt responses,MAR)下的顯式“游戲行為”因子和單次答題(oneattempt response, OAR)下的顯式猜測因子和隱式猜測因子,建模并診斷學生的“游戲行為”以及相對應的認知情況。

在現有大多數研究假設的一種在線選擇題答題形式下,學生只有答對當前試題才能進行下一題的作答。在該形式下,學生的可能存在的“游戲行為”主要可以分為3類:持續作答、系統作答和快速作答,KPGRM基于這3種學生“游戲行為”提出了4個用于診斷顯式的學生“游戲行為”的特征:1)持續作答(keep answering):在一道題上的答題嘗試次數越多,則對應的“游戲行為”因子越高。2)快速作答(quickly):答題速度越快,則“游戲行為”越強。3)系統作答(systematically):答題轉換越多,系統性越差,則“游戲行為”越多。4)選項覆蓋度(coverage):選擇的選項對所有選項的覆蓋度越大,都標志著更高的“游戲行為”因子?;趯W生的答題特征觀測,KPGRM對這4個特征進行線性組合,對學生的顯式“游戲行為”因子進行分析。具體來說,KPGRM模型通過學生多次回答問題時的特征觀測其顯式“游戲行為”因子,并使用協同過濾的方法推斷隱式“游戲行為”因子。在結合學生“游戲行為”因子的情況下,使用信號檢測模型來進行學生學習狀態的診斷。KPGRM在分析學生在線答題時“游戲行為”的同時,能更加精確地診斷學生的認知狀態,具體內容可參考文獻[26]。

3.3 構建認知狀態的動態演化模型

學習者的知識狀態與學習興趣在長期的學習過程中動態變化,這給學習者認知診斷演化建模提出了更高的要求[27]。為此,本文成果分別從教學資源屬性特征和人腦記憶特性兩個角度,量化了學習過程中學習者的認知狀態變化過程,基于馬爾科夫等性質提出了融合教學資源表征和記憶曲線理論的時序建模方案,揭示了學習者知識狀態和學習興趣的動態演化規律。

本文成果提出一種稱為exercise-aware knowledge tracing(EKT)[28]的動態知識跟蹤框架,該框架通過題目語義來建模教學資源特征,進而分析其對學習者認知狀態的影響。對比傳統的認知狀態動態演化模型,EKT還考慮了兩類額外信息對于學習過程的影響,分別是題目中包含的知識信息和每個題目的個性化信息。具體來說,模型輸入學生歷史上做過的題目序列,輸出學習者的認知狀態預測。對于題目中包含的知識信息,模型設計了一種動態增強記憶網絡,以存儲題目之間的知識共性,并量化題目知識對學生知識概念學習的影響。對于每個題目的個性化信息,模型設計了基于雙向循環神經網絡的題目特征提取器,可以自動學習題目的個性化特征。然后,模型分別對每一個時刻的共性和個性兩種特征信息進行融合,利用多維LSTM網絡追蹤學習者在多個知識概念下的狀態變化[10]。最后,本文成果提出兩個EKT的實例化模型,模型框架如圖5[28]所示。其中圖5(a)所示的EKTM(EKT with Markov property)假設學生的未來表現僅與當前時刻的知識狀態相關,即對學生的認知動態演化建立一階馬爾科夫假設。圖5(b)所示的EKTA(EKT with Attention mechanism)則假設學生的未來表現與其歷史上的每一時刻的知識狀態均可能相關,按照題目的相似性聚合歷史的做題表現。本文成果在大規模數據集上對EKT框架進行了實驗驗證,結果表明EKT同時具有較高的預測精度和良好的可解釋性。

圖5 基于EKT框架的兩個模型框架Fig.5 Architectures of two implementations based on EKT framework

為了建模人腦記憶特性對學習者認知狀態的影響,本文成果提出一種融合學習因素的知識跟蹤模型exercise-correlated knowledge proficiency tracing (EKPT)[29]。首先,模型通過一個預定義的關聯矩陣將題目映射為一個向量,向量的每一維表示該題是否與某一特定知識概念相關聯。為建立知識空間中題目之間的關聯關系,EKPT首先為題目尋找具有相近知識概念的鄰居題目集合,然后聚合其鄰居的知識信息,以使得具有相似知識概念的題目在空間中距離相近。為建立學生的動態演化模型,EKPT基于學生的表現,將學生投影到相同的知識空間中的一個認知狀態向量,該向量的每一維表示此學生在何種程度上掌握某一知識概念。最后,結合“學習曲線理論”和“遺忘曲線理論”,模型對學習者在學習過程中的記憶與遺忘特性進行量化,進而動態追蹤其知識掌握情況。本文成果將EKPT應用于實際教育學任務中,實驗結果驗證了所提出模型的效果。

4 自適應學習推薦新技術

智能教育的核心目標是提供學習者自主學習環境。其中,如何設計和自適應學習的策略是一個重要的任務。然而,由于智能教育場景多樣、目標復雜等特點,學習策略的設計和自動調整非常困難,本文成果首次設計了基于知識匹配的個性化推薦新技術以及多目標匹配的自適應推薦新技術,分別解決了在靜態學習場景和交互式學習場景中,如何將教學資源質量與學習者認知狀態進行智能匹配的難題,為智能教育應用和系統研發奠定了基礎。

4.1 基于知識匹配的個性化推薦技術

自適應學習推薦所具備的教育背景與傳統推薦場景(如電子商務)有所不同。傳統的電商推薦關注用戶在興趣喜好上與商品的匹配,而教育中的自適應學習推薦關注學習者與教育資源在知識上的匹配。因此,實現自適應學習推薦技術的一個關鍵在于如何在知識空間中教學資源與學習者進行精準匹配。為解決傳統推薦方法難以顯式建模知識狀態的難題,同時滿足學習者不同的學習需求,本文成果面向教學資源推薦和學習伙伴推薦兩個任務,分別設計了融合認知狀態的矩陣分解技術和優化認知收益的異質聚類技術,在知識空間中,實現了“學習者–教學資源”和“學習者–學習者”之間的智能匹配,保證了教學資源推薦和學習伙伴推薦的可靠性[30]。

為滿足教學資源的個性化推薦需求,本文成果結合教育心理學中的認知診斷方法和數據挖掘的推薦方法,為了增強試題推薦結果可靠性以及可解釋性,提出了一種新的試題推薦方法。如圖6所示[30],該試題推薦框架主要包括數據輸入、認知診斷、得分預測以及試題推薦4個步驟。根據已有的學生答題記錄,該框架利用認知診斷方法獲得每個學生的認知狀態。隨后,將學生的認知狀態作為先驗信息應用到得分預測的概率矩陣分解方法中,在考慮學生共性的同時加入了每個學生的個性化認知狀態。最后,根據試題難度范圍和學生認知狀態的不同,可以篩選出合適的試題并形成個性化的推薦試題集,每個學生可以得到一份相應的個性化推薦試題。因此,根據學生的不同學習需求,該個性化試題推薦框架可以有針對性的向學生推薦不同難度的試題。如圖7所示[30],針對需要提升薄弱知識點的掌握程度、提高知識能力的學生,可以向其推薦難度較大的試題,幫助成績提升;而對于每個知識點的基礎鞏固,則可以向學生推薦難度較低(簡單)的試題。

圖6 結合認知能力結果的學生試題推薦框架Fig.6 Question recommendation with cognitive level

圖7 有針對性的試題推薦Fig.7 Personalized question recommendation

為滿足學習伙伴的個性化推薦需求,本文成果研究了一種基于學生認知診斷分析的學生協同分組方法[22],并基于該方法為學生尋找合適的學習伙伴。具體地,本文成果提出了基于學生差異的分組算法UKB(uniformk-means based)和基于收益的學生分組算法BGB(balanced gain based)。UKB以學生知識點掌握程度為特征對班級內的學生進行聚類,旨在將同類的學生分配到不同的學習小組;BGB通過最大化組內所有學生的平均收益,對學生進行分組。本文成果將分組方法應用于學習伙伴推薦任務中,在班級中為每名學生尋找最合適的學習小組伙伴,實驗結果驗證了所提出模型的效果[12]。

4.2 多目標匹配的自適應推薦技術

在智能教育系統中,學習者通常與系統進行交互式的多輪學習,使得單一目標的推薦策略難以滿足學習者動態多樣的學習需求。因此,探索不同的推薦目標,使學習者始終保持沉浸感并能夠獲取更多知識,是自適應推薦所面臨的主要難題之一。為此,本文成果提出了融合多個學習目標的自適應推薦技術,利用強化學習協同優化多目標長期收益,實現了推薦策略的自動調整;設計了滿足知識結構約束的自適應推薦技術,生成合理的學習路徑。

在實際應用場景中,一個理想的在線學習推薦系統需要對其推薦機制進行調整以適應實際情況。傳統推薦系統的推薦機制一般較為單一,不足以滿足實際需求,因此,本文成果提出如下3種在線題目推薦目標。1)復習與探索:題目推薦的根本目的是幫助學生掌握知識,不僅包括沒有接觸過的新知識,還包括未掌握需要復習的舊知識,因此需要根據學生實際情況,動態地進行復習與探索。2)難度平滑性:實踐表明,一個良好的知識學習過程是循序漸進的,量化地說,即學習者接受的題目序列在難度上不應該變化過于劇烈,在推薦的過程中,算法需要根據之前的推薦序列自適應調整當前推薦的題目難度,使得被推薦題目的難度更加平滑。3)參與度:保持學習積極性和熱情是決定學習者學習效率的重要因素,尤其是需要學習者持續參與的在線教育系統,因此,算法需要在適當的時候推薦一些有趣的或具有挑戰性的題目以激發學習者的興趣。因此,本文成果提出一種基于多學習目標優化的個性化推薦算法DRE (deep reinforcement exercise recommendation),其框架如圖8[31]所示。

圖8 DRE框架Fig.8 The proposed DRE framework

這是一個基于深度強化學習的通用框架,它將在線學習推薦過程建模成一個馬爾科夫決策過程(Markov decision process, MDP)。由于題目資源規模過大,傳統的基于有限MDP的強化學習算法在在線教育系統中難以實現。因此,DRE轉而對“狀態–動作”價值函數進行參數化估計。具體來說,DRE設計了兩種基于不同策略的神經網絡結構(exercise Q-network,EQN)。第1種結構基于Markov性質,稱為EQNM(EQN with Markov property),即假設推薦策略僅取決于學習者在當前時刻的狀態。第2種結構基于序列特性,稱為EQNR(EQN with recurrent manner),即假設推薦策略取決于學習者之前所有的歷史行為序列。兩種神經網絡對應的強化學習訓練算法都是模型無關的,不需要借助或學習Markov過程的狀態轉移信息。進一步地,DRE針對前述3種推薦目標,即復習和探索、難度平滑性、參與度,分別定義了量化的獎勵函數,以同時對3個目標進行優化。因此,DRE在能夠通過調節3個推薦目標的平衡來自適應地調整其推薦機制,以優化推薦效果。最后,本文對DRE分別進行了離線測試和在線模擬測試,實驗結果驗證了DRE的自適應題目推薦效果的有效性和魯棒性[10]。

為生成合理的符合知識結構的推薦路徑,本文成果提出了一種基于知識結構的學習者學習路徑推薦方法CSEAL(cognitive structure enhanced framework for Adaptive Learning)[32]。CSEAL首先根據目標學習路徑中包含的學生需要學習的所有知識單元及學生當前學習的第一個知識單元,確定候選知識單元集合;然后,CSEAL利用知識追蹤算法獲取學生的當前知識狀態,并根據學生不同的知識狀態,確定候選知識單元集合中每一個知識單元作為目標知識單元時為最優解的概率,最后選取其中最大概率的知識單元作為目標知識單元,即學生下一個需要學習的知識單元。在CSEAL中,通過將學習路徑推薦問題轉化為逐步的馬爾可夫決策問題,并應用演員–評論家算法,動態更新推薦策略,從而順序地向不同學生推薦能實現高效學習的知識單元,詳細方法可參考文獻[32]。

5 智能教育系統?“智學網”

融合上述3項自適應學習核心技術,本文成果進一步研發了一款面向基礎教育的智能教育系統,名為“智學網”。該系統通過伴隨式地采集日?!敖膛c學”過程性的動態數據,建立面向中小學的大規模高質量教學資源庫,構建以學習者為中心的學業評價體系,實現優質資源精準推薦,為老師“針對性教”和學生“個性化學”提供了智能環境與服務?!爸菍W網”系統核心模塊主要由數據層、技術層和應用層構成,核心模塊結構如圖9所示。

圖9 “智學網”系統核心模塊結構Fig.9 Structure diagram of key modules of “Zhixue”

數據層主要負責對上層應用產生的教學資源(試題、課程、課件等)和學習者學習行為(學業數據、作答記錄等)數據進行存儲管理。現階段,“智學網”已構建了面向中小學的大規模高質量教學資源庫。技術層基于本文成果核心技術創新成果,即教學資源表示新框架、學習者認知診斷新方法和自適應學習推薦新技術,技術層為應用層提供了核心接口服務。應用層包含數據采集平臺和智能應用服務,數據采集平臺通過如知識點標注平臺、題庫平臺等多個數據平臺采集教學資源與學習者數據,并回灌數據層進行存儲和管理;智能應用服務為學習者提供了多個服務平臺,如個性化學情分析、個性化學習手冊,構建了以學習者為中心的評價體系。通過數據層、服務層、應用層的聯合協作,“智學網”實現了優質教學資源精準推薦,同時,也伴隨式記錄了更高質量的學業數據,促進良性循環。

“智學網”的智能教育技術服務體系框架如圖10所示,包含智能基礎設施、上層對象和服務場景等3層架構。截止至2020年7月,“智學網”系統已深入教學核心,其產品服務覆蓋智能課堂、智能教研、智能考試、智能評價等各類教與學場景。系統已在安徽、江西等全國各省市16 000余所學校推廣并實現常態化應用,惠及師生約2 500萬。全國范圍每月組織聯考數千場,服務各類班級、年級測試數萬場,提供評價報告800萬份。

圖10 “智學網”智能教育技術服務體系框架Fig.10 Framework of intelligent technology and service system of “Zhixue”

6 結束語

教育作為民族振興、社會進步的基石,是國之大計、黨之大計,對實現中華民族偉大復興具有決定性意義。本文成果經過10余年的潛心研發,突破了面向智能教育的自適應學習技術難點,構建了教學資源表示新框架,提出了學習者認知診斷新方法,設計了自適應推薦新技術,研發了面向基礎教育的智能教育系統?“智學網”。其關鍵技術和系統平臺已取得重大的技術突破和大規模行業應用。未來,我們將依托所研發的“智學網”系統,逐步開展教學資源知識庫的構建、學習者多種學習行為數據的收集以及在線與離線數據的對標融合,旨在設計智能程度更高、解釋性更強的自適應學習技術,力求在關鍵技術上再一次突破,為我國智能教育發展應用和教育現代化事業做出進一步的貢獻。

猜你喜歡
教學資源智能教育
國外教育奇趣
華人時刊(2022年13期)2022-10-27 08:55:52
題解教育『三問』
當代陜西(2022年4期)2022-04-19 12:08:52
教育有道——關于閩派教育的一點思考
智能前沿
文苑(2018年23期)2018-12-14 01:06:06
智能前沿
文苑(2018年19期)2018-11-09 01:30:14
智能前沿
文苑(2018年17期)2018-11-09 01:29:26
智能前沿
文苑(2018年21期)2018-11-09 01:22:32
辦好人民滿意的首都教育
初中語文數字化教學資源應用探索
初探教學資源開發的系統思維
主站蜘蛛池模板: 欧美在线视频a| 中文字幕在线观看日本| 久99久热只有精品国产15| 色一情一乱一伦一区二区三区小说| 欧美一级高清免费a| 香蕉久久国产精品免| 国产在线一区视频| 亚洲中文字幕在线观看| 精品三级在线| 精品一区二区无码av| 精品久久久久久中文字幕女| 国产无套粉嫩白浆| 亚洲中文字幕手机在线第一页| 无码综合天天久久综合网| 亚洲床戏一区| 免费欧美一级| 欧美不卡二区| 四虎影视国产精品| 91午夜福利在线观看精品| 久久99国产乱子伦精品免| 无套av在线| 国产免费久久精品99re不卡| 亚洲色无码专线精品观看| 国产天天射| 免费在线国产一区二区三区精品| 无码福利日韩神码福利片| 久久亚洲国产一区二区| 99视频在线精品免费观看6| 国产综合日韩另类一区二区| 久久综合干| 国产精品欧美在线观看| www.91在线播放| 欧美午夜在线播放| 国产H片无码不卡在线视频| 亚洲精品桃花岛av在线| 亚洲国模精品一区| 青青国产视频| 国产在线麻豆波多野结衣| 亚洲天堂日韩av电影| 在线观看亚洲人成网站| 亚洲中文字幕在线观看| 国产欧美视频综合二区| 亚洲视频影院| 日韩最新中文字幕| 亚洲欧美精品日韩欧美| 午夜一级做a爰片久久毛片| 亚洲一级毛片| 日本91在线| 精品一区二区三区四区五区| 亚洲人成影视在线观看| 嫩草国产在线| 亚洲国产欧美国产综合久久 | 91精品网站| 国产精品一区二区久久精品无码| 视频在线观看一区二区| 色吊丝av中文字幕| 亚洲男人的天堂网| 欧美色综合网站| 最新国语自产精品视频在| 亚洲欧美日韩久久精品| 中文字幕久久亚洲一区| 国产精品网拍在线| 欧美狠狠干| av在线无码浏览| 天天婬欲婬香婬色婬视频播放| 97视频免费在线观看| 中文字幕在线日韩91| 欧美午夜一区| 免费观看成人久久网免费观看| 久热99这里只有精品视频6| 成人精品视频一区二区在线 | 亚欧乱色视频网站大全| 少妇被粗大的猛烈进出免费视频| 女人一级毛片| 97国产精品视频自在拍| 成人亚洲天堂| 亚洲成人福利网站| 99精品视频播放| 天天色天天操综合网| 婷婷色一二三区波多野衣| 最新加勒比隔壁人妻| 福利一区在线|