吳正洋,湯 庸,劉 海
華南師范大學 計算機學院,廣州510631
隨著人工智能與大數據技術的廣泛應用,教育大數據與教育數據挖掘以其豐富的內涵和實用性為智能教育中相關技術的發展注入了新的動力。學習推薦系統是教育數據挖掘領域的重要研究方向,且被廣泛地應用于各類智能學習系統。在智能學習系統中,學習者利用各類學習資源加入教學活動,學習資源包括課件、多媒體和模擬場景、練習題和測驗,甚至適度和生動的討論話題等。這些學習資源由于內在關系可能組合形成一個復雜的結構,如圖1所示,在線學習系統中的各類學習資源通常源自互聯網或者教師。圖中的正方形、六邊形、圓形以及五邊形分別表示不同種類的學習資源。同類學習資源之間存在知識的前序、后繼、同級的層次關系,這種層次關系也可能存在于不同種類的資源間。而即使學習資源的類型不同,也可能具有相同知識、相同來源,屬于相同課程,此外,它們之間還可能存在相互引用、擴展知識的關系。

圖1 在線學習系統中學習資源的復雜關系Fig.1 Complex relationship of learning resources in online learning system
學習者通過與學習資源的交互達到認知提升的目的,但由于學習資源種類數量繁多且結構復雜,因此有必要在學習系統中嵌入個性化功能,以適應性地跟蹤學習者的進展,并提供適合他們需要的學習資源。鑒于此,學習推薦系統(learning recommender system,LRS)應運而生。學習是一項具有綜合性特征的活動,需要學習者長期持續的認知加工、情感投入乃至意志支撐。因此,與推薦系統在其他領域的應用不同,學習推薦不是為了預測或迎合學習者的潛在行為,而應該通過推薦的內容,輔助學習者在合適的學習進程中以合理的方式發現與其個性化參數相匹配的學習資源,從而保持學習者的積極性,并支持他們有效地完成學習活動。
根據以上目標,本文從學習推薦系統的研究中歸納了三個核心問題:第一個是學習者建模問題,即如何對學習者的學習風格、認知水平、情感狀態等信息進行全面捕獲,并有效地建立學習者模型。第二個是學習推薦對象建模問題,即如何發掘學習推薦對象與學習者個性化參數相關聯的信息,并有效地建立學習推薦對象模型。第三個是學習推薦算法設計問題,即采用何種計算模式將學習者模型和學習推薦資源模型有效結合,從而提升比較、過濾、匹配等操作的效率和精度。此外,建構主義學習理論認為,學習活動是學習者認知構建的過程,且具有持續性和連貫性,因此,對推薦效果的評價和跟蹤也是學習推薦系統應解決的重要問題。
一個通用的學習推薦系統框架如圖2 所示,該框架由三個子模塊構成,即學習者建模、推薦對象建模以及推薦算法。學習者建模主要包括學習者狀態表示算法以及學習者模型;學習推薦對象建模主要包括推薦對象狀態表示算法以及學習推薦對象模型;推薦算法模塊通過處理學習者模型和學習推薦對象模型,向目標學習者輸出推薦結果。

圖2 學習推薦系統的框架示意圖Fig.2 Schematic diagram of framework of learning recommendation system
對于個性化推薦系統而言,首要解決的是用戶和推薦對象建模的問題。所謂用戶或推薦對象的建模,即通過對用戶、推薦對象顯式特征的轉換或潛在特征的提取,來構成能夠體現其獨特性或相似性的表示方式。在學習推薦系統中,用戶即為學習者,其特征包括學習偏好、學習風格、知識掌握水平、知識背景等。學習者表示模塊即通過算法將學習者在學習過程中所體現出來的個性化參數值進行有效表示,并盡量使其蘊涵更豐富的個性化語義。學習推薦對象表示模塊的作用則是將推薦對象的特征提取出來,并進一步轉換推薦對象模型。推薦算法模塊通過處理學習者和推薦對象模型,實現推薦。但與其他個性化推薦系統不同的是,學習推薦對象可以是課件、多媒體、練習題等單一學習資源,也可以是由若干有關聯的學習資源組合構成的學習路徑。這是因為在一個完整的課程學習過程中,單一學習資源推薦可能會導致一些問題,首先是忽略了學習者對不同學習資源的偏好,只推薦一種學習資源可能會影響本身不喜歡這類資源的學習者的積極性,其次是忽略了學習者在學習過程中的進步和變化,從而喪失了學習推薦的引導作用。可見,個性化學習推薦問題在考慮學習資源與學習者個性化特征匹配的基礎上,還應考慮對學習者學習效果的影響。參考推薦系統對個性化學習推薦系統進行形式化定義:設P是學習者的個性化參數集合,函數表示學習者建模過程,(P)是學習者模型集合;P是所有可以推薦給學習者的對象的特征集合,函數表示推薦對象建模過程,(P) 是推薦對象模型集合。設函數可以用于計算推薦對象對學習者的推薦度,即((P),(P))→,是一定范圍內的全序的非負實數,推薦的目標就是找到推薦度最大的那些對象,如式(1)所示:

由以上形式化定義可以看出,學習者建模、推薦對象建模以及推薦算法,是個性化學習推薦的3個關鍵技術,本文接下來將圍繞這些內容展開介紹。
學習者建模是構建精準、優質、個性化學習推薦系統的先決條件。學習者模型應反映多方面的、動態變化的學習者個性化參數。文獻[14]總結了19 項學習者個性化參數,并將其歸納為3 個類別:“為何學”“學什么”以及“如何學”。其中,“為何學”類別下的參數,是將學習目標和動機視為學習者的個性化差異;“學什么”類別下的參數體現了學習本質內容,即根據學習預期達到的知識點和技能目標等作為學習者的個性化差異;“如何學”類別下包含了更豐富的個性化參數,如學習偏好、學習風格以及面向學習內容所采用教學方法的相關知識背景等,這些參數可用于體現學習者的個體化學習方案差異。對于學習推薦系統而言,可根據應用場景考慮其中一項或多項參數的組合。如在線課程學習中,學習者的目標一般是在限定的時間(三個月或一個學期)內完成學習任務且取得好成績。為此,學習者只需關注與自己的知識背景、能力水平等參數相匹配,且可以在限定的時間內完成的學習資源;接下來,學習者會在這些學習資源中挑選符合自己學習風格偏好的那些開展學習。因此,文獻[7]從學習路徑推薦視角,將學習者的個性化參數設置為學習目標、技能學習、知識背景、時間限制以及學習風格五個,每個參數從屬的類別如圖3 所示。

圖3 學習路徑推薦視角下的學習者個性化參數分類Fig.3 Classification of learners'personalized parameters from perspective of learning path recommendation
學習者建模應能獲取、表示、存儲和修改學習者的特征和狀態,能通過推理,對學習者進行分類和識別,使系統更充分、更準確地捕獲學習者的特征和狀態。Chrysafiadi 等總結了九種學習者建模方法:覆蓋建模(overlay)、原型建模(stereotypes)、攝動建模(perturbation)、機器學習技術建模(machine learning techniques)、基于認知理論建模(cognitive theories)、基于約束的建模(constraint-based)、模糊建模(fuzzybased)、基于貝葉斯網絡建模(Bayesian networks)以及基于本體的建模(ontology-based)。可以看出,學習者建模除了要體現學習者的基本屬性特征(如年齡、性別等)之外,還需體現學習者的認知狀態(或知識掌握狀態)、情感狀態等,這類狀態會隨著學習活動的進行而變化。近年來,隨著深度學習和特征工程相關研究的發展,學習者建模方法也在發展。本文接下來將結合近幾年學習者建模方法的研究進展,并從學習者特征表示的視角將其歸納為顯式的學習者建模方法、隱式的學習者建模方法以及語義式的學習者建模方法,如圖4 所示。

圖4 本文歸納學習者建模的三類方法Fig.4 Three types of learner modeling methods in this paper
顯式的建模方法是通過提取系統或文檔等明顯的學習者特征或偏好描述數據,構成能夠體現學習者獨特性或相似性的表示方式。顯式的學習者建模有利于將學習者模型與個性化參數直接對應。由于存在多種學習者個性化參數,在不同的應用需求下,顯式學習者建模方法所描述的學習者特征可能也不同。文獻[15]從學習者對被推薦對象的偏好出發,認為在學習路徑選擇上,學習者更關注研究的新穎性、權威性和普及性,并基于此提出了一個學習路徑推薦方法,該方法以學習路徑中所配置學習資源的新穎度、流行度和權威度3 個值的加權平均表示學習者模型。有的顯式學習者建模方法直接采用了學習者對學習資源項目評分,如在文獻[16]所提出的學習推薦模型中,將所有學習者對所有學習資源項目的評分形成一個矩陣,該矩陣的每一行即為一個學習者的向量表示。
有的方法通過采集學習者在不同系統中體現的個性化參數進行學習者建模,如文獻[17]將學習者在多個系統中所表現出的不同學習目標進行組合后形成學習者模型。該方法對學習者的描述是基于其在多個系統中配置文件的前個標簽,并重點描述該學習者在系統中的行為,即其最活躍的個性化特征。還有的研究通過直接調查獲取個性化參數的方法進行學習者建模,比如文獻[18]所提出的學習推薦模型就直接通過采集學習風格進行學習者建模,還為此開發了一套關于學習風格的在線調查表工具,使用學習風格分類法描述學習者的學習風格特征。文獻[8]提出的學習推薦方法同樣使用了在線問卷調查的方式收集更豐富的個性化參數,所形成的學習者模型除了學習風格之外,還包括學習者的學習進展。顯式學習者建模高效直觀,保留了推薦系統所需要的學習者特征,使學習者模型具有良好的可解釋性,但在學習者特征缺少的情形下,顯式的學習者建模方法往往失效。另一方面,當學習者與學習項目交互矩陣過于稀疏時,采用顯式學習者建模方法也難以有效表現學習者與學習資源項目的交互行為特征。
所謂隱式學習者建模,是指將顯式的學習者特征數據或行為數據經過轉換計算后得到一種可以描述學習者特征的向量。該向量的組成元素看似不是特征值的直觀表示,但能表達學習者特征的語義信息。由于這種向量通常被稱為“隱向量”,本文將這種建模方式稱為“隱式學習者建模”。隱式學習者建模是當前學習推薦系統研究的熱點,主要包括基于模型的方法、基于會話的方法和基于圖的方法。
(1)矩陣分解
矩陣分解(matrix factorization,MF)已經廣泛應用于推薦系統中,它基于的假設是:用戶偏好受到少量潛在因素的影響,且項目的評分取決于其每個特征因素如何應用于用戶偏好。MF 能夠把“用戶-項目”評分矩陣分解成兩個或者多個低維矩陣的乘積實現維數的規約,用低維空間數據研究高維數據的性質,主要包括非負矩陣分解(non-negative matrix factorization,NMF)、廣義矩陣分解(generalized matrix factorization,GMF)和概率矩陣分解(probabilistic matrix factorization,PMF)。其中NMF 方法是把用戶對項目的評分矩陣R分解成兩個實值非負矩陣U和V,使得≈,如圖5 所示。

圖5 矩陣分解示意圖Fig.5 Schematic diagram of matrix factorization
采用矩陣分解進行學習者建模,通常先根據交互數據構建值為1/0 的矩陣,再將該矩陣分解為兩個低維矩陣,其中一個矩陣的行數與學習者人數相同,每行即表示一個學習者的隱特征向量。凡有交互或評分行為的應用場景都可以考慮使用矩陣分解方法。比如在文獻[24]中,采用了一個×的矩陣表示學習者在論壇上的表現,其中每行表示至少在課程的在線論壇上發布一次的學習者,每一列表示文中所定義的學習者在論壇中五種行為維度之中的某個類別標簽(比如知識構建維度中的一個類別是“觀察或意見聲明”)。如果學習者發布至少一個帖子分配了的內容標簽,則的每個條目C為1,否則為0。因此,是一個值為1/0 的矩陣,然后對采用貝葉斯非負矩陣分解(Bayesian non-negative matrix factorization,BNMF)方法生成學習者隱特征向量。文獻[25]根據學習者課程學習記錄,構建了“學習者-所選課程”矩陣,再采用PMF 方法并假設其條件概率符合高斯分布,將選課矩陣分解為學習者和課程的隱特征向量。文獻[26]首先將學習者對學習資源的點擊、閱讀或使用看作一次“交互”,從而形成一個“學習者-學習資源”交互矩陣。采用GMF 方法將其分解為學習者和學習資源的隱特征向量,為了融入學習者與學習資源長時期交互的特征,該模型還結合長短期記憶網絡(long short-term memory,LSTM)進一步生成學習者和學習資源的融合隱特征向量,并將兩種特征向量進行組合后,共享同一個Sigmoid輸出層。在使用過程中,將學習者與學習資源的交互記錄作為輸入數據,經過模型生成學習者對候選學習資源的交互概率,最后將交互概率最高的前幾項學習資源推薦給學習者。
(2)自編碼器


圖6 自編碼器結構Fig.6 Framework of auto-encoder
文獻[31]提出的練習題推薦系統中,采用了兩套結構相同的堆疊降噪自編碼器(stacked denoising auto-encoder,SDAE)分別生成學習者隱表示和練習題的隱表示。SDAE 是降噪自編碼器(denoising auto-encoder,DAE)的變體,DAE 的提出是為了防止過擬合,在自編碼器輸入層的輸入數據加入噪音,使學習得到的編碼器具有魯棒性;而SDAE 就是將多個DAE 堆疊在一起形成一個深層網絡結構,并且只在訓練時才對輸入進行加噪。與矩陣分解不同的是,自編碼器能夠將學習者多種特征所整合的高維向量進行降維,而矩陣分解則聚焦于表示學習者與學習資源的交互特征。
(3)基于上下文
學習者所受到的環境影響,難以通過主觀調查獲得?;谏舷挛牡膶W習者建模方法能夠適當將學習環境的信息融入學習者模型中。比如,有研究提出從社交網絡中產生的信息作為特征提取的數據來源,用以更準確捕獲學習者的潛在偏好。文獻[33]以多媒體為媒介,將學習者看作社交網絡中多媒體資源的提供者,基于他/她所學習的多媒體資源描述文本所表達的上下文信息,使用特征袋(bag of features,BOF)算法模型產生學習者的隱特征向量。另外還有研究認為,學習者作為群體中的成員也會受到所在班級環境的影響,文獻[35]提出了一種基于班級上下文因素(class contextual factors,CCF)實現個性化學習推薦的方法。該方法所采用的班級上下文因素是學習者對課程知識點的掌握水平,并以此作為學習者的隱特征表示。
基于會話的推薦任務是指給定用戶在會話中的上一次互動,預測用戶對下一次出現項目感興趣的可能性。對應的推薦方法采用了用戶與項目在一段時間內的交互序列,因此,用于處理序列數據的模型,如循環神經網絡(recurrent neural networks,RNN)、Transformer等被廣泛使用。文獻[38]根據學習者的答題記錄,使用基于LSTM(RNN 的一種變體)的知識追蹤模型(如圖7 所示)預測學習者正確回答知識點的概率,由于練習題包含一個或多個知識點,可以基于此形成知識點掌握水平概率的向量表示,從而構建學習者模型。

圖7 基于LSTM 的知識追蹤模型Fig.7 Knowledge tracking model based on LSTM
近年來,注意力機制(attention mechanism)受到了推薦模型研究的關注,傳統的注意力機制是面向源端和目標端的隱變量的計算,從而得到源端輸入與目標端輸出之間的依賴關系。自注意力機制(self-attention mechanism)是一種常用的注意力機制,它首先分別在源端和目標端進行,捕捉源端或目標端自身的隱變量之間的依賴關系;然后將源端和目標端的注意力結合,捕捉源端和目標端之間隱變量的依賴關系。因此,自注意力機制不僅可以得到源端與目標端隱變量之間的依賴關系,同時還可以有效獲取源端或目標端隱變量之間的依賴關系。文獻[39]使用自注意力機制,根據學習者在課程中的瀏覽點擊記錄,分別捕獲查詢、鍵和值的上下文信息,進一步生成注意力向量,表示會話中的線程?;谧宰⒁饬C制的表示生成模型如圖8 所示。

圖8 基于自注意力機制的表征生成Fig.8 Self-attention mechanism based representation generation
相比序列結構而言,圖或網絡結構更能表現學習環境下的真實情況。在基于圖形結構的推薦系統中,數據以圖形的形式表示,其中節點是用戶、標簽或資源,邊是它們之間的事務或關系。文獻[40]根據學習者、學習資源之間的關系為其添加排序標簽,即以基于位置關系的排序對學習者進行表示。文獻[41]提出將學習者和練習題作為實體,用邊表示學習者回答練習,再根據學習者回答練習的正確率確定邊的權重。文獻[42]在實驗部分提到了一種基于知識圖譜表示的練習題推薦方法,該方法將學習者和練習題作為實體,并將學生回答練習的結果作為關系?;谥R圖譜獲得每個實體的低維向量,并進行關系學習,使圖的結構和語義信息保持在向量中。
所謂基于知識的學習者建模,是指基于領域知識背景,通過識別學習者特征實體和其之間的關系,從而形成蘊含語義的網絡或圖結構,再通過將其實例化形成學習者模型。基于知識的學習者建模通常需要領域專家的參與,難以避免主觀偏差,本體技術在該建模方法中被廣泛使用。本體是基于領域中所涉及的概念、屬性和條件,以及它們之間的關系所形成的領域知識表示形式,支持抽象概念和屬性的形式表示,并可在需要時進行重用、擴展以及更新知識。在學習推薦應用場景下,基于本體的學習者建模方法通常根據學習者的基本屬性和學習特征來構建學習者本體。文獻[45]提出的基于本體的學習者建模方法,首先使用學習風格指數(index of learning styles,ILS)問卷對學習者的學習風格進行分析,并將有效規則定義為學習風格語義組與學習目標之間存在交集。文獻[46]提出了一個基于本體的MOOC 學習活動推薦方法。在該推薦方法中,本體被用于建模和表示領域知識、學習者以及學習活動。其中,學習者本體由4 個子類構成,即知識水平、學習方式、教學偏好以及學習者基本特征。采用本體技術可以將學習者建模擴展到多模態數據。文獻[47]提出一種通過學習者的Facebook 帳戶提取他/她的社交數據,將個人資料信息、好友列表、喜歡的頁面、帖子和群組等進行過濾,尋找那些定義教育興趣、訪問時間偏好、語言媒體偏好等信息,再基于這些信息對學習者本體進行實例化。文獻[48]構建了一個基于學習系統領域規則的通用本體,該本體結合了用于建模用戶配置文件的概念和屬性,以便在學習系統中制定具體、完整和可擴展的用戶建模。該方法使學習者模型不斷更新,并利用語義規則來分析學生的學習情況,從而更新關于學習者表現的知識。
學習者建模方法應圍繞學習者個性化參數,并盡可能保留學習者特征語義。本章將學習者建模方法歸納為顯式、隱式和基于知識的方法。其中,顯式學習者建模方法最直觀,但在學習者特征數據缺少的情形下往往失效。因此,當前對學習者建模方法的研究比較傾向于隱式學習者建模,如基于模型的方法、基于會話的方法和基于圖的方法等。基于模型的方法旨在通過模型從文本描述、上下文等非結構化的數據中提取學習者特征,常采用矩陣分解、自編碼器等能夠產生稠密向量的模型;基于會話的方法利用學習者與學習資源帶有時序特征的交互數據,一般使用RNN 或其變體、注意力機制等模型處理數據,其本質是生成學習者在交互序列中下一個時間步狀態的隱特征向量;基于圖的方法則首先要將學習者、學習資源以及其之間的關系用圖結構表示,然后采用隨機游走或用于處理知識圖譜表征的翻譯嵌入(translating embeddings,TransE)模型生成關系圖中學習者的隱特征向量表示?;谥R的學習者建模側重于領域知識表示模型的構建,旨在通過構建完備的學習知識表示模型來預先設定學習者建模所涉及的特征,再通過實例化生成學習者模型。隱式學習者建模方法缺乏直觀性,用于學習者隱特征表示的稠密向量只能間接反映學習者的相對狀態,且向量維度往往需要通過模型訓練調參才能確定。
學習推薦對象主要包括學習資源、好友以及學習路徑。其中學習資源是學習活動中所使用的資源,包括習題、課程、教學視頻、參考文獻、考試卷等,相關推薦的研究較多。按來源不同可將學習資源分為兩類:一類源自在線學習平臺內部,在平臺建設初期導入,并隨著平臺的運作不斷更新和補充;另一類源自在線學習平臺外部,學習者可以通過平臺提供的鏈接訪問。無論來源于內部或外部,在線學習平臺都應對其進行統一標準化管理,標準化的內容包括資源的類型、所覆蓋的知識點、難度、適用階段、學習時間等。此外,為了提高檢索效率,通常在學習資源管理系統中采用自動或半自動的語義化方法,從而為學習推薦對象的特征描述提供豐富的語義。學習推薦對象建模是學習推薦任務的重要部分,建模之前要考慮以下幾個問題:
(1)從推薦對象提取的特征應與學習者的個性化參數相匹配。學習推薦對象可能具有多種屬性特征,其中有些屬性與學習者的個性化參數相關,比如推薦對象所包含的知識點與學習者對知識點的掌握情況相關;推薦對象的資源類型與學習者的學習偏好相關等。為了推薦的有效實現,在提取推薦對象屬性特征時,應考慮與之匹配的學習者個性化參數。
(2)不同類型推薦對象的特征表示應該統一。在個性化學習推薦場景中,可能出現多種不同類型的推薦對象(如練習題、課程視頻等),這些資源的屬性特征不可能完全相同,但要反映同一學習者對這些不同類型資源的偏好時,就需要采用統一的特征表示方式,比如以評分作為對所有資源的表示。
(3)推薦對象的特征應符合算法模型的輸入要求。用于推薦對象建模的特征,將成為推薦算法模型的輸入,為了適應算法模型的有效運行,該特征應符合其輸入要求。
學習推薦對象特征的獲取是建模的首要任務。根據描述特征的獲取方式,可將當前常用的學習推薦對象建模方法歸納為:靜態方法、動態方法以及基于知識的方法三類。
學習推薦對象建模靜態方法是指提取推薦對象顯式特征中與學習推薦相關的那些來形成模型。比如直接采集學習推薦對象的文檔描述,如文獻[15]使用特征關鍵詞集描述學習資源,其中包括:發表時間、引文次數、搜索頻率、出版商影響以及作者影響力,然后使用加權關鍵詞矢量方法,通過對推薦對象文檔的統計分析得出對象的特征向量。直接提取文檔描述雖然簡單直觀,但是往往難以體現推薦對象的內在差異性。有研究著眼于挖掘更深層次的特征,從推薦對象文本中提取特征,比如從簡介、摘要、練習題的題干中提取。文獻[53]提出了一個基于卷積神經網絡(convolutional neural networks,CNN)的學習資源特征表示生成模型,提取學習資源中的文本信息(例如MOOC 平臺中的課程介紹、學習資源的摘要等)的特征,生成低維度的隱向量表示,該模型的結構如圖9 所示。

圖9 基于CNN 的學習資源文本特征提取模型Fig.9 CNN-based learning resource text feature extraction model
文本特征提取的方法雖然比較多,但學習推薦系統的對象不一定都具有文本特征,或文本描述不充分,比如來自網絡的學習視頻、音頻等多媒體學習資源,此時基于內容的學習推薦對象建模還需要結合多媒體內容分析領域的相關技術。靜態方法利用學習推薦對象的明顯特征對其建模,在特征描述豐富的前提下,能夠直觀且高效地達成建模任務,其所用特征的顯著特點也有利于提高推薦的可解釋性。
學習推薦對象建模可以采用“分類”和“交互”兩種動態方法實現?!胺诸悺奔窗淹扑]對象放入不同類別中,這樣可以把同類學習資源推薦給相關的學習者。可以使用基于統計機器學習的分類方法如樸素貝葉斯(Naive-Bayes)、近鄰(-nearest neighbor,NN)和支持向量機(support vector machine,SVM)等,也可以使用基于深度學習的方法。推薦對象的類別標簽可以預先設置,也可以聚類生成。但是這兩種方式都不能完全脫離人工參與,因為由自動聚類產生的標簽對學習者來說可能并沒有意義?!敖换ァ眲t利用學習者與推薦對象的交互數據進行建模。文獻[54]提出一種基于規則空間(rule-space)模型的推薦方法,該方法根據學習者在學習對象上的學習效果和學習進度等生成診斷表,并進一步將每個課程中學習對象描述為對于學習者的強弱學習狀態。文獻[55]提出一種基于貝葉斯個性化排序(Bayesian personalized ranking,BPR)算法的MOOC 課程推薦模型,該模型沿用了BPR 算法的成對排序思想,將一個正樣本課程與隨機采樣的個負樣本課程兩兩組合成個“正-負”樣本對,然后將它們的編號通過嵌入矩陣轉換生成嵌入表示。該方法中還采用了一種可以從成對樣本中學習偏好排序的神經網絡,用于捕獲課程兩兩之間的偏好排序信息。動態方法利用了“資源-資源”之間的關系、“資源-學習者”之間的動態關系形成推薦對象特征,使對象模型具備了動態性,即能隨著推薦對象在系統中隨學習過程產生的狀態變化而進行調整,有利于更好與不斷變化的學習者特征匹配。
基于知識的學習推薦對象建模方法也通常采用領域本體或知識圖譜實現。學習資源本體的構建多采用半自動化或手工方式,同樣離不開人工參與,難以避免主觀偏差。文獻[45]通過專家咨詢,采用五種特征構建學習資源本體,即:格式、交互類型、交互級別、語義密度和學習資源類型。文獻[57]為了提高學習資源本體構建的效率,采用了領域專家協作標注結合DOGMA的本體構建方法,框架如圖10 所示。該方法在準備好包含相關知識數據的基礎上,先進行清洗和修剪,凸顯出實體、屬性以及關系,并基于此建構推薦對象本體;在本體構建的過程中,再結合領域專家的協作參與不斷完善和優化推薦對象本體。

圖10 DOGMA 本體構建方法框架Fig.10 Framework of DOGMA ontology construction method
基于知識的方法本質上是借助專家參與,利用領域知識來補充學習推薦對象的描述,從而使推薦對象的特征更加豐富,對象模型更適用于相應的推薦算法。由于領域知識的加入,使學習推薦對象能夠根據需要匹配多種推薦應用場景,且使相應的推薦算法具備了更高的可解釋性。
本章將介紹學習推薦方法,這些方法是在學習者模型(第2 章所介紹)與推薦對象模型(第3 章所介紹)基礎之上實現的。學習推薦方法中利用了學習者和推薦對象建模的功能,且這些功能會隨著應用需求的差異而各不相同。本章重點介紹根據學習者和推薦對象模型進行計算、匹配、篩選、排序等用于推薦的算法模型。
許多個性化學習推薦方法參考了電子商務領域的商品推薦方法。這些方法把學習者看作電子商務平臺的用戶,把學習資源看作商品,以學習者在學習資源上的打分作為推薦模型的訓練標簽。常用的方法包括基于內容推薦(content-based recommendation,CBR)、協同過濾推薦(collaborative filtering recommendation,CFR)以及混合推薦(hybrid recommendation,HR)。此外,基于知識的學習推薦方法,以及基于會話的學習推薦方法也是研究的熱點,本章將對這些方法進行介紹。
基于內容推薦方法(CBR)是通過比較學習資源的屬性特征與學習者的偏好,找到與學習者偏好最符合的學習資源。與電子商務中基于內容的推薦有所不同,基于內容的學習推薦可以借鑒學習領域的一些知識背景,比如學習風格模型。文獻[62]通過人工定義若干推薦規則將學習資源的特征與學習者的學習風格模型進行關聯,基于滿足規則的情況計算學習資源與學習者的相關性分數,再根據分數排序推薦。也有研究將學習資源與學習者的知識掌握水平進行關聯,如文獻[63]提出了一種學習內容推薦方法,該方法首先采用特征選擇模型提取學習資源的表示特征,再將表示特征根據學習者理解水平進行分類,從而在大量數據中識別出確切的學習資源內容,然后根據學習者的理解水平進行推薦。除了與學習資源的屬性特征直接比較外,現有研究關注于提取學習資源的潛在特征,以及發掘其與學習者的關聯。文獻[53]提出的推薦方法通過歷史學習資源的文本數據(內容本身或內容簡介)結合學習者偏好訓練CNN 模型。在使用時,該模型可以將輸入的學習資源文本信息轉換為學習資源的特征,然后結合學習者偏好預測評分進行推薦。基于內容的學習推薦方法離不開學習資源屬性特征,一旦缺乏有用的特征數據,該方法的有效性將大為降低。
協同過濾是推薦系統中的經典算法,其執行過程是根據“用戶-用戶”相似矩陣或者“項目-項目”相似矩陣比較找到最相似用戶或項目,因此進一步可以分為基于用戶的協同過濾(user-based CFR),如圖11(a)所示,和基于項目的協同過濾(item-based CFR),如圖11(b)所示。圖11(a)和圖11(b)中矩陣的行表示用戶,列表示項目,矩陣內的元素表示用戶對項目的評分,但兩者的計算方式不同。如在圖11(a)所展示的User-based 協同過濾中,將第2 行和第4 行分別作為用戶和的項目偏好特征向量,通過計算其相似度來確定相似用戶;在圖11(b)所展示的Item-based 協同過濾中,將第1 列和第4 列分別作為項目和的用戶偏好特征向量,通過計算其相似度來確定相似項目。

圖11 協同過濾推薦使用的相似矩陣Fig.11 Recommended similarity matrix for collaborative filtering
在學習推薦場景中,該類方法則是基于學習者對學習資源的評分構建“學習者-學習者”相似度矩陣或“學習資源-學習資源”相似度矩陣,然后根據學習資源項目上的評分找到相似的學習者。NN 是協同過濾推薦方法中的常用算法,基于NN 的協同過濾推薦方法根據學習者或項目在相似矩陣中的表示,直接使用所有鄰居進行項目之間的相似度計算,在相似矩陣很大的情況下導致了較高的時間復雜度。在推薦應用中,NN 通常采用單個距離度量方法進行相似度的計算,如Cosine、Jaccard、Manhattan等,由于這些指標本身的側重點不同,可能會對系統的性能產生不同的影響。
混合學習推薦方法(HR)是將多種學習推薦相結合的方法,以達到提高推薦準確度,以及緩解單一推薦方法所可能出現的如矩陣稀疏、冷啟動等問題的目的。混合推薦方法最初是將基于內容的推薦方法與協同過濾推薦方法結合,并優化結合策略。如文獻[67]提出了一種基于內容推薦和協同過濾推薦的混合方法用于課程推薦,該方法利用本體來克服信息超載問題,即采用相似結構層次的本體來映射課程的屬性結構與學習者的特征結構。文獻[61]提出了一種采用人工免疫系統算法融合基于內容推薦與協同過濾推薦的課程推薦方法,該方法以學習者的課程學習效果為目標,根據過往課程的學習效果為學習者建模。然后運用免疫網絡理論中親和性與擴展圖的概念設計算法,計算學習者與課程的“親和度”從而實施推薦。對混合學習推薦的研究具有靈活性,可以通過調整其涉及的下級推薦方法,或者優化混合的策略來提升推薦的質量。文獻[68]提出了一種采用遺傳算法整合多種推薦策略的課程推薦方法,該方法將定制的遺傳算法應用于推薦的前置階段,利用訓練數據優化推薦系統的參數配置,然后用該配置構建推薦系統模型。文獻[69]提出了一種混合過濾推薦方法,以提高學習推薦的個性化和多樣性。該方法首先采用顯式學習者建模方法,盡可能豐富學習者的特征描述,然后運用自組織推薦策略進行學習者聚類,最后通過順序模式挖掘完成學習資源的排序及推薦。文獻[42]提出的練習題推薦方法中,融合了基于會話的推薦方法和模擬退火算法,以在保障推薦準確性的同時改善推薦的多樣性和新穎度。文獻[70]提出了一種基于多目標粒子群優化算法的學習推薦方法,該方法以學習者規劃的時間為約束,以同時滿足學習者偏好和學習資源難度最適宜為優化目標進行學習資源推薦。
學習是一種在教育情境中符合一定心理規律的行為,這是基于知識(knowledge-based)學習推薦方法的研究背景,這種推薦方法將學習者和學習資源的有關知識結合考慮,并應用到推薦過程中,根據學習者在領域知識中的偏好向其推薦學習資源。基于知識的推薦系統需要使用三種類型的知識:即用戶的知識、項目的知識以及項目與用戶需求之間匹配的知識。而這種方法的主要缺點是對領域知識整理的要求離不開人工參與,往往帶有主觀偏差,而且所構建領域知識的完備性也難以保障。使用本體對學習領域進行建模是基于知識學習推薦中的常用手段。在此過程中,除了可以用本體對學習者和學習資源的知識進行建模之外,還可以用它來描述學習場景中的要素。比如,文獻[43]構建了E-learning環境中的學習行為標準本體。文獻[46]使用本體描述了學習者在學習過程中表現的行為,分別對學習者、領域知識和學習行為進行建模。文獻[74]設計了一個框架來存儲學習資源,對學習資源進行分類并基于本體生成資源表示。
近年來基于知識圖譜的學習推薦方法受到了關注。文獻[75]基于學習過程中已出現知識單元、目標知識單元、知識單元依賴等構建知識圖譜,從而形成多個學習路徑,然后根據學習者的學習日志判斷其學習進度,再向其推薦學習路徑。文獻[15]構建了一個以學習目標為導向的跨學習領域知識圖譜,其中包括了六種語義關系,然后結合學習者的學習目標和學習資源的特征表示推薦學習路徑。
基于知識的學習推薦方法具有靈活性的語義描述域,文獻[52]提出一種采用本體綜合描述CBR、CFR、HR 等推薦算法,并選擇性調用相關算法的課程推薦方法,該方法能夠根據需求,對已描述的推薦算法進行動態調用。基于知識的學習推薦方法廣受關注的主要原因在于:教學是一個有規律的活動,學習行為的目標明確,而且學習資源特征與學習者的需求之間的映射規則易于定制。但是,領域本體或領域知識圖譜的構建也是一個需要人工參與,且耗時耗力的過程,所構建本體的合理性和完備性也會影響推薦的效果。此外,學習者的狀態,如情感、知識水平并非一成不變,知識的描述如果沒有合理的更新機制,則會導致學習路徑固化,反而與“個性化”的初衷相悖。
CBR 基于用戶和項目的靜態特征,而CFR 則依賴長期的“用戶-項目”交互歷史數據,兩者都在一定程度上忽略了用戶近期狀態的變化,這會導致用戶當前真實狀態被長期平均情況所掩蓋。而且,CBR和CFR 通常將一個基礎交互單元(如評分、點擊等)分解為多個“用戶-項目”的交互對記錄,并將這些記錄混合,這樣顯然不利于保留用戶在交互事件中所隱含的“狀態轉移”。此外,在實際應用場景中,用戶信息往往并不完全,并且只有處于正在進行會話中的用戶行為更能體現其當前狀態。因此,能對有限范圍內(一個會話)的行為進行建模是提高推薦質量的有效途徑。近年來,基于會話(session-based)的推薦方法成為研究熱點。采用基于會話的方法,能捕獲用戶狀態的變化,并將其更好地應用于推薦模型的訓練。文獻[39]提出了一種基于會話的MOOC 課程討論線程推薦方法,該方法將學習者在當前會話中所查看主題的歷史記錄作為輸入序列,通過模型計算候選線程的推薦得分,最后輸出得分最高的前幾個線程組成推薦列表。在學習推薦場景下,除了偏好可能會隨著學習過程而發生變化之外,學習者的知識掌握狀態也在學習過程中不斷變化,知識掌握狀態是學習發展的核心因素。文獻[78]提出了一種基于認知診斷模型預測學習者知識掌握狀態的個性化練習題推薦方法,該方法根據學生的答題會話記錄所形成的認知診斷模型表示學習者知識掌握狀態,再采用PMF 預測學生的答題情況,最后根據預測結果進行練習題推薦。文獻[42]提出的練習題推薦方法采用深度知識追蹤(deep knowledge tracing,DKT)模型捕獲學習者知識掌握狀態變化,并用知識點掌握概率為學習者建模;采用LSTM 模型預測知識點出現概率并以此對練習題建模。在形成學習者和練習題的表示后,通過匹配、篩選和排序生成練習題推薦列表。
本文把近年來對個性化學習推薦方法的研究歸納為基于內容的學習推薦、協同過濾學習推薦、混合學習推薦、基于知識的學習推薦以及基于會話的學習推薦五類,并對各類代表性推薦方法中的部分指標進行了比較,如表1 所示?;趦热?、協同過濾以及混合推薦屬于傳統的推薦方法,也被廣泛應用于其他推薦場景,這三種方法相關的研究比較豐富?;趦热莸耐扑]方法有利于直接將推薦對象特征與學習者個性化參數進行匹配,易于實現且高效,但無法獲取學習者和推薦對象在學習過程中的變化。協同過濾基于學習者與推薦對象的交互歷史,從行為數據挖掘學習者對推薦對象的潛在評價,這種方法有助于發掘學習者的潛在興趣或新興趣,從而提高推薦的質量,但協同過濾推薦存在冷啟動、數據稀疏性等問題?;旌贤扑]方法利用多個推薦算法協同合作,能夠在一定程度緩解單個算法存在的問題,不同的混合推薦方法可能采用的混合策略不同,通常要根據具體的應用場景和數據情況而定。基于知識的推薦方法充分利用教育領域知識,使學習推薦系統具備良好的可解釋性,但由于領域知識模型離不開人工參與,難以避免主觀偏差。以上幾種學習推薦方法多關注學習者的長期靜態偏好,而忽略了他們偏好隨時間的轉移?;跁挼膶W習推薦全面考慮了學習者在前后會話間的狀態轉移,并將會話作為推薦的基本單元,有利于對學習者即時狀態的獲取。但由于是會話數據自身特征所驅動,基于會話的學習推薦方法在會話內部結構處理、會話之間關系建模等問題上還有待進一步研究。

表1 個性化學習推薦方法摘要及對比Table 1 Summary and comparison of personalized learning recommendation methods
隨著在線教育和網絡技術的蓬勃發展,開放式學習拓展了學習推薦系統的應用場景。在開放式的學習環境下,學習者往往會登錄多個在線學習平臺、學習管理平臺,使用各種各樣的學習資源,直接或間接地與其他學習者接觸。開放式學習環境網絡中的某些學習資源由于來源于不同的系統,相互之間可能存在較大的特征結構差異。為了解決這一問題,文獻[80]以分布式MOOC 平臺為基礎,將多個平臺各類型學習資源整合至統一平臺,其學習資源推薦方法采用了基于Apriori 的改進分布式關聯規則挖掘算法。文獻[33]提出了一種基于分布式在線學習的視頻推薦模型,該模型采用去中心化服務供應商協同工作以處理學習視頻的大規模上下文數據。有的研究利用了本體在知識表示形式化方面的優勢,從組成學習環境網絡的異構數據中發現相似學習資源。如文獻[74]提出了本體匹配的概念,通過比較不同實體的本體相似性,實現學習資源在各種學習搜索引擎和學習管理系統之間共享。此外,可以將包含多模態學習資源的在線學習平臺看作異質信息網絡(heterogeneity information networks,HIN)的一個實例,如圖12 所示,由學習者、學習資源、教師等實體構成。文獻[84]根據網絡中實體之間的關系,提取“學習者-學習資源-學習者”“學習者-教師-學習者”等元路徑,提出了基于HIN 的學習資源推薦方法。

圖12 異質學習網絡中的實體關系示意圖Fig.12 Schematic diagram of entity relationship in heterogeneous learning network
冷啟動是推薦系統的常見問題。推薦系統中的冷啟動問題又可以分為“項目”冷啟動問題和“用戶”冷啟動問題。在學習推薦系統中,“項目”冷啟動是指系統中加入了新的學習資源,而這些學習資源之前并沒有被學習者使用或評價過;“用戶”冷啟動是指系統中加入了新的學習者,這些學習者們在學習系統中沒有學習記錄,或只有很少的學習記錄。這兩種冷啟動問題均會導致“學習者-學習資源”評分矩陣的稀疏,使協同過濾推薦算法失去精確性?;贚STM 網絡的模型能夠通過訓練從數據中捕獲長期和短期的學習行為,從而達到預測較少學習記錄的學習者學習行為和效果的目的。文獻[86]提出一種基于LSTM 模型融合知識關系的全路徑學習推薦模型,基于學習者個性特征訓練LSTM 網絡,預測學習路徑及其表現,再根據預測結果進行學習路徑推薦,從而緩解學習者冷啟動問題。面向個性化學習問題,文獻[87]提出,在知識追蹤模型中引入外部信息能夠對冷啟動起到有效緩解作用。文獻[88]采用具備一致信息傳輸的跨域推薦方法,通過外部數據緩解冷啟動問題。文獻[89]建立學習者與課程的關聯規則模型,對于新的課程,基于注冊信息與學習日志數據,計算新課程與學習者的關聯度,并使用頻繁模式增長(frequent pattern-growth,FP-growth)算法生成推薦的可視化展示。此外,在推薦方法中融入社交網絡信息,也能夠緩解冷啟動和評分矩陣稀疏問題。文獻[90]提出了一種利用社交信息增強深度學習的學習資源推薦方法,并討論了使用社交信息緩解推薦冷啟動問題的優勢。文獻[91]提出了一種融合社交網絡信息的學習推薦方法,該方法基于學習者的社交網絡信息發掘社交網絡中的學習者之間所具有的潛在相似性,并對學習者聚類,再根據聚類標簽進行學習資源和學習好友推薦。
學習推薦系統的評估通常圍繞系統性能、用戶體驗和學習適用性三方面進行,本章將從這三方面對學習推薦系統的評估方法進行介紹。
推薦系統的核心性能是推薦的準確性,即推薦預測值與真值的接近或誤差程度。主要包括推薦預測的精度(accuracy)、召回率(recall)、1 分數、平均絕對誤差(mean absolute error,MAE)、均方根誤差(root mean square error,RMSE)等。有的研究同時采用多個指標的組合方式,以達到多角度評估的目的。比如文獻[60]和文獻[93]對所提出的推薦算法分別進行了精度、召回率和1 分數的評估。文獻[38]使用了召回率和排序質量的指標(normalized discounted cumulative gain,NDCG),因為NDCG 是一個有位置感知的度量標準,它能為推薦項目的排名列表更高位置的項目分配更高的分值,從而測量推薦列表的質量。在實際應用中,也可以對系統的性能進行單個指標上的評估,如文獻[94]只采用了1 分數,因為1 分數可以看作精度和召回率的一種調和平均,被認為能夠同時兼顧精度和召回率。也有的研究從誤差的角度來評估推薦系統性能,比如文獻[93]和文獻[95]采用了平均誤差(MAE),文獻[96]和文獻[97]則使用均方根誤差(RMSE)。雖然大部分推薦系統性能評估的指標可以用于學習推薦系統的性能評估,但是對于性能的評估只是學習推薦系統評估的角度之一。
文獻[60]對七種推薦的結果進行人工評估,結果表明用戶體驗的質量與推薦的高精度并不相關。一般而言,用戶體驗好的推薦內容,除了符合自己偏好外,還要盡量做到不與剛剛看過的內容完全相同或者非常相似,但是一味追求推薦的高精度往往會忽視這一問題。為了解決這一問題,近年來研究人員對推薦的“偶然性”開展研究。文獻[100]指出,現有大多數的推薦算法基于準確性評估,但難以保障推薦內容能夠滿足用戶需求、偏好的變化,因為單純準確性可能會導致所推薦內容沒有新意。為了獲得高的精度評估值,用戶可能僅收到那些與他們初始評分高的項目類似的推薦項目(過度專業化)。這必然會降低用戶體驗的滿意度。因此,用戶體驗評估的核心指標是推薦的“偶然性”,該指標通常采用新穎度(novelty)和多樣性(diversity)等二級指標來衡量。新穎度是指所推薦的項目在用戶過往的交互記錄中出現得越少越好;多樣性是指推薦列表中出現的項目越不相似越好,因為用戶可能對包含彼此非常相似項目的推薦列表感到不滿意。新穎而多樣的學習資源會在一定程度上激發學習者的學習興趣,即提高學習資源推薦的新穎度和多樣性會對學習者的學習熱情產生積極影響。文獻[42]結合練習題的題型、難度、涵蓋的知識點等特征,在對練習題推薦精度的基礎上,還對推薦的新穎度和多樣性進行了評估。對用戶體驗的評估也常采用人工方法。如文獻[103]和文獻[104]中,設計了用戶體驗量表,采用人工打分的方式進行評估,來衡量推薦的感知相關性,此外文獻[103]還采用人工打分方式評估了推薦的可用性。
學習適用性也是學習推薦系統評估的另一個重要方面,所采取的方式比較靈活,可以通過推薦系統對學習成績的影響,對學習積極性的影響來進行評估。在文獻[105]中,首先將學習者分為三類:第一類通過所提出推薦系統獲得推薦;第二類隨機獲得推薦;第三類沒有獲得推薦。然后通過比較三類學習者的成績來開展學習適用性評估。文獻[106]通過統計學習者對所推薦文章的閱讀、回復和發布頻率來評估推薦的適用性。文獻[107]將學習者在推薦影響下參與學習活動的頻率作為推薦適用性的評估依據。與文獻[105]一樣,文獻[108]和文獻[109]也都采用了“推薦前”和“推薦后”的成績對比來評估學習適用性。其中文獻[109]還預設了“適用性等級”,通過成績提升效果來衡量推薦適用性的級別。此外,文獻[108]和文獻[109]還通過對學習者在使用推薦系統前后的在線時長、互動頻率等進行了比較評估。文獻[18]和文獻[110]使用Felder-Silverman 學習風格指數問卷,通過測量使用推薦系統前后學習風格變化,來評估所提出推薦系統的學習適用性。文獻[111]使用“自我-同行”評估方法,應用知識指示事件(knowledge indicating events,KIE)來評估推薦系統對于學習者知識水平的影響。
目前可用于評估個性化學習推薦系統的通用數據集不多,從當前研究的應用場景來看,可以分為用于課程推薦、學習資源推薦以及學習路徑推薦三類。課程推薦常用到edX、Coursera、學堂在線(XuetangX)、中國慕課大學(icourse163)等在線課程平臺提供的數據集,比如edX 數據集可用于評估基于學習風格的課程推薦,XuetangX 數據集可用于評估基于學習偏好的課程推薦,icourse163 數據集可用于課程學習中的主題推薦。對于學習資源推薦常采用Amazon 產品數據集、ASSISTment 學習平臺數據集等,比如學習書籍推薦使用Amazon 的Book-Crossing 數據集、e-book 數據集,練習題推薦使用ASSISTment 數據集。對于學習路徑推薦而言,離線方法并不能提供可靠的結果,因為其假設學習者的行為不會隨時間發生變化,研究人員無法獲取適用于他們實驗的公共數據集,所以通常自組織數據集,比如文獻[15]和文獻[75]均使用了自組織的數據集對提出的推薦方法進行評估。
除此之外,還有不少研究人員使用自主研發平臺的數據集,或所在教學機構的數據集來測試推薦性能,以便于進一步對推薦效果進行評估。比如文獻[60]從名為PLEM 的學習平臺獲取數據集,用于驗證其基于標簽的學習資源推薦方法有效性;文獻[61]使用了作者所在大學(YZU)在2005—2009 年的課程學習數據集;文獻[68]使用了作者所在大學(University of Cordoba)計算機相關課程的數據集;文獻[67]使用了來自大學課程管理平臺UCAS 的數據集;文獻[73]使用了多所大學的課程學習數據來構成數據集。
不同方法的評估角度和目的不相同,系統性能評估通常根據推薦系統在測試數據集上的表現來實現,本質上評估的是推薦系統對訓練數據的學習能力表現,常使用精度、誤差等指標來衡量;用戶體驗評估在于測量學習者對所推薦學習資源的感受,常通過對新穎度、多樣性等指標的測量來評估是否出現推薦的過度專業化,從而彌補單純準確性評估的不足;學習適用性則注重于所推薦的學習資源是否有利于學習效果和學習質量的提升,常通過學生成績、學習時長等衡量。性能評估任務能夠使用離線數據集完成,用戶體驗和學習適用性則可能需要加入真實教學場景中的實驗。從現有的研究可以看出,對學習推薦系統的評估逐漸傾向于采用多種方法組合互為補充的方式,通過評估方法測量到學習推薦系統的不同效應也越來越豐富和多樣化,尤其是對用戶體驗和學習適用性的評估,以及評估中所涉及到的數據隱私問題近年來也越來越受到研究人員的關注。
學習推薦是人工智能教育的核心研究內容,其目標是為學習者匹配到最適合的學習資源或路徑,這種匹配并非僅僅迎合學習者的興趣,而應該以激發和培養學習動機,提高學習者的學習積極性和持久性,達到提升學習效率為目標。鑒于此,本文從學習推薦系統的通用框架結構出發,將其分解為三個核心問題,即:學習者建模、學習推薦對象建模以及學習推薦方法。具體而言,在學習者建模方面,應根據需求組合多種學習者個性化參數構建學習者模型,并采用能夠充分保留學習者特征語義的建模方法。在學習推薦對象建模方面,所提取的特征應與學習者的個性化參數相匹配,不同類型對象的特征表示應該統一,且符合算法模型的輸入要求。在學習推薦方法方面,應以學習活動的開展為背景,并圍繞學習者與學習資源的交互行為進行設計。學習推薦系統的總體設計思路,不能脫離學習活動的規律,且有必要適時結合人工評估,或真實教學場景下的實驗開展用戶體驗和學習適用性的評價。在未來的研究中,學習推薦系統可能在學習者狀態獲取和表征,以及學習場景建模等方面產生新的發展。
(1)學習效果預測
學習效果預測是自適應學習的研究熱點。學習推薦系統的目標之一是通過推薦對象提升學習效果,因此在推薦系統中融合學習效果預測,能夠對推薦方法的適應性進行預檢驗,有利于及時調整和優化推薦策略。
(2)多特征學習狀態表示
學習者的個性化參數較多,且認知水平、情緒狀態、學習風格等多種特征會隨著學習活動的開展產生變化。如何及時捕獲這些特征的變化并進行有效表示,將是學習者建模研究的一個重要方向。
(3)基于網絡理論和圖方法的學習推薦
隨著在線學習環境的拓展和形式的多樣化,學習交互行為的類型越來越豐富,“學習者-學習者”“學習資源-學習資源”以及“學習者-學習資源”之間的關系越來越復雜,形成了復雜的圖或網絡結構。與線性結構相比,網絡或圖結構能夠反映更真實的情境,表達更豐富的信息。因此,運用圖計算和圖神經網絡技術對學習者建模和學習資源建模,并設計基于圖的學習推薦算法模型,將是未來學習推薦研究的熱點方向。
隨著智慧學習和人工智能教育的廣泛應用,個性化學習推薦技術也在不斷發展,但這過程中還需對體系框架、學習者建模、學習推薦對象建模、推薦算法等核心關鍵技術進行持續探索。同時,還要甄別與其他推薦系統在推薦目標上的差異,深度融合教育學、心理學相關理論和方法,搭建針對用戶體驗和學習適用性的評估體系,并積極推廣至學習系統中,促進在線教育的內涵發展,推動在線學習系統的技術創新。