999精品在线视频,手机成人午夜在线视频,久久不卡国产精品无码,中日无码在线观看,成人av手机在线观看,日韩精品亚洲一区中文字幕,亚洲av无码人妻,四虎国产在线观看 ?

在線學習資源推薦綜述

2023-07-03 14:11:30董永峰王雅琮鄧亞晗
計算機應用 2023年6期
關鍵詞:資源課程

董永峰,王雅琮,董 瑤*,鄧亞晗

(1.河北工業大學 人工智能與數據科學學院,天津 300401;2.河北省大數據計算重點實驗室(河北工業大學),天津 300401;3.河北省數據驅動工業智能工程研究中心(河北工業大學),天津 300401)

0 引言

近年來,信息科技的迅猛發展給各行業帶來了一系列新的產業戰略機遇和市場挑戰,教育產業亦然;但傳統的教育模式已經難以滿足學習者的需求,如今越來越多的人選擇通過線上學習來提升自我。

國內外己出現一批成熟的在線教育平臺,緩解了學習者對學習新技能的急迫需求,為教育行業帶來了變革,同時也帶來了相應挑戰:一方面,學習者很難從海量的學習資源中獲取所需學習資源,需花費大量時間尋找學習資源,降低了學習的效率;另一方面,平臺無法為學習者提供個性化的學習資源,難以預測學習者個體的學習進度,導致部分學習者對所學課程難度不適應,對所學內容不感興趣,無法完成課程。因此,個性化學習資源推薦應運而生。個性化在線學習資源推薦泛指通過數據分析方法提取每位學習者的特征與偏好,量身推薦能夠滿足他們個性化要求的在線學習資源,其中在線學習資源通常指習題、概念、知識點、線上課程、學習視頻等。通過在線學習資源推薦,學習者無需將精力花費在尋找學習資源中,而將更多的時間投入感興趣資源的學習中,提高了學習效率和效果。本文首先總結了當前主流國內外在線教育平臺中的學習資源推薦行為,并從兩個角度出發:1)從不同推薦目標的角度,總結分析了以知識點習題、學習路徑、學習視頻、課程為目標的推薦算法的優缺點;2)從學習者和學習資源建模角度總結了基于學習者畫像、學習者行為、學習資源本體的推薦算法并詳述算法流程;總結了當前可用學習資源數據集;根據當前學習資源推薦算法現狀指出學習平臺、冷啟動、算法普適性和隱私保護等方面的不足以供未來研究參考。

1 國內外在線教育平臺現狀

1.1 國外在線教育平臺

MOOC(Massive Open Online Course)是一種可以讓學習者通過MOOC 網站自由注冊和使用的開放網絡在線教育服務模式[1]。自2012 年起,MOOC 逐漸成為世界范圍內的一種相當普遍的教育模式。

Udacity 是一個盈利性在線教育平臺,專注專業研發和前沿技術的在線培訓。當學習者在Udacity 上選擇其感興趣方向后,平臺將此方向的所有課程根據難易程度排序推薦,一目了然。

Coursera 是于2012 年4 月正式成立的大型網絡公開在線課程平臺,由美國斯坦福大學的兩名計算機科學專業教授共同創建。在學習者瀏覽Coursera 某一課程時,平臺將顯示其他用戶對該課程的評價,同時推薦對這門課程感興趣的人同樣感興趣的其他課程。

edX 是一個由美國哈佛大學和美國麻省理工學院于2012 年4 月共同合作創立的非盈利的大型開放式課程平臺。平臺為學習者推薦最新的和最頂尖的課程,并根據學習者填寫的感興趣方向定制個性化課程搜索。

除了這三大領先的MOOC 平臺以外,國外還有一些比較成熟的教育平臺,如可汗學院(Khan Academy)。許多國家區域也開創了屬于自己本國的MOOC 平臺,如英國的Future Learn、澳洲的Open2study、歐盟的OpenupEd 等。

1.2 國內在線教育平臺

國內的MOOC 也在迅速發展。國內許多教育機構和高校也開始意識到創建自己的平臺并收集數據信息的重要性。

清華大學于2013 年10 月建立學堂在線平臺,為學習者推薦優質課程、熱銷課程、國家一流課程等,以幫助學習者更迅速地選擇課程。

依托高等學校本科教學質量與教學改革工程的背景,中國大學MOOC(又稱慕課),由網易旗下的網易云課堂與愛課程網攜手打造。平臺為學習者推薦一周內最新最熱門的課程,并根據學習者選擇的課程推薦相關其他課程。

網易云課堂由網易公司于2012 年12 月底推出,主要提供在線實用技術視頻課程。學習者選擇感興趣的方向后,平臺為其推薦相關課程。

除在線課程教育平臺外,許多教育機構還對線上教育的不同模式進行了探索。2016 年4 月,清華大學和學堂在線聯合發布推出了新型智慧教學解決方案——雨課堂。

與雨課堂不同,科大訊飛基于學生學情、學科教學內容等數據,構建了教育領域知識圖譜。教師通過預設教學重點,使用科大訊飛所提供的知識點圖譜引導學生學習,提升了學習效率,達到使學習者自主學習的目標。

現有在線教育平臺種類繁多,但存在課程完成率低的通病,其中一個重要的原因是平臺提供的課程不足以吸引用戶,說明在線教育平臺維系用戶規模的能力嚴重不足。盡管這些在線教育平臺都為學習者提供一定程度的課程推薦,但推薦結果單一,通常僅推薦熱銷課程,不具有個性化特征,致使學習者很難在繁多的課程中找到適合的感興趣的課程,在線學習資源推薦的研究工作亟須推進。國內外在線教育平臺見表1。

表1 國內外在線教育平臺Tab.1 Domestic and international online education platforms

2 基于不同推薦目標的學習資源推薦算法

學習資源包含知識點、習題、學習視頻、課程等多種類型,不同類型的學習資源分別具有獨特的數據形式和特征分布。針對這一問題,研究者通常使用特定的方法解決不同目標的學習資源推薦問題,本章總結了以知識點習題、學習路徑、學習視頻、課程為推薦目標的常用算法及優缺點。

2.1 以知識點習題為目標的推薦算法

知識點習題推薦的難點在于知識點或習題中通常包含多個異構數據,即文本、概念和圖像等。如何整合這些材料,以多模態的方式幫助學習者學習和理解,如何將同一個習題中文本的不同部分與不同的概念或圖像關聯起來都是困擾著研究者的問題。最常見的知識點習題推薦算法有兩種:基于習題相似度的知識點習題推薦和基于學習者認知的知識點習題推薦。

2.1.1 基于習題相似度的知識點習題推薦

當學習者想針對某一薄弱知識點進行強化練習時,通常利用知識點習題相似度為學習者提供相似知識點習題推薦。

最開始,一些研究者利用練習的文本或概念計算習題的相似性。Williams等[2]認為,相似的習題通常具有共同的核心概念,通過概念相似性分析習題是否相似。向量空間模型(Vector Space Model,VSM)是海量題庫系統中常用的試題相似度度量方法。Tsinakos 等[3]提出使用一種基于VSM 結合詞頻-逆文檔頻率(Term Frequency-Inverse Document Frequency,TF-IDF)和余弦相似度的沖突檢測算法計算習題之間的相似性。針對VSM 在準確表示不同特征詞的知識關系和潛在語義關系方面的局限性,Yu 等[4]提出了一種結合領域本體和VSM 的試題相似度度量方法,通過結合VSM 中的特征向量和單詞權重揭示單詞之間的內在關系,計算試題的相似度。除VSM 外,Li 等[5]提出了一種基于機器學習的習題推薦方法,使用K-means 算法和K最近鄰分類算法(K-Nearest Neighbors,KNN)根據學習者對知識點的掌握程度和對所有知識點的平均掌握程度,將學習者分類,針對不同類別推薦適合的習題。

以上方法都建立在單一類型數據集的基礎上,沒有綜合利用多種異類數據來精確地理解和表示每個習題的語義。針對這一問題,Liu 等[6]開發了基于多模式注意力的神經網絡框架。對于包含多種類型信息文本的習題,模型使用卷積神經網絡(Convolutional Neural Network,CNN)提取圖像表示,使用嵌入層表示概念。通過一個基于注意力的長短期記憶(Long Short-Term Memory,LSTM)網絡,以多模式的方式處理異構材料,學習每種練習的統一語義表示。

基于習題相似度的知識點習題推薦方法從知識點習題本身出發,雖然可以更好地利用本體之間的關系,卻忽視了學習者本身的知識狀態和認知情況,因此有研究者提出了基于學習者認知的知識點習題推薦方法。

2.1.2 基于學習者認知的知識點習題推薦

目前,使用多種認知診斷模型對學生的認知進行建模和分析[7],以達到良好的推薦效果也是一種主流知識點習題推薦方法。

基于項目反應理論(Item Response Theory,IRT)[8]、DINA(Deterministic Inputs,Noisy“And”gate)[9]和基于協同過濾算法[10]是幾種經典的基于認知的知識點推薦方法。IRT 模型和DINA 模型都來源于數學統計模型,其中:IRT 模型使用統計方法建立平均分排名等數學理論模型,被廣泛應用于預測學生的綜合能力和區分練習難度,但通常只考慮了學習者的狀態,卻忽視了習題特點;DINA 模型是針對二進制數據的統計模型,引入了矩陣Q來建模習題和知識點間關聯,從而判斷學習者對正確回答該問題所需的每一個知識點掌握與否。通過這些信息了解其學習中的不足,據此向學習者推薦習題,但是DINA 模型往往忽略了學習者未考察的知識點[11]。協同過濾算法假設行為相似的用戶偏好相似,因此可以向用戶推薦相似用戶的偏好項目。目前的基于協同過濾的習題推薦算法中,通常從學習者的習題記錄中分析其偏好,再對比計算其他學習者的相似度,根據相似度最高的學生偏好進行習題推薦;但該方法在推薦習題時,忽略了不同學習者對不同知識點的理解程度差異。

針對以上這些算法的不足,研究者嘗試引入知識點之間的關聯信息。蔣昌猛等[12]提出了使用知識點層次圖對習題進行個性化的推薦,根據知識點天然存在的結構層次關系,輔以專家知識建模,成功地構建了知識點的層次關系。Zheng 等[13]提出了一種基于知識結構樹的習題推薦算法,通過量化學生認知水平,根據其學習相關數據獲取學生的知識需求,基于知識點的關聯關系構建知識結構樹,將知識需求與知識結構樹相結合,向學習者推薦習題。

基于學習者認知的知識點習題推薦方法大多都基于學生本身的認知狀態與習題記錄為學習者進行推薦,卻往往忽視了知識點習題中彼此間聯系。

2.2 以學習路徑為目標的推薦算法

在種類繁多的在線學習資源中,使用個性化推薦系統是幫助學習者高效和精準地獲取學習資源的有效途徑。特別地,對于學習者,按照一定的學習路徑可以更高效地學習。Durand 等[14]基于圖論證明了學習資源的順序對學習者的重要性。Chen 等[15]指出學習先驗知識和后驗知識有助于學習者理解當前的學習資源,這也支持將學習資源分類生成為學習路徑的觀點。學習者可以在推薦的學習路徑中依次學習,可以更加系統有效地達到最終學習目標。目前常用的學習路徑推薦方法主要分為基于數據挖掘的學習路徑推薦和基于知識圖譜的學習路徑推薦。

2.2.1 基于數據挖掘的學習路徑推薦

數據挖掘被廣泛應用于將學習內容組織成學習路徑。Chen[16]構建了一個基于基因的個性化網絡課程學習系統,生成適合學習者的學習路徑,系統挖掘個體學習者測試數據和學習成績數據。Dwivedi 等[17]改進了這一方法,通過包含學習者學習路徑記錄的可變長度遺傳算法(Variable Length Genetic Algorithm,VLGA)構建學習路徑。Chen 等[18]提出了一種基于坐標系的改進蟻群優化算法推薦學習路徑。Bendahmane 等[19]提出了一種基于學習者能力的方法,該方法認為個性化的學習路徑取決于所收集的軌跡在學習環境中的活動,故根據學習數據、學習者的期望,定制學習環境和適應學習者的學習路徑,提高學習質量。Hsieh 等[20]使用數據挖掘方法開發了一個在線課程學習系統,該系統通過構建學習材料的關系層次,生成適合學習者的學習路徑。

通過這些基于數據挖掘的方法,學習者不需要浪費額外的時間組織學習內容。但是目前存在兩個問題:第一,此類學習系統中更新數據困難,這些非自適應的習題每次更新數據時都要重新生成新學習路徑;第二,當系統中存在多個相似的學習內容時,生成的學習路徑有時會存在冗余的學習資源。

2.2.2 基于知識圖譜的學習路徑推薦

在研究如何利用知識圖譜生成良好的學習路徑時,大部分研究者選擇將學習資源視為節點,將關系視為學習路徑中的路徑。

最早的有關知識圖譜路徑的研究引入了連接模式,稱為元路徑,以指導被推薦者學習[21]。元路徑被定義為一個實體類型的序列,捕獲以知識圖譜為單位的學習者行為偏好。Yu 等[22]提出在元路徑相似矩陣上使用矩陣分解進行學習路徑推薦,此類方法的性能依賴于元路徑的質量,而這需要大量的領域知識。Catherine 等[23]利用邏輯編程模型推斷用戶在路徑上的偏好。

這些方法無法學習用戶和項目的表示,因此很難推廣到隱性交互中。為了解決這些問題,最近的研究學習了每條路徑的表示。Hu 等[24]利用CNN 嵌入實體以獲得路徑的單一表示,卻忽略了路徑中實體和關系的順序依賴性。Sun 等[25]采用了循環神經網絡(Recurrent Neural Network,RNN)嵌入實體,從而獲得路徑表示,但這樣的路徑建模僅涉及實體嵌入。這些限制可能會損害模型的推理能力。

上述基于連接關系的知識圖譜學習路徑推薦方法并未充分利用知識的連通性,一個好的學習路徑推薦模型應該能夠生成滿足不同場景下不同學習需求的學習路徑。針對這些問題,研究者使用多維的知識圖譜建模包含多種類型的實體和關系。Shi 等[26]提出了一種基于多維知識圖框架的學習路徑推薦模型,由多維知識圖譜和學習路徑推薦模型兩個模塊組成,通過構造多維知識圖表達學習資源間復雜語義關系,從而達到學習路徑推薦的目的。Zhou 等[27]提出了在多維知識圖譜的基礎上,使用課程序列為學習者推薦學習路徑。構建多維課程知識圖譜后,使用AprioriAll 算法從學習者的過往交互數據中挖掘目標知識點,生成學習路徑并推薦給學習者。

基于知識圖譜的學習路徑生成算法根據個體的學習需求和節點間關系生成約束,從而生成學習路徑推薦;但算法中知識圖譜嵌入表示是否有效,能否與學生個性化需求完美結合,這些問題仍困擾著研究者。

2.3 以學習視頻為目標的推薦算法

隨著在線教育的普及,傳統的教育形式正越來越多地被在線學習形式取代,諸如Bilibili、Youtube 和Coursera 之類的視頻網站為希望學習特定主題的人們提供了更多的選擇和豐富的學習資源。許多著名的大學提供在線學習視頻,以便國際學習者參加他們的課程。此外,在線視頻教育能夠到達難以建立傳統學校的偏遠地區,不僅幫助了更多人接受更好的教育,而且降低了教育成本。通常學習視頻推薦方法分為基于協同過濾的學習視頻推薦和基于內容的學習視頻推薦。

2.3.1 基于協同過濾的學習視頻推薦

協同過濾被認為是推薦系統中最流行的算法,它為用戶提供了其感興趣的相似項。陳漢福[28]構建了基于協同過濾的學習視頻推薦系統,根據學習者觀看和收集視頻的行為構造學習者與視頻之間的交互向量,利用交互向量測量學習者之間的相似性,并據此向學習者推薦學習視頻。Choi 等[29]提出一種基于學習者面部表情的學習視頻推薦方法,通過捕獲用戶面部表情的變化分析學習者當前偏好,以解決學習者觀看視頻時經常存在的學習者偏好改變問題。Sincan 等[30]提出了一種新的基于內存的協同過濾視頻推薦算法。Ding等[31]使用多元線性回歸模型,通過分析一系列針對視頻的用戶行為自動計算用戶的偏好,無需用戶進行評分操作。針對視頻描述之間的語義關系,Yu 等[32]分別對視頻相似度矩陣和用戶相似度矩陣進行歸一化處理,并引入知識圖譜,基于多路徑關系的置信度進行推薦,并將推薦結果與協同過濾推薦結果進行融合。

由于在線教育平臺上缺乏明確的評分數據,越來越多的基于協同過濾的學習視頻推薦系統通過隱式反饋收集用戶偏好,例如視頻觀看時長和視頻觀看時間;但是,這些系統往往忽略學習者的視頻暫停和拖動行為,這些行為同樣反映了學習者對視頻的偏好。盡管協同過濾算法已被廣泛應用,但算法本身仍然存在數據稀疏、可伸縮性差和冷啟動問題,嚴重限制了推薦質量。

2.3.2 基于內容的學習視頻推薦

解決冷啟動問題的一種方法是基于內容為用戶進行推薦,核心思想是基于對所推薦項目的內容分析,向用戶推薦類似的項目。熊玲[33]提出了一種基于標簽的視頻推薦方法,該方法通過標記觀看視頻記錄構建學習者的興趣模型,為學習者提供學習視頻推薦。Tsai 等[34]提出了一種自適應個性化排名機制,該機制使用基于偏好和基于鄰居興趣的方法對學習對象與用戶意圖的相關程度進行排序,用本體描述視頻學習資源,為主動學習者提供合適的學習視頻資源。Cui 等[35]提出了一種新穎的基于視頻內容和社交網絡的視頻推薦算法,由信任朋友計算模型和視頻的質量評估模型組成。Li 等[36]提出了一種利用深度卷積神經網絡緩解冷啟動問題的基于內容的視頻推薦方法。Deldjoo 等[37]提出了一種基于視頻內容的推薦系統,該推薦系統可以自動分析視頻內容,并基于當前應用傳感器和媒體學習理論推薦同風格的視頻。Lee 等[38]將視頻推薦建模為基于視頻內容的相似性學習問題,并采用了深度學習進行視頻嵌入,這些經過訓練后的視頻嵌入可以預測基于共同觀看的系統識別的視頻關系。Bhatt 等[39]提出了一種視頻推薦算法,將基于主題的視頻表示與主題間關系的順序模式挖掘相結合。針對不存在明顯組織關系的學習視頻,Tang 等[40]設計了面向特定學習方向的概念導航系統,通過對已搜索到的學習視頻文本展開內容分析,根據分析結果生成關聯概念和視頻內容的概念圖,并基于此為學習者推薦學習視頻,提高視頻學習的效率,幫助學習者探索感興趣的知識。

由于基于內容的課程視頻推薦通常使用標簽和本體描述視頻,導致此類方法很大程度上忽略了各個學習視頻之間的知識相關性。

2.4 以課程為目標的推薦算法

課程推薦是一項重要且具有挑戰性的任務,特別是在互聯網發展迅速、教育資源豐富多樣的當下。其主要挑戰在于目前大多數學術領域都存在大量學習資源,而在課程學習時卻不可避免地忽視學習者對特定知識的個性化需求。因此,及時捕捉學習者行為并對其學習過程進行個性化指導是重要且必要的。

為了解和捕捉學生對課程的興趣,研究者在多個方面進行了研究,包括課程推薦、行為預測、用戶畫像等。傳統的基于協同過濾的課程推薦策略考慮學生的歷史互動,并根據具有相似興趣的用戶的潛在共同偏好提出推薦。這樣的方法通常會因為學生和課程交互的稀疏性問題而限制了推薦性能。因此,部分研究者提出通過利用諸如用戶信息、項目屬性信息、社交網絡、圖像等輔助信息解決這個問題。

在線學習平臺積累了大量的學習者與網站的互動數據。通過這些交互數據和學習者本人信息可以發現其學習模式。Rawat 等[41]提出了一種基于學習者個人特征的課程推薦方法。該方法在考慮學習者的知識水平和技能水平的基礎上,根據學習者的個人資料和學習日志對他們進行分類,然后采用關聯規則挖掘向學習者推薦合適的課程。

知識圖譜作為一種新型的圖結構,同樣可以作為輔助信息緩解冷啟動問題。Jung 等[42]設計了一個知識圖譜增強的個性化課程推薦框架。通過學習者和課程相關的關鍵字,整合課程的內部信息和外部知識,使用知識圖譜作為輔助信息提高推薦性能,嵌入學生課程水平,向學習者推薦課程。

除此以外,研究者還嘗試引入其他輔助信息。李弘運[43]設計了使用微博賬號登錄的在線學習資源管理平臺,并通過系統收集了用戶的社交信息和課程的學習者評分,改進基于協同過濾的推薦算法為學習者提供課程推薦,根據課程內容的相似性解決了新課程的冷啟動問題。Gulzar 等[44]設計和開發了一種混合推薦系統,構建了課程本體,混合方法與本體一起被用來檢索有用的信息并作出準確的推薦,方便學習者獲取信息,并為其提供個性化服務。賀超波等[45]構建了基于興趣社區的在線學習服務,通過分析論壇中學習者的多種互動數據,挖掘學習者間的關聯,建模學習者興趣特征,依據關聯度次序向學習者推薦課程。Yin 等[46]針對MOOC 平臺設計了基于LDA(Latent Dirichlet Allocation)的課程推薦算法,該算法構建了基于LDA 主題模型的學習者興趣模型,并結合項目的分布構建了主題和學習者得分矩陣,利用主題模型本身的優點減少計算量,與傳統的用戶程序矩陣方法相比,能更準確地挖掘學生的潛在興趣。

3 基于學習者和學習資源本體的推薦算法

鑒于學習資源的數據多樣性,學習資源推薦算法通常因推薦目標不同而結構差異巨大,但總體可以劃分為從學習者建模和從學習資源建模兩方面出發的學習資源推薦算法。基于此,本文總結了基于學習者和學習資源本體這兩類常用學習資源推薦算法并以通用的方法為例詳述了算法具體流程。

3.1 基于學習者的學習資源推薦算法

作為學習資源推薦的主體,學習者建模是個性化學習資源推薦系統中最重要的部分,只有精準地建模學習者偏好,才能實現高效的推薦。基于學習者的推薦算法主要介紹常用的基于學習者畫像和基于學習者行為序列這兩種算法。

3.1.1 基于學習者畫像的推薦算法

用戶畫像指將真實用戶的相關數據經過算法的分析建模后,根據用戶的偏好生成相應的用戶模型。根據用戶畫像的原理,可以利用算法生成學習者畫像,將學習者劃分成不同類型,基于學習者畫像個性化推薦不同學習資源。陳海建等[47]等根據腦電研究的原理,對學習者基本信息、知識點興趣、學習風格和學習偏好等方面進行了學習者畫像,通過標簽化處理將學習者劃分成多個類,并分別為不同類型的學習者提供教學方面改進建議,這表明通過挖掘學習者的個人數據建立學習者畫像能夠達到精準教學的目的。

其中n表示規定的學習行為向量維度。

通常學習行為的特征值間存在較大差異,因此通過對向量特征進行歸一化處理保證各個特征間具有水平相當的影響。在歸一化后,使用K-means 算法對特征數據進行聚類分析時,首先處理學習者標簽,使用特征詞作為其特征標簽。然后通過K-means 算法得到聚類的劃分群體,再為每個學習者群體構建學習者畫像。另一方面,根據學習者歷史信息獲取學習者目前的學習興趣,可以使用余弦函數進行相似度計算,如式(2)所示:

其中:KWi和KWj分別表示兩個不同的關鍵詞,ki和kj表示知識點的特征向量。通過學習者畫像高度概括學習者個人性格屬性特征,再和已經計算好的知識點相似度等內容一起應用到學習資源個性化推薦中,為類型相似的學習者推薦其感興趣的知識點,達到更優的學習資源推薦效果。

除K-means 聚類外,研究者還嘗試通過不同技術構建學習者畫像。王莉莉等[49]使用了雙向長短期記憶網絡和注意力機制建模學習者畫像。葛迪等[50]從行為、對象、場景這3個方面構建學習者畫像,并使用圖神經網絡自適應地動態更新畫像。

基于學習者畫像的學習資源推薦算法通過劃分學習者類型建模學習者偏好,但不能準確針對特定學習者行為進行個性化推薦,因此研究者使用基于學習者行為序列的推薦方法解決這一問題。

3.1.2 基于學習者行為序列的推薦算法

學習者行為序列通常指學習者于在線教育平臺上學習時,根據每個學習行為開始和結束的時間,生成遵循時間順序的學習行為序列[51]。以最經典的基于學習行為序列相似度推薦算法為例,通常可以將學習者行為序列建模為序列集合S={(x1,y1),(x2,y2),…,(xi,yi),…,(xn,yn)} (n≥2)。其中(xi,yi)表示序列中學習者第i個學習行為,xi表示學習資源;yi表示該學習者對學習資源實施了相應的操作。用si表示學習者的第i個行為狀態,即學習者行為序列數據中第i個元素對中的元素xi和yi鏈接組成的行為狀態。

首先求得兩個狀態序列Ci和Cj最大公共狀態子序列。在此基礎上,獲得Ci和Cj狀態次序相似度,如式(3)所示:

其 中:comm(Ci,Cj) 為Ci和Cj的最大 公共狀 態子序 列;|Ci∪Cj|代表Ci和Cj的所有的行為狀態數;len()表示包含的狀態數。

設Ci中包含γ+1 個行為狀態,Cj中包含ω+1 個狀態,則Ci中的狀態轉移個數為γ,Cj中的狀態轉移個數為ω。假設Ci和Cj存在ε個相同的狀態轉移,對于第i(1 ≤i≤ε)個相同的狀態轉移,取其在Ci和Cj中發生的最小轉移次數作為第i個狀態轉移的次數τi。對ε個相同狀態轉移的次數求和得到φ。則兩個狀態序列Ci和Cj的狀態轉移相似度計算公式為:

兩個狀態序列Ci和Cj的狀態值相似度計算公式為:

兩個行為序列Si和Sj的最終的相似度函數是由式(3)~(5)的結果分別根據不同權重線性組合得出:

其中:α+β+δ=1,α>0,β>0,δ>0。

基于計算得出的行為序列相似度,對行為序列具有較高相似性的學習者,采用協同過濾算法進行學習資源推薦,即參考興趣相似的其他用戶的評價信息,預測學習者對于未交互的學習資源的興趣。

3.2 基于學習資源本體的推薦算法

學習資源推薦算法的另一常用方法是根據學習資源本體間特征及資源間相互間關系為學習者推薦學習資源,可以有效解決協同過濾算法在面對無歷史信息的新用戶和與用戶數量相比數量龐大的學習資源時,出現的冷啟動和用戶信息稀疏問題。盧春華等[52]提出了基于本體的神經網絡推薦模型。

在已建立學習者與學習資源本體的基礎上,使用TransR(Translating entity space and Relation spaces)構建學習者與學習資源的關系網絡。對于每個含有關系的三元組,使用轉移矩陣Mr將頭實體h和尾實體t映射在關系空間。頭、尾實體的投影向量分別定義為hr=hMr和tr=tMr。則目標函數定義為:

首先最小化目標函數,在嵌入層得到實體和關系的向量表示,使用輕量級雙向循環神經網絡對學習序列進行建模。以門控循環單元(Gated Recurrent Unit,GRU)作為基本單元,有效獲取學習長期偏好,提高網絡更新效率。GRU 的激活函數將上一個時間步t-1 的狀態和當前時刻t的狀態線性組合:

更新門zt的表達式為:

重置門rt的更新公式為:

當前狀態激活函數的定義為:

其中:xt表示當前t時刻的輸入,ht-1為上一時刻t-1 的隱含向量,σ為激活函數,⊙表示Hadamard 運算。

學習資源-注意力機制的設計使得解碼器能夠在學習資源的序列中動態地選取數據,對所有被選取的結果都進行了線性組合,以便于決定哪類學習資源會影響推薦結果,在獲取不同學習者的不同學習資源偏好后,編碼器部分的輸出公式如下:

其中:a為計算得出的注意力系數。

將編碼器輸出的學習者對已學習和已瀏覽資源的偏好,輸入到解碼器中,同時輸入候選的學習資源實體和學習者實體。將三者通過雙向RNN 層和前饋隱藏層,通過激活函數得到各候選的學習資源實體的長度劃分平均值。其中,網絡權重的更新采用隨機梯度下降法,損失函數則采用交叉熵損失,函數定義如下:

其中,x是預測結果的分布;y是實際學習序列的分布。模型結構如圖1 所示。

圖1 基于本體的神經網絡推薦算法結構Fig.1 Structure of neural network recommendation algorithm based on ontology

4 學習資源數據集

學習資源領域的公開數據集較少,一方面由于數據通常包含學習者的隱私,數據公開難免涉及隱私泄漏問題;另一方面,構造這類數據集通常需要大量的人力物力,因此許多研究者選擇使用非公開的數據集。基于此種緣由,創建在線教育平臺時,開發人員就應當注意收集用戶的學習行為數據等,這些數據記錄為教育教學的研究起到了重大作用。為了便于研究者針對學習資源推薦這一特定問題的研究,本文總結了目前主要的公開學習資源數據集,如表2 所示。

表2 公開學習資源數據集Tab.2 Public datasets of learning resources

edX 教育數據集 edX 是由美國哈佛大學、麻省理工學院兩校共同創建的非盈利性質的在線教育平臺。2014 年5月,edX 平臺發布了平臺的開放數據集。數據集包括2012 至2013 學年edX 平臺上共290 門課程開放數據,包含課程編號ID、上線日期、課程名稱、講師、課程主題、是否提供認證、拿到認證人數、用戶年齡中位數、男性占比、女性占比等23 個字段。

Canvas Network 開放數據集 Canvas Network 是一個開放在線課程平臺。2016 年3 月Canvas Network 公布的數據集包括該平臺的10 個學科門類里的238 門課程,課程中醫學、計算機、數學等科學類課程占少數,大部分為職業應用類課程,有130 門之多。公布的數據集包含學習者信息、課程信息等26 個字段。

HarvardX Person-Course Academic 數據集 包含 edX 平臺上哈佛大學2012—2013 學年秋季、春季和夏季的學習者數據。數據集包含課程ID、學習者ID、學習者國籍、分數等20 個字段。

英國開放大學學習分析數據集(Open University Learning Analysics Dataset,OULAD)英國開放大學是一所完全在線的大學,他們公布了2012/2013 學年和2013/2014 學年7 門課程的匿名數據,其中3 門是社會科學課程,4 門是理工科課程。數據集包含關于學生的地域信息、人口統計、個人數據、參與校內活動情況、課程交互信息等。

MOOCCube 教育數據倉庫 MOOCCube 是清華大學和學堂在線聯合創建的一個開放數據倉庫,收集了來自學堂在線教育平臺的真實用戶行為數據,包括用戶與學習視頻交互、留言等。作為附加資源,MOOCCube 還包含一個大型概念圖和相關學術論文。

MOOPer數據集 MOOPer數據集是由國防科技大學和在線實踐教學平臺頭歌平臺(EduCoder)共同發布的大型開放實踐數據集。數據集包括平臺2018至2019年間用戶參與實踐練習的交互數據,并將課程、實踐、關卡、知識點等實體屬性信息及相互關系構建為包含11類實體,10類關系的知識圖譜。

5 結語

隨著現代信息科學技術的飛速發展,傳統授課模式遭受了前所未有的嚴峻挑戰,越來越多的新技術加入課堂中。無論是線上教育平臺還是輔助授課軟件,都為學習者創造了更多的學習機會與更好的學習條件。多種個性化學習資源推薦算法都幫助學習者更快地找到適合自己學習風格的學習資源,但是截至目前,在學習資源推薦領域仍有幾大問題還未解決。

1)學習平臺移動端穩定性。

科技發展使得移動設備更加普及,越來越多學習者使用電子設備進行課程學習,這對學習平臺和輔助授課軟件的硬軟件設施提出了要求。在復雜的情況下能否利用有限的資源為學習者提供準確的學習資源推薦,特別是一些視頻直播課程,平臺需要在移動客戶端為每位學習者提供穩定同步的課程進度、習題測試,保證平臺移動端的穩定性。

2)冷啟動問題。

冷啟動問題指一個新的系統啟用時或新用戶使用系統時,由于系統內無足夠的數據以分析新用戶的偏好,導致新學習者在使用在線學習資源推薦系統時推薦不準確的問題。目前研究者已嘗試許多方法緩解推薦算法中的冷啟動問題,例如,引進社交信息、引入專家知識等,但是這類方法通常很難拓展遷移到其他模型中,導致無法有效解決冷啟動問題。

3)推薦方法的普適性。

推薦方法通常是針對某一特定問題而開發,不同方法適用對象不同。因此,在進行學習資源推薦時應針對不同算法缺陷,選取最適合學習者的個性化推薦算法。目前的一大趨勢是使用混合推薦策略改善推薦效果,但是多種推薦算法能否很好地結合仍是未知數。

4)隱私保護問題。

近幾年來,人們越來越重視個人數據的隱私問題。對于在線學習資源推薦方法,分析數據并從中獲取偏好時,需要收集學習者的個人信息、社交信息、學習水平等數據,因此在使用時更要額外注意學習者隱私信息保護,避免隱私泄露。另一方面,面對一些脫敏數據,在線學習資源推薦方法需要正確地分析提取學習特征,避免推薦效果受其影響。

針對以上這些問題,研究者們仍然需要進行不懈的努力,提高在線學習資源的推薦準確性和算法普適性,以使在線學習者獲得更好的學習體驗和學習效果。

猜你喜歡
資源課程
讓有限的“資源”更有效
基礎教育資源展示
《無機化學》課程教學改革
云南化工(2021年6期)2021-12-21 07:31:42
數字圖像處理課程混合式教學改革與探索
軟件設計與開發實踐課程探索與實踐
計算機教育(2020年5期)2020-07-24 08:53:38
一樣的資源,不一樣的收獲
為什么要學習HAA課程?
資源回收
資源再生 歡迎訂閱
資源再生(2017年3期)2017-06-01 12:20:59
“學而時習之”的課程值得贊賞
教育與職業(2014年1期)2014-04-17 14:28:07
主站蜘蛛池模板: 欧美国产日韩在线| 黑人巨大精品欧美一区二区区| 中文字幕永久在线看| 国产h视频免费观看| 欧美国产日韩在线播放| 欧美日韩va| 国产91小视频在线观看| 欧美成人亚洲综合精品欧美激情| 无码精品国产VA在线观看DVD| 国产农村妇女精品一二区| 欧美激情二区三区| 日本精品一在线观看视频| 国产91高跟丝袜| 麻豆国产精品一二三在线观看| 亚洲黄网在线| 亚洲AⅤ无码国产精品| 免费在线看黄网址| 久久亚洲高清国产| 日韩国产精品无码一区二区三区 | 91精品啪在线观看国产60岁| 欧美一级大片在线观看| 女人爽到高潮免费视频大全| 亚洲人成网站18禁动漫无码 | 91午夜福利在线观看精品| 911亚洲精品| 国产欧美日韩视频怡春院| 91福利免费| 四虎国产成人免费观看| 成人日韩视频| 国产精品视频观看裸模| 国产av一码二码三码无码| 亚洲精品色AV无码看| 欧美三级不卡在线观看视频| 欧美一级特黄aaaaaa在线看片| 日韩欧美中文亚洲高清在线| 性欧美在线| 色婷婷在线播放| 四虎影视永久在线精品| 91福利在线观看视频| 国产福利在线免费观看| 国产91小视频在线观看| 第九色区aⅴ天堂久久香| 久久青草精品一区二区三区| 四虎免费视频网站| 久久永久免费人妻精品| 久久99蜜桃精品久久久久小说| 国产一在线| 国产在线一区视频| 亚洲第一色网站| 露脸国产精品自产在线播| 女同久久精品国产99国| 亚洲欧美日韩久久精品| 欧美狠狠干| a级毛片免费网站| 欧美一区福利| 亚洲AⅤ无码日韩AV无码网站| 丁香五月婷婷激情基地| 中文字幕在线看| 久久综合色视频| 亚洲天堂.com| 国产成人免费高清AⅤ| 天堂网亚洲综合在线| 国产91导航| 正在播放久久| 国产91熟女高潮一区二区| 亚洲一级毛片免费观看| 在线观看网站国产| 亚洲天堂日本| 国产精品一区二区在线播放| 国产精品免费福利久久播放| 国产精品女主播| 免费在线国产一区二区三区精品| 国产亚洲美日韩AV中文字幕无码成人 | 久久性视频| 国产91蝌蚪窝| 九九香蕉视频| 在线精品视频成人网| 片在线无码观看| 亚洲第一极品精品无码| 精品国产免费观看| 欧美丝袜高跟鞋一区二区| 天天视频在线91频|