何英 許文


摘 要:隨著互聯網及在線教育平臺的加速發展,積累了大量的教育資源,學習者對網絡平臺中教育資源的利用依賴性不斷提高,但需要花費大量的時間和精力去篩選符合自己的資源[1]。目前,在線平臺為學習者們提供的內容基本相同,未能針對個性化的要求提供差異化的資源[2]。文章所構建的基于高維張量分解的個性化教育資源推薦算法,在分解中能夠保留高維空間的信息完整性,避免了傳統推薦算法在分解中原始信息和特征的丟失,從而為個性化學習資源推薦的研究提供參考。
關鍵詞:高維張量分解;個性化;教育資源;推薦算法
0 引言
目前,個性化推薦技術已經在互聯網及電子商務(淘寶、京東等平臺)中使用,效果也尤為顯著[3],近幾年個性化推薦技術已經逐漸成為教育資源領域應用的研究熱點,從而使學習者與教育資源之間形成“找”和“推”的雙向模式。學習者對教育資源的選擇會根據學習目標、學習風格等不同因素產生不同個性化需求,這使得教育資源推薦變得非常復雜。推薦系統起源于信息檢索相關技術,推薦系統的性能和結果質量優劣與推薦方式和推薦策略有著極大的關聯,而推薦系統的核心是推薦算法[1]。
我國推薦算法研究時間較短,2005年,張晗等通過Apriori算法建立關聯規則,將所得頻繁項用個性化教育資源方式呈現出來。后期他們再次建立全新智能教育資源推薦系統,將信息查找與挖掘、聯機分析處理等技術結合完成有效推薦[3]。2017年由Andrew G,GaoJ等人提出了一種新的基于矩陣的推薦方法,可向用戶提供更有效的學習服務,促使用戶制定切實可行的學習計劃。由于互聯網的信息越來越多,維度越來越高,生活中常見的空間位置信息、視頻流數據、圖像信息、文檔集資料等都是高維數據,使用傳統的方法將高維的數據轉換成矩陣形式,會破壞原有數據的張量結構,造成數據和信息的損失,影響最終的分析結果準確性。因此,如何獲取學習者的個性信息,很好地保留學習者教育資源選擇的數據信息結構,設計基于高維張量分解的個性化教育資源推薦算法,對于提高推薦的教育資源精度、提升學習者的學習效率具有十分重要的價值[1]。
1 高維張量分解的個性化教育資源推薦方法
1.1? 學習者特征模塊
文本在自然情境下采用訪談法開展[4],選擇的訪談對象為高職教育技術研究者和某高職2019級學習“軟件測試基礎”課程的學生。選取的訪談對象中兩位教師均具有多年的教學經驗,專業或研究方向為教育技術學,能夠保證訪談的結果具有科學性和代表性。
針對文本所指的教師和學生進行訪談后確定個性化推薦系統中推薦的內容與影響因素。一是推薦內容,感興趣的知識點。二是影響因素,在資源推薦過程中主要影響因素包括學習者屬性信息、特征信息、行為軌跡信息等數據。
1.2? 教育資源模塊
如何準確地對教育資源進行建模是實現個性化教育資源推薦的關鍵。本文根據國內外典型的教育資源模型規范要求定義了以下幾個方面的內容:知識摘要信息、教育資源類型、資源難度系數、估計學習時間以等[1]。模型中的基本信息包括資源的名稱、容量大小、作者、上傳的時間和存放路徑等內容。
1.3? 學習情景模塊
學習者可以從信息化教學平臺獲取文字圖片、音頻、視頻等多種教育資源,同時學習者也可以從不同形式的教育資源構建豐富多彩的學習環境,從而形成一種不受時空限制且包含豐富音頻、視頻資源的學習方式,可以調動學生的學習興趣。
1.4? 高維張量在個性化教育資源推薦上的算法研究
目前推薦系統在多維信息聯合應用方面仍存在不足,還有較大的提升空間,推薦系統是在矩陣分解模型的基礎上發展起來的,從而衍生出了張量分解模型,張量分解可以提取3種影響因素之間的潛在關系信息[5]。目前大多數基于張量分解的推薦算法采用CP分解或Tucker分解進行優化[6],通過Tucker分解可以獲取高維數據的特征信息,CP分解是Tucker分解的一種特殊形式,如果張量模型中的各維度的數目相等且核心張量是對角的,那么Tucker分解就退化成了cp分解,本文所采用的資源推薦參考因素轉化成三維數據時,各維度的數目并不相等。因此,更適合使用Tucker分解。
1.4.1? 張量分解
高維張量是由三階張量推廣得到的高維空間,由一個三階的張量分解可得高維的張量分解,一個三階張量的定義為:,其中I,J,K是張量的維度,x∈RI*J*K,同理高階張量的表達式為:
1.4.2? Tucker分解
在張量分解模型中應用比較廣泛的推薦算法是Tucker分解[7],將三階張量分解成一個核心張量與3個因子矩陣的乘積如公式為:,其中U∈RM×r1,V∈RN×r2,W∈RK×r3是正交矩陣,張量G∈Rr1×r2×r3被稱為Tucker分解的核心張量,元組(r1×r2×r3)可以被稱為多線性的秩。同理高階張量的索引模式可表示為:
1.4.3? 學習者教育資源推薦算法
張量分解方法就是在三維張量上引用Tucker分解方法,這樣能夠降低張量的維度[8]。本文抽取學習者、教育資源、學習情景三個維度的特征,輸入“學習者-教育資源-學習情景”{s,e,c}三元組的數據構建初始張量x,,其中IS,IE,IC分別代表數據中學習者,教育資源,學習情景的元素。
根據初始張量x進行Tucker分解,將構建的三維張量分解為學習者特征矩陣U、教育資源V、學習情景W以及核心張量S,那么張量分解的公式如下所示:
根據教育資源特征矩陣里面的每行的特征之和,可得特征之和越大,就說明教育資源推薦的越能受到學習者的喜好,反之值越小,就說明推薦的教育資源不受到學習者的喜好。
2 結語
學習者教育資源的推薦系統就要考慮到個性化所涉及的多樣性等問題,此時,個性化推薦顯得非常重要。教育資源作為教育行業服務領域的研究方向之一,它在信息化教學平臺資源庫的建設中是必不可少的。本文從學習者個性化教育資源角度出發,將張量Tucker分解成功融合應用到資源推薦上,設計了一種基于高維張量分解的個性化教育資源推薦算法。將現有經典張量分解算法和理論推廣到高維張量,研究“學習者-教育資源”高維張量的分解算法,并對算法的效率進行研究,為個性化精準教育資源推薦提供技術基礎。
[參考文獻]
[1]李光泉.基于學習者個性的教育資源推薦服務研究[D].南昌:江西財經大學,2018.
[2]衛文婕,付宇博.個性化學習資源推薦算法研究[J].中國教育信息化,2018(18):91-96.
[3]劉靜,熊才平,丁繼紅,等.教育信息資源個性化推薦服務模式研究[J].中國遠程教育,2016(2):5-9,79.
[4]馬秀麟,梁靜,李小文,等.智能化學習環境下資源推薦的影響因素及權重的探索[J].中國電化教育,2019(3):110-119.
[5]楊曉蕾,李勝,何熊熊,等.基于張量分解的多維信息融合興趣點推薦算法[J].小型微型計算機系統,2020(5):902-907.
[6]汪亮.稀疏高階張量CP分解[D].廣州:廣東工業大學,2019.
[7]劉振嬌,王新華.基于上下文學習和張量分解的個性化推薦[J].山東師范大學學報(自然科學版),2017(1):36-42.
[8]胡強.基于張量分解的個性化推薦算法研究[D].南昌:華東交通大學,2018.
(編輯 何 琳)