羅群 劉振棟
(重慶城市職業學院 重慶市 402160)
在網絡技術不斷發展的背景下,學習資源站點也在不斷增加。但是,用戶在海量學習資源中尋找需要的學習資源比較困難。目前,個性化推薦算法包括基于規則、基于內容和協同推薦算法。雖然協同推薦算法能夠對用戶潛在興趣進行挖掘,但是還存在缺點,比如新用戶無法對資源評價、用戶評價矩陣問題等。以此,本文提出了基于語義網的個性化學習推薦算法[1]。
基本思路為:通過領域中具有明確意義的本體組織無序異構學習資源,對學習資源語義關系進行明確。學習資源是在概念空間中被組織,從而使學習資源通過更加靈活的操作方式被使用,從而提供智能化推薦服務,圖1 為學習資源組織模型。

圖1:學習資源組織模型
針對線上學習活動來說,學習者和學習資源能夠抽象成為兩種不同性質的節點。學習者學習過程為學習者節點和學習資源節點的關系,大量交互關系組合構成二部圖網絡。在二部圖網絡中,相同節點互不相連,連邊只會在不同類別節點間,連邊密集程度包括學習者對于學習資源偏好類型。在二部圖網絡中,將感興趣的學習資源推薦給學習者,就是以網絡結構信息,實現沒有相連兩類節點可能連邊的預測[2]。
圖2:為二部圖網絡結構,左側節點表示學習者,右側節點表示學習資源,連邊充分展現了學習者對學習資源的偏好性,充分展現了兩層關系。節點A 和G 沒有聯系,說明學習者A 沒有選擇學習資源G。假如利用已有歷史選擇信息對A 和G 可能存在連邊進行預測,就能夠對節點A 推薦G 節點,以此實現個性化推薦。
在學習資源和學習者所構成的二部圖網絡中,假設:學習資源能夠被學習者所選擇,主要是因為其中的知識和學習者興趣特征匹配,學習者能夠接受相似學習者的推薦。所以,具備相似興趣學習者歷史選擇,以評估規則對學習者進行推薦。
針對上述假設,和圖2 結合描述信息擴散推薦機制。假設圖中A 節點表示所推薦資源學習者,初始的時候對節點A 連接節點賦予單元信息量,也就是D 和E 節點信息量為1。之后使兩個節點的連邊作為傳播路徑,對相鄰的節點實現信息傳播,此過程為第一階段傳播,在此階段之后的學習者節點能夠積累信息。此學習者節點的信息量能夠將A 學習者之前的學習資源量展現出來,充分展現了和A 學習者興趣的相似性[3]。
一般,人們比較傾向于和自己興趣相同的學習者建議。學習者和A 學習者興趣相似性能夠通過第一個傳播階段結束的時候代表節點信息量進行展現,那么是節點信息的量額對學習資源另一側進行傳播,相當于曾經選擇的學習資源能夠賦予的推薦可性度。最后,針對右側學習資源節點,以獲得的信息量排序,將學習者原本選擇的節點排除,對學習者A 推薦排序靠前的節點。在二部圖信息擴散的過程中,各階段數據描述為:
初始階段:因為D 和E 節點連接A 節點,那么信息量單位為1。F 和G 節點沒有和A 直接連接,所以信息量為0;
第一傳播階段:此階段信息的右側為學習資源節點傳播,左側為學習者節點,此過程結束后的ABC 信息量為4/3、1/3、1/3;
第二傳播階段:此階段信息左側為學習者節點傳播,右側為學習資源節點,此過程結束后的DEFG 節點信息量為2/3、17/18、1/9、5/18。將學習者A 已經選擇的資源D 和E 進行排除,G 節點信息量是最大的。所以,對學習者A 推薦G 資源節點,也是最合適的資源[4]。
學習資源推薦中的學習者模型包括:
(1)對學習者個性化特征確定。通過不同視角對學習者模型進行分析,從而發現學習者模型中的非智力和智力因素特征。此特征是無法獨立存在,要通過相互作用構成有機整體。學習者模型規范包括管理信息、學業信息、個人信息、作品集信息、安全信息、關系信息等,此規范針對學習過程信息描述并不細致,對于學習者非智力因素的特征涉及比較少。本文針對學習者信息模型規范,和其他個性化學習者特征整合,使學習者特征劃分為學習風格、知識狀態、基本信息、興趣偏好、認知能力等;
(2)通過系統對初始學習者特征信息收集,實現學習者模型的初始化;
(3)使學習者特征劃分為應用層、分析層、數據層,對學習者個性化特征維度指標進行分析,對層級關聯關系研究,實現學習者模型的更新,方便后續個性化服務。
要想能夠有效推薦學習資源,只是對用戶偏好考慮是不夠的。在現代教育環境下,學習資源不管是結構或者表現方式都存在明顯多樣化、復雜化的趨勢,表現方式包括索引、文獻、案例、試題、網絡課程等。以此,利用改進圖網絡神經創建基于知識點的本體。此過程能夠將各類學習資源數據共享價值作為基本的原則,劃分非結構性、無序性的學習資源,劃分類別包括媒體類、文本類。文本類資料包括試卷、案例、課件等;媒體資源包括音頻、視頻、文本、動畫、圖片等。針對無法直接界定的劃分類別資源,通過改進算法實現結構重組[5]。
以此,創建學習資源模型:
公式(1)中γ是指學習資源模型,xi是指知識點構成,p是指資源中元數據的占比,sim(x1,x2,...,xi)指的是各個知識點之間相似程度。此模型能夠實現學習資源知識點的檢索和管理,通過知識點對資源本體描述的過程中,利用元數據實現知識點和本體關聯關系的創建,利用元數據屬性定義不同類別的層次,創建包括課程類、動畫、資料與圖形類、音頻類、文本類和視頻類等圖網絡神經。這個時候的學習資源本體層次關系能夠將知識點構成的資源差別展現出來,為了實現不同資源的關聯,設計改進圖神經網絡資源結構知識點之間的關系為平行、依賴、參考和父子四種。父子關系指的是資源之間的整體性,平行關系為資源在知識點構成的獨立性,依賴關系為資源之間的重疊性[6]。
在分析用戶特征過程中,能夠掌握用戶的學習偏好和情況,對用戶學習目標進行確定,也能夠為組織學習資源提供依據。在本文資源推薦之前,要充分掌握用戶學習內部因素,此過程是利用用戶在線學習行為特征的分析所實現。一般,學習行為是通過目的性方式所存在。用戶為了能夠全面挖掘用戶行為特征,就要對其研究。在學習過程中,如果出現無法理解的難點,用戶利用線上交流及時性特征對自己的疑問提出。所以,可以通過主題討論、小組討論、發布和回答問題的方式收集偏好和主要問題。另外,在學習過程中用戶以自己興趣趨向和學習需求主動搜索相關的知識內容,以此所產生的收藏、點擊和下載操作能夠展現用戶偏好。用戶和自身不足結合,以實際情況重復學習相應知識點,此部分內容為資源推薦主要構成。除了上述特征,用戶對于知識掌握的程度與推薦學習資源難易程度相關。通過學習目標,用戶對于知識掌握能力也在不斷發展,但是此發展為階段性。所以,根據現階段用戶對于知識理解推薦資源,決定用戶最終的使用情況。
以此,本文使用戶在學習過程中的學習行為特征作為判斷偏好的根據,實現個性化學習者資源的推薦[7]。
為了對本文算法在資源推薦中的性能進行驗證,開展實例仿真,表1 為仿真樣本集。

表1:仿真樣本集
為了對算法優化性能進行分析,本文使用不同算法實現樣本集歸一化特征差異平均最小值性能的優化,對兩種算法生成候選推薦序列準確度進行驗證。圖3 為算法的特征差異最小值,通過收斂性方面分析,在樣本集1 特征差異最小值求解時,GRNN 能夠實現收斂。橫向對比表示,在學習記錄條數不斷增加的過程中,特征差異值最小[8]。

圖3:算法的特征差異最小值
為了對DE 算法優化性能驗證,實現不同算法特征差均值標準差性能仿真,表2 為算法的標準差和推薦時間。通過表2 可以看出來,DE-GRNN 特征值要比DRNN 算法小。通過兩種算法候選推薦序列的求解時間分析,學習記錄條數越多,那么推薦的耗時就會越長。通過對比表示,樣本集相同,DE-GRNN 算法的推薦時間更多,但是兩者的運算時間并沒有太大的差別。是由于通過DE 優化之后,GRNN 算法的特征差異值更小,在DE 優化之后,并沒有消耗大量的計算時間[9]。

表2:算法的標準差和推薦時間
為了對不同算法針對不同樣本集的資源推薦性能進行驗證,使用DE-GRNN 算法、深度神經網絡、SVM實現樣本集訓練。表3 為不同算法的推薦性能,DE-GRNN 資源具有較高的資源推薦準確率,并且F1 值和召回率都比其他算法優[10]。
本文在學習資源個性化推薦中使用語義網技術,利用領域本體的概念間關系對不同用戶興趣相似度進行分析,以最近鄰域興趣對學習資源進行協同推薦。在個性化學習資源推薦中,如果訓練樣本量充足,實現DE 算法的合理設置,利用DE 優化對算法核函數中心與平滑因子進行優化求解,得出合適的核函數中心和平滑因子,使CRNN 算法資源推薦性能得到提高。通過試驗表示,本文算法的學習資源推薦更加精準。