999精品在线视频,手机成人午夜在线视频,久久不卡国产精品无码,中日无码在线观看,成人av手机在线观看,日韩精品亚洲一区中文字幕,亚洲av无码人妻,四虎国产在线观看 ?

基于改進型協同過濾的網絡學習資源推薦算法

2021-05-10 12:21:28王根生袁紅林黃學堅
小型微型計算機系統 2021年5期
關鍵詞:資源用戶實驗

王根生,袁紅林,黃學堅,閔 潞

1(江西財經大學 國際經貿學院,南昌 330013)

2(江西財經大學 計算機實踐教學中心,南昌 330013)

3(江西財經大學 人文學院,南昌 330013)

1 引 言

隨著互聯網的普及,各種在線網絡學習平臺迅速發為用展,戶提供了豐富的學習資源.面對海量的學習資源如何根據用戶的學習興趣、習慣、能力實現個性化資源推薦是網絡學習平臺的發展趨勢.個性化推薦在電子商業領域運用非常廣泛,針對個性化網絡學習資源推薦研究方面,國內外學者進行了相關研究探索.陳潔敏[1]對目前學習資源個性化推薦算法進行歸納,總結出主要有基于內容過濾、基于關聯規則、基于協同過濾和基于混合模式,梁婷婷[2]通過內容向量空間濾波建立學習資源過濾模型;丁繼紅[3]在大數據的環境下對學習者、資源、情景等進行多維關聯分析,實現資源和學習者之間的個性匹配;沈苗[4]設計一種以學生屬性分類為基礎的協同過濾算法,實現學生選課系統的智能化、個性化資源推薦;Lei W[5]先通過數據挖掘得到關聯規則建立偏好矩陣,再和協同過濾算法混合進行個性化推薦.

基于內容過濾推薦算法需要建立資源特征表示[6],而網絡學習資源形式多樣化,很難建立統一的特征表示;關聯規則推薦算法需要海量的樣本數據支撐,并且個性化程度偏低[7];資源和用戶進行特征表示在協同過濾推薦算法可以省略[8],通過對資源建立用戶興趣相似度模型,根據興趣相似用戶的偏好對資源進行偏好預測,是目前運用于網絡學習資源個性化推薦中最流行的算法.但傳統的協同過濾算法面臨冷啟動和矩陣稀疏問題[9],針對這兩個問題不少學者也提出相關改進方法,管水城[10]提出一種在矩陣分解技術的基礎上同時考慮社交網絡推薦的新方法,幫助用戶在海量的線上異構數據中快速發現其感興趣的內容;顧寰[11]提出一種融合社區結構和個人興趣的協同過濾推薦算法,有效緩解了推薦系統數據稀疏性的問題;高玉凱[12]提出一種基于協同矩陣分解的用戶冷啟動推薦算法,在多個維度上得到用戶的潛在特征,緩解冷啟動問題;Shulong C[13]在利用用戶-項目評價顯式信息的基礎上,加入其他的隱式信息填充用戶-項目評價矩陣,從而緩解評價矩陣稀疏問題;付芬[14]提出一種基于隱式評分和相似度傳遞的學習資源推薦算法,改進協同過濾推薦算法的相似度計算;丁永剛[15]提出一種改進協同過濾推薦算法,該算發融合學習者社交網絡信息,根據社交網絡中學習者之間的信任度預測缺失評分,緩解了協同過濾方法的矩陣稀疏問題;Wang X[16]提出一種改進協同過濾推薦算法,該算法的核心是學生在線學習行為序列數據,算法性能相對傳統算發得到了改善.通過研究發現,挖掘用戶其他潛在特征、添加用戶-項目間的隱式信息是目前解決協同過濾冷啟動和矩陣稀疏問題的主要思路.

針對網絡學習資源推薦這個特定領域,本文引入用戶對資源的學習行為日志(分享、收藏、瀏覽、下載等)緩解評分矩陣稀疏問題,添加用戶的學習能力、學習專業、學歷、興趣等潛在特征緩解用戶冷啟動問題,通過該改進的協同過濾算法來實現更加精準的個性化網絡學習資源推薦.

2 傳統協同過濾推薦算法

協同過濾推薦算法通常分為兩類:一類是基于用戶的協同過濾(User-based CF),另一類基于項目的協同過濾(Item-based CF)[17].User-based CF根據用戶對資源的歷史興趣建立用戶相似度模型[18],通過興趣相似的用戶預測評分,把預測評分高的資源推薦給用戶[19];Item-based CF根據用戶對資源的歷史評價建立資源相似度模型,計算資源間的相似度,然后把和用戶歷史偏好相近的資源推薦給用戶[20].相似度計算是推薦算法的核心部分[21],主要有余弦相似度、皮爾遜相似度、Jaccard相似度、對數似然相似度[22].余弦相似度是一種比較常用的相似度計算方法,將用戶對資源的歷史評價表示為向量,用戶興趣的相似度通過評價向量的余弦值來衡量,計算如公式(1)所示.

(1)

(2)

3 改進型用戶協同過濾推薦算法

本文使用基于用戶的協同過濾推薦算法建立網絡學習資源的個性化推薦系統,針對協同過濾推薦算法的矩陣稀疏和冷啟動問題,引入學習行為日志和用戶初始化標簽進行算法改進,具體算法如下:

算法1.改進型用戶協同過濾推薦算法

Step 1.根據用戶歷史資源評價,生成用戶資源評價矩陣;

Step 2.根據用戶資源學習行為,生成用戶資源行為矩陣;

Step 3.基于用戶資源行為矩陣,調整用戶資源評價矩陣,生成用戶-資源矩陣;

Step 4.根據用戶能力、專業、興趣和學歷標簽,生成用戶初始化標簽;

Step 5.根據用戶-資源矩陣和用戶初始化標簽,計算用戶相似度;

Step 6.產生推薦結果.

算法1的具體算法模型架構如圖1所示.

圖1 算法1改進型用戶協同過濾推薦算法模型架構

3.1 用戶資源評價矩陣

將用戶對資源的歷史評價轉換成分值矩陣,形成M×N的矩陣,如圖2所示.

圖2 用戶資源評價矩陣

Uk為第k個用戶,ij為第j個資源,rkj為用戶k對資源j的評分,取值范圍為0-10,沒有評價過的資源默認為0,當資源數比較多時,用戶評價的資源可能只有很少的一部分,所以整個矩陣中大部分的值為0,導致整個矩陣稀疏.

3.2 用戶資源行為矩陣

用戶對網絡資源的操作不僅僅只是直接的獲取與評價,中間也會進行分享、收藏、瀏覽、下載等學習行為.這些操作行為也側面反映了用戶對資源的學習興趣,所以通過收集用戶學習行為日志,分析其學習行為軌跡,建立行為軌跡與資源評價的關系,從而挖掘用戶的相似度,一定程度上可以改善協同過濾算法的矩陣稀疏問題.把用戶對資源的相關學習行為轉換成對應的興趣評分,分值通過調查問卷方式獲取,問卷給定15種學習行為,被調查者根據自己以往的經驗給與不同的評分,例如對某個學習資源只是點擊瀏覽了一下,說明用戶對該資源評價可能不高,而用戶對資源進行了瀏覽+收藏+下載+分享,說明用戶對該資源評價應該挺高.問卷一共發放了500份給在校學生,有效回收了421份,統計每種行為的平均分,再規約為0.5的倍數,最終得出的分值如表1所示.

表1 學習行為資源評分

分析用戶學習行為日志,構建用戶資源行為矩陣,如圖3所示.

圖3 用戶資源行為矩陣

Uk為第k個用戶,ij為第j個資源,skj為用戶k對資源j的學習行為,取值范圍如表1所示.

3.3 用戶-資源矩陣

依據用戶資源行為矩陣對圖2中的用戶資源評價矩陣進行調整.如果用戶沒有對某個資源進行評價過,則分析是否對該資源進行過相關學習行為操作,并根據表1計算相應的分值.經過這一處理,得出用戶-資源矩陣,該矩陣的稠密度明顯高于用戶資源評價矩陣的稠密性.

3.4 用戶初始化標簽

用戶的學習能力、學習專業、學歷、興趣等特征是對用戶的直接描述,當一個新用戶加入系統時,我們無法根據用戶資源評價向量的相似度來查找其興趣相似的用戶,但如果有了這些用戶的初始化標簽,我們就可以根據這些標記進行用戶的相似度計算,從而解決新用戶的冷啟動問題.用戶的標簽表示如公式(3)所示.

Tu=[tua,tum,tur,tui]

(3)

tua、tum、tur、tui分別代表用戶u的學習能力、專業、學歷、興趣.

1)學習能力:分為4個層次,分別為差、中、良、優,用1-4表示.用戶u和v學習能力相似度計算如公式(4)所示.

(4)

2)學習專業:依據教育部的專業分類,共13個學科,92個專業類,630個專業.用戶u和v學習專業的相似度計算如公式(5)所示.

(5)

3)學歷:分中等和高等教育,中等教育分普通中專、高中,分別用1、2表示;高等教育分專科、本科、碩士研究生、博士研究生,分別用3-6表示.用戶u和v學歷的相似度計算如公式(6)所示.

(6)

4)興趣:主要是對那些專業感興趣,可以多選,但限定不超過5個.用戶興趣的相似度計算如公式(7)所示.

(7)

其中Iu和Iv分別代表用戶u和v感興趣的專業集合,m和n分別代表Iu和Iv兩個集合的大小.sim(tua,tvb)的計算見公式(5).

把這四者的相似度進行融合,得到用戶初始化標簽的整體相似度,計算如公式(8)所示.

simt(u,v)=αsim(tua,tva)+βsim(tum,tvm)+

γsim(tur,tvr)+δsim(tui,tvi)

(8)

在公式(8)中,α+β+γ+δ=1,分別代表對應相似度所占權重,sim(tua,tva)、sim(tum,tvm)、sim(tur,tvr)和sim(tui,tvi)的計算分別為公式(4)-公式(7).

3.5 用戶相似度計算

用戶相似度采用線性加權方式融合用戶資源評分相似度和用戶初始化標簽相似度,其計算如公式(9)所示.

sim(u,v)=φsimi(u,v)+(1-φ)sim_t(u,v)

(9)

在公式(9)中,φ為融合權重因子,取值范圍為[0,1];sim_i(u,v)為用戶資源評分相似度,計算見公式(2),其用戶評價數據來源用戶-資源矩陣;sim_t(u,v)為用戶初始化標簽相似度,計算見公式(8).

3.6 產出推薦結果

得出用戶的相似度后,按大小進行排序,選擇前k個鄰近用戶作為目標用戶u的相似用戶集Su={su1,su2,su3,…,suk}.在相似用戶集Su中找出所有目標用戶u沒有評價過的資源,并預測目標用戶u對該資源的評分,具體計算如公式(10)所示.

(10)

通過公式(10)的計算,給用戶u推薦預測評分最高的Top-N個資源.

4 實驗分析

4.1 實驗數據

實驗數據使用JXUFE大學網絡教學平臺的后臺管理數據,平臺中包括1215門課程,42452名學生用戶,從中隨機抽取出3000用戶、500門課程作為實驗數據.實驗數據中包含學生對課程的評分和瀏覽、收藏、下載、分享等行為記錄,以及學生之間的評論和轉發記錄.由于平臺設計之初沒有考慮用戶的初始化標簽,所以后臺數據沒有關于用戶學習能力、學習專業、學歷、興趣的標簽記錄,但可以通過教務管理系統中的數據,分析出相關的標簽值,具體如下:

·學習能力值:根據教務系統中記錄的學生考試成績,得到其學習能力;

·學習專業:根據教務系統數據可以得出其專業;

·學歷:根據教務系統數據得到,目前平臺只用本科、碩士、博士3種學歷;

·興趣:選擇用戶評分最高的10門課程所屬專業作為其興趣專業.

4.2 評價指標

實驗使用預測評分與實際用戶評分的均方根誤差(RMSE)進行衡量,RMSE計算如公式(11)所示.

(11)

4.3 實驗結果與分析

實驗步驟如下:

Step 1.根據用戶對資源的歷史評分得到用戶資源評分向量;

Step 2.分析用戶對資源的學習行為并轉化成資源評分向量;

Step 3.融合Step 1和Step 2的向量,得到最終用戶資源評分向量;

Step 4.聯合教務管理系統得出用戶的學習能力、專業、學歷、興趣標簽值;

Step 5.根據公式(2)計算用戶資源評分相似度;

Step 6.根據公式(8)計算用戶初始化標簽相似度,其中α、β、γ、δ,4個權重取值設為1/4;

Step 7.根據公式(9)計算最終用戶的相似度;

Step 8.根據Step 7的結果,尋找與目標用戶u相似最高的前k個用戶;

Step 9.計算目標用戶u對資源的預測評分,計算見公式(10);

Step 10.計算預測評分和實際評分的均方根誤差(RMSE).

試驗步驟Step 1得到的原始用戶資源評分向量的稀疏程度為84%,稀疏程度具體計算如公式(12)所示.

(12)

在公式(12)中,EvalNum表示為用戶對課程資源的評價數量,UserNum、ResUum分別為用戶總數和課程資源總數.通過Step3融合學習行為資源評分,得到最終的用戶資源評分向量的稀疏程度為61%,緩解了矩陣稀疏程度.

4.3.1 不同鄰近用戶個數k值的實驗對比

實驗過程中,設定公式(9)中的融合權重因子φ為0.7.鄰近用戶個數k的取值從10逐步增加到50,每次增加步長為5,共9組實驗,分別統計每組實驗的RMSE值,實驗結果如圖4所示.

圖4 不同k值下RMSE結果

從實驗結果可以看出,在該實驗設定的參數下,鄰近用戶個數k為30時RMSE值最小.

4.3.2 不同融合權重因子φ值的實驗對比

融合權重因子φ是公式(9)的一個關鍵因子,它決定了公式(9)中用戶資源評分相似度simi(u,v)和用戶初始化標簽相似度sim_t(u,v)的權重.為了選取合適的φ值,進行了11組試驗對比,φ的取值范圍是{0,0.1,0.2,0.3,0.4,0.5,0.6,0.7,0.8,0.9,1}.鄰近用戶個數k設定為30,實驗結果如圖5所示.

圖5 不同φ值下RMSE結果

通過實驗發現,在設定參數下,融合權重因子φ為0.7時RMSE值最小.

4.3.3 新用戶推薦效果實驗

為了驗證改進算法對用戶冷啟動問題的緩解效果,進行新用戶的推薦效果驗證實驗,隨機抽取出150個用戶作為測試數據.為了模仿新用戶,在查找其相似用戶時,去除其資源評分相似度,只保留用戶初始化標簽相似度,實驗參數φ取0.7.推薦效果使用平均精準率(precision)和平均召回率(recall)進行衡量,計算如公式(13)和公式(14)所示.

(13)

(14)

表2 新用戶推薦實驗結果

通過實驗可以看出,本文算法對新用戶的推薦也有較好的效果,避免了協同過濾算法因新用戶冷啟動而無法推薦的問題.

4.3.4 與傳統協同過濾算法對比實驗

為了驗證本文改進算法的性能,將本文提出的算法與另外4類算法進行對比實驗,5類算法如表3所示.

表3 5類協同過濾推薦算法

5類算法的最鄰近個數都設定為30,IT_UCF的融合權重因子φ設定為0.7,使用RMSE進行衡量,實驗結果如圖6所示.

圖6 與傳統協同過濾算法對比實驗結果

通過對比實驗發現,I_UCF和T_UCF都比UCF和ICF兩種傳統協同過濾推薦算法的RMSE值要小,說明引入用戶學習行為日志或用戶初始化標簽相似度確實能改進傳統協同過濾推薦算法;IT_UCF算法比I_UCF和T_UCF兩種算法的RMSE值要小,說明同時引入用戶學習行為日志和用戶初始化標簽比單獨只引入其中一種的效果要好.

4.3.5 與其他改進算法對比實驗

為了進一步驗證文本改進算法的性能,將本文算法(T_UCF)和基于隱式評分和相似度傳遞的學習資源推薦算法(CF-IRST)[14]、融合學習者社交網絡的協同過濾學習資源推薦算法(Social-CF)[15]和基于在線學習行為序列的學習資源推薦算法(OLSB-UCF)[16]做實驗對比.T_UCF融合權重因子φ設定為0.7,CF-IRST的傳遞路徑閾值設定2,Social-CF信任度計算權重參數α設定為0.4,OLSB-UCF聚類k設定為5,鄰近用戶個數k的取值從10逐步增加到50,每次增加步長為5,共9組實驗,把RMSE值作為實驗對比結果,結果如圖7所示.

圖7 與其他改進算法對比實驗結果

通過對比發現,T_UCF,CF-IRST和Social-CF這3種算法隨著鄰近用戶個數k的變化RMSE值具有較大的波動,而OLSB-UCF算法波動較小,這可能是因為OLSB-UCF算法是在聚類的基礎上進行的協同過濾,在各自所屬的聚類中挑選鄰近用戶,從而減少了鄰近用戶個數k的影響.T_UCF相比其他兩種改進的算法CF-IRST和Social-CF在不同的鄰近用戶個數下始終能保持較小的RMSE值,在鄰近用戶個數k為30左右時RMSE值小于OLSB-UCF算法的最小RMSE值,進一步證明了本文算法的有效性.

5 總 結

智慧網絡教育面對海量的在線學習資源使用個性化學習資源推薦是其發展的趨勢.針對基于傳統協同過濾推薦算法中典型問題—冷啟動和矩陣稀疏,提出了引入用戶學習行為日志和用戶初始化標簽的改進型用戶協同過濾網絡學習資源個性化推薦算法.該算法將用戶對資源的操作行為和用戶初始化標簽添加到用戶的相似度計算中.并且通過實驗對比證明了該算法的有效性.但本文算法也存在一定不足,一方面是算法存在一定的局限性,在很多其他應用領域用戶對資源的操作日志與用戶初始化標簽不好獲取;另一方面,隨著時間的推移,用戶的學習興趣、習慣、能力等可能會發生變化,歷史數據存在時效性,這種用戶興趣漂移現象本文提出的算法沒有考慮.針對這些問題還需進一步研究.

猜你喜歡
資源用戶實驗
記一次有趣的實驗
基礎教育資源展示
一樣的資源,不一樣的收獲
做個怪怪長實驗
資源回收
資源再生 歡迎訂閱
資源再生(2017年3期)2017-06-01 12:20:59
關注用戶
商用汽車(2016年11期)2016-12-19 01:20:16
NO與NO2相互轉化實驗的改進
實踐十號上的19項實驗
太空探索(2016年5期)2016-07-12 15:17:55
關注用戶
商用汽車(2016年6期)2016-06-29 09:18:54
主站蜘蛛池模板: 中文字幕亚洲综久久2021| 8090午夜无码专区| 精品亚洲国产成人AV| 情侣午夜国产在线一区无码| 国产一二视频| 毛片视频网址| 亚洲欧美人成电影在线观看| 青青草国产免费国产| 亚洲色图另类| 欧美一级高清片欧美国产欧美| 精品视频在线一区| 天天综合网站| 国产毛片不卡| 日韩av电影一区二区三区四区 | 日韩在线永久免费播放| 欧美日韩中文字幕在线| 在线免费看片a| 手机永久AV在线播放| 国产精品久久久久久久久| 国产在线视频欧美亚综合| 午夜视频在线观看免费网站| 91亚洲免费| 男女男精品视频| 重口调教一区二区视频| 国产成a人片在线播放| 另类综合视频| 欧美激情视频一区二区三区免费| 99re热精品视频国产免费| 激情乱人伦| 亚洲天堂视频在线观看| www.亚洲色图.com| 亚洲一区二区无码视频| 国产主播在线观看| 污网站在线观看视频| 丁香六月综合网| 91色老久久精品偷偷蜜臀| 9久久伊人精品综合| 色综合网址| 中文字幕在线日韩91| 欧美区日韩区| 91精品国产一区| 亚洲综合色婷婷| 精品久久久久成人码免费动漫| www精品久久| 久久这里只精品国产99热8| 又爽又黄又无遮挡网站| 天天躁夜夜躁狠狠躁图片| 婷婷综合亚洲| 国产91全国探花系列在线播放| 亚洲欧美日本国产综合在线| 亚洲欧美在线综合图区| 色妞www精品视频一级下载| 国产95在线 | 亚洲最大看欧美片网站地址| 色综合久久88| 国产色爱av资源综合区| 久久久久国产一级毛片高清板| 91视频精品| 欧美一区二区啪啪| 亚洲人成网址| 国产在线专区| 欧美日韩综合网| 四虎影视无码永久免费观看| 精品无码人妻一区二区| 人人爽人人爽人人片| 日本91在线| 亚洲第一精品福利| 538国产在线| 亚洲日韩精品欧美中文字幕| 中文字幕久久精品波多野结| 亚洲色偷偷偷鲁综合| 亚洲福利视频网址| 国产 在线视频无码| 国内精品自在欧美一区| 日日噜噜夜夜狠狠视频| 久久亚洲黄色视频| 国产亚洲高清视频| 国产精品亚洲欧美日韩久久| 国产99视频在线| 亚洲欧美自拍中文| 国产免费福利网站| 91精品国产91久久久久久三级|