999精品在线视频,手机成人午夜在线视频,久久不卡国产精品无码,中日无码在线观看,成人av手机在线观看,日韩精品亚洲一区中文字幕,亚洲av无码人妻,四虎国产在线观看 ?

基于資源特征的協同過濾算法的研究

2012-08-15 02:01:46徐德智廖暉寰
網絡安全與數據管理 2012年17期
關鍵詞:資源用戶模型

王 偉,徐德智,廖暉寰

(中南大學 信息科學與工程學院,湖南 長沙 410083)

隨著網絡的迅速發展,資源數量也成倍地增長。所面臨的問題已經不是如何找到資源,而是怎樣從資源海洋中找到自己所需要的資源。用戶獲取所需資源最常用的手段就是搜索關鍵詞和瀏覽推薦資源。以往簡單的搜索和推薦資源并沒有考慮用戶的個性化需求(即沒有針對性),找到的資源可能與用戶需要的資源差距很大。此外,有時候用戶也無法準確地把自己的需求形象地表示出來。

所謂推薦引擎,就是不需要用戶額外的勞動,就可以根據用戶的個性化特征推測用戶可能感興趣的資源,然后再將其推薦給用戶。個性化推薦在某些領域已經取得了成功,最有名的有亞馬遜推薦系統、Pandora音樂推薦系統等。目前,個性化服務的研究已經越來越受重視,尤其是在電子商務領域和搜索引擎領域。

1 相關研究

目前,針對推薦引擎的理論已經有很多研究,推薦主要可以分為基于內容的推薦、協同過濾推薦和混合推薦。協同過濾推薦又可分為基于用戶的推薦、基于項目的推薦和基于模型的推薦。參考文獻[1]中論述了推薦引擎的工作原理和其中涉及的各種推薦機制。參考文獻[2]和[3]中論述了在協同推薦算法中加入了用戶背景信息,將用戶或者資源進行分類以提高推薦的準確度。參考文獻[4]在協同推薦算法中加入時間因素以跟蹤用戶的短期興趣和長期興趣。以往的協同推薦算法都是根據用戶以往對于資源的興趣評分來推測該用戶對其他未評分的物品的興趣評分,它只考慮用戶對物品的態度,而忽略了物品本身的屬性和特征,因此對于新物品的推薦有“冷啟動”問題。此外,它還具有數據稀疏性問題。

針對以往協同過濾推薦算法的不足,本文提出了基于資源特征的協同過濾推薦算法。通過記錄和分析用戶在網站上的動態行為,將用戶對于資源的喜好轉化為用戶對于關鍵詞的興趣權重,將用戶興趣的變化轉化為用戶興趣關鍵詞權重的變化,以此建立用戶興趣模型。最后,通過建立用戶興趣模型與資源模型間的關聯達到資源推薦的目的。它不僅沒有“冷啟動”問題和數據稀疏性問題,而且能夠跟蹤用戶的長期興趣和短期興趣。

2 相似度策略

常用的相似度計算方法主要有歐氏距離、余弦相似性、相關相似性和修正的余弦相似性。本文采用余弦相似性[5]方法計算兩個空間向量的相似度。

設用戶 U1的關鍵詞集合為 A,U2的關鍵詞集合為B。如果U2為用戶,則取集合A和B的并集作為標準關鍵詞集合S,即S=A∪B;如果 U2為資源,則取集合 B作為標準關鍵詞集合S,即S=B。

設U1對應于 S的權重向量為 x,U2對應于 S的權重向量為 y,則x、y為 n維項空間上的向量。x與 y之間的相似性可以通過向量間的余弦夾角度量。因此U1和U2的相似性 Sim(U1,U2)為:

式中,分子為兩個向量的內積,分母為兩個向量模的乘積。

3 基于資源特征的協同推薦算法

本文提出的基于資源特征的協同推薦算法以用戶對于所有興趣關鍵詞的權重向量來描述用戶,以最喜歡目標資源的多個用戶的興趣權重向量來描述目標資源,通過計算目標資源向量與其他資源向量之間的相似度來查找與該資源最相似的資源,從而達到推薦的目的。整個推薦流程如圖1所示。

圖1 基于資源特征的協同推薦模型

3.1 信息收集

本文的信息收集不同于以往的協同推薦算法,它通過收集用戶在網站上的動態行為來作為用戶的興趣源。以基礎教育資源網為例,能夠表達用戶愛好的操作行為主要有瀏覽、播放、下載、預覽、推薦、收藏、刪除收藏、分享、搜索、評分、評論、購買等。不同的行為所表達的用戶對于資源的愛好程度不一定相同(例如瀏覽和收藏表達的用戶愛好程度不一致)。因此,當用戶執行該類操作時,需要記錄用戶操作的類型和訪問時間作為用戶興趣的依據。

3.2 用戶興趣建模

考慮到網站的性能需求,用戶興趣模型的更新是周期性的,即離線進行。用戶興趣模型的建立和更新分為以下幾個步驟:

(1)將用戶行為記錄轉化為用戶關鍵詞興趣權重,并把對應關鍵詞的最后訪問時間設定為該行為的發生時間,然后刪除該行為記錄。在將用戶的行為轉化為用戶興趣關鍵詞權重時,根據行為的不同對應關鍵詞的權重增量也不同,例如瀏覽時與資源相關的關鍵詞的興趣權重分別增加a,而收藏時與資源相關的關鍵詞的興趣權重分別增加2a,刪除收藏則對應關鍵詞權重增量為-2a。關鍵詞興趣權重值最大不應超過Wmax(最大權重值Wmax為常數),且不能小于0(小于0則刪除該記錄)。

(2)根據時間窗(為一常數)更新所有興趣關鍵詞權重。用戶的興趣可能會隨著時間的變化而變化,對于那些用戶不再感興趣的關鍵詞,其興趣權重應下降。因此,如果當前時間與某關鍵詞的訪問時間之差大于時間窗t時,則對應關鍵詞的權重 W會減少 b(b為常量),如果W≤0,則刪除該關鍵詞記錄。

(3)以用戶為單位采用極差變換法標準化用戶興趣關鍵詞權重。因為通過以上步驟獲得的用戶興趣模型是不標準的,需要進行標準化處理之后才能正確分析出用戶的興趣。

3.3 推薦的產生

推薦結果的產生可以分為以下幾個步驟(相似度計算采用本文第2節介紹的余弦相似度計算方法):

(1)建立矩陣 A=(aij)m×n, 其中 m 為資源數量,n 為最喜歡目標資源的前n個用戶。矩陣的第i行記為Ai。

(2)計算目標資源R與所有用戶興趣模型的相似度,相似度最高的前n個用戶(也可以取相似度大于某個臨界值的所有用戶)即為最喜歡該資源的前n個用戶。設最喜歡目標資源 R的用戶集合 V={v1,v2,…,vn},目標資源 R與用戶 V[i]的相似度為 Sim(V[i],R),其中V[i]∈V。 設 A0=Sim(V[i],R),其中 i=0,1,…,N-1。

(3)分別計算用戶 V[i]的興趣模型與其他所有資源模型的相似度。設用戶V[i]對資源j的相似度為Sim(V[i],j),則 aij=Sim(V[i],j),其中 V[i]∈V;i=0,1,…,n-1;j=1,…,m-1。

(4)計算目標資源與其他資源之間的相似度。矩陣的每一個行向量都表示一個資源,其中A0為目標資源的向量。通過計算矩陣 A0與(Ai)T(i=1,2,…,m-1)的余弦相似度,選取相似度最高的前k個資源即為與目標資源最相似的資源,也就是推薦的資源列表。

4 實驗結果和分析

4.1 實驗數據集

本文基于北京國之源公司提供的基礎教育資源測試數據集對上述算法的有效性進行了測試,并與傳統的協同過濾推薦算法進行了比較。此數據集包含各類數據共9萬多條,數據集采用高中一年級的語文資源數據約3 000條,測試用戶數量為100,每個用戶至少訪問過30個資源。

4.2 度量標準

推薦質量的評價標準采用平均絕對誤差MAE(即通過計算預測的用戶評分與實際的用戶評分之間的誤差)來度量,MAE值越小,推薦質量越高。

用戶u對于目標資源R的真實評分Pu,R可表示為:

式中,Sim(u,R)為用戶 u與目標資源 R的余弦相似度。

設目標資源 R 的最近鄰集合為 Np={r1,r2,…,rn},資源 R與資源 ri的相似度為 sim (R,ri)(其相似度計算按第3.3節的步驟進行),其中 ri∈Np。則用戶 u對于資源R的預測評分 Qu,R可表示為[6]:

式中,Sim(u,ri)為用戶 u與資源 ri的余弦相似度。

設預測的用戶評分集合為{p1,p2,…,pn},對應的用戶實際評分集合為{q1,q2,…,qn},則平均絕對誤差 MAE可表示為:

4.3 實驗結果

通過對本文所提出的基于資源特征的協同過濾算法進行測試和與傳統的協同過濾推薦算法進行比較可知,本文算法MAE值比傳統算法低。實驗結果如圖2所示。

圖2 基于項目特征的協同過濾推薦算法

從圖中可以看出,本文的基于資源特征的協同過濾推薦的準確性要比傳統的基于項目的協同過濾推薦算法高;鄰居數太少,會使推薦的準確率降低,而鄰居數太多,則對推薦的準確性影響不大。

4.4 實驗結果分析與比較

本文所提出的基于資源特征的協同過濾推薦算法與傳統的基于項目的協同過濾推薦算法的主要不同點在于用戶興趣的表現方式不同。傳統的基于項目的協同過濾推薦算法是以資源整體為單位來表示用戶的興趣,而基于項目關鍵詞的協同過濾推薦算法是以資源特征為單位來表示用戶的興趣。

與傳統的基于項目的協同過濾推薦算法相比,本文所提出的基于資源特征的協同過濾推薦算法可以跟蹤用戶的短期興趣和長期興趣,不存在數據稀疏性問題和新資源的“冷啟動”問題,所需的顯示用戶反饋比較少,但是計算的復雜度比傳統算法高。

本文根據以往協同推薦算法的不足,提出了一種基于資源特征的協同過濾推薦算法。通過在基礎教育資源網上的實驗結果表明,該算法解決了數據稀疏性問題和新資源的“冷啟動”問題。同時,它還能夠跟蹤用戶的興趣變遷,而推薦質量也有所提高。下一步的工作是研究根據用戶的背景和用戶的關鍵詞興趣模型對用戶進行聚類,以減少相似資源的計算開銷并提高推薦的準確性。

1]趙晨琳,馬春娥.探索推薦引擎內部的秘密,第1部分:推薦引 擎初探 [EB/OL].(2011-03-16)[2012-03-02].http://www.ibm.com/developerworks/cn/web/1103_zhaoct_recommstudy1/.

[2]吳一帆,王浩然.結合用戶背景信息的協同過濾推薦算法[J].計算機應用,2008,28(11):2972-2974.

[3]劉旭東,葛俊杰,陳德人.一種基于聚類和協同過濾的組合推薦算法[J].計算機工程與科學,2010,32(12): 125-127.

[4]戰守義,井新.加入時間因素的個性化信息過濾技術[J].北京理工大學學報,2005,25(9):782-785.

[5]曾子明,于小鵬.電子商務推薦系統與智能談判技術[M].武漢:武漢大學出版社,2008:30-118.

[6]SARWAR B, KARYPIS G, KONSTON J, et al.Itembased collaborative filtering recommendation algorithms[C].In:Proceedings of the 10th international conference on World Wide Web, 2001:285-295.

猜你喜歡
資源用戶模型
一半模型
基礎教育資源展示
重要模型『一線三等角』
一樣的資源,不一樣的收獲
重尾非線性自回歸模型自加權M-估計的漸近分布
資源回收
資源再生 歡迎訂閱
資源再生(2017年3期)2017-06-01 12:20:59
關注用戶
商用汽車(2016年11期)2016-12-19 01:20:16
3D打印中的模型分割與打包
關注用戶
商用汽車(2016年6期)2016-06-29 09:18:54
主站蜘蛛池模板: 在线播放国产一区| 亚洲成A人V欧美综合| 91福利在线观看视频| 日日碰狠狠添天天爽| 老司机精品久久| 免费在线a视频| 国模私拍一区二区| 亚洲欧洲天堂色AV| 中文国产成人精品久久| 免费无码又爽又刺激高| 日本欧美成人免费| 欧美日韩成人| 亚洲人成网站观看在线观看| 992Tv视频国产精品| 亚洲一本大道在线| 久久特级毛片| 97无码免费人妻超级碰碰碰| 内射人妻无码色AV天堂| 国产美女免费网站| 久草性视频| 国内精品久久人妻无码大片高| 日韩精品免费一线在线观看| 欧美成人免费午夜全| 97精品伊人久久大香线蕉| 日本在线亚洲| 五月婷婷丁香综合| 在线国产三级| 成人va亚洲va欧美天堂| 亚洲成人高清无码| 日韩免费视频播播| 91九色视频网| 色老二精品视频在线观看| 久久性视频| AV天堂资源福利在线观看| 国产女人在线观看| 在线观看国产精品日本不卡网| 亚洲综合狠狠| 亚洲无码在线午夜电影| 全部免费毛片免费播放| 国产一级片网址| 人禽伦免费交视频网页播放| 无码中文字幕精品推荐| 人妻无码中文字幕第一区| 婷婷99视频精品全部在线观看| 狂欢视频在线观看不卡| 国产极品嫩模在线观看91| 免费国产一级 片内射老| 国产欧美视频在线| 97se亚洲综合不卡| 国产成人禁片在线观看| 国产一级毛片网站| 国产精品偷伦视频免费观看国产 | 精品一区二区久久久久网站| 婷婷久久综合九色综合88| 国产成人精品男人的天堂下载| 色综合激情网| 宅男噜噜噜66国产在线观看| 欧美福利在线观看| 男女精品视频| 波多野结衣视频一区二区| 欧美色伊人| a级毛片毛片免费观看久潮| 久久久久国色AV免费观看性色| 99国产精品一区二区| 毛片免费视频| 波多野结衣二区| 国产性生交xxxxx免费| 欧美精品在线观看视频| 亚洲三级片在线看| 一级毛片在线播放| 国产网站一区二区三区| www.国产福利| 久久精品人妻中文视频| 国产精品欧美亚洲韩国日本不卡| 国产乱子伦视频三区| 国产永久在线视频| 亚洲第一黄色网址| 国产一级毛片在线| 中文字幕亚洲综久久2021| 91区国产福利在线观看午夜 | 亚洲美女AV免费一区| 在线看片中文字幕|