999精品在线视频,手机成人午夜在线视频,久久不卡国产精品无码,中日无码在线观看,成人av手机在线观看,日韩精品亚洲一区中文字幕,亚洲av无码人妻,四虎国产在线观看 ?

基于共同評分項和權重計算的推薦算法研究

2016-03-01 08:59:38謝人強
計算機技術與發展 2016年9期
關鍵詞:用戶

謝人強,陳 震

(福州外語外貿學院信息系,福建福州 350202)

基于共同評分項和權重計算的推薦算法研究

謝人強,陳 震

(福州外語外貿學院信息系,福建福州 350202)

產生推薦列表是基于用戶的協同過濾推薦算法的重要步驟,也是最終的結果。針對在基于用戶的協同過濾推薦算法中,“產生推薦列表”環節的研究相對較少的這一現象,為了改進推薦算法的性能,通過權重計算和共同評分項方法來選定推薦項目,即首先將項目按照評分的近鄰用戶數量的多少進行排序,然后對排序的項目進行綜合權重計算,將其結果由高到低進行再次排序,從而產生推薦列表。該算法經MovieLens數據集測試,在測試中使用“平均絕對誤差”作為實驗測評指標,結果表明,在目標用戶的相似用戶數為60時,該算法相較于不考慮共同評分項或綜合權重計算因素的算法,有著更低的平均絕對誤差,其值為0.77。該算法能夠在一定程度上提高推薦系統的準確度。

協同過濾算法;評分項;綜合權重;準確度

1 概述

隨著互聯網信息技術的快速發展,以及網民數量的持續增加,使得互聯網的信息呈現爆炸式增長態勢,用戶正面臨著越來越嚴重的“信息過載”問題。目前,解決“信息過載”問題的方法主要有兩種:一是信息檢索技術,該類技術以搜索引擎為代表;二是信息過濾技術,該類技術以推薦系統為代表。兩類技術各有優缺點,但當用戶的需求不明確時,推薦系統能表現出更強的優勢。在眾多推薦系統算法中,協同過濾技術應用最為廣泛,且效果最好。所謂的協同過濾算法是通過分析、查找與目標用戶相似的近鄰用戶或項目,根據近鄰用戶或項目的情況,為目標用戶進行個性化推薦[1]。

現有的協同過濾推薦算法主要分為基于模型與基于內存兩類。基于模型的推薦算法是建立評分模型進行推薦,具體算法包括:基于聚類的算法、基于分類的算法、基于關聯規則的算法等[2]。基于內存的推薦算法包含基于用戶的推薦算法和基于項目的推薦算法,文中以基于用戶的推薦算法為例。

基于用戶的協同過濾算法,大致包含以下幾個步驟:

(1)建立用戶-項目評分矩陣;

(2)計算用戶相似度;

(3)選擇k近鄰;

(4)產生推薦列表[3]。

其中,常見的計算用戶間相似度的算法有余弦相似性、修正的余弦相似性、相關相似性等[4];選擇K近鄰主要有閾值法和Top-N法。

近些年,協同過濾算法得到了廣泛研究,眾多的模型與算法被提出。文中在此基礎上,充分考慮共同對項目評分的近鄰用戶數量、項目的權重計算方法兩個影響因素,提出協同過濾的改進算法,并通過實驗驗證算法的性能。

2 基于用戶的協同過濾推薦算法的相關研究

為了提高推薦算法的性能,許多學者對該領域進行了深入研究。例如,Reinders等充分利用用戶-項目評分矩陣信息,結合用戶相似性和項目相似性,使用了近鄰用戶對近鄰項目的評分信息[5]。George等提出歸一化評分項目的方法,將每個評分項目都添加一個歸一化因子,從而降低活躍用戶評價過的項目的重要性[6]。David等提出以概率模式為基礎的相似性計算方法[7]。Herlocker等提出了項目-評分矩陣中的評分信息的改進方式,對那些與目標用戶相似的近鄰用戶,如果沒有對目標項目進行評分,可以使用近鄰用戶的平均評分來參與相似度計算[8]。Xue G R等提出利用目標用戶的近鄰用戶集的平均分值作為近鄰用戶缺失的評分信息[9]。Larson等提出了“細粒度”的計算方法[10]。Zhao S等提出了整合與充分利用近鄰用戶和相似項目的信息來提高精度[11]。另外,李紅梅等利用精確歐氏局部敏感哈希算法對用戶評分數據進行降維處理,然后構建索引,從而快速獲取目標用戶的近鄰用戶[12]。汪靜等提出基于共同評分和相似性權重的協同過濾推薦算法,使用共同評分數據計算用戶的相似性,選擇被共同評分的數據計算項目的相似性,再結合相似性權重得出預測結果,該算法有效提高了推薦的準確度[13]。

綜上所述,協同過濾推薦算法的改進方法眾多,許多學者對改進推薦系統的性能做出了重大貢獻,但總體而言,在基于用戶的協同過濾推薦算法的各步驟中,“用戶相似度計算”環節的改進研究較多,而“產生推薦列表”環節的研究相對較少。文中將著眼于“產生推薦列表”環節,提出基于共同評分項和綜合權重計算的協同過濾推薦算法。

3 基于共同評分項和綜合權重計算的協同過濾推薦算法

3.1 算法說明

設計的算法包括以下幾個步驟,例如要給目標用戶u推薦K個項目。

(1)使用Pearson相關相似性算法計算u與其他所有用戶的相似度,并將相似度的值從高到低進行排列。Pearson相關相似性算法如式(1)所示[14-15]:

其中,Ric表示用戶i對項目c的評分;Ri表示用戶i的平均評分;表示用戶j的平均評分;Rij表示用戶i和用戶j共同評分的項目集合。

(2)選取相似度最高的前N個用戶數據放入集合A中。

(3)將項目按集合A中用戶的共同評分數量的多少進行排序,用戶共同評分多的項目排在前,共同評分少的項目排在后,排序后項目集合為B。

(4)利用用戶間相似性的程度,計算集合B中各項目的權重,例如項目c的權重計算如下:

其中,TWeight(c) 為 項 目 c的 總 權 重; Sumsim(c)為對項目c進行評價的,與目標用戶u相似的所有用戶的相似值之和;Weight(c)為項目c的權重值;Ic為對項目c進行評價的用戶集合;j為Ic中的某個用戶;sim(u,j)表示目標用戶u與用戶j的相似值。

(5)將各項目的權重,按從大到小進行排序。

(6)選擇權重最大的前K個項目推薦給用戶。

3.2 算法分析

該算法具有較強的實用性,同時也具有一定的優越性,具體表現在:

(1)步驟1和步驟2保證了參與計算的用戶都與目標用戶有較高的相似度,從而保證了它們之間的相關性,因此獲得的推薦信息將會更準確。

(2)通過步驟3,可以在一定程度上保證權重高的項目優先被推薦。因為共同評分多的項目,往往是因為相似用戶對該項目的興趣程度高。

(3)通過步驟4準確計算步驟3得出的各項目的權重,然后將前K個項目進行推薦,保證了推薦算法的準確性。

3.3 算法設計

根據前文的分析,基于雙重選擇的協同過濾推薦算法設計如圖1所示。

4 實驗分析

4.1 實驗數據與測評指標

實驗數據來源于GroupLens提供的MovieLens數據集,該數據集是一個評分數據集,是用戶對自己看過的電影進行評分,分值為1~5,不同的評分分值表達了用戶對某影片的不同喜好程度。MovieLens數據集包括三個大小不同的庫,評分數據分別為10萬條、1百萬條、1千萬條。為了計算方便,文中選取小規模的數據集,它包含943個用戶對1 682部電影的10萬條評分數據。

在實驗過程中,將數據集按照8∶2的比例劃分為訓練集和測試集,在訓練集上按3.1節的算法建立相應的模型,在測試集上對目標用戶行為進行預測。實驗測評指標使用平均絕對誤差(Mean Absolute Error,MAE),它是一種統計度量方法。MAE通過計算目標用戶在訓練集上的評分與測試集上的評分之間的差值來度量算法及預測準確性,見式(5)。

其中,n為評分總數;ric為用戶i對項目c的實際評分;r^ic為用戶i對項目c的預測評分;MAE數值與推薦的預測準確性呈反比,MAE越小,推薦效果越好。

為了比較文中所描述算法的性能,引入另外兩種算法進行比較,分別命名為UBCF-1、UBCF-2,文中算法命名為UBCF-3。三種算法的具體計算思路如表1所示。

由表1可以看出,相比于UBCF-1,UBCF-2改進了項目權重的計算方法,UBCF-3相比UBCF-2,考慮了共同評分項的因素。

4.2 測評結果

對MovieLens數據集進行測評,當使用UBCF-1時,與目標用戶的相似用戶數選取值N發生變化時,得到如圖2所示的MAE變化圖。

UBCF-2使用了文中介紹的權重計算公式(見式(2)~(4)),通過程序運行,得出了如圖3所示的MAE變化圖。

從圖3可以看出,UBCF-2中MAE數值有了大幅降低,即推薦系統的準確率得到了大幅提高。在UBCF-2的基礎上,UBCF-3考慮了項目共同評分的數量,該算法MAE變化圖如圖4所示。

從圖4可以看出,UBCF-3的總體性能相對于UBCF-2又有了一定程度的提升,當N=60,即目標用戶的相似用戶數為60時,UBCF-3算法的MAE值最小。通過圖5,可以顯而易見地得到UBCF-3相對UBCF-1、UBCF-2有著更好的性能。

圖4 UBCF-3的MAE變化圖

UBCF-3算法給目標用戶推薦的項目數不同,MAE值也會產生相應的變化,如圖6所示。

5 結束語

文中提出了一種基于共同評分項和綜合權重計算的協同過濾推薦算法。考慮了共同評分用戶數對產生最終推薦列表的影響,一般情況下,共同評分越多的項目,往往是因為相似用戶對該項目的興趣程度越高,因而對它進行推薦,準確度就越高;也考慮了綜合權重計算對推薦列表產生的影響,并提出了綜合權重的計算公式。在MovieLens數據集上的測試結果表明,基于共同評分項和綜合權重計算的協同過濾推薦算法能夠提高推薦系統的準確度,獲得更好的推薦質量。

[1] 朱麗中,徐秀娟,劉 宇.基于項目和信任的協同過濾推薦算法[J].計算機工程,2013,39(1):58-62.

[2] 劉宇軒.混合協同過濾算法研究[D].北京:北京郵電大學,2013.

[3] 碩良勛,柴變芳,張新東.基于改進最近鄰的協同過濾推薦算法[J].計算機工程與應用,2015,51(5):137-141.

[4] 馬宏偉,張光衛,李 鵬.協同過濾推薦算法綜述[J].小型微型計算機系統,2009(7):1282-1288.

[5] Wang Jun,Vries A P,Reinders M J T.Unifying user-based and item-based collaborative filtering approaches by similarity fusion[C]//Proceedings of ACM SIGIR’06.[s.l.]:ACM,2006:501-508.

[6] Karypis G.Evaluation of item-based Top-N recommendation algorithms[C]//Proceedings of the tenth international conference on information and knowledge management.[s.l.]:[s. n.],2001:247-254.

[7] Kits B,Freed D,Vrieze M.Cross-sell:a fast promotion-tunable customer-item recommendation method based on conditionally independent probabilities[C]//Proceeding of the sixth ACM SIGKDD international conference on knowledge discovery data mining.[s.l.]:ACM,2000:437-446.

[8] Herlocker J L,Konstan J A,Borchers A,et al.An algorithmic framework for performing collaborative filtering[C]//Proceedings of ACM IGIR’99.[s.l.]:ACM Press,1999:230-237.

[9] Xue G R,Lin C,Yang Q,et al.Scalable collaborative filtering using cluster-based smoothing[C]//Proceedings of SIGIR. [s.l.]:[s.n.],2005.

[10] Shi Yue,Larson M,Hanjalic A.Exploiting user similarity based on rated-item pools for improved user-based collaborative filtering[C]//Proceedings of the third ACM conference on recommender systems.[s.l.]:ACM,2009:125-132.

[11]Ding S,Zhao S,Yuan Q,et al.Boosting collaborative filtering based on statistical prediction errors[C]//Procedding of ACM conference on recommender systems.[s.l.]:ACM,2008:3-10.

[12]李紅梅,郝文寧,陳 剛.基于精確歐氏局部敏感哈希的協同過濾推薦算法[J].計算機應用,2014,34(12):3481-3486.

[13]汪 靜,印 鑒,鄭利榮,等.基于共同評分和相似性權重的協同過濾推薦算法[J].計算機科學,2010,37(2):99-104.

[14]孫遠帥,陳 垚,劉向榮,等.基于項目層次相似性的推薦算法[J].山東大學學報:工學版,2014,44(3):8-14.

[15]胡 勛,孟祥武,張玉潔,等.一種融合項目特征和移動用戶信任關系的推薦算法[J].軟件學報,2014,25(8):1817-1830.

Research on Recommendation Algorithm Based on Co-rating and Weight Calculation

XIE Ren-qiang,CHEN Zhen
(Department of Information Technology,Fuzhou University of International Studies and Trade,Fuzhou 350202,China)

The recommended list is an important step of the user-based collaborative filtering recommendation algorithm and is also the final result.According to the phenomenon of less research on the“generation of recommendation list”in collaborative filtering recommendation algorithm based on user,in order to improve the performance of it,the recommended items are selected by weight calculation and the method of co-rating number.Firstly the co-rating items is sorted by the number of nearest neighbor.Then,the ranking items are calculated by comprehensive weight,and the results are sorted by high to low,and the recommended list is generated.The algorithm is tested by MovieLens data set.It uses the“Mean Absolute Error”as the evaluation index in the test.The results show that when the target user’s similar user number is 60,the algorithm has a lower mean absolute error compare with those calculation algorithms which don’t consider the factors of common rating items or comprehensive weight,and the value is 0.77.The algorithm can improve the accuracy of the recommendation system to a certain extent.

collaborative filtering algorithm;co-rating;comprehensive weight;accuracy

TP391

A

1673-629X(2016)09-0069-04

10.3969/j.issn.1673-629X.2016.09.016

2015-08-12

2015-12-10< class="emphasis_bold">網絡出版時間:

時間:2016-08-23

2014年福建省教育科技計劃項目(JB14129)

謝人強(1982-),男,副教授,研究生,研究方向為電子商務、信息管理與信息系統。

http://www.cnki.net/kcms/detail/61.1450.TP.20160823.1343.026.html

猜你喜歡
用戶
雅閣國內用戶交付突破300萬輛
車主之友(2022年4期)2022-08-27 00:58:26
您撥打的用戶已戀愛,請稍后再哭
關注用戶
商用汽車(2016年11期)2016-12-19 01:20:16
關注用戶
商用汽車(2016年5期)2016-11-28 09:55:15
兩新黨建新媒體用戶與全網新媒體用戶之間有何差別
關注用戶
商用汽車(2016年6期)2016-06-29 09:18:54
關注用戶
商用汽車(2016年4期)2016-05-09 01:23:12
挖掘用戶需求尖端科技應用
Camera360:拍出5億用戶
創業家(2015年10期)2015-02-27 07:55:08
100萬用戶
創業家(2015年10期)2015-02-27 07:54:39
主站蜘蛛池模板: a欧美在线| 在线网站18禁| 干中文字幕| 综合社区亚洲熟妇p| 国产麻豆精品手机在线观看| 国产精品成人一区二区| 国产成人高清精品免费| 麻豆国产在线观看一区二区 | 日韩少妇激情一区二区| 亚欧成人无码AV在线播放| 亚洲欧洲AV一区二区三区| 亚洲首页在线观看| 欧美日韩精品在线播放| 欧美日韩国产综合视频在线观看 | 亚洲综合九九| 激情无码字幕综合| 亚洲第一色视频| 91视频区| 四虎永久在线视频| 国产精品无码翘臀在线看纯欲| 免费毛片a| 在线观看免费人成视频色快速| 欧美啪啪一区| 国产农村1级毛片| 国产无人区一区二区三区| 天天操天天噜| 国产99视频免费精品是看6| 成人在线亚洲| 91探花在线观看国产最新| 国产国模一区二区三区四区| 国产成人亚洲无码淙合青草| 91网在线| 国产精品99一区不卡| 欧美精品v欧洲精品| 欧美国产精品不卡在线观看| 亚洲精品色AV无码看| 精品福利国产| 久久久久人妻一区精品色奶水| 99手机在线视频| 久久一日本道色综合久久| 国产黄在线免费观看| 国产精品尹人在线观看| 久久中文电影| 99精品国产自在现线观看| 91青青草视频| 在线免费看黄的网站| 无码精品一区二区久久久| AV网站中文| 456亚洲人成高清在线| 国产日韩欧美中文| 欧美成人手机在线观看网址| 亚洲欧美人成人让影院| 国产女人18水真多毛片18精品| 狠狠干欧美| 一级一级一片免费| 亚洲国产第一区二区香蕉| 日韩国产精品无码一区二区三区| 在线va视频| 国产激情无码一区二区免费| 蜜臀AVWWW国产天堂| 国产乱人伦精品一区二区| 亚洲精品无码在线播放网站| 自慰网址在线观看| 欧美国产日本高清不卡| 欧美成人第一页| 精品天海翼一区二区| 无码中文AⅤ在线观看| 国产高清无码第一十页在线观看| 亚洲成人免费看| 中文字幕久久精品波多野结| 四虎国产在线观看| 亚洲欧美综合在线观看| 日韩精品高清自在线| 国产精品55夜色66夜色| 国产在线视频欧美亚综合| 久久香蕉国产线看精品| 亚洲青涩在线| 国产成人一区二区| 一区二区三区四区在线| 日韩一区精品视频一区二区| 日韩在线观看网站| 亚洲色图欧美激情|