999精品在线视频,手机成人午夜在线视频,久久不卡国产精品无码,中日无码在线观看,成人av手机在线观看,日韩精品亚洲一区中文字幕,亚洲av无码人妻,四虎国产在线观看 ?

融合用戶評分和屬性相似度的協(xié)同過濾推薦算法

2017-04-24 10:40:37王三虎王豐錦
計算機應(yīng)用與軟件 2017年4期
關(guān)鍵詞:用戶

王三虎 王豐錦

1(呂梁學院計算機科學與技術(shù)系 山西 呂梁 033000)2(同方股份有限公司 北京 100083)

融合用戶評分和屬性相似度的協(xié)同過濾推薦算法

王三虎1王豐錦2

1(呂梁學院計算機科學與技術(shù)系 山西 呂梁 033000)2(同方股份有限公司 北京 100083)

為了提高協(xié)同過濾推薦系統(tǒng)的推薦效率和準確性,更好地向用戶提供個性化的推薦服務(wù),提出一種用戶評分和屬性相似度的推薦算法。首先分析當前協(xié)同過濾推薦研究的現(xiàn)狀,設(shè)計相似度、興趣傾向相似度、置信度等指標作為評分標準,使得用戶相似度的計算更加準確、有區(qū)分度。然后根據(jù)用戶屬性來衡量用戶之間的相似度,利用MovieLens數(shù)據(jù)集和Book-Crossing數(shù)據(jù)集做對比實驗,對比精度、通用性和不同稀疏度及冷啟動情況下的性能。實驗結(jié)果表明,本文算法不僅提高了推薦精度,而且明顯優(yōu)于其他協(xié)同過濾推薦算法,具有更高的實際應(yīng)用價值。

推薦系統(tǒng) 協(xié)同過濾 相似性度量 稀疏性問題

0 引 言

近十年,電子商務(wù)得到長足的發(fā)展,商戶之間的競爭也逐步需要商戶本身主動去掌握更準確的用戶的需求和偏好,從而有針對性地為客戶提供服務(wù)者。因此一種高準確定、高性能的推薦過濾算法顯得十分重要[1]。協(xié)同過濾推薦可以充分利用信息間的聯(lián)系,執(zhí)行效率高,可以得到較好的推薦結(jié)果,因而成為當前研究的熱點[2]。

針對協(xié)同過濾推薦問題,國內(nèi)外學者和專家進行了大量深入的研究。迄今為止,協(xié)同過濾推薦算法眾多[3-6],每一種協(xié)同過濾推薦算法的工作思想不同,在實際應(yīng)用,這些協(xié)同過濾推薦算法均存在各自的優(yōu)勢,同時缺陷也十分明顯:如數(shù)據(jù)稀疏、冷啟動、可擴展性差等[7-9]。為了解決這些不足,一些學者提出了采用關(guān)聯(lián)規(guī)則數(shù)據(jù)挖掘、貝葉斯網(wǎng)絡(luò)、神經(jīng)網(wǎng)絡(luò)、支持向量機等技術(shù)[10-12],以提高推薦系統(tǒng)的推薦精度,獲得了不錯的推薦效果。然而用戶興趣受到多種因素的綜合作用和影響,當前協(xié)同過濾推薦算法的相似度值計算不科學,缺乏合理性,忽略了用戶的興趣信息,推薦精度有待進一步提高[13]。

為了提高協(xié)同過濾推薦系統(tǒng)的推薦效率和準確性,設(shè)計了一種基于用戶評分和屬性相似度相融合的協(xié)同過濾推薦算法。利用MovieLens數(shù)據(jù)集和Book-Crossing數(shù)據(jù)集做對比實驗,對比精度、通用性和不同稀疏度及冷啟動情況下的性能。

1 經(jīng)典協(xié)同過濾推薦算法

1.1 經(jīng)典協(xié)同過濾推薦算法

經(jīng)典協(xié)同過濾推薦算法工作過程如下:

(1) 建立用戶對項目評價的評分矩陣R={rij}m×n,其中,m、n分別表示用戶數(shù)和項目數(shù),rij為用戶i對項目j的評分,其可以描述用戶的判斷和偏好,具體如表1所示。

表1 用戶-項目評分矩陣

(2) 根據(jù)評分值得到用戶的相似度值,然后對相似度值進行排序,從中選擇k個近鄰。

(3) 根據(jù)k個近鄰對用戶與項目評分值進行估計。設(shè)i的“最近鄰居”集為Si,i對項目x的評分值為Pix,那么有:

(1)

1.2 傳統(tǒng)相似度計算方法

傳統(tǒng)相似度計算方法主要有:余弦相似度、相關(guān)相似度。

(1) 余弦相似度:用戶評分為一個向量,當用戶不對具體項目進行評分時,那么就認為該評分值等于0,用戶i和j間的相似度sim(i,j)計算公式為:

(2)

其中:rix、rjx分別為用戶i和j對項目x的評分值。

(2)Pearson相似度:Pearson相似度只考慮兩個用戶共同評分的項目集合,去掉全部評分的平均值。兩個用戶i和j的共同評分為Iij(Iij=Ii∩Ij),Pearson相似度計算公式為:

(3)

2 協(xié)同過濾推薦算法

經(jīng)典算法存在相似度值計算不科學,缺乏合理性,忽略了用戶的興趣信息等缺陷,導(dǎo)致推薦誤差大,推薦結(jié)果不可靠[14]。為提高推薦精度,挖掘用戶評分中的興趣信息,本文提出了一種新的相似度計算方法。

2.1 用戶評分相似度

用戶評分相似度可以描述兩個用戶對同一項目評分的非線性變化趨勢,為此,引入非線性函數(shù)描述用戶評分相似度,那么兩個用戶對同一項目評分的相似度計算公式為:

(4)

2.2 興趣的傾向相似度

每個用戶有自己的評分習慣,對一個具體項目,有的用戶給高分,然而有的用戶卻給低分,這樣用戶的平均評分描述了用戶對某目標的興趣,用戶i和j對同一個項目興趣傾向相似度計算公式為:

(5)

2.3 用戶評分相似度的置信度

當兩個用戶對某一個項目給出相近的分數(shù)時,但是也不完全表示兩個用戶是相似的,因為相似度還有一個置信度,為此選擇Jaccard函數(shù)度量置信度,具體計算公式為:

(6)

其中,Ii表示用戶i評價的項目集合。綜上所述,相似度最終計算公式為:

sim3(i,j)

(7)

2.4 用戶屬性相似度

經(jīng)典協(xié)同過濾推薦算法僅通過已有用戶相關(guān)信息實現(xiàn)推薦,無法對新用戶信息進行精確評價,導(dǎo)致產(chǎn)生冷啟動的概率十分高。在用戶評分數(shù)目不多時,通過用戶屬性相似度進行推薦,隨著用戶評分項目的增多,通過用戶評分來進行推薦。為此,引入sigmoid函數(shù)將用戶屬性推薦和用戶評分推薦進行融合,實現(xiàn)兩者的平滑過渡。設(shè)用戶i的特征向量為Attri=(ai1,ai2,…,ain),n是用戶屬性的個數(shù),如果用戶i和j的第m個屬性相同,simAttr(i,j,m)=1,不然simAttr(i,j,m)=0,這樣用戶i和j屬性的相似度計算公式為:

simAttr(i,j)=∑m∈Attrwm·simAttr(i,j,m)

(8)

其中,wi是第i個屬性的權(quán)值。

2.5 用戶屬性相似度與用戶評分相似度融合

用戶屬性相似度與用戶評分相似度融合的計算公式為:

sim(i,j)=α·simAttr(i,j)+β·simscore(i,j)

(9)

(10)

β+α=1

(11)

2.6 本文算法的工作步驟

Step1 收集用戶的屬性維度和對應(yīng)數(shù)據(jù)值,同時建立屬性矩陣。

Step2 收集用戶的屬性評分數(shù)據(jù)及對應(yīng)的值,同時計算評分的值,建立相似度評分矩陣。

Step3 對兩種矩陣進行分析,綜合兩者可以得到用戶相似度矩陣。

Step4 通過相似度矩陣得到用戶i的K個近鄰,通過式(12)估計未評分項目x的值,并根據(jù)結(jié)果得到相應(yīng)的推薦方案。

(12)

其中,NK是與用戶最相似的K個鄰居;rki是用戶k對x的評分。

3 仿真實驗

3.1 數(shù)據(jù)集

在Intel(R)Corei5-3337U3.0GHzCPU,4GBRAM,WindowsXP操作系統(tǒng)計算機上,采用VisualC++編程進行仿真測試。數(shù)據(jù)來自公開數(shù)據(jù)集MovieLens,其描述具體見文獻[11]。

3.2 對比算法及評價標準

為了使本文算法實驗結(jié)果更具說服力,選擇文獻[15]、文獻[16]的協(xié)同過濾推薦算法進行對比實驗,選擇平均絕對誤差(MAE)作為算法性能優(yōu)劣的評價標準,其定義如下:

(13)

式中,N為測試集大小,pi為推薦算法的預(yù)測評分值,qi為用戶的實際評分值。

3.3 結(jié)果與分析

推薦精度比較 最近鄰數(shù)為35時,采用推薦算法對問題進行求解,具體結(jié)果圖1所示。從圖1可以清楚看出,本文協(xié)同過濾推薦算法的MAE值低于對比算法,有效提高了推薦的精度,獲得了比較理想的推薦結(jié)果。

圖1 不同算法的推薦精度對比

冷啟動條件下的結(jié)果分析 為了模擬冷啟動條件,選擇10個用戶,并刪除其評價信息,結(jié)果如圖2所示。對圖2進行詳細分析可知,本文融合用戶評分和屬性相似度的協(xié)同過濾推薦算法能解決當前存在的冷啟動情況下推薦算法無法施行的難題,提高了推薦精度,獲得更優(yōu)的推薦結(jié)果。

圖2 冷啟動條件下的算法性能對比

不同稀疏度下的性能對比 不同數(shù)據(jù)稀疏度的推薦誤差如圖3所示。數(shù)據(jù)稀疏度與MAE之間是一種近似線性變化關(guān)系,但是在同等條件下,與文獻[15]和文獻[16]的對比結(jié)果發(fā)現(xiàn)本文算法推薦結(jié)果的MAE值更小。因此本文算法的推薦精度優(yōu)于同樣條件下的文獻[15]和文獻[16]的算法。

圖3 稀疏度不同情況下三種算法的性能對比

通用性測試 為了驗證本文融合用戶評分和屬性相似度的協(xié)同過濾推薦算法的通用性,選擇Book-Crossing數(shù)據(jù)集進行仿真測試,有287 558個用戶信息及他們對231 797本電子書的1 491 807評分數(shù)據(jù)。我們采取[0,10]區(qū)間內(nèi)數(shù)據(jù)對評價建模采取評分制,1:評價最高,0:評價最低。不同算法的實驗結(jié)果如圖4所示。從圖4可知,相對于其他協(xié)同過濾推薦算法,本文協(xié)同過濾推薦算法的MAE也最小,推薦精度更高,再次證明了本文算法的優(yōu)越性以及良好的通用性。

圖4 與經(jīng)典算法的性能對比

4 結(jié) 語

過濾推薦系統(tǒng)一直是電子商務(wù)研究中的重點和熱點,為了得到高準確度、高性能、通用性和適應(yīng)性更強的推薦結(jié)果,本文設(shè)計了一種融合用戶相似度和評分屬性的協(xié)同過濾推薦算法。首先收集用戶的屬性維度和對應(yīng)的值,再收集描述用戶對項目的興趣信息的評分信息,以增強用戶相似度的區(qū)分度。然后采用用戶屬性來衡量用戶之間的相似度,最后采用多個數(shù)據(jù)集進行仿真測試。仿真實驗結(jié)果表明,本文方法利用了用戶依靠,能夠大幅度提高推薦質(zhì)量,推薦可以滿足用戶實際要求,具有一定的實際應(yīng)用價值。

[1]MichaelJ,AndreasT,RobertL.Combiningpredictionsforaccuraterecommendersystems[C]//Proceedingsofthe16thACMSIGKDDInternationalConferenceonKnowledgeDiscoveryandDataMining,2010:693-702.

[2]CachedaF,CarneiroV,FernA,etal.Comparisonofcollaborativefilteringalgorithms:Limitationsofcurrenttechniquesandproposalsforscalable,high-performancerecommendersystems[J].ACMTransactionsontheWeb,2011,5(1):2-10.

[3]BellogínA,CastellsP,CantadorI.Self-adjustinghybridrecommendersbasedonsocialnetworkanalysis[C]//Proceedingsofthe34thinternationalACMSIGIRconferenceonResearchanddevelopmentinInformationRetrieval,2011:1147-1148.

[4]HeZ.ThestudyofpersonalizedrecommendationbasedonWebdatamining[C]//IEEE,InternationalConferenceonCommunicationSoftwareandNetworks.IEEE,2011:386-390.

[5]DouGQ,ZhuYS,HanYM.ResearchonselectionsystembasedonBayesianrecommendationmodel[C]//InternationalConferenceonAdvancedMechatronicSystems.IEEE,2011:35-38.

[6]MaiJ,FanY,ShenY.ANeuralNetworks-BasedClusteringCollaborativeFilteringAlgorithminE-CommerceRecommendationSystem[C]//InternationalConferenceonWebInformationSystemsandMining.IEEE,2009:616-619.

[7] 韋素云,業(yè)寧,朱健,等.基于項目聚類的全局最近鄰的協(xié)同過濾算法[J].計算機科學,2012,39(12):149-152.

[8]ChenZhiMin,JiangYi,ZhaoYao.Acollaborativefilteringrecommendationalgorithmbasedonuserinterestchangeandtrustevaluation[J].InternationalJournalofDigitalContentTechnologyanditsApplications,2010,4(9):106-113.

[9]WangMJ,HanJT.Collaborativefilteringrecommendationbasedonitemratingandcharacteristicinformationprediction[C]//InternationalConferenceonConsumerElectronics,CommunicationsandNetworks.IEEE,2012:214-217.

[10]WuYK,TangZH.CollaborativefilteringsystembasedonclassificationandextendedK-meansalgorithm[J].AdvancesinInformationSciencesandServiceSciences,2011,3(7):187-194.

[11]WuYK,YaoJR,TangZH,etal.CollaborativeFilteringBasedonMulti-levelItemCategorySystem[J].JournalofConvergenceInformationTechnology,2012,7(7):64-71.

[12] 李鵬飛,吳為民.基于混合模型推薦算法的優(yōu)化[J].計算機科學,2014,41(2),68-71.

[13] 孫金剛,艾麗蓉.基于項目屬性和云填充的協(xié)同過濾推薦算法[J].計算機應(yīng)用,2012,32(3):658-660,668.

[14] 韋素云,業(yè)寧,朱健,等.基于項目聚類的全局最近鄰的協(xié)同過濾算法[J].計算機科學,2012,39(12):149-152.

[15]QiL,EnhongC,HuiX,etal.EnhancingcollaborativefilteringbyuserinterestexpansionviapersonalizedRanking[J].IEEETransactionsonSystems,Man,andCybernetics,PartB:Cybernetics,2012,42(1):218-233.

[16] 鄒永貴,望靖,劉兆宏,等.基于項目之間相似性的興趣點推薦方法[J].計算機應(yīng)用研究,2012,29(1):116-118,126.

A COLLABORATIVE FILTERING RECOMMENDATION ALGORITHM BASED ON USER SCORE AND ATTRIBUTE SIMILARITY

Wang Sanhu1Wang Fengjin2

1(DepartmentofComputerScienceandEngineering,LvliangUniversity,Lvliang033000,Shanxi,China)2(TongfangCo.,Ltd,Beijing100083,China)

In order to improve the recommendation efficiency and accuracy of collaborative filtering recommendation system, and to provide personalized recommendation service, a recommendation algorithm based on user score and attribute similarity is proposed. Firstly, the current status of collaborative filtering recommendation research is analyzed, and the similarity, similarity of interest tendency, confidence and other indicators are used as the scoring criteria, which makes the calculation of user similarity more accurate and discriminative. Then the similarity between users is measured according to the attributes of the users. The comparison is made between the MovieLens data set and the Book-Crossing data set, and the accuracy, versatility and performance under different sparsity and cold start conditions are compared. Experimental results show that the proposed algorithm not only improves the recommendation accuracy, but also is superior to other collaborative filtering recommendation algorithms, and has higher practical application value.

Recommendation system Collaborative filtering Similarity measurement Sparsity problem

2016-11-09。山西省教育廳教學改革項目(J2014120,J2015121)。王三虎,副教授,主研領(lǐng)域:數(shù)據(jù)庫應(yīng)用技術(shù),算法設(shè)計,數(shù)據(jù)挖掘。王豐錦,高工。

TP3

A

10.3969/j.issn.1000-386x.2017.04.052

猜你喜歡
用戶
雅閣國內(nèi)用戶交付突破300萬輛
車主之友(2022年4期)2022-08-27 00:58:26
您撥打的用戶已戀愛,請稍后再哭
關(guān)注用戶
商用汽車(2016年11期)2016-12-19 01:20:16
關(guān)注用戶
商用汽車(2016年5期)2016-11-28 09:55:15
兩新黨建新媒體用戶與全網(wǎng)新媒體用戶之間有何差別
關(guān)注用戶
商用汽車(2016年6期)2016-06-29 09:18:54
關(guān)注用戶
商用汽車(2016年4期)2016-05-09 01:23:12
挖掘用戶需求尖端科技應(yīng)用
Camera360:拍出5億用戶
100萬用戶
主站蜘蛛池模板: av无码一区二区三区在线| 91精品福利自产拍在线观看| 99精品这里只有精品高清视频| 99re视频在线| 久久综合久久鬼| 试看120秒男女啪啪免费| 欧美日本在线播放| a级毛片一区二区免费视频| AV天堂资源福利在线观看| 久久网欧美| 亚洲va在线∨a天堂va欧美va| 91精品伊人久久大香线蕉| 成人av手机在线观看| 青青草原国产av福利网站| 久久综合伊人77777| 无码中文字幕加勒比高清| 亚洲欧美在线综合一区二区三区| 日韩成人在线网站| 国产哺乳奶水91在线播放| 青青久在线视频免费观看| 国产黄在线观看| 免费毛片a| 成人在线观看一区| 国产精品性| 亚洲第一精品福利| 欧美精品二区| 伊人久久精品无码麻豆精品 | 亚洲中文字幕日产无码2021| 在线观看网站国产| 国产一级做美女做受视频| 毛片免费在线| 亚洲国产成人自拍| 亚洲一级毛片免费观看| 日本在线亚洲| 综合色区亚洲熟妇在线| 欧美精品一区二区三区中文字幕| 国产精品区网红主播在线观看| 91网址在线播放| 天堂成人在线| 亚洲成人高清无码| 国产拍揄自揄精品视频网站| 99re在线免费视频| 久久精品只有这里有| 免费黄色国产视频| 色老二精品视频在线观看| 国产成人做受免费视频| 1级黄色毛片| 不卡网亚洲无码| 国产精品片在线观看手机版| 亚洲精品va| h视频在线观看网站| 六月婷婷激情综合| 亚洲人网站| 午夜精品久久久久久久无码软件| 久久天天躁夜夜躁狠狠| 亚洲热线99精品视频| 国产高清国内精品福利| 色综合网址| 久草视频一区| 国产午夜无码片在线观看网站 | 波多野结衣第一页| 高清无码手机在线观看| 国产成人精品一区二区三区| 国产精品理论片| 国产在线观看第二页| 青青草a国产免费观看| www.日韩三级| 999精品在线视频| 国产美女一级毛片| 91福利免费视频| 亚洲爱婷婷色69堂| 欧美一级高清片欧美国产欧美| www成人国产在线观看网站| 一本大道AV人久久综合| 在线中文字幕网| 一级爆乳无码av| 久久影院一区二区h| 伊人蕉久影院| 亚洲国产精品一区二区第一页免 | 中国一级毛片免费观看| 97免费在线观看视频| 久久综合国产乱子免费|