999精品在线视频,手机成人午夜在线视频,久久不卡国产精品无码,中日无码在线观看,成人av手机在线观看,日韩精品亚洲一区中文字幕,亚洲av无码人妻,四虎国产在线观看 ?

基于用戶興趣和項目屬性的協同過濾算法

2017-06-29 12:00:34武文琪劉永利王建芳
計算機應用與軟件 2017年5期
關鍵詞:用戶

劉 靜 武文琪 李 驍 劉永利 王建芳

(河南理工大學計算機科學與技術學院 河南 焦作 454000)

基于用戶興趣和項目屬性的協同過濾算法

劉 靜 武文琪 李 驍 劉永利 王建芳

(河南理工大學計算機科學與技術學院 河南 焦作 454000)

針對傳統協同過濾算法不能及時反應用戶的興趣變化、時效性不足而導致推薦精度不高的問題,提出一種基于用戶興趣和項目屬性的協同過濾算法。在傳統協同過濾基礎上綜合考慮評分時間、相似度以及項目屬性等因素,首先在計算相似度過程中加入基于時間的用戶興趣度權重函數,然后再與項目屬性相似度進行融合,最后進行項目預測與推薦。在Movielens數據集上的實驗結果表明,所提出的算法與已有的經典算法相比,平均絕對誤差降低了3%~6%,有效提高了推薦的準確性。

用戶興趣 項目屬性 協同過濾 權重函數 相似度

0 引 言

個性化推薦[1-2]是從海量數據中挖掘出有用信息的一種技術,協同過濾是其應用最廣泛、最成功的推薦算法之一,通過收集和分析用戶的信息數據來學習用戶的興趣偏好和行為模式,從而為用戶推薦所需要的信息或商品。

傳統的協同過濾算法忽略了隨著時間變化而用戶的興趣也在不斷發生變化的問題,即存在用戶興趣漂移現象[3]。用戶的興趣偏好不但范圍廣泛,而且實時變化,例如:一個孩子在幾歲時可能對動畫片感興趣,青春期可能對浪漫愛情片感興趣,隨后有可能對文藝片感興趣,再過幾年可能對劇情片感興趣等。隨著時間推移,用戶的關注點在不斷變化,如何捕獲這一動態的時間效應是個難題[4]。

通常將時間窗作為判斷用戶興趣變化的一種表征方式,采用加權處理的方法,來提高推薦質量。文獻[5]中,通過對心理遺忘曲線擬合出用戶興趣權重函數,提出基于時間窗的改進協同過濾算法,從而追蹤和學習用戶的興趣偏好;文獻[6-8]提出基于評價時間數據權重的用戶興趣度量函數,使得用戶最可能感興趣近期訪問過的資源。這些方法在相似性度量過程中加入了時間因子,從一定程度上解決了用戶興趣漂移問題,但是忽略了不同對象的類別屬性等特征信息,這在一定程度上也會影響最終的推薦質量。

針對這一問題,本文提出了一種基于用戶興趣和項目屬性的協同過濾推薦算法。在傳統的用戶—項目評分矩陣基礎上綜合考慮用戶偏好、評分時間以及項目屬性特征等因素,先在計算相似度過程中加入時間邏輯性因素,再與項目屬性相似度進行融合,明確用戶對項目中各個屬性的偏好程度,更能體現出用戶的行為需求。

1 相關工作

提供個性化推薦服務已經成為各大電子商務網站和社交媒體的核心競爭力所在,如何實時根據用戶的瀏覽和購買行為為其推薦更加符合用戶偏好的項目,即在正確的時間推薦合適的項目,是目前推薦系統的一大挑戰。在信息飛速發展的當代,用戶興趣和信息話題的流行轉移速度也非常快,文獻[9-10]提出了一個實時的在線推薦系統——TencentRec,并在此系統上部署一系列的應用,每天為10億用戶根據其興趣愛好實時推薦話題,在實踐中觀察TencentRec的性能。并在此系統上提出了一個基于項目的可擴展協同過濾算法[10],處理隱式反饋問題,增量更新和實時修剪以減少計算成本,對數據進行實時采集和處理,可以隨時捕捉用戶的興趣,提高推薦質量。文獻[11]提出了一種基于空間正則化和突發加權平滑的混合模型推薦算法。利用正則化框架發現社交網絡中的空間信息以及在時間軸上采用突發加權平滑方案發現的時變信息,實驗結果表明所提出的混合模型能夠在單一的檢測過程中區別時變話題和穩定話題,針對用戶不同的興趣分別進行推薦話題。此算法只適用服務于新聞類的信息網站。針對目前流行的社交媒體平臺,文獻[12]設計了一個潛在的類統計混合模型,稱為時間上下文感知混合模型(TCAM)。TCAM同時為用戶內在興趣相關話題和時間上下文相關話題建模,結合這兩個因素的影響對用戶行為建模。為了進一步提高TCAM算法的性能,提出項目加權方法使TCAM更好地為用戶推薦其偏好的項目。文獻[4]提出了一種利用人類行為對信息過濾的協同過濾算法,與傳統的協同過濾算法相比推薦精度得到了很大的提高,同時改善了推薦的新穎性和多樣性。在計算相似度時加入時間因素,但是沒有考慮項目特征屬性問題,為此本文提出一種基于用戶興趣和項目屬性的協同過濾算法,在計算相似度時不單單考慮用戶興趣還考慮項目本身的屬性特征,提高算法的推薦精度。

時間是一種重要的上下文信息,對用戶興趣偏好有著深入的影響[13]。本文以Movielens數據集為例(從1997年9月到1998年4月,以月為單位),分析了3種不同類型影片觀眾人次比例隨時間的變化情況如圖1所示。

圖1 三種不同類型影片月觀眾人次比例走勢圖

圖1中Item1是屬于喜劇動畫片,Item50是屬于戰爭科幻動作片,Item181是屬于浪漫喜劇片。由圖1中可以看出不同類型影片,隨著時間的變化,影片受歡迎的程度發生改變,觀影人次也相應的發生變化。不管是屬于哪種類別的電影,其觀眾人次比例隨時間的推移都在逐漸下降,其規律在大體上和心理學上的遺忘曲線相似。電影剛上映時關注的觀眾比較多,隨著時間的推移觀眾人次在慢慢下降,直到被人們所遺忘,這也符合艾賓浩斯(Ebbinghaus)遺忘曲線的規律,即人類記憶能力隨時間的變化而降低。

傳統的協同過濾算法分為輸入數據、尋找最近鄰居集合和預測推薦3步,尋找最近鄰居集合是協同過濾算法中關鍵的一步,其結果直接影響推薦的準確度。尋找最近鄰居集合可通過計算相似度方法實現,常用的相似度度量方法有:余弦相似度、調整余弦相似度和皮爾遜相關相似度[14-15]。計算相似度公式分別如下:

(1)

(2)

(3)

2 基于用戶興趣和項目屬性的協同過濾算法

2.1 基于時間的用戶興趣度權重

本文采用擬合的遺忘曲線對項目評分進行時間加權,離采樣時間越近的評分賦予較大的權值,反之則賦予較小的權值,以此來模擬用戶的興趣愛好隨著時間而不斷變化。因此,可以根據遺忘曲線定義指數衰減函數來表示用戶興趣的變化,基于時間的用戶興趣度權重函數如式(4)所示:

(4)

其中,tui表示用戶u對項目i的評分時間,t0表示目標用戶的采樣時間,T表示整個數據集的時間跨度(結束時間-開始時間)。

本文以皮爾遜相關相似性作為相似度計算公式,并將基于時間的用戶興趣度權重函數引入到相似度計算公式中,基于用戶興趣度權重的皮爾遜相關相似性計算方法如式(5)所示:

(5)

2.2 改進相似度計算

加入興趣度權重能夠有效地找出用戶的喜好范圍,為了更好地進行推薦服務,需要找出用戶偏好的特征屬性,避免把一個用戶不喜歡的影片當成是用戶喜好的影片進行推薦。在考慮時間效應的基礎上計算出用戶評分與項目屬性之間的關系,發現用戶對于項目中各個屬性的喜好程度,結合基于時間的用戶興趣度權重和項目屬性能夠明確用戶的興趣偏好,準確有效地找出其鄰居集合。

令項目屬性的集合為l={l1,l2,…,ld},其中d為類別屬性個數。以Movielens數據集為例:數據集中的電影一共有18個類別屬性,分別為{unknown,Action,Adventure,…,Western}。項目屬性特征可以用一個n×d的項目屬性矩陣Gn×d來計算,其中n為項目個數,gid為0時代表項目i不具有這個屬性,gid為1時代表項目i具有該屬性。項目的特征屬性相似度計算方法如式(6)所示:

(6)

其中,il表示項目i的屬性集合,jl表示項目j的屬性集合。

在計算項目與項目之間相似性時不能單一通過用戶對項目的評分來計算,還要考慮項目與項目之間的相關相似性,采用算術加權平均,綜合考慮項目的特征屬性相似度和評分相似度,獲得更全面的相似性度量模型,融合的相似度計算方法如式(7)所示:

sim(i,j)=γ×Esim(i,j)+(1-γ)×sim(i,j)

(7)

其中,γ為平衡因子用作協調兩方面相似性度量的結果,0<γ<1,在[0,1]中取一系列值,觀察不同γ值對推薦準確度的影響,選擇合適的γ值將兩種相似度進行融合,提高推薦準確率。

2.3 加權預測評分

由相似度計算得到最近鄰居集合后,考慮時間對預測值的影響,用戶現在的行為應該和用戶最近的行為關系更大。將基于時間的用戶興趣度權重wt加入到預測評分中,其計算方法如式(8)所示:

(8)

其中,sim(i,j)表示目標項目i與最近鄰居項目j的相似性度量,rc,j表示用戶c對項目j的評分,表示項目i的平均評分,表示項目j的平均評分。

為了有效計算出用戶的當前興趣,改進的預測評分用wt賦予評分矩陣中每個評分一個權重,即用戶最近數據貢獻度更大,占較大的權重,反之亦然。

2.4 算法步驟

算法:基于用戶興趣和項目屬性的協同過濾算法。

輸入:數據集中的一對訓練集和測試集,最近鄰居個數neighbor_num,平衡參數γ。

輸出:用戶c對測試集中項目i的預測評分。

算法步驟:

步驟1 由訓練集得到用戶——項目評分矩陣Rm×n和時間矩陣Tm×n。例如:用戶1對項目1的評分為5且評分時間為874 965 758,則在評分矩陣Rm×n中r1,1=5, 在時間矩陣Tm×n中t1,1=874 965 758。

步驟2 利用用戶興趣度權重函數wt,計算目標用戶的興趣度權重。

步驟3 用式(5)計算項目i和項目j的評分相似度(當j=i時令sim(i,j)=0)。

步驟4 通過式(6)計算項目i和項目j的特征屬性相似度(當j=i時令sim(i,j)=0)。

步驟5 根據步驟3和步驟4得到的評分相似度和項目屬性相似度利用式(7)進行融合,形成最終的相似度矩陣。

步驟6 根據步驟5計算得到的相似性矩陣來尋找目標項目i的最近鄰居,鄰居關系的計算是為了對每一個項目i找到一個鄰居集合Neighbori={j1,j2,…,jm},i?Neighbor,將相似度{sim(i,j1)>sim(i,j2)>…>sim(i,jm)}遞減排序。根據預先設定的鄰居數neibor_num,選擇sim(i,j)最大的前neibor_num個作為項目i最近鄰居。

步驟7 根據步驟6得到的目標項目i的最近鄰居集合Neighbori和評分矩陣Rm×n中的評分,依據式(8)利用用戶c對項目i的最近鄰居評分來預測用戶c對項目i的評分。

算法結束。

3 實驗結果與分析

3.1 數據集

本文選用MovieLens數據集對提出的算法在Matlab中進行評估測試,該數據集包含943個用戶對1 682部電影連續7個月左右的評分數據,評分范圍是1~5,1表示“很差”,5表示“很好”。整個數據集的稀疏等級為1-100 000/(943×1 682)=93.7%。

MovieLens數據集提供5組隨機劃分的訓練集和測試集,實驗在這5對數據上分別進行,最終實驗結果為這5次結果的算術平均值。

3.2 評價標準

本文采用平均絕對誤差MAE(MeanAbsoluteError)來衡量推薦的精確率,能更好地反映預測值誤差的實際情況。設在訓練集上得到用戶的預測評分集合為{pu,1,pu,2,…,pu,n},用戶實際評分集合為{ru,1,ru,2,…,ru,n},則平均絕對誤差MAE定義為:

(9)

其中,N是測試集中用戶評分的個數,pu,i是用戶u對第i個項目在訓練集上的預測評分,ru,i是用戶u對第i個項目的實際評分。MAE通過計算用戶的預測評分和實際評分之間的偏差來度量算法預測的準確性,MAE值越小,則推薦精確度越高。

3.3 結果分析

1) 相似度比較

為了驗證本文提出的算法和傳統的相似度算法在不同相似度公式中的推薦效果,根據本文在2.1節中提出的算法思想,同樣將式(5)中的用戶興趣度權重函數引入到相似度計算公式中,對余弦、調整余弦分別根據式(1)、式(2)作了相似的改進和替換,其實驗結果如圖2所示。

圖2 三種改進相似度與傳統相似度的MAE比較

分別使用三種計算方式進行MAE對比。從圖2可以看出,不管選用何種相似度計算方式,在任意鄰居數neighbor_num值下,三種改進的相似性計算方法都比原始的計算方法取得更低的MAE值。尤其是采用皮爾遜相關相似性計算相似度時MAE值最小,從而也驗證了本文選用皮爾遜相似性方法作為相似度計算的依據。另外改進后算法的MAE明顯小于傳統協同過濾推薦系統,說明基于時間的用戶興趣度權重和項目屬性對推薦系統的影響比較大。

2) 平衡因子γ對MAE的影響

實驗中選擇最近鄰居數neigbor_num= 25,針對式(7),在其他參數一樣的情況下,觀察不同平衡因子γ值對推薦準確度的影響,如圖3所示。當γ=0.15時MAE值最小,此時不但考慮了項目屬性還考慮了時間對相似度計算的影響。

圖3 平衡因子γ 對MAE的影響

3) 不同算法之間對比

實驗中最近鄰居數neigbor_num分別取5、10、15、20、25和30,設定最優平衡因子γ=0.15,本文提出的基于用戶興趣和項目屬性協同過濾算法(UIIP-CF)分別與傳統基于項目的協同過濾算法(ICF)與文獻[9] 中提出的改進算法(TDGS-CF)、文獻[10]中提出的改進算法(WUCF) 進行MAE值對比,如圖4所示。

圖4 四種算法的MAE對比圖

由圖4可以看出,改進算法的MAE與傳統的基于項目的協同過濾算法相比MAE降低了10%,比TDGS-CF算法MAE降低了6%,比WUCF算法MAE降低了3%。由于MAE值越小則推薦精度越高,UIIP-CF算法的精確性比以上提到的推薦算法都高,這也說明了基于時間的用戶興趣權重和項目屬性在推薦算法中起著比較關鍵的作用。

4 結 語

本文分析了用戶的興趣隨時間的變化而變化的規律,在此基礎上提出了一種基于用戶興趣和項目屬性的協同過濾算法。實驗表明,改進的協同過濾算法不僅有效提高了推薦系統的推薦精度,而且在一定程度上解決了協同過濾推薦系統的用戶興趣漂移問題。但是,改進算法中采用實驗法得到最佳平衡因子并進行相似度融合以達到解決用戶興趣漂移的目的,所以,下一步的研究重點將放在如何自適應平衡因子問題以及更多的相似度改進方法上。

[1] 孟祥武,劉樹棟,張玉潔,等.社會化推薦系統研究[J].軟件學報,2015,26(6):1356-1372.

[2] 王國霞,劉賀平,李擎.基于萬有引力的個性化推薦算法[J].工程科學學報,2015,37(2):255-259.

[3]AdibiP,LadaniBT.Acollaborativefilteringrecommendersystembasedonuser’stimepatternactivity[C]//InformationandKnowledgeTechnology(IKT),2013 5thConferenceon.IEEE,2013:252-257.

[4]JiaCX,LiuRR.Improvethealgorithmicperformanceofcollaborativefilteringbyusingtheintereventtimedistributionofhumanbehaviors[J].PhysicaA:StatisticalMechanicsandItsApplications,2015,436:236-245.

[6] 鄭志高,劉京,王平,等.時間加權不確定近鄰協同過濾算法[J].計算機科學,2014,41(8):7-12.

[7] 李源鑫,肖如良,陳洪濤,等.時間衰減制導的協同過濾相似性計算[J].計算機系統應用,2013,22(11):129-134,158.

[8] 劉東輝,彭德巍,張暉.一種基于時間加權和用戶特征的協同過濾算法[J].武漢理工大學學報,2012,34(5):144-148.

[9]ChenC,YinH,YaoJ,etal.TeRec:Atemporalrecommendersystemovertweetstream[J].ProceedingsoftheVLDBEndowment,2013,6(12):1254-1257.

[10]HuangY,CuiB,ZhangW,etal.TencentRec:Real-timeStreamRecommendationinPractice[C]//Proceedingsofthe2015ACMSIGMODInternationalConferenceonManagementofData.Melbourne,VIC,Australia:ACM,2015:227-238.

[11]YinH,CuiB,LuH,etal.Aunifiedmodelforstableandtemporaltopicdetectionfromsocialmediadata[C]//2013IEEE29thInternationalConferenceonDataEngineering(ICDE).Brisbane,Australia:IEEEComputerSociety,2013:661-672.

[12]YinH,CuiB,ChenL,etal.Atemporalcontext-awaremodelforuserbehaviormodelinginsocialmediasystems[C]//Proceedingsofthe2014ACMSIGMODInternationalConferenceonManagementofData.AssociationforComputingMachinery,2014:1543-1554.

[13]RenY,LiG,ZhouW.LearningUserPreferencePatternsforTop-NRecommendations[C]//WebIntelligenceandIntelligentAgentTechnology(WI-IAT),2012IEEE/WIC/ACMInternationalConferenceson,2012:137-144.

[14] 吳毅濤,張興明,王興茂,等.基于用戶模糊相似度的協同過濾算法[J].通信學報,2016,37(1):198-206.

[15] 榮輝桂,火生旭,胡春華,等.基于用戶相似度的協同過濾推薦算法[J].通信學報,2014,35(2):16-24.

COLLABORATIVE FILTERING ALGORITHM BASED ON USER INTEREST AND ITEM PROPERTIES

Liu Jing Wu Wenqi Li Xiao Liu Yongli Wang Jianfang

(CollegeofComputerScienceandTechnology,HenanPolytechnicUniversity,Jiaozuo454000,Henan,China)

Aiming at the problem that traditional collaborative filtering algorithm can’t response to user’s interest changes timely, lack of timeliness leads to recommend accuracy is not high, a collaborative filtering algorithm based on user interest and item properties is proposed. On the basis of the traditional collaborative filtering, considering the factors of scoring time, similarity and item properties, first we add the user preference time weight function to the process of computing similarity, then merge with the similarity of tem properties, finally make the item prediction and recommendation. Compared with the newly proposed algorithm and the existing algorithm, the experimental results on the Movielens demonstrate that the MAE (Mean Absolute Error) reduces by 3%~6%, which effectively improves the recommendation accuracy.

User interest Item properties Collaborative filtering Weight function Similarity

2016-03-17。國家自然科學基金項目(61202286);河南省高等學校骨干教師計劃項目(2015GGJS-068)。劉靜,副教授,主研領域:數據挖掘,推薦算法。武文琪,碩士生。李驍,碩士生。劉永利,副教授。王建芳,副教授。

TP391

A

10.3969/j.issn.1000-386x.2017.05.006

猜你喜歡
用戶
雅閣國內用戶交付突破300萬輛
車主之友(2022年4期)2022-08-27 00:58:26
您撥打的用戶已戀愛,請稍后再哭
關注用戶
商用汽車(2016年11期)2016-12-19 01:20:16
關注用戶
商用汽車(2016年5期)2016-11-28 09:55:15
兩新黨建新媒體用戶與全網新媒體用戶之間有何差別
關注用戶
商用汽車(2016年6期)2016-06-29 09:18:54
關注用戶
商用汽車(2016年4期)2016-05-09 01:23:12
挖掘用戶需求尖端科技應用
Camera360:拍出5億用戶
創業家(2015年10期)2015-02-27 07:55:08
100萬用戶
創業家(2015年10期)2015-02-27 07:54:39
主站蜘蛛池模板: 专干老肥熟女视频网站| 黄色网站不卡无码| 女人18毛片一级毛片在线 | 亚洲天堂久久新| 久久久久无码国产精品不卡| 日韩在线欧美在线| 一级黄色欧美| 国产一区二区三区在线观看视频 | 永久成人无码激情视频免费| 国产亚洲日韩av在线| 在线不卡免费视频| 欧美精品aⅴ在线视频| 免费亚洲成人| 波多野结衣一区二区三视频 | 欧美日韩午夜| a级毛片网| 久久久国产精品免费视频| 一级毛片在线直接观看| 98超碰在线观看| 亚洲午夜天堂| 国产激爽爽爽大片在线观看| 精品久久久久久中文字幕女| 久久综合色视频| 欧美成人h精品网站| 国产jizzjizz视频| 日韩精品一区二区三区视频免费看| 丁香六月激情综合| 成年人免费国产视频| 日韩精品一区二区三区中文无码| 亚洲an第二区国产精品| 毛片在线看网站| 91福利在线看| 日韩欧美亚洲国产成人综合| 免费观看三级毛片| 伊人中文网| 美女高潮全身流白浆福利区| 欧美激情视频一区| 婷婷六月综合| 国产产在线精品亚洲aavv| 亚洲人成人伊人成综合网无码| 激情影院内射美女| 国产精品亚洲片在线va| 国产三级a| 欧美日韩中文国产| 欧美人在线一区二区三区| h视频在线观看网站| 婷婷五月在线| 国产浮力第一页永久地址 | 国产精品视频白浆免费视频| 精品伊人久久久久7777人| 亚洲国产精品不卡在线| 免费jjzz在在线播放国产| 成人伊人色一区二区三区| 国产在线视频自拍| 老汉色老汉首页a亚洲| 欧美亚洲一区二区三区导航| 毛片网站观看| 国产精品区网红主播在线观看| 国产v精品成人免费视频71pao| 国产精品密蕾丝视频| 亚洲国产成人麻豆精品| 亚洲天堂视频在线免费观看| 国产91小视频| 国产精品黑色丝袜的老师| 中文字幕在线观看日本| 国产精品福利在线观看无码卡| 欧美精品高清| 91精品国产情侣高潮露脸| 呦女亚洲一区精品| 国产成人狂喷潮在线观看2345| 久久国产精品影院| 国产无人区一区二区三区| 精品一区二区无码av| 无码专区在线观看| 青青国产视频| 欧美成人第一页| 久久精品女人天堂aaa| 免费看a级毛片| 伊人精品视频免费在线| 在线亚洲小视频| 国产在线视频欧美亚综合| 成人毛片免费观看|