999精品在线视频,手机成人午夜在线视频,久久不卡国产精品无码,中日无码在线观看,成人av手机在线观看,日韩精品亚洲一区中文字幕,亚洲av无码人妻,四虎国产在线观看 ?

基于用戶特征和時間效應的協同過濾算法

2016-05-30 03:09:30吳雄峰
現代計算機 2016年10期

吳雄峰,賈 年

(西華大學無線電管理技術研究中心,成都 610039)

?

基于用戶特征和時間效應的協同過濾算法

吳雄峰,賈年

(西華大學無線電管理技術研究中心,成都610039)

摘要:隨著互聯網和電子商務的高速發展,越來越多的電子商務網站和應用通過推薦技術給用戶進行個性化推薦。協同過濾算法作為推薦算法的一種,已被各大公司廣泛應用,已成為電子商務推薦系統中使用最為廣泛、最為成功的一類推薦算法。稀疏性問題是傳統的協同過濾算法的一個明顯缺點。為解決稀疏性問題,提出基于用戶特征和時間效應的協同過濾算法:在計算相似度這一步驟上引入時間信息和用戶信息這兩大影響因子,改進用戶相似度的計算,減小稀疏性問題,進而提高推薦質量。

關鍵詞:協同過濾;屬性特征;時間效應

0 引言

隨著互聯網和信息技術的快速發展,網絡信息不斷膨脹,“信息過載”問題越來越嚴重。用戶想在信息的海洋中找到有用信息,尤為困難。個性化推薦系統在這種情況下產生,并得到快速應用。它為不同用戶提供不同的服務,來滿足不同需求。其中,協同過濾技術是迄今為止最成功的、應用最廣泛的個性化推薦技術之一[1]。其核心思想是基于用戶對項目的評分來計算用戶間的相似性,通過相似性尋找到與目標用戶興趣最相似的用戶集合,然后找到這個集合中用戶喜歡的、并且目標用戶沒有的物品,并推薦給目標用戶。

傳統的協同過濾算法在計算用戶相似性上存在以下問題:(1)沒有考慮時間信息對用戶興趣的影響。用戶的興趣是隨著時間的變化而不斷發生變化的,比如用戶小時候喜歡看動畫片,長大了喜歡看文藝片等。所以,如果我們要準確預測用戶現在的興趣,就應該考慮時間這個因素,因為用戶最近的行為最能體現他現在的興趣。(2)忽略了用戶的個體信息特征。例如兩個從事IT行業男性用戶他們都喜歡看科技類文章,而一個從事經濟行業的男性用戶喜歡看經濟類文章。由此可見,用戶屬性相似的用戶,其興趣有一定的相似度,反之亦然。因此,用戶屬性也可作為影響用戶興趣的一個因素。

通過上述分析,本文提出基于用戶特征和時間效應的協同過濾算法。主要是在傳統協同過濾算法中計算相似度這一步驟上引入時間信息和用戶信息這兩大影響因子,改進用戶相似度的計算,減小稀疏性問題,進而提高推薦質量。

1 傳統協同過濾算法介紹

協同過濾算法的原理是通過分析用戶歷史行為數據,計算用戶間的相似性,通過相似性尋找到與目標用戶興趣最相似的用戶集合,然后找到這個集合中用戶喜歡的、并且目標用戶沒有的物品,并推薦給目標用戶。其推薦過程可分為三個階段:建立用戶模型、選擇相似鄰居、產生推薦[2]。

1.1建立用戶模型

收集每個用戶的評分記錄,建立用戶模型。通常用一個m×n的矩陣R表示,如表一所示。其中,用戶數記作m,項目數記作n,表示第i個用戶對第j個項的評價值記作rij,rij在0到5之間且rij為整數。評分值的大小與興趣度成正比,分值越大,興趣度越高。

1.2選擇相似鄰居

這里主要是計算用戶間的相似度,相似度越高,表明與目標用戶越相似。通過相似度的計算,選擇出與目標用戶最相似的用戶集。計算用戶相似度方法有三種:Pearson相關性相似度和修正的余弦相似度以及余弦相似度[3]。本文計算相似度采用第一種方法:Pearson相關性相似度。其計算公式為:

式中,u表示目標用戶,v表示相似用戶,sim(u,v)記作u和v的相似度,ru,i記作u對項目i的評分,rv,i記作v對項目i的評分,ru和rv分別記作u和v對項目的平均評分,Iuv記作u和v共同評價的項目集合。

1.3產生推薦

通過上述計算得到相似鄰居集后,通過式(2)計算預測目標用戶對未評價項目的評分值,然后根據評分的最高TOP-N項推薦給目標用戶進行推薦。

其中,目標用戶u對任意項目i的預測評分記作Pu,i。

2 改進的協同過濾算法

2.1時間效應

時間是一種重要的信息,對用戶興趣有著深入的影響。用戶在不同的時間段其興趣不是固定不變的。例如一位程序員隨著工作時間的增加,逐漸從閱讀入門書籍過渡到閱讀專業書籍。通常我們認為用戶最近訪問的項目為其感興趣的項目,要想準確預測用戶現在的興趣,就應該關注用戶最近的行為。故本文通過引入時間因子,改進相似度的計算,優化最近鄰的尋找過程。此時間因子是按時間衰減的函數,其函數可表示為:

其中tn表示當前時間,ti表示項目i的評價時刻,t0為最早的評價時刻。m為權重系數。該函數在突出最近評分重要性的同事削弱了過去評分的重要度,有效反映了用戶的興趣變化。

2.2基于用戶屬性的特征向量

在一些網站、軟件注冊中,都會要求用戶填寫基本信息,例如昵稱,性別、職業、年齡等。像這些帶有某些相同屬性的人可能會有相同的興趣愛好。本文通過引入用戶特征這一因子,考慮用戶的性別、年齡,構建用戶特征向量,改進尋找最近鄰過程,以提高推薦質量。

(1)年齡因素。每個年齡段的用戶都有不一樣的興趣愛好。例如老年人喜歡健身,青少年喜歡上網。年齡因素也是影響推薦質量的一個因素。其相似性的度量公式為:

式中目標用戶記作u,相似用戶記作v,Au記作U的年齡,Av記作V的年齡,本文認為年齡差距在10歲以內的用戶,他們的興趣是相近的。

(2)性別因素。通常認為男性用戶和女性用戶的興趣是不相同的,故需要計算性別影響的相似度。我們用Su表示目標用戶u的性別,用Sv表示相似用戶V的性別,S(u,v)表示他們的相似性,則其計算公式可以表示為:

用戶U和V在用戶特征向量上的相似度可以通過如下公式來計算:

式中,λ表示修正系數。通常λ的值會根據實驗結果的值來動態調整。

2.3算法改進流程

本文通過對上述影響因子分析并引入,對傳統算法進行改進,來提高推薦質量。算法的改進流程如下:

(1)引入時間效應,先對用戶原始矩陣R按評價時間來進行修正,獲得新的評價矩陣R',其計算方法如下:

(2)在矩陣R'上,通過Pearson相關系數法計算目標和候選用戶的原始相似度:

(3)引入用戶特征,在式(8)求出的相似度基礎上,構造新的用戶綜合相似度,再根據新的相似度來獲得最近鄰居集。新的相似度計算公式為:

(4)用新的相似度,通過如下公式產生推薦:

3 實驗結果及分析

3.1實驗數據的選取和評價標準

本次實驗所用的數據集為GroupLens研究組提供的Movielens數據集,該數據集包含943位用戶的10萬條評分記錄和1682部電影,每個用戶至少對20部電影進行了評分[4]。評分區間設為1到5之間的整數,評分值越高,表示用戶對該電影的偏愛程度越高。本文隨機選取80%的評分數據作為訓練集,20%作為測試集。

本文采用平均絕對誤差(Mean Absolute Error,MAE)作為此次試驗的評價系統推薦準確度的度量標準。MAE的值與推薦質量成反比,其值越高,推薦的質量越低。計算公式如下:

式中,Pu,i表示預測目標用戶的評價集合,Ru,i表示對應的實際評價目標用戶的集合。

3.2實驗結果及分析

將改進后的算法結合傳統算法進行反復試驗確定計算公式中相關系數的值,式(3)中權重系數m取0.4,時間間隔T取15,式(6)中λ取0.3,式(9)中的α取0.8。通過確定的系數值,將改進后的算法結果與傳統結果相比較,從圖1中可以看出,改進后的算法在相關公式中系數合適的情況下,其推薦精度有一定程度的提高。

圖1 

4 結語

實驗表明,本文提出的基于用戶特征和時間效應的協同過濾算法,在引入了時間效應和用戶特征后,能較好的改進用戶相似度,有效地解決稀疏性問題,從而提高尋找最近鄰的準確度。雖然本文在稀疏性問題中進行了優化,但還有像系統延伸性問題、新用戶問題等,有待繼續深入研究。

參考文獻:

[1]焦成斌.協同過濾算法在電子商務推薦系統的研究[D].鄭州大學,2011.

[2]鄧娟,陳西曲.基于用戶興趣變化的協同過濾推薦算法[J].武漢工業學院學報,2013,32(4): 48-51.

[3]周張蘭.基于協同過濾的個性化推薦[D],華中師范大學,2009.

[4]王小亮.基于協同過濾的個性化推薦算法的優化與應用[D],浙江工商大學2010.

賈年(1973-),男,四川眉山人,副教授,碩士生導師,研究方向為智能信息檢索、數字圖像處理

A Collaborative Fltering Algorithm Based on User Characteristics and the Effects of Time

WU Xiong-feng,JIA Nian
(Center for Radio Administration and Technology Development,Xinhua University,Chengdu 610039)

Abstract:With the rapid development of the internet and ecommerce, more and more ecommerce sites and applications offer users personalized recommendations by recommended technology. As a recommendation algorithm, collaborative filtering algorithm had been widely used in major companies. It will be inaccurate or of low quality to recommend products to users merely by their comments on the products. Sparse question is an obvious drawback of the traditional collaborative filtering algorithms. To solve the problem of parity, proposes a collaborative filtering algorithm based on user’s characteristics and time effects. Introduces this step in the calculation of the similarity of the time information and user information these two influencing factors, improves user computing similarity, reduces parity problems, thus improves the quality of recommendation.

Keywords:Collaborative Filtering; Property Characteristics; Time Effect

收稿日期:2016-03-24修稿日期:2016-03-30

作者簡介:吳雄峰(1991-),男,安徽安慶,在讀碩士研究生,研究方向為嵌入式系統及其應用

文章編號:1007-1423(2016)10-0021-04

DOI:10.3969/j.issn.1007-1423.2016.10.005

基金項目:國家科技支撐計劃(No.2011BAH26B03)、西華大學創新基金(No.ycjj2015189)

主站蜘蛛池模板: 久久久久亚洲av成人网人人软件| 日韩久草视频| 日本午夜影院| 一本久道久综合久久鬼色| 波多野一区| 国产Av无码精品色午夜| 91成人在线观看视频| 欧美一区二区精品久久久| 国产91视频免费| 亚洲色图欧美| 亚亚洲乱码一二三四区| 国产亚洲视频中文字幕视频| 特级毛片免费视频| 毛片视频网址| 91精品专区| 素人激情视频福利| 老司国产精品视频| 免费观看亚洲人成网站| 国产美女91呻吟求| 亚洲另类色| 国产喷水视频| 国产在线91在线电影| 91视频精品| 午夜高清国产拍精品| 日本亚洲国产一区二区三区| 亚洲av日韩综合一区尤物| 2021无码专区人妻系列日韩| 首页亚洲国产丝袜长腿综合| 亚洲无码视频喷水| 日韩无码视频播放| 波多野结衣一区二区三区四区视频| www.av男人.com| 成人国产精品网站在线看| 亚洲精品人成网线在线| 日本高清免费不卡视频| 青青久久91| 国产麻豆精品久久一二三| 无码精品一区二区久久久| 成年人视频一区二区| 国产系列在线| 在线a网站| 亚洲欧美日韩天堂| 亚洲色精品国产一区二区三区| 欧美成人看片一区二区三区| 久青草网站| 国产办公室秘书无码精品| 国产色爱av资源综合区| 好吊日免费视频| 欧美日韩专区| 免费人成在线观看视频色| 国产精品精品视频| 91午夜福利在线观看| 亚洲性视频网站| 国产国模一区二区三区四区| 亚洲欧洲一区二区三区| 老司机午夜精品视频你懂的| 2021天堂在线亚洲精品专区| 亚洲日韩高清在线亚洲专区| 精品国产免费观看一区| 国产乱人免费视频| 日韩成人免费网站| 国产高潮流白浆视频| 欧美精品xx| 网友自拍视频精品区| 四虎影视永久在线精品| 蜜芽国产尤物av尤物在线看| 中文字幕资源站| 欧美激情二区三区| 国产精品亚洲天堂| 成人小视频在线观看免费| 精品无码一区二区三区电影| 国产精品人人做人人爽人人添| 国产理论一区| AV不卡在线永久免费观看| 中文字幕久久亚洲一区 | 亚洲一区精品视频在线| 爆操波多野结衣| 日韩欧美国产成人| 国产成人精品三级| 国产爽妇精品| 国产欧美日韩视频一区二区三区| 国产在线一区二区视频|