999精品在线视频,手机成人午夜在线视频,久久不卡国产精品无码,中日无码在线观看,成人av手机在线观看,日韩精品亚洲一区中文字幕,亚洲av无码人妻,四虎国产在线观看 ?

協(xié)同過濾算法的優(yōu)化研究

2018-11-09 08:33:58熊波元陳軍華
關(guān)鍵詞:用戶實驗

熊波元, 陳軍華

(上海師范大學(xué) 信息與機電工程學(xué)院,上海 200234)

1992年,xerox公司郵件系統(tǒng)通過協(xié)同過濾技術(shù),對所有咨詢的郵件進行分析,提取有價值的郵件,推薦給公司優(yōu)先處理,這是對協(xié)同過濾算法最早的應(yīng)用[1].1994年,GroupLens研究小組創(chuàng)建了MovieLens系統(tǒng),對協(xié)同過濾算法的研究影響很大[2].

基于用戶的協(xié)同過濾算法雖然應(yīng)用廣泛,但是用戶相似性是通過用戶的評分來計算的,評分與購買商品沒有必然聯(lián)系,因此通過這種方式計算得到的用戶相似性,體現(xiàn)的是評分行為上的相似度,并不能直接代表用戶在興趣偏好上的相似度.對此,本文作者提出了改進方案,在原有用戶相似性計算中加入用戶興趣偏差度因素,以期達到較為準(zhǔn)確的相似度計算結(jié)果.

1 基于用戶的協(xié)同過濾算法的優(yōu)化

1.1 獲取用戶項目屬性評分矩陣

1.2 計算用戶興趣度指數(shù)

統(tǒng)計數(shù)據(jù)中瀏覽行為的總次數(shù)與其用相同方法對應(yīng)的有效購買總次數(shù),然后將有效購買總次數(shù)除以瀏覽總次數(shù)得到瀏覽行為的有效購買占比w1,用相同方法計算出關(guān)注行為的有效購買占比w2和購買行為的有效購買占比w3.

將用戶對某個品牌的某種行為操作次數(shù)乘以對應(yīng)行為的有效購買占比,然后累加,得到用戶興趣度指數(shù).

1.3 計算品牌偏好

品牌偏好計算公式如下:

(1)

其中,Iua是用戶u對品牌a的興趣指數(shù).

根據(jù)品牌偏好,可以得到用戶品牌偏好矩陣,每行中的數(shù)據(jù)是用戶對各個品牌的偏愛度,以此計算用戶間興趣偏差度:

(2)

其中,n是品牌的數(shù)量,Lua是用戶u對品牌a的偏好值,Lva是用戶v對品牌a的偏好值.

1.4 計算用戶相似性

矩陣Q中的每行數(shù)據(jù)代表一個用戶向量,通過余弦相似性、修正的余弦相似性及Pearson相關(guān)相似性,計算得到用戶評分相似度,再乘以用戶興趣偏差度,最終得到用戶相似性.

1.5 最近鄰居集合

采用Top-N的方式尋找目標(biāo)用戶的最近鄰居集合,即計算出每個用戶與目標(biāo)用戶之間的相似性,取相似性值最大的前k個用戶組成集合,即最近鄰居集合.

2 算法驗證與分析

2.1 數(shù)據(jù)集

實驗數(shù)據(jù)采用京東算法競賽提供的真實數(shù)據(jù),其中包括用戶信息、商品信息、商品屬性信息、用戶評分信息、用戶操作日志等數(shù)據(jù).實驗的數(shù)據(jù)中總共有983個用戶、2398件商品和146198條評分記錄,還有幾十萬條用戶操作數(shù)據(jù).

2.2 實驗標(biāo)準(zhǔn)

選擇平均絕對誤差(MAE)作為驗證標(biāo)準(zhǔn).MAE是計算用戶對項目的預(yù)測評分與用戶的實際評分之間的偏差,計算公式如下:

(3)

其中,n為商品數(shù)量,Suk為用戶u對商品k的預(yù)測評分,Quk為用戶u對商品k的實際評分.M越小,說明推薦準(zhǔn)確度越高.

2.3 實驗結(jié)果分析

將實驗的數(shù)據(jù)集隨機分為5等份,將其中4份作為訓(xùn)練數(shù)據(jù)集,剩下的一份作為測試數(shù)據(jù)集,總共實驗5次,每次實驗都取不同的訓(xùn)練數(shù)據(jù)集和測試數(shù)據(jù)集進行實驗,得到的5個結(jié)果再取平均值作為最后的實驗數(shù)據(jù),以此提高實驗的準(zhǔn)確性.

圖1 相似性度量方法的比較

圖2 不同算法用戶評分預(yù)測的M值對比

對比了余弦相似性、修正的余弦相似性及Pearson相關(guān)相似性三種度量方法對算法M值的影響(圖1).從圖1中可以看出,隨著最近鄰居的數(shù)量的增加,三種度量方法對應(yīng)的M值都在減小,推薦準(zhǔn)確度在提高.相對而言,使用Pearson相關(guān)相似性公式計算用戶相似性更為準(zhǔn)確.因此,在后續(xù)比較算法的實驗中,采用Pearson相關(guān)相似性公式計算用戶相似性.

比較了不同算法下用戶評分預(yù)測的M值(圖2).從圖2可知,隨著最近鄰居的增加,M值均先減小后趨于穩(wěn)定,傳統(tǒng)的基于用戶的協(xié)同過濾算法和基于項目屬性的協(xié)同過濾算法在最近鄰居數(shù)為80后,才接近穩(wěn)定,而改進算法在最近鄰居數(shù)為60時,已趨于穩(wěn)定.相對來說,改進后的算法收斂速度較快,其對應(yīng)的M值整體相對于前兩種算法較低,表示改進后的算法推薦準(zhǔn)確度更高.從圖2中還可以看出,改進后的算法在最近鄰居數(shù)量為60時,推薦效果最好,推薦系統(tǒng)的準(zhǔn)確性和復(fù)雜度達到最佳平衡.綜上所述,改進后的算法的性能優(yōu)于傳統(tǒng)的基于用戶的協(xié)同過濾算法和基于項目屬性的協(xié)同過濾算法.

3 結(jié) 論

提出了一套協(xié)同過濾改進算法,對用戶相似性計算方面進行優(yōu)化,通過實驗驗證,相較于傳統(tǒng)算法,改進算法能提高推薦系統(tǒng)的準(zhǔn)確率.但本研究依然存在較多不足,如未能考慮實時性、多樣性的平衡及智能化等問題,有待下一步研究工作加以解決.

猜你喜歡
用戶實驗
記一次有趣的實驗
微型實驗里看“燃燒”
做個怪怪長實驗
關(guān)注用戶
商用汽車(2016年11期)2016-12-19 01:20:16
NO與NO2相互轉(zhuǎn)化實驗的改進
實踐十號上的19項實驗
太空探索(2016年5期)2016-07-12 15:17:55
關(guān)注用戶
商用汽車(2016年6期)2016-06-29 09:18:54
關(guān)注用戶
商用汽車(2016年4期)2016-05-09 01:23:12
Camera360:拍出5億用戶
100萬用戶
主站蜘蛛池模板: 国产97色在线| 香蕉99国内自产自拍视频| www.国产福利| 国产精品性| 中文国产成人久久精品小说| 亚洲全网成人资源在线观看| 91啦中文字幕| 亚洲精品在线91| 无码专区国产精品第一页| 91精品啪在线观看国产60岁 | 青草视频在线观看国产| 71pao成人国产永久免费视频| 久久五月视频| 国产精品久久久久久久久久久久| 日韩高清成人| 青青久视频| 日本不卡在线播放| 免费国产不卡午夜福在线观看| 亚洲精品无码专区在线观看| 欧美日一级片| 香蕉蕉亚亚洲aav综合| 美女高潮全身流白浆福利区| 噜噜噜久久| 午夜毛片免费看| 欧美一级专区免费大片| 成人福利在线观看| 中国毛片网| 在线观看亚洲国产| 国产SUV精品一区二区| 青青草国产免费国产| h视频在线观看网站| 女同久久精品国产99国| 国产乱子伦一区二区=| 亚洲第一区欧美国产综合| 青青国产在线| 热这里只有精品国产热门精品| 亚洲高清无码久久久| 国产精品冒白浆免费视频| 91久久偷偷做嫩草影院精品| 亚洲成人免费在线| 国产在线观看99| 精品综合久久久久久97超人| 国产精选自拍| 久久青草免费91观看| 伦伦影院精品一区| 99久久国产综合精品2020| 人人91人人澡人人妻人人爽| 综合网久久| 欧美黄色a| 手机精品视频在线观看免费| 国产成人成人一区二区| 日日噜噜夜夜狠狠视频| 伊人成人在线| 欧美一级特黄aaaaaa在线看片| 日本久久网站| 亚洲精品高清视频| 婷婷久久综合九色综合88| 四虎AV麻豆| 波多野结衣在线一区二区| 亚洲第一中文字幕| 国产欧美高清| 91福利在线观看视频| 好吊妞欧美视频免费| 国产精品分类视频分类一区| 青草娱乐极品免费视频| 伊人久久大香线蕉综合影视| 啦啦啦网站在线观看a毛片| 国产精品人莉莉成在线播放| 亚洲中文字幕av无码区| 91青青草视频在线观看的| 亚洲午夜天堂| 成人在线观看一区| 久久久久九九精品影院| 青青青国产视频| 97久久精品人人做人人爽| 国产一级二级三级毛片| 伊人五月丁香综合AⅤ| 国产欧美日韩精品第二区| 亚洲国产精品国自产拍A| 国产XXXX做受性欧美88| 在线精品亚洲一区二区古装| 国产一区二区免费播放|