999精品在线视频,手机成人午夜在线视频,久久不卡国产精品无码,中日无码在线观看,成人av手机在线观看,日韩精品亚洲一区中文字幕,亚洲av无码人妻,四虎国产在线观看 ?

基于非參數(shù)統(tǒng)計(jì)的相似度度量方法及其在用戶評分預(yù)測中的應(yīng)用

2017-04-25 06:34:01蘇開益余詩慧
關(guān)鍵詞:用戶

◆江 偉 蘇開益 余詩慧

(武漢理工大學(xué)計(jì)算機(jī)科學(xué)與技術(shù)學(xué)院 湖北 430070)

基于非參數(shù)統(tǒng)計(jì)的相似度度量方法及其在用戶評分預(yù)測中的應(yīng)用

◆江 偉 蘇開益 余詩慧

(武漢理工大學(xué)計(jì)算機(jī)科學(xué)與技術(shù)學(xué)院 湖北 430070)

傳統(tǒng)實(shí)參數(shù)統(tǒng)計(jì)方法對用戶評分的分析預(yù)測準(zhǔn)確度難以保證,因此本文提出一種基于非參數(shù)統(tǒng)計(jì)的相似度度量方法,分析用戶興趣之間的相似性,進(jìn)而預(yù)測用戶的評分。相對其他方式,預(yù)測準(zhǔn)確度有一定的提升。

非參數(shù)統(tǒng)計(jì);相似度度量;協(xié)同分析

0 前言

對于用戶評分?jǐn)?shù)據(jù),傳統(tǒng)的處理方法是使用實(shí)參數(shù)統(tǒng)計(jì)的方法進(jìn)行。實(shí)參數(shù)統(tǒng)計(jì)需要基于一些假設(shè)或者近似,在假設(shè)的正確性不能得以保證以及近似的誤差積累的情況下,用戶興趣分析算法的準(zhǔn)確性并不可靠。本文提出使用非參數(shù)統(tǒng)計(jì)的方式來處理用戶評分,不依賴假設(shè),將用戶的評分直接轉(zhuǎn)化為用戶興趣,便于進(jìn)行預(yù)測。

1 相似度

對于兩個(gè)用戶來說,相似度表示的是他們對某些項(xiàng)目評分的相似程度。在分析時(shí),我們將一個(gè)用戶的評分作為一個(gè)向量,用戶對不同項(xiàng)目的評分作為向量的元素。

衡量相似度通常使用余弦相關(guān)系數(shù)。對于兩個(gè)向量u和v,將u向v的方向分解,得到與v平行的向量ucosθ和垂直于v的向量usinθ。其中ucosθ與v完全線性相關(guān),usinθ與v不線性相關(guān)。這樣,通過cosθ的值就可以判斷出u和v的相似度。下面給出余弦相關(guān)系數(shù)的表達(dá)式:

式中u和v表示用戶,I表示項(xiàng)目集合,ru表示用戶u的評分向量。由此我們可以得出,當(dāng)相關(guān)系數(shù)為-1時(shí),表示兩個(gè)向量完全線性負(fù)相關(guān),為1時(shí)表示兩個(gè)向量完全線性相關(guān),為0時(shí)則表示兩個(gè)向量沒有線性相關(guān)關(guān)系。

余弦相關(guān)系數(shù)能夠比較好地衡量兩個(gè)用戶興趣的相似性,其原因主要有兩個(gè)方面。其一是余弦相關(guān)系數(shù)具有良好的線性性質(zhì),若u1與u的余弦相關(guān)系數(shù)是u2與u的兩倍,則可以認(rèn)為u1與u興趣相似性是u2與u興趣相似性的兩倍。另一個(gè)方面是余弦相似度不關(guān)注用戶的評分標(biāo)準(zhǔn)。例如對于某些用戶而言,80分是一個(gè)較低的分?jǐn)?shù),而對于另一些用戶而言,80分已經(jīng)是較高的評分,用戶這樣不同的評分標(biāo)準(zhǔn)對于相似性的分析會造成一定干擾,而余弦相似性只關(guān)注方向,因此能夠消除用戶評分標(biāo)準(zhǔn)不同帶來的影響。

2 基于相似度分析的預(yù)測

在計(jì)算出用戶評分的相似性之后,我們可以基于一個(gè)思路——評分相似的用戶興趣相似——來進(jìn)行評分的預(yù)測。預(yù)測步驟本文使用協(xié)同過濾算法進(jìn)行。協(xié)同過濾需要做的是求加權(quán)和,加權(quán)和定義如下:

式中iuP,表示用戶u對i的預(yù)測評分,N表示與用戶u相似的用戶的集合, inr,表示用戶 n對 i的評分, nuw,表示用戶 u與n的相似度。這里我們認(rèn)為用戶的預(yù)測評分和與其相似的用戶的評分是線性組合的關(guān)系,這也同樣契合本文第一部分中所敘述的“余弦相關(guān)系數(shù)具有線性性質(zhì)”。因此在協(xié)同過濾中使用余弦相似度進(jìn)行相似性度量是科學(xué)的,能相互配合,使預(yù)測結(jié)果更加準(zhǔn)確可信。

3 基于非參數(shù)統(tǒng)計(jì)的相似度度量及預(yù)測方法

因?yàn)橛脩舻呐d趣是一個(gè)難以量化的特征,我們需要一種轉(zhuǎn)化的方式,將用戶的評分轉(zhuǎn)化為一個(gè)特征值,并且轉(zhuǎn)化后的特征值能夠線性地表達(dá)用戶的興趣。例如某用戶的評分是80分,我們難以判斷這個(gè)分?jǐn)?shù)是較高還是較低,如果其他用戶的評分普遍在90分以上,那么80分是一個(gè)較低的分?jǐn)?shù);但如果其他用戶評分都分布在60~70分,那么80分就是一個(gè)較高的評分了。基于這個(gè)思想,我們定義用戶評分 x的特征值為其分布函數(shù)值,即表示均值為μ,方差為 2 σ的正態(tài)分布。

具體處理步驟如下:

(5)將用戶興趣特征值逆變換回評分值。計(jì)算 'Pia,,使得,則用戶評分值

4 實(shí)驗(yàn)驗(yàn)證與分析

本文使用VR項(xiàng)目的評論作為數(shù)據(jù)集,包含73421個(gè)用戶的4136360個(gè)評分,評分值是-10到10的有理數(shù)。為了衡量上述算法的準(zhǔn)確度,這里使用平均絕對誤差MAE和均方根誤差RMSE。它們的定義如下:

此二者的值越小,表示預(yù)測值與實(shí)際值越接近,即準(zhǔn)確度更高。

本文采用“80%-20%”交叉驗(yàn)證的方式,即將數(shù)據(jù)集的80%作為待處理數(shù)據(jù),20%的數(shù)據(jù)作為對模型結(jié)果的驗(yàn)證。設(shè)定閾值ε表示用戶相似的標(biāo)準(zhǔn),當(dāng)兩個(gè)用戶間的相似度大于ε時(shí)認(rèn)為這兩個(gè)用戶相似。本文提出的模型與其他模型的結(jié)果對比如下表。

表1 模型對比評價(jià)表

從實(shí)驗(yàn)結(jié)果可以看出,本文提出的非參數(shù)統(tǒng)計(jì)相似度度量配合協(xié)同過濾的方式,預(yù)測準(zhǔn)確度相較于其他方式更高,尤其當(dāng)ε取得合適的值時(shí),算法的準(zhǔn)確度更高。

5 總結(jié)

本文提出了一種基于非參數(shù)統(tǒng)計(jì)的相似度度量方法,將用戶的評分值映射成為一個(gè)能線性地表示用戶興趣的特征值,該特征值能夠消除不同用戶評分標(biāo)準(zhǔn)的差異以及評分?jǐn)?shù)據(jù)的分布對分值的影響,更科學(xué)地反應(yīng)用戶的興趣。通過在Jester集的數(shù)據(jù)上做的實(shí)驗(yàn)驗(yàn)證,證明了本文提出的非參數(shù)統(tǒng)計(jì)相似度度量模型的預(yù)測準(zhǔn)確性優(yōu)于現(xiàn)有的其他模型。

[1]Quercia D, Lambiotte R, Stillwell D, et al. The personality of popular facebook users[C]AcmConference on Computer Supported Cooperative Work. DBLP, 2012.

[2]Porcel C, Tejeda-Lorente A, Martínez M A, et al. A hybrid recommender system for the selective dissemination of research resources in a Technology Transfer Office[J]. Information Sciences, 2012.

[3]James S E. Charles Duhigg: The Power of Habit: Why We Do What We Do in Life and Business[J]. Journal of Child and Family Studies, 2013.

[4]Deng S, Wang D, Li X, et al. Exploring user emotion in microblogs for music recommendation[J]. Expert Systems with Applications, 2015.

[5]Rao Y. Contextual Sentiment Topic Model for Adaptive Social Emotion Classification[J]. IEEE Intelligent Systems, 2015.

猜你喜歡
用戶
雅閣國內(nèi)用戶交付突破300萬輛
車主之友(2022年4期)2022-08-27 00:58:26
您撥打的用戶已戀愛,請稍后再哭
關(guān)注用戶
商用汽車(2016年11期)2016-12-19 01:20:16
關(guān)注用戶
商用汽車(2016年5期)2016-11-28 09:55:15
兩新黨建新媒體用戶與全網(wǎng)新媒體用戶之間有何差別
關(guān)注用戶
商用汽車(2016年6期)2016-06-29 09:18:54
關(guān)注用戶
商用汽車(2016年4期)2016-05-09 01:23:12
挖掘用戶需求尖端科技應(yīng)用
Camera360:拍出5億用戶
100萬用戶
主站蜘蛛池模板: 2020久久国产综合精品swag| 亚洲国产成人久久精品软件| 亚洲精品视频网| 在线播放国产99re| 91无码视频在线观看| 日韩精品一区二区深田咏美| 91精品久久久无码中文字幕vr| 色综合激情网| 99re热精品视频国产免费| 成人一区专区在线观看| 中文字幕无码av专区久久| 亚洲中文字幕无码mv| 72种姿势欧美久久久大黄蕉| 99视频在线免费看| 91在线精品麻豆欧美在线| 国产日韩欧美精品区性色| 美女国产在线| 一本大道香蕉久中文在线播放 | 成人蜜桃网| 精品国产网站| 亚洲精品天堂在线观看| 人妻夜夜爽天天爽| 尤物亚洲最大AV无码网站| 国产在线视频导航| 日韩专区第一页| 国产免费黄| 国产青榴视频| 亚洲欧美综合另类图片小说区| 亚洲高清国产拍精品26u| 不卡色老大久久综合网| 国产人成网线在线播放va| 无码电影在线观看| 色视频国产| 国产97视频在线| 日韩精品中文字幕一区三区| 国内嫩模私拍精品视频| 欧美人与牲动交a欧美精品 | 精品视频一区在线观看| 日本一区二区三区精品视频| 亚洲精品桃花岛av在线| 午夜精品久久久久久久99热下载| 国产农村1级毛片| 伊人色在线视频| 国产九九精品视频| 91成人试看福利体验区| 无码一区二区三区视频在线播放| 亚洲男人的天堂视频| 伊人查蕉在线观看国产精品| 99久久精彩视频| 99精品热视频这里只有精品7| 国产一级毛片yw| 伊在人亚洲香蕉精品播放| 91精品啪在线观看国产91九色| 99这里只有精品免费视频| 四虎成人精品在永久免费| 国产精品七七在线播放| 精品国产美女福到在线不卡f| av在线5g无码天天| 国模沟沟一区二区三区| 五月婷婷综合色| 久草视频精品| 伊人成人在线| 久久福利片| 国产69精品久久久久妇女| 黄色一级视频欧美| 深爱婷婷激情网| 久久免费成人| 久久亚洲日本不卡一区二区| 青青久久91| 亚洲开心婷婷中文字幕| 久久96热在精品国产高清| 欧美成人亚洲综合精品欧美激情| 欧美日韩午夜| 日本欧美成人免费| 久久永久免费人妻精品| 999国内精品久久免费视频| 国产精品福利导航| 国产乱论视频| 波多野结衣一区二区三区四区| 久久精品人人做人人爽97| 国产91透明丝袜美腿在线| 精品日韩亚洲欧美高清a|