999精品在线视频,手机成人午夜在线视频,久久不卡国产精品无码,中日无码在线观看,成人av手机在线观看,日韩精品亚洲一区中文字幕,亚洲av无码人妻,四虎国产在线观看 ?

融合社區(qū)結(jié)構(gòu)和社交影響力的矩陣分解推薦

2019-12-04 03:32:50熊麗榮沈樹茂
關(guān)鍵詞:用戶信息模型

熊麗榮,沈樹茂,范 菁

(浙江工業(yè)大學(xué) 計(jì)算機(jī)科學(xué)與技術(shù)學(xué)院,杭州 310023)

1 引 言

推薦系統(tǒng)作為一種信息過濾工具,可以有效地緩解信息過載問題.幫助人們從大量繁雜的信息中找到自己感興趣的內(nèi)容.協(xié)同過濾技術(shù)是現(xiàn)在最流行的推薦方法,其中的矩陣分解方法[1]受到了很多人的關(guān)注.

在社交網(wǎng)絡(luò)中,用戶的行為不僅會(huì)被自己的興趣愛好影響,也會(huì)被其他用戶影響.研究表明,擁有一定社交關(guān)系的用戶之間會(huì)在一些方面存在相似性[2].在矩陣分解推薦算法中引入用戶的社交關(guān)系可以增強(qiáng)推薦準(zhǔn)確度[3,4].可是社交網(wǎng)絡(luò)中往往存在長尾效應(yīng)[5],即只有少數(shù)的用戶擁有大量的社交關(guān)系,而大多數(shù)的用戶擁有很少的社交關(guān)系.在社交網(wǎng)絡(luò)中,擁有某些相似的特征和愛好的用戶會(huì)相互聚集成為社區(qū),同一個(gè)社區(qū)內(nèi)的用戶會(huì)對(duì)彼此的選擇產(chǎn)生影響.同時(shí),在社區(qū)內(nèi)與用戶擁有間接關(guān)系的用戶很多,增加間接社交關(guān)系的使用而不只是僅僅使用直接社交關(guān)系可以有效地緩解用戶好友稀疏問題.

本文提出一種融合社區(qū)結(jié)構(gòu)和社交影響力的矩陣分解推薦算法SoInf.同時(shí)使用用戶評(píng)分信息和社會(huì)網(wǎng)絡(luò)結(jié)構(gòu)信息來計(jì)算用戶之間的影響力,且將用戶之間的相互影響和用戶個(gè)人影響力相結(jié)合,更精確刻畫用戶間的相互影響.將社區(qū)結(jié)構(gòu)和用戶間社交影響力結(jié)合到矩陣分解中,來增加推薦的準(zhǔn)確度.

這篇論文的主要貢獻(xiàn)如下:

1)考慮社區(qū)內(nèi)的其他用戶對(duì)用戶的影響,而不僅僅是用戶的直接鄰居的影響.基于社交網(wǎng)絡(luò)結(jié)構(gòu)進(jìn)行社區(qū)發(fā)現(xiàn),將社區(qū)結(jié)構(gòu)用于用戶之間的影響力計(jì)算和模型構(gòu)建.

2)同時(shí)使用用戶評(píng)分信息和社會(huì)網(wǎng)絡(luò)結(jié)構(gòu)信息來計(jì)算用戶之間的影響力.結(jié)合社區(qū)信息,計(jì)算用戶個(gè)人影響力.融合用戶之間的影響力和用戶個(gè)人影響力,得到非對(duì)稱的用戶之間的影響力.

3)用戶社區(qū)結(jié)構(gòu)信息和用戶社交影響力結(jié)合到矩陣分解中,提出一種融合社區(qū)結(jié)構(gòu)和社交影響力的矩陣分解推薦算法SoInf,緩解用戶評(píng)分的稀疏問題,同時(shí)提升推薦準(zhǔn)確度.

2 相關(guān)工作

在社交網(wǎng)絡(luò)中,擁有較強(qiáng)的社交關(guān)系的用戶之間存在一定的相似性,彼此之間會(huì)相互影響.因此在矩陣分解推薦算法中引入社交關(guān)系可以增強(qiáng)推薦效果[6,7].引入社交關(guān)系的矩陣分解推薦算法可以分成兩類:

1)以用戶特征矩陣為紐帶,同時(shí)分解用戶評(píng)分矩陣和用戶社交關(guān)系矩陣[8,10-12].

2)優(yōu)化用戶特征向量[13-23],通過與用戶之間擁有社交關(guān)系的用戶來優(yōu)化用戶的特征矩陣.

同時(shí)分解用戶評(píng)分矩陣和用戶社交關(guān)系矩陣的推薦算法認(rèn)為通過同步分解評(píng)分矩陣和社交矩陣可以獲取更準(zhǔn)確的用戶隱式特征向量.在概率矩陣分解推薦模型[9]基礎(chǔ)上,Ma等人[8]提出了同時(shí)分解用戶評(píng)分矩陣和用戶社交關(guān)系矩陣的SoRec模型.而對(duì)信任與被信任行為的不同進(jìn)行考慮,Yang等人[10]提出了TrustMF模型,分別刻畫了用戶受其信任用戶的影響與對(duì)信任他的用戶的影響.同時(shí)考慮局部社交信息和全局社交信息,Tang等人[11]提出了LOCABAL模型,引入不同視角的社交關(guān)系以提升推薦效果.

優(yōu)化用戶特征向量的矩陣分解方法,用戶特征向量受到社交網(wǎng)絡(luò)中關(guān)聯(lián)用戶的影響.引入用戶社交關(guān)系,可以優(yōu)化當(dāng)前用戶的隱式特征向量.引入用戶好友的偏好信息,Ma等人[13]提出了一種融合社交信息的推薦模型RSTE,在一定程度上利用了社交信息.考慮社交網(wǎng)絡(luò)中的用戶的偏好信息會(huì)隨著用戶之間的相互交流而傳播,Jamali等人[14]提出了一種社交推薦模型SocialMF,利用信任傳播機(jī)制增強(qiáng)推薦效果.SoReg是Ma 等人[15]提出的一種社交正則化推薦模型,使用社交信息對(duì)推薦模型進(jìn)行增強(qiáng),考慮用戶的行為受到用戶好友的影響,且用戶之間社交關(guān)系越強(qiáng)兩個(gè)用戶的興趣愛好越相似.Guo等人[16]提出TrustSVD模型,將用戶顯式信任關(guān)系與評(píng)分信息都看作隱式反饋信息,使用隱式社交反饋信息對(duì)用戶特征矩陣進(jìn)約束.把用戶之間的相似和各個(gè)用戶的重要性相結(jié)合,Davoudi等人[17]提出了一個(gè)社會(huì)信任模型,其中包含了偏好相似性、用戶的中心地位和社會(huì)關(guān)系,并使用矩陣分解來對(duì)項(xiàng)目進(jìn)行評(píng)分預(yù)測(cè).王等人[18]利用用戶評(píng)分過程中潛在存在的信任關(guān)系,提出一種基于信任機(jī)制的推薦算法TM-PMF.

雖然在上述優(yōu)化用戶特征的推薦算法中,也有一些算法[14,17]使用了間接社交關(guān)系來計(jì)算用戶間相似度,但是在構(gòu)建矩陣分解模型時(shí)只利用了用戶的直接相連用戶,即只利用了直接社交關(guān)系.直接社交關(guān)系存在用戶好友數(shù)據(jù)稀疏問題.社交網(wǎng)絡(luò)中存在社區(qū)結(jié)構(gòu),將社區(qū)結(jié)合到推薦模型中可以有效地緩解用戶好友稀疏問題.Yang等人[19]提出了CircleCon模型,考慮用戶在不同領(lǐng)域會(huì)擁有不同的信任用戶集合,根據(jù)評(píng)分信息和社交網(wǎng)絡(luò)數(shù)據(jù)推斷出特定分類的社交信任圈,提出基于圈子的推薦模型.Ma等人[20]在SR+模型中認(rèn)為用戶的隱式特征向量同時(shí)依賴于用戶的朋友和與用戶非常相似的其他用戶.然而SR+需要通過預(yù)先設(shè)定一個(gè)相似閾值來過濾與用戶相似的其他用戶.Li等人[21]在社交化推薦算法MFC中引入了重疊社區(qū)發(fā)現(xiàn)算法,通過計(jì)算用戶與社區(qū)的相關(guān)度和用戶與其他用戶的相似度,來獲取各個(gè)用戶間興趣的差異,并對(duì)目標(biāo)函數(shù)中的正則項(xiàng)進(jìn)行約束,使用間接社交關(guān)系來增強(qiáng)推薦效果.考慮社交關(guān)系中具有同構(gòu)關(guān)系,將興趣愛好相似的用戶分配到同一個(gè)社區(qū),在此基礎(chǔ)上Tang 等人[22]構(gòu)建了推薦模型SoDimRec.Ahmadian等人[23]提出了一種基于自適應(yīng)鄰居選擇機(jī)制的社會(huì)推薦算法SRANS.為用戶選擇合適的鄰居,可以提高推薦過程中評(píng)分預(yù)測(cè)的準(zhǔn)確性.

本文也是增加了間接社交關(guān)系的使用,考慮社區(qū)內(nèi)用戶間的相互影響,來增加推薦準(zhǔn)確度.與上述工作不同的是,我們將社區(qū)結(jié)構(gòu)和社交影響力融合到矩陣分解推薦模型中.同時(shí)使用用戶評(píng)分信息和社交網(wǎng)絡(luò)結(jié)構(gòu)信息來計(jì)算用戶之間的影響力,且將用戶之間的影響力和用戶個(gè)人影響力相結(jié)合,更精確刻畫用戶間的相互影響,從而提升推薦效果.

3 推薦算法SoInf

3.1 相關(guān)定義

U={u1,u2,…,um}表示推薦系統(tǒng)中用戶的集合,V={v1,v2,…,vn}表示推薦系統(tǒng)中項(xiàng)目的集合.將用戶對(duì)項(xiàng)目的評(píng)分矩陣表示為R=(Rij)m×n,其中Rij∈{1,2,3,4,5}表示用戶ui對(duì)項(xiàng)目vj的評(píng)分.T=(Tij)m×m表示用戶的社交關(guān)系矩陣,Tij=1表示用戶ui和用戶vj之間存在好友關(guān)系,否則Tij=0,與用戶ui的直接相連的好友集合為Ni.假設(shè)有x個(gè)社區(qū),g={g1,…,gx}是社區(qū)集合.對(duì)于用戶ui,設(shè)ui∈gi,C(i)∈(gi∪Ni)表示用戶好友和其所屬社區(qū)的其他用戶的集合.矩陣分解推薦算法將用戶評(píng)分矩陣R近似地分解成低階的用戶特征矩陣U∈Rl×m和低階的項(xiàng)目特征矩陣V∈Rl×n,其中l(wèi)是隱特征向量的維數(shù).

3.2 社區(qū)發(fā)現(xiàn)

用戶的偏好受到社區(qū)內(nèi)其他用戶的影響.采用社區(qū)發(fā)現(xiàn)算法將用戶集合根據(jù)其社交網(wǎng)絡(luò)結(jié)構(gòu)進(jìn)行劃分,屬于同一社區(qū)內(nèi)的用戶存在相同的特性或愛好.簡(jiǎn)單隨機(jī)塊模型[24]假設(shè)生成鏈接的概率只與兩個(gè)端點(diǎn)的社區(qū)相關(guān),社區(qū)選擇各節(jié)點(diǎn)的概率相同.而實(shí)際的鏈接生成過程與很多因素有關(guān),如有些節(jié)點(diǎn)是權(quán)威的節(jié)點(diǎn),其被社區(qū)選擇的概率相對(duì)要大.

Karrer和Newman[25]提出度糾正隨機(jī)塊模型DCBM.DCBM使用了Kernighan-Lin算法[26],這是一種基于貪婪原理的啟發(fā)式算法.首先將網(wǎng)絡(luò)隨機(jī)地劃分為x個(gè)社區(qū)的初始集合.然后重復(fù)地將一個(gè)頂點(diǎn)從一個(gè)集合移動(dòng)到另一個(gè)集合,在每一次移動(dòng)中選擇目標(biāo)函數(shù)增加最大的移動(dòng)結(jié)果,或者目標(biāo)函數(shù)減少最小的移動(dòng),且每個(gè)頂點(diǎn)只能移動(dòng)一次.當(dāng)所有頂點(diǎn)都被移動(dòng)后,檢查移動(dòng)過程中從開始到結(jié)束所經(jīng)過的狀態(tài),選擇目標(biāo)分?jǐn)?shù)最高的那個(gè)移動(dòng)狀態(tài),并使用這個(gè)狀態(tài)作為相同過程的新迭代的起點(diǎn).當(dāng)目標(biāo)函數(shù)沒有增加時(shí),一個(gè)完整的迭代過程結(jié)束,并得到最終的網(wǎng)絡(luò)的社區(qū)劃分結(jié)果.

相比于簡(jiǎn)單隨機(jī)塊模型,DCBM在發(fā)現(xiàn)社區(qū)的過程中考慮節(jié)點(diǎn)度的影響,可以更好地識(shí)別網(wǎng)絡(luò)中的非重疊廣義社區(qū).本文使用DCBM對(duì)用戶網(wǎng)絡(luò)進(jìn)行社區(qū)發(fā)現(xiàn),將每個(gè)用戶被劃分到各個(gè)社區(qū)中.

3.3 影響力計(jì)算

本文的影響力計(jì)算從兩個(gè)方面進(jìn)行考慮.一方面,通過用戶評(píng)分信息和社交網(wǎng)絡(luò)結(jié)構(gòu)信息來計(jì)算用戶之間的影響力.另一方面,通過社交網(wǎng)絡(luò)拓?fù)浣Y(jié)構(gòu)分析用戶在社交網(wǎng)絡(luò)中的個(gè)人影響力.用戶個(gè)人影響力,即用戶影響其他用戶的能力[27],類似于可信度.研究表明在社交網(wǎng)絡(luò)中,越重要的人越能快速擴(kuò)散和放大輿論[28].本文將用戶之間的影響力和用戶的個(gè)人影響力相結(jié)合,計(jì)算非對(duì)稱的用戶之間的影響力.

3.3.1 使用用戶評(píng)分信息計(jì)算用戶之間的影響力

用戶之間的影響力是指任意兩個(gè)用戶之間的相互影響的大小,在計(jì)算的時(shí)候我們同時(shí)使用用戶歷史評(píng)分信息和社交網(wǎng)絡(luò)結(jié)構(gòu)信息.通過用戶歷史評(píng)分信息,我們可以分析得到用戶之間的相似性,本文采用皮爾遜相似性來計(jì)算相似度.與其他同樣使用用戶評(píng)分計(jì)算相似度的方法相比較,皮爾遜相關(guān)系數(shù)中對(duì)用戶評(píng)分做了處理.在實(shí)際情況中,每個(gè)用戶的打分習(xí)慣和對(duì)評(píng)分檔位的理解存在差異,導(dǎo)致有些用戶打分整體偏高,而有些整體偏低的情況.而皮爾遜相關(guān)系數(shù)可以很好的去除這種差異,更準(zhǔn)確的衡量用戶之間的相似性.其公式如下:

(1)

3.3.2 使用社交網(wǎng)絡(luò)結(jié)構(gòu)信息計(jì)算用戶間影響力

但是通過用戶評(píng)分計(jì)算出的相似度只利用了評(píng)分信息,沒有充分利用用戶之間的信息,所以本文同時(shí)使用社交網(wǎng)絡(luò)結(jié)構(gòu)信息來計(jì)算用戶之間的影響力.

使用社交網(wǎng)絡(luò)結(jié)構(gòu)數(shù)據(jù),通過SimRank算法[29]計(jì)算用戶間的影響力.定義兩個(gè)用戶i和k之間的SimRank相似度infs(i,k).SimRank基于相似的用戶則鄰居也相似的思想來計(jì)算用戶間的相似度,計(jì)算方法如下:

1)infs(i,k)=0,當(dāng)I(i)=φ或I(k)=φ;

2)在其他情況下,

(2)

其中,I(i)表示所有指向用戶a的用戶集合,d∈(0,1)是一個(gè)阻尼系數(shù).

在社交網(wǎng)絡(luò)中,用戶尋求建議時(shí)更容易受到個(gè)人影響力大的其他用戶的影響.而且用戶在選擇其他用戶進(jìn)行交流時(shí),會(huì)更傾向于選擇與其同一個(gè)社區(qū)的用戶,而不是社區(qū)外的用戶.

定義社區(qū)中各個(gè)用戶的局部影響力為si,S為由社區(qū)中所有用戶的局部影響力組成的個(gè)性化向量.在每個(gè)社區(qū)中,使用PageRank[30]求出社區(qū)中各個(gè)用戶的局部影響力si.

定義用戶個(gè)人影響力fi,F(xiàn)為網(wǎng)絡(luò)中用戶影響力得分向量,fi∈F.

本文通過社區(qū)信息計(jì)算出的個(gè)性化向量S結(jié)合到Personalized PageRank[31],計(jì)算得到的用戶個(gè)人影響力,見公式(3):

F=aPTF+(1-a)S

(3)

P為網(wǎng)絡(luò)圖的轉(zhuǎn)移矩陣,a為跳轉(zhuǎn)因子.在整個(gè)社交網(wǎng)絡(luò)中使用Personalized PageRank算法,可以計(jì)算出每個(gè)用戶的全局個(gè)人影響力fi.然后對(duì)用戶的全局個(gè)人影響力進(jìn)行數(shù)據(jù)標(biāo)準(zhǔn)化將影響力映射到[0,1]區(qū)間上.

計(jì)算出來的用戶之間的影響力基本都呈對(duì)稱性,直接用來描述用戶之間的影響會(huì)有一定偏差.在實(shí)際情況中,用戶i對(duì)用戶k的影響力可能與用戶k對(duì)用戶i的影響力不同.個(gè)人影響力大的用戶更容易影響其他用戶.將用戶的個(gè)人影響力與用戶之間的影響力相結(jié)合,得到使用社交網(wǎng)絡(luò)結(jié)構(gòu)信息計(jì)算的非對(duì)稱的用戶i與用戶k之間的影響力:

(4)

3.3.3 計(jì)算綜合的用戶之間的影響力

把使用用戶歷史評(píng)分信息計(jì)算的用戶之間的影響力sim(i,k)和使用社交網(wǎng)絡(luò)結(jié)構(gòu)信息計(jì)算的用戶之間的影響力inf(i,k)相結(jié)合,得到綜合的用戶i對(duì)k的影響力:

(5)

3.4 融合社區(qū)結(jié)構(gòu)和用戶影響力的推薦算法

本文在Ma等人[15]提出的SoReg的基礎(chǔ)上提出一種融合社區(qū)結(jié)構(gòu)和社交影響力的矩陣分解推薦算法SoInf,利用用戶之間的影響力信息和用戶評(píng)分信息進(jìn)行推薦,其模型如圖1所示.

圖1 SoInf模型圖Fig.1 Graphical model of SoInf

我們使用用戶在社區(qū)中的間接社交關(guān)系來增強(qiáng)我們的模型,根據(jù)社區(qū)內(nèi)其他用戶和用戶好友的偏好來獲得用戶的偏好信息.與SoReg中用戶ui只受到用戶好友的影響不同,在SoInf中,用戶ui的隱式特征向量受到用戶的好友Ni和其所屬社區(qū)gi中其他用戶的影響.在SoReg中,用戶與好友之間的相互影響關(guān)系受到通過用戶歷史評(píng)分信息計(jì)算的相似度的影響.而在SoInf中,同時(shí)使用用戶評(píng)分信息和社交網(wǎng)絡(luò)結(jié)構(gòu)信息來計(jì)算用戶之間的影響力f(i,k),并融合用戶之間的影響力和結(jié)合社區(qū)信息計(jì)算的用戶個(gè)人影響力.用戶ui的隱式特征向量Ui和用戶uk的隱式特征Uk受到用戶之間的影響力f(i,k)的約束:

(6)

假設(shè)Ui,Vj先驗(yàn)概率服從高斯分布且相互獨(dú)立,則有:

(7)

(8)

給定用戶的同社區(qū)內(nèi)的其他用戶和用戶的直接鄰居的隱式特征,在用戶隱式特征空間執(zhí)行優(yōu)化任務(wù),得到用戶隱式特征的條件分布:

(9)

預(yù)測(cè)評(píng)分值的條件分布如下:

(10)

利用貝葉斯規(guī)則,特征矩陣U和V的后驗(yàn)分布可通過如下方法計(jì)算:

(11)

對(duì)后驗(yàn)分布取對(duì)數(shù),可得:

(12)

其中Con是常量.最大化上述對(duì)數(shù)后驗(yàn)概率,等價(jià)于最小化如下目標(biāo)函數(shù):

(13)

(14)

(15)

本文給出我們的算法,如下所示:

Algorithm1:learningSoInfInput:RatingsintrainingsetR,usersocialmatrixT,Learningrateγ,α,λU,λVOutput:userlatentprofilematrixUanditemlatentprofilematrixV1 InitializeUandV;2 repeat3 forrij∈Rdo4 updateUi←Ui—α?E?UibasedonEq.(14);5 updateUj←Uj—α?E?VjbasedonEq.(15);6 untilconvergence;7 returnUandV;

4 復(fù)雜性分析

5 實(shí) 驗(yàn)

5.1 數(shù)據(jù)集

豆瓣1https://www.douban.com是一個(gè)中國社交網(wǎng)絡(luò)平臺(tái),主要是對(duì)圖書、電影和音樂進(jìn)行評(píng)論和推薦.每個(gè)人可以根據(jù)自己的喜好對(duì)圖書、電影和音樂進(jìn)行評(píng)分,評(píng)分從1到5.我們使用Zhong等人[32]分享的數(shù)據(jù)集,僅僅使用其中電影相關(guān)的數(shù)據(jù),并且移除評(píng)分為零的數(shù)據(jù).實(shí)驗(yàn)中使用的豆瓣數(shù)據(jù)集共包含6164個(gè)至少評(píng)分過一次的用戶,28781部電影,715204條評(píng)分和8728條好友關(guān)系.

CiaoDVD是Guo等人[33]爬取的一個(gè)英國DVD社交網(wǎng)站Ciao2http://dvd.ciao.co.uk的公開數(shù)據(jù)集.評(píng)分從1到5,共包含17615個(gè)用戶,16121部電影,72665條評(píng)分和22484條信任關(guān)系.

5.2 對(duì)比算法

為了比較本文提出的算法SoInf與其他算法在推薦結(jié)果準(zhǔn)確度上的差別,我們選擇6種算法作為對(duì)比算法進(jìn)行實(shí)驗(yàn).

PMF[9]:僅僅使用了評(píng)分信息,沒有加入用戶的社交關(guān)系信息.

SoRec[8]:屬于同步分解評(píng)分矩陣和社交關(guān)系矩陣的方法,同時(shí)將其分解為用戶特征矩陣與社交特征矩陣.

TrustMF[10]:屬于同步分解評(píng)分矩陣和社交關(guān)系矩陣的方法,將每一個(gè)用戶映射為信任者特征向量和被信任者特征向量.

SocialMF[14]:屬于利用直接社交關(guān)系對(duì)用戶特征矩陣進(jìn)行優(yōu)化的方法,使用用戶好友信息和信任傳播機(jī)制來增強(qiáng)推薦效果.

SoReg[15]:屬于利用直接社交關(guān)系對(duì)用戶特征矩陣進(jìn)行優(yōu)化的方法,通過加入社交正則項(xiàng)使得用戶的偏好與其好友的偏好相似.

MFC[21]:屬于利用間接社交關(guān)系對(duì)用戶特征矩陣優(yōu)化的方法.在矩陣分解模型中引入了重疊社區(qū)發(fā)現(xiàn)算法,區(qū)分用戶所在社區(qū)不同的差異.

為了說明我們的SoInf模型的效果,我們分別進(jìn)行以下三組實(shí)驗(yàn)比較:

1)使用社區(qū)中間接社交關(guān)系,對(duì)推薦的增強(qiáng)效果.把我們的僅僅添加社區(qū)信息的模型命名為SoInfc.將它與上述其他算法進(jìn)行比較.

2)同時(shí)使用用戶評(píng)分信息和社交網(wǎng)絡(luò)結(jié)構(gòu)信息來計(jì)算用戶之間的影響力,對(duì)推薦的增強(qiáng)效果.把在SoInfc模型基礎(chǔ)上,同時(shí)使用用戶評(píng)分信息和社交網(wǎng)絡(luò)結(jié)構(gòu)信息來計(jì)算用戶之間的影響力的模型命名為SoInfs.將它和SoInfc以及其他算法進(jìn)行比較.

3)結(jié)合用戶個(gè)人影響力,對(duì)推薦的增強(qiáng)效果.在SoInfs模型基礎(chǔ)上,結(jié)合用戶個(gè)人影響力來計(jì)算用戶之間的影響力的模型就是本文提出的SoInf.將它與SoInfs以及其他算法相比較.

5.3 評(píng)價(jià)指標(biāo)

本文的實(shí)驗(yàn)采用五重交叉驗(yàn)證方法,即隨機(jī)把數(shù)據(jù)集分成5份,每次選擇其中的4份作為訓(xùn)練集,選擇剩下的1份作為測(cè)試集,對(duì)5次的評(píng)估結(jié)果取平均值得到最終的評(píng)估結(jié)果.為了分析本文提出的算法對(duì)推薦結(jié)果的精確度,采用平均絕對(duì)誤差(Mean Absolute Error,MAE)和均方根絕對(duì)誤差(Root Mean Square Error,RMSE)作為實(shí)驗(yàn)結(jié)果的評(píng)估方法.MAE值和RMSE值越小表示預(yù)測(cè)評(píng)分和真實(shí)評(píng)分的差距越小,推薦結(jié)果越準(zhǔn)確.

(16)

(17)

5.4 參數(shù)選擇和分析

實(shí)驗(yàn)參數(shù)的設(shè)置影響著算法的最終準(zhǔn)確度.根據(jù)文獻(xiàn)[8,9,10,14,15,21]中的參數(shù)設(shè)定規(guī)則,將所有算法的隱特征向量個(gè)數(shù)l設(shè)為10,迭代計(jì)算的步長(學(xué)習(xí)率)γ設(shè)為0.0001,迭代的終止條件設(shè)為前后兩次迭代誤差小于0.00001,將λu和λv設(shè)置為0.001.在我們的算法中,正則項(xiàng)系數(shù)α表示用戶社交網(wǎng)絡(luò)社區(qū)信息以及用戶之間的影響力信息在矩陣分解模型中參與的比重,將α的值分別取值為{0.01,0.1,1,10,50,100}進(jìn)行實(shí)驗(yàn).記錄我們的算法SoInf的推薦結(jié)果的MAE值和RMSE值隨不同α值的變化情況,如圖2和圖3所示.

圖2 SoInf算法的 MAE值隨α值的變化Fig.2 MAE of the SoInf algorithm varies with parameter α

由圖2和圖3可知,對(duì)于Douban數(shù)據(jù)集,當(dāng)α為10時(shí)MAE和RMSE最小, 也就是推薦準(zhǔn)確度最高, 所以在我們的算法中設(shè)α為10.而對(duì)于ciaoDVD數(shù)據(jù)集,當(dāng)α為50時(shí)MAE和RMSE最小.依據(jù)文獻(xiàn)[8,9,10,14,15,21]對(duì)于其他算法的參數(shù)進(jìn)行設(shè)定,見表1.

圖3 SoInf算法的RMSE值隨α值的變化Fig.3 RMSE of the SoInf algorithm varies with parameter α

表1 不同社交推薦方法參數(shù)設(shè)定
Table 1 Parameters for different social recommendation methods

方法參數(shù)設(shè)定PMFλu=0.001,λv=0.001,SoRecλu=0.001,λv=0.001,α=1TrustMFλu=0.001,λv=0.001,α=1SoRegλu=0.001,λv=0.001,α=0.001SocialMFλu=0.001,λv=0.001,α=1MFCλu=0.001,λv=0.001,α=0.001SoInfλu=0.001,λv=0.001,α=10

5.5 實(shí)驗(yàn)結(jié)果比較和分析

在為每個(gè)算法選擇最優(yōu)的參數(shù)以后,通過實(shí)驗(yàn)我們可以比較各個(gè)矩陣分解的預(yù)測(cè)效果.表2里顯示的是在Douban和CiaoDVD數(shù)據(jù)集中各個(gè)算法的MAE和RMSE.在圖4和圖5中分別顯示了各個(gè)算法的MAE和RMSE的對(duì)比.

表2 SoInf算法與其他推薦算法的實(shí)驗(yàn)結(jié)果對(duì)比
Table 2 Comparison ofMAEandRSMEfor SoInf algorithm and other recommendation algorithms

算法DoubanCiaoDVDMAERMSEMAERMSEPMF0.63970.83170.79541.0930SoRec0.60350.76700.76341.0311TrustMF0.60120.76170.76311.0303SocialMF0.61490.77570.76381.0337SoReg0.60360.76180.76321.0321MFC0.59960.76080.75941.0299SoInfc0.59930.75990.75791.0295SoInfs0.59840.75960.75591.0286SoInf0.59810.75950.75531.0268

通過觀察和分析,我們可以得到以下幾個(gè)結(jié)論:

1)使用社區(qū)中間接社交關(guān)系,對(duì)推薦效果的分析.相對(duì)于利用直接社交信息進(jìn)行用戶特征矩陣優(yōu)化的模型(SoReg,SocialMF)和同步分解評(píng)分矩陣和社交關(guān)系矩陣的模型(SoRec,TrsutMF),基于社區(qū)的社交推薦模型(MFC,SoInfc,SoInfs,SoInf)準(zhǔn)確度更高.這表明社區(qū)信息的引入可以緩解用戶好友稀疏的問題,提升推薦效果.

圖4 各個(gè)算法的MAE指標(biāo)比較Fig.4 Comparison of MAE for different algorithms

2)同時(shí)使用用戶評(píng)分信息和社交網(wǎng)絡(luò)結(jié)構(gòu)信息來計(jì)算用戶之間的影響力,對(duì)推薦效果的分析.和僅僅使用用戶評(píng)分信息來計(jì)算用戶之間的影響力的SoInfc算法相比較,同時(shí)使用評(píng)分信息和社交網(wǎng)絡(luò)結(jié)構(gòu)信息來計(jì)算用戶之間的影響力的SoInfs準(zhǔn)確度更高,說明同時(shí)使用評(píng)分信息和社交網(wǎng)絡(luò)結(jié)構(gòu)信息來計(jì)算用戶之間的影響力可以更加準(zhǔn)確地刻畫用戶間的相互影響,更加有效地使用用戶評(píng)分信息與社交信息.

3)結(jié)合用戶個(gè)人影響力來計(jì)算有差異的用戶之間的影響力效果分析.結(jié)合用戶個(gè)人影響力來計(jì)算非對(duì)稱的用戶之間的影響力的模型SoInf相比沒有結(jié)合用戶的個(gè)人影響力的SoInfs推薦準(zhǔn)確度更高.說明使用結(jié)合用戶個(gè)人影響力得到的非對(duì)稱的用戶之間的影響力,可以獲得更好的推薦結(jié)果.

與PMF相比較,我們提出的推薦模型SoInf在Douban數(shù)據(jù)集上對(duì)于MAE和RMSE分別提升了6.50%和8.68%,在ciaoDVD上數(shù)據(jù)集分別提升了5.04%和6.06%.對(duì)比其他算法,我們的模型SoInf在準(zhǔn)確度方面有一定的提升.與MFC通過重疊社區(qū)來增強(qiáng)基于社區(qū)的推薦的效果不同,我們考慮通過更精確地刻畫用戶之間的關(guān)系,得到用戶之間的影響力來對(duì)基于社區(qū)的推薦進(jìn)行增強(qiáng).SoInf與MFC相比準(zhǔn)確度更高,說明將社區(qū)結(jié)構(gòu)和社交影響力相融合到矩陣分解模型中,同時(shí)使用用戶的評(píng)分信息和社交網(wǎng)絡(luò)結(jié)構(gòu)信息,可以更加充分合理的利用推薦數(shù)據(jù),達(dá)到更好的推薦效果.

圖5 各個(gè)算法的RMSE指標(biāo)比較Fig.5 Comparison of RMSE for different algorithms

6 總 結(jié)

本文提出了一種融合社區(qū)結(jié)構(gòu)和社交影響力的矩陣分解推薦算法SoInf.為了減少好友的稀疏,我們采用間接社交關(guān)系來代替直接社交關(guān)系.進(jìn)行社區(qū)發(fā)現(xiàn),然后結(jié)合社區(qū)信息進(jìn)行用戶個(gè)人影響力計(jì)算.考慮社區(qū)內(nèi)其他用戶對(duì)用戶的影響,來提高推薦的準(zhǔn)確度.使用社區(qū)內(nèi)用戶之間的影響力和用戶的個(gè)人影響力,得到非對(duì)稱的用戶之間的影響力.通過在Douban和ciaoDVD數(shù)據(jù)集上的實(shí)驗(yàn)結(jié)果表明,算法在推薦準(zhǔn)確度上比一些已有的基于矩陣分解的算法更好.未來,我們將研究使用社交影響力和評(píng)分信息來構(gòu)建用戶畫像,使用用戶畫像來提升推薦效果.

猜你喜歡
用戶信息模型
一半模型
重要模型『一線三等角』
重尾非線性自回歸模型自加權(quán)M-估計(jì)的漸近分布
訂閱信息
中華手工(2017年2期)2017-06-06 23:00:31
關(guān)注用戶
商用汽車(2016年11期)2016-12-19 01:20:16
3D打印中的模型分割與打包
關(guān)注用戶
商用汽車(2016年6期)2016-06-29 09:18:54
關(guān)注用戶
商用汽車(2016年4期)2016-05-09 01:23:12
如何獲取一億海外用戶
展會(huì)信息
主站蜘蛛池模板: 国产h视频在线观看视频| 高清欧美性猛交XXXX黑人猛交 | 婷婷色婷婷| 中文字幕人成乱码熟女免费| 亚洲欧美日韩动漫| 精品无码专区亚洲| 成人a免费α片在线视频网站| 一级毛片在线免费视频| 欧美亚洲国产视频| 99久久精品国产精品亚洲| 国产91麻豆视频| jizz国产视频| aaa国产一级毛片| 91精品在线视频观看| 国产美女精品人人做人人爽| 久996视频精品免费观看| 在线免费看片a| 四虎国产在线观看| 日本少妇又色又爽又高潮| 成年人久久黄色网站| 青青久久91| 国产爽歪歪免费视频在线观看| 天天躁夜夜躁狠狠躁图片| 亚洲成人播放| 99er精品视频| 国产高清不卡| 凹凸精品免费精品视频| 在线观看免费黄色网址| 黄片一区二区三区| 国产一级妓女av网站| 国产精品久线在线观看| 永久在线精品免费视频观看| 理论片一区| 亚洲最大在线观看| AV网站中文| 国产在线麻豆波多野结衣| 在线另类稀缺国产呦| 伊人久久影视| 青青草国产在线视频| 动漫精品中文字幕无码| 精品三级网站| 国产久草视频| 欧美人与动牲交a欧美精品| 日韩高清欧美| 夜夜操国产| 精品久久香蕉国产线看观看gif | 亚洲国产精品不卡在线| 91精品在线视频观看| 亚洲国产91人成在线| 国产精品免费露脸视频| 精品国产一区91在线| 久久狠狠色噜噜狠狠狠狠97视色| 男女猛烈无遮挡午夜视频| 青青草综合网| 国产视频只有无码精品| 中文无码日韩精品| 亚洲国产精品无码久久一线| 国产精彩视频在线观看| 国产96在线 | 色噜噜久久| 凹凸国产熟女精品视频| 亚洲日韩高清无码| 亚洲免费播放| 免费一级α片在线观看| 亚洲αv毛片| 久久亚洲黄色视频| 狠狠亚洲婷婷综合色香| 亚洲综合久久一本伊一区| 国产黑丝一区| 久久免费视频6| 91国内在线观看| 中文无码精品A∨在线观看不卡 | 亚洲黄网在线| 亚洲国产天堂久久综合| 毛片免费试看| 国产欧美网站| 日韩欧美网址| 无码中文字幕乱码免费2| 一级毛片不卡片免费观看| 中国美女**毛片录像在线| 亚卅精品无码久久毛片乌克兰| 青青操国产视频|