999精品在线视频,手机成人午夜在线视频,久久不卡国产精品无码,中日无码在线观看,成人av手机在线观看,日韩精品亚洲一区中文字幕,亚洲av无码人妻,四虎国产在线观看 ?

基于用戶行為特征的動(dòng)態(tài)權(quán)重混合推薦算法

2017-04-24 10:40:38劉沛文陳華鋒
關(guān)鍵詞:用戶

劉沛文 陳華鋒

(武漢大學(xué)國(guó)家多媒體軟件工程技術(shù)研究中心 湖北 武漢 430072)(武漢大學(xué)計(jì)算機(jī)學(xué)院 湖北 武漢 430072)

基于用戶行為特征的動(dòng)態(tài)權(quán)重混合推薦算法

劉沛文 陳華鋒

(武漢大學(xué)國(guó)家多媒體軟件工程技術(shù)研究中心 湖北 武漢 430072)(武漢大學(xué)計(jì)算機(jī)學(xué)院 湖北 武漢 430072)

推薦系統(tǒng)可以為不同的用戶定制個(gè)性化的網(wǎng)絡(luò)服務(wù),如何提供準(zhǔn)確的推薦則成為其最大難點(diǎn)。針對(duì)傳統(tǒng)推薦算法的稀疏性問題,提出基于用戶行為特征的動(dòng)態(tài)權(quán)重混合推薦算法。通過對(duì)數(shù)據(jù)集中的數(shù)據(jù)進(jìn)行預(yù)處理,計(jì)算出不同用戶對(duì)于不同物品的個(gè)性化行為特征指數(shù),并將其引入相似度的計(jì)算中。依據(jù)用戶評(píng)分?jǐn)?shù)據(jù)稀疏性的差異計(jì)算出動(dòng)態(tài)權(quán)重,并依此將基于用戶內(nèi)容的推薦和協(xié)同過濾推薦進(jìn)行動(dòng)態(tài)混合。實(shí)驗(yàn)結(jié)果表明,該算法在稀疏數(shù)據(jù)集中能有效降低推薦誤差,提高推薦精度。

行為特征 動(dòng)態(tài)權(quán)重 混合推薦算法

0 引 言

為了能夠提供更好的產(chǎn)品設(shè)計(jì)和用戶服務(wù),電子商務(wù)和社交網(wǎng)絡(luò)始終致力于提高對(duì)用戶興趣的理解和預(yù)測(cè)。2013年下半年,Twitter通過監(jiān)測(cè)用戶關(guān)注和轉(zhuǎn)發(fā)等操作,設(shè)計(jì)了一個(gè)向個(gè)人推薦推文和賬戶的新功能。推薦系統(tǒng)開始大范圍的應(yīng)用于Amazon、Netflix和LinkedIn等網(wǎng)站。

在推薦系統(tǒng)中,推薦算法是其核心。傳統(tǒng)的推薦算法主要包括基于內(nèi)容的過濾算法CBF(Content-based Filtering)、協(xié)同過濾算法CF(Collaborative Filtering)和混合過濾算法HR(Hybrid Recommendation)等[1]。

基于內(nèi)容的過濾算法使用對(duì)象的自身信息來(lái)進(jìn)行推薦,核心思想是針對(duì)待推薦的目標(biāo)用戶,其將來(lái)很可能對(duì)與該用戶相似的用戶以往感興趣的物品或在內(nèi)容上與該用戶以往感興趣的物品相似的物品仍然感興趣[2]。針對(duì)算法的計(jì)算對(duì)象,基于內(nèi)容的推薦算法可分為基于用戶內(nèi)容的過濾算法和基于項(xiàng)目?jī)?nèi)容的過濾算法[3]。兩種算法分別從用戶和物品的角度,分析目標(biāo)用戶或物品與其他用戶或物品之間因自身內(nèi)容或?qū)傩缘牟煌嬖诘膬?nèi)在聯(lián)系,例如用戶資料、物品描述等,利用相似度計(jì)算公式計(jì)算用戶或物品間的相似程度,最終加權(quán)計(jì)算出推薦預(yù)測(cè)值,并按預(yù)測(cè)值的大小來(lái)決定目標(biāo)用戶的推薦物品。

協(xié)同過濾算法分為兩種,基于用戶的協(xié)同過濾算法UBCF(User-based Collaborative Filtering)和基于項(xiàng)目的協(xié)同過濾算法IBCF(Item-based Collaborative Filtering)[4],其依據(jù)用戶對(duì)物品的歷史評(píng)分,分別計(jì)算用戶或物品間的相似度,找到與目標(biāo)用戶或目標(biāo)物品相似的對(duì)象,并根據(jù)相似對(duì)象的歷史評(píng)分信息計(jì)算目標(biāo)用戶對(duì)目標(biāo)物品的推薦預(yù)測(cè)值,以此來(lái)進(jìn)行推薦。

混合過濾算法是將上述提到了多種推薦算法進(jìn)行不同方式的融合,進(jìn)而衍生出的一種推薦算法[5]。大多是引入一個(gè)平衡因子,通過線性公式將推薦算法進(jìn)行混合,并通過在特定測(cè)試數(shù)據(jù)集上對(duì)特定用戶的反復(fù)實(shí)驗(yàn)來(lái)確定平衡因子的值。

雖然以上推薦算法在目前的推薦系統(tǒng)中已經(jīng)得到了較為廣泛的應(yīng)用,但還存在以下幾個(gè)問題:

(1) 推薦效果強(qiáng)烈依賴于用戶和項(xiàng)目的歷史數(shù)據(jù),受數(shù)據(jù)集稀疏性的干擾[6];

(2) 傳統(tǒng)的混合推薦算法不能靈活感知用戶在不同時(shí)期、不同用戶所產(chǎn)生的動(dòng)態(tài)的個(gè)性化偏好[7];

(3) 在實(shí)際應(yīng)用中,混合推薦的固定權(quán)重不能適應(yīng)數(shù)據(jù)集中不同用戶數(shù)據(jù)稀疏性的個(gè)性化差異。

針對(duì)上述問題,本文提出一種基于用戶行為特征的動(dòng)態(tài)權(quán)重混合推薦算法DWHR(Dynamic-Weighted Hybrid Recommendation),其核心思想是根據(jù)用戶在不同的時(shí)期所產(chǎn)生的行為操作,例如評(píng)分、瀏覽記錄等,自適應(yīng)地將多種推薦算法進(jìn)行動(dòng)態(tài)加權(quán),預(yù)測(cè)用戶對(duì)于該物品的喜好程度。在MovieLens公共電影評(píng)分?jǐn)?shù)據(jù)集上的實(shí)驗(yàn)結(jié)果表明,該算法可以針對(duì)不同用戶的個(gè)性化差異,有效提高在稀疏數(shù)據(jù)集下的推薦精度。

1 本文提出的算法

1.1 相關(guān)定義

1.1.1 評(píng)分矩陣

在推薦系統(tǒng)中,定義U={u1,u2,…,um}為系統(tǒng)中所有m個(gè)用戶的集合,I={i1,i2,…,in}為所有n個(gè)項(xiàng)目的集合。則評(píng)分矩陣R[m×n]可用表1表示。其中,用戶i對(duì)項(xiàng)目j的評(píng)分表示為rij。若rij=0,則表示用戶i對(duì)項(xiàng)目j未進(jìn)行評(píng)分。另外,針對(duì)MovieLens數(shù)據(jù)集,定義X={x1,x2,…,x19}為所有19種電影類型,而每種電影類型中又包含了多部電影,即xa={ii},ii∈I,xa∈X。

表1 評(píng)分矩陣R[m×n]

1.1.2 相似度定義

(1)

(2)

(3)

(4)其中,T={i|ui≠0∧vi≠0}。從以上公式中可以看出,相對(duì)于余弦相似度和皮爾遜相似度,歐氏距離強(qiáng)調(diào)在向量中每個(gè)維度在數(shù)值特征上的絕對(duì)差異;而余弦相似度關(guān)注的是向量每個(gè)維度間的相對(duì)差異;修正余弦相似度在余弦相似度的基礎(chǔ)上,修正了其可能在度量標(biāo)準(zhǔn)上存在的不統(tǒng)一的問題;而皮爾遜相似度進(jìn)一步將向量的計(jì)算維度縮小至兩向量共有數(shù)據(jù)的維度上。

針對(duì)MovieLens數(shù)據(jù)集,評(píng)分矩陣可以被看作是針對(duì)用戶的n維或是針對(duì)項(xiàng)目的m維向量,然后根據(jù)上述公式即可針對(duì)不同情況計(jì)算出用戶或物品之間的相似度。

1.1.3 用戶行為特征定義及提取

一些早期的推薦模型常常假定用戶的興趣愛好是固定的,以至于在任何情況下系統(tǒng)總是推薦同一類型的項(xiàng)目給用戶。但事實(shí)上,用戶的興趣經(jīng)常隨著時(shí)間及周圍環(huán)境的影響而改變。比如,用戶在不同的季節(jié)或不同的年齡段喜歡穿不同款式的衣服,看不同類型的電影等。所以,行為特征是用戶由外界環(huán)境影響所引發(fā)的一系列行為表現(xiàn)。

為了量化行為特征,選取MovieLens數(shù)據(jù)集中用戶在不同時(shí)間和不同年齡段對(duì)不同類型電影的評(píng)分情況作為量化指標(biāo)。在通常情況下,用戶如果喜歡一部電影,其評(píng)分往往會(huì)高于均分。由于MovieLens數(shù)據(jù)集的評(píng)分范圍是1~5,因此定義3分為用戶的評(píng)分喜好點(diǎn),即如果用戶對(duì)一部電影的評(píng)分大于等于3分,則說(shuō)明用戶是喜歡此部電影的。本文定義時(shí)間特征指數(shù)monthlike(m,xa)為用戶在m月對(duì)xa類型電影的喜好程度;年齡特征指數(shù)agelike(i,xa)為用戶i所在的年齡段xa類型電影的喜好程度,其中年齡段依據(jù)數(shù)據(jù)集中的標(biāo)示進(jìn)行劃分。二者的計(jì)算公式如下:

(5)

(6)

其中,Lm,xa表示用戶在m月中喜歡xa類型電影的評(píng)分?jǐn)?shù)據(jù)集合,Li,xa表示用戶i所對(duì)應(yīng)的年齡段喜歡xa類型電影的評(píng)分?jǐn)?shù)據(jù)集合,Lxa表示評(píng)分?jǐn)?shù)據(jù)中所有喜歡xa類型電影的評(píng)分集合。

依據(jù)上述公式對(duì)MovieLens數(shù)據(jù)集中的數(shù)據(jù)進(jìn)行預(yù)處理,計(jì)算出每個(gè)月份和每個(gè)年齡段的用戶對(duì)不同類型電影的特征指數(shù),結(jié)果如圖1和圖2所示。從圖1可看出,用戶隨著其年齡的增長(zhǎng),觀看電影的數(shù)量總體上呈先上升再下降的趨勢(shì)。而針對(duì)不同的年齡段的用戶,其對(duì)不同類型的電影也有著較為明顯的區(qū)別,例如25歲以下的用戶最喜愛動(dòng)畫片,而25~45歲的用戶喜歡紀(jì)錄片的居多。從圖2可看出,用戶在8月和11月最喜歡看電影。而在1月用戶最喜歡看紀(jì)錄片,在8月喜歡看恐怖片,最不喜歡看紀(jì)錄片。

圖1 不同年齡段對(duì)不同類型電影的喜好程度

圖2 不同時(shí)間段對(duì)不同類型電影的喜好程度

因此,行為特征指數(shù)越大,則此用戶所代表的這類人對(duì)該類型的電影越感興趣,則其喜歡對(duì)應(yīng)類型電影的可能性越大。

1.1.4 動(dòng)態(tài)權(quán)重

當(dāng)一個(gè)新用戶或新項(xiàng)目進(jìn)入到系統(tǒng)中時(shí),其必然會(huì)面對(duì)“冷啟動(dòng)”問題[8-10]。在這種情況下,推薦系統(tǒng)無(wú)法利用協(xié)同過濾等基于歷史數(shù)據(jù)的推薦算法進(jìn)行推薦,只有利用基于內(nèi)容的過濾算法,根據(jù)用戶或項(xiàng)目自身特定的屬性和信息來(lái)進(jìn)行粗粒推薦;而當(dāng)用戶和項(xiàng)目的歷史數(shù)據(jù)積累到一定數(shù)量之后,基于內(nèi)容的過濾算法過于粗糙的弊端暴露,協(xié)同過濾算法依據(jù)歷史數(shù)據(jù)精確推薦的優(yōu)勢(shì)逐漸突出。所以,混合推薦將兩種算法進(jìn)行不同方式的融合,目的在于使單一的推薦算法在不同使用場(chǎng)景中能夠揚(yáng)長(zhǎng)避短,提升推薦精度。

傳統(tǒng)的混合推薦算法大多引入一個(gè)平衡因子,通過線性公式將兩種或多種推薦算法混合而來(lái)[11-14]。其中,平衡因子的取值往往需要在特定的測(cè)試數(shù)據(jù)集上反復(fù)實(shí)驗(yàn),才能找到一個(gè)特定的值,來(lái)達(dá)到最好的推薦效果。然而,在實(shí)際應(yīng)用中,由于項(xiàng)目數(shù)量遠(yuǎn)大于用戶數(shù)量[15],評(píng)分?jǐn)?shù)據(jù)矩陣對(duì)總體而言十分稀疏,但對(duì)于不同的用戶和項(xiàng)目個(gè)體來(lái)說(shuō)其稀疏性差別巨大。所以,固定權(quán)重值的混合推薦算法只能針對(duì)特定的數(shù)據(jù)集在宏觀上平衡每個(gè)個(gè)體的推薦誤差,不能很好地滿足用戶的個(gè)性差異。

為了解決上述問題,針對(duì)不同用戶評(píng)分?jǐn)?shù)據(jù)稀疏性的個(gè)性化差異,將用戶已評(píng)分的物品數(shù)量占物品集總數(shù)量的比值作為動(dòng)態(tài)權(quán)重平衡因子引入進(jìn)混合推薦中,即依據(jù)用戶評(píng)分的多少來(lái)動(dòng)態(tài)決定權(quán)重大小,以此來(lái)動(dòng)態(tài)平衡混合推薦算法中兩種推薦算法所占比重,提出如下計(jì)算公式:

(7)

其中,λ為引入的線性因子,用來(lái)控制在一定物品數(shù)量下已評(píng)分物品數(shù)據(jù)量的線性增長(zhǎng)快慢對(duì)動(dòng)態(tài)權(quán)重影響的大小;Tr為用戶i已評(píng)分的項(xiàng)目集合,即Tr={r|rij≠0,1≤j≤n},I表示物品集。

1.2 基于用戶行為特征的動(dòng)態(tài)權(quán)重混合推薦算法

基于用戶行為特征的動(dòng)態(tài)權(quán)重混合推薦算法主要分為基于內(nèi)容的過濾算法和協(xié)同過濾兩大部分。

首先是基于內(nèi)容過濾算法部分的計(jì)算。由上文可知,基于內(nèi)容的過濾算法分為基于用戶和項(xiàng)目?jī)煞N。但由于用戶社會(huì)網(wǎng)絡(luò)信息的豐富程度遠(yuǎn)高于物品,所以基于用戶內(nèi)容的推薦計(jì)算維度更廣,精確度更高。另一方面,在大部分?jǐn)?shù)據(jù)集中,物品數(shù)量極大于用戶數(shù)量,且物品增長(zhǎng)速度遠(yuǎn)高于用戶增長(zhǎng)速度,所以基于用戶內(nèi)容信息推薦的計(jì)算復(fù)雜度遠(yuǎn)低于基于項(xiàng)目信息內(nèi)容過濾算法。因此,基于內(nèi)容的過濾算法部分采用基于用戶內(nèi)容的推薦算法進(jìn)行計(jì)算,可分為以下3個(gè)步驟:

1) 計(jì)算用戶內(nèi)容相似度并組成相似用戶數(shù)據(jù)集

2) 計(jì)算用戶行為特征指數(shù)

確定待推薦電影j的電影類型為xj,并遍歷用戶集Ua中每一個(gè)用戶和其看過的所有xj類型的電影,根據(jù)式(5)、式(6)分別計(jì)算出其對(duì)應(yīng)的時(shí)間特征指數(shù)monthlike(m,xj)和年齡特征指數(shù)agelike(i,xj)。

3) 計(jì)算基于用戶內(nèi)容推薦預(yù)測(cè)值

利用加權(quán)平均公式,計(jì)算出相似用戶對(duì)同類型電影的評(píng)分和其特征指數(shù)的基于用戶內(nèi)容推薦的預(yù)測(cè)值,即:

PDBR(i,j)=

(8)

其中Ui表示用戶i的基于用戶內(nèi)容推薦的相鄰用戶集,xj表示與電影j相同類型的電影集合,rbk表示用戶b對(duì)電影k的評(píng)分。

其次進(jìn)行協(xié)同過濾部分的算法計(jì)算。由于物品數(shù)量極大于用戶數(shù)量,所以計(jì)算物品之間相似度的準(zhǔn)確性會(huì)大大優(yōu)于計(jì)算用戶之間的。因此,協(xié)同過濾部分的算法采用基于項(xiàng)目的協(xié)同過濾算法。正如上文所述,基于評(píng)分矩陣計(jì)算相似度更加關(guān)注兩個(gè)向量在不同維度之間的相對(duì)差異。并且,在評(píng)分向量單個(gè)維度數(shù)據(jù)稀疏的情況下,皮爾遜相似度可以有效規(guī)避向量之間因線性獨(dú)立所帶來(lái)的計(jì)算誤差。因此本文采用皮爾遜相似度作為用戶相似度計(jì)算的主要方法,相似度計(jì)算公式可由式(4)轉(zhuǎn)變?yōu)椋?/p>

PCC(i,j) =simPCC(i,j)

(9)

因此,協(xié)同過濾部分的算法概括為以下2個(gè)步驟:

1) 計(jì)算物品之間的相似度并組成相似物品數(shù)據(jù)集

根據(jù)式(9)計(jì)算出待推薦物品i與任意其他物品j之間的相似度集合SPCC。將SPCC中的相似度按大小進(jìn)行降序排列,并選取前θ個(gè)組成相鄰物品數(shù)據(jù)集IPCC。

2) 計(jì)算協(xié)同過濾預(yù)測(cè)值

針對(duì)目標(biāo)用戶,利用IPCC中相似物品的評(píng)分?jǐn)?shù)據(jù)進(jìn)行加權(quán),計(jì)算出目標(biāo)用戶i對(duì)于待推薦物品j的基于項(xiàng)目的協(xié)同過濾的加權(quán)預(yù)測(cè)值,即:

(10)

最后,利用式(7)計(jì)算出的動(dòng)態(tài)權(quán)重,將上述基于用戶內(nèi)容的推薦和協(xié)同過濾的推薦算法分別計(jì)算出來(lái)的預(yù)測(cè)值進(jìn)行線性組合,計(jì)算出本文提出的基于用戶行為特征的動(dòng)態(tài)權(quán)重混合推薦算法的預(yù)測(cè)結(jié)果,即:

P(i,j)=DynamicWeight(i)·PPCC(i,j)+

(1-DynamicWeight(i))PDBR(i,j)

(11)

2 數(shù)據(jù)實(shí)驗(yàn)及結(jié)果分析

2.1 實(shí)驗(yàn)設(shè)計(jì)

實(shí)驗(yàn)采用平均絕對(duì)誤差MAN(MeanAbsoluteDifference)作為衡量算法準(zhǔn)確性的標(biāo)準(zhǔn),其通過統(tǒng)計(jì)算法計(jì)算出來(lái)的預(yù)測(cè)評(píng)分與用戶的實(shí)際評(píng)分之間的絕對(duì)距離的均值來(lái)實(shí)現(xiàn)精確性的度量。介于MAE的計(jì)算和實(shí)現(xiàn)都非常簡(jiǎn)單,所以其已經(jīng)成為絕大多數(shù)文獻(xiàn)中使用的標(biāo)準(zhǔn)[2]。對(duì)于n個(gè)用戶的實(shí)際評(píng)分R={r1,r2,…,rn},推薦算法計(jì)算出的預(yù)測(cè)評(píng)分P={p1,p2,…,pn},則MAE計(jì)算公式如下:

(12)

其中pi為預(yù)測(cè)評(píng)分,ri為實(shí)際評(píng)分。

實(shí)驗(yàn)方案為10折交叉驗(yàn)證法(10-FoldCross-Validation)[2,3]。此方案將MovieLens數(shù)據(jù)集隨機(jī)分為10個(gè)互不相交的數(shù)據(jù)集,輪流選擇其中的一份作為測(cè)試數(shù)據(jù)集,其他9份作為訓(xùn)練集,重復(fù)執(zhí)行10次測(cè)試算法,保證每個(gè)子數(shù)據(jù)集有且僅有一次作為訓(xùn)練集,最后取十次計(jì)算結(jié)果的平均值作為實(shí)驗(yàn)的整體結(jié)果。

2.2 實(shí)驗(yàn)結(jié)果及分析

2.2.1 動(dòng)態(tài)權(quán)重線性因子λ的影響

在式(7)中,動(dòng)態(tài)權(quán)重線性因子λ起著非常重要的作用,如果λ的取值不當(dāng),會(huì)造成動(dòng)態(tài)權(quán)重DynamicWeight(i)的值過大或者過小,進(jìn)而改變基于用戶內(nèi)容的推薦和協(xié)同過濾兩種推薦算法在混合推薦中所占比重大小,極大影響算法的推薦精度。所以,本次實(shí)驗(yàn)針對(duì)在不同線性因子λ下,對(duì)本文提出算法的推薦結(jié)果進(jìn)行測(cè)試,并對(duì)不同的相鄰用戶數(shù)量θ之間的實(shí)驗(yàn)結(jié)果進(jìn)行了對(duì)比,實(shí)驗(yàn)結(jié)果如圖3所示。

圖3 不同線性因子λ的實(shí)驗(yàn)結(jié)果對(duì)比

從式(7)中可以發(fā)現(xiàn),隨著λ的增加,在最終的預(yù)測(cè)評(píng)分中協(xié)同過濾部分所占比重增加。而從圖中的曲線變化可知,針對(duì)同一相鄰用戶數(shù)量,MAE總體呈下降趨勢(shì),說(shuō)明相對(duì)較大的λ值所提高的協(xié)同過濾比重可以在一定程度上提高推薦的準(zhǔn)確性。特別是當(dāng)λ=4時(shí),算法可以達(dá)到最佳的推薦質(zhì)量。但隨著λ繼續(xù)增大,MAE的數(shù)值并沒有顯著減小,反而略微開始增加,這說(shuō)明此時(shí)協(xié)同過濾預(yù)測(cè)所帶來(lái)的誤差對(duì)結(jié)果的影響增大,而基于用戶內(nèi)容部分在稀疏數(shù)據(jù)中所展現(xiàn)出來(lái)的優(yōu)勢(shì)在低權(quán)值下無(wú)法對(duì)結(jié)果產(chǎn)生影響,從而降低了算法的推薦精度。

2.2.2 常見推薦算法推薦效果對(duì)比

為了驗(yàn)證本文算法在提高推薦預(yù)測(cè)準(zhǔn)確性方面的有效性,本次實(shí)驗(yàn)選用同是混合推薦算法但采用固定權(quán)重推薦的文獻(xiàn)[16]。優(yōu)化混合推薦算法作為主要對(duì)比算法。而在傳統(tǒng)的推薦算法中,相鄰用戶是目標(biāo)用戶預(yù)測(cè)評(píng)分的關(guān)鍵依據(jù),鄰居規(guī)模的大小都有可能影響推薦算法的準(zhǔn)確度。所以,本次實(shí)驗(yàn)分別對(duì)傳統(tǒng)的基于用戶的協(xié)同過濾、基于項(xiàng)目的協(xié)同過濾、優(yōu)化混合推薦算法[16]。以及本文提出的算法等四種算法在不同的相鄰用戶數(shù)量θ下的推薦精度進(jìn)行對(duì)比。實(shí)驗(yàn)結(jié)果如圖4所示。

圖4 不同相鄰用戶數(shù)量θ的實(shí)驗(yàn)結(jié)果對(duì)比

由圖可知,不論是文獻(xiàn)[16]算法還是本文的算法,其核心都是將多種推薦算法進(jìn)行組合,減小傳統(tǒng)單一推薦算法在不同使用場(chǎng)景下的計(jì)算誤差,所以混合算法的推薦精度都遠(yuǎn)高于傳統(tǒng)單一推薦算法。而針對(duì)混合推薦算法,由于文獻(xiàn)[16]算法在計(jì)算相似度的過程中采用固定權(quán)重的方式將物品屬性相似性和修正余弦相似度線性組合,忽略了相鄰用戶個(gè)體評(píng)分?jǐn)?shù)據(jù)稀疏性差異以及用戶評(píng)分?jǐn)?shù)據(jù)受外界條件等因素的影響。因此,從實(shí)驗(yàn)結(jié)果可以看出,本文所提出的推薦算法在不同數(shù)量的相鄰用戶下其MAE均小于文獻(xiàn)[16]中的混合推薦算法,推薦效果一直處于較高的優(yōu)勢(shì),并隨著相鄰用戶數(shù)量的增加,優(yōu)勢(shì)也逐漸增加。就本文提出的算法而言,隨著相鄰用戶數(shù)量的增加,MAE總體呈下降趨勢(shì),特別是當(dāng)50<θ<60,即相鄰用戶數(shù)量取到所有訓(xùn)練集用戶數(shù)量的50%~60%時(shí),MAE值取最小,推薦效果最好。而當(dāng)相鄰用戶數(shù)量超過60%時(shí),由于過多的鄰居評(píng)分引入了更多相似度不高的噪聲數(shù)據(jù),從而降低了推薦精度,影響了算法的推薦效果。

3 結(jié) 語(yǔ)

本文對(duì)傳統(tǒng)的混合推薦算法進(jìn)行了優(yōu)化,將用戶行為特征進(jìn)行量化并引入到用戶相似度的計(jì)算中來(lái),并根據(jù)用戶數(shù)據(jù)稀疏性的個(gè)性化差異,自適應(yīng)地將多種推薦算法動(dòng)態(tài)連接并進(jìn)行推薦預(yù)測(cè)。實(shí)驗(yàn)結(jié)果表明,該算法從多方面縮小因單一推薦算法所帶來(lái)的推薦誤差,極大地提高了傳統(tǒng)單一推薦算法在稀疏數(shù)據(jù)集中推薦的準(zhǔn)確性。相較于其他的混合過濾算法,引入動(dòng)態(tài)權(quán)重的概念來(lái)調(diào)整不同推薦算法所占的比重,有效平衡因用戶歷史數(shù)據(jù)集稀疏性的個(gè)性差異所帶來(lái)的推薦誤差,提高推薦質(zhì)量。從實(shí)驗(yàn)中發(fā)現(xiàn),算法在相鄰用戶數(shù)量較低的情況下推薦精度下降,并且混合推薦自身存在的計(jì)算量大、耗時(shí)長(zhǎng)等問題,下一步該算法還需在以上兩個(gè)方面進(jìn)行深入研究。

[1]AdomaviciusG,TuzhilinA.Towardthenextgenerationofrecommendersystems:Asurveyofthestate-of-the-artandpossibleextensions[J].IEEETransactionsonKnowledgeandDataEngineering,2005,17(6):734-749.

[2] 任磊.推薦系統(tǒng)關(guān)鍵技術(shù)研究[D].上海:華東師范大學(xué),2012.

[3] 朱文奇.推薦系統(tǒng)用戶相似度計(jì)算方法研究[D].重慶:重慶大學(xué),2014.

[4]GuptaJ,GadgeJ.Performanceanalysisofrecommendationsystembasedoncollaborativefilteringanddemographics[C]//Communication,Information&ComputingTechnology(ICCICT),2015InternationalConferenceon.IEEE,2015:1-6.

[5] 趙偉明.基于用戶行為分析和混合推薦策略的個(gè)性化推薦方法研究[D].北京:北京工業(yè)大學(xué),2014.

[6]AbhishekK,KulkarniS,ArchanaVKN,etal.AReviewonPersonalizedInformationRecommendationSystemUsingCollaborativeFiltering[J].InternationalJournalofComputerScienceandInformationTechnologies(IJCSIT),2011,2(3):1272-1278.

[7]ScheinAI,PopesculA,UngarLH,etal.Methodsandmetricsforcold-startrecommendations[C]//Proceedingsofthe25thAnnualInternationalACMSIGIRConferenceonResearchandDevelopmentinInformationRetrieval.ACM,2002:253-260.

[8]BaoH,LiQ,LiaoSS,etal.AnewtemporalandsocialPMF-basedmethodtopredictusers’interestsinmicro-blogging[J].DecisionSupportSystems,2013,55(3):698-709.

[9]LeeTQ,ParkY,ParkYT.Atime-basedapproachtoeffectiverecommendersystemsusingimplicitfeedback[J].ExpertSystemswithApplications,2008,34(4):3055-3062.

[10]KoenigsteinN,DrorG,KorenY.Yahoo!musicrecommendations:modelingmusicratingswithtemporaldynamicsanditemtaxonomy[C]//ProceedingsoftheFifthACMConferenceonRecommenderSystems.ACM,2011:165-172.

[11] 張騰季.個(gè)性化混合推薦算法的研究[D].杭州:浙江大學(xué),2013.

[12] 張新猛,蔣盛益,李霞,等.基于網(wǎng)絡(luò)和標(biāo)簽的混合推薦算法[J].計(jì)算機(jī)工程與應(yīng)用,2015,51(1):119-124.

[13]PazzaniMJ,BillsusD.Content-basedrecommendationsystems[M]//TheAdaptiveWeb.Springer,2007:325-341.

[14]ChenW,NiuZ,ZhaoX,etal.Ahybridrecommendationalgorithmadaptedine-learningenvironments[J].WorldWideWeb,2014,17(2):271-284.

[15]TangX,ZhouJ.Dynamicpersonalizedrecommendationonsparsedata[J].IEEETransactionsonKnowledgeandDataEngineering,2013,25(12):2895-2899.

[16] 李鵬飛,吳為民.基于混合模型推薦算法的優(yōu)化[J].計(jì)算機(jī)科學(xué),2014,41(2):68-71,98.

A DYNAMIC-WEIGHTED HYBRID RECOMMENDATION ALGORITHM BASED ON USER BEHAVIOR CHARACTERISTICS

Liu Peiwen Chen Huafeng

(NationalEngineeringResearchCenterforMultimediaSoftware,WuhanUniversity,Wuhan430072,Hubei,China)(CollegeofComputer,WuhanUniversity,Wuhan430072,Hubei,China)

A recommendation system can personalize website service for different users, and how to provide accurate recommendations has become the biggest difficulty. Aiming at the sparsity problem of traditional recommendation algorithm, dynamic-weighted hybrid recommendation algorithm based on user behavior characteristics is proposed. Through the data preprocessing in dataset, the personalized behavior characteristic index of different users for different items is calculated and introduced into the similarity calculation. The dynamic weight is calculated according to the difference of the user’s rate data sparseness, and the user’s content recommendation and collaborative filtering recommendation are dynamically mixed. Experimental results show that the proposed algorithm can reduce the recommendation error effectively and improve the recommendation accuracy in the sparse data set.

User behavior characteristics Dynamic-weighted Hybrid recommendation algorithm

2016-03-19。劉沛文,碩士生,主研領(lǐng)域:模式識(shí)別與智能系統(tǒng)。陳華鋒,博士生。

TP301.6

A

10.3969/j.issn.1000-386x.2017.04.054

猜你喜歡
用戶
雅閣國(guó)內(nèi)用戶交付突破300萬(wàn)輛
車主之友(2022年4期)2022-08-27 00:58:26
您撥打的用戶已戀愛,請(qǐng)稍后再哭
關(guān)注用戶
商用汽車(2016年11期)2016-12-19 01:20:16
關(guān)注用戶
商用汽車(2016年5期)2016-11-28 09:55:15
兩新黨建新媒體用戶與全網(wǎng)新媒體用戶之間有何差別
關(guān)注用戶
商用汽車(2016年6期)2016-06-29 09:18:54
關(guān)注用戶
商用汽車(2016年4期)2016-05-09 01:23:12
挖掘用戶需求尖端科技應(yīng)用
Camera360:拍出5億用戶
100萬(wàn)用戶
主站蜘蛛池模板: 亚洲一区毛片| 久久精品国产999大香线焦| 国产免费网址| av一区二区三区高清久久| 国产成人精品在线1区| 欧美午夜精品| 日本一区中文字幕最新在线| 91po国产在线精品免费观看| 999国产精品| 伊人丁香五月天久久综合| 国产午夜精品鲁丝片| 国产欧美日韩一区二区视频在线| 亚洲第一区欧美国产综合| 999福利激情视频| 国产黄在线观看| 久青草国产高清在线视频| 国产在线自揄拍揄视频网站| 一本大道无码日韩精品影视| 亚洲精品国产日韩无码AV永久免费网 | 成人av专区精品无码国产| 亚洲青涩在线| 91视频国产高清| 婷婷综合缴情亚洲五月伊| 日韩国产黄色网站| 四虎影视8848永久精品| 国产人成乱码视频免费观看| 无码啪啪精品天堂浪潮av| 亚洲IV视频免费在线光看| 亚洲大尺码专区影院| 国产亚洲精品自在久久不卡 | 久久久久青草线综合超碰| 欧美一级专区免费大片| 久久精品无码国产一区二区三区| 成年av福利永久免费观看| 国产成熟女人性满足视频| 99资源在线| 黄色三级毛片网站| 精品国产黑色丝袜高跟鞋| 免费A级毛片无码无遮挡| 91精品小视频| 欧美激情网址| 伊人精品视频免费在线| 久久国产成人精品国产成人亚洲| 麻豆精选在线| 国产精品无码一二三视频| 麻豆国产在线观看一区二区| 国产亚洲现在一区二区中文| 中文字幕亚洲精品2页| 亚洲视频四区| 在线观看91香蕉国产免费| 久久国产精品77777| A级毛片高清免费视频就| 欧美精品v| 她的性爱视频| 青青草原国产免费av观看| 国产小视频免费| 国产又爽又黄无遮挡免费观看| 日韩黄色大片免费看| 国产在线高清一级毛片| 欧美精品H在线播放| 免费亚洲成人| 久久99国产视频| 四虎在线观看视频高清无码| 中文字幕久久亚洲一区| 亚洲成年人网| 中文字幕有乳无码| 亚洲成人动漫在线观看| 欧美一级夜夜爽www| 亚洲精品va| 成人蜜桃网| 日本一区二区三区精品国产| 国产视频你懂得| 久青草国产高清在线视频| 高清大学生毛片一级| 伊人久久精品无码麻豆精品 | 欧洲熟妇精品视频| 偷拍久久网| 成人精品亚洲| 欧美在线伊人| 国产精品自拍合集| 色综合五月婷婷| 欧美.成人.综合在线|