999精品在线视频,手机成人午夜在线视频,久久不卡国产精品无码,中日无码在线观看,成人av手机在线观看,日韩精品亚洲一区中文字幕,亚洲av无码人妻,四虎国产在线观看 ?

融合項(xiàng)目質(zhì)量與時(shí)間的矩陣分解協(xié)同過濾算法

2022-06-28 02:55:46崔麗莎
軟件導(dǎo)刊 2022年6期
關(guān)鍵詞:用戶質(zhì)量

邵 超,崔麗莎

(河南財(cái)經(jīng)政法大學(xué)計(jì)算機(jī)與信息工程學(xué)院,河南鄭州 450046)

0 引言

20 世紀(jì)90 年代以來,隨著互聯(lián)網(wǎng)和信息技術(shù)的快速發(fā)展,信息量呈現(xiàn)爆炸式增長(zhǎng),人們面對(duì)浩如煙海的信息無所適從。針對(duì)“信息超載”問題,個(gè)性化推薦系統(tǒng)能夠“主動(dòng)”推薦用戶感興趣的信息和資源,并已在電子商務(wù)[1]、視頻音樂推薦[2]等領(lǐng)域廣泛應(yīng)用。現(xiàn)階段,傳統(tǒng)推薦算法主要包括基于關(guān)聯(lián)規(guī)則的推薦(Association Rules Based)[3]、基于內(nèi)容的推薦(Content Based)[4]、協(xié)同過濾推薦(Collaborate Filtering)[5]等。其中,協(xié)同過濾推薦算法是目前應(yīng)用最廣泛的推薦技術(shù)。

協(xié)同過濾推薦又分為基于內(nèi)存(Memory-Based)、基于模型(Model-Based)和混合(Hybrid-CF)的協(xié)同過濾推薦。其中,基于內(nèi)存的協(xié)同過濾推薦通過用戶歷史行為數(shù)據(jù)挖掘用戶偏好,尋找存在共同經(jīng)驗(yàn)的群體推薦用戶感興趣的項(xiàng)目,在此基礎(chǔ)上又可細(xì)分為基于用戶和基于項(xiàng)目?jī)深悺H欢摲椒ù嬖跀?shù)據(jù)稀疏、冷啟動(dòng)、用戶興趣遷移等問題。隨后,提出了基于模型的協(xié)同過濾推薦,該算法在協(xié)同過濾推薦的基礎(chǔ)上,利用機(jī)器學(xué)習(xí)思想建立各類模型進(jìn)行推薦,例如聚類[6]、分類[7]、矩陣分解[8]、神經(jīng)網(wǎng)絡(luò)[9]等。相較于前者,該類方法推薦效果更佳,混合協(xié)同過濾推薦則主要通過融合以上兩種方法進(jìn)行推薦。

目前,改進(jìn)協(xié)同過濾算法主要通過挖掘用戶的潛在偏好,改進(jìn)相似度計(jì)算,優(yōu)化最近鄰選擇以提升推薦質(zhì)量。何明等[10]結(jié)合用戶評(píng)分和項(xiàng)目類型信息構(gòu)建用戶興趣偏好矩陣,基于此對(duì)用戶進(jìn)行聚類。王衛(wèi)紅等[11]引入用戶對(duì)項(xiàng)目類型的平均評(píng)分和用戶屬性構(gòu)建用戶偏好,將其填充后對(duì)用戶進(jìn)行聚類。李志軍[12]引入評(píng)分比例因子和商品屬性改進(jìn)項(xiàng)目相似度計(jì)算,結(jié)合用戶評(píng)分構(gòu)建用戶對(duì)商品的喜好矩陣。以上研究均根據(jù)用戶評(píng)分和項(xiàng)目類型信息構(gòu)建用戶偏好,有助于緩解數(shù)據(jù)稀疏性,提高推薦效果。然而,此類研究并未在產(chǎn)生候選集時(shí)考慮用戶對(duì)項(xiàng)目類型的偏好,忽略了用戶評(píng)分越早對(duì)用戶當(dāng)前偏好的反映程度越低的興趣遷移問題。文獻(xiàn)[13-14]通過引入時(shí)間權(quán)重因子分別改進(jìn)了用戶評(píng)分相似度與物品相似度度量公式,卻未在構(gòu)建用戶偏好時(shí)考慮時(shí)間因素的影響。陸航等[15]引入時(shí)間衰減函數(shù)到標(biāo)簽權(quán)重計(jì)算中,卻忽視了用戶評(píng)分對(duì)用戶偏好的反映程度。文獻(xiàn)[15-16]考慮了項(xiàng)目質(zhì)量對(duì)用戶評(píng)分存在的影響,分別將項(xiàng)目質(zhì)量作為差異影響因子與懲罰因子,優(yōu)化計(jì)算用戶評(píng)分差異相似度與改進(jìn)相似度計(jì)算公式。然而,該類研究?jī)H將項(xiàng)目質(zhì)量應(yīng)用于改進(jìn)相似度計(jì)算中,忽略了項(xiàng)目質(zhì)量可通過影響用戶評(píng)分而影響挖掘用戶偏好。

此外,由于矩陣分解具有良好的可擴(kuò)展性和評(píng)分預(yù)測(cè)準(zhǔn)確性,有助于緩解數(shù)據(jù)稀疏,故而得到廣泛關(guān)注并產(chǎn)生了多種變體。馬瑩雪等[17-18]通過神經(jīng)網(wǎng)絡(luò)學(xué)習(xí)目標(biāo)用戶和項(xiàng)目的特征向量,將其集成在矩陣分解模型上產(chǎn)生預(yù)測(cè)評(píng)分。王運(yùn)等[19-20]利用用戶屬性信息和項(xiàng)目標(biāo)簽信息獲取用戶相似度和項(xiàng)目相似度,將其融入PMF 模型中實(shí)現(xiàn)推薦。Luo 等[21]探尋標(biāo)簽與項(xiàng)目的關(guān)聯(lián),并在矩陣分解中添加時(shí)間影響因子優(yōu)化用戶偏好,取得了良好效果。然而,這些算法仍存在以下不足:①神經(jīng)網(wǎng)絡(luò)模型復(fù)雜且對(duì)數(shù)據(jù)具有依賴性;②僅考慮用戶和項(xiàng)目的屬性信息,忽略了用戶的興趣遷移;③未考慮項(xiàng)目自身質(zhì)量對(duì)評(píng)分的影響。

為解決上述問題,本文提出了一種融合時(shí)間因素、項(xiàng)目質(zhì)量及項(xiàng)目類型信息的矩陣分解協(xié)同過濾算法,首先引入項(xiàng)目評(píng)分標(biāo)準(zhǔn)差作為衡量項(xiàng)目質(zhì)量對(duì)用戶評(píng)分影響程度的質(zhì)量因子,消除由項(xiàng)目自身質(zhì)量產(chǎn)生的評(píng)分誤差,并引入時(shí)間權(quán)重因子反映用戶興趣的動(dòng)態(tài)變化;然后,結(jié)合修正的用戶評(píng)分和項(xiàng)目類型信息獲取用戶當(dāng)前的項(xiàng)目類型偏好,以此產(chǎn)生推薦候選集;最后,基于修正后的用戶——項(xiàng)目評(píng)分,采用矩陣分解預(yù)測(cè)用戶對(duì)候選集中的項(xiàng)目進(jìn)行評(píng)分,將評(píng)分最高的N個(gè)項(xiàng)目推薦給用戶。

本文的主要貢獻(xiàn)有以下3 個(gè)方面:①在用戶項(xiàng)目類型偏好構(gòu)建和評(píng)分預(yù)測(cè)中引入項(xiàng)目評(píng)分標(biāo)準(zhǔn)差,作為衡量影響程度的質(zhì)量因子;②在用戶——項(xiàng)目類型興趣度計(jì)算中引入時(shí)間權(quán)重因子,以獲取用戶當(dāng)前的項(xiàng)目類型偏好;③在候選集生成過程中考慮了用戶當(dāng)前項(xiàng)目類型偏好,以此優(yōu)化候選集。

1 相關(guān)概念

1.1 相關(guān)定義

項(xiàng)目質(zhì)量:項(xiàng)目自身的質(zhì)量屬性。以電影為例,當(dāng)拍攝質(zhì)量較高時(shí),通常會(huì)導(dǎo)致觀眾無論是否喜歡該類型的電影,都會(huì)評(píng)于高分。

時(shí)間因素:用戶的興趣并非一成不變,而是隨著時(shí)間呈動(dòng)態(tài)變化。

用戶對(duì)項(xiàng)目類型的偏好:以電影為例,電影具有多種類型。例如,喜劇、動(dòng)作片等,而用戶對(duì)各種類型的偏好不盡相同。

1.2 用戶興趣變化

傳統(tǒng)協(xié)同過濾算法假定用戶的興趣是固定的,不會(huì)隨著時(shí)間的推移而動(dòng)態(tài)變化,因此將用戶所有的歷史行為看作同等影響力,以此計(jì)算用戶偏好和尋找最近鄰,推薦與目標(biāo)用戶偏好相似的項(xiàng)目。然而,這種假定在現(xiàn)實(shí)生活中并不成立,人們的興趣往往不會(huì)一成不變,而是隨著時(shí)間的推移不斷發(fā)生變化。因此,必須在推薦過程中考慮用戶的興趣變化。

由于用戶興趣會(huì)隨著時(shí)間變化,所以用戶的評(píng)分行為越早,代表用戶偏好與用戶當(dāng)前偏好的一致性就越弱,在當(dāng)前的推薦過程中所占的權(quán)重也越小。因此,為不同時(shí)刻的評(píng)論分配不同的權(quán)重,能夠準(zhǔn)確反映用戶興趣的動(dòng)態(tài)變化,提升推薦質(zhì)量。目前有以下4 種產(chǎn)生時(shí)間權(quán)重的方法[22]:模擬遺忘曲線[23]、建立線性時(shí)間函數(shù)[24]、建立非線性時(shí)間函數(shù)[25]、時(shí)間窗技術(shù)[26]。

1.3 矩陣分解

矩陣分解可在一定程度上緩解傳統(tǒng)基于近鄰模型的數(shù)據(jù)稀疏性等問題,目前在推薦領(lǐng)域已有廣泛應(yīng)用。其基本思想[8]是將一個(gè)高維稀疏的原始用戶——項(xiàng)目評(píng)分矩陣R∈Rn×m分解為兩個(gè)低維潛在特征矩陣,即用戶潛在特征矩 陣P∈Rn×f和項(xiàng)目潛在特征矩陣Q∈Rf×m,如 式(1)所示:

其中,用戶u和項(xiàng)目i的特征向量分別由pu和qi表示,用戶u對(duì)項(xiàng)目i的評(píng)分如式(2)所示:

實(shí)際上,矩陣分解是通過最小化預(yù)測(cè)評(píng)分與實(shí)際評(píng)分的差異以尋找最優(yōu)pu和qi,目標(biāo)函數(shù)如式(3)所示:

2 融合項(xiàng)目質(zhì)量和時(shí)間的矩陣分解推薦算法

隨著時(shí)間變化,用戶對(duì)項(xiàng)目的興趣會(huì)生變化,越早的評(píng)分行為對(duì)用戶當(dāng)前興趣的反映程度越弱。同時(shí),用戶對(duì)項(xiàng)目的評(píng)分在一定程度上也會(huì)受到項(xiàng)目自身質(zhì)量的影響,從而導(dǎo)致用戶興趣偏好的計(jì)算存在偏差,影響推薦效果。基于此,本文在構(gòu)建用戶——項(xiàng)目類型興趣度矩陣和采用矩陣分解預(yù)測(cè)用戶評(píng)分時(shí),引入項(xiàng)目評(píng)分標(biāo)準(zhǔn)差作為衡量項(xiàng)目質(zhì)量影響用戶評(píng)分的質(zhì)量因子,同時(shí)引入融合信息保持期的時(shí)間權(quán)重因子,修正用戶評(píng)分,提高用戶——項(xiàng)目類型興趣度計(jì)算未評(píng)分項(xiàng)的評(píng)分預(yù)測(cè)準(zhǔn)確度。然后,根據(jù)用戶當(dāng)前項(xiàng)目類型偏好優(yōu)化推薦候選集。最后,基于修正后的用戶——項(xiàng)目評(píng)分,采用矩陣分解預(yù)測(cè)用戶對(duì)候選集中項(xiàng)目的評(píng)分,并將top-N 項(xiàng)目推薦給用戶。本文算法主要由3部分組成:①構(gòu)建用戶——項(xiàng)目類型興趣度矩陣;②產(chǎn)生推薦候選集;③預(yù)測(cè)評(píng)分并生成推薦。算法的整體框架如圖1所示。

2.1 構(gòu)建用戶——項(xiàng)目類型興趣度矩陣

準(zhǔn)確獲悉用戶偏好是實(shí)現(xiàn)高質(zhì)量推薦的必要條件,而用戶偏好不僅與用戶歷史評(píng)分相關(guān),與項(xiàng)目類型的聯(lián)系更為密切。例如,用戶1 更喜歡動(dòng)作片、喜劇,用戶2 更喜歡音樂劇、文藝片,因此在推薦過程中應(yīng)針對(duì)不同用戶的偏好,推薦符合的項(xiàng)目。考慮到項(xiàng)目的標(biāo)簽信息中包含項(xiàng)目的類型信息。因此,用戶對(duì)項(xiàng)目的點(diǎn)擊或評(píng)價(jià)行為可在一定程度上反映用戶對(duì)該類項(xiàng)目的偏好態(tài)度。此外,用戶對(duì)項(xiàng)目的實(shí)際評(píng)分可具體反映用戶的偏好程度。基于此,本文根據(jù)用戶——項(xiàng)目評(píng)分和項(xiàng)目類型信息計(jì)算用戶對(duì)項(xiàng)目類型的興趣度,構(gòu)建用戶——項(xiàng)目類型興趣度矩陣(UTI),獲得用戶當(dāng)前項(xiàng)目類型偏好,如式(4)所示:

其中,Inter(u)t表示用戶u對(duì)項(xiàng)目類型t的興趣度,Iu,t表示用戶u評(píng)價(jià)過的且項(xiàng)目類型為t的項(xiàng)目集合,ru,i表示用戶u對(duì)項(xiàng)目i的實(shí)際評(píng)分。如式(4)所示,興趣度Inter(u)t的大小由兩個(gè)因素決定:①項(xiàng)目類型出現(xiàn)的次數(shù);②用戶對(duì)該項(xiàng)目類型的偏好程度。如果一個(gè)項(xiàng)目類型在用戶的歷史評(píng)價(jià)行為中出現(xiàn)頻率越高,越能說明用戶對(duì)該類型感興趣。同理,用戶對(duì)一個(gè)項(xiàng)目類型的評(píng)分越高,說明對(duì)該類型的興趣程度越高。

Fig.1 Algorithm framework圖1 算法框架

然而,由于用戶對(duì)項(xiàng)目類型的興趣會(huì)隨著時(shí)間推移而發(fā)生變化,故用戶對(duì)項(xiàng)目的歷史評(píng)分對(duì)用戶當(dāng)前興趣的反映程度在逐漸下降。此外,項(xiàng)目自身質(zhì)量也會(huì)對(duì)用戶興趣產(chǎn)生影響。例如,用戶1 喜歡動(dòng)作片,不喜歡文藝片,雖然影片1 為文藝片,但是由于該影片劇情扣人心弦、好評(píng)如潮,用戶1 為其評(píng)分5 分,然而該評(píng)分無法證明用戶1 對(duì)文藝片的興趣度為5。因此,需要對(duì)用戶評(píng)分進(jìn)行修正,消除項(xiàng)目質(zhì)量帶來的評(píng)分誤差。

2.1.1 修正用戶——項(xiàng)目評(píng)分

步驟1:引入質(zhì)量因子消除項(xiàng)目質(zhì)量對(duì)用戶評(píng)分產(chǎn)生的偏差。

文獻(xiàn)[16]將項(xiàng)目評(píng)分標(biāo)準(zhǔn)差作為衡量項(xiàng)目質(zhì)量影響用戶評(píng)分的質(zhì)量因子,如式(5)所示。

其中,WQ(i)表示項(xiàng)目i的質(zhì)量因子權(quán)重,Ni表示項(xiàng)目i的評(píng)分總個(gè)數(shù),ri,m表示項(xiàng)目i的第m個(gè)評(píng)分,表示項(xiàng)目i的平均分。項(xiàng)目i的離散性越大,對(duì)用戶偏好的反映程度越高,質(zhì)量權(quán)重也就越大。

項(xiàng)目的評(píng)分越集中,標(biāo)準(zhǔn)差越小,說明項(xiàng)目質(zhì)量對(duì)用戶評(píng)分的影響越大,就越難反映用戶的興趣偏好;反之,項(xiàng)目評(píng)分越分散,說明項(xiàng)目質(zhì)量對(duì)用戶評(píng)分的影響越小,對(duì)用戶興趣偏好的反映程度越高。

本文采用公式(6)消除項(xiàng)目質(zhì)量帶來的用戶評(píng)分偏差。

其中,ru,i'表示修正后用戶u對(duì)項(xiàng)目i的評(píng)分,ru,i表示用戶u對(duì)項(xiàng)目i的原始評(píng)分,WQ(i)則是由公式(5)計(jì)算出的質(zhì)量權(quán)重。

最后,利用如式(7)所示的最小——最大標(biāo)準(zhǔn)化公式將加權(quán)修正后的評(píng)分映射到評(píng)分區(qū)間[1,5],標(biāo)準(zhǔn)化后記為

其中,表示標(biāo)準(zhǔn)化后的評(píng)分,R表示標(biāo)準(zhǔn)化前的評(píng)分,Rmax和Rmin分別表示標(biāo)準(zhǔn)化前評(píng)分的最大值和最小值。

步驟2:引入時(shí)間因子模擬用戶興趣的動(dòng)態(tài)變化。

本文參考文獻(xiàn)[27]建立融合信息保持期的時(shí)間衰減函數(shù),獲得不同時(shí)刻的時(shí)間權(quán)重,如式(8)所示。

其中,λ=表示衰減因子,T0表示信息半衰期,即信息經(jīng)過T0的時(shí)間,影響力減少一半;T'表示信息保持期,即信息在T'時(shí)間內(nèi)影響力保持不變;t=tnow-tu,i,tnow表示用戶u最晚評(píng)分時(shí)間,tu,i表示用戶u對(duì)項(xiàng)目i的評(píng)分時(shí)間。

步驟3:通過公式(9)對(duì)用戶評(píng)分進(jìn)行引入時(shí)間權(quán)重的加權(quán)處理。最后,將加權(quán)修正后的評(píng)分再次利用公式(7)進(jìn)行最小——最大標(biāo)準(zhǔn)化,標(biāo)準(zhǔn)化后記為,即為既消除了項(xiàng)目質(zhì)量的影響,又能夠體現(xiàn)用戶興趣變化的用戶評(píng)分。

2.1.2 構(gòu)建用戶——項(xiàng)目類型興趣度矩陣

步驟1:根據(jù)基于項(xiàng)目質(zhì)量和時(shí)間因素修正的用戶評(píng)分建立用戶——項(xiàng)目評(píng)分矩陣R,如式(10)所示。

假設(shè)現(xiàn)有一組用戶u1、u2、u3、u4對(duì)項(xiàng)目i1、i2、i3的評(píng)分,引入質(zhì)量因子和時(shí)間因子加權(quán)修正后的矩陣R如表1所示。

步驟2:根據(jù)項(xiàng)目所具有的類型信息構(gòu)建項(xiàng)目類型矩陣T,當(dāng)項(xiàng)目i具備類型t時(shí),對(duì)應(yīng)t項(xiàng)的值記為1,否則為0,如式(11)所示。

Table 1 User-item rating matrix(R)表1 用戶——項(xiàng)目評(píng)分矩陣(R)

假設(shè)根據(jù)上述項(xiàng)目i1、i2、i3的類型信息構(gòu)建的項(xiàng)目類型矩陣T如表2所示。

Table 2 Item type matrix(T)表2 項(xiàng)目類型矩陣(T)

步驟3:根據(jù)矩陣R和T構(gòu)建用戶——項(xiàng)目類型興趣度矩陣UTI,具體步驟如下:

Step1:根據(jù)用戶——項(xiàng)目評(píng)分矩陣R獲取用戶評(píng)價(jià)過的項(xiàng)目及評(píng)分。例如,u1評(píng)價(jià)過項(xiàng)目i1,i2和i3,評(píng)分分別為3、5、2。

Step2:根據(jù)項(xiàng)目類型矩陣T獲取每個(gè)項(xiàng)目的類型信息。例如,項(xiàng)目i1擁有t1和t3兩種類型。

Step3:根據(jù)公式(4)計(jì)算用戶——項(xiàng)目類型興趣度。例如,u1對(duì)t1的興趣度為Inter1,1=1 × 3=3;u1對(duì)t2的興趣度為Inter1,2=1 × 5+1 × 2=7;u1對(duì)t3的興趣度為Inter1,3=1×3+1×5=8;u1對(duì)t4的興趣度為Inter1,4=1 × 2=2。

Step4:將Step3 計(jì)算得到的用戶——項(xiàng)目類型興趣度,利用公式(7)進(jìn)行標(biāo)準(zhǔn)化,映射到評(píng)分區(qū)間。以u(píng)1為例,對(duì)各類型的興趣度標(biāo)準(zhǔn)化后分別為:

最后,得到的用戶——項(xiàng)目類型興趣度矩陣UTI如表3所示。

Table 3 User-item type interest matrix(UTI)表3 用戶——項(xiàng)目類型興趣度矩陣(UTI)

由表3 可見,用戶u1對(duì)t2和t3的興趣度很大,而對(duì)t1和t4的興趣度較小,說明用戶u1更加偏好具有t2和t3類型的項(xiàng)目。

2.2 引入項(xiàng)目類型偏好優(yōu)化候選集

考慮到用戶對(duì)不同項(xiàng)目類型具有不同的興趣度,為其推薦感興趣類型的項(xiàng)目可在一定程度上提高推薦的準(zhǔn)確率,滿足用戶的個(gè)性化需求。因此,本文引入用戶對(duì)項(xiàng)目的類型偏好改進(jìn)項(xiàng)目候選集的選擇。具體步驟如下:

步驟1:設(shè)置類型偏好閾值,獲取用戶當(dāng)前項(xiàng)目類型偏好。將參數(shù)θ作為判斷用戶對(duì)項(xiàng)目類型偏好程度的閾值,當(dāng)興趣度≥θ時(shí),說明用戶當(dāng)前對(duì)該項(xiàng)目類型感興趣,反之則說明不感興趣。以閾值作為劃分條件,以便于根據(jù)UTI矩陣獲取每個(gè)用戶當(dāng)前的項(xiàng)目類型偏好。

步驟2:生成符合用戶偏好的候選集。根據(jù)步驟1 步得到的用戶當(dāng)前項(xiàng)目類型偏好,將具有該類屬性的未評(píng)分項(xiàng)目組成推薦候選集。

2.3 矩陣分解預(yù)測(cè)評(píng)分

由于用戶對(duì)項(xiàng)目的原始評(píng)分無法體現(xiàn)用戶的興趣變化,同時(shí)還受到項(xiàng)目質(zhì)量的影響而產(chǎn)生評(píng)分偏差。因此,本文引入質(zhì)量和時(shí)間因子修正后的用戶評(píng)分進(jìn)行矩陣分解,通過尋找用戶、項(xiàng)目的潛在特征向量實(shí)現(xiàn)對(duì)候選集中項(xiàng)目的評(píng)分預(yù)測(cè),并向用戶推薦top-N 項(xiàng)目。

2.4 算法描述

融合時(shí)間因素、項(xiàng)目質(zhì)量和項(xiàng)目類型信息的矩陣分解協(xié)同過濾算法的具體流程如算法1所示。

算法1:融合項(xiàng)目質(zhì)量和時(shí)間因素的矩陣分解協(xié)同過濾算法。

輸入:帶有時(shí)間戳的用戶評(píng)分信息(u.data),項(xiàng)目類型信息(u.item),目標(biāo)用戶u,半衰期T0,信息保持期T',類型偏好閾值θ,矩陣分解潛在特征數(shù)k,推薦列表長(zhǎng)度N。

輸出:針對(duì)目標(biāo)用戶u生成的top-N 推薦列表。

步驟1:引入質(zhì)量和時(shí)間因子修正用戶評(píng)分。根據(jù)公式(9)計(jì)算基于質(zhì)量和時(shí)間加權(quán)后的用戶評(píng)分,并利用公式(7)標(biāo)準(zhǔn)化到評(píng)分區(qū)間,得到修正的用戶——項(xiàng)目評(píng)分

步驟2:構(gòu)建用戶——項(xiàng)目類型興趣度矩陣UTI。分別根據(jù)公式(10)、公式(11)構(gòu)建用戶——項(xiàng)目評(píng)分矩陣R和項(xiàng)目類型矩陣T,再根據(jù)公式(4)計(jì)算用戶對(duì)項(xiàng)目類型的興趣度,并標(biāo)準(zhǔn)化到評(píng)分區(qū)間,構(gòu)建UTI矩陣。

步驟3:根據(jù)步驟2 得到的UTI矩陣,結(jié)合類型偏好閾值θ,獲取用戶u當(dāng)前的項(xiàng)目類型偏好。

步驟4:根據(jù)步驟3 中獲得的用戶項(xiàng)目類型偏好,將具有該類型屬性的未評(píng)分項(xiàng)作為推薦候選集。

步驟5:矩陣分解。將步驟2 中構(gòu)建的矩陣R分解為代表用戶潛在偏好特征的矩陣P和代表項(xiàng)目潛在偏好特征的矩陣Q。

步驟6:預(yù)測(cè)評(píng)分。根據(jù)公式(2),預(yù)測(cè)用戶u對(duì)項(xiàng)目i的評(píng)分。

步驟7:產(chǎn)生top-N 推薦列表。對(duì)于推薦候選集中的所有項(xiàng)目,重復(fù)步驟6,計(jì)算用戶u對(duì)所有候選集中項(xiàng)目的預(yù)測(cè)評(píng)分并排序,并將預(yù)測(cè)評(píng)分最高的top-N 作為推薦列表。

3 實(shí)驗(yàn)分析

3.1 實(shí)驗(yàn)設(shè)置

MovieLens 數(shù)據(jù)集是經(jīng)典電影評(píng)分?jǐn)?shù)據(jù)集,本文使用其中的MovieLens-100K 數(shù)據(jù)集和MovieLens-1M 數(shù)據(jù)集分。

由圖2、圖3 可見,QTW-MFCF 算法的準(zhǔn)確率和召回率別進(jìn)行實(shí)驗(yàn),將其記為M1和M2,對(duì)數(shù)據(jù)集的詳細(xì)描述如表4所示。

Table 4 Description of data sets表4 數(shù)據(jù)集描述

數(shù)據(jù)集一共包含19 種電影類型,本文實(shí)驗(yàn)中使用除unknown 類型外的18 種類型,并將用戶近期20%的評(píng)分?jǐn)?shù)據(jù)作為測(cè)試集,剩下的80%則作為訓(xùn)練集以挖掘用戶偏好。

為了檢驗(yàn)QTW-MFCF 算法的性能,本文將其與傳統(tǒng)基于物品的協(xié)同過濾算法(IBCF)、結(jié)合評(píng)分比例因子和商品屬性的協(xié)同過濾算法(RFIA-CF)[12]、基于用戶評(píng)分偏好模型、融合時(shí)間因素和物品屬性的協(xié)同過濾算法(PTPItem-CF)[14]、融合用戶偏好和物品相似度的概率矩陣分解推薦算法(UPIS-PMF)[19]、融合時(shí)間的矩陣分解協(xié)同過濾算法(MFTWCF)[28]及融合項(xiàng)目質(zhì)量的矩陣分解協(xié)同過濾算法(QW-MFCF)進(jìn)行分析比較實(shí)驗(yàn)。

3.2 實(shí)驗(yàn)指標(biāo)

目前有多個(gè)指標(biāo)可用來評(píng)價(jià)推薦算法的性能,而對(duì)于top-N 推薦則一般采用準(zhǔn)確率(precision)、召回率(recall)及F1值度量,計(jì)算公式如式(12)-式(14)所示。

其中,U表示所有用戶集合,R(u)表示用戶u推薦的top-N 項(xiàng)目列表,T(u)表示測(cè)試集中用戶u的實(shí)際評(píng)價(jià)項(xiàng)目列表。

3.3 結(jié)果分析

QTW-MFCF 算法中一共涉及了4 個(gè)參數(shù),即矩陣分解的潛在特征個(gè)數(shù)k,用戶對(duì)項(xiàng)目類型偏好的閾值θ,信息半衰期T0及信息保持期T',下面分別設(shè)置實(shí)驗(yàn)確定4 個(gè)參數(shù),并在不同推薦列表長(zhǎng)度下與IBCF 算法、RFIA-CF 算法、PTP-Item-CF 算法、UPIS-PMF 算法、MFTWCF 算法和QW-MFCF 算法進(jìn)行性能比較。

3.3.1 潛在特征個(gè)數(shù)k對(duì)實(shí)驗(yàn)結(jié)果的影響

Fig.2 Influence of k on results in M1 dataset圖2 M1數(shù)據(jù)集中潛在特征個(gè)數(shù)k對(duì)結(jié)果的影響

Fig.3 Influence of k on results in M2 dataset圖3 M2數(shù)據(jù)集中潛在特征個(gè)數(shù)k對(duì)結(jié)果的影響

實(shí)驗(yàn)設(shè)置推薦列表長(zhǎng)度N=10,類型偏好閾值θ=3,信息半衰期T0=30,信息保持期T'=3,通過比較不同k值的準(zhǔn)確率和召回率確定最優(yōu)潛在特征個(gè)數(shù)k。首先,實(shí)驗(yàn)以間隔為5 確定最優(yōu)k值范圍;然后,以間隔為1 確定最優(yōu)k值。圖2、圖3 分別給出了潛在特征個(gè)數(shù)k在M1和M2數(shù)據(jù)集上的結(jié)果。隨k的逐漸增大呈現(xiàn)先增大后減小的趨勢(shì)。在M1數(shù)據(jù)集上,當(dāng)k值的取值范圍為[15,20]時(shí),k=19 時(shí)效果最好,準(zhǔn)確率和召回率分別比k=10 時(shí)提高了6.78%和7.62%;在M2數(shù)據(jù)集上,當(dāng)k值的取值范圍為[25,30]時(shí),k=28 時(shí)效果最好,準(zhǔn)確率和召回率分別比k=10 時(shí)提高了11.6% 和21.76%。實(shí)驗(yàn)結(jié)果證實(shí),潛在特征個(gè)數(shù)k的選取對(duì)矩陣分解效果的優(yōu)劣至關(guān)重要,還可看出M1數(shù)據(jù)集的最優(yōu)k值相較M2數(shù)據(jù)集更接近其所包含的電影類型種類,這可能是由于M2數(shù)據(jù)集內(nèi)包含的項(xiàng)目數(shù)量更多,且每個(gè)項(xiàng)目類型屬性不唯一,使項(xiàng)目間存在更多的類型組合差別。

3.3.2 類型偏好閾值θ對(duì)實(shí)驗(yàn)結(jié)果的影響

本文設(shè)置推薦列表長(zhǎng)度N=10,信息半衰期T0=30,信息保持期T'=3,M1和M2數(shù)據(jù)集的潛在特征數(shù)k分別為19和28,比較類型偏好閾值θ分別取1、2、3、4 時(shí)的準(zhǔn)確率和召回率。

Fig.4 Influence of θ on results in M1 dataset圖4 M1數(shù)據(jù)集中類型偏好閾值θ對(duì)結(jié)果的影響

由圖4、圖5 可見,在M1和M2數(shù)據(jù)集上都是θ=2 時(shí)效果最好。M1的準(zhǔn)確率和召回率相較于θ=1 時(shí)分別提高了0.778%和0.428%,而M2的準(zhǔn)確率和召回率則相較于θ=1時(shí)分別提高了1.338%和0.763%。該結(jié)果說明根據(jù)用戶的項(xiàng)目類型偏好對(duì)候選集進(jìn)行優(yōu)化,可進(jìn)一步提高推薦效果。此外,當(dāng)閾值θ>2 后,M1和M2數(shù)據(jù)集的準(zhǔn)確率和召回率都存在明顯的下降趨勢(shì),這主要是因?yàn)殡S著閾值θ的不斷增大,推薦列表中項(xiàng)目的多樣性不斷減小,以致于無法滿足用戶的個(gè)性化需求,造成推薦效果不佳。

Fig.5 Influence of θ on results in M2 dataset圖5 M2數(shù)據(jù)集中類型偏好閾值θ對(duì)結(jié)果的影響

3.3.3 信息半衰期T0對(duì)實(shí)驗(yàn)結(jié)果的影響

本文設(shè)置推薦列表長(zhǎng)度N=10,類型偏好閾值θ=3,信息保持期T'=1,M1和M2數(shù)據(jù)集的潛在特征數(shù)k分別為19和28,信息半衰期T0取值范圍為10~60,間隔為5。

Fig.6 Influence of T0 on results in M1 dataset圖6 M1數(shù)據(jù)集中信息半衰期T0對(duì)結(jié)果的影響

Fig.7 Influence of T0 on results in M2 dataset圖7 M2數(shù)據(jù)集中信息半衰期T0對(duì)結(jié)果的影響

由圖6、圖7 可見,在M1數(shù)據(jù)集上T0=40 時(shí),即時(shí)間經(jīng)過40 天,用戶評(píng)分的影響力衰減為原來的一半時(shí),效果最好;而在M2數(shù)據(jù)集上,當(dāng)T0=15 時(shí)推薦效果最好,說明M2中的用戶興趣遷移現(xiàn)象相較M1更頻繁,而實(shí)際上M2所包含的項(xiàng)目數(shù)量大約為M1的2.5 倍,用戶擁有的選擇性更大,因此興趣遷移更容易發(fā)生。

3.3.4 信息保持期T'對(duì)實(shí)驗(yàn)結(jié)果的影響

本文設(shè)置推薦列表長(zhǎng)度N=10,類型偏好閾值θ=3,信息半衰期T0=30,M1和M2數(shù)據(jù)集的潛在特征數(shù)k分別為19和28,比較不同信息保持期T'下的準(zhǔn)確率和召回率。由圖8、圖9 可見,盡管在M1和M2數(shù)據(jù)集上,算法的準(zhǔn)確率和召回率隨T'增大呈現(xiàn)出不同的變化趨勢(shì),但都當(dāng)T'=3 時(shí)結(jié)果最優(yōu),說明用戶興趣在3 天內(nèi)保持不變,與實(shí)際相符合,具有一定合理性。

Fig.8 Influence of T'on results in M1 dataset圖8 M1數(shù)據(jù)集中信息保持期T'對(duì)結(jié)果的影響

Fig.9 Influence of T'on results in M2 dataset圖9 M2數(shù)據(jù)集中信息保持期T'對(duì)結(jié)果的影響

(5)算法性能對(duì)比

實(shí)驗(yàn)通過設(shè)置不同推薦列表長(zhǎng)度N來比較各算法的準(zhǔn)確率和召回率,以此檢測(cè)算法性能。N的取值范圍為[5,30],間隔為5。

由圖10、圖11 可見,隨著N不斷增大,在兩個(gè)數(shù)據(jù)集上各算法的準(zhǔn)確率均有不同程度的下降,而召回率則相反。其中,本文提出的QTW-MFCF 算法的準(zhǔn)確率和召回率在不同推薦長(zhǎng)度N都最高。表5 給出了在top-10 推薦下,不同數(shù)據(jù)集上各算法的準(zhǔn)確率、召回率及QTW-MFCF算法相對(duì)各對(duì)比算法的提升率。

Fig.10 Performance contrast of each algorithm with different recom?mend lengths N on M1 dataset圖10 M1數(shù)據(jù)集不同推薦列表長(zhǎng)度N下各算法的性能比較

從圖10、圖11及表5可見,在M1和M2數(shù)據(jù)集上,QTW-MFCF 算法推薦效果最好。經(jīng)過實(shí)驗(yàn)證明在推薦過程中利用類型偏好優(yōu)化候選集可獲得更好的推薦準(zhǔn)確度。

Fig.11 Performance contrast of each algorithm with different recom?mend lengths N on M2 dataset圖11 M2數(shù)據(jù)集不同推薦列表長(zhǎng)度N下各算法的性能比較

Table 5 Comparison of precision and recall of each algorithm on dif?ferent data sets表5 不同數(shù)據(jù)集上各算法的準(zhǔn)確率和召回率比較

續(xù)表

4 結(jié)語

本文提出的QTW-MFCF 算法,通過消除項(xiàng)目質(zhì)量影響和融合時(shí)間因素構(gòu)建用戶——項(xiàng)目類型偏好,基于此對(duì)推薦候選集進(jìn)行優(yōu)化。實(shí)驗(yàn)證明,該算法推薦的準(zhǔn)確率和召回率均有所提高,證明了在挖掘用戶偏好時(shí)應(yīng)考慮用戶興趣變化和項(xiàng)目質(zhì)量對(duì)用戶行為的影響,但該算法在提高推薦準(zhǔn)確率的同時(shí),會(huì)損失部分推薦多樣性。因此,下一步將考慮在保持現(xiàn)有推薦準(zhǔn)確率的同時(shí)提高推薦多樣性。例如,在考慮項(xiàng)目類型偏好的同時(shí),增加人與人之間的信任關(guān)系[29]對(duì)用戶行為的影響,并以此擴(kuò)展推薦候選集,提高推薦質(zhì)量。

猜你喜歡
用戶質(zhì)量
“質(zhì)量”知識(shí)鞏固
質(zhì)量守恒定律考什么
做夢(mèng)導(dǎo)致睡眠質(zhì)量差嗎
關(guān)于質(zhì)量的快速Q(mào)&A
關(guān)注用戶
商用汽車(2016年11期)2016-12-19 01:20:16
關(guān)注用戶
商用汽車(2016年6期)2016-06-29 09:18:54
關(guān)注用戶
商用汽車(2016年4期)2016-05-09 01:23:12
質(zhì)量投訴超六成
汽車觀察(2016年3期)2016-02-28 13:16:26
Camera360:拍出5億用戶
100萬用戶
主站蜘蛛池模板: 国产av无码日韩av无码网站| 国产精品亚洲一区二区三区z| 亚洲国产精品一区二区高清无码久久| 亚洲精品动漫| 亚洲欧美精品一中文字幕| 在线观看视频一区二区| 亚洲男人天堂2020| 制服丝袜亚洲| 最新国产麻豆aⅴ精品无| 99热这里都是国产精品| 国产呦视频免费视频在线观看| 女人18毛片水真多国产| 亚洲成av人无码综合在线观看| 免费一级无码在线网站| 亚洲天天更新| 狠狠色综合网| 国产va在线观看免费| 亚洲av色吊丝无码| 免费看美女自慰的网站| 亚洲福利网址| 91九色最新地址| 国产美女无遮挡免费视频网站 | 亚洲欧美不卡视频| 亚洲欧洲天堂色AV| 亚洲成人动漫在线| 在线中文字幕网| 国产日韩精品一区在线不卡 | 国产青榴视频在线观看网站| 亚洲无码久久久久| 欧美成人日韩| 国产69精品久久| 久久夜夜视频| 午夜电影在线观看国产1区| 99热这里只有精品2| 日韩资源站| 中文字幕免费在线视频| 国产美女人喷水在线观看| 久久激情影院| 国产精品女主播| 久久国产拍爱| 婷婷久久综合九色综合88| 国产欧美日韩18| 青青草国产一区二区三区| 天天综合网色中文字幕| 亚洲最新地址| 亚洲欧美日韩高清综合678| 日韩性网站| 亚洲动漫h| 精品国产中文一级毛片在线看| 夜夜拍夜夜爽| 国产SUV精品一区二区| 午夜色综合| 乱码国产乱码精品精在线播放| 亚洲日韩AV无码精品| 五月婷婷综合网| 污网站在线观看视频| 综合久久五月天| 亚洲精品午夜无码电影网| 91无码网站| 亚洲欧洲日韩久久狠狠爱| 国产黄视频网站| 久久9966精品国产免费| 免费国产一级 片内射老| 国产一级做美女做受视频| 色色中文字幕| 狠狠色噜噜狠狠狠狠奇米777 | 亚洲一区网站| 精品中文字幕一区在线| 凹凸精品免费精品视频| 72种姿势欧美久久久久大黄蕉| 成年人福利视频| 激情六月丁香婷婷四房播| 亚洲精品第五页| 996免费视频国产在线播放| 国产美女无遮挡免费视频网站| 免费看久久精品99| 欧美国产在线精品17p| 美美女高清毛片视频免费观看| 欧美成人一区午夜福利在线| 欧美一级黄色影院| 久久婷婷五月综合97色| 久久精品人人做人人爽|