999精品在线视频,手机成人午夜在线视频,久久不卡国产精品无码,中日无码在线观看,成人av手机在线观看,日韩精品亚洲一区中文字幕,亚洲av无码人妻,四虎国产在线观看 ?

基于評(píng)分相似性的群稀疏矩陣分解推薦算法

2017-07-31 17:47:29王保云
計(jì)算機(jī)應(yīng)用 2017年5期
關(guān)鍵詞:特征用戶

盛 偉,王保云,何 苗,余 英

(云南師范大學(xué) 信息學(xué)院,昆明 650500)

基于評(píng)分相似性的群稀疏矩陣分解推薦算法

盛 偉,王保云*,何 苗,余 英

(云南師范大學(xué) 信息學(xué)院,昆明 650500)

(*通信作者電子郵箱wspbmly@163.com)

如何提高系統(tǒng)的推薦精度,是當(dāng)前推薦系統(tǒng)面臨的重要問題。對(duì)矩陣分解模型進(jìn)行了研究,針對(duì)評(píng)分?jǐn)?shù)據(jù)的群結(jié)構(gòu)性問題,提出了一種基于評(píng)分相似性的群稀疏矩陣分解模型(SSMF-GS)。首先,根據(jù)用戶的評(píng)分行為對(duì)評(píng)分?jǐn)?shù)據(jù)矩陣進(jìn)行分群,獲得相似用戶群評(píng)分矩陣;然后,通過SSMF-GS算法對(duì)相似用戶群評(píng)分矩陣進(jìn)行群稀疏矩陣分解;最后,采用交替優(yōu)化算法對(duì)模型進(jìn)行求解。所提模型可以篩選出不同用戶群的偏好潛在項(xiàng)目特征,提升了潛在特征的可解釋性。在GroupLens網(wǎng)站上提供的MovieLens數(shù)據(jù)集上進(jìn)行仿真實(shí)驗(yàn),實(shí)驗(yàn)結(jié)果表明,所提算法可以顯著提高預(yù)測(cè)精度,平均絕對(duì)誤差(MAE)及均方根誤差(RMSE)指標(biāo)均表現(xiàn)出良好的性能。

群稀疏;矩陣分解;L2,1范數(shù)正則化;潛在特征

0 引言

隨著Internet的快速發(fā)展,數(shù)據(jù)資源每天以幾何數(shù)量級(jí)增加,在如今電子商務(wù)蓬勃發(fā)展的時(shí)代,賣家提供的商品種類和數(shù)量非常龐大,如何快速有效地找到最需要的商品成為消費(fèi)者的一個(gè)難題。在這種背景下,推薦系統(tǒng)(Recommender System, RS)應(yīng)運(yùn)而生,它能夠?yàn)橄M(fèi)者推薦潛在喜歡的商品。協(xié)同過濾(Collaborative Filtering, CF)方法[1]是推薦系統(tǒng)中應(yīng)用比較廣泛的技術(shù),其主要分為兩類:基于記憶(memory-based)和基于模型(model-based)?;谟洃浀乃惴ㄍㄟ^分析用戶的歷史喜好信息,尋找相似的用戶或項(xiàng)目,然后根據(jù)這些相似的用戶或項(xiàng)目對(duì)目標(biāo)用戶的喜好程度進(jìn)行預(yù)測(cè),如K近鄰算法(K-Nearest Neighbor,KNN)。真實(shí)的購(gòu)買環(huán)境中,用戶不可能對(duì)每一個(gè)項(xiàng)目進(jìn)行評(píng)分,導(dǎo)致評(píng)分?jǐn)?shù)據(jù)極度稀疏。當(dāng)沒有足量的評(píng)分可用時(shí),基于記憶的方法很難提供準(zhǔn)確的預(yù)測(cè)[2]?;谀P偷乃惴ㄖ饕靡延杏脩粝埠眯畔ⅲ?xùn)練出一個(gè)推薦模型進(jìn)行推薦,如基于矩陣分解[3-4]、概率模型[5]、圖模型[6]算法等。

矩陣分解推薦算法是一類實(shí)現(xiàn)簡(jiǎn)單、預(yù)測(cè)精度高的CF推薦技術(shù)。它的目標(biāo)是將原始評(píng)分矩陣分解為兩個(gè)低維度的潛在特征矩陣,這在一定程度上改善了數(shù)據(jù)稀疏性問題[7]。Koren等[3]詳述了矩陣分解算法在推薦系統(tǒng)中的應(yīng)用,這些算法在一定程度上提高了推薦精度,但沒有考慮評(píng)分?jǐn)?shù)據(jù)的群結(jié)構(gòu)性問題。Salakhutdinov 等[4]提出了一種概率矩陣分解推薦算法,該算法較好地解決了冷啟動(dòng)問題,但也沒有考慮評(píng)分?jǐn)?shù)據(jù)的群結(jié)構(gòu)性問題。Yuan等[8]提出了一種群稀疏矩陣分解推薦算法,該算法能夠挖掘多種類型的評(píng)分?jǐn)?shù)據(jù)信息,但其僅針對(duì)評(píng)分?jǐn)?shù)據(jù)具有列相關(guān)性的問題。

在推薦系統(tǒng)中,輸入數(shù)據(jù)往往是一種類型的評(píng)分矩陣,比如常見的圖書評(píng)分矩陣、電影評(píng)分矩陣等?,F(xiàn)實(shí)生活中,用戶可以分為不同的群體,同一個(gè)群體內(nèi)的用戶通常具有相似的興趣愛好,而評(píng)分矩陣中的一行表示一個(gè)用戶的評(píng)分行為,這使得評(píng)分矩陣的行具有很高的相關(guān)性。本文主要利用群稀疏約束將評(píng)分矩陣的群聚性轉(zhuǎn)化為用戶群與潛在特征的關(guān)系。以電影推薦系統(tǒng)為例,用戶群與潛在電影特征的關(guān)系如表1所示,存在3類觀影群體:年輕觀眾u1,女性觀眾u2,男性觀眾u3,每部電影用4個(gè)潛在特征來表示:恐怖、喜劇、動(dòng)作和愛情。從表1中可以看出,u1選擇潛在特征{1}和{2};u2偏好潛在特征{2}和{4};u3喜好潛在特征{1}和{3}。本文的目的是根據(jù)評(píng)分相似性從評(píng)分矩陣中找出這3類群體,并篩選出它們喜好的潛在特征,而傳統(tǒng)的矩陣分解模型忽略了這些信息,這在一定程度上降低了推薦信息的利用率。

表1 用戶群與潛在電影特征的關(guān)系Tab. 1 Relationship between user groups and latent movie features

本文針對(duì)評(píng)分?jǐn)?shù)據(jù)的群結(jié)構(gòu)性問題,提出了一種基于評(píng)分相似性的群稀疏矩陣分解推薦算法(Score Similarity based Matrix Factorization recommendation algorithm with Group Sparsity,SSMF-GS)。該算法首先根據(jù)評(píng)分的相似性對(duì)用戶進(jìn)行分群;然后在矩陣分解過程中利用L2,1范數(shù)訓(xùn)練得到一個(gè)群稀疏的潛在用戶特征矩陣;最后通過潛在用戶特征矩陣和潛在項(xiàng)目特征矩陣的內(nèi)積進(jìn)行評(píng)分預(yù)測(cè)為目標(biāo)用戶產(chǎn)生推薦。該方法可以自動(dòng)篩選出不同用戶群的共有潛在項(xiàng)目特征和私有潛在項(xiàng)目特征,共有潛在特征表示用戶群之間的聯(lián)系,私有潛在特征則表示用戶群之間的差異。實(shí)驗(yàn)結(jié)果證明本文算法具有較好的預(yù)測(cè)精度。

1 相關(guān)工作

1.1 矩陣分解推薦算法

設(shè)用戶全集為U={u1,u2,…,um},項(xiàng)目全集為V={v1,v2,…,vm},m表示用戶數(shù)量,n表示項(xiàng)目數(shù)量。記U中用戶ui對(duì)項(xiàng)目vj的評(píng)分為rij,rij=0表示用戶ui對(duì)項(xiàng)目vj沒有評(píng)分,完整的用戶-項(xiàng)目評(píng)分矩陣如表2所示。

表2 用戶-項(xiàng)目評(píng)分矩陣Tab. 2 User-Item rating matrix

協(xié)同過濾推薦系統(tǒng)中矩陣分解的思想是把評(píng)分矩陣分解為兩個(gè)低維數(shù)的矩陣p∈Rk*m和q∈Rk*n,它們分別用于描述用戶特征和項(xiàng)目特征。用戶和項(xiàng)目之間的評(píng)分關(guān)系可以通過這些潛在特征向量的內(nèi)積來建模,如式(1)所示:

(1)

(2)

其中:λ表示正則化系數(shù),K表示已有評(píng)分集合,λ(‖pi‖2+‖qj‖2)被用來防止訓(xùn)練過擬合。上述模型求解可以應(yīng)用隨機(jī)梯度下降(Stochastic Gradient Descent, SGD)法和交替最小二乘迭代(Alternating Least Squares, ALS) 法。

1.2 群稀疏表示

稀疏表示(Sparse Representation)在圖像分類及圖像恢復(fù)等很多實(shí)際應(yīng)用中表現(xiàn)出非常良好的性能,因而受到廣泛的關(guān)注。稀疏表示模型一般采用L1范數(shù)來度量稀疏性,沒有考慮稀疏數(shù)據(jù)的群結(jié)構(gòu)性。在很多實(shí)際應(yīng)用中,數(shù)據(jù)矩陣本質(zhì)上具有群結(jié)構(gòu)的特性。比如,相同題材的新聞可以組成一個(gè)群,不同主題的文檔形成不同的群等。群稀疏表示模型[9]主要考慮的是稀疏數(shù)據(jù)的群結(jié)構(gòu)性, 它將稀疏數(shù)據(jù)進(jìn)行分群, 分別考慮每個(gè)群的稀疏先驗(yàn),其主要采用L2,1范數(shù)來度量稀疏性。文獻(xiàn)[10]將L2,1范數(shù)應(yīng)用于有效圖像特征選擇。文獻(xiàn)[11]利用L2,1范數(shù)定位采樣服務(wù)質(zhì)量(Quality of Service, QoS)信息中的結(jié)構(gòu)化噪聲行。本文主要將L2,1范數(shù)應(yīng)用于群稀疏表示潛在用戶特征矩陣。對(duì)于任意矩陣X∈Rk*m,其L2,1范數(shù)定義如式(3)所示:

(3)

2 群稀疏矩陣分解推薦算法

2.1 評(píng)分預(yù)測(cè)問題建模

上述式(2)正則化矩陣分解模型并沒有考慮到評(píng)分矩陣的群結(jié)構(gòu)特性,是一種全局優(yōu)化的學(xué)習(xí)過程。本文算法在保持矩陣分解算法優(yōu)點(diǎn)的同時(shí),將用戶群結(jié)構(gòu)先驗(yàn)融入到矩陣分解過程中,得到一個(gè)群稀疏的潛在用戶特征矩陣。最后通過潛在用戶特征矩陣和潛在項(xiàng)目特征矩陣的內(nèi)積對(duì)每個(gè)用戶群內(nèi)的用戶進(jìn)行評(píng)分預(yù)測(cè)。

在協(xié)同過濾推薦系統(tǒng)中,輸入數(shù)據(jù)通常用一個(gè)如表2所示的用戶-項(xiàng)目評(píng)分矩陣R來表示。R中的一行表示某一個(gè)用戶對(duì)所有物品的評(píng)分,可以看作該用戶的一個(gè)評(píng)分行為向量?,F(xiàn)實(shí)生活中,許多用戶具有相同的興趣愛好,這使他們的評(píng)分行為高度相似。本文根據(jù)用戶的評(píng)分信息將用戶集合U劃分成C個(gè)用戶群,即:U=(u1,u2,…,uC),每個(gè)用戶群對(duì)應(yīng)一個(gè)評(píng)分矩陣,即:R=(R1,R2,…,RC)。對(duì)用戶進(jìn)行分群,實(shí)際上是一種聚類問題,屬于同一簇的用戶自然被劃分到同一個(gè)群。目前的聚類方法有很多,主要有k-means、近鄰傳播(Affinity Propagation,AP)聚類[12]等。由于聚類算法不是研究的重點(diǎn),所以本文采用簡(jiǎn)單高效的k-means算法對(duì)用戶進(jìn)行基本聚類。

(4)

如圖1基于評(píng)分相似性的群稀疏矩陣分解所示,原始評(píng)分矩陣被劃分為3部分:R1、R2和R3,分別對(duì)應(yīng)評(píng)分用戶群u1、u2和u3,分解后得到的群稀疏潛在用戶特征矩陣為pc(c=1,2,3)(pc中灰色和白色行分別表示1和0)。由式(4)可知,pc中值為1的行可以篩選出uc用戶群的偏好潛在特征。從圖1可以看出,為u1、u2和u3篩選出的潛在項(xiàng)目特征分別為{1,2,3},{1,2,4}和{1,3,4}。比較u1和u2偏好的潛在特征,{1,2}是兩個(gè)用戶群的共有潛在特征,{3}和{4}是各自的私有潛在特征。通過對(duì)pc(c=1,2,3)施加群稀疏約束,本文算法能夠?qū)W習(xí)到這些不同用戶群間的共有和私有潛在特征。

圖1 基于評(píng)分相似性的群稀疏矩陣分解Fig. 1 Score similarity based matrix factorization with group sparsity

基于上述對(duì)矩陣分解和群稀疏的分析,本文引入L2,1范數(shù)正則化項(xiàng)到矩陣分解模型中,將評(píng)分預(yù)測(cè)問題建模為如下問題:

(5)

2.2 模型求解

由于目標(biāo)函數(shù)L(p,q)含有兩個(gè)變量,無法直接進(jìn)行求解,為了避免同時(shí)存在多個(gè)變量,本文采用交替優(yōu)化方法將式(5)分解成下述子問題交替求解變量pc和q:

(6)

(7)

(8)

(9)

其中E是一個(gè)k×k的單位矩陣。

固定p求解q類似地,L(q)對(duì)q.j求導(dǎo),并令求導(dǎo)結(jié)果等于0,可得:

(10)

綜上,本文將問題(5)的求解過程命名為基于評(píng)分相似性的群稀疏矩陣分解推薦算法(SSMF-GS),詳細(xì)步驟如算法1所示。

算法1 評(píng)分相似性的群稀疏矩陣分解推薦算法。

Input:聚類后評(píng)分矩陣Rc(c=1,2,…,C)參數(shù)βc,γ,λ

1)

initialize:pc(c=1,2,…,C),q

2)

fork=1 toK

3)

forc=1 toC

4)

5)

end for

6)

forc=1 toC

7)

8)

end for

9)

通過式(10)更新q.j;

10)

end for Output:pc(c=1,2,…,C),q

3 實(shí)驗(yàn)驗(yàn)證

3.1 實(shí)驗(yàn)設(shè)置

本文實(shí)驗(yàn)數(shù)據(jù)采用Movielens-100k數(shù)據(jù)集(http://grouplens.org/datasets/movielens/),包含943個(gè)用戶對(duì)1 682部電影的評(píng)分,共100 000條評(píng)分記錄,評(píng)分區(qū)間為1~5分。為了全面地評(píng)價(jià)推薦模型,本文在3種訓(xùn)練集上(80%、60%、40%)做了相關(guān)實(shí)驗(yàn)來驗(yàn)證SSMF-GS算法在不同稀疏情形下的性能。比如,80%的訓(xùn)練集是從原始評(píng)分矩陣中隨機(jī)選取80%的評(píng)分?jǐn)?shù)據(jù)作為訓(xùn)練集,剩余的20%作為測(cè)試集。

3.2 度量標(biāo)準(zhǔn)

預(yù)測(cè)精度可以度量出真正評(píng)分和預(yù)測(cè)評(píng)分之間的接近程度,本文選擇平均絕對(duì)方差(Mean Absolute Error, MAE)和均方根誤差(Root Mean Squared Error, RMSE)作為預(yù)測(cè)精度的評(píng)價(jià)指標(biāo)。

(11)

(12)

3.3 結(jié)果及分析

為了驗(yàn)證本文算法的預(yù)測(cè)性能,將其應(yīng)用于電影評(píng)分預(yù)測(cè),并與基于用戶的K近鄰(User-basedK-Nearest Neighbors,UserKNN)[13]算法、矩陣填充(Matrix Completion, MC)[14]算法、概率矩陣分解(Probabilistic Matrix Factorization, PMF)[4]算法和正則化的矩陣分解(Regularized Matrix Factorization, RMF)[3]算法進(jìn)行比較。

在UserKNN中,主要參數(shù)設(shè)置為目標(biāo)用戶的鄰居數(shù)目e=10。在RMF模型中,主要參數(shù)設(shè)置為潛在特征維度k=5,正則化系數(shù)λ=0.01。MC算法的實(shí)現(xiàn)代碼下載于http://perception.csl.illinois.edu/matrix-rank/Files/inexact_alm_mc.zip,其參數(shù)按照設(shè)計(jì)者的方法設(shè)置。PMF算法的實(shí)現(xiàn)代碼下載于http://www.cs.toronto.edu/~rsalakhu/BPMF.html,主要參數(shù)設(shè)置為潛在特征維度k=5,正則化系數(shù)λ1=λ2=0.01。在SSMF-GS中,固定用戶群數(shù)目為50,主要參數(shù)設(shè)置為潛在特征維度k=5,正則化系數(shù)λ=0.08,為簡(jiǎn)單起見βc(c=1,2,…,50)=1,80%訓(xùn)練集中γ=120,60%訓(xùn)練集中γ=120,40%訓(xùn)練集中γ=150。文本利用Matlab(2014b)進(jìn)行相關(guān)實(shí)驗(yàn),實(shí)現(xiàn)結(jié)果如表3所示。

表3 不同稀疏度情形下預(yù)測(cè)精度比較Tab. 3 Comparison of prediction accuracy under different sparsity

從表3中可以看出,基于矩陣分解的兩種算法PMF和RMF預(yù)測(cè)精度明顯優(yōu)于基于記憶算法的UserKNN,這與上述對(duì)它們的分析是吻合的,在數(shù)據(jù)非常稀疏的情況下,基于記憶的算法無法找到足量的相似用戶,導(dǎo)致預(yù)測(cè)精度較差。隨著訓(xùn)練數(shù)據(jù)集稀疏度的增加,幾種算法的預(yù)測(cè)性能也在下降,在40%的訓(xùn)練集中PMF和RMF預(yù)測(cè)精度優(yōu)勢(shì)并不是十分明顯,這表明基于矩陣分解的算法也受到了數(shù)據(jù)稀疏性的制約。本文算法融入了評(píng)分?jǐn)?shù)據(jù)中相似用戶群的評(píng)分信息,相對(duì)于其他幾種算法,SSMF-GS算法在預(yù)測(cè)精度上得到了顯著提升。

本文隨機(jī)抽取2個(gè)用戶群的潛在特征向量進(jìn)行分析。由于每個(gè)用戶群的用戶數(shù)量不等,本文選取用戶群的前5個(gè)用戶,潛在用戶特征數(shù)向量中值為0的用叉號(hào)表示,值不為0的用圓圈表示。從圖2可以看出,用戶群1偏好潛在特征為{1,2,3,4},用戶群2偏好的潛在特征為{1,2,3}。其中{1,2,3}為共有潛在特征,{4}為用戶群1的私有潛在特征。這表明在真實(shí)數(shù)據(jù)中,本文算法能夠?yàn)椴煌挠脩羧汉Y選出共有和私有潛在特征,這也和上述圖2分析一致。

圖2 用戶群的潛在特征向量Fig. 2 Latent feature vector of user group

3.4 參數(shù)γ的影響

參數(shù)γ為群稀疏正則化系數(shù),在SSMF-GS算法中扮演了重要的角色。如果γ取值過小,則無法區(qū)分不同用戶群的潛在項(xiàng)目特征;如果γ取值過大,潛在項(xiàng)目特征矩陣則會(huì)產(chǎn)生過多的0行,導(dǎo)致極少的潛在項(xiàng)目特征被篩選出來。參數(shù)γ對(duì)MAE和RMSE的影響見圖3和圖4。

圖3 參數(shù)γ對(duì)RMSE的影響Fig. 3 Impact of parameter γ on RMSE

圖4 參數(shù)γ對(duì)MAE的影響Fig. 4 Impact of parameter γ on MAE

從圖4和圖5可以看出,80%及40%訓(xùn)練集中γ為120,20%訓(xùn)練集中γ為150時(shí),RMSE及MAE最低,算法預(yù)測(cè)精度最優(yōu)。

4 結(jié)語

矩陣分解推薦算法能有效地改善評(píng)分?jǐn)?shù)據(jù)稀疏性問題,而群稀疏表示能夠挖掘評(píng)分?jǐn)?shù)據(jù)呈現(xiàn)出的特殊群結(jié)構(gòu)。結(jié)合兩者的優(yōu)點(diǎn),提出一種基于評(píng)分相似性的群稀疏矩陣分解推薦算法,該算法群稀疏表示潛在用戶特征矩陣,為用戶群篩選出共有和私有潛在項(xiàng)目特征,通過潛在用戶特征向量和潛在項(xiàng)目特征向量的內(nèi)積來預(yù)測(cè)用戶群中用戶對(duì)項(xiàng)目的評(píng)分形成推薦結(jié)果。與其他幾種推薦算法相比,本文算法獲得了更好的預(yù)測(cè)精度。

References)

[1] 冷亞軍, 陸青, 梁昌勇. 協(xié)同過濾推薦技術(shù)綜述[J].模式識(shí)別與人工智能, 2014, 27(8): 720-734.(LENG Y J, LU Q, LIANG C Y. Survey of recommendation based on collaborative filtering[J]. Pattern Recognition and Artificial Intelligence, 2014, 27(8): 720-734.)

[2] PAGARE R, PATIL S A. Study of collaborative filtering recommendation algorithm-scalability issue[J]. International Journal of Computer Applications, 2013, 67(25):10-15.

[3] KOREN Y, BELL R, VOLINSKY C. Matrix factorization tech-niques for recommender systems[J]. Computer, 2009, 42(8): 30-37.

[4] SALAKHUTDINOV B R, MNIH A. Probabilistic matrix factorization[C]// Proceedings of the 21st Annual Conference on Neural Information Processing Systems. New York: Curran Associate Inc,2008:1257-1264.

[5] ZHANG Y, KOREN J. Efficient Bayesian hierarchical user modeling for recommendation system[C]// Proceedings of the 30th Annual International ACM SIGIR Conference on Research and Development in Information Retrieval. New York: ACM, 2007: 47-54.

[6] PHAM T A N, LI X, CONG G, et al. A general graph-based model for recommendation in event-based social networks[C]// Proceedings of the 2015 IEEE 31st International Conference on Data Engineering. Piscataway, NJ: IEEE, 2015: 567-578.

[7] BOKDE D, GIRASE S, MUKHOPADHYAY D. Matrix factorization model in collaborative filtering algorithms: a survey [J]. Procedia Computer Science, 2015, 49(1):136-146.

[8] YUAN T, CHENG J, ZHANG X, et al. Recommendation by mining multiple user behaviors with group sparsity[EB/OL]. [2016-10-11]. http://www.aaai.org/ocs/index.php/AAAI/AAAI14/paper/download/8267/8424.

[9] HUANG J, ZHANG T. The benefit of group sparsity[J]. The Annals of Statistics, 2010, 38(4): 1978-2004.

[10] 鄭秋中, 徐軍. 一種基于群稀疏特征選擇的圖像檢索方法[J]. 計(jì)算機(jī)應(yīng)用研究, 2014, 31(9):2867-2872.(ZHENG Q Z, XU J. Group sparse based feature selection for image retrieval [J]. Application Research of Computers, 2014, 31(9):2867-2872.)

[11] 陳蕾, 楊庚, 陳正宇,等. 基于結(jié)構(gòu)化噪聲矩陣補(bǔ)全的Web服務(wù)QoS預(yù)測(cè)[J]. 通信學(xué)報(bào), 2015, 36(6):49-59. (CHEN L, YANG G, CHEN Z Y, et al. Web services QoS prediction via matrix completion with structural noise [J]. Journal on Communications, 2015, 36(6):49-59.)

[12] FREY B J, DUECK D. Clustering by passing messages between data points[J]. Science, 2007, 315(5814): 972-976.

[13] BREESE J S, HECKERMAN D, KADIE C. Empirical analysis of predictive algorithms for collaborative filtering[C]// Proceedings of the 14th Conference on Uncertainty in Artificial Intelligence. San Francisco, CA: Morgan Kaufmann Publishers, 1998: 43-52.

[14] LIN Z, CHEN M, MA Y. The augmented lagrange multiplier method for exact recovery of corrupted low-rank matrices[EB/OL]. [2016-10-11].https://arxiv.org/pdf/1009.5055v3.pdf.

This work is partially supported by the Scientific Research Foundation of Education Department of Yunnan Province (2014Y145), the Philosophical and Social Science Program of Yunnan Province (QN2015067), the Doctoral Research Starting Foundation of Yunnan Normal University (01000205020503064).

SHENG Wei, born in 1988, M. S. candidate. His research interests include recommender system.

WANG Baoyun, born in 1977, Ph. D., lecturer. His research interests include machine learning.

HE Miao, born in 1990, M. S. candidate. Her research interests include machine learning.

YU Ying, born in 1965, M. S., associate professor. Her research interests include network communication.

Score similarity based matrix factorization recommendation algorithm with group sparsity

SHENG Wei, WANG Baoyun*, HE Miao,YU Ying

(SchoolofInformationScienceandTechnology,YunnanNormalUniversity,KunmingYunnan650500,China)

How to improve the accuracy of recommendation is an important issue for the current recommendation system. The matrix decomposition model was studied, and in order to exploit the group structure of the rating data, a Score Similarity based Matrix Factorization recommendation algorithm with Group Sparsity (SSMF-GS) was proposed. Firstly, the scoring matrix was divided into groups according to the users’ rating behavior, and the similar user group scoring matrix was obtained. Then, similar users’ rating matrix was decomposed in group sparsity by SSMF-GS algorithm. Finally, the alternating optimization algorithm was applied to optimize the proposed model. The latent item features of different user groups could be filtered out and the explanability of latent features was enhanced by the proposed model. Simulation experiments were tested on MovieLens datasets provided by GroupLens website. The experimental results show that the proposed algorithm can improve recommendation accuracy significantly, and the Mean Absolute Error (MAE) and Root Mean Squared Error (RMSE) both have good performance.

group sparsity; matrix factorization;L2,1-norm regularization; latent feature

2016-10-13;

2016-12-21。 基金項(xiàng)目:云南省教育廳科學(xué)研究基金資助項(xiàng)目(2014Y145);云南省哲學(xué)社會(huì)科學(xué)規(guī)劃項(xiàng)目(QN2015067);云南師范大學(xué)博士啟動(dòng)基金資助項(xiàng)目(01000205020503064)。

盛偉(1988—),男,江蘇豐縣人,碩士研究生,主要研究方向:推薦系統(tǒng); 王保云(1977—),男,云南玉溪人,講師,博士,主要研究方向:機(jī)器學(xué)習(xí); 何苗(1990—),女,云南曲靖人,碩士研究生,主要研究方向:機(jī)器學(xué)習(xí); 余英(1965—),女,云南昆明人,副教授,碩士,主要研究方向:網(wǎng)絡(luò)通信。

1001-9081(2017)05-1397-05

10.11772/j.issn.1001-9081.2017.05.1397

TP181

A

猜你喜歡
特征用戶
抓住特征巧觀察
新型冠狀病毒及其流行病學(xué)特征認(rèn)識(shí)
如何表達(dá)“特征”
不忠誠(chéng)的四個(gè)特征
抓住特征巧觀察
關(guān)注用戶
商用汽車(2016年11期)2016-12-19 01:20:16
關(guān)注用戶
商用汽車(2016年6期)2016-06-29 09:18:54
關(guān)注用戶
商用汽車(2016年4期)2016-05-09 01:23:12
Camera360:拍出5億用戶
100萬用戶
主站蜘蛛池模板: 中文天堂在线视频| 无码乱人伦一区二区亚洲一| 欧洲高清无码在线| 国产一二三区在线| 91美女视频在线| 精品国产免费观看| 久久精品无码国产一区二区三区| 国产激情影院| 亚洲成aⅴ人在线观看| 久久a毛片| 综合亚洲网| 99久久精品国产精品亚洲| 91久久偷偷做嫩草影院| 国产在线精彩视频二区| 亚洲精品欧美重口| 国产激情无码一区二区三区免费| 成人在线第一页| 国产中文一区a级毛片视频| 777午夜精品电影免费看| 丝袜久久剧情精品国产| 伊人成人在线| 国产无码精品在线播放| 国产91蝌蚪窝| 亚洲精品第五页| 国产91精品久久| 中文字幕一区二区视频| 91精品综合| 亚洲永久视频| 久久女人网| 伊人AV天堂| 日韩第九页| 99精品福利视频| 在线国产毛片| 亚洲国产精品一区二区第一页免| 欧美天堂在线| 日韩欧美国产另类| 激情爆乳一区二区| 亚洲国产精品一区二区高清无码久久| 精品丝袜美腿国产一区| 国产在线视频自拍| 在线网站18禁| 国产亚洲一区二区三区在线| 欧美激情综合一区二区| 日韩AV无码免费一二三区| 色偷偷一区二区三区| 欧美视频二区| 精久久久久无码区中文字幕| 国产爽歪歪免费视频在线观看| 成人午夜久久| 怡红院美国分院一区二区| 精品91视频| 国产va视频| 亚洲精品视频网| 人妻一区二区三区无码精品一区| 精品在线免费播放| 日韩欧美视频第一区在线观看| 性视频一区| 精品少妇人妻无码久久| 99ri精品视频在线观看播放| 亚洲综合精品第一页| AV天堂资源福利在线观看| 麻豆精品久久久久久久99蜜桃| 曰AV在线无码| 国产无人区一区二区三区| 一级爆乳无码av| 久久情精品国产品免费| 国产欧美在线观看精品一区污| 国产精品内射视频| 成·人免费午夜无码视频在线观看| 亚洲精品无码久久毛片波多野吉| 亚洲 欧美 偷自乱 图片| 午夜国产理论| 免费无码又爽又黄又刺激网站| 国产成人无码Av在线播放无广告| 国产在线一区二区视频| 老司机午夜精品视频你懂的| 亚洲一级毛片在线观| 欧美成人精品在线| 国产精品99一区不卡| 欧美成人a∨视频免费观看| 亚洲综合亚洲国产尤物| 国产精品永久在线|