沈 杰,喬少杰,2,韓 楠,元昌安,許源平,覃 曉,王玨嵐
(1.成都信息工程大學,成都 610225;2.軟件自動生成與智能服務四川省重點實驗室,成都 610225;3.廣西教育學院,南寧 530007;4.南寧師范大學,南寧 530299;5.四川省醫學科學院·四川省人民醫院,電子科技大學附屬醫院,成都 610072)
隨著人工智能、云計算與大數據技術以及移動互聯網等先進技術的迅速發展,各種信息數據的規模也呈現爆炸式的增長[1]。在享受這些數據帶來的便利的同時,需要處理數據量過大而導致的“信息過載”問題。推薦系統則正是解決“信息過載”問題的有效方法之一,可以根據用戶以及項目(item)的相關屬性找到用戶的興趣點,并且將用戶感興趣的項目以個性化目錄的方式推薦給用戶[2]。
目前,基于協同過濾的推薦系統考慮到用戶與項目的歷史交互,然后根據其潛在特征為用戶提出推薦建議,已經取得一些效果[3]。但是基于協同過濾的推薦系統通常會面臨用戶和商戶歷史交互數據的稀疏性問題及伴隨的冷啟動問題。為了解決這些局限性,研究人員將諸如用戶/項目屬性[4]、社交網絡[5]、圖像[6]、背景[7]等輔助信息納入基于協同過濾的推薦系統。
在各種輔助信息中,知識圖譜(knowledge graph,KG)由于其具有效率極高的事實描述能力以及可解釋項目之間的關聯信息,得到研究人員的廣泛關注。知識圖譜是一種定向異構圖,其中節點對應于實體,邊對應于關系。研究人員已經提出了諸多知識圖譜,例如:NELL、Dbpedia、以及諸如Google Knowledge Graph和Microsoft Satori的商業知識圖譜。這些知識圖譜已成功應用于多個領域,例如知識圖譜填充[8]、人機問答[9]、單詞嵌入(word embedding)[10]和文本分類[11]。
深度學習是當前互聯網和人工智能的一個研究熱點[12]。深度學習主要是通過將低層的屬性特征生成高層語義抽象,自動挖掘出數據的分布式特征表示,解決了傳統機器學習中需要人工設計特征的問題,在圖像識別、機器翻譯等諸多領域取得了較大進展。基于深度學習的推薦系統近期得到廣泛關注,將與用戶和商品項目相關數據作為輸入,通過深度學習模型獲得具有相應屬性特征的用戶和項目的隱表示,再基于這類隱表示為用戶推薦項目。
本文的研究包括:傳統基于協同過濾的推薦算法會由于數據稀疏產生推薦效率低下的問題,可以通過添加輔助信息(如:文本,時空信息)改進這一缺陷;傳統基于知識圖譜的推薦算法僅著重于結構化知識,然而用戶-項目評論等文本知識是普遍存在各類社交網站以及電子商務系統中,其中蘊含著豐富的語義特征信息,考慮從評論的文本知識中獲取特征可以極大地提高推薦的準確性。
針對現有推薦算法的不足,本文主要貢獻包括:
1)將知識圖譜與評論內容作為多源數據,并使用不同算法對數據進行處理,根據用戶-項目的歷史交互信息,提出了一個動態融合推薦模型,簡稱為REME(rippleNet and word2vec fusion Model)。
2)在評論文本知識處理上,利用深度學習模型word2vec[13]+FM(factorization machine)[14]算法計算用戶-項目相似度,得到一個用戶點擊預測值。
3)將REME與當前流行推薦算法CKE(collaborative knowledge based embedding)[6],DKN(deep knowledge-aware network)[15]和PMF(probabilistic matrix factorization)[16]算法在真實數據集上進行對比實驗,驗證所提算法的各方面性能。
知識圖譜在各個領域中得到廣泛應用,研究人員嘗試利用知識圖譜來改進推薦系統的性能。現有基于知識圖譜的推薦系統分為以下2類:1)基于嵌入(embedding)的方法[4,15,17]。此類方法使用知識圖譜嵌入(knowledge graph embedding,KGE)[18]算法預處理KG,并將學習到的實體嵌入到推薦系統框架中。基于嵌入的方法利用KG輔助推薦系統提升算法的靈活性,但是上述方法采用的KGE算法更適用于鏈路預測而不是推薦系統[18]。2)基于路徑的方法[19-20]。此類方法探索KG中各實體之間的關聯模式,作為推薦系統的額外輔助信息。基于路徑的方法以更直觀的方式使用KG,但是會嚴重依賴于人工設定的元路徑,通用性無法保障,不同的應用場景需要設定不同的元路徑。此外,實體和關系不在一個領域內的某些場景(例如新聞推薦)中是無法人工設計元路徑的。
文獻[21]較早將圖嵌入技術應用于推薦領域。將Movielens中電影與用戶信息嵌入(embedding)到同一個向量空間,進而計算用戶與電影之間的空間距離,生成推薦列表。Wang等[22]將醫學知識圖譜、疾病&患者二部圖、疾病&藥物二部圖分別嵌入低維向量空間,為病患推薦更為安全的藥物治療方式。通過加權平均將知識圖譜與二部圖結合生成包含更加細粒度屬性信息的患者和藥物向量,最終生成對給定患者的藥物top-k列表。
Ostuni等[23]融合KG路徑中隱含的語義反饋信息,提出基于隱式語義反饋的路徑算法SPrank。基于路徑特征對數據集進行挖掘,以捕獲項目之間的復雜關系。SPrank的主要思想是探索語義圖中的路徑,以便找到與用戶感興趣項目相關的項目。通過分析路徑,提取基于路徑的特征,利用隨機森林與漸變增強回歸樹相結合的學習算法來生成推薦結果。
為了解決上述方法的局限性,Wang等[20]提出了一個將KG應用到推薦系統的RippleNet算法,用于網頁點擊率的預測。RippleNet的基本思想是基于用戶偏好的傳播,對于每個用戶,Ripple-Net將其歷史記錄作為KG的種子集,沿著KG鏈路迭代地傳播用戶的興趣愛好,進而發現用戶對于商戶的潛在興趣等級。RippleNet結合了上述2種方法的優點:1)基于偏好傳播將KGE應用到推薦系統中;2)可以自動發現用戶歷史記錄的商戶到候選商戶的可能路徑,而無需任何人工操作。
本文提出的基于深度學習的推薦系統如圖1所示,包含輸入層,模型層以及輸出層。輸入層的數據和傳統的推薦系統相似,主要是用戶的顯式反饋以及隱式反饋數據,以及用戶畫像和項目內容。深度學習層使用深度學習算法模型,如:自編碼器AE[24]、受限玻爾茲曼機RBM[25]、卷積神經網絡CNN[26-28]、循環神經網絡RNN[29]等。最后,在輸出層利用學習到的相應隱表示,通過內積、softmax、相似度計算等方法為用戶提供推薦。

圖1 基于深度學習的推薦系統框圖
深度學習被廣泛應用于推薦系統中,結合傳統推薦系統,將基于深度學習推薦算法分為:1)深度學習結合協同過濾的推薦系統。獲取并使用用戶和項目的交互數據,通過使用深度學習方法學習得到用戶和項目的隱向量,預測用戶對于目標項目的評分或感興趣程度等信息。2)深度學習結合基于內容的推薦系統。獲取并使用用戶畫像、用戶的顯式以及隱式反饋數據、項目內容數據以及相應的用戶生成內容,通過使用深度學習方法學習用戶和項目的隱向量,為用戶提供精準推薦。
當前大多數社交媒體網站和電子商務系統允許用戶發表文本評論。文本蘊含著豐富的信息,可以找到用戶潛在的興趣點,將其應用于推薦系統可以提高推薦系統的準確性。基于深度學習的word2vec模型不僅應用在自然語言任務,而且被應用于推薦系統和廣告推薦上。Word2vec[13]是基于Skip-gram或CBOW(continuous bag-of-words)的詞嵌入模型。在沒有詞性標注的情況下,word2vec能夠從原始語料學習到單詞的向量表示,比較單詞間的語義、句法的相似性。本文利用word2vec對文本進行處理,將一個用戶對所有商戶的評論合成代表用戶信息的文本數據,同理,將一個商戶接受到的所有用戶的評論集成為商戶的文本數據,提取出用戶和項目的文本潛在特征,根據其特征進行匹配,最終進行合理推薦。
RippleNet算法僅使用了用戶的歷史點擊記錄與結構化知識構成的知識圖譜,沒有考慮蘊含豐富知識的用戶和項目評論數據,基于這一考慮,本文所提算法利用word2vec提取出用戶以及商戶的隱特征,通過Factorization Machine(FM)[14]算法處理隱特征,進而計算得到用戶點擊概率值。通過加入一個動態參數,將RippleNet算法所得值與word2vec+FM所得值結合,最終獲得點擊率預測數值。本文所提REME模型在真實數據集上進行大量實驗,實驗結果表明融合多算法的REME推薦框架相比現有推薦算法,具有更高的推薦準確性。
本節分別介紹RippleNet模型、word2vec和FM的算法原理,進而給出一種動態結合上述算法(即RippleNet模型結合word2vec+FM)的優勢,生成本文提出的REME模型,利用隨機梯度下降算法進行模型求解。REME模型框架如圖2所示。

圖2 REME模型
如圖2所示,REME算法首先通過數據庫中所有用戶-商戶評論的信息,基于用戶和商戶形成2個文件,通過word2vec算法分別對2個文件進行向量化處理,以此向量作為FM算法的輸入;在已有用戶點擊歷史的情況下,與知識圖譜相結合(在知識圖譜上搜尋出與用戶對應的商戶)作為RippleNet算法的輸入;通過計算得到FM算法與RippleNet算法的輸出后,利用2.3節動態融合方法將2個輸出進行有效結合,獲得了一個預測分數,基于預測分數進而為用戶提供個性化推薦列表。
本節將介紹REME的第一步關鍵操作Ripple-Net算法,其主要思想為:通過用戶的歷史點擊項目信息,找出在知識圖譜上與其相連的項目,進而獲得用戶的潛在興趣傳播方式。下面對于算法進行形式化描述。
假設U={u1,u2,…,un}和V={v1,v2,…,vn}分別表示用戶集與項目集,m表示用戶數量,n表示項目數量。用戶/項目交互矩陣定義為Yuv={yuv|u∈U,v∈V},其中yuv的值為1和0,當取值為1時,表示用戶u和項目v存在歷史交互,即用戶u曾經點擊觀看過項目v。
除了用戶-項目交互矩陣外,包括大量關系-實體三元組(h,r,t)的知識圖譜G。其中h∈E,r∈R,t∈E,分別代表著頭實體、關系、與尾實體。E和R分別代表著知識圖譜G中的實體集合和關系集合。在實際推薦情景中,一個項目v可能和知識圖譜中的其他多數實體相連。
RippleNet的目標是在已有交互矩陣Y和知識圖譜G的情況下,得到用戶u和待定項目v的點擊預測評分。即將用戶u和項目v作為輸入,輸出用戶u會點擊項目v的概率。
首先給出算法中的主要概念,形式描述如下。
定義1(關聯實體)已有交互矩陣Y和知識圖譜G,用戶u的第k個關聯實體定義為:

基于定義1給出波紋集的定義。用戶u在G上的第k跳(k-hop)波紋集,其關聯三元組定義如下。
定義2(波紋集)波紋集形式定義為:

“波紋”的含義包括:
1)將用戶的歷史點擊視為一個個水滴,滴在知識圖譜水面上形成了很多波紋,波紋的傳播可以用于表示用戶的潛在興趣傳播路徑。
2)用戶的潛在興趣程度隨著k的增大而變小,即傳播距離越遠,與初始項目的相似性越小。
“波紋集”如圖3所示。圖3中三角形代表的是用戶最初點擊的“種子集”,方塊代表的是與種子集直接相連的第一跳波紋集(Hop1),實心圓則代表的第二跳波紋集(Hop2),第h跳波紋集皆以此類推。

圖3 波紋集
對于每個項目v對應創建一個d維的嵌入向量v。項目嵌入向量通常是基于one-hot ID[30],分布、詞袋等特征信息表示的一個項目。在已有用戶u的Hop1波紋集與項目嵌入向量v的條件下,的每一個三元組(hi,ri,ti)與v的相關系數為:

式(3)中:Ri表示關系ri的嵌入,是一個d×d的矩陣;hi表示頭實體hi的嵌入,是一個d維的向量;相關系數pi表示項目v與頭實體hi在關系Ri上的相似程度。在獲得相關系數pi后,對于的尾實體ti計算加權和得到向量為:


式(5)中,αi是正項(αi>0)可訓練混合參數,且其和為1。
基于上述公式,基于u和v輸出預測點擊概率為:

根據式(6)得到損失函數為:

式(8)中,yuv更表示用戶u與項目v的交互歷史,值為1和0,當取值為1時,表示用戶u和項目v存在歷史交互,即用戶u曾經點擊并觀看過項目v。式(8)定義的損失函數用于訓練和調節參數。
為了得到更好的實驗效果,在損失函數中加入了L2正則化參數(限于篇幅,省略這部分內容),參數的相關設置會在實驗部分進行說明。
本節將對word2vec與FM算法進行描述,下面將介紹其主要思想及理論基礎。
Word2vec可以視為一個神經網絡,其主要作用為將自然語言中的每個詞通過一個三層神經網絡訓練成為一個詞向量。其很好地解決了傳統詞袋模型 (bag-of-words,BOW)無法表示文本上下文語義信息以及造成的維數災難的問題,使得語義上相似的詞具有相似的向量表示。Word2vec主要包括2種預測模型:skip-gram和CBOW(continuous bag-of-word model)以及2種訓練模型Hierachical softmax(huffman樹,HS)和negtive sampling(權重采樣負例,NS)。其常用的組合分為4種:CBOW-HS、CBOW-NS、Skip-Gram-NS、Skip-Gram-NS。
本文主要目標是使用word2vec分別獲得用戶以及項目的特征詞向量,基于特征詞向量使用FM模型獲得用戶與商戶的相似度(預測評分)。
CBOW與skip-gram的結構如圖4所示。本文使用的是CBOW-HS模型,且CBOW與skip-gram模型相似,因此這里僅介紹CBOW模型。CBOW是根據已知的上下文單詞來預測中心詞的后驗概率,模型結構如下:1)輸入層,上下文詞向量context(w);2)投影層,將輸入層的2c個context(w)詞向量相加;3)輸出層,輸出中間詞向量。
CBOW的訓練函數為:

下面對FM算法進行介紹,首先給出使用FM算法的理由如下:1)特征組合是機器學習建模過程中遇到的問題,如果對特征直接建模,很可能忽略特征與特征之間的關聯信息,因此可以通過構建新的交叉特征組合方式提高模型的效果。2)高維的稀疏矩陣是真實應用中常見的問題,直接應用會導致計算量過大、特征權值更新緩慢的問題。

圖4 連續詞袋模型與Skip-gram模型
首先介紹FM算法的輸入:基于Word2vec構建出用戶與商戶的特征向量,公式如下:

式(10)(11)中:Tu、Tv分別表示用戶u與商戶v的評論;tu與tv為相對應的用戶和商戶特征向量。

式(12)中:·表示向量點乘操作;zuv是u與v之間的相關系數向量。
筆者經過大量實驗發現:通過FM算法將特征兩兩組合,引入交叉項特征,可以提高模型的準確性,FM應用的主要公式為:

式(13)、(14)中:m0表示全局偏差項;m是潛在特征向量zu,v的系數向量;M是二階交互的權重矩陣,其對角元素為0;vj、vk是與zu,v的維度j和k相關的v維隱向量。
最后,使用平方損失作為參數優化的目標函數,定義為:

式(15)中:O表示觀察到的用戶-項目評分對集合;yu,v與式(8)中的yuv的含義相同,都是用戶-項目交互;Θ表示的是所有參數。其中,式(15)中的第二項是為了防止模型過擬合。
本節介紹如何將前面所述的RippleNet和word2vec+FM進行動態融合,使2個算法可以起到相互促進的作用。因為融合方法中參數可以自動調節,所以本文所提出的融合算法成為動態融合算法。
上述RippleNet算法、word2vec+FM算法分別從評分和文本2個不同的信息源獲得隱特征。為了使這2個隱特征的整合可以相互補充并產生更好的預測結果,加入了一個線性插值α,參數α主要用于有效結合2個組件。然而,將這2個模型與靜態α線性融合可能不是評級預測的合適選擇,因此這里加入的是動態參數α,其動態變化方式主要為當基于評論的組件預測的分數高于基于交互的組件時,參數α變大。
當用戶給予某個項目高分評價時,可能會是由于某些特定的偏好特征,而此項目其他特征對于用戶選擇的影響則可忽略。因此這里引入了一種動態加權方案,主要方式為通過優先選擇具有更高預測評分的組件(即來自評論的知識或結構化知識)來搜尋更符合用戶個人喜好特征的項目[31-33]。
在式(6)和式(10)的基礎上得到:

本節介紹模型REME的參數優化方法,主要是采用隨機梯度下降與反向傳播的方法對式(8)(9)(15)的參數進行優化。REME算法如下所述。
算法1REME模型參數優化。


算法1首先為每一個用戶統計出其波紋集與這個用戶的所有評論的集合,使用word2vec算法將評論集合文件轉化為對應的用戶特征向量(第2~4行)。在預設好的迭代次數T內,基于式(1)~式(8)使用隨機梯度下降算法與反向傳播算法更新參數{αi,i=1,2,….,H}(第5~6行)。利用計算用戶特征向量相同的操作,為每一個項目計算出對應的項目特征向量(第7~9行)。在計算出所有用戶-項目特征向量后,遍歷出測試集的用戶-商戶對,計算出用戶-項目相關系數向量zuv(第10~11行),并在基于FM算法使用隨機梯度下降算法與反向傳播算法更新參數Θ(第12~13行)。最終輸出參數{αi,i=1,2,….,H}與 Θ。
為了說明REME算法在提高算法準確性的同時,仍具有著較好的時間性能,本節將分析REME算法的時間復雜性,并與其他經典算法的時間復雜性做對比。
首先創建用戶特征向量:計算用戶波紋集的時間復雜度為O(a×m),其中m為用戶數量,a是一個常數;word2vec算法的時間復雜度為O(a log(n)),n為項目數量。綜合上述步驟,創建用戶特征向量的時間復雜度為O(a(m+log(n))),因為n的值遠大于m,所以近似為O(log(n))。與創建用戶特征向量相似,創建項目特征向量的時間復雜度為O(log(n))。計算用戶特征與項目特征的交叉向量的時間復雜度為O(log2(n)),綜上,REME的算法時間復雜度為OREME(log2(n))。
PMF,DKN與CKE算法的時間復雜度分別近似為OPMF(mn),ODKN(m2+n2)和OCKE(log2(n))。REME算法的時間復雜度與上述算法相比,ODKN(m2+n2)>OREME(log2(n))≈OCKE(log2(n))>OPMF(mn)。以此可以發現,REME算法在提升推薦能力的同時,所犧牲的時間效率在可接受范圍之內,且其時間復雜性優于DKN算法,略遜色于PMF算法。
在實驗中使用通用的Yelp數據集進行推薦性能分析。本文抽取Yelp數據集中亞利桑那州(AZ)與南卡洛來納州(SC)2個不同地區的餐館數據,包含用戶的評論數據以及商家的屬性數據集。在用戶的評論數據中主要包含用戶的評論,評分等信息。在實驗中將用戶評論視為簽到一次。在商家的屬性數據集中主要包含了商家的ID,名稱,位置(地區、城市、經緯度等),餐館種類以及標簽等信息。實驗利用Microsoft Satori來為Yelp商戶建立知識圖譜。
對于篩選完后的2個地區的數據集,其統計信息如表1所示。

表1 數據集的各項統計信息
從表1中可以發現,AZ的用戶數量是SC的2倍左右,然而商戶數量是SC的5倍,因此帶來了數據稀疏性的不同,從而導致最終的實驗結果有著一定的差異。
在Ripplenet中,將其波紋跳數即式(4)中的H設置為2,根據實驗結果證明大量的波紋跳數不會提高性能,相反會增加額外的計算開銷。
實驗完整的參數設置為:商戶和知識圖譜的嵌入維度d=16,學習率 η=0.02,正則化參數λ1=10-7,λ2=0.01,H=2。
對于word2vec,設置其所得嵌入向量維度為也為d。通過驗證數據集上的AUC曲線來確定超參數。
為了取得更好的實驗結果,對于每個數據集進行訓練,訓練、評估、測試集的比例為6∶2∶2。每個實驗重復5次,取其平均值作為最終數據。
本文采用如下2個評價指標,評價算法的性能:
1)對于點擊率(CTR)預測,本文使用ACC(accuracy)與AUC來評估CTR預測的性能。
2)對于top-k推薦,本文采用的是recall@k作為評價指標,recall@k的定義如公式:

式(18)中:recall@k表示的是在top-k推薦列表中的召回率,即用戶在推薦列表中點擊的概率;hit表示的是測試集中的用戶點擊推薦列表中的餐館的次數;recall代表測試集的簽到總次數。
在本文中主要對比如下3個經典推薦算法:
1)CKE[6]:CKE主要將協同過濾與結構知識,文本知識和圖像知識結合在一個統一的框架中進行推薦。
2)DKN[13]:DKN將實體嵌入和字嵌入視為多個通道,并將它們組合在CNN中以進行CTR預測。實驗中使用商戶標簽作為DKN的文本輸入。
3)PMF[24]:PMF主要是利用了用戶的簽到信息,將“用戶-興趣點”的簽到矩陣分解為用戶隱式因子矩陣和興趣點隱式因子矩陣,利用這些隱式因子矩陣預測用戶對于興趣點的評分,進而為用戶生成推薦列表。
不同算法的top-k推薦與CTR預測的結果如圖5、圖6以及表2所示。實驗結果表明:
1)在不同數據集上,SC的實驗效果總是比AZ的好,這是因為2個地區的數據稀疏度有著差異,AZ的每個商戶的平均流量比SC的更少。
2)CKE在這里只使用了結構化知識,因此其效果相比RippleNet來說較差。RippleNet與其他模型相比結果較好,但是其僅考慮了知識圖譜,沒有有效利用評論文本信息等數據,因此推薦效果沒有REME好。DKN的實驗結果并不好,因為這里僅使用了標簽信息,沒有考慮其他的有效信息。
3)無論在哪個數據集中PMF的推薦效果總是最差的,因為用戶的簽到數據是稀疏的。此外,PMF算法沒有融合其他的內容數據信息。
4)如圖5,圖6及表2所示,REME都取得了最好的推薦效果,其分別在AZ和SC2個數據集AUC上相比于其他基線提升了7.8%~19.3%和4.9%~20%,同時在recall@k的測試中也取得了最佳效果。以此可以說明REME推薦能力優于僅使用結構化知識的CKE與RippleNet,更優于未使用知識數據的PMF算法。這意味著額外使用文本知識可以提高推薦性能,并說明了REME框架將不同的知識組合在一起以增強推薦性能。

圖5 南卡洛來納州不同模型的召回率對比

圖6 亞利桑那州不同模型的召回率對比

表2 點擊率預測中AUC與Accuracy結果
綜上,REME模型相比于現有典型模型,在有效融合多種數據的情況下,明顯提升了推薦效果,且在數據稀疏的情況下可以得到不錯的推薦效果,表明REME模型可以有效解決數據稀疏對于推薦結果所帶來的負面影響。

表3 各模型的運行時間 min
實驗結果如表3所示,在實際應用中,推薦模型的運行時間往往是重要的評價指標之一,如果模型的運行時間超過了可接受范圍,那么這個模型的實用性就會受到限制。因此該實驗主要在2個不同數據量的數據集中進行效率評估實驗。由表3可以看出,在提升了推薦能力的同時,隨著數據量的增大,REME算法的運行時間也是呈現穩定增長的趨勢,這說明REME算法其所增長的時間是在可接受范圍內。
REME算法分為2個組件,其中基于Ripple-Net算法的組件是以知識圖譜為輸入數據,不需人工專門設計元路徑,可以適用于各類行業;另外一個基于Word2vec算法的組件主要是以用戶評論為輸入,目前用戶-項目評論數據普遍存在于各類社交網站以及電子商務系統中。可以看出,REME算法的輸入數據是可以直接獲取到的,獲取難度低,應用場景眾多。基于之前所做的效率評估實驗,可以看到REME算法在隨著數據增大的同時,其時間開銷的增長是在可接受范圍之內的。綜上所述,REME算法在實際應用中,提升了推薦能力的同時,其實現成本是相對較低及可行的。
在推薦系統領域,知識圖譜與深度學習結合近年來成為研究熱點,本文通過運用2種不同的算法分別對于結構化知識以及文本信息進行動態融合(即RippleNet和word2vec+FM算法),提出了一種新的融合推薦模型REME。在真實數據集上對不同模型進行實驗,結果表明本文所提出的算法相比于已有算法有著更好的效果。在數據稀疏性不同的實驗數據集上的實驗結果表明:本文所提模型可以有效緩解數據稀疏性對推薦算法帶來的負面影響。