李普聰,王 順,鐘元生,孔偉晶
(江西財經大學 軟件與物聯網工程學院,南昌 330013)
數據稀疏和冷啟動問題是目前大多數個性化推薦算法都會面臨的困擾[1].通常推薦系統根據用戶過往的偏好信息進行個性化推薦,當新用戶加入系統時,常常由于沒有可作為依據的歷史信息,無法為其提供有效的個性化推薦服務.部分應用通過用戶偏好設置過程中所選的標簽來獲取用戶的興趣偏好,但該方法仍無法保證推薦信息的質量.為了提高推薦服務的質量,解決新用戶個性化推薦的冷啟動問題,眾多學者提出了多種較為有效的方法,如基于用戶上下文信息的推薦算法[2]以及基于信任關系的推薦算法.其中,基于用戶上下文信息的推薦算法,如文獻[3]提出的具有邊界值的樸素貝葉斯算法,在推薦的準確率和回召率方面都有不錯的表現;文獻[4]提出了一種用于事件推薦的語義增強和上下文感知混合協作過濾方法,實驗證明了該算法優于同等方案;文獻[5]利用循環神經網絡處理用戶上下文信息,通過與其它經典的特征收集方法比較,驗證了循環神經網絡對于提高推薦算法效率的有效性;文獻[6]提出了一種基于用戶上下文信息和動態預測的協同過濾算法,實驗證明該算法能夠緩解評分數據稀疏性對協同過濾推薦算法的影響.在基于信任關系的推薦算法研究方面,文獻[7]基于可信圖方法,將可信朋友的影響力和公眾影響力加入到信任關系網絡,從而提高推薦算法準確性;文獻[8]將信任機制引入社交網絡,使用關聯規則挖掘來捕獲網絡中用戶的當前閱讀趨勢,提出了一種圖書推薦系統;文獻[9]基于用戶間的信任關系和相似性,將用戶社區結構融入到“用戶-項目”聯合社區的矩陣分解模型,提出了一種結合用戶社區和評分聯合社區的推薦模型,實驗證明該模型能有效提升推薦的準確性和精度.
目前大多數推薦算法都無法在保證推薦精度的同時保證推薦的多樣性[10],難以滿足用戶對高質量信息過濾的要求.近年來,基于復雜網絡的推薦算法[11]越來越受到重視,與傳統推薦算法相比,基于二部圖網絡結構的資源擴散推薦算法在精確性、多樣性、適應性和擴展性等方面都表現出較好的性能.受基于網絡的動態資源分配推薦算法的啟發,Zhou等人發現個性化推薦過程與二部圖投影問題存在相似之處,通過把推薦過程轉化為雙向含權網絡投影過程,提出了一種基于物質擴散的推薦算法[12];此后他們又融合物質擴散和熱傳導思想,修正原有推薦算法,實驗證明新方法可同時兼顧推薦的準確性和多樣性,并增強了算法對不同場景的適應能力[13].文獻[14]提出了一種基于熱雙向傳遞的推薦算法,該算法對推薦的精確度、新穎性和多樣性都有所提升,在發掘長尾商品和解決冷啟動問題方面也有不錯的效果.文獻[15]將基于共同鄰居相似性的二部網絡投影方法集成到Infomap中,利用隨機游動算法得到一個加權的單模網絡,提升了推薦算法的準確率.文獻[16]提出了一個改進的基于物質擴散和熱傳導的混合推薦算法,此算法在融合兩種傳統算法優點的基礎上增加了一個調節參數來抑制系統對熱門物品的過度推薦,實驗表明該混合算法相比傳統算法在準確率和多樣性上都有提升.
在基于擴散過程的推薦算法這方面,大部分學者對 “用戶-物品”二部圖網絡中資源分配方法關注較多,較少融合用戶的社交網絡信息.即使在研究中融入了社交網絡,大多也是采用平均分配原則進行資源的分配.因此,在基于擴散過程的推薦算法研究中,如何充分利用歷史信息確定用戶之間的信任度,并根據權重來進行資源分配,成為一個重要的研究方向.為改進現有推薦算法的不足之處,本文將用戶上下文信息與信任關系同基于擴散過程的推薦算法相融合,提出一種融合信任關系的熱傳導和物質擴散混合推薦算法.
傳統的基于物質擴散的推薦算法(Probabilistic-spreading Recommendation Algorithm,簡稱ProbS算法)、基于熱傳導的推薦算法(Heat-spreading Recommendation Algorithm,簡稱HeatS算法)以及ProbS與HeatS混合推薦算法(PHS算法)是目前研究較多的基于“用戶-物品”二部網絡的推薦算法.部分研究者嘗試在基于擴散過程的推薦算法中引入社交網絡算法表示用戶之間的關系,但大部分未考慮用戶之間信任關系的強弱,也大多沒有針對新用戶冷啟動問題提出切實有效的解決方法.因此,本文基于傳統的ProbS和HeatS的混合推薦算法,通過結合用戶行為、用戶上下文和用戶興趣偏好等3類信息,將用戶信任關系網絡與“用戶-物品”二部圖相結合,形成二層網絡,使資源擴散過程在“用戶-用戶-物品”雙層網絡中進行,提出一種融合信任關系網絡的物質擴散和熱傳導混合推薦算法(Fusion Trust Relationship Network Heat-Probabilistic-Spreading-Based Hybrid Recommendation Algorithm,簡稱THP算法).
本文主要依賴用戶行為、用戶上下文以及用戶興趣偏好等3類信息來構建一種信任關系網絡.
假設有一無向含權信任關系網絡G,網絡中的節點代表用戶,結點個數n表示網絡中的用戶數,用戶之間的信任關系用結點之間的連線表示,則可用鄰接矩陣Ttru=[txy]n×n表示信任關系網絡.其中,txy指用戶x與用戶y之間的信任強度.用戶之間的信任度可利用相似性計算方式求解,則Ttru計算公式可表示為:
Ttru=Tbeh+Tcon+Tint
(1)
其中,Tbeh、Tcon、Tint分別為基于用戶行為、用戶上下文信息和用戶興趣偏好生成的信任關系矩陣.通過歸一化處理用戶鄰接矩陣Ttru,得到用戶之間的信任關系矩陣TUU.
2.1.1 基于用戶行為產生的信任關系
假設存在一個如圖1(a)所示“用戶-物品”二部圖G(U,I,E),U為用戶集合,I為物品集合,E為用戶與物品之間的連線,代表U中用戶和I中物品之間的選擇關系.

圖1 二部圖及用戶相似行為投影圖
當要向用戶x推薦物品時,首先分析x的過往行為記錄,在系統中查找與其行為具有最大相似度的用戶y,比較用戶x與用戶y的歷史選擇記錄,將用戶y歷史選擇清單中未被選擇的物品推薦給x.通?!坝脩?物品”二部圖只保存了用戶選擇物品的記錄,無法直觀地反映出不同用戶之間行為的相似關系,通過二部圖投影可生成反映用戶行為相似關系的無向含權圖.具體方法是:判斷兩個用戶是否選擇了相同的物品,如果選擇了相同物品,則用一條無向邊連接兩個用戶結點,并用所選相同物品的件數作為連邊的權值.例如,在圖1中,用戶u1選購了i1、i3和i43件物品,用戶u2選購了i1、i2、i3和i44件物品,則用戶u1和用戶u2選購了3件相同的物品i1、i3和i4,因此在u1與u2之間建立連邊,并把邊的權值賦為3.采用同樣方法處理其它所有結點,從而得到如圖1(b)所示的用戶之間的相似行為投影圖.
Jaccard相似系數可用于計算集合之間的相似度,為求解基于用戶行為產生的信任度,本文引入Jaccard相似系數,計算公式如公式(2)所示:
(2)
如圖2(a)所示,Inter(x,y)為x和y兩個用戶所選物品的交集,Union(x,y)為x與y兩個用戶所選物品的并集.tbeh(x,y)為信任關系矩陣Tbeh中的元素,取值范圍為[0,1],tbeh(x,y)值越大,說明x與y的相似度越高.

圖2 基于用戶行為生成的信任關系網絡過程
構建基于用戶行為的信任關系網絡的算法描述如下:
輸入:用戶購物信息列表
輸出:基于用戶行為的信任關系矩陣Tbeh
1.基于用戶購物信息列表,構建“用戶-物品”二部圖模型;
2.基于“用戶-物品”二部圖,求解所有用戶的行為向量,若用戶選擇了某物品,將對應列的元素賦值為1,否則,賦值為0;
3.計算每兩個用戶所選物品的總數和所選同一物品的數目;
4.基于二部圖投影策略,利用3中用戶的物品選擇信息,構建用戶行為矩陣;
5.根據Jaccard相似系數公式,計算所有連邊結點的權值;
6.綜合5的計算結果構建用戶信任關系矩陣Tbeh.

2.1.2 基于上下文信息產生的信任關系

已有研究表明,不同性別、年齡、職業的人,他們的生活需求通常存在較大的差異,而年齡接近、職業類似的人在較多生活需求方面存在較高的相似度.因此我們選擇性別、年齡以及職業類別3類用戶信息構建用戶屬性上下文信息,并對它們分類處理:
·性別(2類):男(F)、女(M);
·年齡(7類):1-18、19-24、25-34、35-44、45-49、50-55、56以上;
·職業(8類):黨政事業單位人員,專業技術人員、農林水利生產人員、商業服務業人員、設備操作人員、辦事人員、軍人、其他從業人員(分類源自《中華人民共和國職業分類大典》).


表1 用戶屬性上下文信息表



表2 用戶u1與u2觀影記錄
為評估用戶基于上下文信息產生的信任度,本文采用余弦相似度計算公式(如公式(3)所示),計算兩個用戶時間上下文屬性向量的夾角余弦值,來評估兩者之間的相似度.由于本文討論的用戶上下文向量中各元素不可能為負數,因此余弦相似度的取值范圍為[0,1].
(3)

綜上所述,構建基于用戶上下文信息的信任關系網絡的算法可描述為:
輸入:用戶上下文信息列表
輸出:基于用戶上下文的信任關系矩陣Tcon

3.采用余弦相似度公式進行計算,生成用戶屬性上下文相似度矩陣Satt和用戶時間上下文相似度矩陣Stime;
4.依據步驟3的計算結果,計算Satt和Stime的和;
5.生成信任關系矩陣Tcon

2.1.3 基于興趣偏好產生的信任關系
通常如果兩個用戶的偏好相似,則兩個用戶可能存在相同的興趣點,從而可以為他們推薦類似的商品.另一方面,如果兩個用戶興趣偏好相似,他們對所購商品的評價也可能類似,因而可以通過分析兩個用戶對相同物品評分信息的相似度來評判兩個用戶的興趣偏好相似度.目前電商平臺一般都會保存用戶信息、商品信息以及用戶的交易評價信息等數據,基于這些數據,利用相似度計算公式,就可求解用戶兩兩之間的偏好相似度.假設U={u1,u2,u3,…,ua…,un}(n為用戶總數)為用戶集合,I={i1,i2,i3,…,ib,…,im}(m為物品總數)為物品集合,則利用用戶交易評價信息中給出的評分數據,就能構建一個n×m的交易評分矩陣R=[rab]n×m,如表3所示.

表3 “用戶-物品”評分矩陣

(4)

·0.8-1.0 極強相關
·0.6-0.8 強相關
·0.4-0.6 中等程度相關
·0.2-0.4 弱相關
·0.0-0.2 極弱相關或無相關
綜上所述,基于用戶興趣偏好生成信任關系網絡的構建過程如圖3所示,算法描述如下:

圖3 基于用戶興趣偏好生成的信任關系網絡過程
輸入:用戶信息列表、用戶訂單商品列表、商品評分列表
輸出:基于用戶興趣偏好的信任關系矩陣Tint
1.利用用戶訂單記錄中的商品信息及相應的交易評分數據,構建“用戶-物品”評分矩陣R=[rab]m×n,其中,評分的取值范圍為1-5的整數,未選購商品的評分記為0;





表4 “用戶-物品”評分表
tint(u1,u2)=
(5)
傳統的基于擴散過程的推薦算法性能受限于數據的稀疏性問題,并且無法處理新用戶冷啟動問題,在一定程度上并不能滿足用戶需求.為了進一步提升推薦算法的性能,本文提出了融合信任關系的物質擴散和熱傳導混合推薦算法(THP算法).該算法將融合用戶上下文信息的信任關系網絡與傳統的“用戶-物品”二部圖相結合,利用物理學和社會心理學的思想,通過資源的擴散方式預測用戶感興趣的物品.
2.2.1 二部圖
二部圖是隸屬于圖論的一種特殊模型,主要通過分析拓撲結構特征來尋找節點間的聯系.假設存在一個無向圖G(X,Y,E),其中X、Y分別表示分屬不同類型的節點集合,且均不為空集,其中,同類節點之間不存在直接的交集關系.E(x,y)為不同結點集中節點x和y的連邊集合,其中x∈X,y∈Y,連邊關系通常用“0-1”模型進行表示,根據是否存在連邊設定相應的值,滿足以上條件,這里我們就可以說G是一個二部圖.現實生活的許多場景都可以構建二部圖模型,比如購物、旅游等.由于二部圖的結構特性與推薦系統中常用的“用戶-物品”關系結構較為相似,近年來被引入到推薦算法研究中.
2.2.2 雙層網絡模型構建
過去以單一二部圖為基礎構建的基于擴散過程的推薦算法往往難以滿足不同應用場景對推薦算法性能的要求.本文結合多維用戶信息構建基于“用戶-用戶-物品”的二層網絡模型.為更好地闡述THP算法的原理,我們假設有一雙層網絡G(U,I,EUI,EUU),其中U={u1,u2,…,un}為由n個用戶構成的用戶集合,I={i1,i2,…,im}為由m個物品構成的物品集合,EUI(aui|aui=0或aui=1,0

2.2.3 算法描述
傳統的基于擴散過程的推薦算法的局限性在于只考慮了資源在用戶和物品之間的擴散方式,利用額外的附屬標簽信息提升推薦性能,未處理新用戶到來時的冷啟動問題.而THP推薦算法將資源擴散過程從物品與用戶之間引入到任意兩個用戶之間,基于用戶行為、用戶上下文以及用戶興趣偏好3個維度的相似度求解用戶之間的信任關系強度,將融合多維用戶信息的信任關系網絡有效融入到改進的基于擴散過程的推薦算法中.具體來說,THP算法的推薦過程可描述為以下3個步驟:


(6)
式(6)引入調節因子λ,使資源在λ的調節下在雙層網絡上擴散.其中,當λ為1時,
(7)
則THP算法轉變為融合信任關系網絡的物質擴散推薦算法.
而當λ=0時,
(8)
則THP算法轉變為融合信任關系網絡的熱傳導推薦算法.
基于上述分析,可將THP推薦算法的推薦過程(含相關公式的推導過程)分解為以下5個步驟:



步驟4.基于用戶信任關系矩陣,在信任關系網絡中進行資源擴散,求解目標用戶的資源向量:


THP算法推薦過程可直觀表示為圖4所示過程.

圖4 融合信任關系網絡的物質擴散和熱傳導混合推薦過程
THP推薦算法可形式化描述如下:
算法:THP推薦算法
輸入:用戶物品選擇關系矩陣AUI,用戶信任關系矩陣TUU,目標用戶x調節因子λ;
輸出:推薦給目標用戶x的商品列表Rx.
1.求解AUI的轉置矩陣BIU;
2.求解用戶活躍度對角矩陣ΛU、物品流行度對角矩陣ΛI;





8.對推薦集合L中的元素降序排列,生成推薦給用戶x的物品列表Rx,最終向用戶推薦排名靠前的d個物品.
為檢驗THP算法的有效性,對測試數據進行預處理和特征分析,采用TopN推薦方式生成運算結果,然后從兩個維度來比較THP算法與相關算法的推薦性能差異:1)相同推薦列表長度不同調節因子的推薦性能對比;2)相同調節因子不同推薦列表長度的推薦性能對比.
本實驗所用的測試數據為MovieLens提供的MovieLens-100K數據集.該數據集包含了1682部電影的相關評分數據,由943位用戶提供,共100000條評分記錄.
借鑒推薦算法評價的傳統作法,本文通過查準率(Precision)、查全率(Recall Ratio)、排序分(Ranking Score)、多樣性(Diversity)、新穎性(Novelty)以及覆蓋率(Coverage)等6個指標來檢驗THP算法的質量.
3.2.1 查準率指標
基于傳統的TopN推薦方式,假設目標用戶為x,推薦列表的長度為l,查準率Prex(l)計算公式為:
(9)
其中,Rx(l)為存在于目標用戶x的預測物品集又同時存在于測試集的物品數目.若U(x1,x2,…,xn)為用戶集合,則可用式(10)計算推薦算法的平均查準率Pre.
(10)
3.2.2 查全率指標
假設推薦列表長度為l,則可用式(11)計算目標用戶x的查全率Recx.
(11)
其中,Rx(l)為存在于目標用戶x的預測物品集,同時也存在于測試集的物品數目,Qx為被目標用戶最終選擇了的測試集中物品的數目.
3.2.3 排序分指標
假設U(x1,x2,…,xn)為用戶集合,Tx為推薦給目標用戶x的物品集合,txα為Tx中物品α在推薦列表中的排名,Sx為測試集中目標用戶所選物品集合,則可用式(12)計算目標用戶x推薦排序分RSx.
(12)
推薦系統整體排序分RS為所有用戶排序分的均值.
(13)
3.2.4 多樣性指標
假設U(x1,x2,…,xn)為用戶集合,L為推薦列表長度,可用式(14)計算用戶x與y的海明距離Hxy:
(14)
其中,Txy表示用戶x和y的推薦列表中相同物品的數量.推薦算法的整體推薦多樣性Div可用式(15)來計算,即求解所有用戶海明距離Hxy的平均值.
(15)
3.2.5 新穎性指標
假設U(x1,x2,…,xn)為用戶集合,推薦給目標用戶x的物品集為Tx,可用式(16)計算目標用戶的推薦新穎性Novx.
(16)
其中kα表示選擇了物品α的用戶數,即流行度.推薦算法的新穎性值Nov可用式(17)來計算,即求解所有用戶推薦列表新穎性值的平均值,取值越小則說明新穎性越高.
(17)
3.2.6 覆蓋率指標
假設存在用戶集合U和物品集合I,推薦給目標用戶x的物品集為Tx,可用式(18)計算推薦算法的覆蓋率Cov.
(18)
本次實驗主要采用兩種方法對THP算法進行分析,驗證其推薦效率:1)固定推薦列表長度,以調節因子λ為自變量,分別運行PHS算法和THP算法,觀察比較兩種算法6項評價指標的變化趨勢.2)將調節因子λ固定為某一最佳值,以推薦列表長度為自變量,觀察比較PHS算法和THP算法6項評價指標的變化趨勢.
3.3.1 不同調節因子的算法比較
THP算法是在PHS算法的基礎上進行改進的.因此,為了確定和展現該算法優勢,通過設置不同的調節因子λ來分析其對算法推薦性能的影響.通過對MovieLens數據集中調節因子λ的取值進行不同設置,判斷取得算法最優性能的λ值.此處我們將推薦列表長度設置為20.THP算法與PHS算法在6類評價指標下的推薦效果對比如圖5所示.其中,橫坐標為調節因子λ,取值范圍設為[0,1],間隔為0.1.

圖5 相同推薦長度下不同調節因子的性能指標對比圖
PHS算法是通過引入調節因子λ融合ProbS算法與HeatS算法得到,λ=1時就轉化為ProbS算法,λ=0時就轉化為HeatS算法.從圖5的推薦結果可以發現,ProbS算法獲得了較好的查準率但多樣性相對較差,相反,HeatS算法獲得較好的多樣性但查準率相對較差.相比之下,PHS算法在精確性和多樣性方面達到了平衡,兩方面均有所改進.
在圖5的precision部分可以看到,與PHS算法、ProbS算法和HeatS算法相比,THP算法的推薦精準度更好.在λ=0.2時,THP算法獲得0.1416的查準率值,較其它3個算法,查準率提升幅度分別達到2.76%、48.73%、1142%.在查全率方面,THP算法的為0.2612,較其它3個算法,查全率提升幅度分別達到2.88%為、57.54%、11.87%.從排序指標方面,本文所使用的THP算法與PHS算法的效果基本一致.結合圖5中diversity和novelty性能指標對比,THP算法在推薦多樣性和新穎性方面具有較大優勢.多樣性指標方面:當λ=0.1時,THP算法的值達到0.9253,對比ProbS算法,有60.70%的大幅提升,對比Heat算法和PHS算法,也有9.57%和1.17%的小幅提升.此外,在新穎性方面,相對于其他算法,THP算法也有一定的提升,當λ的值逐漸靠近1,與PHS算法相比THS算法逐漸與其接近,表明新穎性會隨著資源趨向于以物質擴散的方式擴散時而不斷降低.綜上所述,調節因子對THP算法的性能有著較大的影響.所有算法在不同評價指標下的表現詳細見表5.

表5 同調節因子λ下各算法的最佳性能比較
從推薦結果分析可得,在λ=0.2時,使用MovieLens數據集,THP算法在各個性能指標上達到最佳,也就是說在整個資源擴散過程中,有20%的資源通過物質擴散的方式進行擴散,其它80%的資源通過熱傳導的方式進行擴散.因此,當λ=0.2時,THP算法的推薦精確度和多樣性可得到有效的提升.
3.3.2 不同推薦長度的算法比較
以Top推薦算法方式輔助用戶找到感興趣的商品,是目前大多數推薦系統向用戶推送商品列表的主要手段,比如“天貓”、“亞馬遜”等大型的電商平臺.THP算法也采用了同樣的方式產生推薦列表,通過對目標用戶的最終資源向量進行篩選和排序,從而生成推薦列表,然后優先推薦排序靠前的物品.因此,本節主要分析不同的推薦長度對于各個推薦性能指標的影響趨勢,更好的對比不同算法直接的推薦性能差異.以20、40、60、80和100的取值方式設定推薦列表的長度來實現相應的實驗.從上節可知,PHS算法與THP算法在λ的值為0.2時,各項推薦性能指標都比較好,所以在本節中我們將它們的調節因子均固定為0.2,然后基于推薦算法常用的查準率、查全率、排序分以及多樣性4項指標,對幾個常見推薦算法進行比較,各算法在不同性能指標下的變化趨勢如圖6所示.
1)查準率性能比較
從圖6中的precision部分可知,推薦列表的長度(簡稱L)與查全率的比例成反比,隨著L的增加各算法的性能都呈下降趨勢.其中,傳統的HeatS算法因其本身的局限性,在查準率方面明顯低于其他算法.反觀THP算法,隨著L的增加該算法的查準率下降趨勢基本與經典的PHS算法相同.同時,在相同L值下,THP算法與其他算法相比都有不同程度的提升,且一直處于較高的位置,可見該算法在推薦查準率方面具有明顯的改進.
2)查全率性能比較
如圖6中recall部分所示,各個推薦算法的查全率與推薦列表長度L呈正比,即推薦查全率隨L的增長而增長.推薦查全率方面,CF算法與ProbS算法較為接近,而相比THP算法與PHS算法,兩者依然處于最高位置,且THP算法表現的更加優越一些.綜合觀察查準率與查全率的變化趨勢,可知THP算法與其他算法相比,能夠保證不錯的推薦精確度.
3)多樣性性能比較
圖6中diversity部分可見各算法的推薦多樣性有較大的差距.隨著L的增加各個算法的多樣性在逐漸的降低.其中ProbS算法表現最差,主要是因為該算法在保證精確度的同時丟失了推薦多樣性.而THP算法和PHS算法對于推薦多樣性顯著的高于其他算法.可見THP算法在推薦多樣性方面也具有不錯的表現,向用戶提供不同種類的物品的能力均優于其他對比算法.

圖6 相同調節因子不同推薦長度的性能指標對比圖
4)排序分性能比較
排序分主要用于評價推薦算法挖掘用戶潛在興趣的能力.優秀的推薦算法應該是將用戶感興趣的物品放在排名靠前的位置,而并不是將熱門商品放在推薦列表靠前的位置.根據本文設定的排序分指標值的定義,要求排序分越低越好.圖6中ranking score部分為各算法的排序分變化趨勢圖.由圖可見,隨著L的增長,排序分會逐步上升,基數越大,排序分上升的趨勢也會變大.幾種算法的排序分明顯分化為兩組,CF、HeatS以及ProbS算法的排序分比較接近,處于較高位置,而THP和PHS算法的排序分接近,處于較低的位置.與其它算法相比,THP算法排序分最低,而且隨著L的增長,THP算法排序分的增長趨勢相對平緩,可見其性能更具優勢.
綜上所述,與傳統的推薦算法相比,將信任關系網絡與物質擴散算法和熱傳導的混合推薦算法相融合,對于推薦的各個性能都有一定程度的提升.
針對數據稀疏性和新用戶冷啟動問題,本文提出了一種融合用戶上下文信息與信任關系網絡的基于擴散過程的推薦算法.借鑒社會心理學人際信任建立機制,整合用戶行為信息、用戶上下文信息、用戶興趣偏好信息3個維度的用戶相似度,建立用戶信任關系,擴展傳統的“用戶-物品”單層網絡為“用戶-用戶-物品”雙層網絡,構建用戶信任關系網絡.不同于傳統的基于資源擴散推薦算法中資源平均分配方式,本研究根據用戶之間的信任度來確定資源分配比例,讓資源按照權重分配進行擴散.研究表明,本文所提出的THP算法相較傳統推薦算法在一定程度上提升了推薦的準確度和多樣性,有效緩解了數據稀疏性對推薦算法性能的影響,較好地解決了用戶冷啟動問題,為優化基于擴散過程的推薦算法研究提供了新的方向.