中圖分類號:TP391 文獻標志碼:A 文章編號:1001-3695(2025)08-018-2383-07
doi:10.19734/j.issn.1001-3695.2025.01.0004
Multi behavior recommendation based on auxiliary behavior denoising
ChenWenhao,Chen Yuan ,Zhu Xiaei ( 4OOo54,China)
Abstract:Multi-behaviorrecommendation(MBR)systemsanalyzeuser preferences throughauxiliary behaviors toaleviate data sparsityand enhancerecommendationaccuracy.However,previous approaches thatused randomly initialized userand itemembeddingsfailed toprovidesufficientinformationvalueandignoredthenoiseinbehaviorembeddingagregationaswell asthenoiseinauxiliarybehaviorinteractionsequences.Toovercome theselimitations,thiswork introducedtheauxiliarybehavior denoising MBR model(ABD-MBR).The framework firstlypre-trainedusersand items togeneratemeaningful initial embedings.Then itdesigneda projectionagregation module to mapauxiliarybhaviorsto thetargetbehavior space,minimizing noise interference during embedding fusion.Additionally,the model implemented bot- ??k and top ??k sampling modules to refineauxiliarybehavirinteractionsequences,fectivelysuppreingsequence-levelnoise.Finally,themodelemploydmultitask learning tooptimizeitsperformance.Experimentsonthreepubliclyavailabledatasets showthat,comparedtoMB-HGCN, the model achieves an average improvement 10.2% in HR@10 and 13.4% in NDCG@10 ,demonstrating its effectiveness. Key words:multi-behaviorrecommendation;auxiliary behavior;pre-training;embedded projection;multi-task learning
0 引言
隨著互聯網的快速發展,大量的物品信息呈指數級增加,這使得人們要花費大量時間和精力來對這些信息進行管理。為了減少時間和精力的開銷,人們就需要對這些信息進行過濾處理。推薦系統[1]是一種信息過濾系統,它通過預測用戶對某些物品(如書籍、電影票等)的偏好,來向用戶推薦可能感興趣的物品。協同過濾(CF)方法[在推薦中起著關鍵的作用。協同過濾依靠用戶-物品交互數據學習用戶的偏好和物品的特征。然后使用相似度函數來估計用戶和物品之間的兼容性,并基于所得到的兼容性來提供推薦。
傳統的協同過濾方法通常專注于單一行為,但是在真實的場景中,用戶的行為不僅僅是購買,還包括點擊商品和添加購物車等行為,這些行為也能為用戶偏好提供豐富的見解。例如,用戶購買了很多電器,由于電器有種類、品牌等要素,傳統模型無法很好地預測用戶下一個物品將要購買電器,但是用戶大量點擊某品牌店鋪并把一款空調添加到購物車,多行為推薦模型就能夠通過這些輔助行為預測用戶下一個要購買的物品很大概率是在某品牌買一臺空調。因此研究人員引人了多行為推薦(MBR)方法[3]。BCIPM[4]先學習每種行為的特定偏好,然后只使用與目標行為偏好相關的部分進行推薦。這些方法利用來自多個用戶行為的數據來學習用戶偏好以有效地解決數據稀疏性問題,并有助于創建更準確的推薦系統。MB-HGCN[5]利用GCN分別對每種行為進行圖卷積操作,然后聚合學習到的用戶和物品嵌入進行目標行為推薦。盡管這些方法取得了不錯的效果,但是仍然存在以下幾個問題:a)使用隨機初始化的方式來獲得用戶和物品的初始嵌入,這種隨機初始化缺乏用戶和物品自身的信息,因此無法得到良好的初始化嵌入;b)輔助行為中存在著噪聲,雖然多行為信息的聚合可以有效地探索多維用戶興趣,但是一些行為數據也會給用戶興趣建模帶來不可避免的噪聲,例如用戶誤點了某些商品[6];c)用戶行為習慣不同導致不同行為下的交互序列長度不均衡,用戶序列長的會產生很多噪聲,用戶序列短的數據十分稀疏,這給推薦模型的準確性帶來了挑戰。
為了克服這些挑戰,本文提出了ABD-MBR模型。由于隨機初始化用戶和物品的初始嵌入缺乏信息價值,所以本文采用基于GCN的方法對用戶和物品的嵌入進行預訓練。該預訓練框架首先對所有行為的用戶和物品交互而構建的統一同構圖進行圖卷積操作,得到全局嵌入。雖然全局嵌入較為粗糙,但它含有所有用戶和物品的交互信息,因此可以作為后續在每個行為圖上進行特定行為嵌人學習的良好初始嵌人。然后,將全局嵌入作為每個行為的初始化嵌人,進行圖卷積操作,得到每個行為的特定嵌入。最后,為了從不同的行為中提取有效信息用于目標行為的預測,本文根據每個用戶行為嵌人與所有行為嵌入的相似度為每個用戶行為嵌入分配權重,并使用該權重來聚合不同行為的信息。考慮到不同行為的聚合可能會在學習過程中引入噪聲,所以在聚合過程中引入了一個投影機制,將其他用戶行為嵌入權重投影到目標行為嵌入權重空間,保留其他用戶行為與目標行為的共性嵌入權重,去掉其他用戶行為的個性嵌入權重來達到去噪音的目的。此外,針對用戶行為序列長度不均勻帶來的影響,本文提出了一個bot-k和top-k采樣模塊,通過對原始的用戶-物品交互矩陣進行刪除和添加,從而優化用戶行為序列長度帶來的影響。具體來說,通過預訓練模塊訓練結果得到更精準的用戶-物品嵌入的相關性分數,然后根據相關性分數對用戶序列長的進行bot-k采樣,刪除相關性分數低的 k 個數據來減少噪聲數據,對用戶序列短的進行top-k采樣,添加相關性分數高的 k 個數據來增強原始數據,以此來生成新的用戶-物品的交互矩陣。
本文的貢獻可以總結如下:
a)使用預訓練的方法使得用戶和物品的初始化嵌入含有更廣泛、更細致的用戶和物品交互數據。b)提出了一種新的可靠的輔助信息聚合方案,它能夠減少不同行為在權重聚合的學習過程中引人的噪聲,進而使其他行為嵌入與目標行為嵌人更相似,提高其他行為對目標行為的貢獻度。c)提出了bot-k和top-k采樣框架,它利用用戶-物品嵌入的相關性來進行bot-k和top-k采樣,以此來對活躍用戶進行去噪,對不活躍用戶進行增強,從而平衡用戶序列分布不均勻的問題。d)通過在三個真實世界數據集上進行測試。結果一致證明了該模型的有效性和通用性。與最先進的方法相比,本文方法顯示出顯著的性能改進。
1相關工作
1.1 多行為推薦
最近,MBR方法因其在緩解數據稀疏性問題方面的有效性而受到廣泛關注。基于技術的發展,MBR方法大致可以分為基于傳統機器學習、基于DNN和基于GCN的方法三類。
1.2基于傳統機器學習的多行為推薦
傳統的基于機器學習的方法構成了MBR方法的初始階段,主要側重于通過從輔助行為中獲得的數據來增強用戶和物品表征學習,其中一種方法利用矩陣分解[],旨在通過使用共享嵌入分解輔助行為的矩陣來改進表征學習,另一種策略涉及從輔助行為中采樣交互數據[8],以豐富主要行為數據集,從而有助于更好地理解用戶偏好。
1.3基于DNN方法的多行為推薦
基于DNN的方法將協同過濾與深度神經網絡相結合。這些方法利用神經網絡的強大能力來處理復雜的非線性關系,從而揭示用戶和物品之間更深層次的潛在關聯。例如,Guo等人[9]提出了一種分層注意機制來聚合從不同行為中學習到的用戶偏好。Xin等人[10]將神經網絡和注意機制結合起來,分別對基于物品的協同過濾網絡和基于關系的協同過濾網絡進行建模。Gao等人[1]采用順序建模的方法,將當前行為預測分數向前傳遞,探索不同行為之間的依賴關系。
1.4基于GCN方法的多行為推薦
基于GCN的方法利用GCN對用戶和物品之間的交互信息進行建模。高鈺瀾等人[12]采用輕量圖卷積網絡聚合鄰域特征,同時利用注意力機制融入鄰域權重,增強節點嵌入表示。Jin等人[13]提出的一種主要方法是應用GCN來學習每個行為圖中的用戶偏好,然后進行聚合過程。此外,基于GCN的方法已經納入了先進的技術。例如,Chen等人[14]實現了一種非采樣策略,并通過多任務學習開發了一個關系感知的GCN傳播層,在圖中嵌入節點表示和關系。王慧等人[15]在卷積層聚合時引用層衰減系數,區分不同層的重要性。雖然這些MBR方法的技術方法各不相同,但它們通常依賴于來自輔助行為的協作信息來增強用戶表示學習。傳統的基于機器學習的方法直接從輔助行為中的用戶-物品交互中獲得這些信息,基于DNN和GCN的方法對總體輔助行為進行建模。然而,這些方法往往忽略了輔助行為引入的潛在噪聲和用戶行為序列分布不均勻帶來的影響,本文通過使用投影聚合來減少聚合引入的噪聲,使用bot-k和top-k采樣平衡用戶序列分布。
2 總體框架
為了增強用戶和物品嵌人的表征,首先對初始嵌入進行了預訓練,預訓練利用了來自多種行為的數據,使本文能夠利用更廣泛、更細致的用戶和物品交互數據,來解決推薦系統中的數據稀疏性問題。然后使用了嵌入投影聚合策略,讓其他行為的嵌入投影到目標行為的嵌入空間,保留共性,去掉個性來減少聚合引入的噪聲影響。最后使用 bot-k 和top-k采樣對用戶行為序列長的進行刪除,用戶行為序列短的進行添加來減少用戶行為序列不均勻帶來的影響。
模型的總體框架如圖1所示,它由三個關鍵模塊組成:a)嵌入預訓練模塊;b)嵌人聚合模塊;c)bot-k和 去噪和增強模塊。
2.1 問題定義
本文符號定義如下:假設存在用戶集合 U={u1,u2,… uM} ,物品集合 I={i1,i2,…,iN} ,其中 M 和 N 分別表示用戶總體數量和物品總體數量。 G=(V,E) 是基于所有用戶-物品交互的二部圖,其中 V 表示用戶節點 u∈U 和物品節點 i∈I 組成的頂點集, E 表示圖 中用戶與物品的交互邊。在 B 種行為類型的多行為場景中,整個二部圖 G 分割為 B 行為子圖( G1 ,G2,…,G?B) 。定義 R∈RM×N 為用戶和物品的交互矩陣,其中當用戶 u 和物品 i 有交互時, rui∈R 等于1,否則, rui 等于0。問題表述如下:
輸入:用戶集u,物品集 τ, 交互矩陣R。
輸出:一個相似度分數,表示用戶 u 在目標行為中與物品 i 交互的可能性。
2.2 嵌入預訓練
2.2.1 初始化嵌入
將用戶 u 和物品 χi 的ID初始化為 d 維嵌入向量 eu0 和 ei0 。設 P∈RM×d 和 Q∈RN×d 為用戶和物品初始化嵌入的嵌入矩陣。每個用戶和物品的ID都表示為唯一的嵌入。因此,用戶 u 和物品 i 的初始化嵌入為
ei0=P?IDI,ei0=Q?IDI
其中: ??IDυ 和 IDI 分別表示用戶 和物品 ΠI 的one-hot向量
圖1 ABD-MBR模型框架
Fig.1Architecture ABD-MBR model
大多數MBR模型中用戶和物品初始嵌入通常是使用特定策略隨機初始化的(例如,正態分布或均勻分布),這樣就會導致用戶和物品嵌入缺乏有價值的信息。然而,要進行 bot-k 和top-k采樣,需要用戶和物品嵌入有良好的信息。因此,有必要在進行采樣前對嵌入進行預訓練。
首先,不區分不同類型的行為,而是將GCN應用于包含所有行為的交互數據創建的單一統一圖,充分利用所有交互信息來學習用戶的一般偏好和物品的特征。然后將學習到的全局嵌入饋送到 B 種行為的圖 GB 中,分別學習 GB 中用戶 u 和物品 i 的特定行為嵌入 euB 和 eiB 。對于每個圖中的嵌入學習,本文使用LightGCN模型[16],它是一個輕量級的基于CF的單行為推薦模型。它簡化了標準GCN,只保留了核心鄰域聚合組件,被證明是有效的。LightGCN在交互矩陣上的操作為
其中 :A 為圖的鄰接矩陣。然后,通過圖卷積運算對高階鄰域信息進行聚合。
其中: E(l) 表示第 ξl 層節點嵌入,當 l=0 時, E(0) 為用戶和物品的初始化嵌人。最后,對每層的節點嵌人進行聚合:
其中: α 為權重系數,表示第 ξl 層嵌入的重要性; E 表示用戶和物品的嵌人,作為后續模塊的輸入,其嵌入形式對于用戶 Ωu 表示為 eu ,對于物品 i 表示為 ei 。
根據式(3),分別得到 L 個嵌人來描述經過 L 層傳播后的用戶嵌入 {eu(1) (1),eu(2),…,eu(L)} 和物品嵌入 {ei(1) ei(2),…,ei(L)} 在合并之前,采用 L2 歸一化的方法來減輕嵌入尺度的影響。
其中: eug 和 eig 表示從圖 G 中學習到的全局嵌入,也是其他行為圖 GB 的共享輸入。當 L 越大,鄰居的距離越遠,重要性就會降低,所以把α,設為1 L
同式(5)一樣,將 eug 和 eig 作為其他行為圖 GB 中嵌入學習的初始嵌入,得到每個用戶 u 和物品 i 的 B 種行為的特定嵌入(即 {eu1,eu2,…,euB} 和 {ei1,ei2,…,eiB} 。
2.2.2 嵌入聚合
如圖2所示,本文采用兩種不同的策略對用戶和物品的嵌入進行聚合。針對用戶采用一種投影聚合方案;物品嵌入聚合采用了簡單的線性聚合方法。
1)用戶嵌入聚合
考慮到不同的行為可能傳遞一些不同的信息,為了從不同的特定于行為的嵌入中提取有價值的信息用于目標行為預測,本文設計了一種新的用戶嵌人聚合方案,公式為
其中: 表示把向量疊加為矩陣; U=Rd×B 是將每個行為學習的用戶嵌入疊加而成的矩陣; d 表示嵌人大小, B 表示其他行為的個數;
表示用戶的目標行為嵌人; δ 是用戶的其他行為嵌入權重投影到目標行為嵌入權重并與目標行為嵌人權重合并的權重向量。具體計算公式為
其中: ebTU 表示計算用戶的第 b 種行為與其他行為之間的嵌入相似度; 防止梯度消失,采用 stmax(?) 進行數據歸一化;(·)為向量內積運算; δorjb 和 δorjb′ 分別表示用戶的第 b 種行為嵌人權重和目標行為嵌入權重; δshab,b′ 表示將用戶的第 b 種行為嵌人權重投影到目標行為嵌人權重。
圖2嵌入聚合模塊
Fig.2Embedding aggregation module
該聚合策略的合理性在于,通過投影使其他行為包含的目標行為的偏好信息越來越多,從而在聚合時對目標行為貢獻變大。利用這種聚合策略,本文模型可以更好地從其他行為中提取有價值的信息,用于目標行為預測。
2)物品嵌入聚合
鑒于物品特征在不同行為中保持一致,本文采用了線性組合來聚合從不同行為中學習到的嵌入。在不同類型的行為中,與物品交互的用戶不同,交互的總次數(即與物品交互的用戶數量)也不同。直觀地說,交互越多,學習到的特征就越全面。據此,對物品 i 的第 b 個特定行為嵌入賦予的權重定義為
其中: ωb 是第 b 個行為的可學習參數; nib 表示在第 nib 個行為中與物品 i 進行交互的用戶數。物品 i 的特定行為的嵌人聚合為
通過以上運算,可以得到用戶的嵌入集 和物品的總嵌入
。最后使用多任務學習(multi-task leaning,MTL)[17]對預訓練步驟的訓練數據進行優化。
其中: i+ 表示物品與用戶進行交互的正樣本對; i- 表示物品與用戶沒有進行交互的負樣本對; σ(?) 為sigmoid激活函數。
2.3 bot- ?k 和top- k 采樣
本文將經常購物的用戶稱為活躍用戶,反之不經常購物的用戶稱為不活躍用戶。活躍用戶在進行購買行為之前都會進行大量的點擊,加人購物車等其他行為,就會導致在其他行為中產生大量的用戶和物品的交互數據,其中不可避免地產生噪聲,從而影響模型學習的準確性。不活躍用戶與物品的交互信息太過于稀少也會導致模型學習的效果變差。為了解決這兩個問題,設計bot-k 和 top-k 采樣這一模塊。通過對活躍用戶進行bot-k采樣去噪,對不活躍用戶進行 top-k 采樣增強來增強模型的性能。
具體來說,使用預訓練得到的用戶嵌入集 和物品嵌入集
,為用戶生成top ?k 鄰居和bot-k鄰居。對于用戶來說,前K 個鄰居可能代表經常購買、點擊的物品,后 K 個鄰居可能代表他們無意間點擊、偶爾購買的物品。用戶top ??k 鄰居是從輸出分數
中選擇最大的 K 個元素生成的,用戶 bot-k 鄰居是從輸出分數
中選擇最小的 K 個元素生成的。具體公式如下:
其中: Sumax 表示用戶top-k鄰居; Sumin 表示用戶bot-k 鄰居。
然后,定義了一個超參數 ε 來判斷用戶是否為活躍用戶。當用戶與物品交互數量大于超參數 ε 時,與用戶 bot-k 鄰居元素相對應的交互矩陣就為0,反之,小于超參數 ε 時,與用戶top ?k 鄰居元素相對應的交互矩陣就為1。具體如下:
其中 :ru 表示用戶 Ωu 與所有物品交互的總數量; ruikmax 表示與用戶top- ??k 鄰居元素相對應的交互矩陣; ruikmin 與用戶 bot-k 鄰居元素相對應的交互矩陣。
得到新的鄰接矩陣 后,根據2.2節得到新的用戶和物品嵌入集,并使用目標行為嵌人對測試數據進行優化,最后使用優化的模型進行預測。
2.4 多任務學習
采用多任務學習策略對模型進行優化。根據式(13),得到所有 B 個任務的損失函數,即 ,然后對 B 個損失函數求和進行聯合優化。最終損失函數表示為
其中: Θ 表示模型中的所有可訓練參數; β 是控制 L2 歸一化強度以防止過度擬合的系數。為了提高泛化能力,在訓練中還采用了兩種廣泛使用 dropout 策略,即 node dropout 和 messagedropout,分別用于隨機剔除圖中的節點和嵌入中的信息。
3實驗
3.1 數據集
本文在三個真實的數據集Beibei、Taobao和Tmall上進行了相關的實驗。
Beibei:本數據集來自中國最大的嬰兒用品零售電子商務平臺貝貝。該數據集包含21716個用戶和7977個物品,具有三種類型的行為,即查看、加人購物車和購買,購買為目標行為。
Taobao:本數據集是阿里巴巴集團旗下的一個電子商務網站。它包含三種不同的用戶行為:點擊、加入購物車和購買,其中購買是目標行為。
Tmall:與淘寶類似,天貓是阿里巴巴旗下的另一個電子商務網站。該數據集包括四種類型的用戶行為:點擊、收集、加入購物車和購買,其中購買是目標行為。
三個數據集的具體統計信息如表1所示。
表1數據集統計信息
Tab.1Dataset statistical information
3.2 評價指標和參數設計
為了評估模型的有效性,采用了兩個廣泛使用的評估指標[17],即命中率(hit rate) HR@K[18] 和歸一化折損累積增益(normalized discount cumulative gain) NDCG@K[19] 。其中 HR@ K 是評估推薦系統準確性的重要指標,通過分析排名列表的前K 個位置,來評估測試集中實際被用戶交互過的物品被成功推薦的比例。 NDCG@K 通過考慮推薦物品的相關性和它們在排名列表中的位置來衡量推薦物品的質量。
ABD-MBR模型基于PyTorch2.0.1框架實現。批處理大小和嵌人大小分別設置為1024和64。對于LightGCN模塊,將GCN層數固定為2。模型使用 Adam[20] 優化器進行優化,采用網格搜索法分別在[0.01,0.005,0.001,0.0005]和[0.01,0.001,0.0001]范圍內對學習率和正則化權值(β)進行調整。
為了驗證其有效性,本文將模型與九種基線方法進行比較。其中兩個是單行為方法,其余七個是多行為方法。
1)單行為模型
MF-BPR[21]:這是一種基于矩陣分解的推薦方法,它計算用戶項內積進行推薦,并利用BPR損失函數進行優化。
LightGCN[16]:該方法提供了一種簡化的基于GCN的方法,省去了不必要的非線性階段的設計。這種簡化提高了推薦性能,同時也降低了模型復雜性。
2)多行為模型
R-GCN[22] :雖然R-GCN不是為推薦任務設計的,但它對這些領域的適用性正在得到證明。該模型為從異構圖網絡中提取的信息提供了有價值的見解
NMTR:NMTR是DNN與CF相結合的一種方法,它通過順序傳播交互分數來連接不同的行為,并使用多任務學習來優化模型。
MBGCN[13]:該模型在行為特定圖中學習用戶偏好,并根據行為重要性將它們組合起來。它還使用物品-物品圖網絡,通過學習物品嵌人來增強推薦能力。
CRGCN[23]:CRGCN提出了一種行為序列建模方法。它對每個行為使用基于GCN的殘差模塊,通過嵌入傳播促進模塊之間的信息傳遞,建立行為之間的依賴關系。
MB-CGCN[24]:該模型通過直接使用LightGCN來捕獲用戶在每個行為中的偏好,并在信息傳播之前進行特征轉換,從而簡化了CRGCN。
BCIPM[4]:該模型先使用初始嵌入進行預訓練,然后識別和學習用戶在每種行為中的特定偏好,只考慮那些與目標行為相關的偏好,以獲得最終建議,從而顯著減少輔助行為帶來的噪聲。
MB-HGCN[5]:該模型通過設計一種分層圖卷積網絡來實現多行為推薦,通過從統一圖中的粗粒度和全局級別,到每個行為圖中的細粒度和特定行為級別,來深人學習用戶和物品的嵌人表示。
表2展示了本文模型與九個基準基線模型的比較實驗結果,在三個不同的數據集上進行了評估。用粗體突出了每行的最佳結果,并在次優結果下方用下畫線標出。
表2整體性能比較Tab.2 Overall performance comparison
從單行為方法的實驗結果來看,LightGCN在所有數據集上的性能始終優于MF-BPR。這種優異的性能是由于圖卷積網絡(GCN)固有的增強的表示學習能力。與MF-BPR相比,LightGCN擅長吸收來自高階鄰居的信息,而MF-BPR僅限于從直接交互中獲得見解。
多行為模型在天貓和淘寶上的效果優于單行為方法,說明了多行為模型的有效性。MBGCN通過對不同的行為賦予不同的權重,表現出明顯優于R-GCN的性能。CRGCN以順序建模為基礎,通過嵌入促進更廣泛的協作信息共享,從而優于MBGCN。MB-CGCN簡化了CRGCN。BCIPM采用預訓練策略來得到更好的初始化嵌人,在識別和學習其他行為的偏好時,只考慮與目標行為相關的偏好。而MB-HGCN設計了分層圖卷積網絡,并從全局到局部這一條路線來深人學習用戶和物品的嵌入表示。這兩種模型在數據集上都表現了出色的性能。
本文模型首先通過預訓練方法識別出用戶良好的初始偏好,然后會將其他行為的偏好投影到目標行為的偏好空間上并把它們聚合起來,最后會根據用戶的活躍程度對原始數據進行適當的調整。綜上所述,得到了以下結論:a)多種行為的融合提高了推薦系統的性能;b)在融合多種行為時,必須考慮引入噪聲的潛在問題;c)本文模型在各種數據集上表現出強大的適應性和有效性。在3.3節的消融研究中,將深入研究每個單獨模塊的貢獻和有效性。
3.3消融實驗
為了分析不同模塊的有限性,本節進行了詳細的消融研究,并將結果報告在表3中。具體實驗設置如下:a)去除全局嵌入模塊( w/oG ),本實驗剔除了全局嵌人的學習,直接使用隨機初始化的嵌人作為每個行為的初始嵌入;b)去除嵌入投影聚合模塊( W/0agg ):在這個實驗中,每個行為學習的到特定嵌人不進行聚合,使用bot-k和top-k采樣模塊得到新的鄰接矩陣,再用LightGCN進行卷積后直接進行推薦;c)去除bot-k和top-k采樣模塊( ΔW/0sam, ,本次實驗中不再進行預訓練以及bot-k 和top-k采樣模塊,初始化嵌入使用正態分布隨機初始化。
從表中可以看到,在( w/oG )這個方法中,天貓數據集性能明顯比貝貝和淘寶數據集下降得多,分析表明:貝貝和淘寶數據集大多數用戶都是一條線購買,這樣的購買方式就會使得其他行為的用戶和物品的交互信息與目標行為的用戶和物品的交互信息相差不是很大,從而使得把全局嵌人當作每個行為的初始嵌入性能提升不是很大。對于(w/oagg)方法,在三個數據集上的性能顯著性下降。分析表示:不進行聚合策略就會使得各個行為只學習自己特定的嵌入,沒有與目標行為進行交互,導致對目標行為進行預測的時候,其他輔助行為并沒有增強用戶的嵌入。通過( w/osam, )方法可以清晰地看出,使用預訓練方法來初始化用戶和物品的嵌入對模型的性能有明顯的提升。
表3消融實驗結果
Tab.3Ablation experimental results
3.4超參數和GCN層數的影響
在本實驗中,皆在研究兩個超參數的影響,即 bot-k 和 top-k 采樣的 K 和 ε 。參數 K 控制通過用戶和物品嵌人得到的輸出分數中選擇的元素個數,參數 ε 用來判斷該用戶是否為活躍用戶。如圖3和4所示,觀察結果如下。
從圖3可以明顯地看出天貓數據集的變化與其他數據集的變化不同,其中最主要的原因就是,天貓數據集中用戶和物品的交互量較多。由于天貓數據集交互量多,當參數 k 很小的時候,對活躍用戶進行去噪,去掉的用戶和物品的交互噪音量就會很少,效果就不是很明顯。但是隨著參數 k 的增加,去掉的用戶和物品的交互噪音量也會增加。
圖4參數 ε 實驗結果
Fig.4Experimental resultsparameter ε
從圖4可以清楚地看出,模型性能隨著參數 ε 的增加而減少,這是因為 ε 越大,原始數據集中活躍用戶就會變少,模型就會進行top-k操作,添加高質量物品到不活躍用戶,這就會導致新的噪聲產生,從而影響模型的性能。
在本實驗中,研究了GCN層數對模型性能的影響。在Tmall、Beibei和Taobao數據集上的實驗結果如圖5所示。其中layers °=1 Ω,layers=2,layer =3 和 layers=4 分別代表GCN層數為1層、2層、3層和4層。從圖5可以清晰地看出,GCN層數為2時表現最佳,在此基礎上再增加GCN層數會導致模型效果下降。這是因為GCN層數的增加,節點的聚合半徑也會變大,就會導致每個節點都會收斂到全局圖,這樣反而使得節點不能更好地學習自身的特征。
3.5 融合不同輔助信息的影響
設計用戶嵌入聚合策略是因為用戶興趣因行為而異。而且并非所有的用戶偏好都有助于目標行為的預測。為了驗證所設計的用戶嵌人聚合策略的有效性,進行了三個實驗。a)adaptiveagg.:提出了自適應嵌入聚合策略,讓目標行為與其他行為的嵌入相乘得到嵌人權重,根據得到的嵌入權重進行聚合。b)sumagg.:嵌入權重的獲取方式同自適應嵌人聚合策略相同,但是目標行為在嵌入權重聚合時,要與其他行為的嵌入權重相加。c)projectionagg.:在進行嵌人聚合時,將其他行為的嵌人權重投影到目標行為的嵌入權重上。然后,將所有投影后的其他行為嵌入權重與目標行為的嵌人權重相加得到新的目標行為嵌人權重,其他行為的嵌入權重為投影后的嵌入權重。
實驗結果如表4所示,采用projectionagg.的方法可獲得最好的效果。雖然方法adaptive agg.:和sumagg.:都考慮了不同行為的重要性,但是在聚合的時候,不同行為與目標行為交互時,會把不同行為自身的信息也聚合進去,這樣就會產生噪聲,使得模型不能得到更準確的用戶嵌入。
表4不同聚合策略的實驗結果
Tab.4Experimental results different aggregation strategies
3.6采用不同采樣策略的影響
由于每個用戶的物品交互量是不一樣的,有的用戶的物品交互量很多,而有的用戶很少,針對這一現象,對數據進行了采樣策略。為了驗證bot-k和top-k采樣的優越性,進行了三個實驗。a)no sam.:不進行采樣策略;b)topsam.:只進行top-k采樣;c)bot-top sam.:進行bot-k 和 top-k采樣策略。不單獨進行bot-k采樣是因為有的用戶的物品交互量太少,刪除數據的話會導致該用戶沒有物品交互量,故不單獨進行bot-k采樣。
實驗結果如表5所示,可以清晰地看出,采用本文提出的bot-k和top-k采樣效果最好。Beibei和Taobao數據集中只進行top-k采樣還沒有不進行采樣策略的效果好,其中最主要的原因是只進行top-k采樣對那些物品交互量很大的用戶起到的作用很少,甚至可能還添加了新的噪聲進去,所以效果不是很好。
表5不同采樣策略的實驗結果
Tab.5Experimental results different sampling strategies
4結束語
本文提出了基于輔助行為去噪的多行為推薦模型。該模型通過預訓練得到更豐富的初始化嵌人,再通過嵌入投影聚合模塊從不同行為中聚合用戶嵌人來減少嵌入聚合時產生的噪音。然后通過bot-k和 top-k 采樣,減少活躍用戶的噪聲,增強不活躍用戶的數據信息。最后使用多任務學習提高模型的魯棒性。在未來的工作中,將研究如何在嵌人聚合中能更好地將其他行為與目標行為的物品嵌入聚合在一起。
參考文獻:
[1]ChengHT,KocL,HarmsenJ,etal.Widedeeplearningfor recommender systems[C]//Proc the1st Workshop on Deep Learningfor Recommender Systems.New York:ACM Press,2016:7- 10.
[2]Dong Xiao,Zhu Lei,Song Xuemeng,et al.Adaptive collaborative similarity learning for unsupervised multi-view feature selection [C]//Proc the27th International Joint Conferenceon Artificial Intelligence.[S.l.]:International Joint Conferences on Artificial Intelligence Organization,2018:2064-2070.
[3]Chen Chong,Zhang Min,Zhang Yongfeng,et al.Efcient heterogeneouscollaborative filtering without negative sampling for recommendation[C]//Proc AAAI Conference on Artificial Intelligence.Palo Alto,CA:AAAI Press,2020:19-26.
[4]Yan Mingshi,Liu Fan, Sun Jing,et al. Behavior-contextualized item preference modeling for multi-behavior recommendation[C]//Proc the 47th International ACM SIGIR Conference on Research and Development in Information Retrieval.New York:ACM Press,2024: 946-955.
[5]Yan Mingshi,Cheng Zhiyong,Sun Jing,et al. MB-HGCN:a hierarchical graph convolutional network for multi-behavior recommendation [EB/OL].(2023-06-19).https://doi.org/10.48550/arXiv. 2306.10679.
[6]Xu jingcao,Wang Chaokun,Wu Cheng,et al.Multi-behavior Selfsupervised Learning for Recommendation [C]//Proc the 46th International ACM SIGIR Conference on Research and Development in Information Retrieval.New York:ACM Press,2023:496-505
[7]Qiu Huihuai,Liu Yun,Guo Guibing,et al.BPRH:Bayesian personalized ranking for heterogeneous implicit feedback[J].Information s,2018,453:80-98.
[8]Ding Jingtao,Yu Guanghui,He Xiangnan,et al.Improving implicit recommender systemswithviewdata[C]//Procthe27th International Joint Conferenceon ArtificialIntelligence.[S.1]:International Joint Conferences on Artificial Intelligence Organization,2O18:3343- 3349.
[9]Guo Long,HuaLifeng,JiaRongfei,etal.Buyingorbrowsing:Predicting real-time purchasing intent using atention-based deep network withmultiple behavior[C]//Proc the25thACMSIGKDD International Conference on Knowledge Discovery Data Mining.New York:ACMPress,2019:1984-1992.
[10] Xin Xin,He Xiangnan, Zhang Yongfeng,et al.Relational collaborative filtering:modeling multiple item relations forrecommendation [C]//Proc the 42nd International ACM SIGIR Conference on Research and Development in Information Retrieval. New York:ACM Press,2019:125-134.
[11] Gao Chen,He Xiangnan,Gan Dahua,et al. Learning to recommend with multiple cascading behaviors [J]. IEEE Trans on Knowledge and Data Engineering,2021,33(6):2588-2601.
[12]高鈺瀾,黃賢英,陶佳.基于輕量圖卷積和注意力增強的多行為 推薦模型[J].計算機應用研究,2022,39(6):1753-1759. (Gao Yulan, Huang Xianying, Tao Jia. Multi-behavior recommendation model based on light graph convolution and enhanced attention [J].Application Research s,2022,39(6): 1753- 1759.)
[13]Jin Bowen,Gao Chen,Jin Depeng,et al.Mult behavior Recommendation with Graph Convolutional Networks[C]//Proc the 43rd International ACM SIGIR Conference on Research and Development in InformationRetrieval. New York:ACM Press,2020:659-668.
[14]Chen Chong,Ma Weizhi,Zhang Min,et al.Graph heterogeneous multi-relational recommendation[C]//Proc the 35th AAAI Conference on Artificial Intelligence. Palo Alto,CA:AAAI Press,2021: 3958-3966.
[15]王慧,梁興柱,張緒,等.基于鄰接矩陣優化和負采樣的圖卷積 推薦[J].計算機應用研究,2024,41(12):3628-3633.(Wang Hui,Liang Xingzhu,Zhang Xu,et al.Graph convolutional recommendation basedonadjacency matrix optimization and negative sampling[J]. Application Research s, 2024,41(12): 3628-3633. )
[16]He Xiangnan,Deng Kuan,Wang Xiang,etal.LightGCN:simplifying and powering graph convolution network for recommendation [C]//Proc the 43rd International ACM SIGIR conference on research and development in Information Retrieval. New York:ACM Press,2020: 639-648.
[17]Tang Hongyan,Liu Junning,Zhao Ming,et al.Progressive layered extraction(PLE):a novel multi-task learning(MTL)model for personalized recommendations[C]// Proc the 14th ACM Conference on Recommender Systems. New York:ACM Press,202O: 269-278.
[18]Karypis G.Evaluation item-based top- N recommendation algorithms[C]//Proc the 10th ACMCIKM International Conference on Information and Knowledge Management. New York: ACM Press, 2001: 247-254.
[19]Jarvelin K,KekalainenJ.IR evaluation methods for retrieving highly relevant documents [C]//Proc the 23rd Annual International ACM SIGIR Conference on Research and Development in Information Retrieval.New York:ACMPress,200O:41-48.
[20]Diederik P,Kingma,Jimmy B.Adam:a method for stochastic optimiztion[C]//Proc the3rdInteational ConferenceonLeaing Representations.2015:1-15.
[21]Rendle S,Freudenthaler C,Gantner Z,et al. BPR:Bayesian personalized ranking from implicit feedback [C]//Proc the 25th International Conference on Uncertainty in Artificial Intelligence.Arlington,US: AUAI Press,2009: 452-461.
[22]Schlichtkrull M,Kipf TN,Bloem P,et al.Modeling relational data with graph convolutional networks[C]// Proc the 15th European Semantic Web Conference. Cham:Springer,2018: 593-607.
[23]Yan Mingshi,Cheng Zhiyong,Gao Chen,etal.Cascading residual graph convolutional network for multi-behavior recommendation [J]. ACM Transactions on Information Systems,2024,42(1) : 1-26.
[24]Cheng Zhiyong,Han Sai,Liu Fan,et al. Multi-behavior recommendation with cascading graph convolution networks[C]//Proc ACM Web Conference.New York:ACM Press,2023:1181-1189.
收稿日期:2025-01-16;修回日期:2025-03-03基金項目:國家自然科學基金資助項目(62472059);重慶市自然科學基金面上項目(CSTB2022NSCQ-MSX1672);重慶英才計劃項目(CSTC2024YCJH-BGZXM0022);重慶市教育委員會科學技術研究計劃重大項目(KJZD-M202201102)
作者簡介:陳文浩( (2000-) ,男,重慶人,碩士研究生,主要研究方向為推薦系統;陳媛(1966—),女(通信作者),湖北武漢人,教授,碩士,主要研究方向為智能信息處理、數據挖掘(""cqut.edu.cn);朱小飛(1979—),男,江蘇揚州人,教授,博士,CCF會員,主要研究方向為自然語言處理、數據挖掘、信息檢索.