關(guān)鍵詞:跨域推薦;冷啟動問題;圖神經(jīng)網(wǎng)絡(luò);異構(gòu)信息網(wǎng)絡(luò);元路徑中圖分類號:TP311 文獻標志碼:A 文章編號:1001-3695(2025)08-017-2374-09doi:10.19734/j.issn.1001-3695.2025.01.0022
Cross-domain recommendation method based on aggregation of intra-domain and inter-domain meta-paths
Xu Jia 1,2 ,Wang Xin3,Wang Yanqiu4?,Wu Haiwei3,Lyu Pin1 (1.CyberspaceuteofdadlogouUesityaga;ateKybotoyse curityDefesedsof Inforationii;ofceleit Guangdong 518055,China)
Abstract:Cros-domainrecommendation technologyeffectivelyenhances therecommendation performanceof the targetdomain bydeeplyminingandutilizing useful informationfrom otherdomains,providing anefectivesolution tousercold-start problem.However,existingcross-domainrecommendationmethods havelimitations,failing tofinelyexpandimplicitrelationshipsandneglectingpotentialredundantinformationinembeddingvectors,whichrestrictstheperformanceofcross-domain recommendationsystems.Toaddressthis,this paper introduced theintra-domainandinter-domainmeta-pathsaggregation basedcro-domainrecommendationmethod(IMCDR).Specifically,IMCDR firstlycalculated thefine-grainedsemanticembedding of entities across multiple fields,thereby efectively extending user-userand item-itemrelations.Then,IMCDR generated privatefeaturesandshared featuresforeach nodebasedonintra-domainmeta-pathsand inter-domain meta-paths respectively,andefectivelyintegratedtemtoobainbeterqualityembeddngvectors.Experimentalresultsacrosstecossdomain recommendation tasksdemonstrate that IMCDR significantlyoutperforms in terms of precision andoverallperformance.
Keywords:cross-domainrecommendation;usercold-start problem;graph neural network;heterogeneous informationnetwork;meta-path
0 引言
在快速變革的數(shù)字化時代,各種應(yīng)用不斷涌現(xiàn),海量產(chǎn)品、新聞和視頻等內(nèi)容不斷發(fā)布和更新,網(wǎng)絡(luò)信息和數(shù)據(jù)呈爆炸式增長,互聯(lián)網(wǎng)用戶難以在信息海洋中找到真正有價值和感興趣的內(nèi)容[1,2]。為解決這一問題,推薦系統(tǒng)(recommendation sys-tem,RS)應(yīng)運而生,其核心思想是通過分析用戶的基本信息、歷史行為和社交關(guān)系等信息,推斷用戶的興趣,然后優(yōu)先向用戶展示可能感興趣的物品,如圖1所示。推薦系統(tǒng)廣泛應(yīng)用于電商平臺、新聞平臺和短視頻平臺等網(wǎng)絡(luò)服務(wù)中,有效提升了用戶滿意度和平臺活躍度。
圖1推薦系統(tǒng)示例
Fig.1Example of a recommendation system
傳統(tǒng)推薦模型基于用戶-物品交互信息,采用協(xié)同過濾(collaborative filter,CF)[3]或矩陣分解(matrix factorize,MF)[4]等方法建模用戶的低維向量表示,即用戶偏好。因此,傳統(tǒng)推薦模型的準確性嚴重依賴于用戶-物品交互的數(shù)量[5]。對于缺乏交互數(shù)據(jù)的新用戶來說,推薦系統(tǒng)無法準確建模用戶偏好,這就是用戶冷啟動問題[6]
為解決用戶冷啟動問題,現(xiàn)有研究通常借助輔助信息(如用戶資料和物品屬性)學(xué)習(xí)冷啟動用戶的偏好[7]。還有的研究使用情景元學(xué)習(xí)范式將用戶冷啟動推薦問題轉(zhuǎn)換為少樣本學(xué)習(xí)問題[8]。隨著互聯(lián)網(wǎng)的發(fā)展,用戶在不同領(lǐng)域的交互越來越廣泛,因此跨域推薦(cross-domainrecommendation,CDR)成為緩解用戶冷啟動問題的一條重要技術(shù)路線。跨域推薦挖掘利用其他域的有用信息,豐富目標領(lǐng)域的數(shù)據(jù)并提升推薦表現(xiàn),從而緩解用戶冷啟動問題。
基于圖神經(jīng)網(wǎng)絡(luò)的跨域推薦方法[9~13]整合不同域的信息到同一個圖中,基于圖神經(jīng)網(wǎng)絡(luò)方法聚合節(jié)點特征,獲得用于推薦的用戶和物品的嵌人向量[14]。其中,ReCDR[9]和I2RCDR[11]首先構(gòu)建僅包含域內(nèi)用戶-物品交互的單域圖,提取目標用戶的私有特征;然后根據(jù)用戶間、物品間的相似性來擴展這些關(guān)系,構(gòu)造包含所有域的用戶-物品交互、用戶-用戶和物品-物品關(guān)系的跨域圖,從中提取目標用戶的共享特征;最后把這兩種特征進行融合,實現(xiàn)推薦。與傳統(tǒng)方法相比,雖然這些方法有效地改善了重疊用戶不足場景下的跨域推薦表現(xiàn),但仍存在兩方面局限:
a)現(xiàn)有方法擴展用戶-用戶(或物品-物品)關(guān)系是粗粒度的。具體來說,現(xiàn)有方法[15,16]為每個用戶或物品合成一個包含其評論和標簽等內(nèi)容的文檔(如圖2中實線框所示),通過該文檔的語義嵌入計算節(jié)點間的相似性,從而連接兩個用戶節(jié)點(或物品節(jié)點)。但是,這種方法在語義層級上是粗粒度的,可能導(dǎo)致關(guān)系擴展不準確。如圖2所示,電影 m3 (《少年派的奇幻漂流》)與書籍 b1 (《哈利波特》)都屬于冒險類內(nèi)容,體現(xiàn)在其簡介中(如虛線邊框所示)。但由于情節(jié)差異,它們收到的評論內(nèi)容卻大相徑庭(如點虛線邊框所示)。現(xiàn)有機制將簡介和評論合并到一個文檔中計算相似度,由于評論內(nèi)容遠多于簡介,可能會降低兩者的相似性,從而無法根據(jù) m3 (《少年派的奇幻漂流》)推薦 b1 (《哈利波特》)。因此,如何在兩個領(lǐng)域之間建立細粒度的關(guān)系擴展是提升推薦效果的關(guān)鍵。
b)現(xiàn)有工作沒有考慮私有特征和共享特征之間存在的信息冗余。具體地,現(xiàn)有方法[9,]為了學(xué)習(xí)用戶和物品節(jié)點的私有域內(nèi)特征和共享域間特征,構(gòu)建了一個單域圖和一個跨域圖。基于這兩個圖,采用同樣的方法(如層次注意力機制[]或圖卷積神經(jīng)網(wǎng)絡(luò)[8])分別提取節(jié)點的私有特征和共享特征,進行進一步融合。然而,由于兩個圖存在局部相似性,在提取的私有特征和共享特征之間存在信息冗余,導(dǎo)致融合后嵌人質(zhì)量不佳,不僅降低了推薦準確性,還會增加模型復(fù)雜度以及過擬合風(fēng)險[17]。如圖3所示,用戶 u3 與電影 m1 和 m3 交互的信息從單域圖和跨域圖中被重復(fù)提取,模型可能會錯誤地將冗余信息視為獨立信息,導(dǎo)致分析結(jié)果產(chǎn)生偏差,影響推薦準確性。因此,探索一種分別學(xué)習(xí)跨域異構(gòu)信息網(wǎng)絡(luò)中節(jié)點的私有特征和共享特征,有效減少信息冗余,提高嵌入表征質(zhì)量的方法至關(guān)重要。
圖3私有特征和共享特征之間存在信息冗余 Fig.3Informationredundancybetweenprivateandshared features
在重疊用戶不足的場景下,為了解決現(xiàn)有跨域推薦方法無法細粒度擴展隱式關(guān)系,以及未考慮私有特征和共享特征中存在冗余信息的問題,本文提出了一種新穎的基于域內(nèi)和域間元路徑聚合的跨域推薦方法,IMCDR(intra-domainandinterdomain meta-paths aggregation based cross-domain recommendationmethod)。IMCDR首次實現(xiàn)對用戶和物品不同維度語義特征的細粒度建模,通過擴展用戶-用戶及物品-物品關(guān)系,構(gòu)建一個豐富的跨域信息網(wǎng)絡(luò),減少了推薦表征中的冗余信息,從而有效應(yīng)對用戶冷啟動問題。IMCDR根據(jù)域內(nèi)和域間元路徑的特點,采用差異化編碼技術(shù)編碼元路徑實例,促進了有用信息的整合和遷移。IMCDR利用注意力機制,對不同模版和類型的元路徑依次聚合,生成每個用戶和物品的私有特征和共享特征。最后,通過對兩種特征融合,IMCDR得到了最終用戶和物品的嵌入表征,有效減少了信息冗余,提升嵌入向量的質(zhì)量。最后在三個跨域任務(wù)上進行了大量實驗,證明了本文提出的IMCDR方法的有效性。
本文方法適用于電商、影視、音樂、書籍等領(lǐng)域的諸多跨域推薦場景。如,在電商平臺中,已經(jīng)積累了大量用戶-衣服的數(shù)據(jù),但對新上架的商品類別如頭飾,缺少直接的用戶行為數(shù)據(jù)。在這種情況下,IMCDR通過分析用戶對服裝的反饋信息,提取用戶對風(fēng)格、顏色、材質(zhì)等維度的偏好,并將其映射到頭飾類商品中。例如,喜歡“簡約風(fēng)格”服裝的用戶,可能會對“簡約風(fēng)格”的頭飾感興趣。同時,IMCDR通過域內(nèi)元路徑(服裝域內(nèi)的用戶-服裝交互)和域間元路徑(服裝域與頭飾域之間的用戶偏好遷移)分別提取用戶的私有特征和共享特征,避免了傳統(tǒng)方法中因信息冗余導(dǎo)致的推薦偏差。最終,IMCDR可以在缺失用戶數(shù)據(jù)的情況下為頭飾商品生成有效的推薦。
通過上述實例,IMCDR方法在實際跨域推薦場景中展現(xiàn)了其強大的應(yīng)用潛力。相較于現(xiàn)有方法,IMCDR能夠更好地處理冷啟動問題,減少信息冗余,并提供更準確的推薦結(jié)果。因此IMCDR方法在電商、影視、音樂等多個領(lǐng)域的跨域推薦中都具有廣泛的應(yīng)用前景。
1相關(guān)工作
隨著深度學(xué)習(xí)和圖論知識的不斷發(fā)展,基于圖神經(jīng)網(wǎng)絡(luò)的跨域推薦[16]逐漸興起,受到了學(xué)術(shù)界和工業(yè)界的廣泛關(guān)注。
基于圖神經(jīng)網(wǎng)絡(luò)(graphneuralnetwork)[16]的跨域推薦范式的核心思想是整合不同域的信息,構(gòu)建共享的跨域信息網(wǎng)絡(luò)來表示多個域的用戶、物品和其他因素(即圖中的節(jié)點),以及它們之間的關(guān)系(即圖中的邊)。基于構(gòu)建的網(wǎng)絡(luò),通過圖神經(jīng)網(wǎng)絡(luò)等方法聚合節(jié)點的特征,將來自不同域的節(jié)點的表示嵌入到相同的空間中,即為每個節(jié)點學(xué)習(xí)其在域內(nèi)的表示,如圖4所示。通過這種方法,學(xué)習(xí)到的表示能夠捕獲節(jié)點之間高階的和非線性的依賴關(guān)系,從而實現(xiàn)域內(nèi)推薦[14]
圖4基于圖神經(jīng)網(wǎng)絡(luò)推薦范式示例
Fig.4Example of a graph-based neural network recommendation paradigm
NSCR模型[18]首次將圖神經(jīng)網(wǎng)絡(luò)應(yīng)用于跨域社會推薦,它旨在向社交域的用戶推薦信息域的物品。具體來說,NSCR首先在信息域利用一個屬性感知的深度協(xié)同過濾模型學(xué)習(xí)用戶-物品交互,然后利用多層圖卷積網(wǎng)絡(luò)將重疊用戶的嵌入向量從信息域轉(zhuǎn)移到社會域。但是,這種方法間接合并跨域信息,因為它需要在每個域內(nèi)處理用戶-物品的交互行為。HeroGRAPH模型[19]收集所有域的用戶-物品交互以構(gòu)建一個共享圖,基于該圖,利用循環(huán)注意力機制的圖卷積操作來直接建模用戶的跨域行為,最后將用戶物品的域內(nèi)表示和跨域表示組合起來實現(xiàn)最終的推薦。進一步地,ECHCDR[19]首先使用 doc2vec 技術(shù)[20]生成用戶或物品的內(nèi)容表示,并將它們與其鄰接表示連接起來,作為用戶和物品的初始表示。然后利用對抗性學(xué)習(xí)算法,同時訓(xùn)練一個生成器和一個鑒別器來學(xué)習(xí)用戶和物品的適當(dāng)表示以進行推薦。但是,當(dāng)域之間重疊的用戶或物品太少或沒有重疊時,就需要通過其他方面的信息(如評論、標簽的語義信息)來擴展節(jié)點間的關(guān)系,從而構(gòu)建異構(gòu)信息網(wǎng)絡(luò)。ReCDR模型[]和I2RCDR模型[8]基于圖神經(jīng)網(wǎng)絡(luò)技術(shù)[16],根據(jù)已有的交互關(guān)系和擴展的相似關(guān)系,分別構(gòu)建一個單域圖和一個跨域圖,從兩個圖中提取用戶的私有特征和共享特征以進行進一步的融合,從而實現(xiàn)推薦。然而,由于兩個圖存在局部相似性,會造成提取的兩種特征之間存在信息冗余,降低融合后的表征質(zhì)量。
現(xiàn)有基于圖神經(jīng)網(wǎng)絡(luò)的跨域推薦方法存在兩方面問題,(a)現(xiàn)有方法擴展用戶-用戶(或物品-物品)關(guān)系是粗粒度的,可能導(dǎo)致關(guān)系擴展不準確,需要探索跨域細粒度的關(guān)系擴展。(b)現(xiàn)有工作沒有考慮到私有特征和共享特征之間存在信息冗余,導(dǎo)致嵌人表征質(zhì)量不佳。針對現(xiàn)有跨域推薦研究中所存在的不足,本文進一步進行深入研究,以期望能夠緩解上述問題,更好地滿足現(xiàn)實場景中的推薦任務(wù),提升推薦效果。表1為基于圖神經(jīng)網(wǎng)絡(luò)的跨域推薦技術(shù)研究現(xiàn)狀匯總。
2 預(yù)備知識
2.1 問題定義
本文標記 U={u1,u2,u3,…,uN} 為用戶集,而 V={v1,v2 ,v3,…,vM} 為物品集。此外,用戶與物品之間的評分矩陣可以標記為 R ,其中 ri,j∈R 表示用戶 ui 與物品 vj 之間的評分。在每個CDR任務(wù)中有兩個域,本文采用上標 {s,t} 來區(qū)分它們,其中 s 表示源域, Ψt 表示目標域。本文預(yù)測的目標是用戶是否會選擇該物品,即 代表預(yù)測的結(jié)果是用戶 ui 會選擇物品 vj ,而
則代表預(yù)測的結(jié)果是用戶 ui 不會選擇物品 vj° (204號
表1基于圖神經(jīng)網(wǎng)絡(luò)的跨域推薦技術(shù)研究現(xiàn)狀
Tab.1Research status of cross-domain recommendation technology based on graph neural network
2.2 關(guān)鍵概念
受文獻[22]啟發(fā),結(jié)合跨域推薦特性,現(xiàn)給出本文關(guān)鍵概念定義:
a)定義1跨域異構(gòu)信息網(wǎng)絡(luò)(或稱為跨域圖)。一個跨域異構(gòu)信息網(wǎng)絡(luò)表示為 Gc=(N,εe,εi) ,其中節(jié)點集 N 包括用戶集和物品集的所有節(jié)點,即 N={U,V} 。需注意, εe 指的是Gc 中的顯式邊集合,即用戶-物品交互,而 εi 指的是隱式邊的集合,即用戶-用戶和物品-物品關(guān)系。
b)定義2域內(nèi)元路徑。給定一個跨域異構(gòu)信息網(wǎng)絡(luò) Gc 一個節(jié)點的域內(nèi)元路徑被定義為 ,其中 nAi 表示節(jié)點集中的一個用戶或物品節(jié)點,下標 Ai 表示A域中的一種節(jié)點類型。注意,域內(nèi)元路徑 pi 中的所有節(jié)點都來自同一域中,且首尾節(jié)點為同類型節(jié)點。域內(nèi)元路徑 pi 長度定義為 pi 中的節(jié)點數(shù)。
c)定義3域間元路徑。給定一個跨域異構(gòu)信息網(wǎng)絡(luò) Gc ,一個節(jié)點的域間元路徑被定義為 pc=nAi?…?nBi ,其中 nAi 表示來自A域的一個節(jié)點,而 nBi 表示來自B域的一個節(jié)點,即域間元路徑的首尾節(jié)點是來自不同域的同類型節(jié)點。類似地,域間元路徑 pc 的長度被定義為元路徑 pc 中的節(jié)點數(shù)。
域內(nèi)元路徑和域間元路徑的首尾節(jié)點都限定為同一類型(用戶或物品),便于根據(jù)元路徑找相似用戶/物品,實現(xiàn)有效推薦[22]
3 IMCDR算法
IMCDR(intra-domain and inter-domain meta-paths aggrega-tionbasedcross-domainrecommendationmethod)算法的整體框架如圖5所示,其由四個部分組成,分別是跨域信息網(wǎng)絡(luò)構(gòu)建層、基于域內(nèi)和域間元路徑的嵌入層、特征融合層和推薦層。在跨域信息網(wǎng)絡(luò)構(gòu)建層使用BERT模型(12層,768維隱藏層,110M 參數(shù))生成用戶和物品的多字段語義嵌人并通過語義相似度擴展用戶-用戶和物品-物品關(guān)系。在基于域內(nèi)和域間元路徑的嵌入層,采用Bi-LSTM(隱藏層設(shè)置為128維)對域內(nèi)元路徑進行編碼,使用RotatE技術(shù)對域間元路徑進行編碼,并通過多頭注意力機制聚合不同元路徑實例的表征。特征融合層首先拼接基于域內(nèi)和域間元路徑的嵌入向量,并經(jīng)過一個線性層生成用戶和物品的推薦向量。推薦層則基于用戶和物品的最終表示,計算用戶選擇物品的預(yù)測概率。
3.1跨域信息網(wǎng)絡(luò)構(gòu)建層
為了在域之間建立聯(lián)系,已有方法構(gòu)建一個跨域信息網(wǎng)絡(luò),擴展用戶-用戶和物品-物品關(guān)系以彌補缺乏重疊用戶的局限。具體來說,它們將用戶(或物品)不同字段(或?qū)傩裕┑膬?nèi)容進行整合,收集到單個文檔中,然后采用 doc2vec 技術(shù)[20]生成每個文檔的語義嵌入,從而計算用戶之間(或物品之間)的相似度,在相似度較高的用戶對(或物品對)之間建立連接。
這種方法雖然能夠在整體上把相似度高的節(jié)點連接起來,但它是一種粗粒度的方式,很可能導(dǎo)致用戶-用戶(和物品-物品)關(guān)系擴展的不準確,或者遺漏一些本該被擴展的關(guān)系。為了解決這一局限性,本文提出在跨域信息網(wǎng)絡(luò)構(gòu)建層中使用一個細粒度的多字段語義嵌入模塊和一個基于語義相似度的關(guān)系擴展模塊來構(gòu)建一個關(guān)系豐富且準確的跨域異構(gòu)信息網(wǎng)絡(luò)。
圖5IMCDR結(jié)構(gòu)Fig.5IMCDR structure
3.1.1多字段語義嵌入模塊
盡管來自不同領(lǐng)域的用戶和物品大部分是不重疊的,但它們可能在某些方面相互關(guān)聯(lián)。細粒度的多字段語義嵌入模塊可以從用戶(或物品)的基本信息(或簡介)和評論信息等多個字段層面出發(fā),分別提取它們的語義特征,而不是基于一個整體的文檔提取。
由于BERT模型[23能夠更好地理解語言中的語義和語境關(guān)系,對句子和文本的表示能力較強。所以,本模塊基于每個字段層面的內(nèi)容,利用預(yù)先訓(xùn)練好的BERT模型理解文本信息,然后生成語義嵌人。此外,本文還引入TF-IDF分數(shù)表示詞的權(quán)重,并以BERT計算得到的向量與TF-IDF分數(shù)相乘表示帶權(quán)重向量表示,從而提升語義嵌入表征準確性[24]。以物品 vi 為例,其簡介和評論可以記為 b 和 r 物品 vi 的語義嵌人結(jié)果如下:
其中: text(x) 表示該物品的簡介 b 或評論 r 的文本內(nèi)容,即 x∈ [b,r];t 則是簡介或評論中的token; 是文本標記的嵌人; φTF-IDF(t) 是每個文本標記的tf-idf分數(shù),它是基于所有域收集到的文本語料庫計算出來的。
3.1.2基于語義相似度的關(guān)系擴展模塊
在獲得用戶和物品在不同字段下的語義嵌入后,在語義嵌入空間中對兩個域中的所有用戶(或物品)兩兩之間的相似性S(ν1,ν2) 進行計算和比較。然后,在不同的字段下,相似度高于閾值 ρ 的用戶-用戶、物品-物品關(guān)系被認為是相似的。接下來,在相似的節(jié)點之間建立起相互的連接,從而構(gòu)建起一個跨域異構(gòu)信息網(wǎng)絡(luò) Gc=(N,εe,εi) 。其中,節(jié)點集 N 包含用戶集U 和物品集 V 的所有節(jié)點,即 N={U,V} ,兩個域的用戶-物品交互被視為顯示的邊 εe ,而通過細粒度的關(guān)系擴展生成的邊(即用戶-用戶和物品-物品關(guān)系)稱為隱式的邊 εi 。
3.2基于域內(nèi)和域間元路徑的嵌入層
嵌入層基于所構(gòu)建的跨域信息網(wǎng)絡(luò)生成每個用戶節(jié)點和物品節(jié)點的私有特征和共享特征。由于元路徑已經(jīng)被證明可以有效地捕獲用戶的行為偏好[22],所以,為了獲得每個用戶和物品節(jié)點無冗余、高質(zhì)量的私有和共享特征,本節(jié)創(chuàng)新性地設(shè)計了域內(nèi)元路徑和域間元路徑提取每個節(jié)點基于域內(nèi)元路徑的表征(即私有特征)和基于域間元路徑的表征(即共享特征)。
3.2.1域內(nèi)元路徑編碼器
對于域內(nèi)元路徑來說,每條元路徑上的所有節(jié)點都屬于同一領(lǐng)域。因此,可以把這些基于域內(nèi)元路徑的節(jié)點看作一個序列。雙向長短期記憶網(wǎng)絡(luò)(bidirectionallongshort-termmemorynetwork,Bi-LSTM)[22]是傳統(tǒng)的長短期記憶網(wǎng)絡(luò)(LSTM)的擴展,在兩個方向上分別處理輸入序列,從而能夠更好地捕捉序列中的上下文信息,常用于對序列建模。本章采用Bi-LSTM方法對域內(nèi)元路徑實例進行編碼,獲得目標節(jié)點基于該條元路徑實例的表征。例如,給定一個域內(nèi)元路徑實例 pi(m,n),m 和 n 分別表示元路徑的首尾節(jié)點,利用Bi-LSTM技術(shù)對該元路徑進行編碼,有效地促進了嵌入學(xué)習(xí)節(jié)點 m 和 n 之間的結(jié)構(gòu)和語義信息。
hpi(m,n)=Bi-LSTM({ht,?t∈P(m,n)})
其中 ??hpi(m,n) 為域內(nèi)元路徑實例的向量表示; ht 表示這條域內(nèi)元路徑中每個節(jié)點的向量表示,即 P(m,n) 是元路徑上所有節(jié)點的集合,包含節(jié)點 m,n 和它們之間的中間節(jié)點集合。
3.2.2域間元路徑編碼器
對于域間元路徑來說,元路徑上的節(jié)點涉及到不同的領(lǐng)域,并且連接兩個節(jié)點的邊(或關(guān)系)里包含著用戶偏好在兩個域之間的遷移信息。傳統(tǒng)方法,如TransE[25]和 DistMult[26] 將這些關(guān)系表示為普通向量或矩陣,無法捕捉到關(guān)系之間的復(fù)雜語義。而RotatE技術(shù)[27]通過引人旋轉(zhuǎn)操作來解決這個問題。它將節(jié)點與節(jié)點間的關(guān)系表示為向量 r ,其中向量的模表示關(guān)系的強度,而向量的輻角表示關(guān)系的方向或旋轉(zhuǎn)角度。通過旋轉(zhuǎn)操作 ? (向量中逐個元素乘積),RotatE在向量空間中模擬了關(guān)系之間的旋轉(zhuǎn)或變換,從而捕捉到域與域之間的連接模式和關(guān)聯(lián)強度,更有效地處理異構(gòu)的節(jié)點和邊。假設(shè) pc(m) n )是一條域間元路徑實例,它連接了目標節(jié)點 m 和其基于該條元路徑實例的鄰居節(jié)點 n ,則基于RotatE技術(shù)的域間元路徑編碼器可以表述為
其中:域間元路徑實例 表示元路徑實例的長度; h′ti 表示域間元路徑中節(jié)點 ti 的向量表示; ei 表示從開始節(jié)點 t0 到當(dāng)前節(jié)點 ti 的向量累加中間結(jié)果;ri 是節(jié)點 ti-1 與 ti 之間關(guān)系向量; ? 代表元素級乘積。
3.2.3元路徑聚合器
元路徑聚合器包含兩個層面的聚合,即基于元路徑模板的聚合和基于元路徑類型的聚合。首先在不同的元路徑模板下,聚合已編碼的元路徑實例,得到節(jié)點基于該模板的表征。其次,根據(jù)域內(nèi)(或域間)元路徑類型,聚合不同模板下的表征。經(jīng)過兩次聚合,生成每個節(jié)點的基于域內(nèi)元路徑的表征(私有特征)和基于域間元路徑的表征(共享特征)。
1)基于元路徑模板的聚合
對于每個元路徑模板來說,不同的實例對目標節(jié)點的表示影響不同。圖注意機制[28]為本文提供了一種合適的方法來解決元路徑實例的重要性問題,即通過對不同的元路徑實例進行加權(quán)求和,從而獲得目標節(jié)點基于該元路徑模板的表示。以域內(nèi)元路徑模板 TjI∈τI 為例,為了實現(xiàn)這個目標,首先需要計算每個元路徑實例 pi(m,n) 對于該模板的重要性 ,其公式如下:
其中: api 為參數(shù)化的注意力向量; 表示目標節(jié)點 m 和元路徑實例 pi(m,n) 的連接。此外, σ 是一個合適的激活函數(shù),本文使用的是LeakyReLU函數(shù)。
然后再計算元路徑實例的歸一化注意力得分(或貢獻權(quán)重)如下:
其中 是目標節(jié)點 ?m 基于域內(nèi)元路徑模板 τI 的鄰居集合。softmax函數(shù)被用來計算在域內(nèi)元路徑模板 TjI 下,目標節(jié)點 ?m 的域內(nèi)元路徑實例 pi(m,n) 的歸一化注意力得分
mno (2號
接下來,目標節(jié)點 ?m 基于域內(nèi)元路徑模板 TjI 的表示可以通過聚合所有帶權(quán)重的實例嵌入來計算,公式如下:
綜上所述,給定一個目標節(jié)點 ∣m ,其節(jié)點類型為 A ,注意 A∈ N={U,V} 。那么,在所有的域內(nèi)元路徑模板中,該節(jié)點的域內(nèi)元路徑模板集合為 τAI={T1I,T2I,…,TMI} 。因此,基于元路徑模板的聚合步驟會生成 M 個關(guān)于目標節(jié)點 m∈NA 的基于域內(nèi)元路徑模板的向量表示,標記為 。
2)基于元路徑類型的聚合
在得到了基于元路徑模板的向量嵌入之后,對于域內(nèi)元路徑和域間元路徑兩類元路徑來說,需要分別聚合基于元路徑模板獲得的語義信息,從而獲得每個節(jié)點最終的基于域內(nèi)元路徑的表征(私有特征)和域間元路徑的表征(共享特征)。以域內(nèi)元路徑為例,對于所有的節(jié)點 m∈NA ,首先通過平均所有基于域內(nèi)元路徑模板 TiI∈τAI 的節(jié)點向量總結(jié)該元路徑模板,公式為
其中: WA 和 b?A 都是可學(xué)習(xí)的參數(shù),此處的激活函數(shù) σ 是 tanh(Σ) 。
接下來,由于注意力機制的有效性,本文也采用了注意力機制來聚合基于元路徑模板的向量表示,而不是簡單地計算這些向量的元素級均值。關(guān)于節(jié)點 ?m 的基于域內(nèi)元路徑的節(jié)點向量嵌入計算如下:
其中: bA 為參數(shù)化的注意力向量; :βTiI 表示在域內(nèi)元路徑類型下的元路徑模板 TiI 對 A 節(jié)點類型的相對重要性。最后,節(jié)點 ?m 基于域內(nèi)元路徑的最終表示 可以通過注意力得分 βTiI 與節(jié)點 m 基于每個元路徑模板的表征加權(quán)和來計算。通過使用類似的計算過程,可以得到節(jié)點 ψm 基于域間元路徑的最終表示
。
3.3 特征融合層
特征融合層需要將每個節(jié)點的私有特征和共享特征進行有效融合,得到節(jié)點的最終表示。例如,對于目標用戶 u ,其節(jié)點類型 A=U ,通過上述步驟計算得到其基于域內(nèi)和域間元路徑的嵌入向量,即 和
,用戶 u 的最終表示計算如下:
hu=Wo?(huτU⊕huτU)+b
其中: 是一個拼接操作; Wo 是一個可學(xué)習(xí)的權(quán)重矩陣,這一步中的映射函數(shù)取決于具體的推薦任務(wù)。
3.4推薦層
在具體的推薦領(lǐng)域中,給定用戶 u 和該域物品 v 的最終表示,即 hu 和 hv ,可以計算用戶選擇該物品的預(yù)測概率,公式如下:
其中: ? 為元素級的內(nèi)積操作。根據(jù)預(yù)測概率 ,可以決定是否將該物品推薦給用戶。
最后,在每個域內(nèi)最小化以下?lián)p失,以更新IMCDR的參數(shù):
其中: 是用戶-物品交互的正樣本集合;
是采樣的用戶-物品交互的負樣本集合。此外,此處的激活函數(shù) σ 是 sigmoid 函數(shù)。
4實驗評估
4.1實驗設(shè)置
本節(jié)將介紹IMCDR模型的實驗數(shù)據(jù)集、評價指標、實驗對比模型和參數(shù)設(shè)置。在此基礎(chǔ)上,將提出的IMCDR模型與其他先進模型進行性能比較和分析。
4.1.1數(shù)據(jù)集
為了評估IMCDR的推薦性能,本章在三個公共且流行的數(shù)據(jù)集上進行了廣泛的實驗。這三個數(shù)據(jù)集分別是:Mo-vieLens25 數(shù)據(jù)集(http://grouplens.org/datasets/movielens/25m ,簡寫為M)、Amazon數(shù)據(jù)集(http://jmcauley.ucsd.edu/data/amazon/links.html,簡寫為A)和Douban數(shù)據(jù)集(https://www.douban.com/,簡寫為D)。具體來說,MovieLens是一個廣泛應(yīng)用于電影推薦系統(tǒng)研究和開發(fā)的數(shù)據(jù)集,本章將由MovieLens數(shù)據(jù)集中提取的電影域交互數(shù)據(jù)稱為M-Movie。Amazon數(shù)據(jù)集廣泛應(yīng)用于電子商務(wù)領(lǐng)域的研究,本章將由Amazon數(shù)據(jù)集中提取的電影域和游戲域數(shù)據(jù)稱為A-Movie和A-Game。Douban數(shù)據(jù)集包含了電影、圖書、音樂等領(lǐng)域的商品數(shù)據(jù),本章將由Douban數(shù)據(jù)集中提取的電影域、書籍域和音樂域的交互數(shù)據(jù)稱為D-Movie、D-Book和D-Music。
將以上三個數(shù)據(jù)集中提取的具體域組合為三個CDR任務(wù),即M-Movie→A-Movie(任務(wù)1)D-Movie $$ A-Game(任務(wù)2)和D-Music→D-Book(任務(wù)3),其中每個CDR任務(wù)包含一個較為豐富的源域(箭頭的左邊)和一個相對稀疏的目標域(箭頭的右邊)。在實驗中,共包含五種節(jié)點類型:源域用戶、目標域用戶、源域物品、目標域物品、重疊用戶(既屬于源域又屬于目標域),通過節(jié)點類型編碼限定實現(xiàn)元路徑首尾節(jié)點類型一致。由于任務(wù)1和2的源域和目標域來源于不同的數(shù)據(jù)集,所以無法識別出這兩個域中重疊的用戶和物品,可以用其模擬兩個域之間沒有重疊實體的場景。而任務(wù)3的源域和目標域來自于相同的數(shù)據(jù)集,因此它們之間有重疊用戶。以任務(wù)2中用戶 u1 為例,其在亞馬遜游戲域(A-Game)中沒有交互記錄。然而,該用戶在豆瓣電影域(D-Movie)中的交互行為豐富,歷史觀看記錄包括《指環(huán)王》《哈利波特》《加勒比海盜》《荒野獵人》等冒險類電影,并給出高評分。這是典型的跨域推薦冷啟動問題,本文的IMCRD方法可通過其觀影記錄為其推薦游戲。表
2提供了這三個任務(wù)的詳細信息及統(tǒng)計數(shù)據(jù),其中(s)和(t)標記分別表示源域和目標域。
表2三個數(shù)據(jù)集的統(tǒng)計信息
Tab.2Statistics for the threedatasets
4.1.2 評價指標
本文采用AUC(areaunderthecurve,ROC曲線下方的面積大小)和AP(averageprecision,平均精確度)兩個指標來評價所提出的IMCDR模型,這些指標通常用于評估推薦系統(tǒng)中二元偏好預(yù)測任務(wù)的性能[28]。這兩個指標的值越高表示模型的排序性能越好。
4.1.3實驗對比模型
為了驗證IMCDR的有效性,本研究將其與六個現(xiàn)有的推薦模型進行性能比較,包括:單域的PNN[29]、DIN[30]、Deep-FM[30] ,多域的MAGRec[12]、ReCDR[9]、I2RCDR[1]以及HCCDR[15]模型。對上述對比模型的詳細描述如下:
a) PNN[29] 運用嵌入層學(xué)習(xí)分類數(shù)據(jù)的分布式表示,然后基于嵌入特征向量構(gòu)建產(chǎn)品層,捕捉字段之間的交互特征,最后進一步地使用全連接層探索具有高階特征的交互。
b) DIN[31] 是一種用于點擊率預(yù)測的深度興趣網(wǎng)絡(luò)模型。它創(chuàng)新性地通過自適應(yīng)學(xué)習(xí)用戶在不同候選物品下的興趣表示,能夠有效地捕捉用戶的多樣興趣,提高模型表達能力。
c)DeepFM[30]是一種基于因子分解機的神經(jīng)網(wǎng)絡(luò)模型,用于二元偏好預(yù)測。該模型結(jié)合了FM模型和深度神經(jīng)網(wǎng)絡(luò)的優(yōu)點,既能夠捕捉二階交互特征,又能夠?qū)W習(xí)到更高階的交互特征。
d)MAGRec[12]將圖神經(jīng)網(wǎng)絡(luò)引人到序列感知推薦系統(tǒng)中,它從多個域的歷史用戶-物品交互中捕捉領(lǐng)域之間的關(guān)系,并使用雙分支網(wǎng)絡(luò)整合全局和最近的用戶興趣。
e)ReCDR[9首先將每個域中的交互建模為一個局部圖。然后利用預(yù)先訓(xùn)練好的節(jié)點相似性來擴展用戶間、物品間關(guān)系,使不同域之間的交互能夠在一個全局圖中表達。基于局部圖和全局圖,ReCDR采用了一種層次注意機制,對重要的節(jié)點和邊進行加權(quán),獲得節(jié)點表征。
f)I2RCDR[1]基于評分矩陣和擴展關(guān)系,構(gòu)造了一個跨域異構(gòu)圖和兩個單域異構(gòu)圖,讓模型同時考慮不同域之間的交互以及每個域的內(nèi)部特征。然后通過一個關(guān)系感知圖卷積網(wǎng)絡(luò),對圖結(jié)構(gòu)信息進行特征提取和關(guān)系建模。最后引入了一種門控融合機制,將域共享和域特定的信息進行融合,在雙目標推薦任務(wù)中取得良好的效果。
g)HCCDR[15]基于嵌入和映射的跨域推薦范式,分別對嵌入階段和映射進行加強,提升跨域推薦的性能,但是該模型的訓(xùn)練依賴于兩個域的重疊用戶交互數(shù)據(jù),因此只能在任務(wù)3中進行測試。
4.1.4 實現(xiàn)方案
本文使用PyTorch1.10.0實現(xiàn)IMCDR,并且使用GPU(NVIDIARTXA5000)和CPU(IntelCorei9-119002.50G)對模型進行訓(xùn)練。
模型使用多頭注意力機制,對于任務(wù)1和2,注意力頭的數(shù)量為8,節(jié)點的隱藏狀態(tài)維度為512,注意力向量的維度為64。對于任務(wù)3,注意力頭的數(shù)量為4,節(jié)點的隱藏狀態(tài)維度為256,注意力向量的維度為64。模型訓(xùn)練的最大輪數(shù)為100,早停的耐心值為5,批量大小為8。
本文將訓(xùn)練集、驗證集和測試集的比例設(shè)置為7:2:1,訓(xùn)練時采用Adam優(yōu)化器[8],并將其學(xué)習(xí)率設(shè)置為0.005,L2正則化參數(shù)設(shè)置為0.001。為了進行公平的比較,在相同的數(shù)據(jù)集上,本文對所有模型設(shè)置相同的嵌入維數(shù) d 關(guān)于對比模型,本文的實現(xiàn)和超參數(shù)的設(shè)置都基于提供的代碼和相應(yīng)的論文描述。為了實現(xiàn)比較的公平,本研究對所有對比模型的超參數(shù)都進行了仔細調(diào)整,以使它們達到最佳性能。其中,對于ReCDR和I2RCDR模型,為其分別構(gòu)建單域交互圖和包含擴展關(guān)系的跨域交互圖,對ReCDR用注意力機制對其鄰居節(jié)點進行聚合,對于I2RCDR采用對節(jié)點向量和邊向量進行元素級加法,模擬關(guān)系感知的圖神經(jīng)網(wǎng)絡(luò)。其他基線則使用原始的最優(yōu)設(shè)置,或使用驗證集進行優(yōu)化。
4.2實驗結(jié)果分析
4.2.1整體性能比較
本節(jié)對IMCDR和最先進的對比模型在三個CDR任務(wù)下進行了性能比較。表3展示了實驗結(jié)果。其中,最佳值用粗體表示,次佳值用下畫線表示,表中的improvement是指IMCDR相對于次佳值基線的改進。本研究對實驗結(jié)果進行分析,得出以下結(jié)論。
表3IMCDR模型與基線整體比較實驗結(jié)果
Tab.3Experimental results of the IMCDRmodel compared tobaseline
a)本章提出的IMCDR模型在三個任務(wù)上的性能表現(xiàn)始終優(yōu)于其他對比模型。例如,在任務(wù)1和2中,相較于次佳的基線ReCDR,IMCDR將指標AUC分別提高了 2.31% 和 4.09% ,將指標AP提高了 3.31% 和 4.77% 。在任務(wù)三中,比HCCDR模型在AUC(或AP)指標上改進了 1.71% (或 1.95% ),說明基于圖神經(jīng)網(wǎng)絡(luò)學(xué)習(xí)到的用戶和物品表征質(zhì)量比通過映射得到的表征質(zhì)量更好。
b)跨域推薦技術(shù)(即MAGRec、ReCDR、I2RCDR、HCCDR和IMCDR方法)比傳統(tǒng)的單域推薦技術(shù)(即PNN、DIN和DeepFM方法)表現(xiàn)出更優(yōu)異的性能。這表明跨域推薦的方法通過將來自不同領(lǐng)域的數(shù)據(jù)進行融合和利用,可以更全面地挖掘和理解用戶的興趣和需求,從而提供更準確且個性化的推薦結(jié)果。
c)目標域的密度越大,推薦的效果越好。如任務(wù)1、2和3的目標域密度分別為 0.067%.0.071% 和 0.275% ,密度依次遞增,而它們的推薦效果從差到好也是按照任務(wù)1、2和3的順序。這說明較高的目標域密度意味著更多的可用信息和更豐富的數(shù)據(jù),可能導(dǎo)致更準確的推薦結(jié)果。
d)在跨域推薦中,在目標域密度相差不大的前提下,源域與目標域的密度相差越大,對于目標域的提升越大。以任務(wù)1和2為例,它們的目標域密度幾乎相等,但任務(wù)1的源域與目標域之間的密度差僅為 0.112% ,而任務(wù)2的源域與目標域之間的密度差則達到 0.981% 。在這種情況下,跨域推薦方法對任務(wù)2的性能提升更為明顯。這表明當(dāng)源域與目標域之間的密度差異較大時,跨域推薦方法可以更充分地利用源域的信息來輔助目標域的推薦任務(wù)。
e)盡管基于任務(wù)3(含重疊用戶)執(zhí)行基線方法以及IM-CDR方法均比基于任務(wù)1、2(無重疊用戶)更好,但與基線方法相比性能提升并不明顯。可見,本文IMCDR方法在無重疊用戶及物品場景中,相比于現(xiàn)有最好方法跨域效果更好。
f本文提出的IMCDR模型在所有任務(wù)上的表現(xiàn)均優(yōu)于ReCDR和I2RCDR模型。這一結(jié)果可歸因于兩個方面。首先,IMCDR通過減少用戶和物品嵌人向量之間的冗余性,提高了嵌入表示的質(zhì)量。其次,IMCDR專注于對目標域的優(yōu)化,而不采用多目標域優(yōu)化的方法,因為多目標域優(yōu)化的方法可能難以兼顧不同目標域的需求,從而降低了整體的推薦性能。
4.2.2 消融實驗
本節(jié)旨在通過消融實驗,來探討IMCDR模型各個組件的有效性。具體來說,本節(jié)設(shè)計了七種變體,它們與IMCDR的區(qū)別如下:
a)IMCDR(D2V):將用戶和物品的簡介、評論等內(nèi)容添加到一個統(tǒng)一的文檔中,用doc2vec技術(shù)[20]生成語義嵌入。
b)IMCDR-IPE:刪去IMCDR中的域內(nèi)元路徑編碼器。
c)IMCDR-CPE:刪去IMCDR中的域間元路徑編碼器。
d)IMCDR(B):對域內(nèi)和域間元路徑都使用Bi-LSTM技術(shù)進行編碼。
e)IMCDR(R):對域內(nèi)和域間元路徑都使用RotatE技術(shù)進行編碼。
f)IMCDR(Avg):對域內(nèi)和域間元路徑都使用平均操作進行編碼。
g)IMCDR(Linear):對域內(nèi)和域間元路徑都使用線性操作進行編碼。
本文對三個任務(wù)進行了消融實驗(見表4),其中,最佳值用粗體表示,次最佳值用下畫線表示。結(jié)果分析如下:
a)多字段語義嵌入模塊的有效性。根據(jù)表4的結(jié)果,可以觀察到IMCDR相對于IMCDR(D2V)表現(xiàn)出更好的性能。這種差異可以歸因于IMCDR(D2V)和IMCDR在生成語義嵌入方面所采取的不同策略。IMCDR(D2V)使用整合的文本內(nèi)容來生成語義嵌入,可能會導(dǎo)致信息的損失或混淆。相比之下,IMCDR采取了細粒度的多字段語義嵌入策略,細粒度地提取不同字段的內(nèi)容,并生成對應(yīng)的語義嵌入,從而提升用戶-用戶和物品-物品關(guān)系擴展的準確度。
b)域內(nèi)元路徑和域間元路徑編碼器的有效性。表4的結(jié)果顯示,IMCDR相對于IMCDR-IPE和IMCDR-CPE表現(xiàn)出更好的性能。因為IMCDR同時保留了域內(nèi)和域間元路徑編碼器,能夠綜合探索和利用域內(nèi)和域間的有用信息,加強用戶和物品的嵌入。而IMCDR-IPE刪去了域內(nèi)元路徑編碼器,性能相較于IMCDR有所下降,這是因為此變體忽略了推薦目標域內(nèi)的信息。類似地,IMCDR-CPE刪去了域間元路徑編碼器,僅保留了域內(nèi)元路徑編碼器,限制了推薦的性能。這是因為它無法捕捉到不同域之間的關(guān)聯(lián)性和可利用的有用跨域信息。其次,通過IMCDR與IMCDR(B)、IMCDR(R)、IMCDR(Avg)、IMCDR(Linear)的比較可知,IMCDR優(yōu)于其他四個變體。IMCDR采用RotatE建模域間路徑,Bi-LSTM建模域內(nèi)路徑,有效地促進了元路徑的結(jié)構(gòu)和語義信息的學(xué)習(xí),提升了基于元路徑實例得到的節(jié)點嵌入向量。RotatE是一種圖嵌入,更適合建模用戶與物品之間隱式的關(guān)系,而域間路徑更復(fù)雜、更不容易被發(fā)現(xiàn),適合使用RotatE。而Bi-LSTM更注重文本顯性關(guān)系,所以更適合對關(guān)系偏顯性的域內(nèi)關(guān)系進行建模。
而IMCDR(B)僅使用Bi-LSTM技術(shù),IMCDR(R)僅使用RotatE技術(shù)編碼所有的元路徑,導(dǎo)致性能下降,這說明單一的編碼技術(shù)可能無法充分捕捉到不同類型元路徑的特征。再結(jié)合IMCDR(Avg)、IMCDR(Linear)的結(jié)果可知,僅使用平均操作和線性操作編碼域內(nèi)和域間元路徑,導(dǎo)致性能下降得更加嚴重,這說明較為簡單的操作無法捕獲元路徑上節(jié)點和邊之間的復(fù)雜關(guān)系。
表4消融實驗結(jié)果
Tab.4Ablation experiment results
4.2.3參數(shù)分析實驗
本節(jié)在三個任務(wù)上對IMCDR分別進行了兩組參數(shù)敏感性實驗,以探討相似度閾值和嵌入向量維度等參數(shù)對模型推薦性能的影響。具體分析如下:
a)節(jié)點相似度閾值 ρ 對性能的影響。相似度閾值 ρ 會影響擴展的用戶間關(guān)系和物品間關(guān)系的數(shù)量。當(dāng)改變 ρ 的值時,IMCDR在三個任務(wù)中的表現(xiàn)參見圖6。分析圖中結(jié)果可知,隨著節(jié)點相似度閾值 ρ 增加,兩個指標的值先提高然后下降,因為更大的閾值可以讓相似性較高的用戶(或物品)之間被連接,從而可以構(gòu)建更豐富、信息量更大的跨域信息網(wǎng)絡(luò)。但是,當(dāng)閾值 ρ 超過其最優(yōu)值時,生成的相似關(guān)系數(shù)量就會減少,從而減少了有用的可學(xué)習(xí)信息。本文將任務(wù)1的閾值 ρ 設(shè)置為0.95,而將任務(wù)2和3的閾值設(shè)置為0.9,從而保持IMCDR的最佳性能。
b)嵌人向量維度 d 的大小對性能的影響。本節(jié)通過改變嵌人維度從16到256,研究其對模型的影響,實驗結(jié)果如圖7所示。對于任務(wù)1和2來說,IMCDR的性能在維度大小為64時達到最佳,而對于任務(wù)3來說,嵌入向量維度等于32時性能最佳。這說明了較高的嵌人維度不僅無法提升模型表現(xiàn),反而可能會降低模型性能和導(dǎo)致較大的計算開銷。但是如果嵌入向量的維度過小,則會使嵌入向量難以學(xué)習(xí)到更多有效的信息。因此,本文將任務(wù)1和2中IMCDR模型的嵌人維度默認設(shè)為64,任務(wù)3中的嵌入維度設(shè)置為32,以獲得最優(yōu)性能。
圖7IMCDR嵌入維度 d 對模型性能的影響
4.2.4計算效率分析
最后,本節(jié)從每輪訓(xùn)練時間和內(nèi)存消耗兩個方面來研究IMCDR模型的計算效率。需要注意的是,本節(jié)基于任務(wù)1,選擇了兩個次佳的方法ReCDR和I2RCDR來與提出的IMCDR模型進行比較,結(jié)果如圖8所示。
圖8三種方法訓(xùn)練時間和內(nèi)存消耗峰值比較 Fig.8Comparison of the peak training time and memory consumption of the threemethods
從圖8中可以看出,IMCDR在訓(xùn)練時間和內(nèi)存消耗兩個方面都優(yōu)于其他兩個方法,這是因為IMCDR模型僅需要構(gòu)建一個跨域異構(gòu)信息網(wǎng)絡(luò),而ReCDR和I2RCDR需要分別構(gòu)建單域圖和跨域圖來建模用戶和物品的私有特征和共享特征,這導(dǎo)致了額外的計算和內(nèi)存開銷。因此,IMCDR模型在計算效率上具有明顯的優(yōu)勢,成為處理大規(guī)模數(shù)據(jù)和資源受限環(huán)境下的有效選擇。
5結(jié)束語
在重疊用戶稀疏或難以識別重疊用戶的場景下,為了解決現(xiàn)有方法沒有細粒度地擴展隱式關(guān)系且未考慮嵌入向量中含有冗余信息的問題,本文提出了一種新穎的基于域內(nèi)元路徑和域間元路徑聚合的跨域推薦方法IMCDR(intra-domainandinter-domain meta-paths aggregation based cross-domain recom-mendationmethod)。該方法首次細粒度地建模用戶和物品不同維度的語義特征,擴展用戶間、物品間關(guān)系,從而構(gòu)建一個豐富的跨域信息網(wǎng)絡(luò)。其次,IMCDR進一步地基于域內(nèi)和域間元路徑的特點,采取不同的編碼技術(shù)編碼元路徑實例,促進了有用信息的整合和遷移。然后基于注意力機制,對于不同模版和類型下的元路徑依次聚合,生成每個用戶和物品的私有特征和共享特征。最后,通過對兩種特征融合,IMCDR得到了最終用戶和物品的嵌入表征,有效減少了信息冗余,提升嵌入向量的質(zhì)量。在三個公共數(shù)據(jù)集組成的三個CDR任務(wù)上進行了大量實驗,并與其他先進方法進行了比較。實驗結(jié)果顯示,IMCDR在各項評估指標上明顯優(yōu)于其他方法,這表明無論是否擁有重疊用戶,IMCDR都具有顯著的有效性和優(yōu)越性,能夠提供更準確和個性化的跨域推薦服務(wù)。
現(xiàn)有推薦工作難以處理語義差異較大的域間推薦以及動態(tài)數(shù)據(jù)流場景,本文后續(xù)將探索語義差異極大的域間推薦及基于動態(tài)數(shù)據(jù)流的動態(tài)推薦。本工作為后續(xù)這些研究工作的開展奠定了重要基礎(chǔ)。
參考文獻:
[1]朱育頡,劉虎沉.網(wǎng)上購物平臺多推薦融合算法研究[J].計算 機科學(xué),2021,48(S2):232-235.(Zhu Yujie,Liu Huchen.Researchonmulti-recommendation fusion algorithm of online shopping platform[J].ComputerScience,2021,48(S2):232-235.)
[2]張子揚,劉小洋.基于元學(xué)習(xí)的多視圖對比融合冷啟動推薦算法 [J].計算機應(yīng)用研究,2024,41(7):2025-2032.(ZhangZiyang,Liu Xiaoyang. Multi-view contrast fusion cold start recommendation algorithm based onmeta-learning[J].Application Research ofComputers,2024,41(7):2025-2032.)
[3]Gao Chen,ZhengYu,WangWenjie,etal.Causal inferencein recommender systems:a survey and future directions[J].ACM Trans on Information Systems,2024,42(4):1-32.
[4]Yu Junliang,Yin Hongzhi,Xia Xin,et al.Self-supervised learning for recommender systems:a survey[J]. IEEE Trans on Knowledge and Data Engineering,2023,36(1):335-355.
[5]Wu Hanrui,WongCW,ZhangJia,etal.Cold-start next-item recommendation by user-item matching and auto-encoders [J].IEEE Trans on Services Computing,2023,16(4):2477-2489.
[6]Hao Bowen,Yin Hongzhi, Zhang Jing,et al.A multi-strategy-based pre-training method for cold-start recommendation[J].ACM Trans on Information Systems,2023,41(2):1-24.
[7]Zhan Zhu, Xu Bugao. Analyzing review sentiments and product images by paralel deep nets for personalized recommendation[J].Information Processingamp;Management,2023,60(1):103166.
[8]Xu Jia, Zhang Hongming,Wang Xin,et al. AdaML:an adaptive meta-learning model based on user relevance for user cold-startrecommendation [J]. Knowledge-Based Systems,2023,279: 110925.
[9]Xu Kun,Xie Yuanzhen,Chen Liang,et al.Expanding relationship for cross domain recommendation[C]//Proc of the 3Oth ACM International Conference on Informationamp;Knowledge Management.New York:ACM Press,2021:2251-2260.
[10] Zhu Feng,Chen Chaochao,Wang Yan,et al. DTCDR : a framework for dual-target cross-domain recommendation[C]//Proc of the 28th ACM International Conference on Information amp; Knowledge Management.New York:ACM Press,2019:1533-1542.
[11]Wang Ke,Zhu Yanmin,Liu Haobing,et al. Inter-and intra-domain relation-aware heterogeneous graph convolutional networks for crossdomain recommendation [M]//Database Systems for Advanced Applications.Cham:Springer,2022:53-68.
[12]Ariza-Casabona A,Twardowski B,Wijaya T K. Exploiting graph structured cross-domain representation for multi-domain recommendation[M]//Advances in Information Retrieval. Cham: Springer Nature Switzerland,2023:49-65.
[13]李瑞征,趙加坤.一種融合知識圖注意神經(jīng)網(wǎng)絡(luò)的推薦算法 [J].計算機應(yīng)用與軟件,2024,41(3):276-282.(Li Ruizheng, Zhao Jiakun. Knowledge graph attention network for recommendation systems[J].Computer Applications and Software,2024,41 (3): 276-282.)
[14] Zang Tianzi, Zhu Yanmin,Liu Haobing,et al.A survey on crossdomainrecommendation:taxonomies,methods,and future directions [J].ACM Trans on Information Systems,2023,41(2): 1-39.
[15]Xu Jia,Wang Xin, Zhang Hongming,etal.Heterogeneous and clustering-enhanced personalized preference transfer for cross-domain recommendation[J]. Information Fusion,2023,99:101892.
[16] Zhu Feng,Wang Yan,Chen Chaochao,et al. A graphical and attentional framework for dual-target cross-domain recommendation [C]// Proc of the 29th International Joint Conference on Artificial Intelligence.2020:3001-3008.
[17] Zhang Ruohan, Zang Tianzi, Zhu Yanmin,et al. Disentangled contrastive learning for cross-domain recommendation[M]//Database Systems for Advanced Applications.Cham:Springer Nature Switzerland,2023:163-178.
[18] Wang Xiang,He Xiangnan,Nie Liqiang,et al.Item silk road: recommending items from information domains to social users[C]// Proc of the 4Oth International ACM SIGIR Conference on Research and Development in Information Retrieval.New York:ACM Press, 2017: 185-194.
[19]Cui Qiang,Wei Tao,Zhang Yafeng,et al. HeroGRAPH: aheterogeneous graph framework for multi-target cross-domain recommendation [C]//Proc of the 14th ACM Conference on Recommender Systems. New York:ACM Press,2020.
[20] Li Jin, Peng Zhaohui,Wang Senzhang,et al. Heterogeneous graph embedding for cross-domain recommendation throughadversarial learning[M]//Database Systems for Advanced Applications.Cham: Springer,2020:507-522.
[21]Wu Zonghan,Pan Shirui,Chen Fengwen,et al.A comprehensive survey on graph neural networks [J]. IEEE Trans on Neural Networksand Learning Systems,2021,32(1):4-24.
[22]Fu Xinyu,Zhang Jiani,Meng Ziqiao,etal.MAGNN:metapath aggregated graph neural network for heterogeneous graph embedding [C]//Proc of Web Conference.New York:ACM Press,2020: 2331-2341.
[23]Devlin J,ChangM,Le K,etal.BERT: pre-training ofdeepbidirectional transformers forlanguage understanding[C]//Proc of North American Chapter of the Association for Computational Linguistics: Human Language Technologies. Stroudsburg,PA: ACL Press,2019: 4171-4186.
[24]Li Zhi, Amagata D,Zhang Yihong,et al.Debiasing graph transfer learning via item semantic clustering for cross-domain recommendations [C]//Proc of IEEE International Conference on Big Data.Piscataway,NJ: IEEE Press,2022:762-769.
[25]Zhou Peng,Shi Wei,Tian Jun,et al.Attention-based bidirectional long short-term memory networks for relation classification[C]//Proc of the 54th Annual Meeting of the Association for Computational Linguistics.Stroudsburg,PA:ACL Press,,2016:207-212.
[26]Yang Han,Liu Junfei. Knowledge graph representation learning as groupoid:unifying TransE,RotatE,QuatE,ComplEx[C]//Proc of the 3Oth ACM International Conference on Information amp; Knowledge Management.New York:ACM Press,2021: 2311-2320.
[27]Yang Bishan,Yih WT,He Xiaodong,et al.Embedding entities and relations forlearning and inference in knowledge bases[C]//Proc of the 3rd International Conference on Learning Representation.2015.
[28]Velickovic P,Cucurull G, Casanova A,et al.Graph attention networks[C]// Proc of International Conference on Learning Representations.[S.1.]:Openview.net,2018.
[29]Shani G,Gunawardana A.Evaluating recommendation systems [M]//Recommender Systems Handbook. Boston,MA: Springer, 2010: 257-297.
[30] Zhou Guorui,Zhu Xiaoqiang,Song Chengru,et al. Deep interest network for click-through rate prediction [C]//Proc of the24th ACM SIGKDD International Conference on Knowledge Discovery amp;Data Mining.New York:ACM Press,2018:1059-1068.
[31]Qu Yanru,Cai Han,Ren Kan,et al.Product-based neural networks for user response prediction[C]//Proc of the 16th IEEE International Conference on Data Mining. Piscataway,NJ:IEEE Press,2016: 1149-1154.
[32]呂艷霞,郝帥,喬廣通,等.一種基于圖神經(jīng)網(wǎng)絡(luò)的社會化推薦 算法[J].東北大學(xué)學(xué)報:自然科學(xué)版,2024,45(1):10-17. (Lyu Yanxia,Hao Shuai, Qiao Guangtong,et al. A social recommendation algorithm based on graph neural network[J].Journal of Northeastern University:Natural Science,2024,45(1):10-17.)
[33]Le Q,Mikolov T.Distributed representations of sentences and documents[C]// Proc of International Conference on Machine Learning. New York: ACM Press, 2014: 1188-1196.
[34]Sun Zhiqing,Deng Zhihong,Nie Jiantang,et al. Rotate: knowledge graph embedding by relational rotation in complex space[C]//Proc of International Conference on Learning Representations.[S.1.]:Openview.net,2019:905-910.
[35]Guo Huifeng,Tang Ruiming,Ye Yunming,et al.DeepFM:a factorization-machine based neural network for CTR prediction[C]// Procof the26th International Joint Conference on Artificial Inteligence 2017.1725-1731
收稿日期:2025-01-11;修回日期:2025-03-14 基金項目:廣東省基礎(chǔ)與應(yīng)用基礎(chǔ)研究基金資助項目(2025A1515011582,2025A1515012952);深圳職業(yè)技術(shù)大學(xué)校級重點科研項目(6025310013K)
作者簡介:許嘉(1984—),女,山東榮成人,教授,碩導(dǎo),博士,CCF杰出會員,主要研究方向為推薦系統(tǒng)和數(shù)據(jù)管理;王歆(1998—),女,云南紅河人,碩士,主要研究方向為跨域推薦系統(tǒng);王艷秋(1986—),女(通信作者),內(nèi)蒙赤峰人,講師,博士,主要研究方向為數(shù)據(jù)分析和數(shù)據(jù)管理技術(shù)(wangyanqiu@ szpu.edu.cn);吳海威(2000—),男,福建泉州人,碩士,主要研究方向為個性化推薦系統(tǒng);呂品(1983—),男,山東濱州人,教授,碩導(dǎo),博士,CCF杰出會員,主要研究方向為個性化推薦和物聯(lián)網(wǎng).