
















摘 要:基于知識(shí)圖譜的主流推薦模型在融合高階信息時(shí)較少考慮源節(jié)點(diǎn)與目標(biāo)節(jié)點(diǎn)之間的關(guān)系,在復(fù)雜網(wǎng)絡(luò)場(chǎng)景中易引入過多噪聲信息進(jìn)而影響推薦性能。針對(duì)此問題提出一種融合元圖鄰域的知識(shí)圖譜推薦模型,通過構(gòu)建并融合元圖鄰域降低噪聲信息的影響,提升推薦性能。首先,基于元圖相似度生成源節(jié)點(diǎn)的初始相似序列,利用自注意力網(wǎng)絡(luò)與線性網(wǎng)絡(luò)對(duì)初始序列進(jìn)行特征增強(qiáng),以增強(qiáng)后的特征向量組成的集合構(gòu)造節(jié)點(diǎn)的元圖鄰域。其次,基于用戶對(duì)各個(gè)元圖的不同偏好程度設(shè)計(jì)注意力機(jī)制,對(duì)所得元圖鄰域進(jìn)行卷積聚合,將元圖鄰域融入源節(jié)點(diǎn),增強(qiáng)源節(jié)點(diǎn)的特征表示。最后,以增強(qiáng)后的向量與用戶向量的內(nèi)積作為用戶與項(xiàng)目交互的概率,并以此完成推薦。在MovieLens-20M與Last-FM數(shù)據(jù)集上進(jìn)行實(shí)驗(yàn),AUC與F1值分別為97.3%和83.1%、94.3%和75.6%,recall@50分別為35.4%與31.7%,其表現(xiàn)優(yōu)于NGCF、KGCN、LKGR等模型。結(jié)果表明,融合元圖鄰域的知識(shí)圖譜推薦模型可以有效提升推薦的性能。
關(guān)鍵詞:個(gè)性化推薦; 知識(shí)圖譜; 元圖; 卷積神經(jīng)網(wǎng)絡(luò); 注意力機(jī)制
中圖分類號(hào):TP391.3;G353.1 文獻(xiàn)標(biāo)志碼:A
文章編號(hào):1001-3695(2024)08-023-2412-07
doi:10.19734/j.issn.1001-3695.2023.12.0610
Knowledge graph recommendation model with integratedmeta-graph neighborhoods
Zhang Bin, Hao Lixin, Zhang Guofang
(School of Cybersecurity & Computer Science, Hebei University, Baoding Hebei 071000, China)
Abstract:Mainstream knowledge graph-based recommendation model rarely consider the relationship between source nodes and target nodes when fusing high-order information, leading to the introduction of too much noise information and thus affec-ting recommendation performance in complex network scenarios. To address this problem, this paper proposed a knowledge graph recommendation model with integrated meta-graph neighborhoods, with the goal of reducing the impact of noise information by constructing and integrating meta-graph neighborhoods, thereby improving recommendation performance. Firstly, the model obtained the initial similar sequence of the source node based on meta-graph similarity. Then, the model enhanced the initial sequence using self-attention networks and linear networks, which resulted in a set of enhanced feature vectors that serve as the meta-graph neighborhoods of the node. Secondly, the model designed an attention mechanism based on the user’s different preferences for each meta-graph to perform convolution and aggregation on the resulting meta-graph neighborhoods. Then, the model integrated the meta-graph neighborhoods into the source node to enhance the feature representation of the source node. Finally, the model used the inner product of the enhanced vector and the user vector as the probability of user interaction with the item, which was then utilized to complete the recommendation. Experimental results on the MovieLens-20M and Last-FM datasets show that the proposed model achieves an AUC of 97.3% and 94.3%, and F1-score of 83.1% and 75.6%, respectively. The recall@50 are 35.4% and 31.7%, respectively. These performance metrics outperform models such as NGCF, KGCN, LKGR, and other models. The results demonstrate that the knowledge graph recommendation model with integrated meta-graph neighborhoods is effective in improving recommendation performance.
Key words:recommendation model; knowledge graph; meta-graph; convolutional neural network; attention mechanism
0 引言
隨著互聯(lián)網(wǎng)技術(shù)的高速發(fā)展,人類社會(huì)進(jìn)入了信息爆炸時(shí)代,同時(shí)產(chǎn)生了信息過載問題,個(gè)性化推薦作為一種能緩解該問題的方法,在網(wǎng)絡(luò)服務(wù)中發(fā)揮著重要作用[1]。傳統(tǒng)個(gè)性化推薦模型通常存在數(shù)據(jù)稀疏性和冷啟動(dòng)問題[2~4],利用輔助信息是解決這一問題的有效方式[5]。知識(shí)圖譜能夠整合利用蘊(yùn)涵豐富知識(shí)的輔助信息,將知識(shí)圖譜用于個(gè)性化推薦,可以有效改善推薦效果[6,7]。
在推薦系統(tǒng)中,用戶與物品以及它們的屬性可以被構(gòu)建為知識(shí)圖譜中的節(jié)點(diǎn),用戶和物品的交互可以構(gòu)建為邊。如在電影推薦系統(tǒng)中,用戶、電影、用戶的年齡、性別、地區(qū)等屬性以及電影的導(dǎo)演、演員、類型等屬性可以用知識(shí)圖譜中的節(jié)點(diǎn)表示,用戶與電影的交互關(guān)系以及各種屬性之間的關(guān)系等可以用知識(shí)圖譜中的邊信息進(jìn)行表示。知識(shí)圖譜推薦模型一般基于嵌入[8~11]、鏈接關(guān)系[12~14]與傳播[15~17]等方法進(jìn)行研究。基于嵌入的知識(shí)圖譜推薦模型通過知識(shí)圖譜表示學(xué)習(xí)方法[18]對(duì)知識(shí)圖譜數(shù)據(jù)進(jìn)行預(yù)處理,將節(jié)點(diǎn)和關(guān)系映射到低維向量表示,再將得到的向量應(yīng)用到各種模型中進(jìn)行推薦。基于鏈接關(guān)系的知識(shí)圖譜推薦模型通過挖掘知識(shí)圖譜中的關(guān)系路徑信息計(jì)算節(jié)點(diǎn)相似性來進(jìn)行推薦。這兩種方法都利用知識(shí)圖譜對(duì)傳統(tǒng)推薦系統(tǒng)進(jìn)行了改進(jìn),提高了推薦性能,但是對(duì)知識(shí)圖譜的信息利用不夠充分。其中,基于嵌入的推薦模型主要學(xué)習(xí)圖譜中的語義表示,很少利用知識(shí)圖譜中的路徑信息;基于鏈接關(guān)系的推薦模型重點(diǎn)關(guān)注圖譜中節(jié)點(diǎn)之間的鏈接關(guān)系,忽略了節(jié)點(diǎn)本身的屬性信息[19,20]。為充分利用知識(shí)圖譜中的輔助信息,有學(xué)者提出了基于傳播的知識(shí)圖譜推薦模型。此類模型引入向量來表示節(jié)點(diǎn)與關(guān)系,同時(shí)充分利用實(shí)體間的鏈接關(guān)系,通過融合鄰域節(jié)點(diǎn)來豐富自身的向量表示以提升推薦性能。
知識(shí)圖譜中實(shí)體的鄰域節(jié)點(diǎn)數(shù)量眾多,且隨著跳數(shù)的增加呈指數(shù)型增長,因此在復(fù)雜網(wǎng)絡(luò)場(chǎng)景中較難有效利用所有的鄰域節(jié)點(diǎn)信息[21]?,F(xiàn)有基于傳播的知識(shí)圖譜推薦模型多采用從鄰域中選取若干節(jié)點(diǎn)進(jìn)行融合的方式[22],但在選取鄰域節(jié)點(diǎn)時(shí)較少考慮源節(jié)點(diǎn)與目標(biāo)節(jié)點(diǎn)之間的關(guān)系,當(dāng)所選目標(biāo)節(jié)點(diǎn)與源節(jié)點(diǎn)之間的語義關(guān)系不緊密時(shí),會(huì)融入過多的噪聲信息,降低源節(jié)點(diǎn)語義表示的準(zhǔn)確性,進(jìn)而影響模型性能[23]。
基于元路徑的節(jié)點(diǎn)相似度是衡量知識(shí)圖譜中兩節(jié)點(diǎn)之間關(guān)系密切度的一種有效方法[24],因此通過計(jì)算基于元路徑的節(jié)點(diǎn)相似度,篩選與源節(jié)點(diǎn)更為密切的節(jié)點(diǎn)進(jìn)行融合,可以有效降低噪聲信息的影響。但元路徑表示復(fù)雜語義的能力較差,無法充分利用知識(shí)圖譜中豐富的語義信息。元圖[14]是定義在知識(shí)圖譜中具有單一源節(jié)點(diǎn)和單一目標(biāo)節(jié)點(diǎn)的有向無環(huán)圖。相較于只能表示單一路徑信息的元路徑,它可以表示更為復(fù)雜的語義信息,提高對(duì)知識(shí)圖譜所蘊(yùn)涵信息的利用程度。因此,本文提出了一種融合元圖鄰域的知識(shí)圖譜推薦模型,通過計(jì)算基于元圖的相似度來衡量源節(jié)點(diǎn)與目標(biāo)節(jié)點(diǎn)的相關(guān)程度,篩選相關(guān)度更高的節(jié)點(diǎn)構(gòu)建元圖鄰域并進(jìn)行融合,它能有效過濾紛雜的噪聲信息,提升了推薦模型的準(zhǔn)確度。
1 相關(guān)工作
知識(shí)圖譜能夠整合多源異構(gòu)信息,將豐富的實(shí)體關(guān)系融合到一個(gè)復(fù)雜網(wǎng)絡(luò),進(jìn)而發(fā)現(xiàn)并計(jì)算用戶節(jié)點(diǎn)和項(xiàng)目節(jié)點(diǎn)之間的細(xì)粒度關(guān)系。相比傳統(tǒng)推薦系統(tǒng),基于知識(shí)圖譜的推薦系統(tǒng)能夠通過圖譜內(nèi)的語義關(guān)系和項(xiàng)目鏈接等信息來挖掘用戶與項(xiàng)目之間的潛在關(guān)聯(lián),實(shí)現(xiàn)更加精準(zhǔn)的推薦。
1.1 基于嵌入的知識(shí)圖譜推薦模型
基于嵌入的方法通常通過知識(shí)圖譜表示學(xué)習(xí)方法,將知識(shí)圖譜中的實(shí)體節(jié)點(diǎn)和關(guān)系表示為低維的嵌入向量,再利用得到的向量進(jìn)行推薦計(jì)算。對(duì)知識(shí)圖譜嵌入的典型方法有TransR、TransH等翻譯距離模型,其思想是在不同的關(guān)系空間刻畫頭實(shí)體和尾實(shí)體,存儲(chǔ)表達(dá)知識(shí)圖譜結(jié)構(gòu)信息。Zhang等人[8]在TransR的基礎(chǔ)上提出了一種基于嵌入的協(xié)同過濾模型(collaborative knowledge base embedding,CKE),將知識(shí)圖譜中的物品進(jìn)行結(jié)構(gòu)化知識(shí)編碼,結(jié)合文本、圖片等特征擴(kuò)充物品的語義向量。Wang等人[9]利用知識(shí)圖譜嵌入方法設(shè)計(jì)了一種端到端的多任務(wù)學(xué)習(xí)框架(multi-task feature learning approach for knowledge graph enhanced recommendation,MKR),該方法通過交叉壓縮模塊將推薦模塊和知識(shí)圖譜嵌入模塊相關(guān)聯(lián),共享模塊中潛在的特征,學(xué)習(xí)實(shí)體間的高階交互,以完成對(duì)用戶的推薦?;谇度氲姆椒ǜP(guān)注圖譜中的語義關(guān)系等方面的顯式知識(shí),對(duì)實(shí)體間的多跳關(guān)系利用較少,因而在處理復(fù)雜關(guān)系的推薦任務(wù)時(shí)會(huì)使性能受到限制。
1.2 基于鏈接關(guān)系的知識(shí)圖譜推薦模型
基于鏈接關(guān)系的方法的基本思想是利用路徑的相關(guān)算法挖掘用戶或者項(xiàng)目之間的語義相似性來增強(qiáng)推薦效果。Yu等人[13]提出了一種具有實(shí)體相似性正則化的協(xié)同過濾模型(collaborative filtering with entity similarity regularization in heterogeneous information network,Hete-MF),該模型利用包含用戶評(píng)分和其他相關(guān)異構(gòu)信息構(gòu)成的知識(shí)圖譜構(gòu)建基于矩陣分解[25]的推薦框架。Hete-MF模型使用元路徑定義網(wǎng)絡(luò)模式中實(shí)體類型之間的路徑,沿著不同元路徑發(fā)現(xiàn)不同元路徑項(xiàng)目之間的相似性,再根據(jù)相似性構(gòu)建相似度矩陣,利用矩陣分解模型進(jìn)行推薦。針對(duì)Hete-MF模型基于元路徑的推薦方法只能利用單一路徑信息無法挖掘知識(shí)圖譜復(fù)雜語義信息的問題,Zhao等人[14]提出了一種基于元圖的異構(gòu)信息網(wǎng)絡(luò)推薦融合模型(meta-graph based recommendation fusion over heterogeneous information network,F(xiàn)MG)。FMG模型根據(jù)元圖獲取用戶和項(xiàng)目之間的相似度,利用無監(jiān)督的矩陣分解技術(shù)獲得用戶和項(xiàng)目的潛在向量,最后使用因子分解機(jī)技術(shù)[26]對(duì)從不同相似性矩陣中分解得到的用戶項(xiàng)目向量進(jìn)行融合,利用融合后的用戶和項(xiàng)目向量進(jìn)行推薦。這種由多個(gè)元路徑組成的元圖,可以更充分地挖掘知識(shí)圖譜中的復(fù)雜語義,信息提高推薦系統(tǒng)的性能。使用路徑的方式充分且直觀地利用了知識(shí)圖譜的網(wǎng)絡(luò)結(jié)構(gòu),但是忽略了用戶以及項(xiàng)目自身的語義信息,未能充分利用知識(shí)圖譜中的語義信息。
1.3 基于傳播的知識(shí)圖譜推薦模型
由于基于嵌入的方法無法利用知識(shí)圖譜中的結(jié)構(gòu)信息,而基于鏈接關(guān)系的方法忽略了用戶及項(xiàng)目自身的特征,有研究者考慮到單一方法的局限性,開始利用基于嵌入與鏈接關(guān)系結(jié)合的傳播方法進(jìn)行研究。RippleNet模型[16]是首個(gè)基于傳播的知識(shí)圖譜推薦模型,其通過偏好結(jié)果進(jìn)行圖嵌入學(xué)習(xí),將用戶的歷史交互項(xiàng)視為知識(shí)圖譜中三元組的一個(gè)種子集合,并沿著知識(shí)圖譜的鏈接進(jìn)行迭代擴(kuò)展,發(fā)現(xiàn)用戶的低階及高階偏好,以此改善模型性能。Wang等人[17]受到圖卷積網(wǎng)絡(luò)的啟發(fā),提出了知識(shí)圖譜卷積網(wǎng)絡(luò)推薦模型(knowledge graph convolutional network for recommender system,KGCN)。KGCN設(shè)計(jì)了一種注意力機(jī)制[27]用于描述關(guān)系對(duì)用戶的重要性得分,為給定的用戶識(shí)別重要關(guān)系信息。隨后,在項(xiàng)目的鄰域?qū)嶓w中采用隨機(jī)采樣的方式選取若干實(shí)體。最后,結(jié)合得到的權(quán)重和選取的鄰域?qū)嶓w進(jìn)行聚合,計(jì)算項(xiàng)目節(jié)點(diǎn)的嵌入表示進(jìn)行推薦。黃偲偲等人[28]受傳播思想啟發(fā),提出了一種結(jié)合知識(shí)圖譜傳播特征和提示學(xué)習(xí)范式的推薦方法,將用戶和物品的歷史交互作為用戶偏好傳播的起點(diǎn),利用知識(shí)圖譜中的顯式知識(shí),逐層向外擴(kuò)散用戶興趣,建模用戶的動(dòng)態(tài)行為信息,以實(shí)現(xiàn)對(duì)用戶的推薦。
基于傳播的方法雖然相較于嵌入和鏈接的方法有了較大的改善,但其在融合知識(shí)圖譜中的高階信息時(shí),會(huì)因?yàn)槿谌朐肼曅畔⑹鼓P托阅苁芟蕖6獔D可以顯示建模多跳結(jié)構(gòu)中兩節(jié)點(diǎn)間的關(guān)系,通過基于元圖的相似度算法計(jì)算相似度,可以篩選語義關(guān)系密切的節(jié)點(diǎn)。因此利用元圖構(gòu)建鄰域,并以元圖鄰域作為高階鄰域進(jìn)行融合,可以降低噪聲信息的影響,提高模型性能。
2 融合元圖鄰域的知識(shí)圖譜推薦模型
融合元圖鄰域的知識(shí)圖譜推薦模型(knowledge graph re-commendation model with integrated meta-graph neighborhoods,IMGN)的框架如圖1所示。首先,構(gòu)建源節(jié)點(diǎn)的元圖鄰域,基于元圖相似度得到源節(jié)點(diǎn)在各元圖條件下的初始相似節(jié)點(diǎn)序列,利用自注意力網(wǎng)絡(luò)與線性網(wǎng)絡(luò)對(duì)初始相似節(jié)點(diǎn)序列進(jìn)行特征增強(qiáng),以增強(qiáng)后的相似向量構(gòu)成的集合作為節(jié)點(diǎn)的元圖鄰域。其次,利用卷積神經(jīng)網(wǎng)絡(luò)對(duì)元圖鄰域進(jìn)行聚合,并且在聚合時(shí)利用注意力機(jī)制捕捉不同用戶對(duì)不同元圖的偏好,將聚合后的向量融入節(jié)點(diǎn)向量以增強(qiáng)節(jié)點(diǎn)的特征表示。最后,把增強(qiáng)后的節(jié)點(diǎn)向量與用戶向量的內(nèi)積作為用戶與項(xiàng)目交互的概率,并以此完成推薦。
2.1 基于元圖的鄰域構(gòu)建
在知識(shí)圖譜中,元路徑是指連接兩個(gè)節(jié)點(diǎn)之間的關(guān)系序列,通過元路徑可以顯示建模節(jié)點(diǎn)之間的語義關(guān)系。如圖2所示,兩部電影可以通過兩個(gè)元路徑連接:電影→明星→電影(VSV)和電影→導(dǎo)演→電影(VDV)。兩條元路徑表示不同的語義信息,VSV表示兩部電影有同一個(gè)明星出演,VDV表示兩部電影有共同的導(dǎo)演。但元路徑在表達(dá)復(fù)雜語義上會(huì)受到限制,如元路徑不能表示兩部電影既有同一個(gè)明星,也有同一個(gè)導(dǎo)演。因此本文使用元圖來挖掘知識(shí)圖譜中的復(fù)雜語義信息。元圖[14]是具有單一源節(jié)點(diǎn)與目標(biāo)節(jié)點(diǎn)的有向無環(huán)圖,在知識(shí)圖譜G=(N,E)中,可以定義一個(gè)元圖MG=(NM,EM,ns,nt),其中,NMN,EME,ns為源節(jié)點(diǎn),nt為目標(biāo)節(jié)點(diǎn)。如圖2所示,元圖可以表示兩部電影既有同一個(gè)明星,也有同一個(gè)導(dǎo)演,相較于元路徑而言可以表示更復(fù)雜的語義信息。因此本文通過計(jì)算兩節(jié)點(diǎn)基于元圖的相似度衡量節(jié)點(diǎn)之間的關(guān)聯(lián)程度,篩選與源節(jié)點(diǎn)關(guān)系密切的節(jié)點(diǎn)作為初始相似序列,再以自注意力網(wǎng)絡(luò)對(duì)初始相似序列進(jìn)行語義增強(qiáng),利用增強(qiáng)后的相似序列構(gòu)建元圖鄰域。
2.1.1 基于元圖的節(jié)點(diǎn)相似度計(jì)算
在知識(shí)圖譜中,兩節(jié)點(diǎn)之間基于元圖的相似度可以通過PathSim算法[24]進(jìn)行計(jì)算。首先通過鄰接矩陣計(jì)算兩節(jié)點(diǎn)間基于元圖的路徑數(shù)量,再以源節(jié)點(diǎn)到目標(biāo)節(jié)點(diǎn)的路徑數(shù)量與源節(jié)點(diǎn)和目標(biāo)節(jié)點(diǎn)到自身的路徑數(shù)量之和的比值作為相似度?;谠窂降穆窂綌?shù)量通常以鄰接矩陣乘積的方式進(jìn)行計(jì)算,在元圖網(wǎng)絡(luò)結(jié)構(gòu)中,源節(jié)點(diǎn)和目標(biāo)節(jié)點(diǎn)之間通常由多個(gè)分段路徑連接而成,分段路徑是單一通路即為元路徑,分段路徑包括多個(gè)可達(dá)通路即為多路徑。圖2的元圖MG1中,V1→C1部分屬于元路徑部分,C1→S1→V2與C1→D1→V2屬于多路徑。因此基于元圖的路徑數(shù)量如下所示:
C=Wvw·Cs(1)
其中:C為基于某個(gè)元圖的路徑數(shù)量矩陣,矩陣的行為源節(jié)點(diǎn)類型的各個(gè)節(jié)點(diǎn),列為目標(biāo)節(jié)點(diǎn)類型的各個(gè)節(jié)點(diǎn),矩陣元素cij表示在此元圖條件下源節(jié)點(diǎn)類型中第i個(gè)節(jié)點(diǎn)到目標(biāo)節(jié)點(diǎn)類型中的第j個(gè)節(jié)點(diǎn)之間的路徑總數(shù);Wvw表示元圖中屬于單條元路徑部分的路徑數(shù)量矩陣;CS表示元圖中多條路徑部分的路徑數(shù)量矩陣。
Wvw可直接利用兩種相鄰類型節(jié)點(diǎn)之間的計(jì)數(shù)矩陣相乘[14]。如在路徑P=(A1,A2,…,AL)中:
CP=WA1,A2·WA2,A3·…·WAL-1,AL(2)
其中:WAlAl+1為相鄰節(jié)點(diǎn)類型Al到Al+1的鄰接矩陣,定義為
(WAl,Al+1)ij=1 節(jié)點(diǎn)Al與Al+1間有連邊0 節(jié)點(diǎn)Al與Al+1間無連邊(3)
CS部分可視為由多個(gè)單條路徑構(gòu)成。由于元圖表示的語義需同時(shí)滿足多種條件,所以在元圖中節(jié)點(diǎn)之間聯(lián)通的條件為滿足所有的路徑。故以構(gòu)成這部分的所有單條路徑的哈達(dá)瑪積表示此部分路徑數(shù)量:
Cs=∏ Cpi(4)
根據(jù)式(1)得到的路徑數(shù)量矩陣,以源節(jié)點(diǎn)到目標(biāo)節(jié)點(diǎn)的路徑數(shù)量與源節(jié)點(diǎn)和目標(biāo)節(jié)點(diǎn)到自身的路徑數(shù)量之和的比值作為相似度。相似度表示為
s(xi,xj)=2CijCii+Cjj(5)
其中:xi為源節(jié)點(diǎn)類型的節(jié)點(diǎn);xj為目標(biāo)節(jié)點(diǎn)類型的節(jié)點(diǎn);s(xi,xj)為兩節(jié)點(diǎn)之間的相似度。
2.1.2 基于節(jié)點(diǎn)相似度與自注意力機(jī)制的元圖鄰域構(gòu)建
對(duì)于源節(jié)點(diǎn)i,通過上述相似度計(jì)算方法計(jì)算源節(jié)點(diǎn)與符合元圖目標(biāo)節(jié)點(diǎn)類型的節(jié)點(diǎn)之間的相似度。設(shè)H為知識(shí)圖譜中某元圖M的目標(biāo)節(jié)點(diǎn)類型的節(jié)點(diǎn)集合。利用上述相似度計(jì)算方法分別計(jì)算i與H中每個(gè)節(jié)點(diǎn)的相似度:
s(i,v1),s(i,v2),…,s(i,vn) vi∈E,i=1,2,…,n
按相似性高低排序,可得到節(jié)點(diǎn)i基于元圖M的前k個(gè)相似節(jié)點(diǎn):
vs1,vs2,…,vsk
由于同一節(jié)點(diǎn)在不同元圖中側(cè)重的語義不同,與根據(jù)元圖得到的節(jié)點(diǎn)序列中的其他節(jié)點(diǎn)有密切關(guān)系,如周星馳在序列(周星馳、劉鎮(zhèn)偉)中側(cè)重導(dǎo)演的特征,而在序列(周星馳、吳孟達(dá))中側(cè)重演員的特征,故本文采用自注意力機(jī)制[29]對(duì)上述得到的初始相似序列進(jìn)行特征增強(qiáng)。以上述k個(gè)節(jié)點(diǎn)的向量表示作為行構(gòu)成的矩陣作為原始查詢矩陣V,經(jīng)過線性變換后得到查詢Qs、鍵Ks、值Vs矩陣:
Qs=VWQ,Ks=VWK,Vs=VWV(6)
其中:W為線性變換矩陣的參數(shù)。計(jì)算查詢矩陣與鍵矩陣轉(zhuǎn)置的乘積,得到初始權(quán)重表示矩陣:
E=QsKTs(7)
其中:E為初始權(quán)重矩陣;Eij表示序列中節(jié)點(diǎn)vi在融合節(jié)點(diǎn)vj時(shí)的初始權(quán)重。對(duì)上述初始權(quán)重矩陣進(jìn)行softmax歸一化:
Z=softmax(Edk)(8)
其中:Z為歸一化后的權(quán)重矩陣。之后用權(quán)重矩陣和值矩陣相乘:
Vs′=Z·Vs(9)
其中:Vs′即為原節(jié)點(diǎn)序列中的節(jié)點(diǎn)向量表示在以歸一化后的自注意力權(quán)重的基礎(chǔ)上,融合了序列中其他節(jié)點(diǎn)之后的向量表示構(gòu)成的矩陣,融合后的向量增強(qiáng)了其屬于此元圖的語義特征。再以一層全連接神經(jīng)網(wǎng)絡(luò)將這k個(gè)節(jié)點(diǎn)融合為一個(gè),記為vmh,即為節(jié)點(diǎn)i在元圖M條件下的相似向量:
vMi=(w·V′s+b)(10)
知識(shí)圖譜網(wǎng)絡(luò)模式是指利用知識(shí)圖譜中的節(jié)點(diǎn)類型與關(guān)系類型表示的圖結(jié)構(gòu),從網(wǎng)絡(luò)模式中抽取相應(yīng)的節(jié)點(diǎn)與關(guān)系序列即可作為元圖。以節(jié)點(diǎn)i的節(jié)點(diǎn)類型作為源節(jié)點(diǎn)與目標(biāo)節(jié)點(diǎn)從網(wǎng)絡(luò)模式中抽取相關(guān)的L個(gè)元圖,記作M1,M2,…,ML,在這L個(gè)元圖條件下,根據(jù)上述計(jì)算方式可得到節(jié)點(diǎn)i的L個(gè)相似向量v1i,v2i,…,vLi,分別表示在不同元圖下節(jié)點(diǎn)i的相似節(jié)點(diǎn)。由此可得源節(jié)點(diǎn)i的元圖鄰域?yàn)?/p>
NBi={v1i,v2i,…,vLi}(11)
2.2 基于卷積神經(jīng)網(wǎng)絡(luò)的元圖鄰域融合
將鄰域節(jié)點(diǎn)聚合后與源節(jié)點(diǎn)進(jìn)行融合可以更好地表示源節(jié)點(diǎn)的特征,獲得更多的上下文信息,提高推薦模型的準(zhǔn)確性[30]。低階鄰域是與源節(jié)點(diǎn)直接相鄰的節(jié)點(diǎn)構(gòu)成的鄰域,包含一些局部的、比較簡單的關(guān)系模式,能夠提供節(jié)點(diǎn)的局部上下文信息,有助于模型捕捉到節(jié)點(diǎn)的細(xì)粒度特征。元圖鄰域包含了高層次的語義信息,能夠挖掘源節(jié)點(diǎn)與高階節(jié)點(diǎn)之間的復(fù)雜關(guān)系模式,能更好地捕獲全局特征。融合低階鄰域和元圖鄰域可以綜合利用不同層次、不同類型的關(guān)系模式,從而提升模型的性能。對(duì)元圖鄰域的卷積融合如圖3所示。通過卷積神經(jīng)網(wǎng)絡(luò)對(duì)元圖鄰域進(jìn)行卷積聚合,再以聚合后的向量與融合了低階鄰域的源節(jié)點(diǎn)向量進(jìn)行融合增強(qiáng)源節(jié)點(diǎn)的語義表示。
首先,對(duì)源節(jié)點(diǎn)的低階鄰域進(jìn)行聚合,將源節(jié)點(diǎn)的向量表示與聚合后的向量進(jìn)行融合,獲得融合低階鄰域的源節(jié)點(diǎn)向量,公式如下:
i=sigmoid(w1×(vi+vnbi)+b1)(12)
其中:i為融合源節(jié)點(diǎn)向量與低階鄰域聚合向量后的向量表示;w1為權(quán)重系數(shù)矩陣;vi為源節(jié)點(diǎn)的向量表示;vnbi為源節(jié)點(diǎn)的低階鄰域通過卷積神經(jīng)網(wǎng)絡(luò)聚合后的向量表示;sigmoid為非線性激活函數(shù);b1為偏置向量。
其次,對(duì)元圖鄰域進(jìn)行卷積聚合。在卷積過程中由于不同用戶對(duì)表示不同關(guān)系的元圖偏好程度不同,如用戶A和B喜歡同一部電影,可能A用戶喜歡這部電影是因?yàn)檫@部電影是他喜歡的導(dǎo)演的作品,而B用戶喜歡這部電影是因?yàn)檫@部電影有他喜歡的演員,需要設(shè)計(jì)一種注意力機(jī)制[31]以區(qū)分不同用戶對(duì)不同元圖的喜好程度。以atten(ua,mj)=ua·mj表示用戶a對(duì)元圖j的偏好得分,表示用戶對(duì)某個(gè)元圖的偏好程度。其中,ua是用戶a的特征向量表示,mj是元圖j的向量表示。將用戶對(duì)不同元圖的評(píng)分進(jìn)行歸一化表示為
aten(ua,mj)=softmax(atten(ua,mj))=exp(atten(ua,mj))∑mn∈N(x)exp(atten(ua,mn))(13)
其中:aten(ua,mj)表示經(jīng)過softmax歸一化后的用戶a對(duì)元圖j的偏好得分;N(x)是元圖表示向量的集合x∈(1,2,…,L)。
以歸一化后用戶對(duì)某條元圖的評(píng)分為權(quán)重對(duì)元圖鄰域表示v1i,v2i,…,vLi進(jìn)行聚合操作。得到的鄰域聚合向量如下:
s(ua,vi)=∑vji∈NBiaten(ua,mj)·vji(14)
其中:s(ua,vi)為以用戶a對(duì)不同元圖的偏好得分為權(quán)重,聚合源節(jié)點(diǎn)vi的元圖鄰域所得的聚合向量;NBi為源節(jié)點(diǎn)vi的元圖鄰域;vji為鄰域中的向量表示。
最后,將所得的聚合向量與融合低階鄰域初步增強(qiáng)后的源節(jié)點(diǎn)向量融合得到進(jìn)一步增強(qiáng)的節(jié)點(diǎn)向量表示,融合方式如下:
vuai=sigmoid(w2·(i+s(ua,vi))+b2)(15)
其中:vuai為源節(jié)點(diǎn)vi融合自身與基于用戶ua對(duì)不同元圖的偏好得到的元圖鄰域聚合向量后的向量表示;sigmoid是非線性激活函數(shù);w2是權(quán)重矩陣;i為節(jié)點(diǎn)融合知識(shí)圖譜低階鄰域后的向量表示;b2是偏置向量。通過上述卷積融合,實(shí)體的最終表示依賴于源節(jié)點(diǎn)自身、知識(shí)圖譜中的低階鄰域以及元圖鄰域。由于融合了知識(shí)圖譜中豐富的語義知識(shí),其表示更加準(zhǔn)確。根據(jù)上述步驟可得源節(jié)點(diǎn)最終的表示:
vuai=sigmoid(w2×(sigmoid(w1×(vi+vnbi)+b1)+s(ua,vi))+b2)(16)
2.3 基于融合后向量的推薦
通過融合元圖鄰域聚合向量得到語義增強(qiáng)后源節(jié)點(diǎn)的向量表示,該向量可用來預(yù)測(cè)用戶與項(xiàng)目之間的交互概率。在矩陣分解算法中,用戶向量ui和項(xiàng)目向量vj的內(nèi)積可以近似于rij,rij為用戶與項(xiàng)目vj的交互概率。
rij≈ui·vj(17)
因此,利用上述融合了元圖鄰域的節(jié)點(diǎn)向量的內(nèi)積來表示用戶對(duì)項(xiàng)目的預(yù)測(cè)交互概率。
ui=pred(ui,vj)=ui·vj(18)
損失函數(shù)是真實(shí)交互行為和預(yù)測(cè)交互概率之間的平方誤差,是算法的最小化目標(biāo),定義為
L(θ)=∑rui∈R(ui-rri)2+λ‖θ‖2(19)
其中:rui是實(shí)際是否交互,超參數(shù)λ防止過擬合,通過控制L2正則化的強(qiáng)度來實(shí)現(xiàn),θ是要訓(xùn)練的參數(shù)集。采用隨機(jī)梯度下降法來最小化損失函數(shù)。首先通過求參數(shù)的偏導(dǎo)數(shù)找到最速下降方向,然后通過迭代法不斷地優(yōu)化參數(shù)。利用訓(xùn)練完成的模型得到用戶對(duì)各個(gè)項(xiàng)目的預(yù)測(cè)交互概率,根據(jù)交互概率進(jìn)行推薦。
3 實(shí)驗(yàn)
為了驗(yàn)證所提出模型的推薦效果,基于Red Hat Linux x86_64平臺(tái)與NVIDIA A100(40 GB顯存)圖形處理單元(GPU),使用深度學(xué)習(xí)框架PyTorch,在Python 3.8的環(huán)境下設(shè)計(jì)實(shí)驗(yàn)進(jìn)行性能分析。
3.1 數(shù)據(jù)集
本文的實(shí)驗(yàn)基于兩個(gè)數(shù)據(jù)集,數(shù)據(jù)集信息如表1所示。
a)MovieLens-20M數(shù)據(jù)集。該數(shù)據(jù)集收集存儲(chǔ)了用戶對(duì)于電影的評(píng)分,并帶有電影在imdb網(wǎng)站和tmdb網(wǎng)站中的鏈接。使用數(shù)據(jù)集中的鏈接從相關(guān)網(wǎng)站上爬取相關(guān)數(shù)據(jù)的附加信息,利用這些信息構(gòu)建知識(shí)圖譜。數(shù)據(jù)集中的用戶將電影評(píng)分為1~5分的顯式評(píng)價(jià)轉(zhuǎn)換為隱式評(píng)價(jià)用于模型的輸入,將3分設(shè)定為一個(gè)評(píng)分閾值,大于等于3分的評(píng)價(jià)視為正面評(píng)價(jià)并在交互列表中將其記為1,余下評(píng)分記為0。
b)Last-FM。它是由last.fm發(fā)布的數(shù)據(jù)集,包含接近2 000個(gè)用戶在last.fm在線音樂平臺(tái)收聽音樂的信息。
3.2 評(píng)價(jià)指標(biāo)
本文在進(jìn)行點(diǎn)擊率CTR預(yù)測(cè)實(shí)驗(yàn)時(shí),采用area under curve(AUC)和F1-score兩種評(píng)價(jià)指標(biāo);在進(jìn)行top-K推薦實(shí)驗(yàn)時(shí),采用recall@K作為評(píng)價(jià)指標(biāo)。
AUC=∑樣本i∈正樣本ri-P×(P+1)2P×N(20)
F1=2×precision×recallprecision+recall(21)
recall=(∑u∈U|L(u)∩B(u)|)/∑u∈U|B(u)|(22)
其中:AUC表示預(yù)測(cè)得到正樣本的概率大于負(fù)樣本的概率,P表示正樣本數(shù)量,N表示負(fù)樣本數(shù)量,對(duì)所有樣本按照預(yù)測(cè)值進(jìn)行從低到高的排序,排序后可以得到每個(gè)正樣本的序號(hào),用ri表示第i個(gè)正樣本的序號(hào)。F1是精確率和召回率的加權(quán)平均值。該值越高,說明模型越穩(wěn)健。recall表示測(cè)試集中用戶交互過的項(xiàng)目出現(xiàn)在top-K推薦列表中的比例,U表示用戶集,L(u)表示用戶u的top-K推薦列表,B(u)表示測(cè)試集中與用戶交互的項(xiàng)目集。recall值越高,代表推薦系統(tǒng)性能越好。
3.3 對(duì)比實(shí)驗(yàn)結(jié)果及分析
為探究本文模型的性能表現(xiàn),選取以下推薦模型作為基線模型進(jìn)行對(duì)比實(shí)驗(yàn):
a)NGCF[4]。該模型是一種基于圖神經(jīng)網(wǎng)絡(luò)的協(xié)同過濾模型,通過把用戶與項(xiàng)目的交互進(jìn)行嵌入改善推薦效果。
b)CKE。該模型是一個(gè)典型的基于知識(shí)圖譜嵌入的模型,利用知識(shí)圖譜中嵌入得到的低維向量表示進(jìn)行推薦,具有不錯(cuò)的推薦效果。
c)RippleNet。該模型將知識(shí)圖譜作為額外信息融合到CF推薦系統(tǒng)中,并且首次結(jié)合了基于路徑和基于嵌入的方法,利用知識(shí)圖譜對(duì)用戶潛在的偏好進(jìn)行表示,進(jìn)而發(fā)現(xiàn)用戶的潛在興趣。
d)KGCN。該模型結(jié)合了知識(shí)圖譜和圖神經(jīng)網(wǎng)絡(luò),其核心思想是利用鄰域向量擴(kuò)充當(dāng)前實(shí)體的向量表示,提高了推薦性能,緩解了傳統(tǒng)模型冷啟動(dòng)和數(shù)據(jù)稀疏性問題。
e)LKGR[32]。該模型基于知識(shí)增強(qiáng)圖卷積網(wǎng)絡(luò)進(jìn)行推薦,實(shí)現(xiàn)從歐幾里德空間到雙曲空間的轉(zhuǎn)變,能有效地分層圖結(jié)構(gòu),提升推薦性能。
各模型的實(shí)驗(yàn)結(jié)果如表2與圖4所示。結(jié)果表明,本文模型在性能上有著最佳表現(xiàn),AUC與F1值相較于次優(yōu)的模型在兩個(gè)數(shù)據(jù)集上分別提升了0.3%和2.0%、2.0%和1.7%,recall@K值提升了2.5%和3.1%。各模型在MovieLens-20M數(shù)據(jù)集上的性能指標(biāo)較Last-FM上更優(yōu),這是因?yàn)镸ovieLens-20M數(shù)據(jù)集的規(guī)模更大,較大規(guī)模的數(shù)據(jù)集可以減小隨機(jī)性帶來的影響,包含更多的樣本和特征組合,可以幫助模型學(xué)習(xí)到更多的數(shù)據(jù)模式和特征表示,提高模型對(duì)數(shù)據(jù)的理解能力,從而提升模型的性能。在本文所選模型中,NGCF的性能表現(xiàn)最差,因?yàn)樵撃P蛢H利用用戶和項(xiàng)目之間的交互關(guān)系進(jìn)行建模,而其他模型則通過知識(shí)圖譜擴(kuò)充了用戶和項(xiàng)目的表示,通過利用知識(shí)圖譜中大量的輔助信息獲得了更優(yōu)越的性能。CKE相較于其他基于知識(shí)圖譜的模型表現(xiàn)較差,該模型只考慮知識(shí)圖譜中的單跳路徑信息,而其他基于知識(shí)圖譜的模型則考慮了知識(shí)圖譜中的多跳路徑信息,更多跳數(shù)的信息挖掘更能充分利用知識(shí)圖譜中的輔助信息,得到更好的結(jié)果。LKGR相較于RippleNet和KGCN,通過將一些異常數(shù)據(jù)映射到不同空間降低了噪聲信息的影響,因此性能有所提升。本文模型表現(xiàn)較LKGR更好,這是因?yàn)楸疚耐ㄟ^元圖鄰域保證了鄰域節(jié)點(diǎn)與源節(jié)點(diǎn)聯(lián)系的緊密性,避免引入噪聲信息,且通過自注意力網(wǎng)絡(luò)對(duì)元圖鄰域進(jìn)行特征增強(qiáng),進(jìn)一步提高了對(duì)有效特征的利用,進(jìn)而表現(xiàn)出更優(yōu)異的性能。
3.4 超參數(shù)對(duì)模型性能影響的實(shí)驗(yàn)結(jié)果及分析
本節(jié)對(duì)兩個(gè)重要超參數(shù)進(jìn)行分析,以研究它們對(duì)模型性能的影響,分別為表示向量的嵌入維度和基于元圖構(gòu)建的鄰域中所選取鄰域節(jié)點(diǎn)的個(gè)數(shù)。結(jié)果如圖5和6所示。
表示向量嵌入維度對(duì)模型性能具有較大的影響,圖5展示了本文模型基于兩種數(shù)據(jù)集分別在四種嵌入維度上AUC與F1的結(jié)果對(duì)比,可以看出隨著向量嵌入維度的增加,模型性能有所提升,但當(dāng)嵌入維度進(jìn)一步增大時(shí),推薦效果反而降低。嵌入維度的大小決定了模型對(duì)于實(shí)體和關(guān)系的表示能力。較高的嵌入維度可以提供更豐富的特征表示空間,使模型能夠更好地捕捉實(shí)體之間的語義和關(guān)系信息。因此,適當(dāng)增加嵌入維度可能有助于提升模型性能。然而,增加嵌入維度也會(huì)增加過擬合的風(fēng)險(xiǎn),尤其是在數(shù)據(jù)集規(guī)模較小的情況下。在MovieLens-20M數(shù)據(jù)集上嵌入維度為32時(shí)取得最好的結(jié)果,在Last-FM數(shù)據(jù)集上嵌入維度為16時(shí)取得最好的結(jié)果,這是因?yàn)镸ovieLens-20M數(shù)據(jù)集的規(guī)模較大,可以提取更多的特征。
在基于元圖構(gòu)建鄰域時(shí),每個(gè)元圖的相似序列所選取節(jié)點(diǎn)個(gè)數(shù)也是影響模型性能的重要因素。圖6展示了本文模型基于兩種數(shù)據(jù)集在四種不同相似節(jié)點(diǎn)個(gè)數(shù)下的結(jié)果對(duì)比。從實(shí)驗(yàn)結(jié)果看出,在選擇鄰域節(jié)點(diǎn)數(shù)量為4的情況下,模型取得了最好的性能表現(xiàn),較低和較多的鄰域節(jié)點(diǎn)個(gè)數(shù)都會(huì)降低模型性能。增加鄰域節(jié)點(diǎn)的個(gè)數(shù)可以提供更多的上下文信息來表示當(dāng)前節(jié)點(diǎn),從更廣泛的鄰域中學(xué)習(xí)到更全面的特征表示,提高模型對(duì)節(jié)點(diǎn)的理解能力。但當(dāng)節(jié)點(diǎn)個(gè)數(shù)過多時(shí),也會(huì)導(dǎo)致引入冗余信息與過擬合的風(fēng)險(xiǎn),使得模型性能下降。
3.5 相似序列不同處理方式的實(shí)驗(yàn)結(jié)果及性能分析
在構(gòu)建鄰域過程中,相似節(jié)點(diǎn)序列的不同處理方式對(duì)模型性能會(huì)產(chǎn)生影響。本文討論了三種不同相似序列處理方式的不同效果,三種方式分別iwsu0zbmz/U4g/aApMAvPw==為只取相似度最高的節(jié)點(diǎn),對(duì)相似節(jié)點(diǎn)序列進(jìn)行歸一化求平均,以及本文提到的自注意力機(jī)制進(jìn)行融合。圖7展示了在保持其他參數(shù)相同的情況下分別以三種方式進(jìn)行處理后模型的最終結(jié)果,其中以自注意力機(jī)制進(jìn)行融合的方式所取得的推薦效果最好,造成該現(xiàn)象的原因是只取相似度最高節(jié)點(diǎn)的方式會(huì)忽略其他鄰居節(jié)點(diǎn)的信息,導(dǎo)致丟失部分全局信息。對(duì)相似節(jié)點(diǎn)序列進(jìn)行歸一化求平均的方式無法充分體現(xiàn)每個(gè)節(jié)點(diǎn)的貢獻(xiàn),忽略了節(jié)點(diǎn)重要性的不同,無法捕捉到更細(xì)粒度的特征。自注意力機(jī)制處理的方式可以根據(jù)節(jié)點(diǎn)之間的重要程度和相互影響,動(dòng)態(tài)地調(diào)整節(jié)點(diǎn)之間的注意力權(quán)重,增強(qiáng)節(jié)點(diǎn)的特征表示,此種方式能夠充分利用全局信息,并靈活地對(duì)不同節(jié)點(diǎn)進(jìn)行加權(quán)處理,有助于發(fā)現(xiàn)節(jié)點(diǎn)之間的復(fù)雜關(guān)系,提高語義表示的準(zhǔn)確性,進(jìn)而提升模型性能。
3.6 消融實(shí)驗(yàn)
為驗(yàn)證本文模型中各部分的作用,在兩種數(shù)據(jù)集上比較IMGN-KGRM及其他變體的推薦性能,其中變體包括:
a)IMGN-No-MG-Neighbor:只融合節(jié)點(diǎn)的一階鄰域增強(qiáng)特征向量表示,不融合元圖鄰域。
b)IMGN-Base:基本的融合元圖鄰域模型。在構(gòu)造元圖鄰域時(shí)只取相似度最高的節(jié)點(diǎn),不用相似序列與自注意力增強(qiáng)特征。在融合元圖鄰域時(shí)以平均權(quán)重的方式融合,不考慮不同用戶對(duì)不同元圖的偏好。
c)IMGN-No-Enhance:構(gòu)造元圖鄰域時(shí)不以相似序列與自注意力機(jī)制進(jìn)行特征增強(qiáng),融合元圖鄰域時(shí)考慮用戶偏好。
d)IMGN-No-Preference:構(gòu)造元圖鄰域時(shí)取相似序列并利用自注意力機(jī)制進(jìn)行特征增強(qiáng),融合元圖鄰域時(shí)不考慮用戶偏好。
從表3中可以看出,相較于未融合元圖鄰域的IMGN-No-MG-Neighbor模型,IMGN-Base具有更好的性能,表明使用元圖鄰域可以有效挖掘知識(shí)圖譜中的高階信息,提高模型性能。IMGN-No-Enhance相較于IMGN-Base性能有所提升,表明在構(gòu)建元圖鄰域時(shí),以相似度高的節(jié)點(diǎn)組成的相似序列進(jìn)行處理有效地進(jìn)行了特征增強(qiáng)。IMGN-No-Preference相較于IMGN-Base性能有所提升,表明考慮不同用戶對(duì)不同元圖偏好的重要性。IMGN-No-Enhance和IMGN-No-Preference與IMGN-KGRM之間的對(duì)照可以發(fā)現(xiàn),兩種方法同時(shí)使用的效果要好于單一一種方法的使用。通過此消融實(shí)驗(yàn),說明了IMGN-KGRM各部分之間彼此影響,最終作用于模型整體,對(duì)模型的性能提升有積極的貢獻(xiàn)。
3.7 實(shí)例分析
為了直觀地分析驗(yàn)證模型的有效性,本文將IMGN-KGRM模型應(yīng)用到MovieLens-20M數(shù)據(jù)集上進(jìn)行案例分析,預(yù)測(cè)用戶對(duì)電影的交互概率。首先在MovieLens-20M測(cè)試集中隨機(jī)抽取五個(gè)用戶與五部電影,id分別為[20766,23545,38024,79292,119622]與[485,2156,3438,13025,14083]。然后,通過模型計(jì)算得到用戶對(duì)電影的交互概率,結(jié)果如表4所示,表項(xiàng)內(nèi)容為用戶與電影的真實(shí)交互情況(0表示用戶與電影未有過交互,1表示用戶與電影有交互)與預(yù)測(cè)的交互概率。由表中數(shù)據(jù)可知,模型對(duì)用戶真實(shí)交互過的電影的預(yù)測(cè)交互概率均高于對(duì)用戶實(shí)際未交互過的電影的預(yù)測(cè)交互概率。由此可見,本文模型能夠較為準(zhǔn)確地預(yù)測(cè)用戶與電影的交互概率,具有較高的應(yīng)用性。
4 結(jié)束語
本文提出的融合元圖鄰域的知識(shí)圖譜推薦模型,在挖掘利用知識(shí)圖譜中的高階語義信息時(shí)有效減少了噪聲信息的影響,更準(zhǔn)確地挖掘了知識(shí)圖譜中的語義信息,提高了模型性能。具體而言,通過基于元圖的相似度計(jì)算篩選相關(guān)度更高的節(jié)點(diǎn),并以自注意力網(wǎng)絡(luò)對(duì)節(jié)點(diǎn)進(jìn)行語義增強(qiáng)的方式構(gòu)建元圖鄰域,有效地過濾了噪聲信息,提高了信息挖掘的準(zhǔn)確性;利用卷積神經(jīng)網(wǎng)絡(luò)將源節(jié)點(diǎn)與元圖鄰域進(jìn)行融合,豐富了源節(jié)點(diǎn)的上下文信息,擴(kuò)展了源節(jié)點(diǎn)的語義表示;最后利用融合后的向量完成推薦。實(shí)驗(yàn)結(jié)果表明,相較于現(xiàn)有的基于知識(shí)圖譜的推薦模型,本文模型可以有效地提高推薦效果。本文側(cè)重于對(duì)項(xiàng)目端的建模而較少考慮用戶信息,后續(xù)研究擬將用戶側(cè)信息引入模型并進(jìn)行有效利用,以期進(jìn)一步提高模型的推薦性能。
參考文獻(xiàn):
[1]于蒙, 何文濤, 周緒川, 等. 推薦系統(tǒng)綜述 [J]. 計(jì)算機(jī)應(yīng)用, 2022, 42(6): 1898-1913. (Yu Meng, He Wentao, Zhou Xuchuan, et al. Review of recommendation system[J]. Journal of Computer Applications, 2022, 42(6): 1898-1913.)
[2]趙凱華,徐建民,鮑彩倩.一個(gè)基于信息網(wǎng)絡(luò)的微博推薦模型[J].河北大學(xué)學(xué)報(bào):自然科學(xué)版,2022,42(4):438-448.(Zhao Kaihua,Xyu Jianmin,Bao Caiqian. A belief network model for microblog re-commendution[J]. Journal of Hebei University:Natural Science Edition, 2022, 42(4): 438-448.
[3]He Xiangnan, Liao Lizi, Zhang Hanwang, et al. Neural collaborative filtering[C]//Proc of the 26th International Conference on World Wide Web.Republic and Canton of Geneva: International World Wide Web Conferences Steering Committee, 2017: 173-182.
[4]Wang Xiang, He Xiangnan, Wang Meng, et al. Neural graph colla-borative filtering[C]//Proc of the 42nd International ACM SIGIR Conference on Research and Development in Information Retrieval. New York:ACM Press, 2019: 165-174.
[5]Guo Qingyu, Zhuang Fuzhen, Qin Chuan, et al. A survey on know-ledge graph-based recommender systems[J]. IEEE Trans on Knowledge and Data Engineering, 2020, 34(8): 3549-3568.
[6]Cao Yixin, Wang Xiang, He Xiangnan, et al. Unifying knowledge graph learning and recommendation: towards a better understanding of user preferences[C]//Proc of World Wide Web Conference. New York:ACM Press, 2019: 151-161.
[7]張明星, 張驍雄, 劉姍姍, 等. 利用知識(shí)圖譜的推薦系統(tǒng)研究綜述[J]. 計(jì)算機(jī)工程與應(yīng)用, 2023, 59(4): 30-42. (Zhang Ming-xing, Zhang Xiaoxiong, Liu Shanshan, et al. Review of recommendation systems using knowledge graph[J]. Computer Engineering and Applications, 2023, 59(4): 30-42.)
[8]Zhuang Fuzhen, Yuan N J, Lian Defu, et al. Collaborative know-ledge base embedding for recommender systems[C]//Proc of the 22nd ACM SIGKDD International Conference on Knowledge Discovery and Data Mining. New York:ACM Press, 2016: 353-362.
[9]Wang Hongwei, Zhang Fuzhen, Zhao Miao, et al. Multi-task feature learning for knowledge graph enhanced recommendation[C]//Proc of World Wide Web Conference. New York:ACM Press, 2019: 2000-2010.
[10]Xin Xin, He Xiangnan, Zhang Yongfeng, et al. Relational collaborative filtering: modeling multiple item relations for recommendation[C]//Proc of the 42nd International ACM SIGIR Conference on Research and Development in Information Retrieval. New York:ACM Press, 2019: 125-134.
[11]Ye Yuting, Wang Xuwu, Yao Jiangchao, et al. Bayes embedding(BEM) refining representation by integrating knowledge graphs and behavior-specific networks[C]//Proc of the 28th ACM International Conference on Information and Knowledge Management. New York:ACM Press, 2019: 679-688.
[12]何云飛, 張以文, 呂智慧, 等. 異質(zhì)信息網(wǎng)絡(luò)中元路徑感知的評(píng)分協(xié)同過濾[J]. 計(jì)算機(jī)學(xué)報(bào), 2020, 43(12): 2385-2397. (He Yunfei, Zhang Yiwen, Lyu Zhihui, et al. Heterogeneous information network-aware rating collaborative filtering[J]. Chinese Journal of Computers, 2020, 43(12): 2385-2397.)
[13]Yu Xiao, Ren Xiang, Gu Quanquan, et al. Collaborative filtering with entity similarity regularization in heterogeneous information networks[EB/OL]. (2013).https://api.semanticscholar.org/CorpusID:14914495.
[14]Zhao Huan, Yao Quanming, Li Jianda, et al. Meta-graph based re-commendation fusion over heterogeneous information networks[C]//Proc of the 23rd ACM SIGKDD International Conference on Know-ledge Discovery and Data Mining. New York:ACM Press, 2017: 635-644.
[15]Sha Xiao, Sun Zhu, Zhang Jie. Hierarchical attentive knowledge graph embedding for personalized recommendation[J]. Electronic Commerce Research and Applications, 2021, 48: 101071.
[16]Wang Hongwei, Zhang Fuzheng, Wang Jialin, et al. RippleNet: propagating user preferencettaYKCJhDJDo31lIAevoGGZmyy+eTXVjWt8qyJBlgyw=s on the knowledge graph for recommender systems[C]//Proc of the 27th ACM International Conference on Information And Knowledge Management. New York:ACM Press, 2018: 417-426.
[17]Wang Hongwei, Zhao Miao, Xie Xing, et al. Knowledge graph con-volutional networks for recommender systems[C]//Proc of World Wide Web Conference. New York:ACM Press, 2019: 3307-3313.
[18]Wang Quan, Mao Zhendong, Wang Bin, et al. Knowledge graph embedding: a survey of approaches and applications[J]. IEEE Trans on Knowledge and Data Engineering, 2017, 29(12): 2724-2743.
[19]常亮, 張偉濤, 古天龍, 等. 知識(shí)圖譜的推薦系統(tǒng)綜述[J]. 智能系統(tǒng)學(xué)報(bào), 2019, 14(2): 207-216. (Chang Liang, Zhang Weitao, Gu Tianlong, et al. Review of recommendation systems based on knowledge graph[J]. CAAI Trans on Intelligent Systems, 2019, 14(2): 207-216.)
[20]秦川, 祝恒書, 莊福振, 等. 基于知識(shí)圖譜的推薦系統(tǒng)研究綜述[J]. 中國科學(xué): 信息科學(xué), 2020, 50(7): 937-956. (Qin Chuan, Zhu Hengshu, Zhuang Fuzhen, et al. A survey on knowledge graph-based recommender systems[J]. Scientia Sinica: Informationis, 2020, 50(7): 937-956.)
[21]張波, 趙鵬, 張金金, 等. 基于用戶潛在興趣的知識(shí)感知傳播推薦算法[J]. 計(jì)算機(jī)應(yīng)用研究, 2022, 39(9): 2615-2620. (Zhang Bo, Zhao Peng, Zhang Jinjin, et al. Knowledge-aware propagation recommendation algorithm based on user’s potential interest[J]. App-lication Research of Computers, 2022, 39(9): 2615-2620.)
[22]梁順攀, 涂浩, 王榮生, 等. 融合重要性采樣和池化聚合的知識(shí)圖推薦算法[J]. 小型微型計(jì)算機(jī)系統(tǒng), 2021, 42(5): 967-971. (Liang Shunpan, Tu Hao, Wang Rongsheng, et al. Knowledge graph recommendation algorithm combining importance sampling and pooling aggregation[J]. Journal of Chinese Computer Systems, 2021, 42(5): 967-971.)
[23]朱冬亮, 文奕, 萬子琛. 基于知識(shí)圖譜的推薦系統(tǒng)研究綜述[J]. 數(shù)據(jù)分析與知識(shí)發(fā)現(xiàn), 2021, 5(12): 1-13. (Zhu Dongliang, Wen Yi, Wan Zichen. Review of recommendation systems based on know-ledge graph[J]. Data Analysis and Knowledge Discovery, 2021, 5(12): 1-13.)
[24]Sun Yizhou, Han Jiawei, Yan Xifeng, et al. PathSim: meta path-based top-k similarity search in heterogeneous information networks[J]. Proceedings of the VLDB Endowment, 2011, 4(11): 992-1003.
[25]Ding C, Li Tao, Jordan M I. Convex and semi-nonnegative matrix factorizations[J]. IEEE Trans on Pattern Analysis and Machine Intelligence, 2008, 32(1): 45-55.
[26]Rendle S. Factorization machines with libFM[J]. ACM Trans on Intelligent Systems and Technology, 2012, 3(3): 1-22.
[27]Bahdanau D, Cho K, Bengio Y. Neural machine translation by jointly learning to align and translate[EB/OL]. (2016-05-19). https://arxiv.org/abs/1409.0473.
[28]黃偲偲, 柯文俊, 張杭, 等. 融合知識(shí)傳播和提示學(xué)習(xí)機(jī)制的推薦模型[J]. 中文信息學(xué)報(bào), 2023, 37(5): 122-134. (Huang Cai-cai, Ke Wenjun, Zhang Hang, et al. Incorporation knowledge propa-gation and prompt learning for recommendation[J]. Journal of Chinese Information Processing, 2023,37(5): 122-134.)
[29]Vaswan99b14c5cc96157fccc819744c829e1ca934045412ad4d37b4cf2721ad2130ed0i A, Shazeer N, Parmar N, et al. Attention is all you need[C]//Proc of the 31st International Conference onNeural Information Processing Systems. Red Hook, NY: Curran Associates Inc., 2017: 6000-6010.
[30]付峻宇, 朱小棟, 陳晨. 基于圖卷積的雙通道協(xié)同過濾推薦算法[J]. 計(jì)算機(jī)應(yīng)用研究, 2023, 40(1): 129-135. (Fu Junyu, Zhu Xiaodong, Chen Chen. Two-channel collaborative filtering recommendation algorithm based on graph convolution[J]. Application Research of Computers, 2023, 40(1): 129-135.)
[31]Chen Jingyuan, Zhang Hanwang, He Xiangnan, et al. Attentive collaborative filtering: multimedia recommendation with item-and component-level attention[C]//Proc of the 40th International ACM SIGIR Conference on Research and Development in Information Retrieval. New York:ACM Press, 2017: 335-344.
[32]Chen Yankai, Yang Menglin, Zhang Yingxue, et al. Modeling scale-free graphs with hyperbolic geometry for knowledge-aware recommendation[C]//Proc of the 15th ACM International Conference on Web Search and Data Mining. New York:ACM Press, 2022: 94-102.