


























摘 要:針對當前冷啟動推薦模型在處理異質信息網絡時難以充分挖掘結構與語義信息,以及忽略網絡中用戶行為屬性的問題,提出了一種基于元學習的多視圖對比融合冷啟動推薦算法(MVC-ML)。該算法在模型層和數據層雙重作用下,有效緩解了冷啟動問題。在MVC-ML算法框架中,首先通過元路徑視圖提取異質信息網絡的高階語義信息;其次,利用網絡模式視圖捕獲網絡的結構特征;再接著,通過聚類視圖分析用戶行為屬性信息;最后,運用對比學習方法,將上述三個視圖中提煉的信息進行綜合融合,以生成準確的表示向量。通過在DBook等三個數據集上的實驗驗證,MVC-ML模型在冷啟動場景下相較MetaHIN等傳統異質信息網絡模型,在MAE上降低了1.67%,在RMSE上降低了2.06%,同時nDCG@K提高了1.48%。這些數據充分證實了MVC-ML算法的合理性和有效性。
關鍵詞:異質信息網絡; 對比學習; 網絡模式; 冷啟動
中圖分類號:TP391.3 文獻標志碼:A 文章編號:1001-3695(2024)07-015-2025-08
doi:10.19734/j.issn.1001-3695.2023.11.0547
Multi-view contrast fusion cold start recommendation algorithmbased on meta-learning
Abstract:Addressing the challenges faced by current cold start recommendation models in effectively mining structural and semantic information in heterogeneous information networks, and their tendency to overlook user behavior attributes within these networks, this paper introduced a meta-learning-based multi-view contrast fusion cold start recommendation algorithm(MVC-ML) . This algorithm effectively tackled the cold start problem at both the model and data layers. Within the MVC-ML framework, it firstly extracted higher-order semantic information from heterogeneous information networks using a meta-path view. Subsequently, it captured the network’s structural features using a network pattern view. Following this, the algorithm analyzed user behavior attribute information through a clustering view. Finally, MVC-ML employed a contrast learning method to integrate the information extracted from these three views, thus generating accurate representation vectors. Experimental validations on datasets, including DBook, demonstrate that the MVC-ML model, in a cold start scenario, reduces MAE by 1.67%, lowers RMSE by 2.06%, and increases nDCG@K by 1.48% compared to traditional heterogeneous information network models such as MetaHIN. These results fully confirm the rationality and effectiveness of the MVC-ML algorithm.
Key words:heterogeneous information network; contrast learning; network mode; cold start
0 引言
隨著信息技術的快速發展,互聯網信息數量呈指數級增長,人們想要獲得自己想要的信息的難度越來越大。為了解決用戶信息過載問題,推薦系統[1]被廣泛部署在各種在線服務當中,例如電子商務平臺和新聞門戶。在這些服務當中,推薦系統會根據用戶的習慣和興趣給他們推薦合乎用戶心意的信息。傳統推薦系統的核心是協同過濾,主要是根據用戶的歷史動作(如點擊、購買等)來估計用戶對某物品的感興趣概率。但是對于一個新用戶或者新物品,它們之間的交互信息是稀疏的,如何在數據稀疏的情況下有效地學習新用戶和新物品的表示,這就是推薦系統冷啟動問題[2]。
為了緩解冷啟動問題,常見的方法是借助額外信息來對新用戶和新物品的表示進行增強[3]。近年來,將異構信息網絡和推薦系統進行結合的研究越來越多,異構信息網絡獨特的網絡結構能夠豐富用戶-物品之間的交互信息,從而加強用戶和物品的表示。異構信息網絡在生活中廣泛存在,例如社交網絡、知識圖譜等[4]。圖1(a)就是個典型的異質信息網絡,它不僅描述了用戶和電影之間的關系,還能捕獲用戶、電影與導演、演員之間的關系,圖1(b)是通過異構信息網絡構成的元路徑,它可以有效地表示異質信息網絡的高階結構和語義信息。例如,UMAM就表示了兩部電影具有相同的演員,而用戶已經和其中一部電影有過交互。
在模型層面,元學習框架[5]為冷啟動推薦問題提供了新的研究路徑。元學習注重獲取一般性知識(即先驗知識),以便利用先驗和少量訓練數據快速適應新的學習任務。在某種程度上,冷啟動推薦問題可以變換為元學習問題,其中每個任務是學習一個用戶的偏好。元學習從現有用戶的任務中學習到具有強泛化能力的先驗知識,使得它可以在元測試期間快速適應到新任務上,即為交互數據稀疏的冷啟動用戶推薦物品。圖1(c)中,冷啟動用戶u3(僅具有一個電影評級)可以從元測試的先驗知識θ中被適配,其中先驗知識是通過學習如何在元訓練中適配現有用戶u1和u2而得出的。一些研究[6~8]采用元學習來解決冷啟動問題,并取得了一定的成果。
然而,這些研究通常是直接采用元學習框架,忽略了探索異質信息網絡中獨特的異質圖結構和語義信息。一些模型[9,10]探索了異質信息網絡的高階結構和語義信息,但是這些模型并沒有利用異質信息網絡本身的網絡結構,這種網絡結構直接刻畫了節點之間的聯系,能夠提供大量的輔助信息[11]。另一方面,利用元路徑描述異質信息網絡的高階信息時會存在這樣一個問題:如圖2所示,用戶u1和u2的偏好分布并不相似,但是他們都與m1有過交互,元路徑可以描述這種聯系,從而認為他們是相關的。再來看用戶u2和u3,他們雖然沒有觀看過同樣的影片,但是他們有一個相似的偏好分布,即他們都喜歡看喜劇片和動作片,這種偏好分布很可能不被元路徑所描述出來。
針對上述問題,本文提出了基于元學習的多視圖對比融合冷啟動推薦算法(MVC-ML),旨在解決下面的幾個挑戰:a)單一元路徑描述異質信息網絡的網絡結構和語義信息略顯不足,如何更具質量地描述異質信息網絡的結構和語義信息?b)如何識別元路徑難以描述的偏好信息,提高用戶的特征表示質量?
針對第一個問題,本文考慮到了異質信息網絡的元模板——網絡模式。網絡模式作為異質信息網絡的本地結構信息,它清晰直觀地展現出了節點之間的聯系。而元路徑作為描述異質信息網絡結構和語義信息的常用方式,如果將網絡模式視圖與元路徑視圖得到的信息進行融合,對刻畫異質信息網絡結構和語義信息有很大的作用。
針對第二個問題,考慮到用戶會帶有一些行為屬性簡檔,簡檔相似的用戶在一定程度上會具有相同的興趣,因此本文采用集群的方式,將具有相似行為屬性的用戶分到一個集群,增強用戶的關聯性。最后,對元路徑視圖、網絡模式視圖和聚類視圖進行對比學習[12],整合三個視圖的信息,最終得到用戶和物品的表示向量。
本文的貢獻總結如下:
a)提出了基于元學習的多視圖對比融合冷啟動推薦算法,構建了元路徑、網絡模式和聚類三個視圖,更準確描述了異質信息網絡高階信息,增強元學習過程中的用戶和物品表示,從而在數據和模型兩個方面解決冷啟動問題。
b)構建了對比學習模塊,采用自監督訓練的方法,充分挖掘整合三個視圖中的信息,從而更深入地挖掘異質信息網絡中無標簽數據的信息。
c)對不同冷啟動場景下的三個真實數據集進行了廣泛的實證研究,證明了MVC-ML的合理性、有效性。
1 相關工作
1.1 冷啟動推薦
基于深度學習的推薦算法[13]在提高推薦精度方面表明了其優越性。但是,上述基于深度學習的推薦算法由于其歷史數據有限,以及個人差異導致的用戶偏好的偏差,很難對預測模型訓練后出現的新用戶和新物品作出像樣的推薦。以上冷啟動問題一般存在推薦系統中,為了緩解缺乏歷史數據的問題,在推薦系統中使用了輔助信息來描述新用戶和新物品。Li等人[14]介紹了行為密集型神經網絡,該網絡還利用項目的文本內容來學習語義潛在項目向量,并通過聚合其交互的項目來表示新用戶。除了上述基于文本特征的推薦系統之外,為了更好地學習特征嵌入之間的關系,Cheng等人[15]開發了自適應分解網絡 (AFN)。AFN提出了一種對數變換網絡,以有效地從數據中學習任意階交叉特征。但是,即使用戶具有不同的歷史交互數據,上述基于內容的推薦系統始終為具有465249457ef61a65ebb26d3faa7709c2eaf512d67f11fd8b44c79ab1e824a8f3相同側面信息的用戶提供相同的建議。這些推薦系統忽略了用戶交互中的個體差異,無法準確提供個人推薦。同時,跨域推薦(CDR)利用來自外部域的數據來提供目標域中不足的交互。CDR被視為緩解缺乏互動問題的有前途的解決方案。按照這一思路,文獻[16,17]作出了一些改進。例如,文獻[16]采用了領域對抗學習來隱式地將交互模式從支持領域(support domain)轉移到目標領域(target domain)。當公共用戶或物品跨域存在時,諸如文獻[17]明確地將轉移用戶和物品的嵌入作為先驗知識。上述這些方法只是在數據層面緩解冷啟動推薦問題, 對數據的可靠性有很大的依賴。
1.2 元學習
近年來研究人員將基于優化的元學習[5]引入到了推薦系統當中,以緩解推薦系統冷啟動問題?;趦灮膮党跏蓟幕舅枷胧菍⒃Rw定義為基礎推薦模型的初始參數,然后以雙層優化的形式更新參數初始化。在這個基礎上,Lee等人[6]首先將MAML框架引入冷啟動推薦,并提出了MeLU,目的是學習基于神經網絡的推薦模型的全局參數初始化作為先驗知識。借鑒多個冷啟動任務全局學習模型初始化參數的思想,Chen等人[7]在MeLU的基礎上提出了一種多先驗元學習方法MPML,該方法配備了多組初始化參數,要分配哪一組初始化參數取決于在本地更新后哪個性能優于其支持集。MetaEDL[18]采用MAML框架來通過置信學習增強推薦模型的初始化參數??紤]到任務的異質性問題,MAMO[8]通過面對不同任務定制特定任務的初始化,在初始化推薦模型參數時提供了個性化的偏差項。遵循自定義特定任務初始化的相同想法,Wang等人[19]還認為具有相似偏好的用戶應該共享相似的先驗知識,并提出了一種偏好自適應元學習方法PAML,通過應用外部元模型,將全局共享的先驗初始化調整為偏好特定的初始化。除了基于推薦模型的參數初始化之外,一些工作還利用元學習來學習不同冷啟動任務的自適應超參數。例如,MetaCS[20]采用類似MeLU的雙層優化,并在執行全局優化時附加本地更新的學習率的值。MetaHIN[9]采用了元路徑來刻畫異質網絡的語義和結構信息, 并整合在元學習框架中。RPMLG-Rec[21]將本地不同偏好連接起來,構成顯式偏好圖,然后按照元學習訓練策略快速適應。但是上述這些方法都忽視了一定的結構和語義信息, 且完全忽視了異質信息網絡中大量的信息。
1.3 異質信息網絡表示學習
傳統異質信息網絡的核心技術是基于元路徑, 通過不同的機制來刻畫節點與元路徑之間的關系。metapath2vec[22]采用了異質word2vec技術, 將上下文的窗口限制為一個特定的類型。HIN2vec[23]采用元路徑與節點之間的Hadamard乘積來捕獲網絡特征。近來, 基于圖神經網絡的異質信息網絡表示屢被提出。Het-GNN[24]首先聚合同一類型的節點特征, 然后采用注意力機制聚合不同的類型特征。HAN[25]首先采用注意力機制聚合元路徑的特征, 然后采用注意力機制聚合不同的元路徑。MetaHIN模型[9]通過在元學習環境中捕獲異質信息網絡的語義信息,并利用協同適應元學習器處理每個任務中不同的語義方面。MNRec[26]通過基于元路徑和交換矩陣的異構信息網絡嵌入方法得到用戶和項目的嵌入,最后將其導入到雙路徑MLP中進行評級預測。HSG[27]通過三種不同類型的子圖,將其組合構建成異構圖,之后通過元路徑隨機游走進行網絡嵌入。但是上述方式忽略了異質信息網絡的本地結構,沒有考慮到網絡模式作為異質信息網絡的元模板刻畫了節點之間的直接聯系。
2 基礎知識
本文方法主要是異質信息網絡上的基于元學習的冷啟動推薦,下面對異質信息網絡、元路徑、元學習和網絡模式的相關概念和基礎知識進行介紹。
2.1 異質信息網絡
異質信息網絡[28]可表示為G=(V,E,A,L),其中V表示節點集,E表示邊集。V中的節點(或E中的邊)有多種類型。因此,每一個節點v∈V(或每一個邊e∈E)與一個映射函數φ(v):V→A(ψ(e):E→L)相關聯,其中A(或L)表示節點類型(邊類型)的集合。|A|+|L|>2代表該網絡為異質信息網絡。
2.2 網絡模式
網絡模式[11]可表示為TG=(A,L),是一個由節點類型和邊類型組成的圖,能夠描述節點之間的聯系,刻畫網絡本地結構。例如,圖1(d)是圖1(a)的網絡模式。
2.3 元路徑
寫為V1V2…Vl+1。如圖1(b)所示,存在兩種元路徑UMAM、UMDM,分別代表了不同的語義,即某用戶看了某電影,這個電影與另一個電影有著相同的導演或演員。因此,元路徑能夠抽象出異質信息網絡當中的高階結構信息。
2.4 元學習
3 模型
3.1 模型總體架構
3.2 多視圖融合模塊
圖5是圖4中多視圖融合模塊的詳細架構,本文從元路徑、網絡模式和聚類三個視圖中分別挖掘異質信息網絡的特征信息和用戶的行為屬性簡檔,元路徑主要針對網絡的高階信息,網絡模式主要針對網絡的自身結構,聚類主要針對用戶本身的行為屬性簡檔。最后利用對比學習的方法,將三個視圖所獲得的信息進行融合。
3.2.1 元路徑視圖
根據研究[6, 9],本文使用用戶和物品的初始特征來初始化向量,epu和ei分別表示用戶u和物品i的初始化向量,最后用戶u基于物品的偏好,可以通過匯總用戶的歷史交互來計算,如下所示。
其中:Su是u的支持集;mean是合并平均操作;W和b是可學習參數;η是LeakyReLU激活函數。
對于用戶u,在計算u和他所有基于元路徑的相關用戶的關聯強度后,本文選擇與用戶u關聯強度較高的部分用戶參與到模型運算當中,這些用戶表示為Um。隨后利用公式學習這些用戶基于物品的偏好,如下所示。
其中:W和b是可學習參數。通過上式,模型獲取了Um中的每個用戶基于物品的偏好,但是由于不同用戶對目標用戶u的貢獻不同,本文將所有eum堆疊起來獲得矩陣Em,利用注意力機制獲取用戶u基于元路徑視圖的用戶表示,如式(8)所示。
em=Em softmax(ETmeu)(8)
3.2.2 網絡模式視圖
異質信息網絡的網絡結構可以看作其元模板,其中包含了不同節點之間的直接聯系,將網絡結構融入到模型當中,能夠提供大量輔助信息,提高用戶表示的準確性。在網絡模式的視角下,對于一個給定的用戶u,他與K個其他類型的節點相連,可以表示為{z1,z2,…,zk}。則與節點u相連的類型為zn的鄰居節點可以表示為Nznu,那么對于同一種類型的鄰居節點可以聚合如下:
其中:σ是ReLU激活函數;ej是節點j的特征向量。
其中:wn和bn是可學習參數;an是注意力向量;εzn即為各個類型節點的權重。
3.2.3 聚類視圖
用戶本身是帶著一些行為屬性(如觀看、點擊、評論),具有相同行為屬性的用戶可能不會出現在同一條元路徑上,但是他們本身是具有一定關聯性的。為了挖掘這類具有關聯性的用戶,本文采用基于聚類的策略,通過聚類過程將由式(4)得到的用戶表示進行線性投影,獲得對應用戶的聚類查詢向量,公式如下:
tu=Wteu+bt(13)
其中:β為t分布的自由度,這里取值為1。最后融合聚類信息的用戶表示ec可以計算如下:
3.2.4 對比融合和得分預測
通過上述的運算過程,模型生成了用戶u的三種向量表示,分別是基于元路徑視圖的用戶表示em、基于網絡模式視圖的用戶表示en和基于聚類視圖的用戶表示ec。為了進一步增強用戶表示的魯棒性,本文采用對比學習來將這三種向量表示進行融合,更深層次地挖掘用戶潛在信息。具體而言,就是先將em和en進行對比學習,生成emn,再將en和ec進行對比學習生成enc,最后將emn和enc進行對比學習生成用戶最終表示xu。具體而言就是同一節點u的不同視圖下的表示為正例時,其余節點的表示為負例。各步驟的目標函數如下:
其中:sim()表示為sim()=e(g(),g()),g()是多層感知器,e()是相似度函數,這里采用余弦相似度進行計算;τ代表溫度系數。
同理,物品向量表示xi也可以得到,那么就可以預測用戶u對物品i的偏好得分:
最后最小化如下損失函數以學習用戶u的偏好:
根據上述流程,模型總的訓練過程如算法1所示。
算法1 MVC-ML訓練算法
通過式(21)計算模型整體的損失
4 實驗與結果分析
4.1 數據集
本文在DBook、MovieLens和Yelp三個基準數據集上進行實驗,它們的數據統計信息如表1所示。
對于每個數據集,本文根據用戶加入時間(或第一次用戶操作時間)和物品發布時間,將用戶和物品分為現有用戶(物品)和新用戶(物品)兩組,新出現的用戶(物品)和已存在的用戶(物品)的比例大致為2∶8。然后將每個數據集分為元訓練和元測試數據。元訓練數據僅包含現有物品的現有用戶評級,本文隨機選擇其中的10%作為驗證集,其余為元測試數據。模型訓練對應三種冷啟動場景:用戶冷啟動(UC),即為新用戶推薦現有物品;物品冷啟動(IC),即為現有用戶推薦新物品;用戶物品冷啟動(UIC),即為新用戶推薦新物品。
在元學習設置中,本文構建支持集和查詢集(即Su和Qu)。具體來說,在每個數據集中找出一些交互次數在15~100的用戶,然后為每個用戶隨機選擇10個歷史交互項目作為查詢集(即|Qu=10|),其余部分用作支持集。在元路徑的構建上,凡是長度小于4的元路徑都會被構建。
4.2 評價指標及基準模型
本文采用平均絕對誤差(MAE)、均方根誤差(RMSE)和K級歸一化折扣累積增益(nDCG@K)三種廣泛使用的評價指標。
平均絕對誤差(MAE)是回歸模型的度量之一,它計算的是預測值與真值之間的絕對值之和。MAE值越小,預測精度越高。
均方根誤差(RMSE)對異常值非常敏感,其結果與數據本身在同一尺度上,比均方誤差(MSE)更能描述誤差。RMSE值越小,模型的性能越好,誤差越小。
K級歸一化折扣累積增益(nDCG@K)評估推薦系統中排名列表的準確性。本文設置K=5,并注意到nDCG@K值越高,推薦模型的準確率越高。
在基準模型的選擇上,本文將基準模型分為傳統模型、基于異質信息網絡的模型和冷啟動模型三大類,具體信息如表2所示。
4.3 實驗結果與分析
從表3可以看到,在所有場景下,MVC-ML相較于基線模型都取得了很好的結果。在冷啟動場景下,傳統模型由于架構所限,只能夠提取異質信息網絡簡單的內容特征,對于異質信息網絡所蘊涵的語義信息和高階結構信息均不能有效提取,所以這類模型在冷啟動場景下表現很差。而基于異質信息網絡的模型可以在一定程度上提取到網絡的語義和高階結構信息,因此這類模型相較于傳統模型在推薦效果上有不少的提升,HERec基于元路徑的游走策略可以獲取網絡的語義和高階結構信息,MNRec更進一步采用元路徑和交換矩陣的異質信息網絡嵌入方式來獲取用戶和物品的嵌入,進一步提升了推薦效果,表明了使用元路徑能夠在一定程度上提升非同構網絡下推薦系統的性能。
基于元學習的冷啟動推薦模型相較于傳統模型和異質信息網絡模型均有一定的提升,這是因為元學習本身的少樣本學習特性對于推薦系統冷啟動問題具有天然的優勢。其中由于MateEmb模型是針對廣告場景,所以相較于其他模型而言,推薦效果并不是很好。
MetaHIN模型采用了多層元路徑思想來獲取多方面的異質信息網絡語義信息,因此它的效果要比其他模型的效果好。但是由于MetaHIN并沒有考慮到異質信息網絡的網絡模式和用戶的行為屬性簡檔,導致MetaHIN的推薦效果要差于MVC-ML。HSG通過元路徑隨機游走獲取由多子圖構建的異質信息網絡的復雜異構數據,相較于MetaHIN的多層元路徑方式能夠更充分地挖掘異質信息網絡中的隱含信息。多子圖構建的方法也在一定程度上有著和網絡模式一樣的作用,但是它和MetaHIN有著相同的劣勢,并沒有考慮到用戶的行為屬性簡檔,所以HSG相比MetaHIN有著一定的提升,但是推薦效果要弱于MVC-ML。MVC-ML使用元路徑、網絡模式和聚類三個視圖描述異質信息網絡的語義和結構信息,同時也高效融合了用戶本身的行為屬性簡檔信息,實驗充分表明了多視圖的信息融合使得MVC-ML的推薦效果有很大的提升。
在非冷啟動場景下,MVC-ML的推薦效果也是要好于其他模型的。根據表2所示,數據集本身是很稀疏的,說明這些數據集中存在相當一部分的無監督信息,MVC-ML能在這些數據集下取得很好的推薦效果,說明MVC-ML也是適用于稀疏數據集的,表明了MVC-ML的多視圖融合策略能夠很好地挖掘稀疏數據集中的信息,使得處理稀疏性數據更為高效。
4.4 消融實驗
為了驗證模型中不同視圖模塊的貢獻,本文進行了消融實驗,設計了三個模型變種,分別是:a)MP-去除了元路徑視圖;b)NW-去除了網絡模式視圖;c)CL-去除了聚類視圖。同時為了驗證元學習的有效性,本文采用一個變種ML-,它只采用多視圖融合模塊進行訓練,不采用元學習框架。在實驗場景選擇上,考慮到在用戶物品冷啟動(UIC)場景下能夠包含用戶冷啟動和物品冷啟動兩種場景,因此單獨選擇用戶物品冷啟動場景進行消融實驗,在一定程度上也能描述了用戶冷啟動和物品冷啟動的情況。
消融實驗結果如表4所示。從不同模塊貢獻的角度上來看,三種視圖所獲得的信息都對MVC-ML有影響,其中去掉元路徑視圖對MVC-ML的影響最大,這是因為本文針對的是異質信息網絡,而元路徑在異質信息網絡中對提取語義信息和網絡結構具有很大的作用,去掉元路徑視圖對于高階信息的提取很不利,從而導致推薦效果的減退。網絡模式視圖和聚類視圖對模型的影響相似,表明網絡模式視圖下的本地結構信息和用戶行為屬性簡檔在異質信息網絡下具有同等重要的地位。這三個視圖的消融實驗充分證實了MVC-ML綜合利用元路徑的高階信息、網絡模式下的本地結構和用戶行為屬性簡檔的優勢。ML-變體的效果也不是很理想,僅僅略好于MP-變體,表明了元學習框架在冷啟動推薦問題上具有很大的優勢。
4.5 參數分析
本文研究用戶集群數量(K)的影響,實驗場景仍然選擇用戶物品冷啟動場景。圖6描述了改變DBook、MovieLens和Yelp數據集上的用戶集群數量的結果??梢杂^察到,當K<8時,性能隨著用戶集群數量的增加而增加,然后當K=8時,MVC-ML達到最佳性能。之后,當K>8時,MVC-ML的性能隨著聚類數量的增加而略有下降,這表明選擇較小的K是合理的,當使用的特征數量增加時,可能需要較大的K。
5 結束語
本文提出了基于元學習的多視圖對比融合冷啟動推薦算法來解決異質信息網絡下推薦系統中的冷啟動問題。針對目前冷啟動模型無法高效地刻畫異質信息網絡中的結構和語義信息以及忽視了用戶行為屬性簡檔等問題,本文提出了多視圖融合模塊,設計了元路徑、網絡模式和聚類這三個視圖,挖掘高階和本地的結構與語義信息;而后, 在元路徑、網絡模式和聚類三個視圖中使用對比學習整合三個視圖,獲得用戶和物品的表示; 最后, 將該模塊整合在元學習框架中, 有效解決了冷啟動推薦問題。在三個公開基準數據集上進行了三個冷啟動場景下的對比實驗,MVC-ML的實驗結果優于所有基線模型,驗證了所提模型的有效性。
未來的研究有以下幾個方向:a)目前網絡模式只是把異質信息網絡本地結構給刻畫出來,下一步可以考慮根據節點類型的不同來構造同構信息網絡,結合異質信息網絡本地結構來增強異質信息網絡的結構刻畫;b)采用對比學習挖掘無標簽信息是自監督學習的一種方法,后面可以聯合生成式學習來進一步挖掘深層次無標簽信息。
參考文獻:
[1]Resnick P,Varian H R. Recommender systems[J]. Communications of the ACM, 1997, 40(3): 56-58.
[2]Zhu Yu, Lin Jinghao, He Shibi, et al. Addressing the item cold-start problem by attribute-driven active learning[J]. IEEE Trans on Knowledge and Data Engineering, 2019,32(4): 631-644.
[3]Narducci F, Basile P, Musto C, et al. Concept-based item representations for a cross-lingual content-based recommendation process[J]. Information Sciences, 2016,374:15-31.
[4]Shi Chuan, Li Yitong, Zhang Jiawei, et al. A survey of heterogeneous information network analysis[J]. IEEE Trans on Knowledge and Data Engineering, 2016, 29(1): 17-37.
[5]Finn C, Abbeel P, Levine S. Model-agnostic meta-learning for fast adaptation of deep networks[C]//Proc of the 34th International Conference on Machine Learning. New York:ACM Press, 2017: 1126-1135.
[6]Lee H, Im J, Jang S, et al. MeLU: meta-learned user preference estimator for cold-start recommendation[C]//Proc of the 25th ACM SIGKDD International Conference on Knowledge Discovery & Data Mining. New York: ACM Press, 2019: 1073-1082.
[7]Chen Zhengyu, Wang Donglin, Yin Shiqian. Improving cold-start re-commendation via multi-prior meta-learning[C]//Proc of the 43rd European Conference on Information Research. Cham: Springer, 2021: 249-256.
[8]Dong Manqing,Yuan Feng,Yao Lina,et al. MAMO:memory-augmented meta-optimization for cold-start recommendation[C]//Proc of the 26th ACM SIGKDD International Conference on Knowledge Discovery & Data Mining. New York: ACM Press, 2020: 688-697.
[9]Lu Yuanfu, Fang Yuan, Shi Chuan. Meta-learning on heterogeneous information networks for cold-start recommendation[C]//Proc of the 26th ACM SIGKDD International Conference on Knowledge Discovery & Data Mining. New York: ACM Press, 2020: 1563-1573.
[10]Xu Jia, Zhang Hongming, Wang Xin, et al. AdaML: an adaptive meta-learning model based on user relevance for user cold-start recommendation[J]. Knowledge-Based Systems, 2023, 279:110925.
[11]Sun Yizhou, Han Jiawei. Mining heterogeneous information networks: a structural analysis approach[J]. ACM SIGKDD Explorations Newsletter, 2013, 14(2): 20-28.
[12]邴睿, 袁冠, 孟凡榮, 等. 多視圖對比增強的異質圖結構學習方法[J]. 軟件學報, 2023, 34(10): 4477-4500. (Bing Rui, Yuan Guan, Meng Fanrong, et al. Multi-view contrast enhanced learning method for heterogeneous graph structure[J]. Journal of Software, 2023, 34(10): 4477-4500.)
[13]Liang Dawen, Krishnan R G, Hoffman M D, et al. Variational autoencoders for collaborative filtering[C]//Proc of World Wide Web Conference. New York:ACM Press, 2018: 689-698.
[14]Li Zhi, Zhao Hongke, Liu Qi, et al. Learning from history and pre-sent: next-item recommendation via discriminatively exploiting user behaviors[C]//Proc of the 24th ACM SIGKDD International Confe-rence on Knowledge Discovery & Data Mining. New York: ACM Press, 2018: 1734-1743.
[15]Cheng Weiyu, Shen Yanyan, Huang Linpeng. Adaptive factorization network: learning adaptive-order feature interactions[C]//Proc of AAAI Conference on Artificial Intelligence. Palo Alto, CA: AAAI Press, 2020: 3609-3616.
[16]Krishnan A, Das M, Bendre M, et al. Transfer learning via context-ual invariants for one-to-many cross-domain recommendation[C]//Proc of the 43rd International ACM SIGIR Conference on Research and Development in Information Retrieval. New York: ACM Press, 2020: 1081-1090.
[17]Liu Meng, Li Jianjun, Li Guohui, et al. Cross domain recommendation via bi-directional transfer graph collaborative filtering networks[C]//Proc of the 29th ACM International Conference on Information & Knowledge Management. New York: ACM Press, 2020: 885-894.
[18]Neupane K P, Zheng E, Yu Qi. MetaEDL: meta evidential learning for uncertainty-aware cold-start recommendations[C]//Proc of IEEE International Conference on Data Mining. Piscataway, NJ: IEEE Press, 2021: 1258-1263.
[19]Wang Li, Jin Binbin, Huang Zhenya, et al. Preference-adaptive meta-learning for cold-start recommendation[C]//Proc of the 30th International Joint Conference on Artificial Intelligence. San Francisco,CA:Margan Kaufmann Publishers, 2021: 1607-1614.
[20]Bharadhwaj H.Meta-learning for user cold-start recommendation[C]//Proc of International Joint Conference on Neural Networks. Piscataway, NJ: IEEE Press, 2019: 1-8.
[21]Liu Huiting, Wang Lei, Li Peipei, et al. Relation-propagation meta-learning on an explicit preference graph for cold-start recommendation[J]. Knowledge-Based Systems, 2023, 272: 110579.
[22]Dong Yuxiao, Chawla N V, Swami A. metapath2vec: scalable representation learning for heterogeneous networks[C]//Proc of the 23rd ACM SIGKDD International Conference on Knowledge Discovery and Data Mining. New York: ACM Press, 2017: 135-144.
[23]Fu Taoyang, Lee W C, Lei Zhen. HIN2vec: explore meta-paths in heterogeneous information networks for representation learning[C]//Proc of ACM Conference on Information and Knowledge Management. New York: ACM Press, 2017: 1797-1806.
[24]Zhang Chuxu, Song Dongjin, Huang Chao, et al. Heterogeneous graph neural network[C]//Proc of the 25th ACM SIGKDD International Conference on Knowledge Discovery & Data Mining. New York: ACM Press, 2019: 793-803.
[25]Wang Xiao, Ji Houye, Shi Chuan, et al. Heterogeneous graph attention network[C]//Proc of the World Wide Web Conference. New York: ACM Press, 2019: 2022-2032.
[26]Tan Lei, Gong Daofu, Xu Jinmao, et al. Meta-path fusion based neural recommendation in heterogeneous information networks[J]. Neurocomputing, 2023, 529: 236-248.
[27]Li Meizi, Que Weiqiao, Geng Ziyao, et al. Cold-start item recommendation for representation learning based on heterogeneous information networks with fusion side information[J]. Future Generation Computer Systems, 2023, 149: 227-239.
[28]石川, 王睿嘉, 王嘯. 異質信息網絡分析與應用綜述[J]. 軟件學報, 2021,33(2): 598-621. (Si Chuan, Wang Ruijia, Wang Xiao. Heterogeneous information network analysis and application review[J]. Journal of Software, 2021, 33(2): 598-621.)
[29]Xie Junyuan, Girshick R, Farhadi A. Unsupervised deep embedding for clustering analysis[C]//Proc of the 33rd International Conference on Machine Learning. New York:ACM Press, 2016: 478-487.
[30]Rendle S, Gantner Z, Freudenthaler C, et al. Fast context-aware re-commendations with factorization machines[C]//Proc of the 34th International ACM SIGIR Conference on Research and Development in Information Retrieval. New York: ACM Press, 2011: 635-644.
[31]Wang Xiang, He Xiangnan, Wang Meng, et al. Neural graph colla-borative filtering[C]//Proc of the 42nd International ACM SIGIR Conference on Research and Development in Information Retrieval. New York: ACM Press, 2019: 165-174.
[32]Berg R V D, Kipf T N, Welling M. Graph convolutional matrix completion [EB/OL]. (2017-10-25). https://arxiv.org/abs/1706.02263.
[33]Shi Chuan, Hu Binbin, Zhao W X, et al. Heterogeneous information network embedding for recommendation[J]. IEEE Trans on Know-ledge and Data Engineering, 2018, 31(2): 357-370.
[34]Pan Feiyang, Li Shuokai, Ao Xiang, et al. Warm up cold-start advertisements: improving CTR predictions via learning to learn ID embeddings[C]//Proc of the 42nd International ACM SIGIR Conference on Research and Development in Information Retrieval. New York: ACM Press, 2019: 695-704.