999精品在线视频,手机成人午夜在线视频,久久不卡国产精品无码,中日无码在线观看,成人av手机在线观看,日韩精品亚洲一区中文字幕,亚洲av无码人妻,四虎国产在线观看 ?

基于異質信息網絡分析的主題感知群推薦方法研究

2022-01-01 00:00:00張馨悅岳峰王含茹王剛
計算機應用研究 2022年2期

摘 要: "在社交網絡上面向群組推薦物品時,已有研究大多基于群成員的完整偏好,運用一些合成策略生成群推薦結果。但在實際中,促使群成員加入目標群的可能只是其完整偏好中與該群相關的部分偏好。因此,使用群成員的完整偏好進行推薦便會帶來大量的噪聲,損害推薦效果。為解決這一問題,提出了一種基于異質信息網絡分析的主題感知群推薦方法HINGR_GT(heterogeneous information network analysis based group recommendation method with group topic considered),針對每個群組構建面向群組的異質社交網絡子圖,將成員偏好中與群組無關的偏好提前排除在外,在此基礎上使用異質網絡表示學習方法為群組生成物品推薦。為驗證所提方法的有效性,在豆瓣電影數據集上進行了實驗,結果表明所提方法在所有評價指標上均取得了更好的效果。

關鍵詞: "群推薦; 偏好噪聲; 異質信息網絡分析; 表示學習

中圖分類號: "C931.6 """文獻標志碼: A

文章編號: "1001-3695(2022)02-019-0436-06

doi:10.19734/j.issn.1001-3695.2021.06.0269

Heterogeneous information network analysis based group recommendation "method with group topic considered

Zhang Xinyuea, Yue Fengb, Wang Hanrua, Wang Ganga

(a.Dept.of Management, b.Dept.of Computer Science amp; Information Engineering, Hefei University of Technology, Hefei 230009, China)

Abstract: "When recommending items to groups on social networks,most of the existing studies use the complete preferences of group members and some aggregation strategies to generate group recommendation.However,in practice,a user may join a group just because of a part of his/her complete preferences related to the group.In this way,using the complete preferences of group members for recommendation will bring a lot of noise,and damage the effect of recommendation.This paper proposed the HINGR_GT method to solve the above problem.It constructed a group oriented heterogeneous social network sub graph for each group,and excluded members’ group independent preferences in advance.On this basis,it used the heterogeneous network representation learning method to generate item recommendation for groups.In order to verify the effectiveness of the proposed method,this paper carried out experiments on Douban Movie dataset,and the results show that the proposed method achieves better results in all evaluation metrics.

Key words: "group recommendation; preference noise; heterogeneous information network analysis; representation learning

0 引言

社交網絡為人們的溝通交流和信息共享帶來了極大的便利,在人們的日常生活中扮演著越來越重要的角色。隨著網絡用戶的激增,用戶生成內容也變得十分龐大,從而導致了信息過載問題。推薦系統已被證實是解決該問題的有效工具之一。然而,傳統的推薦系統大多是面向個人用戶的,如面向個人用戶的物品推薦、好友推薦、群組推薦和標簽推薦等,但在很多實際場景中,由于人類的群居屬性,人們傾向于以群組的方式進行活動。例如,在豆瓣的興趣小組中與志同道合的人交流興趣愛好、在科研社交網絡CiteULike的學術小組中與研究興趣相同的人探討學術問題等。因此,為了促進各種群組活動,增強組內成員間的溝通與交流,十分有必要面向群組進行推薦。

已有的群推薦相關研究中,部分學者利用協商技術模擬人類制定決策的過程,從而在群成員之間實現一致,但協商技術無法保證最終一定能在成員之間達成一致,當協商失敗時便無法生成推薦[1,2]。還有部分學者利用與群相關的信息直接生成推薦[3,4],但在實際中,很難直接獲得群與物品的交互信息,即使能夠獲取,這些數據也是極端稀疏的,無法依據它們生成準確的推薦。因此,大部分群推薦相關的研究致力于利用群成員與物品的交互數據,輔以群決策系統中的某種合成策略生成推薦。這些方法大致可以分為偏好合成方法和結果合成方法[5~7]兩類。

偏好合成方法首先使用合成策略,如均值策略、最小遺憾策略和最大幸福策略等,將群成員的偏好融合為群偏好,如此便可將群視做一個偽用戶,進而可使用傳統的面向個人的推薦方法為群生成推薦[8]。例如,Chen等人[9]使用基因算法學習各成員的權重,進而將成員評分的加權和作為該群的評分。Berkovsky等人[10]同樣也使用成員評分的加權平均作為群評分,并設計了四種加權機制。其中兩種加權機制是靜態的,一個給成員賦予相同的權重,另一個根據成員的角色為其預先定義好相應的權重。而另外兩種機制是動態的,根據成員的參與度為其定義權重。為了計算群的隱含特征向量,Ortega等人[11]設計了AF、BF和WBF三種方法。其中,AF方法將矩陣分解后各成員的隱含特征向量融合作為群的隱含特征向量,而BF和WBF方法則是先融合群成員的評分,在此基礎上再進行矩陣分解得到群的隱含特征向量。通過在生成推薦之前對群偏好進行表示,偏好合成方法能夠增加找到高價值推薦的機會。然而,這種方法可能會生成一個有偏向的群偏好,無法準確地表示該群,從而導致后續無法生成準確的推薦。

與偏好合成方法的融合時機不同,結果合成方法首先使用傳統推薦方法,依據群成員的偏好,為每個群成員生成推薦結果,然后使用合成策略將各個群成員的推薦結果融合為群推薦結果。依據群成員推薦結果的形式是預測評分還是推薦列表,結果合成方法可進一步劃分為預測評分合成方法和推薦列表合成方法。Ghazarian等人[12]提出一種改進的基于用戶的協同過濾方法預測每個群成員的評分,然后使用平均策略和最小遺憾策略來融合成員評分,進而得到群的預測評分。Wang等人[13]提出了BTF-GR方法,使用張量分解技術來預測群成員的評分,進而使用平均策略將其聚合得到群的預測評分。Boratto等人[14]在推薦列表數量受限的情境下,同時實現了預測評分合成方法和推薦列表合成方法來生成群推薦結果。由于結果合成方法生成的群推薦結果與個人推薦結果直接相關,所以具有較好的可解釋性,使群成員易于接受。然而,結果合成方法忽略了這種情況,即某一物品可能對于任何群成員來說都不是最感興趣的,但是對群組這一整體來說可能是最優的。而且當群組的規模很大時,結果合成方法將會極其耗時。

無論是偏好合成方法還是結果合成方法,在生成群推薦時,依據的都是群成員的完整偏好,然而每個群成員可能具有多個方面的偏好,而促使他們共同加入到一個群的可能只是他們整個偏好中與該群相關的部分偏好。例如,一個研究人員的研究興趣可能包括個性化推薦、異質信息網絡和圖神經網絡等,那么其平常瀏覽的論文必然是這三方面論文的集合,而促使其加入一個推薦系統群組的主要是其在個性化推薦方面的偏好。如果像傳統群推薦方法一樣,對該研究人員的整個偏好(如論文瀏覽記錄)進行建模,或將其融合為群偏好,或用于生成個人推薦,無論哪種方式都會帶來大量的噪聲,因為其中包含了大量與目標群組無關的偏好。為解決這一問題,本研究提出了一種基于異質信息網絡分析的主題感知群推薦方法HINGR_GT。具體而言,其針對每個群組,抽取與該群組主題密切相關的物品,以及群組成員與這些物品的交互數據和相關輔助信息,進而構建面向群組的異質社交網絡子圖,在此基礎上使用異質網絡表示學習方法為社交網絡上的群組生成物品推薦。

1 問題形式化定義

本章對為社交網絡上的群組進行物品推薦這一問題進行形式化定義。假設社交網絡上存在 M 個用戶 u={u 1,u 2,…,u i,…,u M}(i=1,2,…,M) ,其中 u i 表示第 i 個用戶。存在 N 個群組 g={g 1,g 2,…,g j,…,g N}(j=1,2,…,N ),其中 g j 表示第 j 個群組。存在 L 個物品 v={v 1,v 2,…,v l,…,v L}(l=1,2,…,L) ,其中 v l 表示第 l 個物品。存在 S 個標簽 t={t 1,t 2,…,t s,…,t S}(s=1,2,…,S) ,其中 t s 表示第 S 個標簽。

令 UG "M×N={ug ij}(i=1,2,…,M;j=1,2,…,N) 表示用戶—群組矩陣,其中行代表用戶,列代表群組, ug ij 表示用戶 u i 是否加入過群組 g j ,并且滿足:

ug ij = "1 if "u i "has participated in "g j

0 otherwise

令 UV "M×L={uv il}(i=1,2,…,M;l=1,2,…,L) 表示用戶—物品評分矩陣,其中行代表用戶,列代表物品, uv il 表示用戶 u i 對物品 v l 的評分,并且滿足:

uv il= "1 "if "u i "has interacted with "v l

0 otherwise

令 UT "M×S={ut is}(i=1,2,…,M;s=1,2,…,S) 表示用戶—標簽矩陣,其中行代表用戶,列代表標簽,并且滿足:

ut is = "1 if "u i "has tagged "t s

0 otherwise

令 VT "L×S={vt ls}(l=1,2,…,L;s=1,2,…,S) 表示物品—標簽矩陣,其中行代表物品,列代表標簽,并且滿足:

vt ls = "1 if "v "l has tagged by "t s

0 otherwise

令 UU "M×M={uu ik}(i=1,2,…,M;k=1,2,…,M) 表示好友關系矩陣,其中行和列都代表用戶,并且滿足:

uu ik = "1 if "u i "is the friend of "u k

0 otherwise

在社交網絡上為群組推薦物品這一問題可以形式化為:基于用戶—群組矩陣 UG "M×N、用戶—物品評分矩陣 UV "M×L以及用戶—標簽矩陣 UT "M×S、 物品—標簽矩陣 VT "L×S和好友關系矩陣 UU "M×M中的輔助信息。對每個目標群組g j ,根據其成員對物品的可觀測評分,預測群組對物品的評分,并將預測評分較高的前 K 個物品放入該目標群組的推薦列表中,形成群推薦結果。

2 "基于異質信息網絡分析的考慮群組主題的群推薦方法

本文提出了一種基于異質信息網絡分析的考慮群組主題的群推薦方法HINGR_GT,如圖1所示。該方法主要包括異質社交網絡子圖構建、基于元路徑隨機游走、異質社交網絡表示學習和群推薦生成四個步驟:a)在異質社交網絡子圖構建階段,篩選出群成員標記次數最多的標簽作為群標簽,并將被這些標簽標記過的物品、標記過該標簽的用戶及其相關節點抽取出來,形成面向群組的異質社交網絡子圖;b)在基于元路徑隨機游走階段,基于所構建的面向群組的異質社交網絡子圖,定義元路徑并據此在子圖上實施隨機游走,生成每條元路徑下的多條節點序列;c)在異質社交網絡表示學習階段,基于所獲得的節點序列,基于skip-gram模型得到每條元路徑下的群成員和物品的嵌入表示,并將其融合作為最終群成員和物品的表示;d)在群推薦生成階段,將群成員嵌入表示融合為群組嵌入表示,并將群組表示與物品表示的內積放入MLP中生成群對物品的預測評分,最后將預測評分較高的前 K 個物品放入推薦列表中,形成最終的群推薦結果。

2.1 考慮群組主題的異質社交網絡子圖構建

根據每個群組的主題,篩選出與該群組在內容上相關的標簽、用戶和物品等節點,進而構建相應的異質社交網絡子圖,這是本文所提HINGR_GT方法十分重要的一步,為后續向群組生成準確的物品推薦奠定了基礎。本節首先給出異質社交網絡中的實體和關系類型,進而介紹如何生成相應于每個群組的異質社交網絡子圖。由于在面向群組進行推薦時使用的是群成員與物品的交互數據,本研究在設計異質社交網絡時只保留了用戶節點,而群組隱式地體現為其成員的集合。此外,為了找出與目標群組主題相關的物品,需要借助于其他輔助信息。標簽信息在社交網絡中廣泛存在,并且標簽是用戶對物品的標注,一方面可以反映用戶自身的偏好,另一方面也是對物品內容的提煉與概括。所以,本研究在設計異質社交網絡時加入了標簽節點。綜上所述,本研究定義的異質社交網絡中包含三種類型的實體,即用戶( u )、物品( v )和標簽( t ),在這些實體之間包含四種類型的關系,即 uv (用戶與物品的關系)、 ut (用戶與標簽的關系)、 uu (用戶間的關系)和 vt (物品與標簽的關系)。若用戶 u i 與物品 v l 有過交互,如收藏、購買、評分等,則用戶 u i 與物品 v l 之間存在 uv 關系;若用戶 u i 標記過標簽 t s ,則用戶 u i 與標簽 t s 之間存在 ut 關系;若用戶 u i 與用戶 u k 是好友,則用戶 u i 與用戶 u k 之間存在 uu 關系;若物品 v l 被標記過標簽 t s ,則物品 v l 與標簽 t s 之間存在 vt 關系。根據這些實體和關系可構建異質社交網絡。

在為目標群組進行推薦時,需要篩選出群組成員的完整偏好中與目標群組主題相關的偏好,以防止成員無關偏好的引入帶來大量噪聲,從而導致推薦性能的下降。首先,對于目標群組 g j ,將所有成員標記過的標簽中被標記次數最多的前 T 個標簽篩選出來,作為該目標群組的主題標簽集合 T(j) 。其次,將所有物品中,被 T(j) 中的標簽標記過的物品篩選出來,并將相應的物品—標簽關系挑選出來形成對應于目標群組 T(j) 的物品—標簽關系集合 vt′ 。接著,將群成員與這些物品的用戶—物品關系挑選出來形成對應于目標群組 g j 的用戶—物品關系集合 uv′ 。然后,將群成員與 T(j) 中標簽的用戶—標簽關系以及這些成員的好友關系挑選出來形成對應于目標群組 g j 的用戶—標簽關系集合 ut′ 和用戶關系集合 uu′ 。最后,根據 ut′ 、 vt′ 、 uv′ 和 uu′ 這些關系集合構建考慮目前群組 g j 主題的異質社交網絡子圖。以圖1為例,假設以包含用戶1、2、3、4的群組為目標群組,該群組成員標記過標簽1和2,由于標簽1被標記次數較多,所以將標簽1篩選出來。將被標簽1標記過的物品1和2及其與標簽1之間的關系篩選出來,接著,將相應的用戶—物品關系、用戶—標簽關系和用戶—用戶關系篩選出來即得面向該群組的異質社交網絡子圖。

2.2 基于元路徑的隨機游走

在獲得面向群組的異質社交網絡子圖后,下一步便是在該子圖上進行隨機游走生成節點序列,從而為后續學習節點的表示奠定基礎。本節首先介紹針對異質社交網絡子圖所定義的元路徑,進而介紹如何基于元路徑在子圖上進行隨機游走[15,16]。本研究的目的是學習用戶和物品的嵌入表示,因此,本研究分別定義了以用戶和物品為起始節點的元路徑。以用戶為起始節點的元路徑包括 uvu 、 utu 、 uuu 和 uvtvu 。其中: uvu 表示兩個用戶與同一個物品有過交互; utu 表示兩個用戶標記過相同的標簽; uuu 表示兩個用戶具有共同的好友; uvtvu 表示兩個用戶與具有相同標記的兩個物品有過交互。以物品為起始節點的元路徑包括 vuv 和 vtv 。其中: vuv 表示兩個物品與同一個用戶有過交互; vtv 表示兩個物品具有相同的標簽。

元路徑定義好以后,接下來可基于元路徑在面向群組的異質社交網絡子圖上進行隨機游走。在網絡圖上進行隨機游走是指給定一個起始節點,在網絡圖上根據某種規則移動到下一個節點,然后再將當前所在節點作為起始節點,繼續選擇并移動到下一節點,不斷重復此過程,直至達到規定的游走長度。這便是在網絡圖上進行隨機游走的過程,它能夠很好地刻畫網絡的結構信息。基于元路徑的隨機游走也是類似的,不同之處在于基于元路徑的隨機游走需要根據所定義的元路徑進行下一節點的選擇,它在保留網絡結構信息的同時,還能夠刻畫異質信息網絡中豐富的語義信息。對于異質社交網絡子圖,給定元路徑 ρ=A 1 r 1 "A 2 r 2 "… r l "A l+1 ,可根據如下分布進行隨機游走以生成節點序列:

P(n t+1=y|n t=x,ρ)=

1/|N A t+1(x)| (x)=A t,(x,y)∈SymbolACp

,(y)=A t+1

0 (x,y)∈SymbolACp

, (y)≠A t+1

0 (x,y)SymbolACp

(1)

其中: n t+1=y 表示 t+1 時刻位于節點 y 處; n t=x 表示 t 時刻位于節點 x 處; P(n t+1=y|n t=x,ρ) 表示 t 時刻位于 x 處的起始節點在 t+1 時刻沿著元路徑 ρ 游走至節點 y 的概率; (x)=A t 表示節點 x 屬于 A t 類型; |N A t+1(x)| 表示節點 x 的類型為 A t+1 的鄰居節點的數量; (x,y)∈SymbolACp

表示節點 x與y 之間存在連接。

使用上述方法獲得的節點序列通常是異質序列,其中包含著多種類型的節點。此處借鑒了文獻[17]的做法,進一步對這些異質序列進行節點過濾,即將序列中與起始節點類型不同的節點去除,如此一來便將這些異質序列轉換為同質序列。這樣做有兩方面的好處:a)可以使用同質信息網絡中的表示學習方法對其進行處理;b)這樣做其實是將不同類型的節點嵌入到不同的空間中,減輕了將所有異質節點嵌入到同一個空間的限制。

2.3 基于skip-gram的節點表示學習

本節是針對所得節點序列,基于skip-gram模型學習節點的嵌入表示。skip-gram模型是2013年由Google開源的一款詞向量工具,能夠通過在語料上優化目標函數,學得詞語的低維連續嵌入表示。然而,當語料庫中的詞語較多時,使用skip-gram模型訓練的開銷巨大。因此,層級softmax和負采樣兩個加速策略被提出,用于優化skip-gram模型的訓練過程。本研究使用基于負采樣策略的skip-gram模型來學習節點的嵌入表示。 基于負采樣策略的skip-gram模型將正負樣本放在一起進行訓練,使用二元邏輯回歸,學習節點的嵌入表示。對于隨機游走生成的節點序列 nodes={n 1,n 2,…,n s,…,n S} ,以 n s 為中心節點為例,可通過設置固定長度的窗口,根據共現性獲得節點 n s 的上下文節點,記做context (n s) ,則可將 (n s,c|c∈ context (n s)) 視做正樣本。此外,基于負采樣策略的skip-gram模型會在剩下的節點(不屬于context (n s) 的節點)中取出一些節點,可將 (n s,c|c context (n s)) 視做負樣本。令 (n s,c) 為正樣本的概率表示為

P(y=1|n s,c)= 1 1 +e - p "c q "n s =σ( p "c q "n s) ""(2)

其中: p "c和 q "n s 分別表示上下文節點 c 和中心節點 n s 的嵌入表示向量; σ(x)=1/ exp( "-x) 是sigmoid函數。那么, (n s,c) 為負樣本的概率可表示為

P(y=0|n s,c)=1-P(y=1|n s,c)= 1 1+ e p "c q "n s =σ(- p "c q "n s) ""(3)

目的是優化如下對數似然函數:

E= ln ∏ (n s,c)∈D [P(y=1|n s,c)×∏ c′∈N(n s) P(y=0|n s,c′)]=

ln ∏ (n s,c)∈D [σ( p "c q "n s)×∏ c′∈N(n s) σ(- p "c′ q "n s)]=

∑ (n s,c)∈D [ ln "σ( p "c q "n s)+∑ c′∈N(n s) "ln "σ(- p "c′ q "n s)] ""(4)

其中: D 表示正樣本集合; N(n s) 表示針對中心詞 n s 抽取負樣本集合進行介紹。使用隨機梯度下降算法對該目標函數進行優化:

E ""q "n s =[1-σ( p "c q "n s)] p "c-∑ c′∈N(n s) [1-σ(- p "c q "n s)] p "c′ ""(5)

E ""p "c =[1-σ( p "c q "n s)] q "n s ""(6)

E ""p "c′ =-[1-σ(- p "c′ q "n s)] q "n s ""(7)

因此,可按如下公式對 q "n s、 p "c和 p "c′ 進行更新:

q "n s= q "n s+η "E ""q "n s """(8)

p "c= p "c+η "E ""p "c """(9)

p "c′= p "c′+η "E ""p "c′ """(10)

獲得每條用戶元路徑下用戶節點的嵌入表示后,取其平均值作為最終用戶節點的嵌入表示。物品節點的最終嵌入表示亦是如此。

2.4 面向群組的推薦生成

采用2.3節中的方法生成用戶和物品的嵌入表示后,接下來要基于這些嵌入表示預測目標群組對物品的評分。在本節中,首先介紹了如何將群成員的嵌入表示融合為群組的表示,然后介紹如何根據群組和物品的嵌入表示生成群組對物品的預測評分。 令 e "U={e(1) U,e(2) U,…,e(i) U,…,e(M) U}(i=1,2,…,M) 表示所學得的用戶的嵌入表示矩陣,其中 e(i) U 表示用戶 u i 的嵌入表示。令 e "V={e(1) V,e(2) V,…,e(l) V,…,e(L) V}(l=1,2,…,L) 表示所學得的物品的嵌入表示矩陣,其中 e(l) V 表示物品 v l 的嵌入表示。對于目標群組 g j ,可根據式(11)將其成員表示聚合為群組表示。

e g j= average[ReLU (We(i) U+b)|u i∈g j] ""(11)

其中: e g j 表示群組 g j 的嵌入表示;average表示平均聚合函數;ReLU表示線性整流激活函數; u i∈g j表示用戶u i 是群組 g j 的成員; W 和 b 是待優化的參數。

將目標群組和待推薦物品的嵌入表示拼接起來,放入多層感知機中,生成目標群組對待推薦物品的預測評分。

r ^ "jl= sigmoid{MLP[CONCAT (e g j,e(l) V)]} ""(12)

其中: r ^ "jl 表示目標群組 g j 對物品 v l 的預測評分;sigmoid函數的目的是為了將 r ^ "jl 的范圍限制在0~1。

為了訓練 W、b 以及多層感知機中的權重參數,將與成員交互次數位于前50%的物品視做群交互過的物品,并從中隨機選取80%作為正樣本,然后從未交互的物品中選擇同等數量的物品作為負樣本,使用交叉熵損失函數進行訓練:

L=-[∑ v∈Δ+ y log r ^ +∑ v∈Δ- (1-y) log (1-r ^ )] ""(13)

其中: Δ+ 表示正樣本集合,對于其中樣本有 y=1 ; Δ- 表示負樣本集合,對于其中樣本有 y=0 。待優化好相應參數后,可根據式(11)(12)生成目標群組對待推薦物品的預測評分,將預測評分最高的前 K 個物品生成推薦列表。

3 實驗設計

3.1 實驗數據

為了對所提HINGR_GT方法的有效性進行驗證,本研究從豆瓣電影(https://movie.douban.com/)上抓取了相關數據作為本次實驗的數據集。豆瓣電影是豆瓣網專注于電影方面的一個分支,是集影視訊息查詢、購票、評論和社交于一體的網站。在豆瓣電影上,用戶可以查詢到電影的劇情介紹、演職人員、圖片及視頻等基本信息,還可以對電影進行評分和評論,同時也可以看到其他用戶對該電影的評價信息。除上述功能外,在社交方面,豆瓣網還允許用戶將其他用戶添加為關注、允許用戶之間互相留言以及允許用戶加入感興趣的小組。綜上所述,豆瓣電影數據非常符合本次實驗的數據需求,適合作為本次實驗的數據集。

本研究從豆瓣電影上抓取了電影、用戶、群組和標簽等基本信息,以及用戶對電影評分、用戶加入群組、用戶間交互、用戶標記標簽和電影被標記的信息。首先,本研究抓取了熱門、最新和經典等17個類別下的電影的ID和名稱,并對這些基本信息進行了去重。其次,針對每一部電影,抓取對其進行短評的前20個用戶的ID和評分以及該電影被標記的標簽。為保證實驗質量,將已注銷和被禁用的用戶以及評分數量少于等于10的用戶的相關信息剔除。再次,針對每一個用戶,抓取在其留言板上留過言的用戶的ID,作為該用戶的好友。接著,抓取每個用戶加入小組的ID和名稱以及該用戶標記的標簽。同樣為保證實驗質量,將成員少于等于2的群組的基本信息及相關成員加入群組信息剔除,將用戶和物品涉及的所有標簽中出現次數小于2的標簽剔除。數據集的描述信息如表1所示。

3.2 評價指標

本研究使用推薦系統中常用的四個評價指標——準確率(precision)、召回率(recall)、平均準確率(MAP)和平均倒數排名(MRR)來評價推薦方法的性能[15~17]。precision和recall衡量的是推薦結果的準確性,而MAP和MRR同時還考慮了推薦列表中物品的排序。

precision表示推薦給目標用戶的物品中,有多少是用戶真正感興趣的。當推薦個數為 K 時,precision可按如下公式計算:

precision@K= 1 M ∑ M i=1 ""|Rec( u i)@K ∩Te( u i )| |Rec( u i)@K| """(14)

其中:Rec( u i) 表示給用戶 u i 的推薦列表中的前 K 個物品;Te (u i) 表示測試集中用戶 u i 實際交互過的物品集合;|·|是集合的勢; M 是用戶的數量。

recall表示所有用戶真正感興趣的物品中,有多少推薦給了用戶。當推薦個數為 K 時,recall可按如下公式計算:

recall@K= 1 M ∑ M i=1 ""|Rec( u i)@K∩ Te (u i)| "|Te (u i)| """(15)

MAP表示測試集中所有用戶的推薦平均準確率(AP)的均值,可按如下公式計算:

MAP= 1 M ∑ M i=1 ( 1 |C(u i)| ∑ |C(u i)| c=1 "c "Rank i (c) ) ""(16)

其中: C(u i) 表示用戶 u i 的推薦列表中,其真正感興趣的物品集合;Rank i (c) 表示 C(u i) 中第 c 個物品在用戶 u i 的推薦列表中的位置。

MRR表示推薦列表中第一個用戶真正感興趣的物品的平均位置,可按如下公式計算:

MRR= 1 M ∑ M i=1 "1 "Rank i(1) ""(17)

3.3 對比方法及參數設置

為了驗證本研究所提HINGR_GT方法的有效性,在本次實驗中,將之與群推薦系統中的經典方法進行了對比,主要包括:a)MB方法[21],該方法首先使用加和策略將成員偏好融合為群偏好,然后使用基于物品的協同過濾推薦方法來生成群推薦結果;b)MR方法[21],該方法首先使用基于用戶的協同過濾方法為每個群成員生成推薦列表,然后使用平均策略將成員推薦列表融合為群推薦列表;c)CP方法[21],該方法首先使用基于用戶的協同過濾方法生成每個群成員的預測評分,然后使用加和策略將成員評分融合為群評分;d)AF方法[22],該方法首先對用戶—物品評分矩陣進行矩陣分解,然后使用某種合成策略將群成員的特征向量融合為群組的特征向量,本實驗中使用平均策略進行融合;e)BF方法[22],該方法首先將群成員偏好融合為群組偏好,然后基于群—物品評分矩陣進行矩陣分解,得到群特征向量;f)WBF方法[23],該方法在BF方法的基礎上,根據物品收到的來自群成員的評分數量及其一致性為每個物品設定了權重,將群成員偏好融合為群偏好時,權重越高的物品貢獻越大;g)EB方法[23],該方法認為一個成員輸出的信息越多,那么他對于群偏好的建模是越重要的,因此該方法首先基于信息熵得到每個群成員的權重,然后將成員評分加權聚合為群評分。此外,本研究還進行了消融實驗以評估所提方法中不同因素對推薦性能的貢獻情況,主要包括以下兩種方法:a)HINGR_NoSub方法,考慮群組主題生成面向群組的異質社交網絡子圖,是本研究所提方法的重要貢獻之一,為了衡量其對所提方法推薦性能的貢獻,在保證HINGR_GT方法其余部分不變的基礎上,取消子圖抽取步驟,即直接在初始異質社交網絡上進行后續學習;b)HINGR_GT_AVE方法,在將成員嵌入表示融合為群組嵌入表示時,通過構建目標函數學習成員的個性化權重也是所提方法的創新點之一,為了衡量其對所提方法推薦性能的貢獻,在保證HINGR_GT方法其余部分不變的基礎上,取消對于成員權重的學習過程,直接使用平均策略進行融合。綜上所述,此次實驗主要包括九種對比方法,即MB、MR、CP、AF、BF、WBF、EB、HINGR_NoSub和HINGR_GT_AVE。

本次實驗的環境為:Intel CoreTM i5-5200U CPU @ 2.20 GHz,內存4 GB,操作系統為Microsoft Windows 8。在整個實驗過程中,設置隨機游走時,每條元路徑下的實例路徑數為80條,隨機游走步數為100步,設置MLP的隱藏層個數 H 為2,每個隱藏層神經元個數為50。其他相關參數均使用程序中的默認參數。實驗使用留出法對所提方法的有效性進行驗證。具體而言,對于每個群組,從與群成員交互次數位于前50%的物品中,隨機挑選出20%作為測試集,用于對所提方法的性能進行評估,其余數據作為訓練集,用于對所提方法進行訓練。此外,為了減小數據集的劃分對實驗結果的影響,將實驗重復進行10次,以10次結果的平均值作為最終的實驗結果。

4 實驗結果與分析

4.1 實驗結果

表2展示了所提HINGR_GT方法與其他對比方法在豆瓣電影數據集上的precision、recall、MAP和MRR值。可以看出,所提HINGR_GT方法在各個評價指標上均取得了最好的結果,其中,取得最高的precision值為0.375,最高的recall值為0.445,最高的MAP值為0.720,最高的MRR值為0.825,這驗證了所提HINGR_GT方法的有效性。此外,通過對比MB、MR和CP方法可以發現, MR方法取得了較好的結果,其次是MB方法,CP方法取得了最差的效果。這一結果與文獻[21]中的結果存在出入,可能是由于在文獻[21]中,群組是通過聚類形成的,相比于傳統群組,成員之間的偏好更加一致和諧。EB方法基于信息熵從用戶的歷史評分中對用戶特征進行了探索,更好地模擬了群組,因而取得了優于MB、MR和CP方法的結果。通過對比AF、BF和WBF方法可以發現,WBF方法取得了最好的結果,接著依次是BF和AF方法。這一結果與文獻[16]中的結果一致,證明了本次實驗的有效性。此外,由于本質上是對基于矩陣分解模型進行推薦,AF、BF和WBF方法取得了優于MB、MR和CP方法的結果。而通過對比HINGR_NoSub、HINGR_GT_AVE和所提HINGR_GT方法可以發現,HINGR_GT_AVE和所提HINGR_GT方法均取得了比HINGR_NoSub方法好的性能,這表明通過群組成員的標簽構建異質社交網絡子圖確實有助于提高推薦性能。而所提HINGR_GT方法的性能又優于HINGR_GT_AVE方法,這表明使用訓練得到的成員的權重進行融合的方式要優于直接將成員嵌入表示進行平均的融合方式。

4.2 結果分析與參數討論

本研究還對標簽個數 T 、節點嵌入表示的維度 D 和元路徑個數對方法推薦效果的影響進行了探索,接下來對這三個方面進行詳細介紹。

1)標簽個數 T "圖2展示了在標簽個數 T 分別為5、10、15、20和25時,HINGR_GT_AVE方法和所提HINGR_GT方法得到的實驗結果。首先可以發現,所提HINGR_GT方法在不同標簽個數下均取得了優于HINGR_GT_AVE方法的實驗結果,驗證了所提方法的優越性。此外可以發現,隨著標簽個數 T 的增加,各評價指標均呈現出不斷上升的趨勢。當標簽個數 T=20 時,各評價指標取得了各自的最大值。但隨著標簽個數 T 的進一步增加,各評價指標開始下降。因此,通過上述分析可知,當 T=20 時,各方法取得了最佳的推薦性能。

2)節點嵌入表示的維度 D "圖3展示了在節點嵌入表示 維度 D 分別為16、32、64、128和256時,HINGR_NoSub、HINGR_GT_AVE和所提HINGR_GT方法所取得的實驗結果。 首先可以發現,所提HINGR_GT方法在不同節點嵌入表示維度下均取得了優于其他方法的實驗結果,驗證了所提方法的優良性。此外可以發現,當節點嵌入表示維度 D 由16增加至32時,各評價指標均呈現出上升的趨勢。當 D 由32進一步增加至64時,各評價指標還在繼續上升。隨著節點嵌入表示維度 D 進一步由64增加至128再至256時,各評價指標均不斷下降。通過上述分析可知,當 D=64 時,各方法取得了最佳的推薦性能。

3)元路徑個數 為分析不同元路徑的影響,本實驗不斷將元路徑加入相關方法中來查看方法的性能變化情況。圖4展示了隨著元路徑的不斷增加,HINGR_NoSub、HINGR_GT_AVE和所提HINGR_GT方法所取得的實驗結果。 可以發現,大部分元路徑的加入是會帶來推薦性能的提升的,而有些元路徑的引入卻會影響推薦性能,但總體上而言,隨著元路徑的加入,各方法的性能是在不斷提升的,無論是以用戶類型為起點的元路徑,還是以物品類型為起點的元路徑,都有助于推薦性能的提升。加入新的元路徑導致性能下降可能是因為該元路徑中包含一些噪聲,或包含與已有元路徑相沖突的信息。此外,還可以發現,有些元路徑帶來的性能提升較大,而有些元路徑僅能帶來微小的提升,因此,這帶來一個啟示,可以挑選一些對性能提升較大的比較重要的元路徑,從而可以降低模型的復雜度。

5 結束語

本文提出了一種基于異質信息網絡分析的考慮群組主題的群推薦方法HINGR_GT,為社交網絡上的群組推薦其可能感興趣的物品。所提方法基于群成員的標注信息篩選出相關節點,構建面向群組的異質社交網絡子圖,在此基礎上使用異質信息網絡表示學習方法學習物品和群組的表示,進而生成群推薦結果。這樣做一方面緩解了傳統群推薦方法在合成成員偏好時面臨的成員偏好噪聲問題,另一方面充分利用了社交網絡上廣泛存在的好友、標簽等輔助信息,緩解了推薦時所面臨的數據稀疏問題。在豆瓣電影數據集上的實驗結果表明,所提方法在所有評價指標上均取得了最好的結果,從而證明了所提方法的有效性。雖然所提方法取得了較好的實驗結果,但仍然有很多可以改進之處。首先,通過實驗結果可以看出,考慮異質信息網絡上廣泛存在的輔助信息確實有助于提升推薦方法的性能,因此,在構建異質信息網絡時,除了考慮其上標簽信息和好友信息外,還可以考慮其他的輔助信息,如信任關系和時間因素等。其次,所提方法在解決OCCF問題時,使用的是抽取負例的方式,而實際上還可以使用加權機制來解決該問題,因此,未來可以對這兩種方式進行探索,研究到底哪種方式更適用于本研究的基于異質信息網絡進行推薦的場景。最后,所提方法將群組成員打過的最多的標簽作為群組的主題,進而構建子圖達到過濾噪聲的目的,即以一種啟發式的方式進行子圖構建,后續研究可以考慮使用主題模型等其他更合適的方式來更好地構建異質社交網絡子圖。

參考文獻:

[1] "Garcia I,Sebastia L.A negotiation framework for heterogeneous group recommendation[J]. Expert Systems with Applications ,2014, 41 (4):1245-1261.

[2] Villavicencio C,Schiaffino S,Diaz-pace J, et al .Group recommender systems:a multi-agent solution[J]. Knowledge-Based Systems ,2019, 164 :436-458.

[3] Ortega F,Bobadilla J,Hernando A, et al .Incorporating group recommendations to recommender systems:alternatives and performance[J]. Information Processing Management ,2013, 49 (4):895-901.

[4] Gottapu R D,Monangi L V S.Point-of-interest recommender system for social groups[J]. Procedia Computer Science ,2017, 114 :159-164.

[5] Liu Duenren,Chen Y H,Huang Chunkai.QA document recommendations for communities of question-answering websites[J]. Know-ledge-Based Systems ,2014, 57 :146-160.

[6] Kagita V R,Pujari A K,Padmanabhan V.Virtual user approach for group recommender systems using precedence relations[J]. Information Sciences ,2015, 294 :15-30.

[7] Feng Shanahan,Zhang Huaxiang,Wang Lei, et al .Detecting the latent associations hidden in multi-source information for better group recommendation[J]. Knowledge-Based Systems ,2019, 171 :56-68.

[8] 胡川,孟祥武,張玉潔,等.一種改進的偏好融合組推薦方法[J].軟件學報,2018, 29 (10):3164-3183. (Hu Chuan,Meng Xiangwu,Zhang Yujie, et al .Enhanced group recommendation method based on preference aggregation[J]. Journal of Software ,2018, 29 (10):3164-3183.)

[9] Chen Yenliang,Cheng Lichen.An approach to group ranking decisions in a dynamic environment[J]. Decision Support Systems ,2010, 48 (4):622-634.

[10] Berkovsky S,Freyne J.Group-based recipe recommendations:analysis of data aggregation strategies[C]//Proc of the 4th ACM Conference on Recommender Systems.New York:ACM Press,2010:111-118.

[11] Ortega F,Hernando A,Bobadilla J, et al. Recommending items to group of users using matrix factorization based collaborative filtering[J]. Information Sciences ,2016, 345 :313-324.

[12] Ghazarian S,Nematbakhsh M A.Enhancing memory-based collaborative filtering for group recommender systems[J]. Expert Systems with Applications ,2015, 42 (7):3801-3812.

[13] Wang Jinkun,Jiang Yuanchun,Sun Jianshan, et al .Group recommendation based on a bidirectional tensor factorization model[J]. World Wide Web ,2018, 21 (4):961-984.

[14] Boratto L,Carta S,Fenu G.Investigating the role of the rating prediction task in granularity-based group recommender systems and big data scenarios[J]. Information Sciences ,2017, 378 :424-443.

[15] Sun Yizhou,Han Jiawei.Mining heterogeneous information networks:principles and methodologies[J]. Synthesis Lectures on Data Mi-ning and Knowledge Discovery ,2012, 3 (2):1-159.

[16] "唐正正,洪學海,汪洋,等.基于異質網絡表示學習的姓名消歧[J].模式識別與人工智能,2021, 34 (6):485-496. (Tang Zhengzheng,Hong Xuehai,Wang Yang, et al .Name disambiguation based on heterogeneous network representation learning[J]. Pattern Recognition and Artificial Intelligence ,2021, 34 (6):485-496.)

[17] Shi Chuan,Hu Binbin,Zhao W X, et al. Heterogeneous information network embedding for recommendation[J]. IEEE Trans on Know-ledge Data Engineering ,2019, 31 (2):357-370.

[18] Symeonidis P,Nanopoulos A,Manolopoulos Y.A unified framework for providing recommendations in social tagging systems based on ternary semantic analysis[J]. IEEE Trans on Knowledge Data Engineering ,2010, 22 (2):179-192.

[19] Shi Yue,Karatzoglou A,Baltrunas L, et al .CLiMF:learning to maximize reciprocal rank with collaborative less-is-more filtering[C]//Proc of the 6th ACM Conference on Recommender Systems.New York:ACM Press,2012:139-146.

[20] Torkestani J A.An adaptive learning to rank algorithm:learning automata approach[J]. Decision Support Systems, 2012, 54 (1):574-583.

[21] Boratto L,Carta S,Fenu G.Investigating the role of the rating prediction task in granularity-based group recommender systems and big data scenarios[J]. Information Sciences ,2017, 378 :424-443.

[22] Ortega F,Hernando A,Bobadilla J, et al. Recommending items to group of users using matrix factorization based collaborative filtering[J]. Information Sciences ,2016, 345 :313-324.

[23] Yang Qing,Zhou Shengjie,Li Heyong, et al .Embedding implicit user importance for group recommendation[J]. Computers,Materials and Continua ,2020, 64 (3):1691-1704.

主站蜘蛛池模板: 毛片免费在线视频| 亚洲人人视频| 日韩a级毛片| 国内黄色精品| 91无码人妻精品一区二区蜜桃| 奇米影视狠狠精品7777| 狠狠综合久久久久综| 久久精品娱乐亚洲领先| 国产第一页屁屁影院| 国产精品综合色区在线观看| 亚洲男人天堂网址| 日韩欧美网址| 国产激情影院| 国产精品成人一区二区不卡| 亚洲精品视频在线观看视频| 91精品小视频| 不卡无码h在线观看| 欧美午夜视频| 51国产偷自视频区视频手机观看| AⅤ色综合久久天堂AV色综合| 国产精品无码在线看| 中国丰满人妻无码束缚啪啪| 看你懂的巨臀中文字幕一区二区| 拍国产真实乱人偷精品| 人妻熟妇日韩AV在线播放| av手机版在线播放| 欧美在线一二区| 操国产美女| 久久久黄色片| 人人看人人鲁狠狠高清| 亚洲精品不卡午夜精品| 欧美日本在线| 久久久无码人妻精品无码| 91久久夜色精品国产网站| 亚洲视频欧美不卡| 久久黄色小视频| 青青草原国产一区二区| 精品欧美日韩国产日漫一区不卡| 久久久久久久久久国产精品| 国产久操视频| vvvv98国产成人综合青青| 国产高清在线丝袜精品一区| 一区二区三区在线不卡免费| 天天综合网色| AV不卡国产在线观看| 97综合久久| 中文字幕资源站| 久久精品国产一区二区小说| a级毛片免费看| 欧美日韩在线亚洲国产人| 亚洲欧美在线综合一区二区三区| 精品国产福利在线| 91热爆在线| 国产一线在线| 天天操天天噜| 无码综合天天久久综合网| 一级毛片在线播放| 四虎精品国产AV二区| 午夜电影在线观看国产1区| 精品国产毛片| 看看一级毛片| 国产激情第一页| 国产欧美在线观看一区| 91精品aⅴ无码中文字字幕蜜桃| 亚洲综合色吧| 国产真实乱了在线播放| 日韩午夜福利在线观看| 久久天天躁狠狠躁夜夜躁| 亚洲第一香蕉视频| 538精品在线观看| 亚洲一区二区日韩欧美gif| 伊人成人在线| 国产视频只有无码精品| 在线欧美日韩国产| 国产免费久久精品99re不卡| A级全黄试看30分钟小视频| 欧美精品xx| 欧美亚洲国产一区| 四虎成人在线视频| 无码免费视频| 欧美色视频日本| 亚洲精品无码高潮喷水A|