999精品在线视频,手机成人午夜在线视频,久久不卡国产精品无码,中日无码在线观看,成人av手机在线观看,日韩精品亚洲一区中文字幕,亚洲av无码人妻,四虎国产在线观看 ?

結合屬性信息的二分網絡表示學習

2021-03-11 06:20:48趙雪莉盧光躍呂少卿
計算機與生活 2021年3期
關鍵詞:信息

趙雪莉,盧光躍,呂少卿+,張 潘

1.西安郵電大學 通信與信息工程學院,西安710121

2.西安郵電大學 陜西省信息通信網絡及安全重點實驗室,西安710121

現實世界普遍存在各種各樣復雜但蘊含著豐富信息的網絡,如社交網絡、生物網絡和物流網絡等。其中二分網絡是復雜網絡中一種重要的網絡表現形式,該類網絡由兩種類型的節點構成,其邊只存在于不同類型的節點之間,如引文網絡[1]中作者和其論文發表的會議、購物網絡中用戶和商品、社交網絡中用戶和其所屬社區等均能抽象為二分網絡。因此對二分網絡進行研究和分析具有非常高的應用價值。

在針對網絡結構的研究中,一個重要的問題是如何合適地表示網絡結構信息。傳統的網絡表示一般采用高維稀疏矩陣,但高維稀疏矩陣往往需要更高的時間和空間成本。同時,隨著人工智能技術的突飛猛進,越來越多的研究領域都融入了機器學習、深度學習等技術,但是傳統的網絡表示方法無法直接應用這些算法,因此研究人員轉而探索將網絡中的節點表示為低維向量的方法,即網絡表示學習(或網絡嵌入)。網絡表示學習將網絡中的節點表示為低維稠密向量,并且最大程度地保留原網絡中的結構信息和特性,隨后這些表示向量作為對應節點的特征能夠被應用到后續的節點分類[2]、鏈路預測[3]、社區發現[4]、推薦[5-6]和可視化[7]等任務中。

目前已有的網絡表示學習算法主要針對同質網絡,即只包含一種類型節點的網絡,如Deep Walk[8]、

Node2vec[9]、LINE(large-scale information network embedding)[10]和SDNE(structural deep network embedding)[11]等。盡管這些算法已經被應用在相關網絡分析任務中,卻很難有效地應用于二分網絡。與同質網絡不同,二分網絡中有兩類節點,而且邊只存在于不同類型的節點之間,即顯式關系,但同類型的節點之間仍存在某種隱式關系,這種隱式關系與顯式關系的語義完全不同。文獻[12]表明對這種隱式關系建??梢蕴岣吣P偷耐扑]性能。另一方面,由于周期性問題,在二分網絡上執行隨機游走可能會失敗[13]。

與此同時,一些學者提出了針對異質網絡的表示學習算法,如基于元路徑的metapath2vec 和metapath2vec++[14]等。雖然針對異質網絡的表示學習算法也可以應用于二分網絡,但該類方法同樣沒有區分具有不同語義的顯式關系和隱式關系。

因此一些專門針對二分網絡的表示學習算法如BiNE(bipartite network embedding)[15-16]、FOBE 和HOBE(first-and high-order bipartite embeddings)[17]被提出。此類方法基于二分網絡拓撲結構,從不同角度進行建模得到網絡的低維表示向量。

然而,真實的網絡往往伴隨著數據缺失導致的網絡結構稀疏的情況,僅僅依賴拓撲結構很難得到理想的網絡表示。此外,現實中二分網絡的節點往往攜帶著豐富的屬性信息,如在購物網絡中,用戶擁有年齡段、職業、收入等屬性,商品有價格、產地、品牌等屬性;引文網絡中作者有研究領域、所屬機構等屬性,論文有文本信息、出版信息等屬性。屬性作為輔助信息對稀疏網絡結構的表示學習有巨大的影響。例如,在社交網絡中若兩個用戶不是好友關系,但若他們有相同的興趣、學歷和職業等,則在表示空間中這兩名用戶節點的表示向量應該更加接近。越來越多網絡表示學習算法選擇融合節點所具有的文本、標簽和統計特征等屬性信息,現有的工作表明[18-20],利用屬性這一輔助信息一方面能夠提高推薦的準確性,另一方面可以在一定程度上緩解數據稀疏性的問題[21]和冷啟動問題[22]。例如,文獻[23]研究了在社交網絡中結合網絡結構和屬性相似性對于學習攜帶更多信息的節點表示的重要性,作者通過分析Facebook數據集上用戶的畢業年份、專業和宿舍等屬性信息對友誼關系的影響,發現屬性相似的用戶之間有更強的社交關系。文獻[24]研究表明,考慮用戶的年齡、性別和其他屬性特征對評價推薦系統是至關重要的。因此屬性信息對于網絡表示學習以及下一步的任務具有重要意義,而現有的針對二分網絡的表示學習算法都忽略了對節點屬性信息的利用。

為了解決上述問題,本文提出一種結合屬性信息的二分網絡表示學習算法ABNE(attributed bipartite network embedding),能夠將節點的屬性信息融入二分網絡表示學習過程中從而學習到更加全面的網絡表示。具體來說,整個模型分為對顯式關系建模以及對結合屬性信息的隱式關系建模兩部分。首先,通過加強有連邊的節點對與對方鄰居節點的相似性嵌入顯式關系;此外,定義屬性相似度矩陣并將其作為權重矩陣的補充指導有偏隨機游走捕獲隱式關系,隨后通過聯合優化顯式關系模型和結合屬性信息的隱式關系模型,最終得到同時攜帶網絡拓撲結構信息和節點屬性信息的二分網絡表示。在四個真實公開的數據集上進行的推薦實驗結果表明了ABNE 方法的有效性。

1 相關工作

本文是結合屬性信息的二分網絡表示學習算法,相關的工作包括針對二分網絡的表示學習以及結合屬性信息的網絡表示學習。

BiNE 算法[15-16]是專門針對二分網絡的表示學習算法,該方法分別對二分網絡拓撲結構的顯式關系和隱式關系建模,通過加強不同類型節點的相似性嵌入顯式關系,并提出了一種有偏隨機游走方式嵌入隱式關系,最后設計了一個聯合優化框架從而得到二分網絡的低維向量表示;另外一個專門為二分網絡設計的表示學習算法是FOBE和HOBE算法[17],其中FOBE 算法將有連接的不同類型的節點對分解為存在鄰居關系的同類型節點對捕捉局部關系,HOBE 算法通過強化網絡節點之間的代數距離捕捉高階關系,并聯合兩種算法同時捕捉網絡拓撲結構的局部和高階關系從而得到網絡的表示學習向量。然而,以上方法均只考慮到了二分網絡的拓撲結構,沒有涉及到二分網絡豐富的屬性信息。

已有的屬性網絡表示學習的方法主要集中在同質網絡上。如基于矩陣分解的TADW(text associated deep walk)[25],該算法首先證明了Deep Walk等價于矩陣分解,隨后將節點的文本特征納入網絡表示學習過程中,得到了同時保留結構信息和屬性信息的網絡表示;基于神經網絡的方法如CANE(context-aware network embedding)[26],該算法引入卷積神經網絡將屬性信息和拓撲結構信息整合在一起,并通過相互關注機制學習到了上下文相關的網絡表示從而應用于基于文本的信息網絡中。然而,由于二分網絡特殊的節點類型和連邊特性與同質網絡有本質上的區別,因此上述為屬性同質網絡設計的算法不能直接應用于屬性二分網絡。

N2VSCDNNR(local recommender system based on node2vec and rich information network)算法[5]應用于用戶-商品二分網絡,該方法首先借助商品的類別信息得到了用戶-類別網絡,再通過一種模式投影得到了用戶-用戶和商品-商品網絡,然后在這兩個網絡上應用Node2vec 捕獲節點之間復雜的潛在關系,學習到了用戶和商品兩類節點的向量表示。最后,提出了一種新的聚類方法,對用戶和商品聚類用于推薦任務。然而,該算法是專門為推薦任務設計的。此外,該方法僅涉及到了二分網絡中一種類型節點的一種屬性信息,無法應用于兩種類型節點都攜帶屬性信息的屬性二分網絡中。

本文在BiNE和FOBE模型的基礎上進一步考慮了節點的屬性信息對二分網絡表示的影響,提出了ABNE 模型,通過該模型訓練得到了更加全面、高效的網絡表示向量。

2 問題定義

2.1 相關定義

本節給出了本文工作相關的一些定義:

定義1(屬性二分網絡)給定屬性二分網絡G=(U,V,E,A),其中U和V分別表示這兩類的集合,E是網絡中邊的集合,且E僅存在于節點集U和V之間,即E?U×V,A=AU?AV是這兩類節點的屬性集合。

定義2(屬性二分網絡表示學習)給定屬性二分網絡G=(U,V,E,A),網絡表示的目標是學習一個映射函數f:U?V→Rd,將圖G中的每一個節點映射為一個d維向量,且滿足d<<min(|U|,|V|)。

Fig.1 Attributed bipartite network representation learning圖1 屬性二分網絡表示學習

圖1 展示了一個屬性二分網絡表示學習的示例。該圖中左側為一個屬性二分網絡,其中包括網絡的拓撲結構以及兩類節點的屬性信息。右側為該二分網絡節點在低維空間的表示。在拓撲結構上有直接連接,即存在顯式關系的節點對如(u2,v2)在嵌入空間中有相似的表示。節點對(v1,v3)雖然不存在顯式關系,但它們均與節點u3和u4相連,即它們存在隱式關系,因此它們在嵌入空間彼此接近。在屬性二分網絡中,即使節點u1和u4沒有直接連邊,但由于它們屬性相似因此在嵌入空間中彼此接近。

2.2 符號和解釋

為更好地描述本文方法,表1列出了主要的符號及其定義。

Table 1 Overview of main symbols表1 文中主要符號概述

3 結合屬性的二分網絡表示學習算法

ABNE 算法旨在結合二分網絡拓撲結構信息和節點的屬性信息,從而得到更加全面的網絡表示結果。為了實現這一目的,本文考慮從屬性二分網絡的顯式關系和隱式關系兩方面進行建模,并將屬性信息融合進對隱式關系的建模當中。具體來說,將有連邊的節點對分解為同類型鄰居節點間的間接關系集,通過最小化經驗分布和概率分布之間的KL散度(Kullback-Leibler divergence)來嵌入顯式關系。由于隱式關系存在于由二分網絡分離出的兩個同質網絡,因此需要先將原二分網絡轉化為兩個同質網絡。對隱式關系建模分為三步:首先將攜帶屬性的二分網絡轉化為兩個屬性同質網絡;其次分別在兩個屬性同質網絡上運用余弦相似度得到兩個屬性相似度矩陣,再結合屬性相似度矩陣和同質網絡權重矩陣得到兩個新的同質網絡權重矩陣;最后在這兩個新的同質網絡上進行有偏隨機游走捕獲隱式連接關系。在完成對顯式關系和結合屬性信息的隱式關系建模后,提出了一個聯合優化框架學習得到最終的節點表示。本章將按照這個順序介紹ABNE算法。

3.1 顯式關系建模

二分網絡由兩種不同類型的節點構成,不同類型的節點意味著不同的對象、概念和關系[27]。文獻[17]對于電影-觀眾二分網絡的研究表明,強制直接嵌入電影和觀眾兩類節點的相似性會侵蝕特定類型節點集的特征,從而降低下游任務性能。因此,本文方法并不是直接加強不同類型節點的相似性,而是加強相同類型節點之間的相似性對顯式關系進行建模。具體地:

在二分網絡中,節點ui和節點vj的經驗概率為:

其中,wij為邊eij的權重。顯然,如果兩個節點之間邊的權值越大,它們同時出現的概率就會越大。

對于直接相連的ui和vj,定義它們之間的相似性為兩個節點與彼此鄰居節點的內積經過Sigmoid函數激活后的均值的乘積,則ui和vj之間的聯合概率分布為:

其中,Dui、Γ(ui)分別表示節點ui的度和與ui連接的節點v的集合,Dvj、Γ(vj)分別表示節點vj的度和與vj相連的節點u的集合。

為了在低維空間保持節點的顯式關系,采用最小化這兩種分布的KL散度來學習節點的表示向量,即最小化以下目標函數:

忽略掉一些無關約束得到:

3.2 結合屬性信息的隱式關系建模

隱式關系存在于由二分網絡分離出的兩個同質網絡。此時,學習隱式關系這一目標轉化為學習兩個屬性同質網絡的表示。

首先,將原二分網絡轉化為兩個同質網絡。根據Co-HITS(co-hyperlink-induced topic search)[28],定義兩個同質網絡的權重矩陣分別為:

本文定義節點集U和V的屬性相似度矩陣分別為MU和MV,并用屬性矩陣行向量的余弦相似作為其屬性相似度,即:

MAM(modified adjacency matrix)方法[29]將網絡的鄰接矩陣與節點的屬性相似性矩陣結合,創建了一個統一的相似度矩陣。參考該方法本文將屬性相似度矩陣與原同質網絡的權重矩陣相加作為新的權重矩陣,即:

其中,ε為屬性相似性的權重系數,ε的大小體現屬性相似性對嵌入向量的重要性。該重構網絡既反映結構信息又反映屬性信息,相比原網絡,新權重矩陣攜帶更高的信息量,且重構網絡的每個節點之間關系更加豐富。接著采用文獻[15-16]提到的方法分別在兩個同構網絡上執行有偏隨機游走,得到兩個語料庫DU和DV,并分別在兩個語料庫上執行Skip-gram模型得到節點的表示向量。其目的是保留隱式關系鄰近性,該鄰近性假設中心節點和上下文節點具有更加近似的向量表示。具體來說,給出語料庫DU中一個節點序列S和節點ui,節點uc為節點ui的上下文,向量為節點ui作為上下文時的表示向量,對該語料庫的目標函數為:

其中,Φ(ui)為節點序列S中ui的上下文節點。同樣,可以得到語料庫DV的目標函數為:

根據相關的網絡嵌入方法[8-10],輸入中心節點ui(或vj)可以得到它的上下文節點uc(或vc)的概率分別為:

然而,式(13)和式(14)在實際計算時有一個重要的問題,即每遍歷一個節點對(ui,uc)(或(vj,vc))就需要在整個語料庫DU(或DV)上計算一次當前中心節點ui(或vj)和全部詞向量的點積,這個計算量是非常大的。因此,本文采用負采樣[30]的思想來處理這個問題。通過負樣本的引入,目標轉化為使正樣本Z∈Φ(ui)(或Z∈Φ(vj))預測概率盡可能大,負樣本Z∈Ν(ui)(或Z∈Ν(vj))的預測概率盡可能小,從而將建立在整個語料庫的多分類問題轉換成一個建模在正負樣本上的二分類問題,有效地減少了計算復雜度。局部敏感哈希[31]是高維空間中最流行的神經網絡搜索算法之一。該算法背后的原理是,通過使用特定的哈希函數使得彼此接近的數據點集發生碰撞的概率遠遠大于距離較遠的點集[31]。因此,通過局部敏感哈希算法可以得到高質量且多樣化的負樣本。具體地,該算法先將同一類型節點分到不同的桶內,并給定中心節點ui,再從與包含中心節點的桶不相同的桶內隨機選擇ns個負樣本,該負樣本表示為N(ui)。這樣可以近似優化目標為:

同樣,節點集V的目標函數為:

其中,條件概率P(z|ui;f)和P(z|vj;f)被定義為:

3.3 聯合表示學習模型及其優化

為了同時保留二分網絡的結構相似性和節點的屬性相似性,本文將嵌入二分網絡的顯式關系和結合屬性信息的隱式關系的目標函數結合起來,形成一個聯合優化框架:

其中,參數α和β為超參數,調節α和β的大小以適應不同的網絡。具體來說,α越大,也就意味著二分網絡的隱式關系對節點表示學習的影響越大,β越大,則表示二分網絡的顯式關系對節點表示學習的影響越大。

ABNE算法的目標是最大化式(19),由于該目標函數是非凸的,求梯度為0得到的點并不能判別其是否是全局最優,同時為了避免由訓練集規模加大使訓練過程變得異常緩慢這一問題,本文采用隨機梯度上升算法(stochastic gradient ascent algorithm,SGA)[15-16]優化攜帶網絡拓撲結構和節點屬性信息的目標函數。隨機梯度上升算法每次采用一個樣本更新目標,相比于梯度上升算法每更新一次就需要用到所有的樣本的方式,大大加快了訓練速度。具體步驟如下:

步驟1對于隨機的顯式連接關系,利用SGA 來最大化F1=-βO1,ui、vj和uk、vk的更新公式如下:

步驟2給定中心節點ui(或vj),采用SGA最大化F2=α(lnO2+lnO3),從而可以嵌入節點的隱式關系。具體來說,給定ui(或v j)作為中心節點及它的上下文節點uc(或vc),ui、vj和、的更新公式如下:

其中,I(z,ui)是一個指標函數,它判斷節點z是否是節點ui的上下文,指標函數I(z,ui)的形式如式(28),指標函數I(z,vj)具有相似的意義。

3.4 聯合表示學習算法流程及復雜度分析

本文提出的ABNE算法流程如下:

算法1ABNE算法

輸入:屬性二分網絡G=(U,V,E,A),網絡的權重矩陣W,窗口大小ws,負樣本個數ns,表示向量維度d,每個節點行走的最大次數maxγ,每個節點最小的行走次數minγ,隨機游走停止概率p。

輸出:網絡節點表示矩陣U和V。

1.根據式(7)、式(8)計算屬性相似度矩陣MU、MV;

2.根據式(9)、式(10)計算同質網絡新的權重矩陣LU、LV;

3.初始化節點的表示向量矩陣U和V;

4.初始化上下文向量和;

5.DU=隨機游走(LU,U,maxγ,minγ,p);

6.DV=隨機游走(LV,V,maxγ,minγ,p);

7.對于直接連接的邊(ui,vj)∈E執行

8.找出節點ui的鄰域Γ(ui);

9.找出節點vj的鄰域Γ(vj);

10.根據式(20)和式(21)更新ui和vj;

11.根據式(22)和式(23)更新uk和vk;

12.對于序列S∈DU中的每一個節點對(ui,uc)執行

13.對節點ui進行負采樣生成ns個負樣本Φ(ui);

14.根據式(24)和式(26)更新ui和;

15.對于序列S∈DV中的每一個節點對(vj,vc)執行

16.對節點vj進行負采樣生成ns個負樣本Φ(vj);

17.根據式(25)和式(27)更新uk和;

18.返回網絡節點的表示矩陣U和V

由上面的分析可以看出,ABNE算法的時間復雜度主要取決生成語料庫和聯合模型優化和的計算。bs是從每個節點開始的行走次數,其中minγ≤bs≤maxγ,則生成語料庫的復雜度為2|E|×bs×2ws,本文中ns代表為每個節點生成的負樣本的數量,則本文算法整體的時間復雜度為O(2|E|×bs×2ws(1+ns))。

4 實驗結果及分析

4.1 實驗數據集

本文選取了4 個公開的真實網絡作為實驗數據集進行實驗仿真,其統計數據如表2所示。

Table 2 Datasets for real networks表2 真實網絡數據集

數據集的具體介紹如下:

Yelp數據集(http://www.yelp.com/dataset-challenge)的連邊表示用戶對商家的評分,該數據集由8 136位用戶、7 903 個商家、31 746 條評分構成,評分從1~5不等。此外,該數據集還包括用戶和商家的屬性信息,本文對屬性信息采用獨熱編碼(One-Hot 編碼),則每位用戶的點贊信息屬性被表示為一個11維二進制的向量,每個商家的類別和所在城市屬性被表示為一個558維的向量表示。Douban Book數據集(http://book.douban.com/)的連邊表示用戶對書籍的評分情況,該數據集由7 230位用戶、9 707部電影、23 750條評分構成,評分從1~5 不等,用戶所屬團體作為用戶的屬性信息,由一個2 936 維的向量表示,書籍的出版商和年份作為書籍的兩種屬性信息,由一個1 879維的向量表示。Douban Movie 數據集(http://movie.douban.com/)的連邊表示用戶對電影的評分情況,該數據集由7 189 位用戶、6 057 部電影、53 409 條評分構成,評分從1~5 不等,用戶所屬團體作為用戶的屬性信息,由一個2 753維的向量表示,電影類型作為電影的屬性信息,由一個38 維的向量表示。Movielens數據集(https://grouplens.org/datasets/movielens/)的連邊表示用戶對電影的評分,該數據集由943 位用戶、1 682部電影和10 000條評分構成,評分從1~5不等,用戶的年齡段和職業作為用戶的兩種屬性信息,由一個29 維的向量表示,電影類型作為電影的屬性信息,由一個19維的向量表示。

此外,本文還分別計算了以上4個數據集的密度和不同類型節點集的平均度,計算結果顯示這4個數據集的密度有很大的差異,其中Douban Book和Yelp數據集最為稀疏,其次是Douban Movie 數據集,而Movielens數據集更密集。

4.2 對比算法及參數設置

DeepWalk/Node2vec:該方法在網絡上執行有偏隨機游走來產生節點的路徑,然后使用Skip-gram 模型訓練得到網絡的低維嵌入向量空間。實驗中參數設置為:從每個節點開始的行走次數w=10,節點序列長度l=80,窗口大小ws=10,參數p=q=0.25(僅用于Node2vec算法)。

LINE:本文與同時考慮一階相似度和二階相似度的LINE(1st+2nd)算法作對比。實驗中設置負樣本個數ns=5。

BiNE:該算法通過聯合優化顯式關系模型和隱式關系模型得到了網絡的低維向量表示。實驗參數如下值:隱式關系權重系數α=β=0.01,顯示關系權重系數γ=0.1,隨機游走窗口大小ws=5,隨機游走停止概率p=0.15,負樣本個數ns=4。

為了保證實驗的公平性,節點的表示向量維度均選取為d=128。另外,本文算法ABNE 的主要參數設置為:隱式關系權重系數α=0.01,顯式關系權重系數β=1,屬性相似性權重系數ε=10,其他超參數參照文獻[15-16]的設置。

4.3 推薦任務實驗結果

本文將得到的節點表示向量用于推薦任務,以評價算法性能,實驗中對4 個數據集運用相同的設置。本文隨機抽取60%的邊作為訓練數據,余下40%的邊進行測試。對于每個用戶,對其測試集中的所有對象進行排序,并對排序列表前十位進行評估。評價指標為:F1 分數(F1-score)、MRR(mean reciprocal rank)、歸一化折損累計增益(normalized discounted cumulative gain,NDCG)和平均準確率(mean average precision,MAP)。

表3、表4、表5 和表6 分別記錄了ABNE 和其他對比方法在4個數據集上的實驗性能。結果顯示,本文算法ABNE明顯優于為同質網絡設計的3種模型,證明了同質網絡上的表示學習算法并不適用于二分網絡。此外,本文方法ABNE在Yelp數據集、Douban Book 數據集和Douban Movie 數據集上的性能均優于僅利用網絡拓撲結構的BiNE 算法,且在Yelp 和Douban Book數據集上的改進更為明顯,在邊密集的Movielens數據集上,ABNE的MRR值較BiNE提高了5.09個百分點,其他3個指標略低于BiNE。顯然,本文的模型顯著地改進了拓撲結構稀疏的二分網絡上的推薦結果。

Table 3 Top-10 recommendation performance on Yelp表3 Yelp數據集上的Top-10推薦結果 %

Table 4 Top-10 recommendation performance on Douban Book表4 Douban Book數據集上的Top-10推薦結果%

Table 5 Top-10 recommendation performance on Douban Movie表5 Douban Movie數據集上的Top-10推薦結果%

Table 6 Top-10 recommendation performance on Movielens表6 Movielens數據集上的Top-10推薦結果 %

為了更加明確地說明加強不同類型節點之間關系的作用和屬性信息對于網絡結構的有效性,基于推薦任務的實驗結果,分別在4.4 節和4.5 節對這兩部分進行了詳細的說明。

4.4 加強相同類型節點相似性嵌入顯示關系的作用

為了證明加強相同類型節點相似性嵌入隱式關系對二分網絡表示學習的重要性,本文將ABNE算法與加強不同類型節點之間關系的BiNE 算法的結果進行比較,為了保證比較的公平性,設置ABNE 算法的屬性相似性權重系數ε=0。由于空間限制,此處只選用兩個算法的MRR@10和NDCG@10結果進行比較。表7 的結果顯示,在最稀疏的Yelp 和Douban Book 數據集上,本文算法ABNE 的結果明顯優于BiNE;在Movielens 數據集上,ABNE 的MRR 值較BiNE提高了4.11個百分點。以上結果說明了對于非常稀疏的二分網絡,加強相同類型節點的相似性是很有必要的,因此ABNE算法適用于或因大量缺失數據而導致拓撲結構稀疏的現實網絡中。

Table 7 Comparison of explicit relations modeling between ABNE and BiNE表7 ABNE算法與BiNE算法顯示關系建模比較%

4.5 屬性信息的有效性

為了證明屬性相似性對二分網絡節點表示學習的積極作用,本文將ABNE算法與屬性相似性權重系數ε設置為0時的MRR@10和NDCG@10結果進行比較,表8結果顯示在4個數據集上結合屬性信息的結果均優于忽略屬性信息的結果。因此,本文提出的結合屬性信息的二分網絡表示學習方法對拓撲結構起到了有效的補充。

Table 8 ABNE with and without attribute information表8 ABNE算法結合屬性和忽略屬性信息 %

4.6 參數敏感性分析

本節研究模型中主要參數的敏感性,包括隱式關系權重系數α,顯式關系權重系數β和屬性相似性權重系數ε。除了要測試的參數外,其他參數都采用默認值。

本文通過在Douban Movie數據集上進行的推薦任務對這3個參數進行了分析。實驗設置隱式關系權重系數α分別為0.001、0.01、0.1、1、10 和100,顯式關系權重系數β分別為0.001、0.01、0.1、1和10,屬性相似性權重系數ε分別為0.01、0.1、1、10 和100 來研究這些參數對模型性能的影響。圖2、圖3 和圖4 分別記錄了不同參數下模型性能的變化。

Fig.2 Influence of α圖2 參數α 的影響

Fig.3 Influence of β圖3 參數β 的影響

Fig.4 Influence of ε圖4 參數ε 的影響

從圖2和圖3中可以觀察到,隨著顯式關系權重系數β的增加,模型性能逐漸增加,在β=1 時達到最優,當隱式關系權重系數α很大時模型性能降低,說明對于二分網絡,過分地強調隱式關系會導致表示向量的低效性。本文的屬性相似性權重系數ε會受到隱式關系權重系數α的影響,圖4顯示了在隱式關系權重系數α為默認值的情況下,隨著屬性相似性權重系數ε的增加,性能指標先增加,在ε=10 達到最優,說明節點的屬性信息對二分網絡稀疏的拓撲結構起到了有效的補充。此外,可以觀察到使模型性能達到最優的β值大于使性能達到最優的α值,說明對于二分網絡表示學習,顯式關系比隱式關系更重要。

5 結束語

本文提出了一種結合屬性信息的二分網絡表示學習方法,該算法考慮從顯示關系和結合屬性信息的隱式關系兩方面學習網絡表示,首先借助同類型節點的相似性對顯式關系建立模型,其次將屬性信息作為隱式關系的補充并對其建立模型,最后提出一個聯合優化框架,得到了融合了網絡拓撲結構信息和節點的屬性信息的網絡表示。在4 個真實網絡上的推薦實驗結果證明了ABNE算法的有效性。

由于大規?,F實網絡中節點的屬性相似性矩陣往往隨著節點的增加成為一個高維度稠密矩陣,這樣給計算帶來了很大空間復雜度,因此,在未來的工作中如何進一步處理屬性信息指導網絡表示學習是一大挑戰。

猜你喜歡
信息
訂閱信息
中華手工(2017年2期)2017-06-06 23:00:31
展會信息
中外會展(2014年4期)2014-11-27 07:46:46
信息超市
大眾創業(2009年10期)2009-10-08 04:52:00
展會信息
展會信息
展會信息
展會信息
展會信息
信息
建筑創作(2001年3期)2001-08-22 18:48:14
健康信息
祝您健康(1987年3期)1987-12-30 09:52:32
主站蜘蛛池模板: 超清人妻系列无码专区| 国产视频入口| 99久久精品国产自免费| 亚洲综合香蕉| 99热国产这里只有精品9九| 亚洲伊人天堂| 国产乱子伦无码精品小说| 国产午夜不卡| a级毛片一区二区免费视频| 免费大黄网站在线观看| 狠狠躁天天躁夜夜躁婷婷| 成人国产精品2021| 国产免费精彩视频| 中文无码精品a∨在线观看| 亚洲中久无码永久在线观看软件 | 亚洲精品国产首次亮相| 好吊色妇女免费视频免费| 激情六月丁香婷婷| 欧类av怡春院| 99热在线只有精品| 国产精品视频观看裸模| 国产色网站| 国产真实乱了在线播放| 波多野结衣国产精品| 欧美另类精品一区二区三区| 国产xx在线观看| 国产免费久久精品44| 国产视频入口| 欧美成人午夜视频免看| 国产欧美精品一区aⅴ影院| 日本不卡免费高清视频| 中文字幕在线永久在线视频2020| 2021国产在线视频| av一区二区三区高清久久| 欧美激情福利| 国产日韩丝袜一二三区| 麻豆国产原创视频在线播放| 亚洲国产系列| 国产一级片网址| 一区二区午夜| 少妇精品网站| 欧美日韩亚洲国产| 久青草国产高清在线视频| 亚洲人成网7777777国产| 人妻熟妇日韩AV在线播放| 国产人在线成免费视频| 国产日韩精品欧美一区喷| 凹凸国产分类在线观看| 九九九精品成人免费视频7| 97se综合| 日本道综合一本久久久88| 亚洲国产高清精品线久久| 美女毛片在线| 超碰91免费人妻| 亚洲第一成年网| 成人精品在线观看| 黄片一区二区三区| 免费在线a视频| 久久综合干| 国产欧美日韩综合在线第一| 亚洲国产成人在线| 欧美无遮挡国产欧美另类| 久久久久久久蜜桃| 日韩第九页| 国产在线日本| 日韩第九页| 亚洲国产日韩欧美在线| 18禁黄无遮挡网站| 为你提供最新久久精品久久综合| 国产欧美日韩一区二区视频在线| 国产成人永久免费视频| 欧美成人怡春院在线激情| 伊人色天堂| 四虎精品国产永久在线观看| 欧美日本激情| 99久久国产综合精品2020| 亚洲av片在线免费观看| 成年女人a毛片免费视频| 亚洲人成影视在线观看| 2021天堂在线亚洲精品专区| 国产91在线|日本| 国产chinese男男gay视频网|