










摘 要:現存有向網絡鏈路預測方法僅考慮單類型網絡結構而忽略一些關鍵網絡結構,導致預測準確度下降。針對此問題,提出一個融合多類型有向網絡結構和非負矩陣分解的鏈路預測框架去保持局部和全局結構信息。首先,將有向網絡的鄰接矩陣映射到低維潛在空間保持原始網絡的方向鏈接;其次,通過2-范數和規范化拉普拉斯融合四個關鍵有向結構相似度包括有向共同鄰居(DCN)、有向Adamic-Adar(DAA)、有向資源分配(DRA)和勢理論(BF)去保持多類型網絡結構信息,分別提出四個有向網絡的鏈路預測模型NMF-DNS-DCN、NMF-DNS-DAA、NMF-DNS-DRA和NMF-DNS-BF;最后,啟用乘法更新規則去學習四個模型參數并證明所提算法的收斂性。在八個真實世界有向網絡上與現存的代表性方法相比較,該模型的AUC、recall 和F1分別最大提高5.3%、7.8%和6%。
關鍵詞:鏈路預測;非負矩陣分解;有向網絡結構;規范化拉普拉斯
中圖分類號:TP391 文獻標志碼:A
文章編號:1001-3695(2022)07-033-2124-08
doi:10.19734/j.issn.1001-3695.2021.12.0656
基金項目:福建省自然科學基金資助項目(2021J011146,2021J011144);武夷學院引進人才科研啟動基金資助項目(YJ202017)
作者簡介:陳廣福(1979-),男(通信作者),講師,博士,主要研究方向為鏈路預測和網絡表示等(cgf21st@163.com);郭磊(1979-),男,副教授,碩士,主要研究方向為推薦系統;連雁平(1981-),男,副教授,碩士,主要研究方向為機器學習和大數據.
Link prediction combing nonnegative matrix factorization and directed structure
Chen Guangfu1,2?,Guo Lei1,2,Lian Yanping1
(1.College of Mathematics amp; Computer Science,Wuyi University,Wuyishan Fujian 354399,China;2.Fujian Key Laboratory of Big Data Application amp; Intellectualization for Tea Industry,Wuyishan Fujian 354399,China)
Abstract:The existing link prediction methods for directed networks only consider single-type network structures but ignore some key network structures,which leads to the decrease of prediction accuracy.To solve this problem,this paper proposed a link prediction framework which combined multi-type directed network structure and non-negative matrix factorization to preserve local and global structure information.Firstly,it mapped the adjacency matrix of directed network to the low-dimensional latent space to preserve the directional link of the original network.Secondly,it fused four key directed structural similarities including DCN,DAA,DRA and potential theory (BF) by 2-norm and normalised Laplacian to maintain information on the structure of multi-type networks.Then,it proposed four link prediction models NMF-DNS-DCN,NMF-DNS-DAA,NMF-DNS-DRA and NMF-DNS-BF respectively.Finally,this paper enabled multiplicative update rules to learn the parameters of the four models and proved the convergence of the proposed algorithms.Compared with the existing representative methods on 8 real-world directed networks,the AUC,recall and F1 of the proposed model is increased by 5.3%,7.8% and 6%,respectively.
Key words:link prediction;non-negative matrix factorization;directed network structure;normalized Laplacian
0 引言
真實世界中大量的復雜系統可以通過復雜網絡來描述,網絡中節點表示實體,鏈接表示實體之間的交互。最近十年,復雜網絡得到各領域持續的關注,它的研究主要對象包括社區檢測[1] 、推薦系統[2]和鏈路預測[3]等,其中,鏈路預測是復雜網絡相關研究中最具有挑戰的一個問題。鏈路預測目標是根據已知網絡結構、節點屬性和聚類等信息去預測尚未連接節點間形成鏈接的可能性[4]。因此,鏈路預測具有重大理論和應用價值,其理論價值主要體現在根據當前網絡結構去推演將來網絡演化進程。此外,鏈路預測廣泛應用于不同領域。例如,在疾病—基因網絡中尋找兩個新基因或新疾病的關系,為診斷疾病提供新的技術[5];在蛋白質—蛋白質交互網絡中,可預測蛋白質之間先前未知的相互作用關系,從而降低實驗的成本[6];在軍事網絡中,可消除隨機噪聲和鑒定虛假鏈接的信息,可優化軍事組織結構,提高軍事決策的準確性[7];在社交網絡中,可保護用戶隱私不受攻擊,激勵用戶提供更多可用的數據[8]等。
當前,現存無向無權的鏈路預測方法是將有向網絡看做無向網絡,忽略有向鏈接的貢獻,導致預測準確度降低及得到不合理的預測結果。最近幾年,有向網絡的鏈路預測問題得到了廣泛關注。例如,柳娟等人[9]基于貝葉斯模型和機器學習解決有向科學合作網絡缺失方向問題,并提出單模體和多模體的鏈路預測算法;Bütün等人[10]提出基于有監督的基模式的有向網絡鏈路預測算法;Zhang等人[11]將無向局部相似度擴展到有向網絡,提出有向局部指標DCN(directed common neighbor)、DAA(directed Adamic-Adar)和DRA(directed resource allocation)。此外,李治成等人[12]提出基于拓撲有效連通路徑的鏈路預測方法,該方法主要考慮不同路徑長度在節點度、半局部中心性和H-指數這三種不同衡量節點影響力指標下對節點相似性的貢獻。以上方向僅考慮鏈接方向信息獲得局部結構信息,無法處理稀疏有向網絡。另外,有向網絡中存在大量的互惠鏈接,研究表明互惠鏈接更容易使節點間形成連接。Shang等人[13]提出節點的相動態算法來分析鏈接方向的作用,結果表明互惠鏈接對鏈路預測和網絡結構的形成具有更大的貢獻;Li等人[14]使用零模型驗證互惠鏈接在有向網絡作用,再將互惠鏈接作為附加信息提出間接互惠感知和直接互惠感知加權機制有向網絡鏈路預測指標。上述方法在基于假設網絡是稠密且存在大量的互惠鏈接情況下可取得較高預測準確度,然而真實網絡大部分都是稀疏的。為克服以上不足,一些考慮網絡三階路徑方法被提出。Pech等人[15]提出線性最優化(linear optimization,LO)方法,該方法將節點的鄰居用線性和表示獲得網絡高階路徑信息去保持網絡全局結構信息;李勁松等人[16]在文獻[15]基礎上提出線性規劃方法,與LO有相似作用;Zhang等人[17]提出基于勢理論的最佳模體Bi-Fan(BF)算法,該方法考慮節點鄰居的三階路徑信息。
最近,非負矩陣分解技術具有減維以及較高預測準確度等特性廣泛應用于鏈路預測,該方法主要思想是將網絡鄰接矩陣分解為兩個低秩因子矩陣再附加一些重要信息,如拓撲結構及聚類信息等,然后重構網絡獲得預測分數矩陣。代表性算法包括擾動方法[18]、稀疏學習[19]和圖可達性[20]等。然而,基于非負矩陣分解方法鏈路預測存在以下兩方面不足:a)大部分現存方法僅考慮無向無權網絡;b)非負矩陣分解融合圖正則化方法去保持網絡結構信息,然而該方法不能更全面地衡量整個網絡節點差異。針對第一個不足,有少量現存文獻將非負矩陣分解擴展到有向網絡鏈路預測中。例如,Chen等人[21]融合不對稱聚類信息與非負矩陣分解相融合去保持網絡結構信息,然而,該方法僅考慮單類型網絡結構信息。此外,基于流形假設的前提下非負矩陣分解融合圖正則化方法才可保持局部結構信息[22],但無法利用更多類型結構信息。因此,圖正則化方法不適用于捕獲全局結構信息。
基于上述分析,本文將解決以下兩個問題:a)非負矩陣分解模型如何融合一些重要的有向網絡結構信息;b)如何使用2-范數和拉普拉斯相結合去保持網絡的一些重要的結構信息。為解決以上兩個問題,本文提出融合有向網絡結構和非負矩陣分解的有向網絡鏈路預測框架(nonnegative matrix factorization via directed network structure,NMF-DNS)。首先,將有向網絡的鄰接矩陣映射到低維潛在空間;其次,2-范數和規范化拉普拉斯將相結合融合一些重要的有向結構相似度(DCN,DAA,DRA和BF)去保持多類型結構信息;最后,提出本文四個有向網絡的鏈路預測模型NMF-DNS-DCN、NMF-DNS-DAA、NMF-DNS-DRA和NMF-DNS-BF。
本文的貢獻總結如下:
a)提出四個融合有向網絡結構與非負矩陣分解的鏈路預測模型,該類模型可同時保持一階、二階和高階路徑信息;
b)啟用2-范數衡量整個網絡總分歧程度并結合規范化拉普拉斯去保持網絡結構信息;
c)在8個真實世界有向網絡上與現存代表性方法比較,結果表明本文所提四個模型顯著優于基準方法。
1 本文方法
1.1 相關概念
考慮一個無向網絡G(V,E),其中V={vi}Ni=1是節點集合,E表示鏈接集。本文不允許多個鏈接和自循環存在。本文用A=[aij]n×n來表示G的鄰接矩陣,若G是有向無權網絡,且節點vi→vj之間存在鏈接,則aij=1,否則aij=0。顯然,A是不對稱矩陣,即aij≠aji。
接下來進一步表示所有可能的|V|(|V|-1)2鏈接為U,并且U-E是不存在的鏈接集。鏈路預測的目標是從集合U-E中查找缺失鏈接。為了驗證算法的性能,將觀測到的鏈接集隨機分成訓練集ET和測試集EP兩部分,前者是已知的信息,后者僅用于測試。顯然,ET∩EP=?和ET∪EP=E。 接下來介紹一些基本的矩陣運算定義:運算符〈·〉表示內積,‖·‖2表示2-范數,AT表示矩陣A的轉置,Tr(A)表示矩陣A的跡,‖A‖F表示Frobenius 范數,I表示單位矩陣。
1.2 融合有向結構信息
非負矩陣分解具有維數約減及預測準確性好等特點,廣泛應用于鏈路預測。本文利用非負矩陣分解技術去捕獲網絡的鏈接、鏈接權重以及鏈接方向等信息。非負矩陣分解(nonne-gative matrix factorization,NMF)[23]目標是尋找兩個低秩的非負因子矩陣去近似原始網絡。因此,NMF分解目的是解決以下F-范數優化問題:
網絡結構是網絡重要組成部分,為鏈路預測提供最原始節點和鏈接信息。然而,非負矩陣分解技術最大的瓶頸是無法保持網絡結構信息。盡管圖正則化方法可捕獲網絡局部結構,但無法衡量整個網絡節點間總分歧。因此,本文啟用2-范數與規范化拉普拉斯相結合去保持有向網絡結構信息,增強所提模型預測準確度。真實世界網絡中,兩個節點具有類似的屬性或結構,那么該類節點就容易形成鏈接。以圖1為例,節點x和y共享節點a和b,與它們具有相同結構或屬性,因此,節點x和y產生鏈接的可能性就大。假設節點vi與vj要相似,那么就盡可能距離近,節點vi與vj間最短距離表示如下:
現存典型的有向網絡結構相似度算法有DCN、DAA、DRA和BF四個,其中,前三個考慮二階路徑信息而BF是基于三階路徑方法,具體的描述如表1所示。為使節點間更容易產生鏈接,在式(2)中融合表1中的四個有向網絡結構相似度,其定義如下:
其中:Sij可由SDCN、SDAA、SDRA和SBF替換。式(2)反映了Sij越大,那么節點vi與vj產生鏈接可能性越大。
為衡量整個網絡上所有節點對相似度,將式(3)擴展到整個網絡中。因此,得到整個網絡的總分歧程度為
其中:di和dj是A的第i行和第j行的總和。
由于式(4)中存在2-范數,對式(3)最小優化是非常困難的。又由于2-范數計算核心是取矩陣共軛轉置與矩陣乘積的最大特征值作為解,所以本文啟用歸一化拉普拉斯將式(4)轉換為求矩陣跡的最大值,定義如下:
1.3 統一鏈路預測模型
式(1)的作用是將鄰接矩陣A映射到低維空間中保持原始網絡的方向鏈接信息,而式(4)的功能是利用2-范數和拉普拉斯保持有向多類型結構信息。式(4)是最大化而所提模型是最小化求解目標函數,因此需要將式(4)轉換為最小化只需在式(4)中添加負號即可,其所提四個模型的目標函數如下:
2 實驗結果
2.1 評價度量
為了驗證所提出算法的性能,本文使用AUC、recall和F1作為度量評價所有方法性能。
a)AUC[24](area under the receiver operating characteristic curve),可以理解為在測試集Ep中的鏈接分數大于隨機選擇的一個不存在集U-E中的鏈接分數的概率。獨立地比較n次,若有n1 次測試集中鏈接的分數值大于不存在集中鏈接的分數,有n2次兩分數值相等,AUC定義如下:
b)召回率(recall)[25]定義為所有鏈接M中m個現存鏈接的比率,即
c)F1度量[25]是召回率和準確率的綜合性度量,可更全面和有效地評價算法性能,其定義如下:
2.2 數據集
本文使用八個真實世界有向網絡來評價所有方法性能,其拓撲結構特征統計如表2所示。
其中:|V|是節點數,|E|是鏈接數,〈k〉表示平均度,〈d〉表示平均最短距離,kinmax和koutmax分別表示節點最大入度和出度。八個有向網絡的數據集介紹如下:
a)朋友網絡(HAMster,HAM)[26],該網絡是由1 858個節點和12 534條鏈接構成。
b)論文引用網絡(SMAgri,SMA)[27]是關于網絡理論與實驗的引用網絡,它由1 024個節點和4 916條鏈接組成。鏈接方向表示引用關系。
c)論文引用網絡(KOHene,KOH)[27]是有關“自組織映射”主題的論文引用網絡。
d)維基百科(WikiTalk,WT)[26],該網絡是歐西坦語維基百科的通信網絡。節點表示用戶,從用戶A到B的一條邊表示用戶A在某個時間戳在用戶B的對話頁面上寫了一條消息。
e)EPA[26],該網絡是搜索引擎查詢數據集,它由4 771個節點和8 940條鏈接組成。
f)蛋白質交互網絡(FIGeys,FIG)[26]是人類蛋白質之間相互作用的網絡,節點表示蛋白質,方向鏈接表示蛋白質間交互關系。
g)圖書館與信息科學在線詞典(ODLIS,ODL)[26]是各類圖書館和信息專業的超文本參考資源。
h)信任網絡(SOCgin,SOC)[28]是在Bitcoin Alpha平臺上人與人的信任關系,節點表示匿名用戶,方向鏈接表示匿名用戶間信任關系。
2.3 基準方法
為驗證所提4個有向鏈路預測算法性能,本文啟用12個最近幾年的代表性方法與之比較。12個有向網絡鏈路預測方法介紹如下:
a)3個基于有向局部相似度(DCN、DAA、DRA)[11]和基于勢能理論的最佳模體(BF)方法[17]。
b)線性最優化(linear optimization,LO)[15],該指標假設兩個節點之間存在鏈接的可能性可以通過相鄰節點貢獻的線性求和來展開。
c)大度節點有利指標(hub promoted index,HPI)[11],該指標表示代謝網絡中兩節點端點的相似程度,其定義如下:
d)Jaccard 指標[11]表示兩個頂點共同鄰居數比上兩節點所有鄰居數之和,其定義如下:
e)間接互惠感知加權指標(indirect reciprocity-aware weighting,IRW)與有向網絡DCN、DAA和DRA構建新的指標,其定義如下[14]:
g)有向網絡線性規劃(linear programming index for directed network,LPD)指標[16],該方法考慮三種有向鄰居的信息貢獻并結合結構特點建立線性規劃模型,進而通過求解貢獻矩陣的最優解構建相似性指標。
SLPD=R(RTR+λ·I)-1RTA
其中:R=A+αAT。
2.4 實驗結果分析
本文實驗硬件平臺為Intel Core i5-7200U CPU筆記本,主頻 2.71 GHz,內存 4 GB,操作系統為 Windows 10,所有方法使用MATLAB R2016b實現。此外,本文所提4個模型均含4個重要的參數,分別為α、β、潛在空間維數K和迭代次數maxiter。為公平比較所有的方法,在8個數據集上統一設置:α=0.5、β=5、K=70和maxiter=70。此外,LO指標可調參數α=0.1;LPD指標可調參數α=0.1及λ=1 和FPMF-CN方法默認原文設置。
本文從以下四個方面測試所提4個模型性能:首先,啟用AUC、recall和F1三個度量評估所有16個方法性能;其次,測試所提模型考慮方向鏈接后性能是否獲得顯著改善;另外,測試所提模型融合多類型有向后是否改善性能;最后,測試所有16個方法的魯棒性。
第一個實驗利用AUC、recall和F1評價4個所提模型及12個基準指標性能,其實驗結果如表3所示。
根據表3可以觀察到以下四個現象:
a)AUC度量,所提4個模型在7個(除SOC)數據集中獲得優秀性能,recall和F1度量,所提模型在8個數據集均獲得最優性能,表明所提4個模型通過2-范數和規范化拉普拉斯相結合可有效保持及充分利用網絡結構信息。所提模型在SOC數據集獲得低質量的原因是從表1觀察到SOC的平均最短距離為3.138 2,由于所提模型啟用2-范數衡量節點間產生鏈接的可能性,所以節點間距離直接影響是否充分保持網絡結構信息。此外,表2可觀察到節點平均最短距離較短,如EPA,均獲得優異預測準確度。
b)DCN、DAA、DRA和BF是有向網絡4個基準指標,DCN、DAA、DRA獲得較差預測準確度的原因是三個指標僅考慮節點共同鄰居數量保持局部結構信息,而BF指標與以上三個指標相比預測精度顯著提升,主要原因是該方法考慮三階路徑信息。所提4個方法融合以上四類結構同時保持原始網絡方向鏈接信息獲得顯著改善。例如,在EPA數據集中,所提模型最優性能與DCN、DAA、DRA和BF相比AUC值分別提高了18.1%、18.6%、19.2%和12%。在recall和F1度量,所提模型與DCN、DAA、DRA和BF相比較有顯著提升,例如ODL數據中recall最大提高了50.2%。此外,Jaccard和HPI僅考慮節點鄰居數,同樣獲得了低質量性能。
c)基于感知加權機制的三個指標考慮有向網絡的互惠鏈接信息作為權重平衡方向鏈接和局部結構信息。該類方法與DCN、DAA、DRA三種方法比較,性能明顯得到改進,表明互惠鏈接有助于改善預測精度,與所提模型比較,后者預測準確度更高。例如在FIG數據集中,所提方法最優性能與DCN、DAA、DRA相比,AUC值分別提高了28.1%、26.9%和26%。同理在recall和F1度量也獲得了顯著改善。
d)LO和LPD兩個指標具有類似的機制,LO是通過分解節點鄰居信息去保持全局節點路徑。同理LPD采用線性規劃方法去保持網絡全局結構,兩者都屬于全局指標。然而,兩者在所有數據集均獲得較低預測準確度。PFMF-CN與所提模型同樣機制,采用分解鄰接矩陣到低維潛在空間再融合局部結構信息。該方法性能與所提模型比較接近,然而該指標僅考慮共同鄰居方法,無法充分開采網絡結構全局信息。
第二個實驗主要評估考慮方向鏈接后所提模型是否可改善預測準確度。本實驗啟用三個所提方法NMF-DNS-DCN、NMF-DNS-DAA和NMF-DNS-DRA融合有向結構,而NMF-DNS-CN、NMF-DNS-AA和NMF-DNS-RA融合無向結構信息,其實驗結果如表4所示。從表4可以看出,在AUC和F1度量下,考慮有向結構信息預測準確度有顯著提高。例如,NMF-DNS-DCN與NMF-DNS-CN在所有的數據集上相比,AUC的值分別提高了5.2%、 3.1%、1.4%、0.2%、 3.8% 、7%、3.5%和2.2%,同理F1值分別提高了30.5%、32.9%、64.5%、34.4%、31.6%、31%、25.8%和36.3%,其余兩個指標同樣有顯著改善。因此,考慮方向鏈接信息有顯著提升。
第三個實驗評估基礎NMF融合有向結構是否可以改善性能,其結果如表5所示。當α=0和β=0時,本文所提模型退化為基礎NM模型;當α≠0和β≠0,表示融合有向結構信息的模型。表5可觀察到NMF的AUC、recall和F1值明顯低于融合有向結構的4個模型。具體地,基礎NMF與NMF-DNS-DCN相比較,AUC值在數據集KON、HAM、ODL、SOC、EPA、SMA、FIG和WT上分別提高1.8%、1.1%、3.6%、2.2%、1.6%、3.8%、1.4%和0.6%;recall值在數據集KON、HAM、ODL、SOC、EPA、SMA、FIG和WT上分別提高10.7%、9%、10%、8.4%、3.6%、8.2%、10.1%和2.5%;F1值在數據集KON、HAM、ODL、SOC、EPA、SMA、FIG和WT上分別提高9.3%、6.3%、7.1%、6.6%、2.9%、6.7%、9.9%和1.1%。同理,NMF-DNS-DAA、NMF-DNS-DRA和NMF-DNS-BF性能優于NMF。通過上述分析,表明在基礎NMF上融合有向結構信息可以明顯改善性能。
最后一個實驗測試所有方法的魯棒性。通過不同比率訓練集改變初始網絡稀疏性,本實驗設訓練集大小為30%和70%,實驗結果如圖2所示。
a)在不同比率下所提4個方法的AUC值都顯著優于其他基準算法,除了SOC數據集。此外,所提4個模型在不同比率下AUC值波動并不顯著,而基于局部相似度的DCN、DAA和DRA出現明顯波動,主要原因是可觀察的方向鏈接減少而無法獲得足夠的網絡結構信息。
b) 當訓練集在30%時,網絡處于高度稀疏狀態。所提4個模型依然獲得較高的預測準確度,表明所提4個方法魯棒于稀疏網絡。
3 參數敏感性
本章討論所提方法主要參數對性能的影響。所提模型包含4個重要參數,分別為α、β、潛在空間K和迭代次數。設α變化為{5×10-3,5×10-2,5×10-1,5×100,5×101,5×102},潛在空間K的變化為{10,20,30,…,100},迭代次數變化為{10,20,30,…,100}和β變化為{5×10-2,5×10-1,5×100,5×101,25×102}。本文研究一個參數對性能影響,需固定其他三個參數,由于空間有限,僅對AUC度量進行分析。
3.1 參數α對性能影響
參數α的作用是控制不同類型的結構信息的貢獻,其實驗結果如圖3所示。當αlt;0.05時,AUC值逐漸下降,表明α增大時目標損失函數誤差增加,導致鏈路預測準確度下降;當α≥0.05時,所提4個模型的AUC值達到最優且保持穩定。因此,當α=0.05時,性能最佳。
3.2 參數β對性能影響
參數β是防止正則項過度擬合,其實驗結果如圖4所示。當βlt;5時,AUC值開始快速下降,表明β不宜過大;當βgt;5時,AUC略有下降,表明β不宜過小;當β=5時,性能最優。
3.3 參數K對性能影響
參數K是平衡預測準確度與時間復雜度。若K值過小,低維潛在空間無法獲得足夠網絡結構信息導致預測準確度下降;若K值過大,會增加所提方法的時間復雜度。因此,設參數K值為10~100,其實驗如圖5所示。當K值小于30時在所有網絡中均獲得低質量性能,當K值開始逐漸增加且到70時,AUC值也逐漸增大且達到穩定。因此,K=70時,AUC值達到最優。
3.4 迭代次數對性能影響
迭代次數大小直接影響所提算法的收斂性快慢,其實驗結果如圖6所示。當迭代次數為10時,所提方法在所有數據集上AUC值最小。當迭代次數開始逐漸增加,AUC的值也開始增大然后達到穩定。當迭代次數達到50時,AUC的曲線略有波動,但波動值相差甚微。當迭代次數大于等于70時,所提4個模型在所有數據集上AUC值保持恒定。
4 結束語
大部分現存的有向網絡鏈路預測僅考慮單類型網絡結構,如何在非負矩陣分解的框架下融合多種類型結構信息的挑戰,本文提出一種新穎的融合有向結構和非負矩陣分解的有向網絡的鏈路預測模型。首先,將任意有向網絡鄰接矩陣映射到低維潛在空間;其次通過2-范數融合有向網絡4個結構信息(DCN、DAA、DRA和BF)提出4個預測模型;最后,通過更新規則學習模型參數獲得最優局部解。在8個有向網絡上的實驗結果表明,4個所提模型在預測方向鏈接及魯棒性上顯著優于基準方法。
在將來的工作中,對所提模型考慮有向社區結構及節點屬性等信息。
參考文獻:
[1]Li Ye,Sha Chaofeng,Huang Xin,et al.Community detection in attri-buted graphs:an embedding approach[C]//Proc of the 32nd AAAI Conference on Artificial Intelligence.2018:338-345.
[2]Aghdam M H,Analoui M,Kabiri P.A novel non-negative matrix factorization method for recommender systems[J].Applied Mathema-tics amp; Information Sciences,2015,9(5):2721.
[3]Lyu Linyuan,Jin Cihang,Zhou Tao.Similarity index based on local paths for link prediction of complex networks[J].Physical Review E,2009,80(4):046122.
[4]Lyu Linyuan,Zhou Tao.Link prediction in complex networks:a survey[J].Physica A:Statistical Mechanics and Its Applications,2011,390(6):1150-1170.
[5]Dong Yuxiao,Zhang Jing,Tang Jie,et al.CoupledLP:link prediction in coupled networks[C]//Proc of the 21st ACM SIGKDD Internatio-nal Conference on Knowledge Discovery and Data Mining.2015:199-208.
[6]Cannistraci C V,Alanis-Lobato G,Ravasi T.From link-prediction in brain con-nectomes and protein interactomes to the local-community-paradigm in complex networks[J].Scientific Reports,2013,3:1613.
[7]Fan Changjun,Liu Zhong,Lu Xin,et al.An efficient link prediction index for complex military organization[J].Physica A:Statistical Mechanics and Its Applications,2017,469:572-587.
[8]Yu Shanqing,Zhao Minghao,Fu Chenbo,et al.Target defense against link-prediction-based attacks via evolutionary perturbations[J].IEEE Trans on Knowledge and Data Engineering,2021,33(2):754-767.
[9]柳娟,劉亞芳,許爽,等.基于多模體邊度的科學家合作關系預測[J].計算機學報,2020,43(12):2372-2384.(Liu Juan,Liu Yafang,Xu Shuang,et al.Predicting scientific collaboration by edge degree of multiple motifs[J].Chinese Journal of Computers,2020,43(12):2372-2384.)
[10]Bütün E,Kaya M.A pattern based supervised link prediction in directed complex networks[J].Physica A:Statistical Mechanics and Its Applications,2019,525:1136-1145.
[11]Zhang Xue,Zhao Chengli,Wang Xiaojie,et al.Identifying missing and spurious interactions in directed networks[J].International Journal of Distributed Sensor Networks,2015,11(9):507386.
[12]李治成,吉立新,劉樹新,等.基于拓撲有效連通路徑的有向網絡鏈路預測方法[J].電子科技大學學報,2021,50(1):127-137.(Li Zhicheng,Ji Lixin,Liu Shuxin,et al.A method of link prediction in directed network based on effective connectivity path[J].Journal of University of Electronic Science and Technology of China,2021,50(1):127-137.)
[13]Shang Keke,Small M,Yan Weisheng.Link direction for link prediction[J].Physica A:Statistical Mechanics and Its Applications,2017,469:767-776.
[14]Li Jinsong,Peng Jianhua,Liu Shuxin.et al.Link prediction in directed networks utilizing the role of reciprocal links[J].IEEE Access,2020,8:28668-28680.
[15]Pech R,Hao Dong,Lee Y L,et al.Link prediction via linear optimization[J].Physica A:Statistical Mechanics and Its Applications,2019,528:121319.
[16]李勁松,彭建華,劉樹新,等.一種基于線性規劃的有向網絡鏈路預測方法[J].電子與信息學報,2020,42(10):2394-2402.(Li Jinsong,Peng Jianhua,Liu Shuxin,et al.A link prediction method in directed networks via linear programming[J].Journal of Electronics and Information Technology,2020,42(10):2394-2402.)
[17]Zhang Qianming,Lyu Linyuan,Wang Wenqiang,et al.Potential theory for directed networks[J].PLoS One,2013,8(2):e55437.
[18]Dai Caiyan,Chen Ling,Li Bin,et al.Link prediction in multi-relatio-nal networks based on relational similarity[J].Information Sciences,2017,394:198-216.
[19]Chen Guangfu,Xu Chen,Wang Jingyi,et al.Robust non-negative matrix factorization for link prediction in complex networks using manifold regularization and sparse learning[J].Physica A:Statistical Mechanics and Its Applications,2020,539:122882.
[20]Ma Xiaoke,Sun Penggang,Qin Guimin.Nonnegative matrix factoriza-tion algorithms for link prediction in temporal networks using graph communicability[J].Pattern Recognition,2017,71:361-374.
[21]Chen Guangfu,Xu Chen,Wang Jingyi,et al.Nonnegative matrix factorization for link prediction in directed complex networks using Page-Rank and asymmetric link clustering information[J].Expert Systems with Applications,2020,148:113290.
[22]Cai Deng,He Xiaofei,Han Jiawei,et al.Graph regularized nonnegative matrix factorization for data representation[J].IEEE Trans on Pattern Analysis and Machine Intelligence,2010,33(8):1548-1560.
[23]Lee D D,Seung H S.Algorithms for non-negative matrix factorization[C]//Proc of the 13th International Conference on Neural Information Processing Systems.2000:535-541.
[24]Hanley J A,McNeil B J.The meaning and use of the area under a receiver operating characteristic (ROC) curve[J].Radiology,1982,143(1):29-36.
[25]Yang Yang,Lichtenwalter R N,Chawla N V.Evaluating link prediction methods[J].Knowledge and Information System,2015,45(3):751-782.
[26]Kunegis J.The Koblenz network collection[EB/OL].(2015).http://konect.uni-koblenz.de/.
[27]Bataglj V,Mrva A.Pajek datasets[EB/OL].(2006).hup://vladojmJuni-lj.si/pub/networks/data.
[28]Rossir A,Ahmed N K.Network repository datasets[EB/OL].(2015).http://networkrepository.com/index.php.
[29]Wang Zhiqiang,Liang Jiye,Li Ru.A fusion probability matrix factorization framework for link prediction[J].Knowledge-Based Systems,2018,159:72-85.