楊旭華,熊 帥
(浙江工業(yè)大學(xué) 計(jì)算機(jī)科學(xué)與技術(shù)學(xué)院,杭州 310023)
真實(shí)世界中的許多系統(tǒng)都可以抽象為復(fù)雜網(wǎng)絡(luò),比如社交網(wǎng)絡(luò)、交通網(wǎng)絡(luò)、電力網(wǎng)絡(luò)、通信網(wǎng)絡(luò)、人物關(guān)系網(wǎng)絡(luò)、流行病傳播網(wǎng)絡(luò)等.辨識網(wǎng)絡(luò)中有影響力的傳播節(jié)點(diǎn),涉及到網(wǎng)絡(luò)的結(jié)構(gòu)和功能等屬性,包括度分布,平均距離,連通性,信息傳播,魯棒性等[1-3],在實(shí)際應(yīng)用中,能夠控制信息在網(wǎng)絡(luò)中的傳播[4]、做高效的新聞推廣[5]、避免電網(wǎng)中故障的傳播[6]、分析蛋白質(zhì)之間的相互作用[7]等.
如何有效辨識網(wǎng)絡(luò)中節(jié)點(diǎn)傳播影響力的大小,研究者們已經(jīng)有了不少研究成果,這些方法總體上可以分為兩種類型:基于局部信息和基于全局信息的判斷節(jié)點(diǎn)中心性的方法.基于局部信息的方法,例如:度中心性[8]把節(jié)點(diǎn)連接的邊的數(shù)量作為衡量的指標(biāo);鄰居核中心性[9]把節(jié)點(diǎn)的一級鄰居、二級鄰居和三級鄰居節(jié)點(diǎn)個(gè)數(shù)之和當(dāng)做判斷影響力大小的指標(biāo);K-shell分解方法[10],是一種基于節(jié)點(diǎn)局部拓?fù)浣Y(jié)構(gòu)的方法,Liu等人[11]認(rèn)為許多真實(shí)網(wǎng)絡(luò)由于局部的緊密連接而存在類核結(jié)構(gòu),導(dǎo)致許多節(jié)點(diǎn)的值不能真實(shí)的反映節(jié)點(diǎn)在網(wǎng)絡(luò)中的影響力,他們通過刪除冗余邊的策略,提高了K-shell值的準(zhǔn)確性;鄭文萍等人[12]衡量節(jié)點(diǎn)在網(wǎng)絡(luò)連通性中的作用,通過節(jié)點(diǎn)所連邊對局部網(wǎng)絡(luò)連通性的影響來反映該節(jié)點(diǎn)在網(wǎng)絡(luò)連通性方面的重要性;Chen等人[13]結(jié)合度中心性和全局信息,提出了一種半局部中心性方法,實(shí)驗(yàn)表現(xiàn)與緊密中心性相同,但計(jì)算復(fù)雜度較低;李維娜等人[14],基于網(wǎng)絡(luò)的局部社團(tuán)結(jié)構(gòu)和節(jié)點(diǎn)度的分布情況,提出了一種重要節(jié)點(diǎn)挖掘算法SG-CPMining.
基于網(wǎng)絡(luò)全局信息的方法往往能獲得比基于局部信息的算法更高的精確度,但計(jì)算復(fù)雜度比較高.例如介數(shù)中心性[15]和接近中心性[16],都是基于全局路徑的方法,考慮網(wǎng)絡(luò)中任意節(jié)點(diǎn)對之間的路徑.谷歌公司提出的PageRank[17],通過考慮鄰居節(jié)點(diǎn)的數(shù)量和質(zhì)量,再進(jìn)行全局的迭代計(jì)算來確定節(jié)點(diǎn)的重要性.呂琳瑗等人提出一種類似于PageRank的算法,在網(wǎng)絡(luò)中增加了一個(gè)背景節(jié)點(diǎn)與所有節(jié)點(diǎn)進(jìn)行雙向連接,使新的網(wǎng)絡(luò)成為強(qiáng)連通網(wǎng)絡(luò),稱作LeaderRank[18].王斌等人[19]考慮網(wǎng)絡(luò)的結(jié)構(gòu)及屬性信息,提出節(jié)點(diǎn)信任度的概念,同時(shí)將節(jié)點(diǎn)信任度引入到PageRank 算法中,構(gòu)建了一種關(guān)鍵節(jié)點(diǎn)識別算法TPR(Trust-PageRank);Lu等人[20]提出了一種基于信息擴(kuò)散特性,將節(jié)點(diǎn)的局部屬性與全局屬性相結(jié)合的WeiboRank(WR)算法,在微博社交網(wǎng)絡(luò)數(shù)據(jù)上表現(xiàn)良好.
上述辨識方法,都是建立在傳統(tǒng)的網(wǎng)絡(luò)表示方法之上的,普遍依賴于網(wǎng)絡(luò)的鄰接矩陣和拓?fù)浣Y(jié)構(gòu),具有維度高和數(shù)據(jù)稀疏的特點(diǎn),計(jì)算復(fù)雜度高,在大型網(wǎng)絡(luò)使用中計(jì)算代價(jià)比較高.隨著網(wǎng)絡(luò)表征學(xué)習(xí)技術(shù)在自然語言處理等領(lǐng)域的發(fā)展和廣泛應(yīng)用,研究者們轉(zhuǎn)而探索如何將網(wǎng)絡(luò)中的節(jié)點(diǎn)表示為低維且稠密的向量,提出了諸多方法.DeepWalk是網(wǎng)絡(luò)表征學(xué)習(xí)的先驅(qū)[21],將詞表示學(xué)習(xí)算法word2vec[22]應(yīng)用在隨機(jī)游走序列上,從而生成了節(jié)點(diǎn)的低維度表示向量.Line[23]針對一階相似度和二階相似度,提出了一種邊采樣算法優(yōu)化目標(biāo)函數(shù),進(jìn)而得到節(jié)點(diǎn)的向量表示.Node2vec[24]通過改變隨機(jī)游走序列生成的方式擴(kuò)展了DeepWalk算法,將寬度優(yōu)先搜索和深度優(yōu)先搜索引入了隨機(jī)游走序列的生成過程,綜合考慮了網(wǎng)絡(luò)的局部信息和全局信息來表示節(jié)點(diǎn).CANE[25]假設(shè)每個(gè)節(jié)點(diǎn)的表示向量由文本表示向量及結(jié)構(gòu)表示向量構(gòu)成,其中,文本表示向量的生成過程與邊上的鄰居相關(guān),再利用卷積神經(jīng)網(wǎng)絡(luò)和注意力機(jī)制對一條邊上兩個(gè)節(jié)點(diǎn)的文本信息進(jìn)行編碼,得到節(jié)點(diǎn)的表示向量.SDNE[26]使用深層神經(jīng)網(wǎng)絡(luò)對節(jié)點(diǎn)表示間的非線性進(jìn)行建模,把模型分為兩個(gè)部分:一個(gè)是由 Laplace 矩陣監(jiān)督的建模第1級相似度的模塊,另一個(gè)是由無監(jiān)督的深層自編碼器對第2級相似度關(guān)系進(jìn)行建模,將深層自編碼器的中間層輸出作為節(jié)點(diǎn)的向量表示.這些算法從不同的角度,采用不同的優(yōu)化方法,把高維和稀疏的網(wǎng)絡(luò)映射到低維和稠密的向量空間,保留網(wǎng)絡(luò)的原有結(jié)構(gòu),具有計(jì)算復(fù)雜度低和準(zhǔn)確度高等特點(diǎn).
在本文中,我們基于網(wǎng)絡(luò)表征學(xué)習(xí)提出了一種辨識網(wǎng)絡(luò)節(jié)點(diǎn)影響力的方法.采用網(wǎng)絡(luò)表征學(xué)習(xí)DeepWalk算法把高維的復(fù)雜網(wǎng)絡(luò)映射到低維的向量空間,把網(wǎng)絡(luò)節(jié)點(diǎn)映射為歐式空間中低維的向量表示,然后結(jié)合網(wǎng)絡(luò)拓?fù)湫畔⑻岢龉?jié)點(diǎn)的局部中心性,作為判斷節(jié)點(diǎn)影響力大小的指標(biāo).
節(jié)點(diǎn)在網(wǎng)絡(luò)中傳播信息時(shí),與其局部的拓?fù)浣Y(jié)構(gòu)有很大的關(guān)系.已有研究表明:節(jié)點(diǎn)的K-shell值越大,周圍的拓?fù)浣Y(jié)構(gòu)越緊密,節(jié)點(diǎn)向周圍區(qū)域傳播信息的效率越高[27],同時(shí),信息傳遞的強(qiáng)度隨著節(jié)點(diǎn)間距離的增大而迅速衰減[28],由此,提出一種基于網(wǎng)絡(luò)表征學(xué)習(xí)和局部中心性確定任意節(jié)點(diǎn)i的影響力指標(biāo):
(1)
其中,Ksi表示節(jié)點(diǎn)i的K-shell值,χi、χj分別表示節(jié)點(diǎn)i、j用DeepWalk網(wǎng)絡(luò)表征方法映射到低維歐式空間的向量, |χi-χj|表示兩個(gè)向量之間的歐氏距離,Γ(i)表示i節(jié)點(diǎn)的三級鄰域,即i節(jié)點(diǎn)的一級鄰居、二級鄰居以及三級鄰居節(jié)點(diǎn)的集合,j節(jié)點(diǎn)屬于Γ(i)集合.
網(wǎng)絡(luò)中節(jié)點(diǎn)間的距離,本文沒有采用網(wǎng)絡(luò)的最短路徑距離,因?yàn)闀嬖谌缦碌膯栴},如圖1所示,i節(jié)點(diǎn)在傳播它自身的信息時(shí),首先會影響它的一級鄰居節(jié)點(diǎn),比如節(jié)點(diǎn)k和節(jié)點(diǎn)j,當(dāng)節(jié)點(diǎn)k和j被感染后,由于j節(jié)點(diǎn)有更多的連接到外部區(qū)域的鄰居節(jié)點(diǎn)(圖1中灰色節(jié)點(diǎn)),盡管同樣是節(jié)點(diǎn)i的一級鄰居節(jié)點(diǎn),j比k在傳播i節(jié)點(diǎn)信息的過程中貢獻(xiàn)更大[29],所以,信息在網(wǎng)絡(luò)中的傳播,除了距離以外,還與網(wǎng)絡(luò)的結(jié)構(gòu)密切相關(guān),最短路徑距離的長度不能準(zhǔn)確的表示信息在傳播過程中的衰減,還要根據(jù)網(wǎng)絡(luò)的拓?fù)浣Y(jié)構(gòu),對所求節(jié)點(diǎn)的鄰域節(jié)點(diǎn)做進(jìn)一步的劃分.

圖1 一個(gè)有8個(gè)節(jié)點(diǎn)和9條邊的網(wǎng)絡(luò)Fig.1 Network with eight nodes and nine edges
因?yàn)榫W(wǎng)絡(luò)表征學(xué)習(xí)方法不但可以把高維網(wǎng)絡(luò)映射到低維的向量表示,而且可以同時(shí)保持網(wǎng)絡(luò)的結(jié)構(gòu),節(jié)點(diǎn)間的距離用低維向量間的歐式距離替代后,不僅考慮了最短路徑距離,而且包含了節(jié)點(diǎn)周圍的拓?fù)浣Y(jié)構(gòu)信息,能夠更準(zhǔn)確的描述信息在網(wǎng)絡(luò)傳播過程中的衰減.因此在本文中,我們選擇應(yīng)用DeepWalk方法,把網(wǎng)絡(luò)節(jié)點(diǎn)映射到低維的向量表示,然后用節(jié)點(diǎn)相應(yīng)的低維向量來計(jì)算節(jié)點(diǎn)之間的距離.
具體地,基于DeepWalk方法,將網(wǎng)絡(luò)空間映射到歐式空間,把每一個(gè)節(jié)點(diǎn)表示為一個(gè)低維稠密的向量,將具有N個(gè)節(jié)點(diǎn)的網(wǎng)絡(luò)G轉(zhuǎn)化為歐氏空間的N個(gè)r維向量,一個(gè)網(wǎng)絡(luò)節(jié)點(diǎn)及其連邊信息對應(yīng)一個(gè)向量,其中任意節(jié)點(diǎn)i的向量表示為:
在本文中,r取N/2
為了評估所提出的方法的性能,我們在8個(gè)真實(shí)世界的網(wǎng)絡(luò)中進(jìn)行了實(shí)驗(yàn),這8個(gè)網(wǎng)絡(luò)都是無向網(wǎng)絡(luò),也不考慮權(quán)重,它們分別是常見形容詞和名詞的鄰接網(wǎng)絡(luò)adjnoun[30]、科學(xué)家合作網(wǎng)絡(luò)netscience、Ca-GrQc和hep-th[31-33]、新西蘭寬吻海豚社會網(wǎng)絡(luò)dolphin[34]、小型的facebook社交網(wǎng)絡(luò)[35]、爵士音樂人合作網(wǎng)絡(luò)Jazz[36]、美國政治圖書網(wǎng)絡(luò)polbooks[37],表1給出了8個(gè)真實(shí)數(shù)據(jù)集的拓?fù)鋵傩詤?shù).其中,N和E分別表示網(wǎng)絡(luò)的節(jié)點(diǎn)數(shù)和邊數(shù),〈k〉表示網(wǎng)絡(luò)的平均度,在本文中,考慮到現(xiàn)實(shí)世界中網(wǎng)絡(luò)的度分布往往存在“重尾效應(yīng)”,令βth=〈k〉/〈k2〉[38],表示SIR模型傳播的閾值,c表示網(wǎng)絡(luò)的平均聚類系數(shù).

表1 數(shù)據(jù)集Table 1 Data sets
3.2.1 SIR疾病傳播模型
SIR屬于動態(tài)傳播算法,結(jié)果準(zhǔn)確性好但計(jì)算復(fù)雜度高,本文提出的NLC算法及其他靜態(tài)指標(biāo)方法計(jì)算復(fù)雜度低,我們用SIR疾病模型做為基準(zhǔn)參照模型去評價(jià)不同的判斷節(jié)點(diǎn)影響力靜態(tài)指標(biāo)方法性能的優(yōu)劣[39].在SIR模型中,如果需要判定一個(gè)節(jié)點(diǎn)在網(wǎng)絡(luò)中的傳播影響力,則把這個(gè)節(jié)點(diǎn)設(shè)定為網(wǎng)絡(luò)中唯一的感染節(jié)點(diǎn)(Infected),其他節(jié)點(diǎn)標(biāo)記為易感節(jié)點(diǎn)(Susceptible),在每個(gè)時(shí)間步,每個(gè)感染態(tài)節(jié)點(diǎn)會以概率β(β=1.5βth)感染其易感鄰居節(jié)點(diǎn),βth表示SIR模型傳播的閾值,然后以概率μ(在本文中,我們設(shè)置μ=1)從疾病中恢復(fù),變成移除態(tài)(Recovered),移除態(tài)節(jié)點(diǎn)不會再被感染.這個(gè)過程不斷迭代直到網(wǎng)絡(luò)中沒有感染節(jié)點(diǎn)為止,t時(shí)刻網(wǎng)絡(luò)中移除態(tài)和感染態(tài)節(jié)點(diǎn)的總數(shù)量,記為F(t),F(xiàn)(t),作為評價(jià)t時(shí)刻該節(jié)點(diǎn)傳播影響力大小的指標(biāo),F(xiàn)(t)越大,該節(jié)點(diǎn)影響力越大.
3.2.2 SI疾病傳播模型
在該模型中,節(jié)點(diǎn)一旦被感染,狀態(tài)從S變?yōu)镮之后不能恢復(fù),其他條件和SIR模型相同,在本文中,易感狀態(tài)節(jié)點(diǎn)被感染的概率為2βth.如果在相同的時(shí)間步的條件下,一個(gè)節(jié)點(diǎn)感染的網(wǎng)絡(luò)節(jié)點(diǎn)越多,則說明該節(jié)點(diǎn)感染能力越強(qiáng),影響力越大.
3.2.3 肯德爾系數(shù)
不同的方法都可以按照所計(jì)算的傳播能力,對網(wǎng)絡(luò)中所有節(jié)點(diǎn)從高到低排序,針對不同的感染率β,我們用肯德爾系數(shù)τ去評價(jià)不同的靜態(tài)指標(biāo)方法得到的排序列表和SIR動態(tài)傳播模型生成的排序列表之間的聯(lián)系[40],τ是一個(gè)在[-1,1]之間的一個(gè)數(shù),τ越大,兩個(gè)序列吻合度越高,τ被定義為:
(2)
Nc表示兩個(gè)排序列表相協(xié)調(diào)元素的數(shù)量,Nd表示二者不協(xié)調(diào)元素的數(shù)量,N表示網(wǎng)絡(luò)節(jié)點(diǎn)總數(shù).
首先,對八個(gè)真實(shí)網(wǎng)絡(luò)的每一個(gè)節(jié)點(diǎn)在本網(wǎng)絡(luò)內(nèi)賦予唯一的編號,比如網(wǎng)絡(luò)1有N個(gè)節(jié)點(diǎn),則網(wǎng)絡(luò)節(jié)點(diǎn)的編號應(yīng)該是1,2,……,N.
3.3.1 比較NLC和5種知名中心性方法識別的Top-10高影響力節(jié)點(diǎn)的準(zhǔn)確性
在表2中,我們以SIR模型計(jì)算出來的Top-10節(jié)點(diǎn)為基準(zhǔn),在4個(gè)真實(shí)網(wǎng)絡(luò)上,用NLC方法,度中心性(DC)、接近中心性(CC)、介數(shù)中心性(BC)、鄰居核中心性(Cnc)、半局部中心性(CL)分別計(jì)算Top10節(jié)點(diǎn),比較不同方法的準(zhǔn)確性,考慮到網(wǎng)絡(luò)的規(guī)模和時(shí)間復(fù)雜度,本文令t=10[41].具體計(jì)算方法為:以dolphin網(wǎng)絡(luò)為例,首先用SIR模型在t=10時(shí)刻,計(jì)算得到F(10)數(shù)值最大的Top-10節(jié)點(diǎn)做為基準(zhǔn),然后用NLC方法算出Top-10節(jié)點(diǎn),如果兩組節(jié)點(diǎn)有9個(gè)相同,則NLC算法的準(zhǔn)確率為90%.

表2 6種中心性算法和SIR模型對排名前10節(jié)點(diǎn)的識別結(jié)果Table 2 Six algorithms and SIR models to identify thetop-10 nodes
在表2中,比較其它5種方法,本文提出的NLC算法在4個(gè)數(shù)據(jù)集中都取得了最高的準(zhǔn)確率.接下來,我們比較了各種靜態(tài)指標(biāo)算法與SIR模型得到的Top-10節(jié)點(diǎn)排序列表的吻合程度,在小型網(wǎng)絡(luò)polbooks和adjnoun中,6種中心性算法都有較高的準(zhǔn)確率,CL算法和NLC算法有相同的準(zhǔn)確率,但NLC得到的序列與SIR模型給出的序列更吻合;在dolphin和netscience網(wǎng)絡(luò)中,NLC算法不僅有最高的準(zhǔn)確率,而且給出的排序序列與SIR模型給出的序列更吻合;就整體而言,NLC與SIR模型得到的序列保持良好的吻合度.
其中實(shí)驗(yàn)結(jié)果取1000次實(shí)驗(yàn)的平均值,最佳準(zhǔn)確率用黑體字標(biāo)出,F(xiàn)(10)表示SIR模型在第10時(shí)間步的結(jié)果.
3.3.2 比較NLC與5種知名中心性方法在SIR模型下的肯德爾系數(shù)
分別用各種靜態(tài)指標(biāo)算法與SIR模型對一個(gè)網(wǎng)絡(luò)中所有節(jié)點(diǎn)的影響力排序,然后比較各種靜態(tài)指標(biāo)算法得到的節(jié)點(diǎn)排序列表和SIR模型得到列表的吻合程度,我們用肯德爾系數(shù)表示這個(gè)吻合程度.
如圖2所示,針對不同的感染率β,使用NLC和5種知名中心性方法計(jì)算出網(wǎng)絡(luò)中所有節(jié)點(diǎn)的影響力大小排序列表,與SIR模型生成的排序列表做對比,得到肯德爾系數(shù)τ.在adjnoun網(wǎng)絡(luò)中,BC算法表現(xiàn)最差,CL和Cnc算法表現(xiàn)基本相同,NLC算法表現(xiàn)最好;在polbooks網(wǎng)絡(luò)中,CC和BC表現(xiàn)最差,NLC、CL、Cnc表現(xiàn)良好;在netscience網(wǎng)絡(luò)中,表現(xiàn)最差的還是BC算法,CC和CL算法也表現(xiàn)不佳,當(dāng)β<0.04,NLC算法表現(xiàn)最好,總體表現(xiàn)良好;在facebook網(wǎng)絡(luò)中,CC表現(xiàn)最差,當(dāng)β>0.04,NLC表現(xiàn)最好;在hep-th網(wǎng)絡(luò)中,當(dāng)β<0.04時(shí),NLC算法表現(xiàn)最好,當(dāng)β>0.04,NLC算法在6種方法中排名第二;dolphin網(wǎng)絡(luò)中,當(dāng)β在0到0.04以及0.07到0.1這兩個(gè)區(qū)間時(shí),NLC算法表現(xiàn)最好,優(yōu)于其它算法;在Jazz和Ca-GrQc網(wǎng)絡(luò)中,BC算法表現(xiàn)最差,當(dāng)β>0.03時(shí),NLC算法表現(xiàn)最好;綜上所述,NLC在肯德爾系數(shù)上表現(xiàn)最佳.

圖2 NLC,CC,BC,DC,CL,Cnc算法的肯德爾系數(shù),取1000實(shí)驗(yàn)的平均值.橫坐標(biāo)表示節(jié)點(diǎn)被感染的概率,縱坐標(biāo)表示肯德爾系數(shù)Fig.2 Kendall correlation coefficient of NLC,CC,BC,DC,CL,Cnc algorithm which are taken as the average value of 1000 experiments.The horizontal ordinate represents the probability of the node being infected,and the longitudinal ordinate represents the Kendall correlation coefficient
3.3.3 比較NLC和CL、Cnc方法所選Top-10節(jié)點(diǎn)的平均感染能力
在8種不同的網(wǎng)絡(luò)中,NLC算法性能均排前列;BC和CC算法不僅計(jì)算量大,而且表現(xiàn)差;Cnc算法和CL算法,在不同的數(shù)據(jù)集中,表現(xiàn)極不穩(wěn)定,在有些數(shù)據(jù)集中表現(xiàn)較好,在有些數(shù)據(jù)集中甚至差于BC和CC算法.為進(jìn)一步比較NLC,CL以及Cnc算法的性能,我們使用SI模型檢驗(yàn)3種算法性能.
首先用一個(gè)算法選出Top-10節(jié)點(diǎn),然后用Top-10節(jié)點(diǎn)在第t個(gè)時(shí)間步之內(nèi)感染的節(jié)點(diǎn)總數(shù)與網(wǎng)絡(luò)節(jié)點(diǎn)總數(shù)的比值的平均值
(3)
做為該算法的性能指標(biāo).在式(3)中,n表示網(wǎng)絡(luò)節(jié)點(diǎn)總數(shù),nit表示Top-10節(jié)點(diǎn)中第i個(gè)節(jié)點(diǎn)第1到第t步感染的節(jié)點(diǎn)總數(shù).在相同的時(shí)間步和感染概率的情況下,哪一種方法選出的Top-10節(jié)點(diǎn)感染的節(jié)點(diǎn)越多,可以認(rèn)為該算法表現(xiàn)越好.
具體實(shí)驗(yàn)結(jié)果如圖3所示,可以看到,NLC算法在4個(gè)網(wǎng)絡(luò)中都取得了最佳性能.在dolphin網(wǎng)絡(luò)中,NLC算法表現(xiàn)最好,Cnc算法性能最差;在netscience網(wǎng)絡(luò)中,當(dāng)時(shí)間步大于15后,NLC算法感染的節(jié)點(diǎn)比另外兩種算法明顯增多,達(dá)到穩(wěn)定的時(shí)間也比另外兩種算法早,所選Top-10節(jié)點(diǎn)表現(xiàn)最好;在Ca-GrQc網(wǎng)絡(luò)中,時(shí)間步小于10時(shí),3種算法表現(xiàn)相近,大于10后,NLC算法表現(xiàn)最好,且NLC算法在第33個(gè)時(shí)間步就達(dá)到穩(wěn)定;在hep-th網(wǎng)絡(luò)中,Cnc算法表現(xiàn)最差,在第42個(gè)時(shí)間步才達(dá)到穩(wěn)定,NLC算法表現(xiàn)最好.

圖3 Top-10節(jié)點(diǎn)的感染能力和時(shí)間步的關(guān)系曲線,取1000次實(shí)驗(yàn)的平均值.橫坐標(biāo)表示時(shí)間步,縱坐標(biāo)表示第t個(gè)時(shí)間步內(nèi)Top-10節(jié)點(diǎn)在SI模型中感染的節(jié)點(diǎn)數(shù)的平均值與網(wǎng)絡(luò)節(jié)點(diǎn)總數(shù)的比值Fig.3 Relationship curve of infection ability and time step of Top-10 node.The results are taken the average of 1000 experiments. the horizontal ordinate represents the time step,and the longitudinal ordinate represents the ratio of the average number of nodes infected by Top-10 nodes in the SI model to the total number of network nodes within the t time step
在本文中,我們基于網(wǎng)絡(luò)表征學(xué)習(xí)方法,結(jié)合節(jié)點(diǎn)的拓?fù)浣Y(jié)構(gòu)和鄰域信息,提出了一種節(jié)點(diǎn)局部中心性指標(biāo)來識別節(jié)點(diǎn)影響力的方法.該方法提出網(wǎng)絡(luò)中的節(jié)點(diǎn)的影響力由拓?fù)浣Y(jié)構(gòu)決定,同時(shí)隨著距離的增加而衰減.在8個(gè)真實(shí)網(wǎng)絡(luò)中,通過和5種知名的中心性方法相比較,在計(jì)算Top-10節(jié)點(diǎn)、Top-10節(jié)點(diǎn)的感染能力和肯德爾系數(shù)等方面,NLC算法取得了良好的辨識效果,在分析和控制復(fù)雜網(wǎng)絡(luò)中的信息傳播過程中具有廣闊的應(yīng)用前景.