999精品在线视频,手机成人午夜在线视频,久久不卡国产精品无码,中日无码在线观看,成人av手机在线观看,日韩精品亚洲一区中文字幕,亚洲av无码人妻,四虎国产在线观看 ?

基于譜頂層分割的網(wǎng)絡社區(qū)層次抽取方法①

2020-01-15 06:45:26
計算機系統(tǒng)應用 2020年1期
關鍵詞:方法

熊 英

(江門開放大學 網(wǎng)絡信息中心,江門 529000)

網(wǎng)絡層次設計進行網(wǎng)絡社區(qū)檢測的有效方式,在社交網(wǎng)絡、教育社區(qū)數(shù)據(jù)挖掘和犯罪特征識別等領域得到了廣泛的應用.網(wǎng)絡層次本質上是由不同尺度上社區(qū)內連接密度的異構性定義[1],若社區(qū)內的連接密度大于社區(qū)之間的連接密度,則網(wǎng)絡社區(qū)組織結構具有層次性.將網(wǎng)絡劃分成若干個連接相對緊密的社區(qū),每個社區(qū)又可能包含若干個連接相對更緊密的子社區(qū)[2–4].例如:存在一個具有40個節(jié)點的二層網(wǎng)絡組織,設網(wǎng)絡的一個社區(qū)Ci內部連接密度為p1,它到網(wǎng)絡其余部分的密度為p0,則有p1>p0;如果社區(qū) Ci由許多小的社區(qū)Cik構成,Cik的連接密度為p2,則有p2>p1.如何抽取網(wǎng)絡層次社區(qū)結構是當前的一個重要研究熱點[4].

抽取網(wǎng)絡層次社區(qū)結構的主要方法是基于層次聚類方法[5,6],其思想是采用譜頂層分割的算法將k最近鄰圖劃分成大量較小的子社區(qū),并用相似的子社區(qū)反復地合并操作;文獻[7]利用譜頂層分割的方法,提出了一種基于馬爾可夫鏈的蒙特卡羅抽樣技術預測丟失連接,用于推導復雜網(wǎng)絡的層次,但由于其算法的抽取的空間較大,容易導致數(shù)據(jù)的維度問題;文獻[8]提出了多層次節(jié)點相似的網(wǎng)絡社區(qū)發(fā)現(xiàn)方法,在改進節(jié)點相似度和團體連接緊密度的基礎上構建社區(qū)發(fā)現(xiàn)模型,從而更加準確地找到社區(qū)成員,但這種方法未考慮網(wǎng)絡的層次的異構特性,且不能很好地適用于大型網(wǎng)絡;文獻[9,10]提出了多尺度方法揭示不同尺度下的社區(qū)結構,該方法對異構網(wǎng)絡的檢測具有較好的效果,但未考慮社區(qū)內外連接密度的動態(tài)變化和社區(qū)間的異構性,使該方法不能適用于動態(tài)演化的網(wǎng)絡社區(qū).

基于以上問題,提出了一種基于譜頂層分割的網(wǎng)絡社區(qū)層次抽取方法,該方法將網(wǎng)絡的頂層分割定義為某個子網(wǎng)絡的二分使得沒有任意一個頂層社區(qū)橫跨兩部分,并給出了頂層分割的期望劃分;引入隊列的思想計算社區(qū)連接密度,自頂向下逐層分解給定網(wǎng)絡,提出社區(qū)層次抽取算法;通過實驗驗證所提出方法的科學性和合理性.

1 譜頂層分割

1.1 頂層分割

存在一個具有內部結構的網(wǎng)絡N,所有構成它的第一層的社區(qū)稱為關于該網(wǎng)絡N的頂層社區(qū),所有頂層社區(qū)的集合稱為N的頂層分解,而使N的頂層分解中所有節(jié)點只存在于一個分組中的方法則為N 的譜頂層分割,進而形成一個網(wǎng)絡的二分,使沒有任何一個頂層分解跨越得到兩個組.如圖1所示,在具有兩層網(wǎng)絡組織結構中,P1和P2為網(wǎng)絡N的頂層社區(qū),社區(qū)C1和C2為P1的頂層社區(qū),則P1-P2是網(wǎng)絡的頂層分割,C1-C2是 P1的頂層分割.

圖1 具有網(wǎng)絡組織結構的頂層分割

譜頂層分割可以期望找到一個頂層分割或近似頂層分割,由于每次分裂總是試圖找到模塊度最大或者增量最大的二分,如果考慮更多的特征向量,找到一個頂層分割的機會將進一步增強.因此,為使頂層分割得到較高的模塊度,需計算期望最高劃分,從而選擇連接密度最小的返回頂層分割.

1.2 譜頂層期望劃分

設存在具有3個社區(qū)C1、C2和C3的隨機網(wǎng)絡,假設連接概率的如表1所示且p0

表1 社區(qū)內和社區(qū)間的連接概率配置

譜頂層分割設置了一個兩層次網(wǎng)絡,即由C1和C2構成的社區(qū)和C3形成了網(wǎng)絡的第一層,而C1和C2形成了第二層.對于該網(wǎng)絡,存在3個二分,即π1:(C1,C2)- (C3),π2:(C1,C3)- (C2)和π3:(C1)- (C2,C3).為進一步分析,將3個連接概率參數(shù)設置為:p0=0.1,pn=p0+kn×rn.其中,p0作為社區(qū)與社區(qū)之間劃分的初始連接概率,pn在p0的計算基礎上設置連接概率,并以kn和rn取值[0,1]中的隨機數(shù),這里統(tǒng)一取kn=0.5且rn=0.5,以保持網(wǎng)絡層次的穩(wěn)定性,以免在出現(xiàn)連接狀態(tài)層次不統(tǒng)一問題.在給定一個網(wǎng)絡N的前提下,設Q為期望劃分值,對兩個層次的期望則定義為:

式(1)中,mi和ki分別是社區(qū)i的尺寸和總度.通過計算期望劃分值可以將連接密度最小社區(qū)作為頂層分割,進而對網(wǎng)絡層次進行抽取.

2 網(wǎng)絡層次社區(qū)抽取

2.1 連接密度計算

為獲取連接密度最小的社區(qū),引入隊列思想對網(wǎng)絡N自頂向下逐層分解,采用q_curr表示存儲網(wǎng)絡第h層的有待分析社區(qū),q_work表示當前工作隊列,q_next表示存儲下一層社區(qū).當初始化時,q_curr存儲包含網(wǎng)絡中所有節(jié)點的唯一組,從q_curr的隊頭中取出第一組并將其存入網(wǎng)絡N,然后將其分解成兩組網(wǎng)絡數(shù)據(jù)N1和N2,并計算其連接密度:

式(2)中,E(N1,N2)表示網(wǎng)絡N1和N2之間的邊數(shù),而計算連接密度是關于N的頂層社區(qū)間的連接密度的一個估計.

當N1和N2進入工作隊列q_work時,都可能包含幾個譜頂層分割.如果當前q_work非空,則可以從中取出第一組網(wǎng)絡數(shù)據(jù)N1并對它進行分解;如果不可分,則N1被認為是一個頂層社區(qū),否則它被劃分為兩個更小的組N11和N12,并實時檢查它們之間的連接密度 δ1,計算是否超過譜頂層分割間連接密度的估計值δ?0.如果計算結果大于估計值δ?0,則此分割不屬于h層分解,而屬于h+1層分解.由此推知,N1是關于網(wǎng)絡N的一個譜頂層分割,則N1進入q_next準備下一層分解,否則,N11和N12都可能是一個譜頂層分割或者幾個譜頂層分割.因此,為進一步取代N1,需進入q_work調整估計值 δ?0,調整估計值方法的思路是將原有的估計值在頂層分割次數(shù)的基礎上對下一層網(wǎng)絡分割后連接密度的預判,可以實時檢測頂層分割后的每一層網(wǎng)絡的連接概況,從而提高下一層分割的精準性.其計算方法如下:

式(3)中,n表示網(wǎng)絡N從q_curr中取出后,執(zhí)行頂層分割的次數(shù),δ?0表示新的值.當q_work為空時,表示從q_curr中取出的第一個組N1已經完全分解為它的頂層社區(qū);而從q_curr中取出下一個組直到q_curr為空,將q_next中的組移到q_curr,并進行h+1層分析,重復上述過程得到調整后的估計值.

2.2 算法實現(xiàn)

抽取網(wǎng)絡層次由算法1實現(xiàn),在該算法中函數(shù)subspaceMethod (G,N1,N2,δ1,d)為搜索一個頂層分割,將N分解為兩個組N1和G2,δ1為兩部分間的連接密度,d指示了N是來自于q_curr(d=0)還是來自于q_work(d>0).符號“←”和“→”對應隊列的兩個基本操作,即“從隊頭取元素”和“存儲數(shù)據(jù)到隊尾”,而qa?qb表示將隊列qa的所有數(shù)據(jù)移到另一個隊列qb,算法實現(xiàn)如算法1.

算法1.層次抽取算法(偽代碼)輸入:q_curr,q_work,q_next輸出:新的層次社區(qū)1)initialize q_curr,q_work,q_next 2)N→q_curr,h=0 //N表示整個網(wǎng)絡3)while q_curr is not empty do 4)while q_curr is not empty do 5)N←q_curr, d=0 6)v=subspaceMethod (N,N1,N2,δ1,d)7)if v>0 then //N未被分解8)N1→q_work,N2→q_work,δ*=δ1 9)end if 10)while q_work is not empty do 11)N←q_work and v=subspaceMethod (N,N1,N2,δ1,d)12)if v<=0 then N→q_next δ?<=β×δ?13)else if //β確定一個劃分是否屬于下一個層次14)N1→q_work,N2→q_work update δ*15)d=d+1,compute(Q)//計算期望劃分值16)else N→q_next //N為最頂層社區(qū)17)end if 18)end if 19)end while 20)end while 21)h=h+1 22)if q_next is not empty then output the communities at h level from qnext //返回新的層次社區(qū)?23)q_next q_curr 24)end if 25)end while

由于對網(wǎng)絡分割的順序取決于集合之間邊的密度,因此上述算法可看作為一種有序的譜方法,首先搜索一個頂層分解并計算網(wǎng)絡的特征向量,判斷網(wǎng)絡N是否被分解狀態(tài),然后進入隊列進行頂層分割;在δ??β×δ?中,參數(shù)β的選擇確定一個劃分是否屬于下一層次,本文設置β=1.6,為實驗測試設定一個穩(wěn)定值,以解決該值太小導致連接密度的同質性較高以及異質性較強的問題.

3 實驗分析

仿真實驗在gephi軟件平臺上驗證本文方法的有效性,數(shù)據(jù)來源于Rovirai Virgili[11]大學Email數(shù)據(jù)中的教師聯(lián)系網(wǎng)絡,該網(wǎng)絡由7個主要學院的教師共640個節(jié)點構成的三層次網(wǎng)絡,自頂向下分別為學院、系和研究組,網(wǎng)絡第一層由4個160節(jié)點的社區(qū)構成,每個類似的社區(qū)在第二層分解為4個40節(jié)點的小社區(qū)構成,而每個小社區(qū)又在第三層包含了4個10節(jié)點的更小社區(qū),網(wǎng)絡的邊按照各層的不同的連接密度生成的,滿足p0

3.1 同質層次隨機網(wǎng)絡性能

對于數(shù)據(jù)源中學院、系、研究組,其每個層次具有相似的層次分布結構,在滿足所有層次比例μ=k

圖2 本文方法在層次隨機網(wǎng)絡的凝聚性精度

由圖2可知,對于具有3個同質層的隨機網(wǎng)絡上的性能,每一個點是在10個實例網(wǎng)絡上的平均,一個穩(wěn)定的分割可能對應于某一層次的劃分.

由圖3可知,通過本文方法與多尺度法和同步法進行比較,說明了多尺度法和同步法對3個層次分割的精度.在最強凝聚情形0.785 和0.885下,雖然同步法在3個層次上都具有相當高的精度,但它的精度隨著凝聚強度的下降而快速下降;多尺度法在精度和穩(wěn)定性方面則更接近本文方法,但其規(guī)范化互信息仍然低于本文方法且不適應于動態(tài)演化的網(wǎng)絡.

3.2 異質層次隨機網(wǎng)絡性能

由于在更小的網(wǎng)絡社區(qū)中,其每一層所具有的社區(qū)的尺寸是完全不同的,因此需要在通過本文方法驗證是否適用于尺寸異質的情形.由圖4可知,通過實驗,本文方法能夠精確地抽取它的層次組織,其中粗線表示第一層劃分,細線表示第二層劃分,在第二層中社區(qū)內的不同灰度節(jié)點表示第三層的網(wǎng)絡組織,可以顯示層次抽取后的結果.

圖3 層次隨機網(wǎng)絡的凝聚性比較

圖4 異質隨機網(wǎng)絡的社區(qū)層次抽取結果

由圖5可知,譜頂層劃分與真實的劃分完全一致,第二層和第三層精確地逼近真實的劃分,按照互信息精度分別為0.93和0.81.同時,將本文方法與同步法和多尺度法做了比較,在第一層社區(qū)網(wǎng)絡上,本文方法比同步法和多尺度法在規(guī)范化互信息性能上分別高0.05和0.15,計算精度損失較小,這是由于在第一層社區(qū)網(wǎng)絡計算連接密度的數(shù)據(jù)量較大,而第二層次和第三層次社區(qū)網(wǎng)絡上,本文方法比同步法和多尺度法在規(guī)范化互信息性能上的差距逐漸減少,這是由于本文方法引入了隊列的思想,在空間不足的情形下通過不斷調整連接密度的估計值,實時預判和分析下一層分割網(wǎng)絡社區(qū)的密度,在期望劃分的驅動下釋放密度最小社區(qū)的相關節(jié)點,然后再計算連接密度的估計值,以此類推,得出最小社區(qū).

4 結論與展望

針對網(wǎng)絡的層次社區(qū)檢測問題,提出了一種基于譜頂層分割的網(wǎng)絡社區(qū)層次抽取方法,選取在線真實數(shù)據(jù)源作為實驗數(shù)據(jù),說明了該方法的科學性和合理性,為院校社區(qū)教育和大數(shù)據(jù)行為特征識別提供了相關技術基礎支持,下一步將從大數(shù)據(jù)的角度對社區(qū)的層次進行抽取,利用語義特征檢測的方法和大數(shù)據(jù)優(yōu)化相關算法,對社區(qū)層次檢測的語義性進行探索研究,以得出更好的實驗效果.

圖5 本文方法與同步法和多尺度法的規(guī)范化互信息比較

猜你喜歡
方法
中醫(yī)特有的急救方法
中老年保健(2021年9期)2021-08-24 03:52:04
高中數(shù)學教學改革的方法
河北畫報(2021年2期)2021-05-25 02:07:46
化學反應多變幻 “虛擬”方法幫大忙
變快的方法
兒童繪本(2020年5期)2020-04-07 17:46:30
學習方法
用對方法才能瘦
Coco薇(2016年2期)2016-03-22 02:42:52
最有效的簡單方法
山東青年(2016年1期)2016-02-28 14:25:23
四大方法 教你不再“坐以待病”!
Coco薇(2015年1期)2015-08-13 02:47:34
賺錢方法
捕魚
主站蜘蛛池模板: 亚洲av无码人妻| av在线手机播放| 日韩欧美亚洲国产成人综合| 亚洲欧美一级一级a| 欧美不卡在线视频| 国产福利在线观看精品| 999精品视频在线| 3D动漫精品啪啪一区二区下载| 自拍亚洲欧美精品| 99在线视频免费观看| 真实国产乱子伦视频| 日本在线视频免费| 99人妻碰碰碰久久久久禁片| 日韩第九页| 亚洲一区第一页| 日韩在线网址| 亚洲国产精品日韩av专区| 国产女人18水真多毛片18精品 | 精品亚洲麻豆1区2区3区| 99热这里只有成人精品国产| 欧美成人精品一级在线观看| 国产综合色在线视频播放线视| 国产精品毛片一区| 国产素人在线| 香蕉网久久| 又黄又爽视频好爽视频| 日本福利视频网站| 国产亚洲欧美另类一区二区| 久久一日本道色综合久久| 色悠久久综合| 亚洲男人在线| 免费看美女自慰的网站| 97国产精品视频自在拍| 欧美在线黄| 香蕉视频在线观看www| 在线国产资源| av大片在线无码免费| 日本三区视频| 亚洲欧美日韩久久精品| 亚洲精品无码抽插日韩| 成人午夜亚洲影视在线观看| 天天躁日日躁狠狠躁中文字幕| 亚洲国产精品国自产拍A| 亚洲不卡影院| 天堂在线www网亚洲| 国产欧美精品一区二区| 精品久久久久久中文字幕女| 91在线国内在线播放老师| 欧美午夜一区| 伊人久久大香线蕉影院| 欧美日韩在线第一页| 无遮挡一级毛片呦女视频| 久久6免费视频| AV老司机AV天堂| 91人人妻人人做人人爽男同| 91精品国产丝袜| 狠狠色噜噜狠狠狠狠奇米777 | 亚洲av日韩av制服丝袜| 操美女免费网站| 在线日韩一区二区| 久久五月视频| 婷婷综合缴情亚洲五月伊| 国产成人综合在线观看| 手机在线免费不卡一区二| 国产乱子伦无码精品小说| 国产精品爽爽va在线无码观看| 国产乱人免费视频| 亚洲中文精品久久久久久不卡| 素人激情视频福利| 亚洲国产日韩在线成人蜜芽| 欧美日韩一区二区在线免费观看| 有专无码视频| AV网站中文| 国产在线精品美女观看| 国产女人爽到高潮的免费视频| 久久香蕉国产线看观看亚洲片| 99久久国产综合精品2023| 国产成人亚洲精品无码电影| 国产91精品调教在线播放| 亚洲区第一页| 91亚瑟视频| 久久亚洲高清国产|