摘 要:社會網絡的數據規模在不斷擴大,現存的異常檢測算法對復雜社會網絡進行檢測的效果不理想,提出了一種基于圖模塊度聚類的異常檢測算法(anomaly detection algorithm based on graph modularity clustering,GMC_AD),該算法適用于解決受網絡規模以及復雜度的限制導致檢測效率不高的問題。GMC_AD算法在分析網絡拓撲結構的基礎上,通過引入異常節點加權機制和模塊度聚類算法進行異常檢測。GMC_AD算法主要在三個方面進行改進:a)設計網絡中節點演化的量化策略,以此識別具有異常演化行為的節點來得到異常節點集合;b)通過模塊度聚類的方法降低網絡規模;c)在計算網絡波動值的過程中使用加權機制合理考慮異常節點的影響,再通過網絡波動值變化來檢測異常。基于真實社會網絡VAST、EU_E-mail和ENRON進行對比實驗,GMC_AD算法準確地檢測出異常發生的時段,實驗結果顯示在事件檢測敏感性上提高了50%~82%,在異常檢測運行效率上提高了30%~70%。實驗結果表明,GMC_AD算法不僅提高了異常檢測算法的準確率和敏感性,還提高了異常檢測算法的效率。
關鍵詞:節點演化;模塊度聚類;社會網絡;動態網絡;異常檢測
中圖分類號:TP181 文獻標志碼:A 文章編號:1001-3695(2023)06-019-1721-07
doi: 10.19734/j.issn.1001-3695.2022.10.0513
Anomaly detection method based on graph modularity clustering
Fu Kun Liu Yinghua Hao Yuhan Sun Minglei
(1. College of Artificial Intelligence amp; Data Science, Hebei University of Technology, Tianjin 300401, China; 2. Key Laboratory of Big Data Computing, Tianjin 300401, China)
Abstract:As the growth of social network scale, so do challenges to the existing anomaly detection algorithms. Therefore, this paper proposed an anomaly detection method based on graph modularity clustering (GMC_AD), which could be applied to solve the problem of low detection efficiency caused by network size and complexity. Based on analyzing the network topology structure, the GMC_AD method improved the efficiency of events detection by weighting mechanism on abnormal nodes and modularity clustering algorithm. The GMC_AD processes could be described as follow: a)Since designing a quantization strategy for node evolution in the network, GMC_AD get the set of abnormal nodes by recognizing nodes with abnormal evolutionary behaviors. b)The method used a modularity clustering algorithm to reduce the network size. c)During the calculation of network fluctuation value, it introduced a weighting mechanism for taking the influence of abnormal nodes into consideration, after that, the GMC_AD method detected the abnormality by the changes of network fluctuation value. On real social network datasets VAST, EU_E-mail and ENRON, the GMC_AD method accurately detected the abnormal periods. The event detection sensibility of GMC_AD method was increased by 50%~82% meanwhile the run-time efficiency increased by 30%~70%. The GMC_AD method enhances not only the accuracy and sensitivity but also the efficiency of anomaly detections.
Key words:node evolution; modularity clustering; social network; dynamic network; abnormal detection
0 引言
截至2022年6月,中國網民的規模為10.32億[1],隨著互聯網的快速發展和眾多社交媒體的廣泛應用,社會網絡的規模也在不斷擴大,社會網絡受到越來越多學者的關注。復雜網絡分析是當前社會網絡研究的熱點,其中異常檢測是復雜網絡分析的重要內容。通過對復雜網絡進行異常檢測,可以及時發現異常事件及其發展趨勢,對異常事件作出快速反映,能為政府和企業合理監控網絡輿論、干預敏感話題等提供支撐,而且還可以對網絡言論進行理性的引導,建立文明和諧的網絡社會。
異常檢測是網絡演化規律分析[2]中的重要研究方向,它通過量化不同時刻網絡變化,分析網絡波動的差異,達到事件檢測的目的。現已有研究證明了通過對社會網絡拓撲結構演化規律的分析來進行異常事件檢測的有效性[3,4]。通過分析網絡拓撲結構的方法普適性最強,計算最為簡單且高效,Wu等人[5]提出了基于局部鏈接相似度的異常檢測方法,該方法利用局部相似度指標,降低異常檢測的難度;胡文斌等人[6]提出了基于鏈路預測的社會網絡事件檢測方法,該方法可以對不同網絡進行統一的評價,并以此評價指標實現異常事件的檢測;Wang等人[4]提出了面向微觀節點演化的異常事件監測方法,提高了異常檢測的敏感性和準確性。
隨著網絡規模的不斷擴大,現實社會網絡之間存在復雜的拓撲結構關系,社會網絡的高維度性導致小規模網絡異常檢測的方法不再適用于大規模網絡,檢測效率較低。因此,復雜網絡的簡化便成為了提高異常檢測效率的研究重點。現有的研究方法主要是對復雜網絡進行重構,將相似度較高的節點進行合并來降低復雜網絡的規模。基于聚類的異常檢測INCAD[7]通過概率分布進行聚類和異常檢測,確保社區不受噪聲數據的干擾,更好地區分正常和異常的行為;基于社區發現的異常檢測算法(Louvain[8]和Infomap[9])將節點分配到社區之中,然后根據局部結構的變化情況進行異常評分,最后通過評分來確定異常事件。
現已有針對網絡中節點重要性[10]和影響力[11]的研究,但目前復雜網絡的異常檢測通常是在宏觀層面對網絡演化直接進行異常檢測,識別網絡結構中罕見的子結構,而忽略異常節點對網絡演化的影響。網絡中的異常大多是由節點的異常演化導致異常網絡結構的出現,進一步改變了網絡的演化方向。基于社區發現Louvain[8]算法的異常檢測,通過不斷迭代網絡模塊度的方式,快速地對網絡進行劃分,但是該方法的網絡聚集系數較大,會導致原網絡拓撲結構的異常信息丟失,使得異常檢測的準確率不高。
針對以上問題,本文提出一種基于圖模塊度聚類的異常檢測算法(anomaly detection algorithm based on graph modularity clustering,GMC_AD)。該算法基于社會網絡復雜性對異常檢測算法的影響,對社會網絡結構進行簡化以提高異常檢測的效率,并且在量化網絡演化的過程中引入了異常節點的權重來提高檢測方法的敏感性。GMC_AD方法主要包括異常節點檢測算法(abnormal node detection algorithm,AND)、基于模塊度聚類的粗粒化算法(coarse graining algorithm based on modularity clustering,CG_MC)以及基于網絡波動性的異常檢測算法(abnormal detection algorithm based on network volatility,AD_NV)。本文的主要貢獻如下:a)量化網絡中節點的演化方向,標記異常演化的節點;b)基于社區發現算法Louvain的理論,對復雜網絡進行聚類,設置超參數來控制網絡聚集系數,實現網絡的合理簡化;c)異常檢測的方法中,引入異常節點權重,并合理調整異常節點對網絡異常影響的權重。
1 相關工作
本文異常檢測算法的研究對象為復雜社會網絡,通過改進Louvain算法,對復雜網絡進行簡化以提高異常檢測效率,在異常檢測算法中,引入異常節點加權機制,提高異常檢測的敏感性。本章主要介紹基本概念和相關算法的研究現狀。
1.1 相關概念
1.2 異常檢測相關介紹
異常檢測任務的目標是找到導致結構異常[12]發生的節點、邊或者子圖。Li等人[13]提出了一種基于標簽傳播算法的動態網絡演化聚類方法,通過迭代更新節點標簽來進行網絡劃分;Wang等人[14]提出的異常檢測(LPD)是通過對比節點實際演化和鏈路預測演化的不同,判斷節點是否異常演化;Ranjbar等人[15]提出了一種基于增量張量分解的異常檢測方法,該方法使用MDL方法收斂社團集合找出評分最低的社團,將其歸為異常;Berlingerio等人[16]提出了基于距離的網絡相似度評價指標方法,該方法通過計算相鄰時刻兩個網絡快照之間網絡的相似性,判斷是否有異常事件發生;Wang等人[4]提出NodeED方法,主要是由SimJudge和MicroFluc算法組成。SimJudge算法量化節點演化方向,確定了節點演化波動相似性計算指標。MicroFluc算法通過計算節點的相似性來得到整體網絡的相似性,量化網絡演化波動,得到網絡演化序列。NodeED方法通過比較不同時段網絡波動來判定異常發生的時段。
網絡演化過程中,新節點的產生和舊節點的消失會造成相鄰時刻網絡相似性值的劇烈變化,這對異常檢測有一定的負面影響,為了降低這種影響,引入了虛擬節點的概念,在不同快照中增加一個虛擬節點,虛擬節點與快照中所有節點存在一條邊,引入虛擬節點能夠更合理地量化網絡拓撲結構的變化。SimJudge算法提出引入虛擬節點后節點的相似性指標如表1所示,用相似性指標來量化網絡波動變化以進行異常檢測,并設置了事件檢測敏感值來衡量檢測的效果。
2 GMC_AD方法
本文設計的GMC_AD方法基于節點演化波動的事件檢測方法[4],從節點角度量化網絡演化過程,通過計算相鄰時段節點的相似性,得到對應的網絡相似性并計算網絡結構的波動值,通過比較相鄰時刻網絡的波動值來判斷是否有異常事件發生。
2.1 GMC_AD整體框架
GMC_AD算法主要包括異常節點檢測(AND)、模塊度聚類(CG_MC)和異常事件檢測(AD_NV)三個部分,如圖1所示。AND算法采用鏈路預測技術,判斷節點是否發生異常演化,進而確定異常節點,該算法首先對網絡中節點和邊的變化進行量化處理,再依據量化分析的結果檢測網絡中的異常節點,最后得到異常節點的集合。CG_MC算法是依據模塊度來進行網絡聚類,在不破壞網絡結構的前提下,通過設置聚類系數對大型網絡進行快速的結構劃分,該算法可以降低網絡規模和簡化網絡結構。AD_NV算法是基于面向節點演化波動的異常檢測方法,針對簡化后的網絡結構計算在不同相似性指標下網絡的相似值和波動值,再根據網絡波動情況來檢測異常事件。GMC_AD算法輸入是社會網絡圖序列G,輸出是異常事件發生的時段,具體步驟如下:
a)輸入網絡序列G。
b)對輸入網絡序列G執行AND算法,得到G的異常節點集合并在網絡序列G中進行標記,得到標記后的網絡序列Gs。
c)對標記異常節點集合的網絡序列Gs執行CG_MC算法,獲得簡化后的網絡序列G′。
d)對簡化的網絡序列G′執行AD_NV算法,在G′上依據不同的相似性指標計算所有時段的相似性指標值和波動值,并與閾值T進行比較,若某一時段的波動值大于閾值T,則此時段有異常事件發生;反之,則該時段無異常事件發生。
e)輸出發生異常事件的時段。
2.2 異常節點檢測AND算法
2.3 模塊度聚類CG_MC算法
社會網絡進行異常檢測時,由于當前網絡的規模比較大,會影響異常檢測算法的效率,需要對社會網絡進行簡化。當前網絡簡化的主要問題是,大多數現有的算法認為網絡中的所有節點對整個網絡的影響是一樣的。然而,在現實世界中每個個體都有不同的影響力,所以在設計模塊度聚類算法簡化網絡時增加了節點對網絡聚合影響的計算。
Louvain算法巧妙利用了模塊度的指標來衡量社區劃分的優劣,本文引入Louvain算法的設計思想改進網絡簡化算法。通過Louvain算法直接進行聚類會使網絡規模急劇減小,導致過度丟失網絡的信息,所以本文提出了改進的模塊度聚類CG_MC算法,既降低了網絡的規模,又保留了必要的網絡特征信息。
CG_MC在不破壞原社會網絡整體拓撲結構的前提下對復雜網絡進行聚類,可以在短時間內實現大規模網絡簡化。在聚類過程中,考慮了節點對網絡聚類的影響,在聚類過程中盡可能地保留原圖拓撲結構的節點信息,減少因為聚類產生的信息過度丟失。
CG_MC主要由網絡預處理和網絡結構簡化兩部分組成,對數據集網絡進行預處理,得到去除邊緣節點的網絡拓撲圖序列;在簡化網絡拓撲結構階段,運用模塊度聚類處理網絡拓撲圖,得到節點劃分,重構網絡拓撲圖,將聚類得到的節點進行融合,重構網絡。
在網絡預處理過程中,復雜網絡中的每個節點所消耗的運算資源是相同的,但是每個節點對網絡結構簡化的影響是不同的,例如孤立節點對網絡結構簡化的影響比較大,而邊緣節點對網絡結構的簡化影響就可以忽略不計。通過降低網絡密度,減少網絡中的邊緣節點,降低了對網絡結構簡化影響較小節點的資源消耗,提高了算法的效率。
對網絡序列Gs進行處理:
a)遍歷每個網絡的拓撲結構,找出邊緣節點和其鄰居節點;使用CLIQUE算法[17]搜索數據集中3點云團。
b)將邊緣節點和其鄰居節點進行融合;將得到的3點云團融合成一個新節點,云團之間只要有相連的邊,在新構建的網絡中兩個節點之間就有邊相連,邊的權重值更新為原來相連邊的權重之和。
c)重構圖網絡得到圖網絡序列G′。
初始網絡結構為圖2(a)中的圖g,重構一張網絡圖g′的過程如下:標記邊緣節點f,其鄰居節點d和3點云團(節點a、b和c);將邊緣節點f和鄰居節點d進行融合并將f的信息保存到d,節點a、b和c構成一個3點云團,將三個節點融合為一個新的節點abc并將三個節點的信息保存到新節點a中。重構網絡結構得到的圖g′如圖2(c)所示。
圖網絡序列預處理的目的是提高網絡簡化的效率,降低聚類算法的時間復雜度和空間復雜度,降低網絡結構中節點的運算資源消耗,提高后續事件檢測的效率。
網絡結構簡化模塊的主要任務是以模塊度為指標選擇局部最優的方法對復雜網絡結構進行粗粒化。為了提高異常檢測算法的效率,減少不必要的資源浪費,通過改進模塊度聚類算法實現復雜網絡的粗粒化,提高了異常檢測算法的效率。模塊度是一種評價網絡劃分好壞的度量方法,其含義是社區內節點連邊的權重之和與隨機情況下的連邊權重之和的差值,模塊度定義如式(3)所示。
下面通過經典的空手道俱樂部網絡Karate數據集來對比在Louvain和CG_MC算法下的聚類效果。Karate共有34個節點,78條邊,節點代表俱樂部的成員,邊代表成員之間的互動情況。圖3是采用Louvain算法聚類后得到的粗粒化網絡,在經過Louvain算法的處理后變成了6個節點、9條邊,這導致網絡的結構發生較大的變化,而且在粗粒化的過程中可能會使網絡的關鍵節點和邊信息丟失,對于后續的異常事件檢測的敏感性和準確率產生了不利影響。圖4是采用CG_MC算法得到的聚類結果,Karate網絡經過CG_MC算法處理后得到20個節點、47條邊的粗粒化網絡,為后續的異常事件檢測工作提供了便利,簡化后的網絡去除了一些無關節點,優化了數據網絡結構,減少了大量的無效計算,提高了異常事件檢測的效率。通過聚類實驗結果可以看出,本文提出的CG_MC算法可以保證Karate數據集在經過簡化后還可以很好地保留原數據集網絡的拓撲結構信息。
2.4 異常檢測AD_NV方法
3 實驗分析
實驗通過在相同數據集上進行實驗對比異常檢測的敏感值。
3.1 數據集和實驗環境介紹
本文采用的三個數據集分別是VAST[18]、Email-EU[19]以及ENRON[20],都是真實無向時序社會網絡。實驗環境為Intel CoreTMi7-4720HQ CPU @2.60 GHz,操作系統Microsoft Windows 10,編程語言Python 3.7。
3.2 參數分析
3.3 消融實驗
本文在異常檢測算法中引入異常節點的權重來增加算法的敏感性,并對復雜網絡數據集進行簡化處理,設置以下四種方法進行了對照實驗:原始網絡(M1)、引入異常節點權重的網絡(M2)、簡化網絡(M3)和引入異常節點權重的簡化網絡(M4)。M1方法是直接對原數據集網絡進行異常檢測;M2是在M1基礎之上引入異常節點的權重;M3方法是對原數據集網絡化簡,降低復雜網絡的規模;M4方法是對原數據集網絡化簡和引入異常節點的權重。最后,計算基于八個相似性指標在四種方法下的波動值和異常檢測的敏感值,并對M1和M4方法的運行時間進行比較,分析網絡簡化和異常節點權重對事件檢測的效率影響。用四種方法對三個數據集在八個指標下進行異常檢測,通過觀察波動值的變化,M1~M4方法都可以檢測出異常事件,開始時網絡波動值比較穩定,異常事件發生后,網絡的波動值明顯增大,表明有異常事件發生。M4方法對復雜網絡進行了簡化處理并引入了異常節點的權重,相較于M1方法,網絡平穩時段波動值小,網絡的變化幅度較小;異常事件發生后,網絡的波動值增大更明顯,實驗結果表明了降低數據集網絡規模再進行異常事件檢測的有效性。實驗結果如圖5~7所示,圖中數據都進行歸一化處理。
圖5是VAST數據集的網絡演化波動圖,該數據集異常事件發生在第6個時段。圖6是DEPT部門數據集的網絡演化波動圖,該數據集異常事件發生在第13和14階段。圖7是ENRON數據集,本文選取單一突發事件的階段,異常事件發生在第7個時段。實驗結果顯示,對以上三個數據集,四種方法在八個指標下的網絡波動值在異常事件發生的時段都比較高,都能準確有效地檢測出異常事件。
VAST數據集中網絡結構較為簡單,節點和邊的比例較小,所以在八個指標下的網絡波動值的變化基本一致。對于DEPT和ENRON數據集,邊的數量比較多,在沒有異常事件發生的時段,網絡波動應該較為平穩,實驗結果顯示在CNS、PAS和AAS指標下網絡波動值較小,而在HPIS和LNHS指標下的網絡波動值較大。說明復雜的相似性計算指標,如HPIS和LNHS,較難適應規模較大的網絡,網絡波動值穩定性較差,事件檢測效果不佳;簡單的相似性指標,如PAS、CNS和AAS,網絡波動值穩定性好,較好地量化了網絡演化,事件檢測效果更好。
3.4 異常檢測算法效率分析
通過對數據集原網絡和簡化后網絡異常檢測算法運行時間的實驗結果分析可知,三個數據網絡經過模塊度聚類處理后,異常檢測算法的效率都得到了提高,其中PAS指標下異常檢測效率最高,相比CNS和AAS,PAS只需要自身節點度的信息,不需要鄰域節點的信息,所以PAS計算復雜性最小,檢測效率最高。由于網絡經過CG_MC算法粗粒化處理,網絡規模得到了降低,所以采用粗粒化的M4方法的整體運行時間較短。對比三個數據集在簡化的網絡序列和原網絡序列的異常檢測運行時間可知,采用粗粒化處理后的圖網絡結構進行異常檢測,算法運行時間明顯減少,算法的效率得到提高。
3.5 異常檢測敏感值分析
計算VAST、DEPT和ENRON數據集在M1、M4和SCAD方法下八種指標的異常檢測敏感值如表4所示。通過對比原圖和引入異常節點權重的簡化圖的異常檢測敏感值發現,在三個數據集中,CNS、PAS和AAS三個指標的異常事件檢測的敏感值最高,說明CNS、PAS和AAS三個指標可以很好地量化網絡的變化,并且在M4方法下的敏感值最高,說明對圖網絡序列進行模塊度聚類不會過分丟失網絡拓撲結構的信息,并且引入異常節點的權重會提高異常檢測算法的敏感性。
NodeED方法在SimJudge和MicroFluc的基礎之上,從節點角度有效地分析真實網絡演化過程,提升了異常檢測的敏感性。SCAD算法設計了通過對不同時段網絡進行聚類,再對聚類后的網絡進行異常檢測,提升了異常檢測的效率和敏感性。NodeED方法直接對原始網絡進行異常檢測,需要較多的算力資源,算法復雜度較高。SCAD算法的聚類過程可以有效降低算法復雜度,但存在過度丟失網絡拓撲結構信息的問題,有時會造成異常檢測的敏感性不高。本文GMC_AD方法在深入分析以上算法的基礎上,通過粗粒化復雜網絡來降低異常檢測資源消耗的同時,還通過聚類系數來實現對粗粒化網絡規模的控制,避免網絡拓撲結構信息的過度丟失,并通過異常節點加權機制來提高異常檢測的敏感性和準確性。
通過與NodeED、SCAD算法進行對比實驗,GMC_AD算法相較于NodeED算法,在所有的相似性指標下異常檢測的敏感值均有不同程度的提升,相較于SCAD算法,GMC_AD算法在每個指標下的異常檢測敏感值都是正值,可以檢測出異常,因此GMC_AD算法的異常檢測更加穩定。在VAST數據集中,除了在PAS指標下GMC_AD的敏感值略低于SCAD算法的敏感值,在其他相似性指標下,GMC_AD的異常檢測敏感值相比NodeED、SCAD算法均有不同程度的提升,并且敏感性最高。在DEPT數據集上,GMC_AD在每個相似性指標下得到的異常檢測敏感值相比NodeED算法都有不同程度的提升;相比SCAD算法,GMC_AD在不同相似性指標下異常檢測的敏感值相對穩定,具有更好的檢測效果。在ENRON數據集中,GMC_AD算法得到的異常檢測敏感值都高于NodeED算法,在SAS、JAS、SOS、HPIS和LNHS指標下得到的異常檢測敏感值相比SCAD算法都有提升,在LNHS指標下SCAD算法計算的敏感值出現負值,即沒有檢測出異常,說明SCAD算法存在穩定性差的問題,而GMC_AD算法則可以檢測到異常,說明GMC_AD異常檢測穩定性更好。
綜上說明本文提出的基于圖模塊度聚類的異常檢測方法,在引入異常節點加權機制和網絡簡化的基礎之上,對識別異常事件是有效的,異常節點加權機制提高了異常節點對異常事件的權重,提高了異常檢測算法的敏感性,同時基于圖模塊度聚類的簡化方法有效降低了異常事件檢測算法的時間復雜度和空間復雜度,提高了異常檢測算法的效率。
4 結束語
針對當前復雜網絡規模較大,導致異常檢測算法檢測效率不高的問題,本文設計了一種基于圖模塊度聚類的異常檢測算法GMC_AD。該方法首先通過降低網絡規模來簡化網絡,在簡化后的網絡上進行異常事件檢測,再通過比較相鄰時刻網絡的波動值來判斷是否有異常事件發生,該算法有效提高了事件檢測的效率和準確率。通過在VAST、Email-EU和ENRON數據集上對算法進行驗證,表明了GMC_AD算法對復雜網絡進行異常檢測,具有高效、快速和準確的特點。本文方法對單一異常事件的檢測效果表現良好,但難以檢測出連續異常事件。設計發生連續異常事件時網絡波動值的高效量化方法,并解決在這種情況下網絡波動值難以準確表示網絡演化的問題是未來的主要研究方向。
參考文獻:
[1]CNNIC發布第49次《中國互聯網絡發展狀況統計報告》 [EB/OL]. (2022-07-13).https//www.cnnic.cn/n4/2022/0713/c33-206.html. (CNNIC releases the 49th statistical report on the development of China’s Internet [EB/OL]. (2022-07-13).https//www.cnnic.cn/n4/2022/0713/c33-206.html.)
[2]富坤,劉琪,禚佳明,等. 基于空間尺度粗粒化的異常檢測方法 [J]. 計算機應用研究,2022,39(7):2068-2075. (Fu Kun,Liu Qi,Zhuo Jiaming,et al. Abnormal detection method based on spatial scale coarse-grained [J]. Application Research of Computers,2022,39(7):2068-2075.)
[3]張金柱,胡一鳴. 利用鏈路預測揭示合著網絡演化機制 [J]. 情報科學,2017,35(7): 75-81. (Zhang Jinzhu,Hu Yiming. Uncovering the mechanism of co-authorship network evolution by link prediction [J]. Information Science,2017,35(7): 75-81.)
[4]Wang Huan,Hu Wenbin,Qiu Zhenyu. Nodes’evolution diversity and link prediction in social networks[J]. IEEE Trans on Knowledge and Data Engineering,2017,29(10): 2263-2274.
[5]Wu Yuzhu,Zhang Qianwen,Xie Jinkui. Coarsening networks based on local link similarity for community detection[C]//Proc of the 42nd IEEE Annual Computer Software and Applications Conference.Pisca-taway,NJ:IEEE Press,2018:317-326.
[6]胡文斌,彭超,梁歡樂,等. 基于鏈路預測的社會網絡事件檢測方法 [J]. 軟件學報,2015,26(9): 2339-2355. (Hu Wenbin,Peng Chao,Liang Huanle,et al. Event detection method based on link prediction for social network evolution [J]. Journal of Software,2015,26(9): 2339-2355.)
[7]Guggilam S,Zaidi S M A,Chandola V,et al. Integrated clustering and anomaly detection (INCAD) for streaming data [C]//Proc of International Conference on Computational Science. Cham: Springer,2019: 45-59.
[8]Blondel V D,Guillaume J L,Lambiotte R,et al. Fast unfolding of communities in large networks [J]. Journal of Statistical Mecha-nics: Theory and Experiment,2008,30(2): 155-168.
[9]Rosvall M,Bergstrom C T. Maps of random walks on complex networks reveal community structure [J]. Proceedings of the National Academy of Sciences,2008,105(4): 1118-1123.
[10]羅浩,閆光輝,張萌,等. 融合多元信息的多關系社交網絡節點重要性研究 [J]. 計算機研究與發展,2020,57(5): 954-970. (Luo Hao,Yan Guanghui,Zhang Meng,et al. Research on the importance of multi relationship social network nodes with multiple information fusion [J]. Journal of Computer Research and Development,2020,57(5): 954-970.)
[11]江淼淼,孫更新,賓晟. 多關系社交網絡中社團結構發現算法 [J]. 計算機科學與探索,2019,13(7): 1134-1144. (Jiang Miaomiao,Sun Gengxin,Bin Sheng. Community structure discovery algorithm in multi relationship social networks [J]. Journal of Frontiers of Computer Science and Technology,2019,13(7): 1134-1144.)
[12]陳波馮,李靖東,盧興見,等. 基于深度學習的圖異常檢測技術綜述 [J]. 計算機研究與發展,2021,58(7): 1436-1455. (Chen Bofeng,Li Jingdong,Lu Xingjian,et al. Graph abnormal detection techniques base on deep learning [J]. Computer Research and Development,2021,58(7): 1436-1455.)
[13]Li Shibao,Huang Junwei,Zhang Zhigang,et al. Similarity-based future common neighbors model for link prediction in complex networks[J]. Scientific Reports,2018,8(1): 1-11.
[14]Wang Huan,Wu Jia,Hu Wenbin,et al. Detecting and assessing anomalous evolutionary behaviors of nodes in evolving social networks [J]. ACM Trans on Knowledge Discovery from Data,2019,13(1): 1-24.
[15]Ranjbar V,Salehi M,Jandaghi P,et al. QANet: tensor decomposition approach for query-based anomaly detection in heterogeneous information networks[J]. IEEE Trans on Knowledge and Data Engineering,2019,31(11): 2178-2189.
[16]Berlingerio M,Koutra D,Eliassi-Rad T,et al. NetSimile: a scalable approach to size-independent network similarity[EB/OL]. (2012). https://arxiv.org/abs/1209. 2684.
[17]林鵬,陳曦,龍鵬飛,等. 一種改進的CLIQUE算法及其并行化實現 [J]. 計算機技術與自動化,2018,37(4): 49-54. (Lin Peng,Chen Xi,Long Pengfei,et al. An improved CLIQUE algorithm and parallelization implementation [J]. Computing Technology and Automation,2018,37(4): 49-54.)
[18]Grinstein G,Plaisant C,Laskowski S,et al. VAST 2008 challenge: introducing mini-challenges [C]// Proc of IEEE Symposium on Visual Analytics Science and Technology. Piscataway,NJ: IEEE Press,2008: 195-196.
[19]email-Eu dataset[EB/OL]. (2022-10-21). https://www. cs. cornell. edu/~arb/data/email-Eu/.
[20]http://www. cs. cmu. edu[EB/OL].