999精品在线视频,手机成人午夜在线视频,久久不卡国产精品无码,中日无码在线观看,成人av手机在线观看,日韩精品亚洲一区中文字幕,亚洲av无码人妻,四虎国产在线观看

404 Not Found


nginx
404 Not Found

404 Not Found


nginx
404 Not Found

404 Not Found


nginx
404 Not Found

404 Not Found


nginx
404 Not Found

404 Not Found


nginx

基于對抗多關(guān)系圖神經(jīng)網(wǎng)絡(luò)的機(jī)器賬號檢測

2023-10-24 14:53:00楊英光李陽陽劉弋鋒謝海永
中文信息學(xué)報 2023年7期
關(guān)鍵詞:檢測模型

楊英光,李陽陽,彭 浩,劉弋鋒,謝海永

(1. 中國科學(xué)技術(shù)大學(xué) 網(wǎng)絡(luò)空間安全學(xué)院,安徽 合肥 230026;2. 中國電子科技集團(tuán)公司電子科學(xué)研究院 社會安全風(fēng)險感知與防控大數(shù)據(jù)應(yīng)用國家工程實驗室,北京 100041;3. 北京航空航天大學(xué) 網(wǎng)絡(luò)空間安全學(xué)院,北京 100191;4. 網(wǎng)絡(luò)文化內(nèi)容認(rèn)知與檢測文化和旅游部重點實驗室,安徽 合肥 230026)

0 引言

隨著互聯(lián)網(wǎng)上多種社交平臺的迅速發(fā)展,在社交網(wǎng)絡(luò)海量的用戶中出現(xiàn)了大量機(jī)器賬號,這些機(jī)器賬號大多數(shù)由程序自動控制。其中一部分機(jī)器賬號存在惡意行為,它們常在社交平臺中發(fā)布帶有潛在意圖的誘導(dǎo)內(nèi)容和不良信息,用以達(dá)到竊取用戶隱私、實施網(wǎng)絡(luò)釣魚和誤導(dǎo)網(wǎng)絡(luò)輿論等惡意目的[1]。惡意機(jī)器賬號在數(shù)量上增長的同時,在技術(shù)上也不斷迭代[2],2016年以來已經(jīng)發(fā)現(xiàn)了第三代機(jī)器賬號[3],這些賬號由于人為操作和自動化的混合程度加深,能夠從其他真實賬號盜取信息,利用人工智能技術(shù)生成高可信的文本或圖片,其行為更像真實人類賬號,越加難以分辨惡意機(jī)器賬號和真實用戶賬號。因此針對惡意機(jī)器賬號的檢測的研究成為了一個極其重要的課題[4]。

早期檢測機(jī)器賬號的方法是通過特征工程抽取賬戶元信息的特征,使用傳統(tǒng)的機(jī)器學(xué)習(xí)模型檢測機(jī)器賬號。但這些方法需要繁重的特征工程,并且主要依賴于賬號的昵稱、好友數(shù)量等個人特征作為分類的依據(jù),無法面對偽裝良好的機(jī)器賬號。基于神經(jīng)網(wǎng)絡(luò)的方法進(jìn)一步分析了推文內(nèi)容,聯(lián)合賬戶元信息進(jìn)行檢測,但由于日益成熟的對抗文本生成等內(nèi)容偽裝技術(shù),此類方法在社交平臺中檢測的效果有限。社交網(wǎng)絡(luò)中存在多種社交關(guān)系,由社交關(guān)系組成的圖結(jié)構(gòu)中包含著豐富的語義信息,這催生了圖神經(jīng)網(wǎng)絡(luò)應(yīng)用于機(jī)器賬號檢測的相關(guān)研究[5-8]。圖神經(jīng)網(wǎng)絡(luò)(GNN)能夠?qū)D結(jié)構(gòu)作為輸入,提取出包含了語義信息的圖嵌入向量,用于節(jié)點分類,提升了對機(jī)器賬號的檢測能力。但是這些基于GNN的檢測方法[5-8]忽略了機(jī)器賬號在圖結(jié)構(gòu)中的偽裝行為。例如,惡意機(jī)器賬號通過與正常用戶建立關(guān)系即添加邊來對圖結(jié)構(gòu)進(jìn)行擾動[9]來降低機(jī)器賬號自身的可疑性。因此,如果不加選擇地聚合節(jié)點在圖中所有鄰居的特征得到圖嵌入向量,或者聚合隨機(jī)選擇的鄰居的特征得到圖嵌入向量,會降低圖嵌入向量的表達(dá)能力,也會降低對機(jī)器賬號檢測的召回率。此外,現(xiàn)有的基于GNN的機(jī)器賬號檢測方法都依賴于從一開始就構(gòu)建好的靜態(tài)圖結(jié)構(gòu),無法在訓(xùn)練時動態(tài)地更新圖結(jié)構(gòu),這將導(dǎo)致節(jié)點無法聚合未直接相連的其他相似節(jié)點,導(dǎo)致對潛在的機(jī)器賬號檢測能力不足。再者,這些研究[5-8]基于同種關(guān)系構(gòu)建的圖聚合節(jié)點信息得到圖嵌入向量,進(jìn)而檢測機(jī)器賬號,沒有考慮到節(jié)點間的多種不同關(guān)系所能提供的更加豐富的語義信息,降低了檢測效果。

為了能夠在訓(xùn)練圖神經(jīng)網(wǎng)絡(luò)過程中選擇節(jié)點的相似鄰居的特征進(jìn)行聚合,提高圖嵌入向量的表達(dá)能力,同時動態(tài)修改圖結(jié)構(gòu)來聚合潛在的相似節(jié)點,增強(qiáng)對潛在相似節(jié)點的聚合能力,進(jìn)而提高對機(jī)器賬號檢測的召回率,本文設(shè)計三個模塊來增強(qiáng)GNN的檢測能力:

(1) 鄰居選擇模塊用來選擇與中心節(jié)點相似的鄰居節(jié)點。將節(jié)點特征輸入多層感知機(jī)中進(jìn)行打分,計算出節(jié)點與其鄰居的相似度。根據(jù)閾值,篩選出相似度較高的鄰居節(jié)點,從而有選擇地聚合鄰居節(jié)點的特征,去除不相似鄰居節(jié)點對中心節(jié)點的影響;

(2) 使用生成對抗網(wǎng)絡(luò)模塊不斷更新圖結(jié)構(gòu)。為兩個在圖中沒有直接相連的潛在相似節(jié)點增加連接,在鄰居選擇階段就可以將這些潛在相似節(jié)點作為鄰居,聚合這些相似節(jié)點的特征,從而增強(qiáng)模型對潛在相似節(jié)點的聚合能力;

(3) 根據(jù)用戶間不同的交互類型,建立多個關(guān)系圖,聚合鄰居信息。在構(gòu)建的多關(guān)系圖中,首先聚合每一個關(guān)系圖中根據(jù)相似度選出的鄰居節(jié)點,得到節(jié)點在該關(guān)系圖下的嵌入向量。然后將多種關(guān)系下分別得到的嵌入向量進(jìn)行聚合,得到節(jié)點最終的嵌入向量。由于多關(guān)系圖能夠提供豐富的語義信息,聚合了含有豐富語義信息的嵌入向量,大大提高了其本身的表達(dá)能力。最后將含有豐富語義信息、表達(dá)能力更精確的圖嵌入向量輸入分類器中提高檢測方法的召回率。

本文將上述三個模塊與GNN結(jié)合在一起,命名為對抗多關(guān)系圖神經(jīng)網(wǎng)絡(luò)模型AdversarialMulti-RelationGraphNeuralNetwork(ADMR-GNN),并在兩個流行的數(shù)據(jù)集上做了實驗。最好的情況下,在Yelp數(shù)據(jù)集[10]中AUC值提升了24%,Recall值提升了13%。在Amazon數(shù)據(jù)集[11]中AUC值提升了9%,Recall值提升了4%。

1 相關(guān)工作

1.1 有監(jiān)督方法

目前使用監(jiān)督學(xué)習(xí)的機(jī)器賬號檢測方法主要從賬戶元信息[12]、社交網(wǎng)絡(luò)拓?fù)鋄13]和內(nèi)容[1]中提取特征。Botometer[14-15]方案利用隨機(jī)森林算法,提取特征訓(xùn)練七個不同的分類器,在十倍交叉驗證下的AUC值為0.95。文獻(xiàn)[16]用貝葉斯算法做機(jī)器賬號檢測。文獻(xiàn)[17]用卷積神經(jīng)網(wǎng)絡(luò)和長短時記憶網(wǎng)絡(luò)聯(lián)合抽取文本特征和時間序列信息進(jìn)行機(jī)器賬號檢測。文獻(xiàn)[18]將機(jī)器賬號檢測視為單分類問題,選取了5個單分類檢測算法,對比了不同算法的檢測效果。

1.2 無監(jiān)督方法

也有一些研究使用無監(jiān)督方法,這些方法對于跨數(shù)據(jù)集檢測的魯棒性更好,并且更適合發(fā)現(xiàn)機(jī)器賬號的協(xié)同作用。因為單獨(dú)考慮賬號時,賬戶可能并不會表現(xiàn)出與真實賬號有明顯差異,從而被有監(jiān)督方法忽略。文獻(xiàn)[19]通過檢測內(nèi)容中重復(fù)嵌入的URL鏈接發(fā)現(xiàn)機(jī)器賬號群組。文獻(xiàn)[20]提出使用馬爾可夫集群算法來識別機(jī)器賬號群組。文獻(xiàn)[21]使用StreamKM++和DenStream兩種聚類算法聯(lián)合檢測機(jī)器賬號,達(dá)到了100%的查全率。

1.3 基于圖的方法

近幾年有研究使用基于圖的方法進(jìn)行機(jī)器賬號檢測。文獻(xiàn)[22]使用異質(zhì)圖神經(jīng)網(wǎng)絡(luò)進(jìn)行機(jī)器賬號檢測。FdGars[5]構(gòu)建了多關(guān)系圖,運(yùn)用圖神經(jīng)網(wǎng)絡(luò)聚合鄰居信息。Player2Vec[23]根據(jù)數(shù)據(jù)集中節(jié)點間存在的關(guān)系建立多種同構(gòu)圖,使用圖神經(jīng)網(wǎng)絡(luò)在每種關(guān)系下聚合同構(gòu)圖中的鄰居信息,并采用注意力機(jī)制來聚合多個關(guān)系圖下的節(jié)點的圖嵌入向量。以上基于圖的檢測方法在聚合階段沒有對鄰居進(jìn)行篩選,聚合了不相似鄰居的信息,使得檢測性能下降。此外,上述方法都依賴于靜態(tài)圖結(jié)構(gòu),無法聚合不存在連接的潛在相似節(jié)點,無法進(jìn)一步提升檢測性能。

本文中對抗多關(guān)系圖神經(jīng)網(wǎng)絡(luò)模型(ADMR-GNN)也使用了基于圖的檢測方法,但為了克服上述基于圖的檢測方法的缺點,本方法構(gòu)建多關(guān)系圖,利用多關(guān)系圖檢測機(jī)器賬號,保留了多關(guān)系圖的表征能力。篩選出相似度較高的鄰居節(jié)點,從而有選擇地聚合鄰居節(jié)點的特征,去除不相似鄰居節(jié)點對中心節(jié)點的影響,并使用生成對抗網(wǎng)絡(luò)動態(tài)的更新圖結(jié)構(gòu),從而能夠更好地聚合潛在相似的鄰居節(jié)點,加強(qiáng)了圖嵌入向量的表征效果。

2 問題定義

本文關(guān)注于檢測社交平臺中存在的機(jī)器賬號,這些賬號都受控于自動化程序,自動地模擬用戶行為,例如,①水軍賬號[24-25],這類賬號能夠在各類平臺中,對于商品、服務(wù)、推特等發(fā)表大量評論,從而潛移默化地影響用戶對商品和服務(wù)的評價。②社交機(jī)器人賬號[26],別有用心地傳播新聞和觀點,發(fā)布具有某些意圖的內(nèi)容來影響公眾輿論,這些賬號通過模仿用戶的觀點和行為、通過回復(fù)或者提及用戶等交互操作來偽裝自己。

2.1 異質(zhì)信息網(wǎng)絡(luò)與多關(guān)系圖

異質(zhì)信息網(wǎng)絡(luò)是一個圖G=(V,ε),V和ε分別代表圖G中的節(jié)點集合V={v1,…,vn}和邊集合ε={ε1,…,εn},且節(jié)點和邊的類型之和‖TV‖+‖Tε‖≥3,滿足這樣條件的圖G我們稱其為異質(zhì)信息網(wǎng)絡(luò)。

2.2 多關(guān)系圖下的機(jī)器賬號檢測

對于社交平臺以及其他平臺中的賬號,我們可以將賬號建模成圖中的節(jié)點v,把賬號之間的交互操作如回復(fù),抽取成關(guān)系r,從而將節(jié)點互相連接起來,建模為多關(guān)系圖G。節(jié)點v的標(biāo)簽yv∈{0,1}∈Y,其中,0代表節(jié)點為正常賬號,1代表節(jié)點為機(jī)器賬號。模型對每個節(jié)點從多關(guān)系圖中聚合其他鄰居的信息得到圖嵌入向量,根據(jù)定義的損失函數(shù)得到損失,反向傳播更新模型參數(shù),最后使用訓(xùn)練出的模型對圖中沒有標(biāo)簽的節(jié)點進(jìn)行分類。

3 對抗多關(guān)系圖神經(jīng)網(wǎng)絡(luò)模型

本文基于對抗多關(guān)系圖神經(jīng)網(wǎng)絡(luò)模型對機(jī)器賬號進(jìn)行檢測,模型圖如圖1所示。對于一個中心節(jié)點,我們需要聚合與中心節(jié)點在不同關(guān)系下與中心節(jié)點相連接的鄰居節(jié)點,從而得到可以供下游分類任務(wù)進(jìn)行分類的圖嵌入向量。首先我們使用訓(xùn)練好的生成對抗網(wǎng)絡(luò)模塊來判別圖中節(jié)點對是否存在連接關(guān)系,從而更新圖結(jié)構(gòu)。然后根據(jù)節(jié)點的相似度以及閾值選出將被聚合的鄰居節(jié)點,在同種關(guān)系聚合層,得到中心節(jié)點在單一關(guān)系下的嵌入向量。在多種關(guān)系聚合層,聚合中心節(jié)點在不同關(guān)系下的嵌入向量得到節(jié)點最終的表征向量供分類器分類。

圖1 對抗多關(guān)系圖神經(jīng)網(wǎng)絡(luò)模型圖

3.1 基于生成對抗網(wǎng)絡(luò)的連接更新

如圖2所示,我們從圖中采樣成對相連的節(jié)點(v,u),用源節(jié)點v訓(xùn)練生成器,生成節(jié)點v的虛假目標(biāo)節(jié)點vt,同時將節(jié)點對(v,u)和(v,vt)輸入到判別器進(jìn)行訓(xùn)練。然后我們從圖中采樣節(jié)點對輸入判別器,推理當(dāng)前采樣節(jié)點對是否相似,即是否應(yīng)該存在連接關(guān)系,用判別器的推理結(jié)果更新圖結(jié)構(gòu)。

圖2 生成對抗網(wǎng)絡(luò)模塊

3.1.1 生成器

生成對抗網(wǎng)絡(luò)中的生成器G的目標(biāo)是根據(jù)從圖中取樣得到的源節(jié)點生成接近于真實的目標(biāo)節(jié)點。即,當(dāng)給定了一個源節(jié)點v∈V,生成器G的目標(biāo)就是生成虛假的目標(biāo)鄰居節(jié)點vt,節(jié)點vt應(yīng)該盡可能地接近真實存在的節(jié)點。為了能夠?qū)崿F(xiàn)這個目標(biāo),我們提出使用一個潛在變量z~pz(z)與源節(jié)點相加來作為生成器的輸入,并使用多層感知機(jī)來實現(xiàn)生成器G,如式(1)所示。

其中,f使用多層感知機(jī)實現(xiàn),θf是f的參數(shù)。變量z來自于高斯分布,如式(2)所示。

其中,zv∈d×1,d等于源節(jié)點的特征向量維度。生成器G的目標(biāo)是通過生成足夠接近真實的虛假樣例欺騙判別器D,為了達(dá)到這個目標(biāo),生成器的損失函數(shù)如式(3)所示。

其中,vt就是源節(jié)點v的虛假鄰居節(jié)點,vt通過生成器G生成。判別器D輸出的是輸入節(jié)點對存在真實連接的可能性,生成器的參數(shù)θG可以通過最小化LG進(jìn)行優(yōu)化。

3.1.2 判別器

判別器D試著分辨從圖中采樣的源節(jié)點和鄰居節(jié)點對(v,u)和源節(jié)點與生成器G生成的虛假鄰居節(jié)點對(v,vt)。對于生成器G生成質(zhì)量差的鄰居節(jié)點給出與生成器G期望得到的相反標(biāo)簽,就會提高損失值,為了降低損失值,生成器只能不斷優(yōu)化生成鄰居節(jié)點的質(zhì)量,這樣判別器D就強(qiáng)制G生成接近真實的虛假鄰居節(jié)點,同時增強(qiáng)自身對于源節(jié)點和鄰居節(jié)點是否存在真實連接的判別力。對于一個給定的節(jié)點對(v,u),D將輸出節(jié)點v與u存在連接的可能性。針對這個目的,我們定義判別器D的函數(shù)為Sigmoid,如式(4)所示。

(4)

其中,f使用多層感知機(jī)實現(xiàn),θf是f的參數(shù)。節(jié)點對的采樣形式有以下兩種。

(1)正例采樣: 即采樣的節(jié)點對(v,u),在圖中是實際存在邊連接的,這樣的節(jié)點對被稱為正例,此時判別器D的損失函數(shù)如式(5)所示。

(2)負(fù)例采樣: 對于一個給定的節(jié)點v∈V,vt表示為v的虛假鄰居節(jié)點vt~G(v;θG),這樣的節(jié)點對(v,vt)稱為負(fù)例采樣,此時判別器D的損失函數(shù)如式(6)所示。

我們將上述兩部分損失函數(shù)合并來訓(xùn)練判別器,通過最小化LD來優(yōu)化判別器的參數(shù)θD,損失函數(shù)如式(7)所示。

3.1.3 連接更新

3.2 基于相似度的鄰居選擇

為了能夠?qū)︵従佑兴Y選,我們需要對節(jié)點之間的相似度進(jìn)行度量。為了實現(xiàn)這一點,受LAGCN[27]的啟發(fā),我們在模型的每一層中使用一個單層的多層感知機(jī),來預(yù)測兩個節(jié)點的相關(guān)性,作為兩個節(jié)點相似度的度量標(biāo)準(zhǔn)。

(8)

每一層都有一個多層感知機(jī)進(jìn)行相似性度量。多層感知機(jī)f(l)的輸入就是l-1層節(jié)點的嵌入向量,第一層的輸入是節(jié)點的特征向量,將多層感知機(jī)的輸出輸入到非線性激活函數(shù)中,求其L1范數(shù)。然后與1做差即可得到相似性度量。

為了能夠訓(xùn)練多層感知機(jī),優(yōu)化模型參數(shù),我們定義第l層的多層感知機(jī)的損失函數(shù)為交叉熵?fù)p失函數(shù),如式(10)所示。

(10)

3.3 關(guān)系聚合

(11)

3.4 損失函數(shù)

其中,yv∈{0,1}是節(jié)點v的標(biāo)簽。將相似性度量的損失函數(shù)式(10)聯(lián)立起來,定義最終的損失函數(shù)如式(14)所示。

3.5 算法描述

首先初始化參數(shù),設(shè)定閾值,然后在迭代樣本的時候首先用式(7)和式(8)訓(xùn)練生成對抗網(wǎng)絡(luò),如果迭代次數(shù)超過T就可以使用判別器進(jìn)行推理,更新圖結(jié)構(gòu);然后用式(9)計算節(jié)點間的相似度,挑選鄰居;然后用式(11)計算同種關(guān)系節(jié)點的圖嵌入向量,以及用式(12)計算多種關(guān)系下的圖嵌入向量;最后用式(14)計算相似度損失和GNN損失,更新參數(shù)值。

算法1: ADMR-GNN: 對抗多關(guān)系圖神經(jīng)網(wǎng)絡(luò)輸入: 節(jié)點的特征向量,標(biāo)簽和一個多關(guān)系圖G={V,X,{εr}|Rr=1,Y};層數(shù)L;批量大小B;迭代次數(shù)E;GAN訓(xùn)練次數(shù)T參數(shù){S(l)(·,·)}|Ll=1;閾值TD=0.5,T (l)s=0.5}|Ll=1;參數(shù){AGG(l)r}|Rr=1,?l∈{1,…,L};參數(shù){AGG(l)r}|Rr=1,?l∈1,…,L 。輸出: 嵌入向量hLv、機(jī)器賬號概率pv, ?v∈Vtrainfor e=1,…,E do //訓(xùn)練ADMR-GNN for b=1,…,B do for r=1,…,R do LD←式(7) //訓(xùn)練 D LG←式(3) //訓(xùn)練 G if e>T 更新圖 //推理 for r=1,…,R do S(l)v,v' ←式(9) 鄰居選擇 hlv,r←式(11) //同關(guān)系聚合 hlv←式(12) //多關(guān)系聚合

4 實驗設(shè)置及結(jié)果

4.1 數(shù)據(jù)集

表1展示了數(shù)據(jù)集的統(tǒng)計信息。我們使用Yelp評論數(shù)據(jù)集[10]和Amazon評論數(shù)據(jù)集[11]來研究基于GNN的機(jī)器賬號檢測問題。Yelp數(shù)據(jù)集中包含了Yelp過濾(垃圾郵件)和推薦(合法)的對酒店和飯店的評論,Amazon數(shù)據(jù)集包含了用戶賬號對平臺中樂器產(chǎn)品的評論。這兩個數(shù)據(jù)集中都存在機(jī)器賬號,并可以構(gòu)建出有意義的多關(guān)系圖,為驗證我們提出的檢測方法的有效性提供支撐。我們手動為Yelp數(shù)據(jù)集中的賬號抽取了32個特征,為Amazon 數(shù)據(jù)集中的賬號抽取了25個特征。

表1 數(shù)據(jù)集統(tǒng)計數(shù)

4.2 多關(guān)系圖構(gòu)建

Yelp數(shù)據(jù)集中我們將評論(R)作為圖中的節(jié)點,并設(shè)計了3個關(guān)系。

(1)R-U-R: 連接來自一個相同用戶(U)的評論;

(2)R-S-R: 連接兩個評分?jǐn)?shù)(S)相同的評論;

(3)R-M-R: 連接兩個在同一個月(M)中對相同產(chǎn)品的評論。

Amazon數(shù)據(jù)集中我們將用戶作為節(jié)點,并設(shè)計了三個關(guān)系構(gòu)建多關(guān)系圖:

(1)U-P-U: 連接對同一個產(chǎn)品評論過的用戶;

(2)U-S-U: 連接兩個在同一周中有相同打分值的用戶;

(3)U-V-U: 連接兩個評論有高度相似性的兩個用戶。

4.3 對比方法

為了驗證我們方法的有效性,我們選擇了多個圖神經(jīng)網(wǎng)絡(luò)方法進(jìn)行對比。我們使用GCN[28]、GAT[29]、GraphSAGE[30]作為圖神經(jīng)網(wǎng)絡(luò)的通用模型的代表;并且分別選擇了Player2Vec[23]、SemiGNN[31]、GeniePath[32]、GraphConsis[6]四種時下最先進(jìn)的基于圖神經(jīng)網(wǎng)絡(luò)的欺詐性機(jī)器賬號檢測方法進(jìn)行對比。以半監(jiān)督的方式進(jìn)行訓(xùn)練及檢測,GCN、GAT、GraphSAGE、GraphConsis模型運(yùn)行在同構(gòu)圖中,此時不區(qū)分不同的關(guān)系,將表1中的關(guān)系合并在一起構(gòu)建出一個同構(gòu)圖來分別訓(xùn)練這四個模型。

4.4 實驗設(shè)置

我們使用小批量(Mini-Batch)訓(xùn)練的方式訓(xùn)練ADMR-GNN和其他模型。設(shè)定嵌入向量維度為64,Yelp數(shù)據(jù)集中批量大小為1 024;Amazon數(shù)據(jù)集中批量大小為256;總層數(shù)為1、學(xué)習(xí)率(Learning Rate)為0.01;設(shè)定鄰居選擇的閾值為0.5,設(shè)定圖結(jié)構(gòu)更新的閾值為0.5。

4.5 評估指標(biāo)

由于兩個數(shù)據(jù)集中的類別非常不平衡,所以我們主要使用ROC曲線下面積(AUC)和召回率(Recall)作為評估指標(biāo),盡可能地降低類別不平衡問題對評價的影響。

4.6 實驗結(jié)果與分析

我們將建立好的圖結(jié)構(gòu)和抽取出的節(jié)點特征向量輸入模型進(jìn)行訓(xùn)練,動態(tài)地改變圖結(jié)構(gòu),有選擇地聚合鄰居節(jié)點得到圖嵌入向量,然后使用Sigmoid函數(shù)進(jìn)行分類。訓(xùn)練30個時期(Epoch),并使用AUC和Recall作為評估指標(biāo),與多個模型的對比結(jié)果如表2所示,每項指標(biāo)的第一名加粗顯示,第二名用在數(shù)值下加下劃線顯示。從表中結(jié)果可以看出,當(dāng)使用不同的訓(xùn)練集進(jìn)行訓(xùn)練時,我們提出的ADMR-GNN方法得到的評估指標(biāo)數(shù)值都在該數(shù)據(jù)集中達(dá)到了最好的效果。與評估指標(biāo)數(shù)值為第二的GraphConsis相比,在Yelp數(shù)據(jù)集中訓(xùn)練集占比為40%時AUC值提升了24%,Recall值提升了13%;在Amazon數(shù)據(jù)集中訓(xùn)練集占比為40%時,AUC值提升了9%,Recall值提升了4%。證明了本文提出的方法的有效性。

表2 對比實驗結(jié)果

我們對比了在不同訓(xùn)練集占比情況下,評估指標(biāo)AUC和召回率Recall隨迭代時期Epoch的變化情況。如圖3所示,在不同數(shù)據(jù)集中使用不同比例的訓(xùn)練集訓(xùn)練ADMR-GNN,在其余數(shù)據(jù)集上測試時,前10個訓(xùn)練時期得到的評估指標(biāo)值隨著迭代次數(shù)的變化情況,前10次訓(xùn)練時期(Epoch)里的最大值已經(jīng)在圖中標(biāo)注出。可見我們提出的方法無論是在節(jié)點數(shù)為45 954的較大的Yelp數(shù)據(jù)集上,還是在節(jié)點數(shù)為 11 944的Amazon數(shù)據(jù)集上,評估指標(biāo)都能夠在前幾輪的訓(xùn)練中快速上升,并接近于表2中30個訓(xùn)練時期得到的最大值,說明我們的模型訓(xùn)練效率也較高。

4.7 超參數(shù)敏感性分析

圖4展示了ADMR-GNN在Yelp和Amazon兩個數(shù)據(jù)集中兩個超參數(shù)敏感性的測試結(jié)果。從圖4(a)中可以看出,在Yelp數(shù)據(jù)集中,使用16、32、64、128作為圖嵌入向量的維度時,得到的AUC值為0.77左右、Recall值為0.70左右,對性能影響不大。從圖4(b)中我們可以看出,在Amazon數(shù)據(jù)集中,使用16、32、64、128作為圖嵌入向量的維度時,得到的AUC值略有波動,圖嵌入向量維度為64時AUC值最大,為0.95,而Recall值為0.88左右,對性能影響不大。從圖4(c)中我們可以看出,在Yelp數(shù)據(jù)集中,使用不同正例采樣與負(fù)例采樣的比例時,對性能有較大的影響,尤其在比例為1∶0.2 時Recall值為0.50,在比例為1∶0.5時Recall值為0.59,說明發(fā)生了不同程度的過擬合。從圖4(d)中我們可以看出,在Amazon數(shù)據(jù)集中得到的結(jié)果與Yelp相似,在比例為1∶0.2時Recall值為0.66,也發(fā)生了一定程度的過擬合。

圖4 不同超參數(shù)值得到的評估指標(biāo)值

5 總結(jié)

本文研究多關(guān)系圖中利用潛在相似節(jié)點的特征對機(jī)器賬號檢測的影響。為了增強(qiáng)基于圖神經(jīng)網(wǎng)絡(luò)的機(jī)器賬號檢測模型,更好地聚合潛在相似節(jié)點的特征,提出對抗多關(guān)系圖神經(jīng)網(wǎng)絡(luò)檢測模型ADMR-GNN。該方法能夠在訓(xùn)練過程中使用生成對抗網(wǎng)絡(luò)改變多關(guān)系圖的結(jié)構(gòu)、根據(jù)相似度篩選出相似的鄰居節(jié)點、在多個關(guān)系圖中聚合相似鄰居節(jié)點的特征,得到表達(dá)能力更強(qiáng)、更加精確的表征向量用于分類。實驗結(jié)果表明,利用了潛在相似節(jié)點特征的ADMR-GNN在AUC和Recall評估指標(biāo)中均好于當(dāng)前已有的基于圖神經(jīng)網(wǎng)絡(luò)的機(jī)器賬號檢測方法。下一步工作中,我們將研究如何更好地利用節(jié)點相似度對鄰居節(jié)點進(jìn)行篩選,進(jìn)一步提升模型的檢測性能。

猜你喜歡
檢測模型
一半模型
“不等式”檢測題
“一元一次不等式”檢測題
“一元一次不等式組”檢測題
“幾何圖形”檢測題
“角”檢測題
重要模型『一線三等角』
重尾非線性自回歸模型自加權(quán)M-估計的漸近分布
3D打印中的模型分割與打包
小波變換在PCB缺陷檢測中的應(yīng)用
404 Not Found

404 Not Found


nginx
404 Not Found

404 Not Found


nginx
404 Not Found

404 Not Found


nginx
404 Not Found

404 Not Found


nginx
主站蜘蛛池模板: 一级看片免费视频| 综合五月天网| 成人午夜福利视频| 日本黄色不卡视频| 久久久久国产精品免费免费不卡| 亚洲视频免费在线| 精品少妇人妻无码久久| 国产9191精品免费观看| 中文字幕无码电影| 日本欧美午夜| 欧美无专区| 制服无码网站| 在线视频一区二区三区不卡| 日韩精品亚洲一区中文字幕| 日韩在线视频网站| 国产人人射| 天天综合网在线| 色视频久久| 午夜国产在线观看| 毛片一级在线| 久草视频精品| 久久香蕉国产线看精品| 亚洲欧美不卡中文字幕| 亚洲国产精品成人久久综合影院| 亚洲欧洲免费视频| 57pao国产成视频免费播放| 国产成人一区在线播放| 国产欧美日本在线观看| 色精品视频| 老色鬼欧美精品| 国产十八禁在线观看免费| 国产一级毛片高清完整视频版| 国产日韩欧美中文| 亚洲国产精品一区二区第一页免| 成人免费网站久久久| 久久永久免费人妻精品| 成年A级毛片| 制服丝袜国产精品| 狠狠色噜噜狠狠狠狠色综合久| 久久无码免费束人妻| 国产av无码日韩av无码网站| 久久综合色视频| 亚洲av无码片一区二区三区| 久久精品波多野结衣| 亚洲精品中文字幕无乱码| 国产亚洲一区二区三区在线| 欧美天堂久久| 亚洲精选无码久久久| aaa国产一级毛片| 99re免费视频| 国产视频入口| 波多野结衣第一页| 71pao成人国产永久免费视频| 国产精品 欧美激情 在线播放| 国产91精品久久| 免费啪啪网址| 亚洲综合香蕉| 国产产在线精品亚洲aavv| 国产99视频在线| 波多野结衣在线一区二区| 91在线视频福利| 欧美日韩在线亚洲国产人| 日韩国产 在线| 最新亚洲人成网站在线观看| 国产精品综合久久久| 久久久久久国产精品mv| 久久99国产精品成人欧美| 国产精品一区二区不卡的视频 | 国产成人艳妇AA视频在线| 久青草国产高清在线视频| 欧美在线天堂| 久久精品国产精品青草app| 亚洲黄网视频| 久久久亚洲色| 91午夜福利在线观看精品| 97国产精品视频人人做人人爱| 亚洲精品日产AⅤ| 亚洲女人在线| 国产欧美亚洲精品第3页在线| 精品国产免费人成在线观看| 无码高潮喷水专区久久| 不卡色老大久久综合网|