999精品在线视频,手机成人午夜在线视频,久久不卡国产精品无码,中日无码在线观看,成人av手机在线观看,日韩精品亚洲一区中文字幕,亚洲av无码人妻,四虎国产在线观看 ?

基于圖神經(jīng)網(wǎng)絡(luò)的工控網(wǎng)絡(luò)異常檢測(cè)算法①

2021-01-21 06:50:06李喜旺
關(guān)鍵詞:特征檢測(cè)模型

劉 杰,李喜旺

1(中國(guó)科學(xué)院大學(xué),北京 100049)

2(中國(guó)科學(xué)院 沈陽(yáng)計(jì)算技術(shù)研究所,沈陽(yáng) 110168)

隨著科學(xué)技術(shù)的迅速發(fā)展,人們的日常生活中也逐漸離不開網(wǎng)絡(luò).由于網(wǎng)絡(luò)信息不斷產(chǎn)生和變化,使得網(wǎng)絡(luò)安全問題也成為計(jì)算機(jī)領(lǐng)域的一個(gè)熱門的研究方向.目前網(wǎng)絡(luò)攻擊發(fā)生在我們生活中的方方面面,加之網(wǎng)絡(luò)攻擊類型的千變?nèi)f化,網(wǎng)絡(luò)攻擊者通過各種不同的手段攻擊各種公共設(shè)施和用戶個(gè)人隱私信息[1],比如“橙風(fēng)單車”投用第二天就遭到黑客攻擊,導(dǎo)致系統(tǒng)癱瘓,用戶無法正常體驗(yàn)、使用.隨著信息化時(shí)代的發(fā)展,目前網(wǎng)絡(luò)數(shù)據(jù)已經(jīng)不僅僅是靜態(tài)的單個(gè)節(jié)點(diǎn)的影響,而是以不斷變化的形式存在,因此傳統(tǒng)的網(wǎng)絡(luò)異常檢測(cè)算法已不能滿足數(shù)據(jù)實(shí)時(shí)、準(zhǔn)確的檢測(cè)要求,對(duì)不斷更新的新的網(wǎng)絡(luò)攻擊手段無法迅速的做出相應(yīng)的裁決和相應(yīng),因此我們需要更加快速和準(zhǔn)確的檢測(cè)網(wǎng)絡(luò)異常的方法,已保證在高速網(wǎng)絡(luò)的數(shù)據(jù)到來時(shí)能夠?qū)?shù)據(jù)及時(shí)做出相應(yīng)[2].

目前常用的網(wǎng)絡(luò)入侵檢測(cè)的方法主要有兩種:誤用檢測(cè)和異常檢測(cè)[3].誤用檢測(cè)需要事先建立網(wǎng)絡(luò)異常的特征規(guī)則庫(kù),并將采集到的每個(gè)數(shù)據(jù)包與規(guī)則庫(kù)的每一條規(guī)則進(jìn)行一一匹配,根據(jù)此判斷網(wǎng)絡(luò)中是否存在異常.誤用檢測(cè)的優(yōu)點(diǎn)是檢測(cè)率高、誤報(bào)率低,缺點(diǎn)是對(duì)未知特征的新異常行為,誤用檢測(cè)就表現(xiàn)毫無應(yīng)對(duì)能力.而異常檢測(cè)完全不同于誤用檢測(cè),異常檢測(cè)所關(guān)注的是網(wǎng)絡(luò)流量的宏觀統(tǒng)計(jì)特證,異常檢測(cè)首先需要提取或者概括網(wǎng)絡(luò)流量的統(tǒng)計(jì)特征,據(jù)此建立一個(gè)正常模型.是將當(dāng)前產(chǎn)生的活動(dòng)模型與正常模型作比較,當(dāng)當(dāng)前的活動(dòng)模型與正常活動(dòng)模型不匹配時(shí),異常檢測(cè)就會(huì)發(fā)出警報(bào).異常檢測(cè)的優(yōu)點(diǎn)是可以檢測(cè)出以前從未出現(xiàn)的網(wǎng)絡(luò)攻擊方法,但缺點(diǎn)是誤報(bào)率較高[4,5].

1 目前的研究

近年來,為了應(yīng)對(duì)網(wǎng)絡(luò)異常入侵的多樣性,加之為提高網(wǎng)絡(luò)異常檢測(cè)的檢測(cè)率,降低網(wǎng)絡(luò)異常檢測(cè)的誤報(bào)率,國(guó)內(nèi)外的學(xué)者對(duì)此已經(jīng)做了大量的研究工作,目前網(wǎng)絡(luò)異常檢測(cè)方法大致分為兩大方面:動(dòng)態(tài)網(wǎng)絡(luò)異常檢測(cè)和靜態(tài)網(wǎng)絡(luò)異常檢測(cè).

在靜態(tài)網(wǎng)絡(luò)異常檢測(cè)中,最為代表的是基于閾值的網(wǎng)絡(luò)檢測(cè)方法.在基于閾值檢測(cè)的方法中,Maxion 等[6]提出根據(jù)歷史網(wǎng)絡(luò)流量的特征建立閾值,一旦超出此閾值即判斷為網(wǎng)絡(luò)異常[7].

在動(dòng)態(tài)網(wǎng)絡(luò)異常檢測(cè)中,典型的方法即基于統(tǒng)計(jì)的檢測(cè)方法,比如基于用戶畫像的異常行為檢測(cè)模型[8]中提出引入用戶畫像技術(shù),實(shí)現(xiàn)了入侵檢測(cè)粒度的細(xì)化,并將大數(shù)據(jù)技術(shù)引入網(wǎng)絡(luò)安全領(lǐng)域,證明了基于用戶畫像的入侵檢測(cè)模型有較好的實(shí)用價(jià)值.基于隱馬爾可夫模型和條件熵的異常流量檢測(cè)方法研究中[1]中提出運(yùn)用統(tǒng)計(jì)學(xué)的方法對(duì)流量分類,最后通過輸出概率值來判斷是否是異常類型,該方法明顯的提高了異常檢測(cè)的精確度和檢測(cè)率,但是只能對(duì)流量進(jìn)行籠統(tǒng)的分類為異常和正常,無法做到更精細(xì)的劃分.

但由于網(wǎng)絡(luò)流量不僅存在相似性和周期性的特點(diǎn),還存在多點(diǎn)之間的連接性,因此當(dāng)網(wǎng)絡(luò)攻擊者對(duì)我們的網(wǎng)絡(luò)進(jìn)行入侵時(shí),往往不是單獨(dú)的某個(gè)點(diǎn)對(duì)我們的網(wǎng)絡(luò)造成極大的攻擊,而是多個(gè)網(wǎng)絡(luò)攻擊者聯(lián)合攻擊對(duì)我們的網(wǎng)絡(luò)造成網(wǎng)絡(luò)崩潰,網(wǎng)絡(luò)節(jié)點(diǎn)關(guān)系如圖1所示.因此目前的單點(diǎn)網(wǎng)絡(luò)異常檢測(cè)已滿足不了現(xiàn)階段對(duì)網(wǎng)絡(luò)攻擊者的防御和對(duì)其預(yù)測(cè).另外,“網(wǎng)絡(luò)異常”也是一個(gè)很模糊的概念,工控網(wǎng)絡(luò)異常檢測(cè)通常表現(xiàn)為結(jié)構(gòu)和屬性的變化,異常當(dāng)然也包括網(wǎng)絡(luò)節(jié)點(diǎn)本身的異常以及網(wǎng)絡(luò)變化的異常,因此在本文中,我們基于工控網(wǎng)絡(luò)中的多點(diǎn)連接性提出了基于圖神經(jīng)網(wǎng)絡(luò)的工控網(wǎng)絡(luò)異常檢測(cè)算法,將圖神經(jīng)網(wǎng)絡(luò)應(yīng)用于工控網(wǎng)絡(luò)異常檢測(cè),這樣就可以同時(shí)抓取工控網(wǎng)絡(luò)結(jié)構(gòu)、屬性以及其周圍點(diǎn)鄰域狀態(tài)上的異常.從而使算法能夠脫離單點(diǎn)的網(wǎng)絡(luò)異常檢測(cè).

圖1 網(wǎng)絡(luò)節(jié)點(diǎn)圖關(guān)系

最終將該模型與單點(diǎn)檢測(cè)算法比較,證明了該算法具有較高的準(zhǔn)確率,驗(yàn)證了該算法的有效性.

2 基于圖神經(jīng)網(wǎng)絡(luò)的工控網(wǎng)絡(luò)異常檢測(cè)

2.1 問題描述

對(duì)于我們?nèi)粘I钪械木W(wǎng)絡(luò)拓?fù)浣Y(jié)構(gòu),工控網(wǎng)絡(luò)節(jié)點(diǎn)的結(jié)構(gòu)特征和屬性以及工控網(wǎng)絡(luò)節(jié)點(diǎn)之間的連接關(guān)系,本文中提出的基于圖神經(jīng)網(wǎng)絡(luò)的工控網(wǎng)絡(luò)異常檢測(cè)算法的目標(biāo)是:充分利用工控網(wǎng)絡(luò)節(jié)點(diǎn)之間的屬性信息和工控網(wǎng)絡(luò)拓?fù)浣Y(jié)構(gòu)的信息,挖掘工控網(wǎng)絡(luò)節(jié)點(diǎn)之間的隱含的交互信息,并學(xué)習(xí)每個(gè)工控網(wǎng)絡(luò)節(jié)點(diǎn)的類標(biāo)簽.表1給出本文中相關(guān)的符號(hào)定義.

表1 符號(hào)定義

2.2 圖神經(jīng)網(wǎng)絡(luò)

圖神經(jīng)網(wǎng)絡(luò)(Graph Neural Network,GNN) 是近幾年出現(xiàn)的一類以圖結(jié)構(gòu)作為網(wǎng)絡(luò)輸入的神經(jīng)網(wǎng)絡(luò)模型[9].由于圖神經(jīng)網(wǎng)絡(luò)處理的數(shù)據(jù)結(jié)構(gòu)是圖,而圖是一種主要針對(duì)非歐幾里得空間結(jié)構(gòu)的數(shù)據(jù)進(jìn)行處理,具有以下優(yōu)勢(shì):

(1)對(duì)輸入元素?cái)?shù)據(jù)的順序不敏感;

(2)在圖計(jì)算過程中,節(jié)點(diǎn)的表示受周圍鄰居節(jié)點(diǎn)的結(jié)構(gòu)和屬性的影響,而圖本身的連接不變;

(3)將網(wǎng)絡(luò)節(jié)點(diǎn)表示為圖結(jié)構(gòu)表示,便于進(jìn)行基于圖的推理,對(duì)網(wǎng)絡(luò)異常檢測(cè)具有天然的優(yōu)勢(shì).

同時(shí)受到網(wǎng)絡(luò)嵌入的啟發(fā),本文旨在學(xué)習(xí)一個(gè)圖神經(jīng)網(wǎng)絡(luò)映射函數(shù),通過該映射函數(shù)將圖中的某一節(jié)點(diǎn)Vi可以聚合它自己的特征Xi與它相關(guān)聯(lián)的鄰居的特征Xj來生成節(jié)點(diǎn)Vi的新表示,然后將其作為K-means的輸入,進(jìn)行聚類算法,判斷該節(jié)點(diǎn)是否異常.圖神經(jīng)網(wǎng)絡(luò)結(jié)構(gòu)圖如圖2所示.

圖2 圖神經(jīng)網(wǎng)絡(luò)結(jié)構(gòu)圖

2.3 基于圖神經(jīng)網(wǎng)絡(luò)的網(wǎng)絡(luò)異常檢測(cè)

圖神經(jīng)網(wǎng)絡(luò)模型由三大部分組成:圖節(jié)點(diǎn)狀態(tài)向量獲取模塊、迭代更新模塊和損失函數(shù)模塊[10].

(1)圖節(jié)點(diǎn)狀態(tài)向量獲取

首先每個(gè)節(jié)點(diǎn)Vi都可以用其特征Xi表示,并與其已標(biāo)記的標(biāo)簽相關(guān)聯(lián).給定部分標(biāo)記的圖G=(V,E),利用已標(biāo)記的節(jié)點(diǎn)來預(yù)測(cè)未標(biāo)記的節(jié)點(diǎn)標(biāo)簽.它可以通過學(xué)習(xí)得到每個(gè)節(jié)點(diǎn)的d維狀態(tài)向量表示為Hv,同時(shí)已包含了其相鄰節(jié)點(diǎn)的狀態(tài)信息.

其中,Xv表示節(jié)點(diǎn)的屬性特征集合,Xco表示邊的特征集合,Hne表示樣本v的鄰居節(jié)點(diǎn)的嵌入表示,Xne表示節(jié)點(diǎn)v的鄰居節(jié)點(diǎn)的屬性特征.f(x)函數(shù)表示將輸入節(jié)點(diǎn)的特征映射到d維向量空間的一個(gè)映射函數(shù).

(2)迭代更新

根據(jù)上述算法可以獲取到每個(gè)節(jié)點(diǎn)的d 維狀態(tài)向量,該向量蘊(yùn)含了連接節(jié)點(diǎn)的特征信息以及節(jié)點(diǎn)之間的交互信息.由于我們要求出Hv的唯一解,在本文中我們選擇使用不動(dòng)點(diǎn)理論重寫上述方程進(jìn)行迭代更新.

其中,H和X表示所有h和x的連接.

然而對(duì)于每個(gè)節(jié)點(diǎn),其鄰域節(jié)點(diǎn)的交互信息固然重要,但其自身節(jié)點(diǎn)的原始信息也包含了很多重要的狀態(tài)信息.因此將節(jié)點(diǎn)的狀態(tài)向量Hv以及節(jié)點(diǎn)的特征Xv同時(shí)傳遞給輸出函數(shù)g進(jìn)一步計(jì)算,得到GNN 的輸出,即是否為異常節(jié)點(diǎn).即:

其中,f(x)和g(x)是全連接前饋神經(jīng)網(wǎng)絡(luò).

(3)損失函數(shù)

給定一個(gè)圖G=(V,E,X),經(jīng)過上述的狀態(tài)向量獲取和迭代更新,每個(gè)節(jié)點(diǎn)都可以用一個(gè)具有既包含節(jié)點(diǎn)自身信息又有樣本鄰域交互信息的狀態(tài)向量表示.在本文中根據(jù)詞特征向量,我們使用softmax(x)函數(shù)為每個(gè)節(jié)點(diǎn)計(jì)算每個(gè)類別對(duì)應(yīng)的概率,softmax(x)函數(shù)定義如下:

最后在該模型中,我們使用交叉熵計(jì)算模型的損失loss,其計(jì)算公式如下:

其中,y表示真實(shí)的標(biāo)簽.

圖神經(jīng)網(wǎng)絡(luò)的算法進(jìn)行節(jié)點(diǎn)特征表示的過程圖如圖3所示.

2.4 K-means 數(shù)據(jù)聚類

聚類算法是一個(gè)將數(shù)據(jù)集劃分成若干個(gè)聚類的過程,使得同一聚類的類內(nèi)相似性最大,類間相似性最小.相似性的度量我們選用基于距離的方法.在本文中我們選用歐幾里得距離,計(jì)算公式如下:

常用的聚類算法包括K 均值聚類、密度聚類、層次聚類.在本文中我們選擇K-means 聚類,K-means 聚類算法是將n個(gè)樣本點(diǎn)劃分成k個(gè)子集,每個(gè)子集都代表一個(gè)聚類.

K-means 算法的步驟:

① 在已研究的基礎(chǔ)上,將所有的樣本根據(jù)類標(biāo)種類分為k個(gè)類,記為k個(gè)種子聚類中心.

② 計(jì)算每個(gè)樣本與種子聚類中心之間的距離,并把每個(gè)樣本點(diǎn)分配到距離最近的聚類中心點(diǎn),即聚類中心及分配的樣本點(diǎn)代表一個(gè)簇.

③ 計(jì)算每個(gè)簇的均值作為每個(gè)簇的質(zhì)心,重復(fù)步驟②,直至質(zhì)心不再發(fā)生變化,確定k的值.

將上述圖神經(jīng)網(wǎng)絡(luò)的網(wǎng)絡(luò)節(jié)點(diǎn)輸出特征作為Kmeans 聚類的輸入,判斷網(wǎng)絡(luò)節(jié)點(diǎn)是否是異常節(jié)點(diǎn).

圖3 節(jié)點(diǎn)特征表示的過程圖

3 實(shí)驗(yàn)部分

3.1 數(shù)據(jù)說明與預(yù)處理

為了評(píng)價(jià)本文提出的網(wǎng)絡(luò)異常檢測(cè)算法,使用Libpcap 網(wǎng)絡(luò)工具獲取中科院沈陽(yáng)計(jì)算技術(shù)研究所使用的內(nèi)部網(wǎng)絡(luò)數(shù)據(jù),主要是原始網(wǎng)絡(luò)的流量數(shù)據(jù).

在本文中選取TCP 連接的基本特征比如連續(xù)時(shí)間,協(xié)議類型、傳送的字節(jié)數(shù)、連接正常或錯(cuò)誤的狀態(tài)和TCP 連接的內(nèi)容特征比如登錄嘗試失敗的次數(shù)、成功登錄的次數(shù),root 用戶訪問次數(shù)和文件創(chuàng)建操作次數(shù)等屬性對(duì)網(wǎng)絡(luò)節(jié)點(diǎn)數(shù)據(jù)進(jìn)行分析.

為了剔除數(shù)據(jù)集中的“臟數(shù)據(jù)”,與網(wǎng)絡(luò)節(jié)點(diǎn)異常無關(guān)的數(shù)據(jù)、重復(fù)采集的數(shù)據(jù)、數(shù)據(jù)格式錯(cuò)誤或null 值的數(shù)據(jù),需要先對(duì)數(shù)據(jù)進(jìn)行預(yù)處理,找出數(shù)據(jù)的特征表示,為算法提供可靠的數(shù)據(jù)保證.對(duì)于數(shù)據(jù)的預(yù)處理主要包括兩大部分,首先利用Python 3 將獲取的字符型特征轉(zhuǎn)換為數(shù)值型特征,其次對(duì)數(shù)據(jù)進(jìn)行標(biāo)準(zhǔn)化和歸一化處理.在本文中使用的是min-max 標(biāo)準(zhǔn)化方法,即對(duì)原始數(shù)據(jù)的線性變換,使數(shù)據(jù)結(jié)果歸一化到[0,1]區(qū)間轉(zhuǎn)換函數(shù)如下:

其中,max 為樣本數(shù)據(jù)的最大值,min 為樣本數(shù)據(jù)的最小值.

3.2 實(shí)驗(yàn)平臺(tái)

使用基于Python3 環(huán)境的Tensorflow 開源深度學(xué)習(xí)框架實(shí)現(xiàn)圖神經(jīng)網(wǎng)絡(luò)的模型構(gòu)建與異常檢測(cè).本文實(shí)驗(yàn)采用PC 機(jī),內(nèi)存為16 GB,操作系統(tǒng)為Windows、Linux.

3.3 實(shí)驗(yàn)結(jié)果與分析

在該網(wǎng)絡(luò)異常檢測(cè)算法中,模型的結(jié)果評(píng)估使用準(zhǔn)確率和誤判率來評(píng)價(jià)模型的性能.具體如表2.

表2 混淆矩陣

準(zhǔn)確率表示為:

傳統(tǒng)聚類單點(diǎn)檢測(cè)算法得到的聚類結(jié)果圖和經(jīng)圖神經(jīng)網(wǎng)絡(luò)處理后網(wǎng)絡(luò)節(jié)點(diǎn)異常檢測(cè)結(jié)果分別如圖4和圖5所示.

圖4 傳統(tǒng)聚類結(jié)果

本文模型在準(zhǔn)確率和誤報(bào)率與其他傳統(tǒng)網(wǎng)絡(luò)異常檢測(cè)模型比較,具體如表3.

圖5 圖神經(jīng)網(wǎng)絡(luò)處理聚類結(jié)果

表3 結(jié)果對(duì)比表(%)

4 結(jié)束語

網(wǎng)絡(luò)異常檢測(cè)已經(jīng)成為網(wǎng)絡(luò)安全的一個(gè)重要研究方向,本文提出的基于圖神經(jīng)網(wǎng)絡(luò)的網(wǎng)絡(luò)異常檢測(cè)算法可以融合網(wǎng)絡(luò)節(jié)點(diǎn)自身屬性以及其鄰域節(jié)點(diǎn)的屬性信息進(jìn)行訓(xùn)練,彌補(bǔ)了以往的單節(jié)點(diǎn)的動(dòng)態(tài)預(yù)測(cè)方法的不足,實(shí)驗(yàn)證明該方法具有較好的魯棒性,但是該算法也具有一定的局限性,對(duì)于進(jìn)一步的節(jié)點(diǎn)之間的相關(guān)性研究及圖神經(jīng)網(wǎng)絡(luò)更精確精準(zhǔn)的異常檢測(cè)是我們下一步的研究重點(diǎn).

猜你喜歡
特征檢測(cè)模型
一半模型
“不等式”檢測(cè)題
“一元一次不等式”檢測(cè)題
“一元一次不等式組”檢測(cè)題
重要模型『一線三等角』
重尾非線性自回歸模型自加權(quán)M-估計(jì)的漸近分布
如何表達(dá)“特征”
不忠誠(chéng)的四個(gè)特征
抓住特征巧觀察
3D打印中的模型分割與打包
主站蜘蛛池模板: 欧美日在线观看| 在线观看欧美国产| 精品国产自| 国产丝袜丝视频在线观看| 欧美在线三级| 亚洲乱强伦| 国产成人精品高清不卡在线| 国产综合无码一区二区色蜜蜜| 国内精品久久久久鸭| 欧美特黄一免在线观看| 三上悠亚在线精品二区| 色综合日本| 国产激情无码一区二区APP| 国产a v无码专区亚洲av| 99在线观看国产| 成人看片欧美一区二区| 日本午夜影院| 国产成人精品三级| 麻豆精品在线| 亚洲欧美综合另类图片小说区| 凹凸国产分类在线观看| 无码网站免费观看| 亚洲天堂精品在线| 四虎永久在线| 爽爽影院十八禁在线观看| 亚洲不卡av中文在线| A级全黄试看30分钟小视频| 国产精品成人观看视频国产 | 久久久91人妻无码精品蜜桃HD | 亚洲美女久久| 99精品在线视频观看| 亚洲九九视频| 亚洲综合中文字幕国产精品欧美 | 激情乱人伦| 一级一级特黄女人精品毛片| 国模私拍一区二区三区| 久久久久无码精品| 美女一区二区在线观看| 这里只有精品国产| 极品国产一区二区三区| 久久综合色天堂av| 精品三级网站| 最近最新中文字幕免费的一页| 经典三级久久| 狠狠色婷婷丁香综合久久韩国| 亚洲AV无码久久精品色欲| 国产精品无码一二三视频| 欧美日韩国产一级| 国产黄视频网站| 69视频国产| 亚洲福利片无码最新在线播放 | 中文字幕第4页| 亚洲国产精品成人久久综合影院| 91久久国产热精品免费| 国产精品视频免费网站| 欧美国产日产一区二区| 久草中文网| 亚洲视屏在线观看| 成年看免费观看视频拍拍| 亚洲天堂精品视频| 久久这里只有精品2| 中文字幕亚洲电影| swag国产精品| 成人国产一区二区三区| 久久精品只有这里有| 97国产精品视频自在拍| 国产香蕉一区二区在线网站| 无码精品一区二区久久久| 国产主播喷水| 高清欧美性猛交XXXX黑人猛交| 日韩av手机在线| 免费在线不卡视频| 不卡网亚洲无码| 国产剧情无码视频在线观看| 精品黑人一区二区三区| 亚洲一区二区三区麻豆| 日韩av电影一区二区三区四区| 国产国语一级毛片在线视频| 日韩毛片基地| 国产特一级毛片| 亚洲最猛黑人xxxx黑人猛交| 国产成人亚洲精品无码电影|