999精品在线视频,手机成人午夜在线视频,久久不卡国产精品无码,中日无码在线观看,成人av手机在线观看,日韩精品亚洲一区中文字幕,亚洲av无码人妻,四虎国产在线观看 ?

基于半監(jiān)督學(xué)習(xí)和三支決策的入侵檢測模型

2021-09-18 06:22:06張師鵬李永忠杜祥通
計算機應(yīng)用 2021年9期
關(guān)鍵詞:檢測模型

張師鵬,李永忠,杜祥通

(江蘇科技大學(xué)計算機學(xué)院,江蘇鎮(zhèn)江 212100)

(*通信作者電子郵箱1099682749@qq.com)

0 引言

入侵檢測系統(tǒng)是保護信息和通信技術(shù)基礎(chǔ)設(shè)施免受網(wǎng)絡(luò)攻擊的最重要實體之一,是學(xué)術(shù)界和工業(yè)界不可忽視的研究主題[1]。隨著人工智能的迅猛發(fā)展,越來越多的機器學(xué)習(xí)模型被應(yīng)用在入侵檢測領(lǐng)域的研究中。

楊宏宇等[2]提出了一種基于改進卷積神經(jīng)網(wǎng)絡(luò)(Improved Convolutional Neural Network,ICNN)的入侵檢測模型,一定程度上解決了模型的過擬合問題;丁紅衛(wèi)等[3]利用改進的和聲搜索方法(Harmony Search,HS)對反向傳播(Back Propagation,BP)神經(jīng)網(wǎng)絡(luò)的初始值進行優(yōu)化,提出了一種基于改進的HS 算法優(yōu)化BP 神經(jīng)網(wǎng)絡(luò)的入侵檢測模型;Zegeye等[4]提出了一種基于隱馬爾可夫模型等多種機器學(xué)習(xí)方法的多層入侵檢測模型,該模型可以解決維度災(zāi)難問題;Xiao 等[5]針對誤檢率高且泛化能力差的問題,提出了基于深度卷積神經(jīng)網(wǎng)絡(luò)的入侵檢測模型。

上述方法都是基于監(jiān)督學(xué)習(xí)的入侵檢測模型,監(jiān)督學(xué)習(xí)的特點是穩(wěn)定,效果相對較好,但獲取大量的標(biāo)注信息是一項巨大的工程。然而,當(dāng)網(wǎng)絡(luò)遭受攻擊時,會產(chǎn)生大量未知攻擊的數(shù)據(jù),如果單純地憑借人工進行標(biāo)注,將會大大降低對于攻擊的檢測效率。

半監(jiān)督學(xué)習(xí)在近些年中也越來越多地被用在了入侵檢測的領(lǐng)域中[6-7]。然而已有的基于半監(jiān)督學(xué)習(xí)的入侵檢測模型大都是基于二支決策的,即對于一個網(wǎng)絡(luò)行為,應(yīng)該立即對其作出決策,決定其是正常行為還是異常行為。在一些情況下,尤其是利用基于半監(jiān)督學(xué)習(xí)的方法進行分類的過程中,分類器獲取到的信息不充足,若盲目對所有網(wǎng)絡(luò)行為作出決策,可能會出現(xiàn)大量錯誤;而且在基于半監(jiān)督學(xué)習(xí)的分類方法進行分類的過程中,對于偽標(biāo)記樣本的選擇沒有標(biāo)準(zhǔn),這些問題可能都會導(dǎo)致分類器無法對所有的網(wǎng)絡(luò)行為作出一個合理的決策。

針對上述問題,本文提出了基于半監(jiān)督學(xué)習(xí)(Semi-Supervised Learning,SSL)[8]和三支決策(Three-Way Decision,3WD)的入侵檢測模型——SSL-3WD。基于三支決策理論,在信息不足的情況可以采用延遲決策來保證對于已經(jīng)作出決策的數(shù)據(jù)其所含信息是充分的,三支決策的這個特征可以用于滿足數(shù)據(jù)信息冗余性這個假設(shè);利用三支決策理論進行分類得到的結(jié)果相較于傳統(tǒng)的二支決策得到的標(biāo)記置信度更高,基于此,三支決策理論可以解決在選擇未標(biāo)記樣本時難以選擇合適樣本這個難題。

表1為本文所使用符號的描述。

表1 符號描述Tab.1 Description of symbols

1 半監(jiān)督學(xué)習(xí)

半監(jiān)督學(xué)習(xí)(SSL)[8]的目標(biāo)是利用大量未標(biāo)記的數(shù)據(jù)來提高小數(shù)據(jù)集上監(jiān)督學(xué)習(xí)的性能。基于分歧的半監(jiān)督學(xué)習(xí)[9]是目前主流的四種半監(jiān)督學(xué)習(xí)范型的一種,關(guān)于基于分歧的半監(jiān)督學(xué)習(xí)的研究開始于對協(xié)同訓(xùn)練的研究[10]。假設(shè)數(shù)據(jù)集D=L∪U,其中L={(x1,y1),(x2,y2),…,(xm,ym)}是帶標(biāo)簽的數(shù)據(jù)集,X={x1,x2,…,xm}是數(shù)據(jù)集L中的原始的屬性集,而Y={y1,y2,…,ym}為標(biāo)簽;U=為無標(biāo)簽的數(shù)據(jù)集。

定義1假設(shè)X1、X2分別表示兩種不同視角V1和V2的特征,即X1=V1(X),X2=V2(X),且在理想情況下當(dāng)給定標(biāo)簽Y,協(xié)同訓(xùn)練需要滿足p(X1,X2|Y)=p(X1|Y)p(X2|Y)。假設(shè)Y=g(X)為需要學(xué)習(xí)的真實的映射函數(shù),f1和f2分別為兩個視角的分類器,則

在協(xié)同訓(xùn)練的過程中,利用通過不同視角的特征訓(xùn)練得到的模型f1和f2在無標(biāo)簽的數(shù)據(jù)集上進行預(yù)測,各選取預(yù)測置信度比較高的樣本加入訓(xùn)練集中,重新訓(xùn)練兩個不同視角的模型,并不斷地重復(fù)這個過程。

當(dāng)f1=f2以及V1=V2時,協(xié)同訓(xùn)練方法便退化成為自訓(xùn)練方法。雖然目前相關(guān)研究都證明協(xié)同訓(xùn)練方法充分利用了分類器之間的分歧,相對來說有更好的性能,然而在本文的實驗中發(fā)現(xiàn),當(dāng)與三支決策進行結(jié)合時,自訓(xùn)練方法才是最合適的方法。相對協(xié)同訓(xùn)練,自訓(xùn)練方法更加簡單高效,而且不用考慮視圖的條件獨立性這個假設(shè),通常情況下,這個假設(shè)并不能得到滿足,甚至連弱依賴性也不能滿足[8]。

2 三支決策

三支決策(3WD)理論來自粗糙集理論[11]。目前,人們普遍認為,粗糙集理論只是構(gòu)造三支決策的許多可能方法之一[12]。

定義2假設(shè)S是一個有限非空實體集,C是有限條件集,三支決策通過一個映射f將有限非空實體集S劃分為3 個兩兩互不相交的域:POS、NEG和BND,即

其中:POS∪NEG∪BND=S,POS∩NEG∩BND=?。

POS、NEG、BND可用于生成三支決策的規(guī)則。具體而言:POS區(qū)域生成接受決策規(guī)則,即正域;NEG區(qū)域生成拒絕規(guī)則,即負域;而BND區(qū)域生成延遲決策規(guī)則,即邊界域。如何確定對象是否包含在特定區(qū)域中將取決于它滿足C中條件的程度。正域中的樣本滿足接受條件,負域由滿足或低于拒絕級別的對象組成,邊界域由滿足度高于拒絕級別但低于接受級別的對象組成。在基于三支決策理論的整個決策過程中(最后一步除外),有必要確定是否對當(dāng)前對象作出最終決定,即對象是否屬于正域(POS)或負域(NEG),或當(dāng)前對象應(yīng)分類為邊界域(BND)。對于邊界域中的數(shù)據(jù),在獲取其他信息之后,將重新評估邊界域。如果樣本可以分為正域或負域,則作出最終決定。對于某些樣本,最終決定需要再次推遲[13]。決策過程將繼續(xù)進行,直到將所有對象劃分為正域或負域為止。

對于一個樣本,存在三種可能的決策,即:接受(POS)、拒絕(NEG)和延遲決策(BND),并且存在樣本屬于某個域或不屬于該域兩種可能的狀態(tài)。根據(jù)這三個可能的決策和兩個可能的狀態(tài),相關(guān)成本λ如表2所示。

表2 三支決策的決策損失函數(shù)Tab.2 Decision losst function of three-way decision

假設(shè)樣本x屬于集合的概率為P(C|x),將C定義為正域,而P(CC|x)則為樣本x不屬于域C的概率,即x屬于負域CC的概率。則:

1)如果P(C|x)>α,則x∈POS;

2)如果P(C|x)<β,則x∈NEG;

3)如果β≤P(C|x)≤α,則x∈BND。

假設(shè)0 ≤λPP≤λBP<λNP,0 ≤λNN≤λBN<λPN,根據(jù)文獻[14-15]的推演證明,可以得到如下兩個相關(guān)閾值的計算公式:

其中,0 ≤β≤α≤1。可以得到如下三條應(yīng)用到入侵檢測領(lǐng)域的規(guī)則:

1)如果P(C|x)>α,則該網(wǎng)絡(luò)行為被歸為正類,即該網(wǎng)絡(luò)行為是入侵行為;

2)如果P(C|x)<β,則該網(wǎng)絡(luò)行為被歸為負類,即該網(wǎng)絡(luò)行為是正常行為;

3)如果β≤P(C|x)≤α,則表示當(dāng)前信息下,無法對該行為采取任何決策,則該行為需要被劃分到邊界域以等待進一步的處理。

三支決策為入侵檢測提供了一種有用的機制。考慮這一種情況,在大多數(shù)情況下入侵檢測是正確的,但偶爾會攔截某些正常行為或釋放某些入侵行為。重復(fù)發(fā)生此類錯誤將導(dǎo)致嚴重后果。作出錯誤分類決定的原因可能有多種,例如分類器的不合理設(shè)計和誤導(dǎo)的網(wǎng)絡(luò)行為等,一個重要的原因是用于決策的信息不完整且不充足。為了解決此類問題,可以采取三支決策,通過使用延遲選項,可以避免某些錯誤的分類。

3 本文模型SSL-3WD

3.1 入侵檢測模型設(shè)計

根據(jù)上文所闡述的半監(jiān)督學(xué)習(xí)相關(guān)定理,假設(shè)數(shù)據(jù)集D1所含信息可以支撐分類器對k個無標(biāo)簽的數(shù)據(jù)作出分類,通常情況下k

在半監(jiān)督學(xué)習(xí)中,需要從未標(biāo)記樣本中挑選出一定比率的樣本進行標(biāo)記,并把這些帶有“偽標(biāo)記”的樣本加入分類器的訓(xùn)練集中,從而組成新的訓(xùn)練集。然而在沒有標(biāo)簽的前提下,如何挑選樣本是一個難題。目前有關(guān)半監(jiān)督學(xué)習(xí)的研究中,并沒有在這一方面作出過多的闡述。本文提出利用三支決策理論來挑選由分類器給出“偽標(biāo)記”的樣本。如上文所述,利用三支決策理論得到的正域和負域,可以認為當(dāng)前有標(biāo)簽的數(shù)據(jù)集所包含的信息是足以支撐分類器對這些樣本作出標(biāo)記的,即從某種程度上可以信任對這些數(shù)據(jù)的標(biāo)記,因此,可以選擇正域以及負域中的樣本與原有的訓(xùn)練集組成新的訓(xùn)練集,并利用得到的新的訓(xùn)練集繼續(xù)對模型進行訓(xùn)練,而此時,無標(biāo)簽的樣本集為負域中的樣本組成的樣本集。上述訓(xùn)練過程將一直持續(xù)下去,直至滿足停止條件,通常情況下,停止條件可以人為指定,可以指定訓(xùn)練次數(shù)達到一定程度時訓(xùn)練停止,也可以指定當(dāng)負域中不存在樣本時停止訓(xùn)練。

3.2 入侵檢測模型的算法流程

本文提出的基于半監(jiān)督學(xué)習(xí)和三支決策的入侵檢測模型(SSL-3WD)的算法流程如算法1所示。

特征提取方式用于獲取原始數(shù)據(jù)集的低維表示。由于原始數(shù)據(jù)中包含大量冗余信息,這些信息對于分類效果產(chǎn)生了不好的影響,因此需要對原數(shù)據(jù)進行特征提取。相較于主成分分析方法(Principal Component Analysis,PCA)等傳統(tǒng)的線性特征提取方式,自編碼器[16]是一種非線性的特征提取方式,其提取到的特征更能抽象表示出原始數(shù)據(jù)的信息,故本文采用自編碼器這種非線性的特征提取方式。

分類器模型f用于獲取樣本屬于正域的概率,因此,對于f的選擇以選擇軟分類模型為宜,本文選用邏輯回歸作為分類器模型。邏輯回歸是一種軟分類模型,可以輸出每個樣本屬于某個類的概率。根據(jù)模邏輯回歸求出每一個數(shù)據(jù)屬于正類的概率p,并根據(jù)三支決策的理論,通過預(yù)先設(shè)置的兩個閾值α以及β將該數(shù)據(jù)歸為正域或者負域:若某個樣本屬于正域的概率p>α,則將該樣本劃歸為正域;若某個樣本屬于正域的概率p<β,則將該樣本劃歸為負域;若α

對于劃分到正域以及負域的樣本,則需要將其作為被選中的數(shù)據(jù)加入原有的訓(xùn)練集組成新的有標(biāo)簽的訓(xùn)練數(shù)據(jù)集,而邊界域中的數(shù)據(jù)則作為無標(biāo)簽的數(shù)據(jù)等待被重新劃分。重復(fù)上述步驟,直至不存在無標(biāo)簽的數(shù)據(jù)。

從算法1 的流程可看出:本文算法在一個循環(huán)中完成,循環(huán)的結(jié)束條件為分類器對所有的無標(biāo)記樣本作出一個合理的決策,由于在迭代過程中設(shè)置了一個強制程序終結(jié)的步驟,如第12)步,因此算法不會陷入無限的循環(huán)中。假設(shè)算法的迭代次數(shù)為T,而循環(huán)內(nèi)部主要的時間消耗集中在特征提取,如第2)步,以及對分類器模型的訓(xùn)練,并利用模型進行分類,如第3)~4)步,第5)步中的for 循環(huán)并不是主要的時間消耗,在整個外部循環(huán)中進行的次數(shù)也只為測試集的個數(shù),即時間復(fù)雜度為O(M)。特征提取方式G(自編碼器)以及f分類器(多層感知機)都是深度學(xué)習(xí)模型,而隨著分布式計算的發(fā)展,通常并不計算深度學(xué)習(xí)模型的時間復(fù)雜度,因此并不能確定給出整個算法的時間復(fù)雜度,假設(shè)這兩部分的時間復(fù)雜度為O(N),則本文算法的時間復(fù)雜度可以表示為O(T?N+M),本文的數(shù)據(jù)不是大量的圖像數(shù)據(jù),只是網(wǎng)絡(luò)行為數(shù)據(jù),對于采用了分布式計算的深度學(xué)習(xí)模型來說,時間消耗在可接受范圍內(nèi)。

3.3 三支決策閾值的設(shè)置

在決策的過程中,三支決策劃分三個域的關(guān)鍵在于決策閾值對的設(shè)置。通常情況下,對于損失函數(shù),應(yīng)該根據(jù)所分析問題以及實際情況的不同,根據(jù)專家經(jīng)驗以及先驗知識進行設(shè)定。不同的問題對應(yīng)不同的損失函數(shù),不同的損失函數(shù)對應(yīng)不同的劃分結(jié)果。本文將三支決策理論應(yīng)用于入侵檢測的領(lǐng)域,用于確定一個網(wǎng)絡(luò)行為屬于正常行為還是異常行為,則損失函數(shù)的選取就要植根于入侵檢測的領(lǐng)域中。根據(jù)經(jīng)驗可得,將一個正常的網(wǎng)絡(luò)行為誤認為異常行為所產(chǎn)生的代價要遠低于將一個異常行為誤認為正常行為所產(chǎn)生的代價,故可根據(jù)經(jīng)驗設(shè)置各損失函數(shù)如表3所示。

表3 據(jù)經(jīng)驗設(shè)置的三支決策損失函數(shù)值Tab.3 Setting of loss functions of three-way decision based on experience

4 實驗結(jié)果和分析

4.1 實驗數(shù)據(jù)

本文實驗所采用的數(shù)據(jù)集有兩個,分別是NSL-KDD 數(shù)據(jù)集以及UNSW-NB15數(shù)據(jù)集。NSL-KDD數(shù)據(jù)集由41個特征屬性和1 個類屬性組成。KDD 數(shù)據(jù)集包括訓(xùn)練集和測試集兩種,總共包含38種攻擊,其中訓(xùn)練集包含22種攻擊,而測試集中包含訓(xùn)練集中的20種攻擊,除此之外還包含17種不在訓(xùn)練集中的攻擊類型。因此可以使用測試集測試入侵檢測方法在未知攻擊上的表現(xiàn)。38種攻擊類型可以分為4種主要的攻擊類型:拒絕服務(wù)攻擊(Denial of Service,DoS)、遠程攻擊(Remote-to-Login,R2L)、本地用戶非法提升權(quán)限的攻擊(User-to-Root,U2R)以及網(wǎng)絡(luò)刺探(Probe)。UNSW-NB15 數(shù)據(jù)集包含許多現(xiàn)代網(wǎng)絡(luò)的新攻擊,可以將其分為1 個正常類和9個攻擊類[17]。在本文的實驗中,數(shù)據(jù)分布如表4所示。

表4 不同數(shù)據(jù)集的數(shù)據(jù)分布Tab.4 Data distribution of different datasets

數(shù)據(jù)不能直接用于訓(xùn)練,原始數(shù)據(jù)包含類別特征,而類別特征大多都是用字符串進行表示的,因此需要進行數(shù)值化處理。

以字符串類型表示的類數(shù)據(jù)需要進行數(shù)值化處理,數(shù)值化處理最簡單的方法是序號編碼,以屬性protocol_type 為例,它的屬性值為(TCP,UDP,ICMP),則可以表示為(1,2,3)。然而利用序號編碼處理過的數(shù)據(jù)有了大小關(guān)系,例如按照上文處理會得到ICMP>UDP>TCP 的處理結(jié)果,這種大小關(guān)系并不是該屬性的性質(zhì),所以采用獨熱編碼進行編碼。

原始數(shù)據(jù)所處的量綱不同,自編碼器在訓(xùn)練過程中要使用梯度下降法,若每列屬性的取值范圍相差過大,會影響算法的性能,還有可能帶來意想不到的錯誤,因此要進行歸一化處理。

線性函數(shù)歸一化是一種常見的歸一化方法,也被稱為Min-Max 歸一化,通過這種歸一化方法可以將數(shù)據(jù)歸一到[0,1]區(qū)間內(nèi),歸一化的計算如式(5)所示:

其中:x是第i個屬性列的一個值;mini是第i個屬性列的最小值;maxi是第i個屬性列的最大值。

4.2 評價指標(biāo)

選擇準(zhǔn)確率ACC(ACCuracy)、誤報率FPR(False Positive Rate)、檢出率DR(Detection Rate)與F1值作為評判指標(biāo)。

評價指標(biāo)的計算公式如下。

其中:TP(True Positives)和TN(True Negatives)分別表示攻擊記錄和正常記錄已正確分類;FP(False Positives)代表被誤認為是攻擊的正常記錄;FN(False Negatives)代表錯誤分類為正常記錄的攻擊記錄。

4.3 參數(shù)設(shè)置

對于三支決策的損失函數(shù)的設(shè)置已經(jīng)給出,表5 給出了SSL-3WD模型在工作的工程中所使用的自編碼器參數(shù)。

表5 自編碼器的參數(shù)設(shè)置Tab.5 Setting of parameters of autoencoder

4.4 對比模型

對比模型包括:文獻[18]提出的一種基于深度堆疊自編碼器(Stack Nonsymmetric Deep Autoencoder,SNDAE)的入侵檢測模型;文獻[19]提出的一種基于深度學(xué)習(xí)(Deep Learning)和半監(jiān)督學(xué)習(xí)的入侵檢測模型DL-SSL;文獻[20]提出的一種基于自編碼器(Autoencoder,AE)和支持向量機(Support Vector Machine,SVM)的入侵檢測模型AE-SVM;文獻[21]通過調(diào)整訓(xùn)練數(shù)據(jù)的比例并設(shè)置多個決策樹提出的一種自適應(yīng)的集成學(xué)習(xí)入侵檢測模型Multi-Tree。

4.5 在NSL-KDD數(shù)據(jù)集的實驗結(jié)果

對于一個入侵檢測模型來說,檢測出入侵行為才是最主要的,因此在實驗的過程中,把所有的入侵行為的標(biāo)記設(shè)為1,正常樣本的標(biāo)記設(shè)為0。

SSL-3WD 模型通過多步?jīng)Q策對所有的網(wǎng)絡(luò)行為進行分類,每一步都得到一個對當(dāng)前的正域以及負域(已經(jīng)作出確定決策的樣本)的分類結(jié)果,如圖1 所示為得到的各步的準(zhǔn)確率。

圖1 各決策步驟的準(zhǔn)確率變化Fig.1 Accuracy change of each decision step

從圖1 中可以看到,隨著決策步驟的增加,準(zhǔn)確率在下降。假設(shè)第i次得到的準(zhǔn)確率為a,第i+1 次得到的準(zhǔn)確率為b,則一般情況下b要小于a。因為,根據(jù)三支決策理論,一個樣本越難以被決策,則對其作出錯誤決策的可能性就越大,而隨著決策步驟的增加,對于邊界域中的決策很難達到上一次決策所得到的準(zhǔn)確率,因此準(zhǔn)確率呈現(xiàn)出一個下降的趨勢,但是作出正確決策的樣本的數(shù)量是不斷增加的。

表6為各個模型在NSL-KDD測試集上的性能表現(xiàn)。本實驗在選擇數(shù)據(jù)集時,令訓(xùn)練集與測試集中的樣本數(shù)量基本保持一致,即對于分類器模型來說,所獲取的信息是不充足的。通過這種數(shù)據(jù)選擇的方式更能體現(xiàn)出SSL-3WD 模型的優(yōu)秀表現(xiàn)。

表6 在NSL-KDD測試集上的實驗結(jié)果 單位:%Tab.6 Experimental results on NSL-KDD test set unt:%

從表6 可以看出,本文模型SSL-3WD 的所有指標(biāo)都是最優(yōu),準(zhǔn)確率達到了96.1%,檢出率達到了97.7%,誤報率低至2.4%,F(xiàn)1值達到了96.6%。檢出率相較于對比模型中表現(xiàn)最好的Multi-Tree提升了5.8個百分點。

從實驗結(jié)果可以看出,SSL-3WD 模型不僅要優(yōu)于對比模型中的幾種監(jiān)督學(xué)習(xí)模型,而且要優(yōu)于同樣使用了半監(jiān)督學(xué)習(xí)的DL-SSL 模型。SSL-3WD 模型基于三支決策理論完成偽標(biāo)記樣本的選擇,這種選擇方式要優(yōu)于DL-SSL的隨機選擇。

圖2為根據(jù)幾種模型ROC的實驗結(jié)果得到的受試者特征圖(Receiver Operating Characteristic,ROC)曲線圖,ROC 曲線也可以綜合反映出一個模型的表現(xiàn)。每條曲線圍成所圍成的面積被稱為AUC(Area Under Curve),AUC越大代表一個模型的綜合性能越好。從圖2 可以看出,本文模型SSL-3WD 的AUC達到了0.99,是幾種對比模型中最高的。

圖2 在NSL-KDD數(shù)據(jù)集上進行測試得到的ROC曲線圖Fig.2 ROC curve obtained by test on NSL-KDD test set

為了驗證實驗數(shù)據(jù)的規(guī)模對于SSL-3WD 模型的影響,在本文原本使用的訓(xùn)練集上作了調(diào)整,分別使用訓(xùn)練集的20%、40%、60%、80%、100%作為訓(xùn)練數(shù)據(jù),分別記為訓(xùn)練集1、2、3、4、5,實驗數(shù)據(jù)分布如表7所示。

表7 不同比例的訓(xùn)練集的數(shù)據(jù)分布Tab.7 Data distribution of train data with different proportions

由于U2R 攻擊類型的數(shù)據(jù)極少,因此在選擇數(shù)據(jù)時會選擇所有攻擊類型為U2R 的數(shù)據(jù)。利用以上訓(xùn)練集對模型進行訓(xùn)練,并在測試集上進行測試,可以得到如表8 所示的測試結(jié)果。

表8 在比例不同的訓(xùn)練集訓(xùn)練的測試結(jié)果 單位:%Tab.8 Test results with training datasets with different proportions unit:%

從表8 中可以看出,SSL-3WD 模型隨著數(shù)據(jù)的增多,性能在逐漸地變好,檢出率在不斷地增加,誤報率在不斷地減小,且模型變好的趨勢比較明顯。也在一定程度上說明了模型的魯棒性較好。

4.6 在UNSW-NB15的實驗結(jié)果

和在NSL-KDD 數(shù)據(jù)集上的實驗一樣,在實驗的過程中依舊將異常數(shù)據(jù)的標(biāo)簽置為1,正常行為的標(biāo)簽置為0,可以得到如表9所示的實驗結(jié)果。

表9 在UNSW-NB15測試集上的實驗結(jié)果 單位:%Tab.9 Experimental results on UNSW-NB15 test set unit:%

在UNSW-NB15 的表現(xiàn)相較于在NSL-KDD 數(shù)據(jù)集上的性能表現(xiàn),各個模型都有一定的下降,但是下降幅度都非常小。從表9 中數(shù)據(jù)可以看出,SSL-3WD 模型的性能表現(xiàn)還是最優(yōu)的,其檢出率達到了96.3%,與比較方法中表現(xiàn)最好的基于深度堆疊非對稱自編碼器(SNDAE)的入侵檢測模型比較,分別提升了3.5 個百分點和6.2 個百分點;此外,誤報率低至3.2%,F(xiàn)1值達到了95.6%。

圖3 為幾種模型的ROC 曲線圖。從圖3 可以看出,SSL-3WD 的AUC為0.98,是幾種模型中最高的,也佐證了SSL-3WD模型是幾種模型中較優(yōu)的。

圖3 在UNSW-NB15數(shù)據(jù)集上進行測試得到的R0C曲線圖Fig.3 ROC curve obtained by test on UNSW-NB15 dataset

5 結(jié)語

本文提出了一種基于半監(jiān)督學(xué)習(xí)和三支決策的入侵檢測方法SSL-3WD。通過三支決策理論來改善半監(jiān)督學(xué)習(xí)在信息的冗余性以及“偽標(biāo)記”樣本的選擇這兩個情形上的不足。仿真實驗結(jié)果表明,基于半監(jiān)督學(xué)習(xí)和三支決策的入侵檢測方法要好于對比方法。

當(dāng)使用三支決策理論挑選“偽標(biāo)記”樣本的過程中,不可避免地會選擇一些標(biāo)記錯誤的樣本,如何盡可能地去除這些被錯誤標(biāo)記的樣本是接下來的研究應(yīng)該注意的一個方向。

猜你喜歡
檢測模型
一半模型
“不等式”檢測題
“一元一次不等式”檢測題
“一元一次不等式組”檢測題
“幾何圖形”檢測題
“角”檢測題
重要模型『一線三等角』
重尾非線性自回歸模型自加權(quán)M-估計的漸近分布
3D打印中的模型分割與打包
小波變換在PCB缺陷檢測中的應(yīng)用
主站蜘蛛池模板: 欧美不卡视频在线观看| 欧美一区二区三区不卡免费| 国产熟女一级毛片| 国产精品亚洲五月天高清| 丝袜美女被出水视频一区| 激情视频综合网| 91免费精品国偷自产在线在线| 亚洲视频二| 亚洲欧美日韩天堂| 国产精品lululu在线观看| 超薄丝袜足j国产在线视频| 日韩二区三区无| 亚洲AV成人一区二区三区AV| 亚洲第一区欧美国产综合| 一区二区三区精品视频在线观看| 99国产精品免费观看视频| 亚洲日韩精品伊甸| 精品无码专区亚洲| 波多野结衣一区二区三区AV| 福利片91| 日本色综合网| 亚洲aaa视频| 精品国产香蕉在线播出| 亚洲最大情网站在线观看| 亚洲欧美精品一中文字幕| 91毛片网| 又爽又大又黄a级毛片在线视频 | 国产AV毛片| 国国产a国产片免费麻豆| 日本人又色又爽的视频| 好紧太爽了视频免费无码| 亚洲天堂精品视频| 國產尤物AV尤物在線觀看| 老司机aⅴ在线精品导航| 久久中文电影| 天天综合亚洲| 欧美性猛交xxxx乱大交极品| 国产综合日韩另类一区二区| 国产情侣一区二区三区| 九色在线视频导航91| 久久久久中文字幕精品视频| 国产成人做受免费视频| 国产成人8x视频一区二区| 青草娱乐极品免费视频| 午夜天堂视频| 成人精品午夜福利在线播放| 久久久久久久蜜桃| 一区二区三区高清视频国产女人| 99国产精品免费观看视频| 亚洲综合精品香蕉久久网| 成年A级毛片| 91国内视频在线观看| 色综合久久无码网| 性激烈欧美三级在线播放| 国产成人精品日本亚洲77美色| 国产在线精彩视频论坛| 国产一级在线观看www色| 黄色a一级视频| 久久美女精品| 国产白丝av| 国产精品成人久久| 国产精品视频999| 毛片网站免费在线观看| 久久黄色视频影| 欧美亚洲日韩不卡在线在线观看| 在线色国产| 91久久国产综合精品女同我| 国产xx在线观看| 国内精品久久久久久久久久影视| 成人噜噜噜视频在线观看| 亚洲欧美成人综合| 欧美精品1区2区| 久久亚洲美女精品国产精品| 国产嫩草在线观看| 亚洲天堂在线免费| 国产99热| 激情综合婷婷丁香五月尤物| 国产免费网址| 国产综合亚洲欧洲区精品无码| 国产精品综合色区在线观看| 亚洲资源站av无码网址| 日韩欧美国产另类|