999精品在线视频,手机成人午夜在线视频,久久不卡国产精品无码,中日无码在线观看,成人av手机在线观看,日韩精品亚洲一区中文字幕,亚洲av无码人妻,四虎国产在线观看 ?

一種深度學(xué)習(xí)的網(wǎng)絡(luò)安全態(tài)勢(shì)評(píng)估方法

2021-01-29 04:22:42楊宏宇曾仁韻
關(guān)鍵詞:網(wǎng)絡(luò)安全分類模型

楊宏宇,曾仁韻

(中國(guó)民航大學(xué) 計(jì)算機(jī)科學(xué)與技術(shù)學(xué)院,天津 300300)

近年來,隨著互聯(lián)網(wǎng)的快速發(fā)展,通過互聯(lián)網(wǎng)進(jìn)行的攻擊問題越來越頻繁,帶來的危害也越來越嚴(yán)重。 我國(guó)互聯(lián)網(wǎng)態(tài)勢(shì)報(bào)告[1]中指出,在2019年上半年,我國(guó)網(wǎng)絡(luò)遭受了大量的、多樣的威脅攻擊,并針對(duì)此情況開展了網(wǎng)絡(luò)安全威脅治理工作;其中,采用的一個(gè)重要手段就是網(wǎng)絡(luò)安全態(tài)勢(shì)評(píng)估。網(wǎng)絡(luò)安全態(tài)勢(shì)評(píng)估是一種常用的、有效的解決方案。它綜合了影響網(wǎng)絡(luò)安全的指標(biāo),為網(wǎng)絡(luò)管理人員提供決策意見,從最大程度上降低網(wǎng)絡(luò)攻擊威脅產(chǎn)生的危害[2]。

文獻(xiàn)[3]提出了基于層次分析法和灰色關(guān)聯(lián)分析的多維系統(tǒng)安全評(píng)價(jià)方法,以系統(tǒng)安全評(píng)價(jià)模型構(gòu)建原則為指導(dǎo),構(gòu)建了環(huán)境安全、網(wǎng)絡(luò)安全、脆弱性安全的多維系統(tǒng)安全評(píng)價(jià)模型。文獻(xiàn)[4]將互聯(lián)網(wǎng)受到的網(wǎng)絡(luò)威脅作為態(tài)勢(shì)評(píng)估的重要指標(biāo),利用模糊邏輯推理系統(tǒng)改進(jìn)網(wǎng)絡(luò)安全威脅評(píng)估模型。然而,上述方式在面對(duì)新型的網(wǎng)絡(luò)威脅攻擊時(shí)不能做出及時(shí)反應(yīng)。

隨著神經(jīng)網(wǎng)絡(luò)、機(jī)器學(xué)習(xí)等信息技術(shù)在許多領(lǐng)域的成功應(yīng)用,在信息安全領(lǐng)域開始嘗試將這些技術(shù)融入網(wǎng)絡(luò)威脅態(tài)勢(shì)評(píng)估。文獻(xiàn)[5]引入動(dòng)量因子,對(duì)搜索算法進(jìn)行了優(yōu)化,提出了一種改進(jìn)反向傳播神經(jīng)網(wǎng)絡(luò)的網(wǎng)絡(luò)安全態(tài)勢(shì)定量評(píng)估方法。文獻(xiàn)[6]提出了結(jié)合樸素貝葉斯分類器的網(wǎng)絡(luò)安全態(tài)勢(shì)評(píng)估方法,從整體動(dòng)態(tài)上展示網(wǎng)絡(luò)當(dāng)前安全狀況。文獻(xiàn)[7]結(jié)合支持向量機(jī),并改良了布谷鳥算法預(yù)測(cè)網(wǎng)絡(luò)安全態(tài)勢(shì),該方法在KDD數(shù)據(jù)集上的性能達(dá)到了較高的精度。上述方法可以動(dòng)態(tài)評(píng)估網(wǎng)絡(luò)安全態(tài)勢(shì),但是面對(duì)如今的大量網(wǎng)絡(luò)威脅數(shù)據(jù),已經(jīng)不能滿足實(shí)時(shí)、直觀的評(píng)估需求。

在大數(shù)據(jù)背景下,結(jié)合深度神經(jīng)網(wǎng)絡(luò)的算法已經(jīng)應(yīng)用于海量威脅攻擊數(shù)據(jù)檢測(cè)。文獻(xiàn)[8]通過實(shí)驗(yàn)表明,相對(duì)于傳統(tǒng)的淺層網(wǎng)絡(luò)方法,深層網(wǎng)絡(luò)在檢測(cè)網(wǎng)絡(luò)威脅攻擊方面更加準(zhǔn)確和有效。文獻(xiàn)[9]應(yīng)用長(zhǎng)短期記憶網(wǎng)絡(luò)(Long-Short-Term Memory,LSTM)在CIDDS-001數(shù)據(jù)集上進(jìn)行訓(xùn)練和測(cè)試。盡管實(shí)驗(yàn)結(jié)果取得較高的準(zhǔn)確率,但是文中選擇的測(cè)試集是訓(xùn)練集的一部分,因此沒有表現(xiàn)出模型的泛化性。文獻(xiàn)[10]將自我學(xué)習(xí)(Self-Taught Learning,STL)與稀疏自動(dòng)編碼器(Sparse Auto Encoder,SAE)相結(jié)合,對(duì)NSL-KDD數(shù)據(jù)集的檢測(cè)準(zhǔn)確率有很大的提升。然而,該方法在訓(xùn)練過程中抑制了某些神經(jīng)元的傳播而且易出現(xiàn)不同數(shù)量的樣本檢測(cè)結(jié)果不平衡的現(xiàn)象。

針對(duì)上述方法的不足,筆者提出了基于深度學(xué)習(xí)的網(wǎng)絡(luò)安全態(tài)勢(shì)評(píng)估方法。為了解決數(shù)據(jù)集中不同類型攻擊的分類結(jié)果極度不平衡問題,提出一種欠過采樣加權(quán)(Under-Over Sampling Weighted,UOSW)算法對(duì)數(shù)據(jù)集進(jìn)行處理,結(jié)合深度自動(dòng)編碼器(Deep Auto Encoder,DAE)對(duì)網(wǎng)絡(luò)攻擊進(jìn)行分類。在得到網(wǎng)絡(luò)攻擊分類后,對(duì)每種攻擊類型進(jìn)行影響評(píng)估,并對(duì)網(wǎng)絡(luò)安全狀況進(jìn)行量化評(píng)估。通過實(shí)驗(yàn),證明文中方法可實(shí)現(xiàn)對(duì)網(wǎng)絡(luò)安全狀況的實(shí)時(shí)評(píng)估,評(píng)估效果更加高效、直觀,性能指標(biāo)優(yōu)于其他模型。

1 網(wǎng)絡(luò)安全態(tài)勢(shì)評(píng)估模型

筆者設(shè)計(jì)的網(wǎng)絡(luò)安全態(tài)勢(shì)評(píng)估模型包括態(tài)勢(shì)獲取、態(tài)勢(shì)分析和態(tài)勢(shì)評(píng)估3個(gè)部分。網(wǎng)絡(luò)安全態(tài)勢(shì)評(píng)估模型的結(jié)構(gòu)如圖1所示。

圖1 網(wǎng)絡(luò)安全態(tài)勢(shì)評(píng)估模型

(1) 態(tài)勢(shì)獲取

在此階段,獲取網(wǎng)絡(luò)中的流量數(shù)據(jù)。為了模擬網(wǎng)絡(luò)處理海量流量數(shù)據(jù)的情況,選取上述NSL-KDD數(shù)據(jù)集作為網(wǎng)絡(luò)流量。數(shù)據(jù)預(yù)處理后,輸入深度自編碼器進(jìn)行訓(xùn)練。

(2) 態(tài)勢(shì)分析

將測(cè)試 數(shù)據(jù)集輸入訓(xùn)練后的模型,記錄結(jié)果輸出的二分類結(jié)果和多分類結(jié)果,用于計(jì)算網(wǎng)絡(luò)安全態(tài)勢(shì)量化值。

(3) 態(tài)勢(shì)評(píng)估

根據(jù)測(cè)試的攻擊分類結(jié)果,計(jì)算網(wǎng)絡(luò)攻擊概率和各種網(wǎng)絡(luò)攻擊的影響值。另外,計(jì)算網(wǎng)絡(luò)安全態(tài)勢(shì)值并對(duì)網(wǎng)絡(luò)安全態(tài)勢(shì)進(jìn)行評(píng)估。詳細(xì)計(jì)算方法見下文。

2 深度自編碼器

2.1 深度自編碼器設(shè)計(jì)

2.1.1 模型結(jié)構(gòu)

自動(dòng)編碼器(Auto Encoder,AE)由編碼器和解碼器組成,主要應(yīng)用于數(shù)據(jù)降維和特征學(xué)習(xí)。輸入數(shù)據(jù)通過編碼器被映射到解碼器,解碼器可以用更精簡(jiǎn)的特征描述原始數(shù)據(jù)。深度自動(dòng)編碼器(Deep Auto Encoder,DAE)是一種改進(jìn)的自動(dòng)編碼器模型。文獻(xiàn)[11]深化了原有自動(dòng)編碼器的網(wǎng)絡(luò)結(jié)構(gòu),生成了DAE網(wǎng)絡(luò)。因?yàn)楹须[藏層更多,DAE的學(xué)習(xí)能力得到了提高,這使得它更有利于特征學(xué)習(xí)。

深度神經(jīng)網(wǎng)絡(luò)(Deep Neural Network,DNN)由于其準(zhǔn)確性和高效性,在入侵檢測(cè)中得到了廣泛的應(yīng)用。由于DNN包含了多個(gè)隱藏層,使得它的學(xué)習(xí)能力顯著提高。與傳統(tǒng)的機(jī)器學(xué)習(xí)分類器相比,DNN可以在更短的時(shí)間內(nèi)獲得更準(zhǔn)確的分類結(jié)果,因此,選擇DNN作為網(wǎng)絡(luò)攻擊數(shù)據(jù)的分類器,所提出的深度自編碼器模型(Deep Auto Encoder Deep Neural Network,DAEDNN)如圖2所示。

圖2 DAEDNN模型

由圖2可見,模型接收輸入數(shù)據(jù)后,先通過DAE網(wǎng)絡(luò)進(jìn)行特征學(xué)習(xí)并記錄學(xué)習(xí)結(jié)果,根據(jù)學(xué)習(xí)結(jié)果和DNN分類器,將輸入數(shù)據(jù)進(jìn)行分類,而后將其分類結(jié)果應(yīng)用于后續(xù)的網(wǎng)絡(luò)安全態(tài)勢(shì)量化評(píng)估過程。

DAEDNN模型不僅可以進(jìn)行二分類,也可以進(jìn)行多分類。在進(jìn)行二分類任務(wù)時(shí),模型的激活函數(shù)為sigmoid函數(shù),sigmoid函數(shù)將模型輸出值映射到0和1區(qū)間,其中,數(shù)值越靠近1,則越容易被判定為異常流量。sigmoid函數(shù)(Fsgm)的計(jì)算公式如下,

Fsgm(x)=(1+e-x)-1。

(1)

當(dāng)模型進(jìn)行多分類任務(wù)時(shí),模型的激活函數(shù)為softmax函數(shù),softmax也是將輸出映射到0和1區(qū)間,但是與sigmoid函數(shù)不同的是,各個(gè)類別的輸出值相加的值等于1,模型選擇輸出值最大的類別為預(yù)測(cè)的類別。softmax函數(shù)(Fsfm)的計(jì)算公式如下,

(2)

其中,K表示輸出可以被分為K個(gè)類,zi表示每一類所取得的值。

2.1.2 模型訓(xùn)練

在DAEDNN模型中,DAE模型進(jìn)行特征學(xué)習(xí)。為了讓DNN分類器充分學(xué)習(xí)DAE的特征提取結(jié)果和提高模型性能,減少模型過擬合的風(fēng)險(xiǎn),應(yīng)分次訓(xùn)練DAEDNN模型。

模型訓(xùn)練分為3個(gè)步驟:① 將訓(xùn)練數(shù)據(jù)輸入至DAE網(wǎng)絡(luò),進(jìn)行特征學(xué)習(xí),記錄訓(xùn)練完成的權(quán)重值。② DAE 模型訓(xùn)練結(jié)束后,組合DAE模型和DNN模型為DAEDNN模型,一起訓(xùn)練這兩個(gè)網(wǎng)絡(luò)。為了獲取DAE模型的訓(xùn)練結(jié)果,將DAEDNN模型中的DAE網(wǎng)絡(luò)的權(quán)重值設(shè)置為保留的權(quán)重值,并把DAE層的參數(shù)設(shè)置為不可訓(xùn)練,與DNN網(wǎng)絡(luò)一起進(jìn)行訓(xùn)練,此時(shí)網(wǎng)絡(luò)只會(huì)更新DNN網(wǎng)絡(luò)的參數(shù)。③ 將DAE層的參數(shù)設(shè)置為可訓(xùn)練,更新DAE網(wǎng)絡(luò)和DNN網(wǎng)絡(luò)的參數(shù)。訓(xùn)練過程中更新訓(xùn)練參數(shù),不僅可以獲取DAE層的特征學(xué)習(xí)結(jié)果,也提高了模型對(duì)數(shù)據(jù)的表征能力。

2.2 欠過采樣加權(quán)數(shù)據(jù)重采樣算法

2.2.1 數(shù)據(jù)集描述

選擇網(wǎng)絡(luò)安全領(lǐng)域相對(duì)權(quán)威的入侵檢測(cè)數(shù)據(jù)集NSL-KDD作為評(píng)估的數(shù)據(jù)源。NSL-KDD數(shù)據(jù)集改良于KDD99數(shù)據(jù)集,它刪除了重復(fù)的網(wǎng)絡(luò)流量數(shù)據(jù)記錄,這有助于分類器產(chǎn)生無偏差的結(jié)果[12]。NSL-KDD數(shù)據(jù)集包含41個(gè)特征和5種主要攻擊類型。文中使用的數(shù)據(jù)集信息如表1所示。

表1 KDD-NSL數(shù)據(jù)集信息

2.2.2 數(shù)據(jù)預(yù)處理

為了更方便、準(zhǔn)確地訓(xùn)練網(wǎng)絡(luò)模型,需要將數(shù)據(jù)集中的分類特征轉(zhuǎn)換為數(shù)字特征,并進(jìn)行數(shù)值歸一化。

(1) 特征數(shù)值化

NSL-KDD數(shù)據(jù)集有3個(gè)分類特征“protocol_type”、“service”和“flag”,分別包括3、64和10個(gè)類別。通過獨(dú)熱編碼技術(shù),將這3種分類特征轉(zhuǎn)化為只表示0和1的數(shù)據(jù)。對(duì)這3個(gè)分類特征進(jìn)行處理之后,數(shù)據(jù)集由41個(gè)特征維度變?yōu)?16個(gè)特征維度。

(2) 數(shù)值歸一化

數(shù)據(jù)集中某些特征的最小值與最大值之間存在顯著差異。為了減少不同數(shù)值水平對(duì)模型的負(fù)面影響,文中采用對(duì)數(shù)標(biāo)度法對(duì)特征值進(jìn)行標(biāo)度,使其歸一化到同一區(qū)間。數(shù)值歸一化的過程可以表示為

xnorm=(x-xmin)/(xmax-xmin) ,

(3)

其中,x表示特征原本的值,xmax和xmin為特征所取得的最大值和最小值。

2.2.3 欠過采樣加權(quán)數(shù)據(jù)重采樣算法

由表1可見,在訓(xùn)練數(shù)據(jù)集中,5類攻擊的數(shù)據(jù)量非常不均勻,其中,數(shù)據(jù)量最大的nomal類有67 343 條數(shù)據(jù),而DoS和U2R這兩種類型只包含52和995條數(shù)據(jù)。在訓(xùn)練深度學(xué)習(xí)模型的過程中,若訓(xùn)練數(shù)據(jù)較少,則會(huì)導(dǎo)致模型無法充分學(xué)習(xí)數(shù)據(jù)的特征,而若訓(xùn)練數(shù)據(jù)過多,則又可能導(dǎo)致模型過擬合,即模型學(xué)習(xí)到了數(shù)據(jù)本身以外的特征。因此,極不平衡的數(shù)據(jù)會(huì)導(dǎo)致模型的學(xué)習(xí)效果不佳,導(dǎo)致數(shù)據(jù)量大的類別識(shí)別準(zhǔn)確度較高,反之較小。

數(shù)據(jù)分析中的過采樣和欠采樣是用來調(diào)整數(shù)據(jù)集類分布的技術(shù),也稱為數(shù)據(jù)重采樣。欠采樣通常是刪除數(shù)據(jù)量過大的類別的些許樣本,而過采樣增加了數(shù)據(jù)中少數(shù)樣本的數(shù)據(jù)量,以達(dá)到數(shù)據(jù)平衡。為解決數(shù)據(jù)量分布不平衡的問題,提高模型檢測(cè)少數(shù)類的精度,筆者提出一種過采樣、欠采樣和加權(quán)相結(jié)合的欠過采樣加權(quán)(Under-Over Sampling Weighted,UOSW)算法。該算法步驟設(shè)計(jì)如下:

設(shè)原始數(shù)據(jù)集為S1,輸出的數(shù)據(jù)集為S2,需要進(jìn)行重采樣處理的數(shù)據(jù)類型為typei,其原始數(shù)據(jù)集和樣本數(shù)量為Si和xi。

步驟1 計(jì)算數(shù)據(jù)集中每種類型的權(quán)重wi。在網(wǎng)絡(luò)訓(xùn)練中,當(dāng)訓(xùn)練集中每個(gè)類別的數(shù)據(jù)量非常接近(達(dá)到平均值,以下用average代替)時(shí),網(wǎng)絡(luò)的識(shí)別準(zhǔn)確率會(huì)很高。因此,文中計(jì)算每種類型的實(shí)際樣本量與理想樣本量之間的差值作為權(quán)重,以達(dá)到每種類型的均衡值。

(4)

其中,n表示數(shù)據(jù)集包含n種類別。

步驟2 數(shù)據(jù)欠采樣。對(duì)于數(shù)據(jù)量過大的類型,進(jìn)行數(shù)據(jù)欠采樣,使處理后的數(shù)據(jù)樣本接近平均值(average)。使用Python中sklearn庫(kù)的“train_test_split”方法將數(shù)據(jù)集Si分為兩個(gè)數(shù)據(jù)集Si-train,Si-remain。將Si-train作為訓(xùn)練集,并加入S2,其中,Si-train的數(shù)據(jù)量大小si=xi×wi;Si-remain用于接下來的數(shù)據(jù)過采樣操作,將其加入數(shù)據(jù)集Sremain。

步驟 3 數(shù)據(jù)過采樣。應(yīng)用過采樣算法SMOTE[13]處理數(shù)據(jù)量很少的類別的樣本。SMOTE的核心是在現(xiàn)有少數(shù)類樣本的基礎(chǔ)上生成新的同類樣本。由于SMOTE算法最初是針對(duì)二分類問題,而本文研究中存在多分類問題,因此對(duì)算法進(jìn)行了以下改進(jìn):

(1) 合并其他類型數(shù)據(jù)。將步驟2中經(jīng)過欠采樣處理的數(shù)據(jù)集Sremain和原始數(shù)據(jù)集中的少量類型的數(shù)據(jù)集合并,表示為Sunion。

(2) 改變標(biāo)簽。經(jīng)過(1),Sunion中包含與n種類別的數(shù)據(jù)。由于SMOTE算法只針對(duì)于二分類,因此要將需要進(jìn)行過采樣的類型與其他類型區(qū)分開來。將數(shù)據(jù)集Sunion的標(biāo)簽更改為同一類型,但不同于typei。

(3) 確定數(shù)據(jù)量大小。為了平衡數(shù)據(jù)集,需要對(duì)少數(shù)類樣本進(jìn)行擴(kuò)展,設(shè)擴(kuò)展后的數(shù)據(jù)量大小為si其中,si=xi×wi,wi是數(shù)據(jù)類型typei的權(quán)重。

(4) 數(shù)據(jù)過采樣。使用Python中imblearn庫(kù)的SMOTE方法,結(jié)合其他類型的數(shù)據(jù)生成所需的數(shù)據(jù),將其加入S2。

重復(fù)(1)~(4),直到數(shù)據(jù)量少于平均值的類型全部完成過采樣操作。

3 網(wǎng)絡(luò)安全態(tài)勢(shì)評(píng)估

3.1 網(wǎng)絡(luò)攻擊影響值

NSL-KDD數(shù)據(jù)集包括5種類型的網(wǎng)絡(luò)數(shù)據(jù):Normal、DoS、U2R、R2L和Probe。上述攻擊的基本信息如表2所示。

表2 5種攻擊類型的基本情況

基于通用漏洞評(píng)分系統(tǒng)(CVSS)制定了攻擊影響值評(píng)定表[14]。機(jī)密性(C)、完整性(I)和可用性(A)得分如表3所示。

表3 攻擊影響值評(píng)定表

每種攻擊類型的影響值(Ii)計(jì)算公式如下:

Ii=Ci+Ii+Ai。

(5)

3.2 網(wǎng)絡(luò)安全態(tài)勢(shì)量化

量化網(wǎng)絡(luò)安全態(tài)勢(shì),可以更直觀地分析網(wǎng)絡(luò)整體狀況。本文的網(wǎng)絡(luò)安全態(tài)勢(shì)量化評(píng)估過程主要包括4個(gè)部分:攻擊分析、計(jì)算攻擊的影響、計(jì)算網(wǎng)絡(luò)安全態(tài)勢(shì)值和網(wǎng)絡(luò)安全態(tài)勢(shì)定量評(píng)估。每個(gè)部分的處理過程設(shè)計(jì)如下:

(1) 攻擊分析

從測(cè)試數(shù)據(jù)集中隨機(jī)選取若干組數(shù)據(jù),并將其輸入到DAEDNN模型中,對(duì)其進(jìn)行二進(jìn)制和多分類,記二分類中檢測(cè)到的攻擊比例記為攻擊概率(attack probability,p)。

(2) 計(jì)算攻擊的影響值

結(jié)合表2、表3確定每一類攻擊類型的C、I、A值,并根據(jù)式(5)確定綜合的攻擊影響值。

(3) 計(jì)算網(wǎng)絡(luò)安全態(tài)勢(shì)值

網(wǎng)絡(luò)安全態(tài)勢(shì)值綜合考慮了網(wǎng)絡(luò)受到的全部攻擊和每種攻擊會(huì)對(duì)網(wǎng)絡(luò)造成的危害程度。設(shè)網(wǎng)絡(luò)安全態(tài)勢(shì)值為

(6)

其中,p為式(1)中所得出的攻擊概率,n和N表示一共有n種類型的數(shù)據(jù)和N個(gè)樣本,Ii表示每種攻擊類型的影響值,ti表示每種攻擊的出現(xiàn)次數(shù),tn為normal類型出現(xiàn)的次數(shù)。由于normal類型是正常的網(wǎng)絡(luò)數(shù)據(jù)流,對(duì)網(wǎng)絡(luò)的機(jī)密性、完整性和可用性不會(huì)有影響,因此它的影響分?jǐn)?shù)為0,只需要計(jì)算n-1種攻擊類型的影響分值即可。

(4) 網(wǎng)絡(luò)安全態(tài)勢(shì)定量評(píng)估

參考《國(guó)家突發(fā)公共事件應(yīng)急預(yù)案》[15]對(duì)網(wǎng)絡(luò)安全形勢(shì)進(jìn)行分類。根據(jù)網(wǎng)絡(luò)安全態(tài)勢(shì)值0.00~0.20、0.21~0.40、0.41~0.60、0.61~0.80和0.81~1.00的5個(gè)區(qū)間,將網(wǎng)絡(luò)安全態(tài)勢(shì)嚴(yán)重程度劃分為安全、低風(fēng)險(xiǎn)、中等風(fēng)險(xiǎn)、高風(fēng)險(xiǎn)和超風(fēng)險(xiǎn)等5個(gè)級(jí)別。

4 實(shí)驗(yàn)結(jié)果與分析

實(shí)驗(yàn)的硬件環(huán)境為:Intel(R) Xeon(R) Silver處理器,顯卡為NVIDIA Quadro P2000,內(nèi)存為32 GB。訓(xùn)練和測(cè)試實(shí)驗(yàn)均在Windows 64位操作系統(tǒng)上進(jìn)行。使用的編程語(yǔ)言和機(jī)器學(xué)習(xí)庫(kù)為Python3.5和TensorFlow2.0。模型的訓(xùn)練和測(cè)試均使用GPU加速。

4.1 評(píng)價(jià)指標(biāo)

文中所用的評(píng)價(jià)指標(biāo)如下所示:

真陽(yáng)性(True Positive,TP):表示被模型預(yù)測(cè)為攻擊樣本而實(shí)際也是攻擊樣本的次數(shù)。

假陽(yáng)性(False Positive,F(xiàn)P):表示被模型預(yù)測(cè)為正常樣本而實(shí)際是攻擊樣本的次數(shù)。

真陰性(True Negative,TN):表示被模型預(yù)測(cè)為正常樣本而實(shí)際也是正常樣本的次數(shù)。

假陰性(False Negative,F(xiàn)N):表示被模型預(yù)測(cè)為攻擊樣本而實(shí)際是正常樣本的次數(shù)。

下列公式中,PT,PF,NT和NF分別表示真陽(yáng)性,假陽(yáng)性,真陰性和假陰性。

準(zhǔn)確率(Precision,P):表示模型預(yù)測(cè)正確的攻擊樣本頻率。準(zhǔn)確率越高,誤報(bào)率越低。它可以表示為

P=PT/(PT+PF) 。

(7)

召回率(Recall,R):表示被模型正確分類的攻擊樣本與實(shí)際攻擊樣本的百分比。它可以表示為

R=PT/(PT+NF) 。

(8)

F1值(F1-score,F(xiàn)):表示綜合考慮了模型的準(zhǔn)確率和召回率。它可以表示為

F=2PR/(P+R) 。

(9)

4.2 模型二分類結(jié)果

在二分類任務(wù)時(shí),選擇ROC曲線和AUC面積來反映分類模型的性能。ROC曲線表示不同閾值設(shè)置下分類模型的性能;AUC面積為ROC曲線下的面積。面積越大,表示模型的性能越好;通過面積可以直觀地對(duì)比各個(gè)模型。

在二值分類任務(wù)中,模型只需要區(qū)分?jǐn)?shù)據(jù)是攻擊數(shù)據(jù)還是正常數(shù)據(jù)。為了檢驗(yàn)文中模型的有效性,將筆者提出的DAEDNN與決策樹(Decision Tree,DT)[8]、支持向量機(jī)(Support Vector Machine,SVM)[8]和長(zhǎng)短期記憶網(wǎng)絡(luò)(Long Short-Term Memory,LSTM)[9]等模型進(jìn)行了比較。為了驗(yàn)證文中模型的泛化性,使用KDDTrain+的80%數(shù)據(jù)進(jìn)行訓(xùn)練,分別對(duì)剩下的20%和KDDTest+進(jìn)行測(cè)試。4種模型的二分類結(jié)果如圖3所示。

從圖3(a)可以看出,在使用20% KDDTrain+對(duì)4種模型進(jìn)行測(cè)試時(shí),4種模型均表現(xiàn)出較好的準(zhǔn)確性和泛化能力。這是由于訓(xùn)練集和測(cè)試集來源于同一集合,模型學(xué)習(xí)到的特征可以完全應(yīng)用于測(cè)試數(shù)據(jù)集,所以能得到理想的結(jié)果。然而,從圖3(b)可見,如果使用KDDTest+數(shù)據(jù)集作為測(cè)試數(shù)據(jù)集,4個(gè)模型的準(zhǔn)確性則會(huì)降低。這是因?yàn)闇y(cè)試訓(xùn)練集中存在一些與訓(xùn)練數(shù)據(jù)集數(shù)據(jù)格式不同的樣本,這種情況與真實(shí)的網(wǎng)絡(luò)情況一致,即模型面臨眾多未知攻擊類型。從圖3(b)可見,在使用KDDTest+數(shù)據(jù)集進(jìn)行模型測(cè)試的情況下,DAEDNN模型的準(zhǔn)確率明顯優(yōu)于其他3個(gè)模型,分別比DT、SVM和LSTM高出近13.35%、16.17%和2.72%,說明DAEDNN模型的學(xué)習(xí)能力更強(qiáng),具有較好的泛化性。

4.3 模型五分類結(jié)果

使用KDDTest+數(shù)據(jù)集對(duì)DT、SVM、LSTM、DAEDNN和應(yīng)用UOSW算法的DAENDD這5種模型進(jìn)行檢驗(yàn),并選取準(zhǔn)確率、召回率和F1值作為評(píng)價(jià)指標(biāo),對(duì)各種模型進(jìn)行比較分析。不同模型的指標(biāo)得分如圖4所示,圖中的縱坐標(biāo)表示評(píng)價(jià)指標(biāo)的百分?jǐn)?shù),數(shù)值越高,模型性能越好。

圖4 不同模型的各類指標(biāo)得分

從圖4可見,DAEDNN(UOSW)模型在準(zhǔn)確率、召回率和F1值等方面都優(yōu)于其他4種模型。實(shí)驗(yàn)結(jié)果表明,DAEDNN(UOSW)提高了少數(shù)訓(xùn)練數(shù)據(jù)樣本的攻擊類型的召回率和準(zhǔn)確率,而對(duì)擁有大量訓(xùn)練樣本的攻擊檢測(cè)性能并沒有降低。

值得注意的是,結(jié)合文中的UOSW算法后,DAEDNN的準(zhǔn)確率和召回率更高,泛化能力更強(qiáng)。與DT、SVM和LSTM模型相比,DAEDNN(UOSW)的F1值分別提高了約2.77%、10.5%和5.2%。

4.4 網(wǎng)絡(luò)安全態(tài)勢(shì)量化評(píng)估

從測(cè)試數(shù)據(jù)集中隨機(jī)選取相同數(shù)量的測(cè)試樣本,對(duì)網(wǎng)絡(luò)安全狀況進(jìn)行了量化評(píng)估,并對(duì)于分別用不同的模型計(jì)算網(wǎng)絡(luò)安全態(tài)勢(shì)值,其中20組測(cè)試的網(wǎng)絡(luò)安全態(tài)勢(shì)值如圖5所示。

圖5 20組測(cè)試的網(wǎng)絡(luò)安全態(tài)勢(shì)值

由圖5可見,基于DAEDNN模型計(jì)算出的網(wǎng)絡(luò)安全態(tài)勢(shì)值最貼合樣本的實(shí)際安全態(tài)勢(shì)值,相比于SVM和DT這兩類傳統(tǒng)的機(jī)器學(xué)習(xí)模型,DAEDNN和LSTM這兩類深度學(xué)習(xí)的方法更能表示數(shù)據(jù)的真實(shí)情況。其他3種模型的態(tài)勢(shì)值與實(shí)際態(tài)勢(shì)值相差較大的原因是,訓(xùn)練樣本中存在樣本量極少的攻擊類型,導(dǎo)致模型無法充分學(xué)習(xí)到這類攻擊的特征。而DAEDNN模型應(yīng)用了UOSW算法,提高了模型檢測(cè)少樣本攻擊類型的準(zhǔn)確率。所提出模型計(jì)算出的態(tài)勢(shì)值與實(shí)際態(tài)勢(shì)值之間存在些許差異,但大多數(shù)態(tài)勢(shì)值都落在了相同的區(qū)域內(nèi),根據(jù)3.2節(jié)定義的網(wǎng)絡(luò)安全態(tài)勢(shì)嚴(yán)重程度和實(shí)際情況相符。

5 結(jié)束語(yǔ)

筆者針對(duì)傳統(tǒng)網(wǎng)絡(luò)安全態(tài)勢(shì)評(píng)估方法在處理大量網(wǎng)絡(luò)數(shù)據(jù)時(shí)效率低的缺點(diǎn),提出一種深度學(xué)習(xí)的網(wǎng)絡(luò)安全態(tài)勢(shì)評(píng)估方法。該方法首先結(jié)合了自動(dòng)編碼器和深度神經(jīng)網(wǎng)絡(luò)組成DAEDNN模型,用于對(duì)網(wǎng)絡(luò)攻擊進(jìn)行識(shí)別。根據(jù)識(shí)別的結(jié)果,計(jì)算攻擊概率和攻擊影響值,從而得出網(wǎng)絡(luò)安全態(tài)勢(shì)量化值。通過安全態(tài)勢(shì)量化值,可以更直觀地反映網(wǎng)絡(luò)安全態(tài)勢(shì)。實(shí)驗(yàn)結(jié)果表明,筆者提出的模型在二分類和多分類的攻擊檢測(cè)方面優(yōu)于其他模型。此外,在進(jìn)行多種攻擊類型檢測(cè)時(shí),結(jié)合所提出的UOSW算法,可以提高模型對(duì)擁有少量訓(xùn)練樣本的攻擊的檢測(cè)準(zhǔn)確率,從而可以更準(zhǔn)確地評(píng)估網(wǎng)絡(luò)安全態(tài)勢(shì)。

猜你喜歡
網(wǎng)絡(luò)安全分類模型
一半模型
分類算一算
重要模型『一線三等角』
重尾非線性自回歸模型自加權(quán)M-估計(jì)的漸近分布
分類討論求坐標(biāo)
網(wǎng)絡(luò)安全
網(wǎng)絡(luò)安全人才培養(yǎng)應(yīng)“實(shí)戰(zhàn)化”
上網(wǎng)時(shí)如何注意網(wǎng)絡(luò)安全?
數(shù)據(jù)分析中的分類討論
教你一招:數(shù)的分類
主站蜘蛛池模板: 香蕉99国内自产自拍视频| 国产91麻豆免费观看| 亚洲午夜福利在线| 久爱午夜精品免费视频| 激情六月丁香婷婷| 毛片网站免费在线观看| 精品国产欧美精品v| 大陆国产精品视频| 日韩一区二区三免费高清| 免费毛片全部不收费的| 午夜视频www| 波多野结衣一区二区三视频| 国产精品亚洲天堂| 亚洲欧美一区二区三区图片| 久久国产精品无码hdav| 四虎在线观看视频高清无码| 男女性午夜福利网站| 国产成人精品视频一区视频二区| a欧美在线| 亚洲一区二区无码视频| 亚洲国产成人精品无码区性色| 丰满的少妇人妻无码区| 伊人精品视频免费在线| 国产传媒一区二区三区四区五区| 国产超碰在线观看| 国产成人精彩在线视频50| 国产va在线观看| 毛片免费在线| 激情六月丁香婷婷| 一区二区自拍| 成年看免费观看视频拍拍| 18禁黄无遮挡免费动漫网站| 99久久精品久久久久久婷婷| 欧美国产日韩在线| 国产96在线 | 国产精品护士| 毛片网站在线播放| 亚洲三级色| 免费国产无遮挡又黄又爽| 国产又粗又爽视频| 精品久久高清| 久久综合伊人77777| 最新午夜男女福利片视频| a级毛片免费看| 看国产毛片| 四虎国产精品永久在线网址| 国产精品永久免费嫩草研究院| 天天躁夜夜躁狠狠躁躁88| 丝袜国产一区| 成人精品午夜福利在线播放 | 国产超碰在线观看| 国产成人精品综合| 亚洲全网成人资源在线观看| 国产成人无码AV在线播放动漫| 91精品aⅴ无码中文字字幕蜜桃| 伊人久久福利中文字幕| 婷婷在线网站| 亚洲精品不卡午夜精品| 自偷自拍三级全三级视频| 永久免费AⅤ无码网站在线观看| 91蝌蚪视频在线观看| 色国产视频| 成人亚洲天堂| 在线观看热码亚洲av每日更新| 久久网欧美| 国产欧美日韩18| 亚洲第一色视频| 国产精品欧美在线观看| 好吊妞欧美视频免费| 欧美一区二区三区国产精品| 国产成人精品亚洲日本对白优播| 伊人蕉久影院| 色网在线视频| 亚洲国产第一区二区香蕉| 亚洲一区二区三区麻豆| 国产精品区视频中文字幕| 国产黑丝视频在线观看| 国产无码制服丝袜| 久久综合亚洲鲁鲁九月天| 狠狠色婷婷丁香综合久久韩国| 国产精品成人久久| 2020极品精品国产|