999精品在线视频,手机成人午夜在线视频,久久不卡国产精品无码,中日无码在线观看,成人av手机在线观看,日韩精品亚洲一区中文字幕,亚洲av无码人妻,四虎国产在线观看 ?

基于改進的深度信念網絡的入侵檢測方法

2020-10-19 04:40:48宋雪樺王昌達徐夏強蔡冠宇
計算機工程與應用 2020年20期
關鍵詞:分類特征檢測

汪 盼,宋雪樺,王昌達,陳 鋒,徐夏強,蔡冠宇

1.江蘇大學 計算機科學與通信工程學院,江蘇 鎮江 212013

2.江蘇僅一聯合智造有限公司,江蘇 丹陽 212300

3.鎮江市丹徒區科學技術局,江蘇 鎮江 212000

1 引言

隨著通信技術的迅速發展,基于Internet 的研究和應用越來越廣泛,網絡安全問題日益凸顯,安全防護技術已成為研究熱點之一。入侵檢測系統[1](Instrusion Detection System,IDS)是一種保護用戶隱私和數據的重要網絡安全防御手段。IDS 能夠主動發現和識別入侵行為并采取相應操作,從而確保網絡運行安全可靠。

為有效識別各種網絡攻擊,研究者將機器學習方法引入IDS 中,其中支持向量機算法[2](Support Vector Machine,SVM)較早應用在入侵檢測技術中。假設n為訓練樣本數,則SVM 算法的時間、空間復雜度分別為O(n3)、O(n2),當網絡入侵樣本較少時,SVM 算法具有良好的學習和檢測能力。文獻[3]提出了一種基于交替決策樹(Alternating Decision Trees,ADT)分類的入侵攻擊方法,通過與樸素貝葉斯算法的對比實驗驗證了該方法提高檢測準確率的同時降低了誤報率。近來,遺傳算法、隨機森林[4]等算法先后應用于網絡入侵檢測。但是面對海量入侵數據的分類問題,傳統淺層機器學習方法會受到時間和空間的限制,系統處理速度大幅度降低。

基于此,面向海量數據的入侵檢測方法的研究重點在于進行特征學習和降維。Han等人[5]提出的入侵檢測方法將樸素貝葉斯網絡與主成分分析算法(Principal Component Analysis,PCA)結合,采用PCA 提取主要數據特征,可以有效減少網絡數據的維數。Hinton 等人[6]提出的深度信念網絡(Deep Belief Network,DBN)可以實現對大量無標簽數據進行特征提取,該理論已成功地運用在語音識別、計算機視覺等領域。高妮等人[7]提出了面向IDS 的DBN 模型,深入分析和驗證了DBN 網絡結構對異常入侵行為識別性能的影響,實驗結果表明DBN 適用于高維、非線性的海量無標簽數據的關鍵特征提取。文獻[8]充分考慮了DBN能夠挖掘海量網絡數據的豐富內在信息,提出了基于DBN-MSVM入侵檢測方法。文獻[9]將DBN與核極限學習機(Kernel Extreme Learning Machine,KELM)結合,提出了一種混合深度學習算法。汪洋等人[10]針對網絡入侵檢測中數據分布不平衡問題,提出了DBN-WOS-KELM 算法,能夠實現在線更新輸出權重。

為了DBN在重建誤差時獲得更好的收斂速度和訓練效果,本文引入自適應學習速率(Adaptive Learning Rate,ALR)思想,根據參數每次迭代方向的異同來動態調整學習率,提出了一種基于改進的深度信念網絡的入侵檢測(Softmax Classification based on Improved Deep Belief Network,IDBN-SC)方法。在訓練DBN模型過程中,利用自適應學習速率實現模型參數的快速收斂,采用softmax分類器對網絡入侵行為進行識別分類。該方法可以有效提高對網絡數據的檢測準確率而且檢測速度快。

2 特征提取原理

2.1 受限玻爾茲曼機

受限玻爾茲曼機[11](Restricted Boltzmann Machine,RBM)是一個包含可視層單元(v)和隱藏層單元(h)的兩層神經網絡,如圖1所示。

圖1 RBM結構模型

可視層單元v(v1,v2,…,vn)表示輸入數據,隱藏層單元h(h1,h2,…,hm)進行特征提取,W為連接v和h之間的權重矩陣,a,b分別表示隱藏層和可視層的偏置向量,v和h服從伯努利分布。RBM 采用對比分歧算法(Contrastive Divergence,CD)的學習方法更新RBM 模型的參數θ(W,a,b)。

2.2 深度信念網絡

在入侵檢測過程中,網絡數據只有部分特征被真正利用,因此通過深度信念網絡進行提取數據特征,實現對海量高維原始網絡數據特征降維。DBN結構模型如圖2所示,DBN是由多層受限玻爾茲曼機網絡和單層反向傳播(Back Propagation,BP)網絡依次堆疊構成的深層神經網絡[12]。

圖2 DBN結構模型

在訓練深度信念網絡模型過程中,DBN 可以分為無監督的預訓練和基于BP算法的權值微調兩個過程。

(1)無監督的預訓練:通過對比分歧算法逐層訓練RBM 網絡,將無標簽原始網絡數據映射至不同特征空間,從而保留數據的關鍵特征信息,獲得較優的低維表示。

(2)基于BP 算法的權值微調:BP 網絡設置在深度信念網絡的最后一層,利用被附加到DBN 頂層的帶標簽數據,將誤差損失自頂而下地逐層傳播至每一層RBM 網絡,對整個DBN 的權值進行調整,從而獲得最優的低維表示數據[13]。

在基于BP 算法的權值微調過程中,首先計算訓練樣本xi經過DBN 的實際輸出表示xi',對于輸出層節點k,根據式(7)計算其實際輸出表示與期望輸出表示xi的誤差項δk:

計算每個隱藏層節點h的誤差項δh,更新每個網絡模型參數θij:

其中,θhk為隱藏層節點h與后續輸出層節點k的連接權值,η表示學習速率。

2.3 自適應學習速率

一般來說,逐層訓練RBM網絡需要較長的時間,因此選擇適當的學習速率參數是提高DBN性能的重要因素。由于RBM在訓練過程中每次迭代后的梯度更新方向不盡相同,為了提高RBM網絡訓練收斂速度,本文提出了一種自適應學習速率(ALR)方法。

與RBM 網絡采用全局學習速率不同,ALR 方法是每個連接權重Wij對應一個學習速率εij。在更新模型參數過程中,學習速率由式(11)確定:

其中,μ表示學習速率的增量系數 (μ >1),d表示學習速率的衰減系數(d <1)。

如果兩個相鄰的更新梯度具有相同的方向,則當前模型參數的學習速率增加,而對于方向相反的參數更新梯度,則學習速率減小,從而可以有效避免訓練過程中在非最優解處產生振蕩。

傳統固定學習率在網絡更新權值過程中并不總是朝著減少損失函數的方向進行每一步調節,這導致收斂速度大幅度下降,但自適應學習速率方法可以根據相鄰兩次更新方向的異同自適應變化,能夠克服傳統固定學習率方法的缺點,通過自動調節學習率以變步長的方式加速了每個RBM 網絡無監督學習(即從可視層輸入高維數據到隱藏層所表示的低維抽象數據的過程)。

預訓練階段,在求解目標函數的最優解過程中,ALR 方法實現利用誤差曲面的凹凸性自動增大或減少學習速度,確保模型能夠準確且迅速地找到最優點。采用ALR方法的DBN模型不僅能夠提高訓練網絡的魯棒性,還能減少收斂過程所需的時間。

在每個RBM 的無監督學習過程中,網絡輸出與吉布斯采樣過程的中間狀態有關,ALR方法以變步長的方式有規律地增大或者減小模型對數據內在關聯的學習力度。同時分層降維能夠達到高維數據維數呈指數下降趨勢,因此,在單個RBM 運用ALR 方法加速收斂的情況下,由多個RBM構成的DBN能夠產生收斂速度指數提高的效果。

3 IDBN-SC入侵檢測方法

3.1 入侵檢測方法設計

本文提出的入侵檢測方法總體設計框架如圖3 所示,主要包含3個模塊:數據預處理、IDBN特征降維、入侵識別。

圖3 IDBN-SC入侵檢測方法總體框架

(1)數據預處理。首先數值化NSL-KDD 數據集[14]存在的所有字符型屬性特征,再歸一化處理數值型數據,獲得標準化數據集。

(2)IDBN 特征降維。對預處理后獲得的數據集進行無監督的預訓練和基于BP 算法的權值微調,獲得最優的低維表示[15]。

(3)入侵識別。把降維數據輸入到softmax分類器[16]進行訓練分類。softmax 分類器輸出的是分類概率,選取概率最大的分類,以具體的入侵類別的形式輸出結果。

3.2 數據預處理

NSL-KDD 數據集的每條數據由38 個數字型屬性特征和3個字符型屬性特征組成。訓練之前,需要對數據進行預處理。首先采用屬性映射方法將所有字符型特征變換成數值型數據。例如“protocol_type”屬性特征存在3種類型取值:tcp、udp、icmp,將其分別轉化為二進制向量[1,0,0] 、[0,1,0] 和[0,0,1] 。以此類推,“service”屬性特征存在70種類型取值,“flag”屬性特征存在11種類型取值,這樣可以建立符號值與其對應特征向量的映射關系,將41 個原始屬性特征映射成122 維特征數據。然后最小-最大規范化處理獲得的數據,以消除各屬性間的量綱影響。根據式(12)將各屬性特征歸一化到同一數量級,即[0,1] 范圍。

其中,y為特征屬性值,ymax、ymin分別為該屬性的最大值和最小值。

3.3 softmax分類器

設樣本類別數量為k,模型參數為θ,對于給定的樣本輸入x,根據式(13)計算每一個類別j的概率值p(y=j|x):

對有m個樣本點的數據集,softmax 回歸[17]的損失代價函數為:

其中λ是權重衰減項,1{?}是示性函數,其取值規則:1{值為真的表達式}=1,1{值為假的表達式}=0。

式(14)運用了貝葉斯正則化的思想使J(θ)為嚴格凸函數,保證函數存在唯一解。對式(14)進行極小化,求出J(θ)對θj的偏導數,得到:

根據式(16)更新模型參數θ:

其中α為學習速率。

與SVM分類器相比,softmax分類器計算簡單且高效,主要用于解決多分類問題。SVM 的計算是無標定的,并且難以針對所有分類的評分值給出直觀解釋,而softmax 函數將原始分類評分轉化成歸一化的對數概率,允許計算出對于所有分類標簽的可能性,鼓勵正確分類的歸一化的對數概率變高,其余的變低。

針對網絡數據的入侵識別問題,每種網絡攻擊類型之間是互斥的,softmax分類器的目標函數選擇交叉熵,使得目標類的1{}?等于1,其他類的示性函數等于0。同時在softmax分類過程中網絡數據的屬性特征對其分類概率的影響是乘性的,使得目標類的對數概率遠大于其他類。

4 實驗及結果分析

4.1 實驗環境和數據描述

硬件環境:64位Windows10操作系統、Intel i7處理器、8 GB內存和4 GB GPU的計算機。

開發環境:Eclipse+PyDev。

編程語言:Python。

測試數據集:NSL-KDD 數據集。該數據集包含125 973 個訓練數據和22 543 個測試數據,各類數據具體分布情況如表1所示。

表1 各種類型數據分布情況

NSL-KDD 數據集被分成拒絕服務攻擊(Denial of Service,DoS)、遠程用戶攻擊(Remote to Local,R2L)、用戶到根攻擊(User to Root,U2R)、端口掃描攻擊(Probe)4大類攻擊類型和1類正常(Normal)數據。

4.2 實驗評價指標

實驗中,采用檢測準確率(Accuracy,AC)、誤報率(False Alarm Rate,FAR)、檢測時間(Ti)和重構誤差(error)作為衡量模型的性能的評價指標。

其中,n為樣本個數,m為每層網絡輸入層節點個數,vki為第k個樣本的原始數據,vki'為第k個樣本的重構數據。

4.3 實驗結果及分析

本文設計了3組實驗:(1)不同IDBN網絡深度對入侵檢測的性能影響;(2)不同學習速率對重構誤差的影響;(3)本文提出的入侵檢測方法與其他方法的性能對比。

實驗中自適應速率的初始值設置為0.05,增量系數μ和衰減系數d分別取值為1.25和0.8,將IDBN預訓練的迭代次數設置為100 次,基于BP 算法的權值微調的迭代次數設置為120次。

4.3.1 IDBN網絡深度實驗

針對IDBN 的深度是影響入侵檢測效果的重要因素,實驗對5 種不同的IDBN 網絡結構進行檢測準確率和誤報率對比。設置 IDBN2、IDBN3、IDBN4、IDBN5和IDBN6分別表示為122-110-30、122-110-70-30、122-110-90-60-30、122-110-90-70-50-30 和 122-110-95-70-50-40-30的RBM網絡結構(IDBNi表示IDBN包含i層RBM)。從圖4 可看出,IDBN 采用 4 層的 RBM 網絡結構的檢測準確率最大,誤報率最低。

圖4 不同深度的IDBN的性能對比

4.3.2 學習速率對比實驗

本文提出的入侵檢測方法中,IDBN 選取4 層RBM網絡對輸入數據進行特征降維。NSL-KDD數據集中41個屬性特征經過數據預處理轉化成122維特征,因此設置IDBN 的輸入層節點數為122,隱藏層節點數依次選取110,90,60和30。

將自適應學習速率與三個不同的全局固定學習速率 (ε=0.005,ε=0.05 和ε=0.5) 進行比較,對比結果如圖5所示。對于固定的學習速率來說,設置ε=0.5 的重構誤差最大,ε=0.005 的訓練收斂速度緩慢,而ε=0.05的結果最好。與固定學習速率相比,ALR在迭代次數為90左右之后,重構誤差趨于平穩,在保證低重構誤差的同時具有較快的收斂速度。

圖5 ALR與固定全局學習速率的重構誤差對比

4.3.3 各分類方法的檢測性能對比實驗

將IDBN、PCA、自編碼網絡(AutoEncoder Network,AEN)方法進行對比來分析特征降維效果。首先利用特征學習方法進行降維,然后采用softmax 分類器對降維后的網絡數據進行入侵分類。在訓練過程中分別抽取NSL-KDD數據集中20%、40%、50%、70%的數據進行實驗分析。

從表2可以看出,在70%數據訓練階段,IDBN方法的準確率較PCA 和AEN 分別提高了2.97 個百分點和1.19個百分點。IDBN結合了無監督學習和有監督學習的優點,通過多次映射能夠發現海量網絡數據中的復雜結構及其概率分布。因此,對不同的數據集的測試表明,IDBN的準確率都比較高,對高維無標簽網絡數據的特征提取效果最好。

表2 IDBN與其他特征學習方法的準確率對比%

在NSL-KDD數據集中隨機提取不同攻擊類型進行分類實驗,對比分析不同入侵行為的準確率和誤報率。其中SVM 的核函數采用徑向基函數,設置核函數控制因子g=0.000 01,懲罰因子C=1 000,采用10 折交叉驗證獲得較高的準確率。人工神經網絡(Neural Network,NN)采用5層結構,利用BP算法優化網絡,其余參數和DBN類似。

從表3可以看出,IDBN-SC方法對Normal、DoS、R2L、U2L 和Probe 的識別準確率分別是98.34%、97.25%、83.47%、78.12%和96.26%,相比其他四種方法準確率平均提高 7.49 個百分點。IDBN-SC 方法對 Normal、DoS、R2L、U2L 和 Probe 的誤報率分別是 0.87%、1.23%、10.49%、17.12%、2.94%,誤報率平均降低6.01 個百分點。IDBN-SC 方法利用IDBN 模型保留網絡數據的關鍵重要特征,去除冗余特征,實現高維特征向量的特征提取,同時softmax 分類器支持類別互斥的數據分類。因此,實驗結果表明IDBN-SC 方法在對不同入侵行為的檢測準確率方面要高于其他四種分類方法,且更能精確檢測網絡入侵行為。

表3 針對不同攻擊類型的性能比較 %

進一步驗證IDBN-SC 方法的性能,隨機抽取NSLKDD 數據集中20%、40%、50%、70%的數據,分別進行檢測準確率和時間的對比分析。

從表4可以看出,IDBN-SC方法在不同的數據集上的準確率分別為96.43%、98.65%、97.37%、98.24%,相比較其他四種方法準確率平均提高3.02 個百分點。而IDBN-SC 方法在不同數據集上的分類處理時間分別為6.87 s、10.56 s、14.64 s、18.73 s,相比softmax方法平均縮短5.58 s,相比IDBN-SVM 方法平均縮短2.77 s。實驗結果表明IDBN-SC方法在準確率上顯著提高了網絡入侵數據的識別能力,極大地縮短了softmax 分類器的訓練時間。SVM分類器的時間復雜度是其輸入向量的指數函數,softmax 分類器的時間復雜度是其輸入向量的一次函數,ADT 分類器的時間復雜度與其輸入向量和樹的深度有關,NN 算法的時間復雜度與其輸入向量和網絡層數有關。因此,通過IDBN進行特征降維,IDBN-SC方法有效地減少分類器輸入向量維數,以縮短網絡數據分類的處理時間。

表4 幾種入侵檢測方法的性能對比

5 結束語

針對傳統的入侵檢測方法很難快速準確地分類通信過程中海量無標簽網絡數據的問題,本文利用深度學習在數據特征降維的優勢,提出基于改進的深度信念網絡的softmax 分類入侵檢測方法。該方法利用IDBN 將大量高維無標簽數據進行特征提取,使用ALR 保證模型參數快速收斂,采用softmax 分類器進行入侵行為識別。實驗表明本文提出的IDBN-SC方法不僅提高了網絡攻擊分類準確率,同時顯著地縮短了入侵檢測的分類處理時間。IDBN-SC方法為入侵檢測在區塊鏈、物聯網等領域的網絡安全應用提供了一種高效、可行的研究方法。

猜你喜歡
分類特征檢測
“不等式”檢測題
“一元一次不等式”檢測題
“一元一次不等式組”檢測題
分類算一算
如何表達“特征”
不忠誠的四個特征
當代陜西(2019年10期)2019-06-03 10:12:04
分類討論求坐標
數據分析中的分類討論
教你一招:數的分類
抓住特征巧觀察
主站蜘蛛池模板: 国产一区免费在线观看| 国产精品无码一区二区桃花视频| 无码啪啪精品天堂浪潮av| 欧美午夜理伦三级在线观看| 欧美国产日韩在线| 久久精品国产亚洲麻豆| 在线日韩日本国产亚洲| 婷婷激情亚洲| 国产精品99在线观看| 色噜噜在线观看| 国产精品香蕉在线| 亚洲人成影院在线观看| yjizz视频最新网站在线| 日韩无码黄色| 精品视频一区在线观看| 日本免费福利视频| 亚洲女同一区二区| 国产自无码视频在线观看| 沈阳少妇高潮在线| 精久久久久无码区中文字幕| 91精品福利自产拍在线观看| 91久久国产热精品免费| 亚洲第一区精品日韩在线播放| 亚洲乱码在线播放| 国产精品极品美女自在线网站| 欧美成人免费一区在线播放| 乱人伦视频中文字幕在线| 成人综合在线观看| 人妻一区二区三区无码精品一区| 99精品在线视频观看| 亚洲成在线观看| 激情午夜婷婷| 人妻21p大胆| 亚洲免费毛片| 无码久看视频| 91福利片| 国产91久久久久久| 国产精品精品视频| 成年午夜精品久久精品| AV无码国产在线看岛国岛| 中文国产成人久久精品小说| 亚洲精品波多野结衣| 54pao国产成人免费视频| 亚洲精品无码AV电影在线播放| 精品国产www| 97国产成人无码精品久久久| 欧美日韩精品综合在线一区| 色综合热无码热国产| 老司国产精品视频91| 色久综合在线| 国产美女人喷水在线观看| 九九九精品成人免费视频7| 亚洲日韩高清在线亚洲专区| 中文字幕不卡免费高清视频| 久久精品人人做人人爽电影蜜月| 国产精品丝袜视频| 欧美激情伊人| 免费A级毛片无码免费视频| 欧美在线伊人| 成人韩免费网站| 欧美亚洲日韩中文| 日韩欧美91| 精品无码视频在线观看| 91色爱欧美精品www| 欧美亚洲国产精品久久蜜芽| 永久毛片在线播| 国产成人精品男人的天堂下载 | 456亚洲人成高清在线| 亚洲区一区| 国产剧情国内精品原创| 在线永久免费观看的毛片| 中国一级特黄视频| 欧美精品另类| 国产永久无码观看在线| 亚洲成网站| 欧洲av毛片| 亚洲区第一页| 亚洲福利一区二区三区| 无码国产伊人| 亚洲日韩精品伊甸| 免费jizz在线播放| 爱爱影院18禁免费|