999精品在线视频,手机成人午夜在线视频,久久不卡国产精品无码,中日无码在线观看,成人av手机在线观看,日韩精品亚洲一区中文字幕,亚洲av无码人妻,四虎国产在线观看 ?

融合自編碼降維的改進DNN水利工控網(wǎng)入侵檢測算法*

2021-12-01 14:17:46劉慶華趙雪寒
計算機與數(shù)字工程 2021年11期
關鍵詞:泵站檢測模型

劉慶華 趙雪寒

(江蘇科技大學電子信息學院 鎮(zhèn)江 212001)

1 引言

隨著科技互聯(lián)網(wǎng)的發(fā)展,工業(yè)系統(tǒng)在許多領域取得了廣泛的應用。許多工控系統(tǒng)在建立之初主要考慮系統(tǒng)的功能性,并未過多考慮系統(tǒng)的可靠性,工控系統(tǒng)的安全性面臨著一定的風險[1~3]。

本文在對江蘇省常熟水利樞紐望虞河站進行調(diào)研后針對水利泵站工控網(wǎng)易受攻擊的分析主要有[4~6]網(wǎng)絡結構的設計存在漏洞,且防護力度不夠;主從站之間數(shù)據(jù)傳輸缺乏加密機制認證,從站設備正常運營受到影響;泵站工控網(wǎng)內(nèi)通信協(xié)議的漏洞導致非法數(shù)據(jù)的入侵。針對以上問題,本文設計了一套融合自編碼降維的改進深度神經(jīng)網(wǎng)絡的工控網(wǎng)非法數(shù)據(jù)入侵檢測算法模型。該算法模型主要研究、分析協(xié)議自身及面臨的安全性問題,結合自編碼降維算法準確地檢測出非法入侵的數(shù)據(jù),為防護水利工控網(wǎng)通信安全奠定了基礎。

2 水利泵站工控網(wǎng)檢測算法

2.1 自編碼數(shù)據(jù)降維

工控網(wǎng)內(nèi)的數(shù)據(jù)流動量是很大的,就水利泵站通信網(wǎng)而言,從底層設備導入到本地數(shù)據(jù)庫的每條數(shù)據(jù)都包含了27維特征,維度越高,數(shù)據(jù)在每個特征維度上的分布就越稀疏,這對于深度學習算法而言是災難性的,故而在進行網(wǎng)絡模型訓練前需要進行數(shù)據(jù)降維,本文采用自編碼器對數(shù)據(jù)進行處理,該方法可以有效地初始化權值,相比主成分分析法更有用。主成分分析法(PCA)就是為了從多維特征數(shù)據(jù)中找到能反映主元信息的數(shù)據(jù)屬性,而自動編碼器也正是如此,它實際上是一種無監(jiān)督學習算法,一種盡可能復現(xiàn)輸入信號的神經(jīng)網(wǎng)絡,因此必須在輸入數(shù)據(jù)中提取出最重要的有代表性的特征因素。

自動編碼網(wǎng)絡首先將輸入的27維特征通過編碼網(wǎng)絡得到編碼,然后初始化編碼網(wǎng)絡的權值[ω1,ω2,…ωn],給定樣本數(shù)據(jù)[x1,x2…xn],為了能更加有效地表示樣本數(shù)據(jù),加入了稀疏編碼算法以更好地搜尋基礎特征,即用一組基向量的線性組合來表示輸入向量X:

通過稀疏編碼算法訓練學習一組基向量[φ1,φ2,…]后,利用基向量得到對給定樣本數(shù)據(jù)的表達向量[α1,α2,…],經(jīng)過不斷訓練和調(diào)整編碼網(wǎng)絡的權值和偏置值使重構誤差最小,本文采用誤差的偏導數(shù)后向傳播的方式得到梯度,從而可以將權值調(diào)節(jié)到最佳值,權值更新的公式如下:

其中,wn指n層的權值更新量,En+1是下一層網(wǎng)絡的誤差,In是本層的輸入,bn是n層偏置項更新量,Res是殘差。在得到第一層的編碼后,將第一層網(wǎng)絡計算得到的編碼結果作為第二層網(wǎng)絡的輸入信號,并且進行最小化誤差重構計算,即可得到該層網(wǎng)絡的參數(shù)及下一層網(wǎng)絡的輸入編碼,以此類推直到結束從而達到降維的效果[12]。

2.2 模型參數(shù)優(yōu)化

參數(shù)優(yōu)化是一個全局的過程,通過優(yōu)化可以較大程度調(diào)節(jié)學習率,促使網(wǎng)絡參數(shù)更適應于當前樣本數(shù)據(jù)。因為如果學習率很低,訓練雖然會更加穩(wěn)定,但是由于趨于損失函數(shù)loss最小值的步長很小,所以會花費大量時間來優(yōu)化;如果學習率很高,則會導致訓練結果收斂不了,優(yōu)化會越過最小值從而使得損失值變大[13~14]。深度神經(jīng)網(wǎng)絡模型常用的優(yōu)化算法是SGD(隨機梯度下降算法),而SGD有很多衍生的算法,如Adagrad、RMSProp、Adadelta等。

常見的SGD優(yōu)化算法是通過每次在訓練集中隨機選擇一個樣本的方式進行學習,過程是很快速的,所有的θt都使用相同的學習率,因此迭代到第t次時,參數(shù)向量Δθt的變化過程如下:

其中,η是學習率,gt是某次迭代時刻t目標函數(shù)對參數(shù)的梯度。該算法最大的缺點在于每次學習的方向不定,可能不會按照正確的方向進行,這就容易造成結果在最優(yōu)解附近擾動[15]。而Adagrd算法可以很好地解決這個問題,在更新規(guī)則后,它能夠針對不同的參數(shù)自適應不同的學習率,讓其按照需要的正確的方向進行,參數(shù)向量Δθt的變化過程如下:

此處,Gt是一個對角矩陣,ε是平滑項,防止除零操作,對gt從1到t進行一個遞推形成約束正則化矩陣,前期gt較小時,正則化矩陣較大,可以增大梯度值,后期gt較大時,正則化矩陣較小,可以約束梯度。但該算法仍有弊端,在計算梯度序列平方和時較為復雜,且分母上梯度平方累加逐漸增大,會導致訓練提前結束。故而本文采用Adadelta算法,只使用Adagrad的分母中的累計項離當前時間點比較近的項,即將分母中的Gt換成了梯度平方的衰減平均值E[g2]t,避免了訓練提前結束,公式如下[16]:

式中若是梯度更新值產(chǎn)生振動,則讓梯度減小(乘以1-v),否則增加v,v的默認值為0.02,該算法可以有效地解決水利泵站工控網(wǎng)數(shù)據(jù)稀疏特征、數(shù)據(jù)量大的問題,收斂速度快,適用于本文提出的改進深度神經(jīng)網(wǎng)絡模型。

3 算法優(yōu)化

3.1 基于DNN的入侵檢測模型

由底層設備獲取到的工控網(wǎng)內(nèi)數(shù)據(jù)有很多并非工控協(xié)議,這就需要預先采用腳本剔除,比如Modbus協(xié)議中目的端口號是否是502,Profibus協(xié)議的開始定界符是否是16H,Hart協(xié)議的前導碼是否由5位FF組成,這樣預先進行剔除操作可以適當減少數(shù)據(jù)量。同樣地,對協(xié)議地分類標準也是如此。同時為了讓數(shù)據(jù)盡量處于相同的量綱,把數(shù)據(jù)限定在某一范圍內(nèi),則需要進行歸一化處理,公式如下:ρmax和ρmin分別對應數(shù)據(jù)中的最大值和最小值。

在對數(shù)據(jù)進行預處理、分類、特征選擇降維后,將得到的訓練數(shù)據(jù)集經(jīng)過網(wǎng)絡進行訓練,對可以得到每一層網(wǎng)絡層的訓練輸出結果,而要訓練具有多個隱含層的深度網(wǎng)絡的全局優(yōu)化值,便要采用逐層訓練的機制,每次針對網(wǎng)絡某一隱層進行訓練,得到該層的最有參數(shù)和特征,作為一下層輸入;然后再對下一層進行單獨訓練得到相關數(shù)據(jù),以此類推,逐層訓練出整個網(wǎng)絡的全局最優(yōu)解,最后可得到深度神經(jīng)網(wǎng)絡入侵檢測模型。為了驗證模型的準確度,采用測試數(shù)據(jù)集進行驗證,最終通過Soft?max分類器輸出預測結果,通過加入權重衰減改動損失函數(shù)來解決Softmax回歸的參數(shù)冗余帶來的數(shù)值問題[17~18]。網(wǎng)絡共五層,由輸入層、三隱藏層和輸出層構成,在每層之間采用Dropout來防止過擬合發(fā)生,Dropout率始終保持在20%~50%之間,輸入層的節(jié)點由每種協(xié)議的維度決定,三隱藏層的節(jié)點一般通過經(jīng)驗確定,可以采用遍歷的方法比較選取最合適的節(jié)點數(shù),但由于該方法會耗費大量時間和人力,所以本文通過公式法確定,公式如下:

式中m指隱含層節(jié)點數(shù),n指輸入層節(jié)點數(shù),α是1~10之間的常數(shù),采用公式法大大減少了遍歷的次數(shù)和時間。同時隱藏層需要采用激活函數(shù)RE?LU,可以很好地解決神經(jīng)網(wǎng)絡訓練過程中的梯度彌散問題,基于DNN的入侵檢測模型如圖1所示。

圖1 基于DNN的入侵檢測模型

3.2 基于受限玻爾茲曼機的改進DNN入侵檢測模型

本文以受限玻爾茲曼機網(wǎng)絡(RBM)作為構建深度神經(jīng)網(wǎng)絡算法的基礎,對原來模型的特征提取進行改進,將RBM層作為深度網(wǎng)絡的單層結構實現(xiàn)深層特征提取,以便得到更高級的特征向量,以此作為分類識別的依據(jù)。RBM由可視層與隱藏層組成,RBM在可視層和隱藏層之間有一個聯(lián)合組態(tài)的能量,可表示為

其中:θ={w,a,b}為RBM模型參數(shù),RBM的學習過程就是通過訓練獲得參數(shù)θ的過程。wij表示可視單元i與隱藏單元j之間的連接權重,ai為可視單元i的偏置,bj為隱藏單元j的偏置,基于該能量函數(shù),可得到(v,h)的聯(lián)合概率分布:

將多個RBM網(wǎng)絡層進行疊加,組成新的網(wǎng)絡,使得該網(wǎng)絡具有較高的靈活性和可擴展性,模型如圖2所示。

圖2 RBM網(wǎng)絡組成有向無環(huán)模型

將多層RBM疊加后,高層RBM網(wǎng)絡輸入數(shù)據(jù)采用底層RBM網(wǎng)絡輸出數(shù)據(jù),且數(shù)據(jù)是訓練得到的概率分布數(shù)值。需要注意的是,僅含有由多層RBM網(wǎng)絡疊加而成的網(wǎng)絡結構只能夠?qū)崿F(xiàn)對輸入數(shù)據(jù)的特征提取工作,要實現(xiàn)最終的入侵檢測任務,我們需要在網(wǎng)絡的最終層輸出之上設置一個Softmax分類器對網(wǎng)絡輸出數(shù)據(jù)做出合法非法的分類,把網(wǎng)絡的最后輸出層數(shù)據(jù)作為Softmax回歸分類器的輸入值,從而形成完整的分類神經(jīng)網(wǎng)絡[19~20]。整個網(wǎng)絡仍有五層,但對隱藏層節(jié)點數(shù)的計算方法有所改進,增加了輸出節(jié)點數(shù):

其中m為網(wǎng)絡輸入節(jié)點數(shù),n為網(wǎng)絡輸出節(jié)點數(shù),k為10左右的常數(shù)。這樣通過網(wǎng)絡的實際結構加上實驗的基礎更加準確地確定隱藏層節(jié)點數(shù),以減少資源虛耗,入侵檢測模型如圖3所示。

圖3 基于受限玻爾茲曼機的改進深度神經(jīng)網(wǎng)絡的入侵檢測模型

4 實驗與分析

4.1 實驗數(shù)據(jù)準備

本文的實驗數(shù)據(jù)從水利泵站工控網(wǎng)采集,將采集得到的數(shù)據(jù)處理后存至本地保存,其中,數(shù)據(jù)處理的操作主要包括訓練集、測試集制作。采集數(shù)據(jù)除了工控網(wǎng)內(nèi)正常數(shù)據(jù)外,為了能夠檢測出非法數(shù)據(jù),還對工控網(wǎng)內(nèi)DNS欺騙數(shù)據(jù)、拒絕服務攻擊數(shù)據(jù)、IP源地址欺詐等多類異常數(shù)據(jù)。

4.2 實驗評價標準

入侵系統(tǒng)評價指標主要包括三個:1)檢測率,該指標為工控系統(tǒng)受攻擊后,系統(tǒng)能夠正確檢測到概率;2)誤識率,該指標為工控系統(tǒng)將正確行為判斷為攻擊行為的概率;3)漏報率,該指標為工控系統(tǒng)未檢測到外界攻擊系統(tǒng)的概率。以上三個指標的計算公式如下:

其中PT是工控系統(tǒng)入侵檢測模型正確預測攻擊行為的數(shù)量,N是總攻擊數(shù),PF是入侵檢測模型錯誤預測攻擊行為數(shù),P是總正常樣本量,T是模型不能正確預測的樣本數(shù)量。

4.3 算法對比

為了驗證本文算法的效果,下面將從兩個方面進行驗證比較。

首先是網(wǎng)絡模型參數(shù)優(yōu)化算法,SGD、Adagrad算法都可優(yōu)化模型,但其對收斂速度的影響相比本文采用的Adadelta算法有不足。三種算法學習曲線如圖4所示。

圖4 三種算法學習曲線圖

由上圖可看出隨著迭代次數(shù)的增加Adadelta算法很快便尋找到正確的方向并前進,收斂速度也相當快,而Adagrad算法收斂速度較Adadelta慢些,SGD算法不僅收斂速度慢,且中間出現(xiàn)“走彎路”現(xiàn)象,在震蕩后才沿正確方向收斂。并且本文的優(yōu)化算法能將loss值收斂到0.0012,顯然比另兩種算法收斂的更小,因此采用Adadelta算法較Adagrad和SGD算法的收斂性更好。

其次是與傳統(tǒng)DNN模型以及采用PCA降維算法較。傳統(tǒng)DNN模型不能夠適應水利泵站工控網(wǎng)數(shù)據(jù)量大、緯度高的數(shù)據(jù)特點,所以需要對傳統(tǒng)DNN模型進行改進;PCA降維算法主要是線性降維,對水利泵站工控網(wǎng)的非線性數(shù)據(jù)處理效果并不理想,三種方法的模型訓練準確率及在檢測率、誤報率和漏報率指標方面的表現(xiàn)如表1所示。

表1 不同算法模型訓練準確率對比

由表1可以看出,在訓練數(shù)據(jù)集上進行PCADNN、Encoder-DNN、融合自編碼降維的改進DNN模型訓練。通過模型在測試集上的測試可知,PCA-DNN模型準確度最低,表明該模型對特征無相關性的數(shù)據(jù)訓練效果不好。本文提出的融合自編碼降維的改進深度神經(jīng)網(wǎng)絡模型將數(shù)據(jù)經(jīng)過自編碼降維處理后,模型訓練效果較好;除了數(shù)據(jù)處理,該模型還針對訓練機制等多方面做了改進,模型準確度可達97%,相比其他模型具有更好的攻擊行為預測能力。

由表2可以看出,PCA-DNN入侵檢測系統(tǒng)的檢測率較低、誤報率及漏報率高,模型訓練效果不好,其主要原因是因為降維效果不好。自編碼降維算法檢測率相比PCA-DNN來說有了一定的提高,但與本文提出的改進網(wǎng)絡相比,檢測率還有待提升,且漏報率也相對較大,但其誤識率較本文算法略低。綜合以上分析可以得到如下結論:本文提出的算法模型綜合效果最優(yōu),對系統(tǒng)攻擊的檢測具有較高的準確性,系統(tǒng)具有較強的穩(wěn)定性。

表2 不同算法的入侵檢測模型性能指標對比

5 結語

水利泵站工控安全問題在不斷引起重視,本文以水利泵站為背景,針對泵站工控網(wǎng)內(nèi)的高維數(shù)據(jù)量提出一種結合自編碼降維的改進深度神經(jīng)網(wǎng)絡入侵檢測模型,在對原始數(shù)據(jù)自編碼降維后,基于受限玻爾茲曼機對網(wǎng)絡模型進行改進,再經(jīng)過網(wǎng)絡進行分類預測,同時為了提高算法檢測的準確率,采用Adadelta算法對模型進行參數(shù)優(yōu)化。實驗結果表明,本文的算法模型優(yōu)于其他算法,有較高的預測準確率,在檢測率、誤報率和漏報率三項指標上都比另外兩種算法表現(xiàn)優(yōu)異,具有較好的特征表征學習和分類預測能力,是一種可行且有效的入侵檢測模型。

猜你喜歡
泵站檢測模型
一半模型
張家邊涌泵站建設難點及技術創(chuàng)新實踐
“不等式”檢測題
“一元一次不等式”檢測題
“一元一次不等式組”檢測題
重要模型『一線三等角』
重尾非線性自回歸模型自加權M-估計的漸近分布
2016年河南省己建成泵站數(shù)量
3D打印中的模型分割與打包
全省已建成泵站數(shù)量
主站蜘蛛池模板: 亚洲一区二区日韩欧美gif| Jizz国产色系免费| 黄色一级视频欧美| 综合色区亚洲熟妇在线| 日韩国产黄色网站| 97超碰精品成人国产| 99久久免费精品特色大片| 亚洲欧美在线看片AI| 日本不卡免费高清视频| 素人激情视频福利| 91精品专区| 国产嫩草在线观看| 国产成人精品男人的天堂下载 | 亚洲天堂网在线观看视频| 亚洲免费毛片| 中国一级特黄大片在线观看| 免费xxxxx在线观看网站| 国产在线一区视频| 在线看AV天堂| 精品成人免费自拍视频| 国产精品无码作爱| 最近最新中文字幕免费的一页| 中文字幕在线一区二区在线| 国产成人精品一区二区秒拍1o| 亚洲色欲色欲www在线观看| 亚洲热线99精品视频| 亚洲综合专区| 男人的天堂久久精品激情| 欧美精品亚洲二区| 日韩精品一区二区三区视频免费看| 四虎永久在线| av在线5g无码天天| 99re免费视频| 日本午夜精品一本在线观看| 天天躁狠狠躁| 国产主播福利在线观看| 国产精品55夜色66夜色| 国产97视频在线| 一区二区三区四区在线| 久久久无码人妻精品无码| 午夜毛片福利| 国产精品自在在线午夜区app| 日韩成人免费网站| 国产天天色| 国产在线自乱拍播放| 国产日本欧美亚洲精品视| 黄色在线不卡| 91小视频在线观看免费版高清| 亚洲综合久久一本伊一区| 91精品国产自产在线老师啪l| 在线a网站| 亚洲天堂在线免费| 精品人妻一区无码视频| 国产日韩丝袜一二三区| 青青青视频蜜桃一区二区| 国内精品九九久久久精品| 99re在线观看视频| 女高中生自慰污污网站| 国语少妇高潮| 毛片a级毛片免费观看免下载| 久久青草视频| 强乱中文字幕在线播放不卡| 青青青伊人色综合久久| 精品伊人久久久香线蕉| 国产一区二区精品高清在线观看| 久久久久亚洲av成人网人人软件| 亚洲第一av网站| 成人精品区| 高清国产va日韩亚洲免费午夜电影| 性网站在线观看| 久久精品人人做人人| 天天做天天爱天天爽综合区| 久久精品一卡日本电影| 青青青视频91在线 | 毛片大全免费观看| 欧美色视频在线| 26uuu国产精品视频| 久久久91人妻无码精品蜜桃HD| 激情五月婷婷综合网| 丝袜久久剧情精品国产| 国产美女在线观看| 毛片三级在线观看|