999精品在线视频,手机成人午夜在线视频,久久不卡国产精品无码,中日无码在线观看,成人av手机在线观看,日韩精品亚洲一区中文字幕,亚洲av无码人妻,四虎国产在线观看 ?

基于機(jī)器學(xué)習(xí)的無線傳感器網(wǎng)絡(luò)入侵檢測(cè)算法

2020-07-28 02:40:24羅富財(cái)吳飛陳倩何金棟寇亮
關(guān)鍵詞:特征檢測(cè)

羅富財(cái),吳飛,陳倩,何金棟,寇亮

(1.國(guó)網(wǎng)福建省電力有限公司 信息中心,福建 福州 350003; 2.哈爾濱工程大學(xué) 計(jì)算機(jī)科學(xué)與技術(shù)學(xué)院,黑龍江 哈爾濱 150001)

近年來,隨著傳感器、無線射頻識(shí)別標(biāo)簽(RFID)以及機(jī)器對(duì)機(jī)器(machine-to-machine, M2M)等相關(guān)技術(shù)的快速發(fā)展,對(duì)可穿戴設(shè)備等應(yīng)用領(lǐng)域需求的提高,物聯(lián)網(wǎng)(internet of things, IOT)己經(jīng)成為當(dāng)今學(xué)術(shù)研究領(lǐng)域和工業(yè)制造領(lǐng)域的一項(xiàng)熱門技術(shù),并在未來新型互聯(lián)網(wǎng)世界中占有重要地位[1]。自2005年國(guó)際電信聯(lián)盟正式提出物聯(lián)網(wǎng)概念以來,物聯(lián)網(wǎng)產(chǎn)業(yè)發(fā)展迅猛,目前被廣泛應(yīng)用于環(huán)境監(jiān)測(cè)與保護(hù)、智能交通、移動(dòng)醫(yī)療、食品安全和物流供應(yīng)鏈管理等諸多領(lǐng)域。根據(jù)Statistic門戶網(wǎng)站最新統(tǒng)計(jì)數(shù)據(jù),2017年物聯(lián)網(wǎng)的互聯(lián)設(shè)備數(shù)量約為203.5億,預(yù)計(jì)2020年增長(zhǎng)至307.3億,市場(chǎng)規(guī)模將達(dá)7.1萬億美元。

WSNs作為物聯(lián)網(wǎng)參與信息感知的重要組成部分發(fā)揮著越來越重要的作用。WSNs是一種分布式無線網(wǎng)絡(luò),由部署在感知區(qū)域的數(shù)量龐大的低功耗傳感器節(jié)點(diǎn)通過無線通信鏈路通信所構(gòu)成。傳感器節(jié)點(diǎn)是一種微型計(jì)算單元,具有存儲(chǔ)容量小,計(jì)算能力有限和電池供能等特點(diǎn)。由于無線網(wǎng)絡(luò)的開放性以及傳感器節(jié)點(diǎn)自身的限制,WSNs面臨著多種多樣的安全威脅。引入密鑰管理和身份認(rèn)證機(jī)制作為保護(hù)WSNs的第一道防線,可以有效防御來自WSNs外部的攻擊。然而,攻擊者通過捕獲節(jié)點(diǎn)可以獲得節(jié)點(diǎn)內(nèi)部的秘密消息,進(jìn)而發(fā)動(dòng)內(nèi)部攻擊。第一道防線無法抵抗WSNs的內(nèi)部攻擊。入侵檢測(cè)技術(shù)作為安全防御的第二道防線能夠從根源上發(fā)現(xiàn)安全威脅,降低攻擊帶來的損失。由于WSNs的局限性,傳統(tǒng)的入侵檢測(cè)技術(shù)不能直接應(yīng)用于WSNs環(huán)境中。研究一種適合WSNs入侵檢測(cè)技術(shù)成為研究熱點(diǎn),引起了國(guó)內(nèi)外專家學(xué)者的廣泛關(guān)注。

根據(jù)檢測(cè)入侵的實(shí)現(xiàn)細(xì)節(jié)可以將入侵檢測(cè)系統(tǒng)分為基于特征的入侵檢測(cè)技術(shù)和基于異常的特征檢測(cè)技術(shù)[2]。基于特征的入侵檢測(cè)技術(shù)使用一組預(yù)定義惡意行為模式和攻擊特征進(jìn)行入侵檢測(cè),而基于異常的入侵檢測(cè)系統(tǒng)使用異于正常的行為作為特征檢測(cè)入侵行為[3]。WSNs應(yīng)用場(chǎng)景多種多樣,基于預(yù)定義攻擊特征的入侵檢測(cè)是不切實(shí)際的,基于異常的入侵檢測(cè)系統(tǒng)能夠在缺少預(yù)定義攻擊特征的前提下檢測(cè)未知攻擊。基于異常的入侵檢測(cè)系統(tǒng)主要包括:基于統(tǒng)計(jì)學(xué)的入侵檢測(cè)技術(shù)和基于機(jī)器學(xué)習(xí)的入侵檢測(cè)技術(shù)。

張玲等[4]引入粗糙集方法對(duì)基于人工免疫的入侵檢測(cè)模型進(jìn)行改進(jìn),將異常檢測(cè)和誤用檢測(cè)有機(jī)結(jié)合,提出一種入侵檢測(cè)方法,該方法能夠在不終止入侵檢測(cè)行為的前提下實(shí)現(xiàn)疫苗的注入。粗糙集優(yōu)化了疫苗,進(jìn)而提高了入侵檢測(cè)方法的檢測(cè)性能。疫苗的注入有效降低了檢測(cè)器的長(zhǎng)度,提高了檢測(cè)速度。然而,基于免疫的入侵檢測(cè)方法在訓(xùn)練初期存在檢測(cè)率低的問題。

杜輝等[5]提出一種K-means算法解決了聚類數(shù)目預(yù)先設(shè)定和算法陷入局部最優(yōu)的問題。該算法在樣本空間均勻地防止若干數(shù)目的探測(cè)器,使用萬有引力定律牽引探測(cè)器,當(dāng)探測(cè)器之間的距離足夠近時(shí),進(jìn)行合并。算法最終包含的探測(cè)器的數(shù)目就是聚類中心的數(shù)目。但是該方法對(duì)樣本數(shù)據(jù)的離群點(diǎn)效果不佳,由于離群點(diǎn)與聚類中心距離較遠(yuǎn),萬有引力產(chǎn)生的作用微乎其微。

為了解決數(shù)據(jù)量過大造成入侵檢測(cè)效率低的問題,江頡等[6]將自適應(yīng)AP算法于聚類算法相結(jié)合,提出自適應(yīng)AP聚類算法,并將其應(yīng)用于入侵檢測(cè)。該算法僅對(duì)基準(zhǔn)數(shù)據(jù)和距離聚類中心較遠(yuǎn)的樣本進(jìn)行聚類,其余樣本數(shù)據(jù)進(jìn)行直接關(guān)聯(lián)操作,減少了進(jìn)行聚類的樣本數(shù)量,降低了聚類的時(shí)間,同時(shí)根據(jù)關(guān)聯(lián)結(jié)果對(duì)模型不斷調(diào)整。數(shù)據(jù)壓縮提高了聚類的效率,但是不可避免地造成了精度的下降。

劉緒崇[7]針對(duì)傳統(tǒng)模糊C均值聚類算法的缺陷,提出一種改進(jìn)算法:采用Mercer核定義優(yōu)化FCM算法的目標(biāo)函數(shù)提高了FCM的尋優(yōu)能力,使用Lagrange乘子法分別計(jì)算聚類中心和隸屬度矩陣,提高了算法收斂的速度。但是該算法沒有解決不平衡聚類和噪聲點(diǎn)對(duì)聚類結(jié)果的影響。

許勐璠等[8]針對(duì)現(xiàn)有入侵檢測(cè)方法對(duì)未知類型攻擊檢測(cè)率低的問題,提出了基于半監(jiān)督學(xué)習(xí)和信息增益率的入侵檢測(cè)方案:訓(xùn)練階段,借助半監(jiān)督學(xué)習(xí)算法將少量標(biāo)記數(shù)據(jù)擴(kuò)展為大規(guī)模訓(xùn)練數(shù)據(jù);檢測(cè)階段,借助信息增益率量化不同特征對(duì)檢測(cè)性能的影響,提高了模型對(duì)未知類型攻擊的識(shí)別能力。

任家東等[9]針對(duì)Probe(probing),U2R(user to root)和R2L(remote to local)的檢測(cè)率比較低這一問題,提出一種混合多層次入侵檢測(cè)模型:首先,使用KNN剔除離群樣本數(shù)據(jù),構(gòu)造一個(gè)質(zhì)量高且規(guī)模小的訓(xùn)練集;然后,針對(duì)不同類型的攻擊,提出一種類別劃分方法;最終構(gòu)建多層次隨機(jī)森林模型進(jìn)行網(wǎng)絡(luò)異常的檢測(cè)。實(shí)驗(yàn)表明該方法能夠提高Probe、U2R和R2L等網(wǎng)絡(luò)攻擊行為的檢測(cè)效果。

現(xiàn)有的入侵檢測(cè)方法取得一定成果的同時(shí),存在一定的問題:針對(duì)已知攻擊類型的攻擊檢測(cè)率較高,但是未知類型的攻擊效果不佳;由于應(yīng)用場(chǎng)景的復(fù)雜多變,實(shí)際應(yīng)用中的入侵檢方案受到惡劣環(huán)境的影響存在誤報(bào)率偏高的現(xiàn)象;為了提高檢測(cè)率,一些入侵檢測(cè)算法引入復(fù)雜的數(shù)學(xué)模型,增加了計(jì)算復(fù)雜度,不適合資源受限的應(yīng)用場(chǎng)景。本文針對(duì)WSNs資源高度受限的特性,提出一種基于機(jī)器學(xué)習(xí)的WSNs入侵檢測(cè)方法,用來抵抗WSNs常見的攻擊行為。

1 WSNs網(wǎng)絡(luò)結(jié)構(gòu)及威脅模型

1.1 網(wǎng)絡(luò)結(jié)構(gòu)

本文的提出的入侵檢測(cè)方法基于3層WSNs網(wǎng)絡(luò)。網(wǎng)絡(luò)包含4種節(jié)點(diǎn)類型:傳感器節(jié)點(diǎn)部署在監(jiān)控區(qū)域,在組網(wǎng)初期根據(jù)分簇算法形成簇,負(fù)責(zé)采集監(jiān)控區(qū)域的狀態(tài)信息,形成感知數(shù)據(jù)并發(fā)送給簇頭節(jié)點(diǎn);簇頭節(jié)點(diǎn)是每個(gè)簇的管理者負(fù)責(zé)將傳感器節(jié)點(diǎn)采集的感知數(shù)據(jù)進(jìn)行數(shù)據(jù)聚合發(fā)送給傳輸節(jié)點(diǎn);傳輸節(jié)點(diǎn)將數(shù)據(jù)以無線多跳的形式傳輸至匯聚節(jié)點(diǎn);匯聚節(jié)點(diǎn)負(fù)責(zé)進(jìn)一步處理數(shù)據(jù)并呈現(xiàn)給用戶。網(wǎng)絡(luò)結(jié)構(gòu)如圖1所示。

圖1 分層WSNs網(wǎng)絡(luò)模型Fig.1 Cluster-based WSNs network model

1.2 WSNs威脅模型

本文提出的入侵檢測(cè)方法主要針對(duì)黑洞攻擊、灰洞攻擊、洪泛攻擊和調(diào)度攻擊等類型的主動(dòng)攻擊行為,具體如下所示。

黑洞攻擊:攻擊節(jié)點(diǎn)在每個(gè)工作周期的開始階段將自己是簇頭節(jié)點(diǎn)的消息通過廣播的方式發(fā)送給其他節(jié)點(diǎn)。因此,一些節(jié)點(diǎn)會(huì)錯(cuò)誤地加入偽簇頭節(jié)點(diǎn)進(jìn)而將數(shù)據(jù)包發(fā)送給偽簇頭節(jié)點(diǎn)。真正的簇頭節(jié)點(diǎn)會(huì)將數(shù)據(jù)包轉(zhuǎn)發(fā)至基站,發(fā)起黑洞攻擊的偽簇頭節(jié)點(diǎn)會(huì)持續(xù)地丟棄數(shù)據(jù)包并不會(huì)轉(zhuǎn)發(fā)給基站。

灰洞攻擊:與黑洞攻擊相同的是,攻擊節(jié)點(diǎn)在每個(gè)工作周期的開始階段將自己是簇頭節(jié)點(diǎn)的消息通過廣播的方式發(fā)送給其他節(jié)點(diǎn)。一些節(jié)點(diǎn)會(huì)錯(cuò)誤地加入偽簇頭節(jié)點(diǎn)進(jìn)而將數(shù)據(jù)包發(fā)送給偽簇頭節(jié)點(diǎn)。與黑洞攻擊不同的是,發(fā)起灰洞攻擊的偽簇頭節(jié)點(diǎn)隨機(jī)丟棄數(shù)據(jù)包或者丟棄特定類型的數(shù)據(jù)包并阻止數(shù)據(jù)包轉(zhuǎn)發(fā)給基站。

洪泛攻擊:洪泛攻擊主要發(fā)送大量簇頭廣播消息占用大量網(wǎng)絡(luò)帶寬資源。感知節(jié)點(diǎn)收到大量的簇頭廣播消息不僅耗費(fèi)了感知層節(jié)點(diǎn)的能源供給,而且導(dǎo)致感知節(jié)點(diǎn)耗費(fèi)大量時(shí)間決定加入具體的簇頭節(jié)點(diǎn)。除此之外,攻擊節(jié)點(diǎn)會(huì)嘗試欺騙感知節(jié)點(diǎn)并偽裝成偽簇頭,令遠(yuǎn)距離感知節(jié)點(diǎn)加入自己導(dǎo)致其能源耗費(fèi)嚴(yán)重。

調(diào)度攻擊:調(diào)度攻擊發(fā)生在LEACH協(xié)議的初始化階段,簇頭節(jié)點(diǎn)實(shí)現(xiàn)分時(shí)復(fù)用調(diào)度策略為感知節(jié)點(diǎn)確定數(shù)據(jù)傳輸時(shí)間戳。攻擊者假裝簇頭節(jié)點(diǎn),賦予所有感知節(jié)點(diǎn)相同的發(fā)送數(shù)據(jù)時(shí)間戳。攻擊者將廣播調(diào)度行為修改為單播調(diào)度行為,最終導(dǎo)致數(shù)據(jù)沖突進(jìn)而數(shù)據(jù)丟失。

2 基于機(jī)器學(xué)習(xí)的檢測(cè)算法

2.1 基于密度感知的初始數(shù)據(jù)集劃分算法

定義1樣本數(shù)據(jù)xi的局部密度表示為ρi:

(1)

式中:‖xi-xj‖表示xi和xj之間的歐式距離;dc為預(yù)定義的截?cái)嗑嚯x,通常為所有樣本截?cái)嗑嚯x的前1%~2%。局部密度ρi表示樣本數(shù)據(jù)xi之間距離小于dc的數(shù)據(jù)點(diǎn)個(gè)數(shù)。與樣本數(shù)據(jù)xi之間距離小于dc的數(shù)據(jù)點(diǎn)越多,密度值ρi越大。本文選擇連續(xù)型高斯核計(jì)算樣本數(shù)據(jù)的局部密度避免不同樣本數(shù)據(jù)的局部密度值相同。

定義2特征距離表示樣本數(shù)據(jù)xi與具有更高局部密度的樣本數(shù)據(jù)之間的最小距離:

(2)

式中:δi表示樣本數(shù)據(jù)xi與其他高密度樣本數(shù)據(jù)的最短距離。具有較大局部密度和較大特征距離的樣本數(shù)據(jù)成為聚類中心的可能性更大。

定義3直接鄰居q表示樣本數(shù)據(jù)p的直接鄰居定義為:

(3)

擁有最大密度的樣本數(shù)據(jù)xs沒有直接鄰居,這類樣本數(shù)據(jù)的特征距離為:

(4)

構(gòu)造有向無環(huán)圖(directed acycline graph,DAG)根據(jù)特征距離對(duì)數(shù)據(jù)集進(jìn)行劃分。DAG的頂點(diǎn)表示數(shù)據(jù)點(diǎn),DAG的有向邊表示數(shù)據(jù)點(diǎn)之間的鄰居關(guān)系。需要注意一點(diǎn),直接鄰居關(guān)系是不可逆的,如果數(shù)據(jù)點(diǎn)p的直接鄰居是數(shù)據(jù)點(diǎn)q,那么數(shù)據(jù)點(diǎn)q的直接鄰居不是數(shù)據(jù)點(diǎn)p。使用特征距離作為DAG有向邊的權(quán)重。特征距離可以有效描述數(shù)據(jù)分布密度,擁有較小特征距離的數(shù)據(jù)樣本與它的直接鄰居處在同一類內(nèi),擁有較大特征距離的特征點(diǎn)與它的直接鄰居不在同一類內(nèi)。因此,經(jīng)過若干次迭代后,數(shù)據(jù)集劃分成若干臨時(shí)類,如圖2所示。

圖2 基于DAG的臨時(shí)類劃分Fig.2 Temporary class division based on DAG

采用同時(shí)具備較大局部密度和特征距離的點(diǎn)作為潛在聚類中心可以避免dc選取不當(dāng)導(dǎo)致特征距離大于dc的高局部密度數(shù)據(jù)無法正確聚類的問題。兼顧數(shù)據(jù)局部密度和特征距離二者的優(yōu)點(diǎn),選取二者的乘積作為最終決定聚類中心的值,記為γ,其中γi=ρiδi。

1)根據(jù)公式γi=ρiδi計(jì)算臨時(shí)類聚類中心的γ,并將M個(gè)臨時(shí)類聚類中心按照γ降序排列;

2)根據(jù)γ選擇前C個(gè)臨時(shí)類的聚類中心作為模糊聚類的初始聚類中心;

3)將余下臨時(shí)類內(nèi)的樣本合并到其直接鄰居所在的前C個(gè)臨時(shí)類內(nèi),完成臨時(shí)類的合并,形成數(shù)據(jù)集的初始劃分。

數(shù)據(jù)集初始劃分表示樣本數(shù)據(jù)經(jīng)過臨時(shí)類合并算法形成數(shù)據(jù)集的初始劃分,數(shù)據(jù)集初始劃分定義為FC×N=[f1,1,f2,1,…,fC,1;…;f1,N,f2,N,…,fC,N]。

其中C表示臨時(shí)類個(gè)數(shù),N表示數(shù)據(jù)樣本的總個(gè)數(shù)。設(shè)數(shù)據(jù)集的初始劃分共包含C個(gè)子類,函數(shù)f滿足:

(5)

聚類中心一般處于數(shù)據(jù)點(diǎn)密度高的區(qū)域,處于高密度區(qū)域的數(shù)據(jù)點(diǎn)應(yīng)該在聚類中心更新時(shí)具備更大的權(quán)重,將局部數(shù)據(jù)密度引入模糊聚類的中心計(jì)算,聚類中心計(jì)算公式更新為:

(6)

將局部密度應(yīng)用于更新聚類中心,僅使用聚類中心相關(guān)的數(shù)據(jù)點(diǎn)進(jìn)行聚類中心更新的計(jì)算,能保證聚類中心總是處在高密度區(qū)域附近而非隨機(jī)移動(dòng)。由于聚類中心總是處在高密度區(qū)域,經(jīng)過較少的迭代次數(shù)目標(biāo)函數(shù)完成收斂,提高了算法的效率。

2.2 基于密度感知的模糊聚類算法

在初始數(shù)據(jù)集劃分算法的基礎(chǔ)上,本文提出了基于密度感知的核模糊聚類算法(density- awared kernel based fuzzy c-means clustering algorithm, DKFCM)。輸入的樣本經(jīng)過核函數(shù)映射到高維特征空間,解決低維空間線性不可分的問題。DKFCM的目標(biāo)函數(shù)定義[10]:

(7)

(8)

DKFCM算法的目標(biāo)函數(shù)達(dá)到最優(yōu),絕對(duì)度矩陣T和相對(duì)度矩陣U需要分別滿足:

(9)

(10)

式(10)中的隸屬度矩陣滿足:

將數(shù)據(jù)局部密度和數(shù)據(jù)集初始劃分引入模糊聚類算法,更新聚類中心的計(jì)算公式為:

(11)

(12)

(13)

(14)

(15)

DKFCM算法的描述,遠(yuǎn)離聚類中心的點(diǎn)被視為離群點(diǎn),賦予離群點(diǎn)較小的絕對(duì)度,例如tij<ε,ε是非常接近0 的正數(shù)。算法的描述具體如下:

1)計(jì)算各個(gè)數(shù)據(jù)樣本的局部密度和特征距離,根據(jù)截?cái)嗑嚯xdc對(duì)數(shù)據(jù)集進(jìn)行基于DAG的臨時(shí)類劃分;

2)執(zhí)行臨時(shí)類合并算法得到模糊聚類的初始聚類中心tCen以及樣本數(shù)據(jù)與臨時(shí)聚類之間的關(guān)系FC×N=[f1,1,f2,1,…,fC,1;…;f1,N,f2,N,…,fC,N];

3)將數(shù)據(jù)樣本的局部數(shù)據(jù)密度和關(guān)系矩陣引入模糊聚類的中心計(jì)算,更新聚類中心計(jì)算公式;

4)將tCen作為聚類中心V(0)的初始值,運(yùn)行KFCM算法,獲得模糊隸屬度矩陣、絕對(duì)度矩陣,同時(shí)初始化核函數(shù);

5)確定c、m、p的值,最大迭代次數(shù)為rmax,停止閾值ε,根據(jù)式(12)~(15)不斷地更新聚類中心,模糊隸屬度矩陣和絕對(duì)度矩陣直到收斂。

2.3 模糊支持向量機(jī)

實(shí)際應(yīng)用中,訓(xùn)練集中的樣本數(shù)據(jù)對(duì)模型的訓(xùn)練做出的貢獻(xiàn)有所不同,一些樣本數(shù)據(jù)比另外一些樣本數(shù)據(jù)更重要。有意義的樣本數(shù)據(jù)期望被正確分類,而像噪聲這種無意義的樣本數(shù)據(jù)是否正確分類影響不大。這就意味著一些樣本數(shù)據(jù)可能不僅屬于一個(gè)類也可能屬于多個(gè)類:樣本數(shù)據(jù)90%的可能屬于某一個(gè)類、10%的可能無實(shí)際意義或者20%的可能屬于一個(gè)類、80%的可能無實(shí)際意義。換言之,每個(gè)樣本數(shù)據(jù)存在模糊隸屬度0

模糊支持向量機(jī)(fuzzy support vector machine, FSVM)模型求解最優(yōu)分類超平面轉(zhuǎn)換成基于不等式約束的二次規(guī)劃問題:

(16)

滿足約束條件:

式中:w是分類超平面向量;b是偏移量;φ(xi)是將樣本xi映射到高維空間的非線性核函數(shù);ξi是分類錯(cuò)誤率,C是控制分類邊際與分類錯(cuò)誤率之間的正則化常數(shù);si由DKFCM算法完成聚類后,所得的模糊隸屬度uij確定,能夠降低分類錯(cuò)誤率對(duì)目標(biāo)函數(shù)的影響,降低了噪聲和孤立點(diǎn)的影響力。

構(gòu)造拉格朗日乘子對(duì)式(16)進(jìn)行優(yōu)化:

(17)

使用SMO優(yōu)化算法對(duì)式(17)進(jìn)行求解獲得最優(yōu)判別式:

(18)

2.4 模糊支持向量機(jī)

在DKFCM與FSVM的基礎(chǔ)上本文提出一種應(yīng)用于WSNs的基于機(jī)器學(xué)習(xí)的入侵檢測(cè)模型DKFCM-FSVM,如圖3所示。

圖3 入侵檢測(cè)模型Fig.3 Intrusion detection model

模型包含的實(shí)體包括匯聚節(jié)點(diǎn)、檢測(cè)節(jié)點(diǎn)和普通節(jié)點(diǎn),具體分工如下。

1)匯聚節(jié)點(diǎn)。

匯聚節(jié)點(diǎn)的主要功能是訓(xùn)練檢測(cè)器,主要包括樣數(shù)據(jù)預(yù)處理、訓(xùn)練分類器和分發(fā)分類器3個(gè)功能。

數(shù)據(jù)預(yù)處理:與普通節(jié)點(diǎn)不同的是,網(wǎng)關(guān)節(jié)點(diǎn)具有充足的能源供給和強(qiáng)大的運(yùn)算能力,能夠處理大規(guī)模樣本數(shù)據(jù)庫(kù)。基站選取WSN-DS(針對(duì)無線傳感器網(wǎng)絡(luò)入侵檢測(cè)設(shè)計(jì)的數(shù)據(jù)集)作為訓(xùn)練集訓(xùn)練DKFCM-FSVM模型。數(shù)據(jù)預(yù)處理的2個(gè)重要過程是歸一化和特征降維。

訓(xùn)練檢測(cè)器:檢測(cè)器的訓(xùn)練是入侵檢測(cè)模型的關(guān)鍵部分。首先,網(wǎng)關(guān)節(jié)點(diǎn)對(duì)訓(xùn)練集進(jìn)行數(shù)據(jù)預(yù)處理;計(jì)算樣本數(shù)據(jù)的數(shù)據(jù)密度和特征距離,使用臨時(shí)類合并算法形成數(shù)據(jù)集初始劃分,挖掘訓(xùn)練集中數(shù)據(jù)點(diǎn)潛在的分布特征;使用DKFCM算法計(jì)算模糊隸屬度矩陣U(r);根據(jù)式(18)訓(xùn)練模糊支持向量機(jī),計(jì)算參數(shù)α和b。根據(jù)式(18)進(jìn)行樣本的預(yù)測(cè)并驗(yàn)證提出方法的準(zhǔn)確度。檢測(cè)結(jié)果以正常或異常的形式輸出。

發(fā)布檢測(cè)器:基站將驗(yàn)證過的檢測(cè)器發(fā)送至各個(gè)檢測(cè)節(jié)點(diǎn),供檢測(cè)節(jié)點(diǎn)進(jìn)行入侵行為的檢測(cè)。

2)檢測(cè)節(jié)點(diǎn)。

一定數(shù)量的檢測(cè)節(jié)點(diǎn)被分配到網(wǎng)絡(luò)內(nèi)對(duì)普通節(jié)點(diǎn)提取的測(cè)試樣本進(jìn)行檢測(cè)以便發(fā)現(xiàn)入侵行為。相比于普通節(jié)點(diǎn),檢測(cè)節(jié)點(diǎn)具備更大的存儲(chǔ)空間和強(qiáng)大的運(yùn)算能力,可以存儲(chǔ)檢測(cè)模型和運(yùn)行入侵檢測(cè)算法。檢測(cè)節(jié)點(diǎn)的主要功能是實(shí)時(shí)檢測(cè)入侵行為:

檢測(cè)節(jié)點(diǎn)運(yùn)行基站發(fā)布的檢測(cè)器,主要依據(jù)公式(18)對(duì)網(wǎng)絡(luò)行為進(jìn)行檢測(cè),結(jié)果為正常和異常;檢測(cè)節(jié)點(diǎn)一旦發(fā)現(xiàn)異常行為向基站發(fā)送告警信息;檢測(cè)節(jié)點(diǎn)向基站發(fā)送新的樣本并更新基站樣本數(shù)據(jù)庫(kù),通知基站重新訓(xùn)練檢測(cè)器保證檢測(cè)器的實(shí)效性。

3)普通節(jié)點(diǎn)。

普通節(jié)點(diǎn)運(yùn)行監(jiān)測(cè)代理(monitor agent, MA)獲取感知層網(wǎng)絡(luò)中感知節(jié)點(diǎn)獲取的感知數(shù)據(jù),并發(fā)送至檢測(cè)節(jié)點(diǎn)進(jìn)行入侵檢測(cè)。

3 實(shí)驗(yàn)與分析

3.1 實(shí)驗(yàn)環(huán)境

在入侵檢測(cè)實(shí)驗(yàn)中,感知層網(wǎng)絡(luò)的覆蓋范圍是100 m×100 m,100個(gè)感知節(jié)點(diǎn):使用筆記本計(jì)算機(jī)作為網(wǎng)關(guān)節(jié)點(diǎn),檢測(cè)節(jié)點(diǎn)10個(gè),普通節(jié)點(diǎn)90個(gè)。仿真參數(shù)如表1所示。每次仿真的持續(xù)時(shí)間設(shè)置為200 s,實(shí)驗(yàn)結(jié)果采用20次仿真結(jié)果的平均值。

表1 仿真模型的參數(shù)和值Table 1 Parameters and Values of simulation model

本節(jié)采用NS-2進(jìn)行仿真實(shí)驗(yàn)驗(yàn)證本文提出的入侵檢測(cè)算法的有效性。為了驗(yàn)證提出方法在感知層網(wǎng)絡(luò)環(huán)境下入侵檢測(cè)的效果,本小節(jié)采用的數(shù)據(jù)集WSN-DS。WSN-DS數(shù)據(jù)集是專門針對(duì)WSNs入侵檢測(cè)所設(shè)計(jì)。在使用低能量感知集群層次結(jié)構(gòu)(LEACH)路由協(xié)議的感知層網(wǎng)絡(luò)環(huán)境收集數(shù)據(jù)并形成數(shù)據(jù)集。WSN-DS數(shù)據(jù)集包含374 661條記錄,數(shù)據(jù)集的每個(gè)樣本包含23個(gè)屬性,文獻(xiàn)[11]介紹了每個(gè)屬性的具體含義。分別將WSN-DS數(shù)據(jù)集的60%和40%作為訓(xùn)練集和測(cè)試集,每種類型的攻擊具體如表2所示。

表2 數(shù)據(jù)集隨機(jī)分配訓(xùn)練集60%和測(cè)試集40%Table 2 The random distribution of data set 60% of training set and 40% of test set data sets

3.2 評(píng)價(jià)指標(biāo)

入侵檢測(cè)系統(tǒng)的檢測(cè)結(jié)果包含下面四種:真陽(yáng)性(true positive,TP)表示異常行為被正確識(shí)別為異常行為所占的比例;假陽(yáng)性(false positive,F(xiàn)P)表示正常行為被錯(cuò)誤識(shí)別為異常行為所占的比例;真陰性(true negative,TN)表示正常行為被正確識(shí)別為正常行為所占的比例;假陰性(false negative,F(xiàn)N)表示異常行為被錯(cuò)誤識(shí)別為正常行為所占的比例。根據(jù)上述4種檢測(cè)結(jié)果進(jìn)一步演化出準(zhǔn)確率、誤報(bào)率、漏報(bào)率和受試者工作特性曲線下方面積,作為本文入侵檢測(cè)技術(shù)采用的評(píng)價(jià)指標(biāo)。

1)準(zhǔn)確率(precision)表示正確識(shí)別異常行和正常行為為占有的比例,計(jì)算公式為:

(19)

2)誤報(bào)率(false positive rate, FPR)表示將正常行為識(shí)別為異常行為占有的比例為:

(20)

3) 漏報(bào)率(false negative rate, FNR)表示將異常行為識(shí)別為正常行為占有的比例:

(21)

3.3 實(shí)驗(yàn)結(jié)果分析

為了驗(yàn)證提出方法的有效性,本節(jié)選擇SVM、FCM-SVM、FCM-FSVM和KFCM-FSVM算法作為對(duì)比算法分別對(duì)比。算法的核函數(shù)采用高斯核函數(shù),F(xiàn)CM-FSVM、KFCM-FSVM和DKFCM-FSVM的參數(shù)m取典型值2,ε取典型值0.01,使用隨機(jī)矩陣作為初始矩陣,根據(jù)文獻(xiàn)[12]設(shè)置模糊隸屬度,其中核函數(shù)的參數(shù)σ取值為0.01,正則化常數(shù)C取值為2。在訓(xùn)練集上訓(xùn)練本文提出的算法和對(duì)照組算法,訓(xùn)練完成后在測(cè)試集上完成算法的驗(yàn)證。采用10-fold交叉驗(yàn)證方式,取實(shí)驗(yàn)結(jié)果的平均值進(jìn)行對(duì)比。

圖4給出了DKFCM-FSVM與對(duì)照算法之間在準(zhǔn)確率上的對(duì)比結(jié)果。同對(duì)照算法相比,本文提出的DKFCM-FSVM算法檢測(cè)5種行為的平均準(zhǔn)確率分別為0.998、0.993、0.905、0.997和0.947,在不同行為的檢測(cè)上準(zhǔn)確率均達(dá)到最優(yōu)。SVM算法耗時(shí)短,檢測(cè)率最差,其次是FCM-SVM算法,優(yōu)于SVM算法。FCM-FSVM和KFCM-FSVM的檢測(cè)率相近,DKFCM-FSVM略優(yōu)于KFCM-FSVM。

圖4 5種分類算法的準(zhǔn)確率對(duì)比Fig.4 Comparison of precision rates of five classification algorithms

圖5給出了DKFCM-FSVM與對(duì)照算法之間在誤報(bào)率上的對(duì)比結(jié)果。同對(duì)照算法相比,本文提出的DKFCM-FSVM算法檢測(cè)5種行為的平均誤報(bào)率分別為0.004、0.004、0.01、0.002和0.006,在不同行為的檢測(cè)上達(dá)到最低的誤報(bào)率。SVM算法的誤報(bào)率最高,其次是FCM-SVM算法,優(yōu)于SVM算法。FCM-FSVM和KFCM-FSVM的誤報(bào)率相近,DKFCM-FSVM優(yōu)于KFCM-FSVM。

圖5 5種分類算法的誤報(bào)率對(duì)比Fig.5 Comparison of false positive rates of five classification algorithms

圖6給出了DKFCM-FSVM與對(duì)照算法之間在漏報(bào)率上的對(duì)比結(jié)果。同對(duì)照算法相比,本文提出的DKFCM-FSVM算法檢測(cè)5種行為的平均漏報(bào)率分別為0.004、0.003、0.002、0.007和0.006,在不同行為的檢測(cè)上達(dá)到最低的漏報(bào)率。SVM算法的漏報(bào)率較高,其次是FCM-SVM算法,優(yōu)于SVM算法。FCM-FSVM和KFCM-FSVM的漏報(bào)率相近,DKFCM-FSVM優(yōu)于KFCM-FSVM。

圖6 5種分類算法的漏報(bào)率對(duì)比Fig.6 Comparison of underreporting rates of five classification algorithms

圖7給出了DKFCM-FSVM與對(duì)照算法之間在總體檢測(cè)準(zhǔn)確率的對(duì)比結(jié)果,各算法你總體檢測(cè)準(zhǔn)確率分別為0.820 8、0.859 6、0.923 6、0.933 2和0.968。因此,本文提出的DKFCM-FSVM優(yōu)于對(duì)比算法。

圖7 5種分類算法的總體檢測(cè)準(zhǔn)確率對(duì)比Fig.7 Comparison of the overall detection accuracy of five classification algorithms

實(shí)驗(yàn)結(jié)果分析:WSNs環(huán)境下,正常數(shù)據(jù)和入侵?jǐn)?shù)據(jù)的比例不平衡,多數(shù)行為是正常行為,由入侵攻擊產(chǎn)生的異常數(shù)據(jù)占有極少數(shù),除此之外正常行為和入侵行為在多數(shù)情況下線性不可分,需要使用核函數(shù)映射到高維空間,SVM的檢測(cè)效果不佳。FCM對(duì)初始聚類的選取和不平衡的數(shù)據(jù)集敏感,同樣效果不佳。即使使用核函數(shù)將樣本映射到高維空間,噪聲數(shù)據(jù)和離群點(diǎn)對(duì)聚類產(chǎn)生的影響也是不容忽視的,引入數(shù)據(jù)密度和特征距離能有效避免噪聲數(shù)據(jù)和離群點(diǎn)對(duì)分類結(jié)果的影響,達(dá)到最優(yōu)分類結(jié)果。誤報(bào)率和漏報(bào)率低也說明本文提出的算法更適合不平衡數(shù)據(jù)集,能有效應(yīng)對(duì)離群點(diǎn)和噪聲數(shù)據(jù)。

4 結(jié)論

1)DKFCM引入數(shù)據(jù)密度和特征距離對(duì)模糊聚類進(jìn)行改進(jìn),降低了噪聲點(diǎn)和離群點(diǎn)對(duì)聚類算法影響的同時(shí)加快了聚類算法的收斂速度;FSVM使用DKFCM所得的模糊隸屬度作為模糊因子,增強(qiáng)了模糊因子選取的客觀性,提高了分類準(zhǔn)確度,顯著提高了WSNs場(chǎng)景下入侵檢測(cè)的效果。

2)實(shí)驗(yàn)結(jié)果表明,在WSN-DS數(shù)據(jù)集下,DKFCM-FSVM入侵檢測(cè)各項(xiàng)評(píng)價(jià)指標(biāo)與對(duì)照算法相比均達(dá)到最優(yōu),其能源消耗僅比SVM略高。因此,DKFCM-FSVM可以應(yīng)用到實(shí)際的WSNs場(chǎng)景中,從而提升WSNs抵抗網(wǎng)絡(luò)內(nèi)部攻擊的能力。

3)傳統(tǒng)機(jī)器學(xué)習(xí)處理大規(guī)模數(shù)據(jù)具有檢測(cè)精度低和檢測(cè)速度慢等問題。深度學(xué)習(xí)在模式識(shí)別、圖像處理和惡意流量分析等方面取得顯著成功,為入侵檢測(cè)領(lǐng)域提供了一種思路。

猜你喜歡
特征檢測(cè)
抓住特征巧觀察
“不等式”檢測(cè)題
“一元一次不等式”檢測(cè)題
“一元一次不等式組”檢測(cè)題
“幾何圖形”檢測(cè)題
“角”檢測(cè)題
新型冠狀病毒及其流行病學(xué)特征認(rèn)識(shí)
如何表達(dá)“特征”
不忠誠(chéng)的四個(gè)特征
抓住特征巧觀察
主站蜘蛛池模板: 香蕉久久永久视频| 91精品福利自产拍在线观看| 亚洲成人手机在线| 青青操视频在线| 日本一本正道综合久久dvd| 日韩中文精品亚洲第三区| 香蕉eeww99国产在线观看| 国产黄色爱视频| 午夜毛片福利| 免费一级α片在线观看| 国产成人精品18| 精品91自产拍在线| 成人毛片在线播放| 露脸一二三区国语对白| 国产尤物视频在线| 欧美另类图片视频无弹跳第一页| 强奷白丝美女在线观看| 国产精品综合久久久 | 日韩在线1| 在线免费a视频| a级毛片免费网站| 亚洲视频免| 久久精品国产在热久久2019| 天天色天天综合| 亚洲国产精品日韩av专区| 福利片91| 精品国产www| 国产午夜福利在线小视频| 日本道综合一本久久久88| 久久鸭综合久久国产| 最新亚洲av女人的天堂| 99成人在线观看| 91外围女在线观看| 国产亚洲视频中文字幕视频| 亚洲欧美日韩精品专区| 亚洲国产中文在线二区三区免| 精品91在线| 亚洲精品你懂的| 久久青青草原亚洲av无码| 在线日韩日本国产亚洲| 乱人伦中文视频在线观看免费| 久久综合丝袜日本网| 黄色网站不卡无码| 91po国产在线精品免费观看| 国产性爱网站| 无码人妻免费| 丰满人妻久久中文字幕| 欧美色视频网站| 午夜丁香婷婷| 夜夜拍夜夜爽| 亚洲另类色| 欧美区一区二区三| 亚洲成人网在线观看| 国产91麻豆免费观看| 2021最新国产精品网站| 婷婷丁香在线观看| 国产伦精品一区二区三区视频优播 | 国产欧美日韩视频怡春院| 国产成在线观看免费视频| 波多野结衣第一页| 免费又黄又爽又猛大片午夜| 毛片在线看网站| 91无码视频在线观看| 国产精品偷伦视频免费观看国产 | 亚洲电影天堂在线国语对白| 精品视频免费在线| 亚洲精品卡2卡3卡4卡5卡区| 毛片卡一卡二| 精品91视频| 欧美区在线播放| 国产精品亚洲天堂| 99久久人妻精品免费二区| 成人国产三级在线播放| 国产亚洲精品资源在线26u| 老司国产精品视频| 欧美一级高清片欧美国产欧美| 久久91精品牛牛| 四虎永久免费地址| 18禁影院亚洲专区| 亚州AV秘 一区二区三区| 美女无遮挡免费网站| 毛片免费试看|