999精品在线视频,手机成人午夜在线视频,久久不卡国产精品无码,中日无码在线观看,成人av手机在线观看,日韩精品亚洲一区中文字幕,亚洲av无码人妻,四虎国产在线观看 ?

基于深度學習的跨站腳本攻擊檢測

2022-03-24 08:29:28丁雪川張偉峰方菽蘭鄭黎黎
技術與市場 2022年3期
關鍵詞:深度檢測模型

丁雪川,張偉峰,方菽蘭,鄭黎黎

(1.成都市公安局,四川 成都 610000;2.成都賽博思安科技有限公司,四川 成都 610000)

0 引言

由于腳本語言具有靈活多變的特性以及不同瀏覽器之間存在的差異性,導致XSS攻擊的利用方式復雜多變,傳統的基于規則匹配的檢測方法難以有效地進行XSS攻擊檢測和防御。隨著機器學習的不斷發展,已經有很多研究團隊將機器學習算法引入XSS攻擊檢測中[1-4]。然而傳統的機器學習算法很大程度上依賴于特征的選擇提取,由于人工提取特征具有不可避免的局限性,基于傳統機器學習的檢測方法難以有效地滿足具有混淆、復雜、多變等特征的XSS攻擊檢測需求。

深度學習算法可以自動化提取攻擊載荷特征,從而避免人為提取特征所不可避免的局限性問題,因此將深度學習算法應用于Web攻擊檢測必然成為研究的趨勢。針對編碼混淆的XSS攻擊難以檢測的問題,本文構建了一個基于深度學習的跨站腳本攻擊檢測模型,有效提高XSS攻擊檢測的準確率。

1)提出一種基于深度學習的跨站腳本攻擊檢測模型。該模型基于Word2Vec提取輸入數據保留語義特征的詞向量,并基于LSTM深度神經網絡算法自動提取XSS攻擊的深層次特征,有效地檢測跨站腳本攻擊。此外,針對經過編碼混淆的XSS檢測困難的問題,提出循環解碼器還原其原始形態,進一步提升檢測效果。

2)搭建實驗環境測試檢測模型,在真實數據集上,通過與傳統機器學習算法和常見安全防護軟件進行對比,實驗結果驗證了檢測模型的有效性。

1 基于深度學習的跨站腳本攻擊檢測方法

針對編碼混淆的XSS攻擊難以檢測的問題,本文構建了一個基于深度學習的跨站腳本攻擊檢測模型。首先,根據XSS常見的編碼混淆技術,提出基于循環解碼器的數據清洗,將經過復雜編碼混淆后的攻擊向量解碼還原其原始數據狀態;其次,基于Word2Vec對預處理后的數據進行詞向量提取,將輸入數據構建為含有語義信息的詞向量序列表示;將跨站腳本攻擊檢測轉化為二分類,基于LSTM深度學習算法構架分類模型,根據惡意樣本和正常樣本訓練跨站腳本攻擊分類器作為攻擊檢測模型,實現跨站腳本檢測。

1.1 基于循環解碼器的數據清洗

跨站腳本攻擊常用的編碼混淆技術包括:URL編碼、HTML編碼、Base64編碼、UTF-7編碼、Unicode編碼等,提出一種循環解碼器,循環解碼器對編碼混淆的輸入數據進行循環解碼處理,直到解碼后的結果不再變化為止,從而將經過混淆的攻擊向量還原為其原始的數據形式。

1.2 基于Word2Vector的詞向量提取

深度學習檢測算法不能直接處理文本形式的輸入,需要將原始URL請求文本數據轉化為詞向量的輸入形式。圖1是將文本輸入轉換為詞向量的流程圖,主要包括循環解碼、范化、分詞和量化幾個步驟。

圖1 詞向量提取流程

其中,循環解碼處理過程基于上一小節中提出的循環解碼器;范化處理的目的是降低無意義信息對檢測結果的影響,并減少分詞數量,主要包括:將函數輸入參數替換為“param_string”,將URL鏈接替換為“http://website”,數字替換為“0”;基于跨站腳本攻擊的語法特征,設計相應的正則表達式進行分詞提取,分詞類別主要包括開始標簽、結束標簽、觸發事件、標簽屬性、函數名稱、腳本類型以及特殊字符等,量化過程則是基于Word2Vec進行詞向量表示,從而得到輸入文本的詞向量。

2 實驗設計與結果分析

2.1 實驗過程

基于跨站腳本攻擊惡意樣本數據構建攻擊詞典,將惡意樣本數據分詞后按照詞頻降序排序后取詞。隨著取詞數量的增長,樣本覆蓋率隨之增加,當取詞頻率達到TOP10000后,對應的樣本覆蓋率已經達到93.1%,但隨著取詞數量的成倍增長,后續樣本覆蓋率僅少量提升。最終設定樣本取詞頻為TOP10000的惡意樣本,從而構建跨站腳本攻擊的攻擊詞典。

為了客觀地選擇最優的Word2Vec訓練參數,對Size、Iter、Window、Nagative參數進行調優實驗。通過控制變量法,每次僅修改一個參數,并對比不同參數對LSTM檢測模型的召回率、精確率、準確率和F1值的影響,從而確定Word2Vec訓練參數。

2.2 實驗結果與分析

為了客觀地評估論文提出的檢測模型,將檢測模型與WangRui[18]等人提出的基于AdTree和AdaBoost傳統機器學習算法檢測XSS進行對比實驗,該方法采用了和本文相同的XSS惡意樣本數據集和正常樣本數據集,此外還選擇了網站安全狗[19](版本:Apache版V4.0)和XSSChop[20](版本:b6d98f6更新日期:2019-01-25)進行對比實驗。

基于LSTM的跨站腳本攻擊檢測模型的準確率為99.5%、召回率為97.9%和F1值為98.7%。在精確率、召回率和F1值三個方面的表現均優于ADTree和AdaBoost傳統機器學習算法的檢測模型;論文提出的檢測模型在精確率方面雖然略低于網站安全狗和XSSChop,但三者的精確率均超過了99.5%;且論文提出的LSTM檢測模型在召回率和F1值方面都優越于網站安全狗和XSSChop。

綜上所述,論文提出的基于LSTM的檢測模型在精確率、召回率和F1值等方面具有明顯的優勢,證明了該模型能夠有效地識別跨站腳本攻擊。

3 結語

針對編碼混淆的XSS攻擊難以檢測的問題,本文構建了一個基于深度學習的跨站腳本攻擊檢測模型,并證明其有效性。但是該研究仍然存在著一些問題和步驟,進一步研究和改進內容如下。

1)將檢測模型封裝為應用編程接口(API),提供可視化的Web檢測平臺。

2)深度研究其他跨站腳本攻擊編碼混淆方式,進一步豐富循環解碼器支持解碼的類型,優化解碼效率。

3)擴展應用場景,將基于深度學習的攻擊檢測模型應用到其他網絡安全領域,如SQL注入攻擊檢測和DDOS攻擊檢測等。

猜你喜歡
深度檢測模型
一半模型
“不等式”檢測題
“一元一次不等式”檢測題
“一元一次不等式組”檢測題
深度理解一元一次方程
重要模型『一線三等角』
重尾非線性自回歸模型自加權M-估計的漸近分布
深度觀察
深度觀察
深度觀察
主站蜘蛛池模板: 亚洲区欧美区| 一本视频精品中文字幕| 久久精品免费国产大片| 重口调教一区二区视频| 久久人搡人人玩人妻精品一| 免费观看国产小粉嫩喷水| av一区二区无码在线| 日本精品αv中文字幕| 2022国产91精品久久久久久| 成人一级免费视频| 中文字幕丝袜一区二区| 在线另类稀缺国产呦| 波多野结衣无码AV在线| 91在线日韩在线播放| 2021国产v亚洲v天堂无码| 亚洲天堂2014| 四虎成人免费毛片| 亚洲国产精品一区二区第一页免 | 国产精品三级av及在线观看| 天天躁日日躁狠狠躁中文字幕| 久久久亚洲色| 国产丝袜第一页| 91久久偷偷做嫩草影院精品| 全部无卡免费的毛片在线看| 性欧美久久| 萌白酱国产一区二区| 全色黄大色大片免费久久老太| 日韩一二三区视频精品| 国产亚洲欧美日韩在线一区| 高清码无在线看| 女人av社区男人的天堂| 亚洲国产综合自在线另类| 国产精品毛片一区| 国产精品伦视频观看免费| 日本一本在线视频| 亚洲αv毛片| 四虎影视8848永久精品| 国产精品尤物在线| 91色爱欧美精品www| 第九色区aⅴ天堂久久香| 日本免费新一区视频| 国产一区自拍视频| 成人午夜福利视频| 无码精品一区二区久久久| 国产黑丝一区| 国产靠逼视频| 日韩欧美国产精品| 中国成人在线视频| 日韩无码黄色| 五月婷婷综合网| 精品国产中文一级毛片在线看 | 高清色本在线www| 国产福利一区二区在线观看| 国产一区成人| 人妻丝袜无码视频| 免费A级毛片无码无遮挡| 欧美日韩一区二区三区在线视频| 精品国产成人三级在线观看| 久久精品中文无码资源站| 黄片在线永久| 日韩不卡免费视频| 亚洲中文在线视频| 国产va在线| 少妇露出福利视频| 亚洲天堂免费观看| 手机精品视频在线观看免费| 成年片色大黄全免费网站久久| 亚洲色偷偷偷鲁综合| 国产欧美日韩另类精彩视频| 538精品在线观看| 欧美一级黄片一区2区| 国模沟沟一区二区三区| 亚洲精品视频网| 亚洲成a人片77777在线播放| 亚洲精品无码日韩国产不卡| 成人中文字幕在线| 亚洲专区一区二区在线观看| 亚洲开心婷婷中文字幕| 精品视频免费在线| 一级看片免费视频| 91破解版在线亚洲| 中文字幕永久在线看|