999精品在线视频,手机成人午夜在线视频,久久不卡国产精品无码,中日无码在线观看,成人av手机在线观看,日韩精品亚洲一区中文字幕,亚洲av无码人妻,四虎国产在线观看 ?

基于焦點損失函數的物聯網入侵檢測深度學習方法

2023-10-01 16:53:25陳傲晗杜建斌景鑫淼
互聯網周刊 2023年18期

陳傲晗 杜建斌 景鑫淼

摘要:物聯網有望革命性地改變醫療、能源、教育、交通、制造、軍事、農業等多個行業。然而,要在各行業成功部署物聯網,需要設計和實施檢測安全漏洞的方法。近年來,雖然許多學者和工業界研究者已經利用機器學習技術設計和實施了計算機網絡入侵檢測系統,但在物聯網領域的研究相對較少。為解決物聯網中的入侵檢測問題,我們采用了專門的損失函數,能夠自動降低簡單樣本的權重,從而有效地訓練模型。我們利用兩種深度學習神經網絡架構實現了這一方法。在三個不同物聯網領域的數據集上進行的廣泛實驗評估結果顯示,相較于使用交叉熵損失函數,我們的方法在準確度、精確度、F1和MCC指標上均有顯著提升,分別高出24%、39%、39%和60%。

關鍵詞:焦點損失函數;卷積神經網絡;基線模型

引言

物聯網(the internet of things,IoT)是通過有線和無線網絡相互連接的設備網絡。該技術可能徹底改變醫療、能源、教育、交通、制造、軍事、農業等多個行業[1]。IoT設備不僅在工業領域,還在個人生活中扮演著重要角色。然而,與任何其他網絡信息系統一樣,IoT也容易受到網絡攻擊的影響。例如,2016年10月21日,利用Mirai惡意軟件,一系列利用IoT設備漏洞的分布式拒絕服務(DDoS)攻擊在美國全境爆發。因此,保護IoT中可能收集和處理敏感私人數據的設備免受各種網絡攻擊的威脅變得必不可少[2]。

1. 基于焦點損失函數的深度學習模型

1.1 任務建模

模型的輸入數據是一個二維的矩陣,其中為一個D維的向量。標簽yi與xi相對應且,為標簽類別。對于每個數據集來說,有N個樣本,其中每個樣本有L個攻擊類別。神經網絡將使用這些數據進行訓練以得到一個函數,被稱為估計函數,對于任意一個樣本xi,優化的目標是希望與真實的函數在某些特定的損失(如交叉熵損失函數)下距離最小。

1.2 深度學習模型

1.2.1 深度前饋神經網絡

一般來說,DFNN具有至少3層,即輸入層、輸出層和至少一個隱藏層。這里僅介紹具有一個隱藏層的網絡計算方式,具有多個隱藏層的網絡同理。令,分別為隱藏層和輸出層的可訓練權值矩陣,則從輸入層到隱藏層的計算可以表示為:

其中,為輸入數據集,bh表示偏置,為非線性激活函數,例如Sigmod函數。容易知道隱藏層的輸出。最終,輸出層的計算可以表示為:

其中,M應與數據集中類別個數相同,例如在二分類問題中,M=2。

1.2.2 卷積神經網絡

CNN的優勢在于,由于在計算過程中存在卷積核,可以學習到某一樣本xi的鄰域信息并將卷積核大小之內的信息采用某種方式進行融合,比如常見的最大池化或平均池化。一個卷積神經網絡有若干卷積層和一個深度前饋神經網絡構成,其中卷積層的輸出作為深度前饋神經網絡的輸入。卷積層通常由兩部分操作完成,分別為卷積操作和池化操作。對于數據集矩陣來說,卷積核為一個自定義大小的矩陣C,不妨令,在進行卷積操作時,C中的元素與X中的元素按照從左到右從上到下的順序,以自定義的步長移動C,做逐元素(element-wise)乘法。池化操作將按照某種規則做逐元素乘法得到的矩陣進行壓縮,比如最大池化會選擇4個數字中最大的作為代表參與之后的計算。

1.3 焦點損失函數

在各個領域中,許多數據集普遍存在類別不平衡問題。交叉熵損失是一種傳統的損失函數,在分類任務中被廣泛使用。首先考慮最簡單的二分類問題中的交叉熵損失函數,

在二分類問題中,樣本xi對應的標簽,分別表示正類和負類。上式表示模型對樣本xi的標簽yi=1做出的概率估計。基本上,交叉熵損失試圖通過使用負對數似然來減少整個數據集上的平均損失。因此,任何使用這種損失函數(如交叉熵損失)來訓練模型的深度學習模型都能夠準確地預測多數類別,但無法正確地預測少數類別,因為其目標是最小化訓練集上的平均損失。近年來,針對計算機視覺中的類別不平衡問題,提出了專門的損失函數(如Dice損失和焦點損失)。例如,Dice損失使用Dice系數來解決這個問題,如下所示:

其中表示樣本xi所屬類別的估計值。然而,在類別極度不平衡且分母較小的情況下,比如入侵檢測任務的數據集,Dice損失的梯度本質上是不穩定的。因此,少數樣本的錯誤分類可能會導致Dice系數顯著降低,這對于少數類別不利,因此在入侵檢測任務中表現不佳。為了解決入侵檢測任務中的這個問題,本文使用了最初用于目標檢測場景的焦點損失函數。焦點損失函數的關鍵思想是重新塑造損失函數,使得簡單的示例權重降低,而訓練集重點放在難以正確分類的負例上。令

則焦點損失函數定義為:

其中可以被視為調整因子來平衡類別權重。進一步地,可以令

其中at加入可以更大程度上解決數據集中的類別不平衡問題。在γ選取過大的情況下,少數類別將會獲得比多數類別更大的權重,反之亦然。

2. 實驗

2.1 模型實現

在模型的實現上,本文使用了深度學習模型DFNN和CNN。實現的DFNN包含三個隱藏層,分別包含50、30和20個神經元;輸出層包含與攻擊類型數量相匹配的神經元。對于WUSTL-EHMS-2020數據集,使用了一個包含50個神經元的單隱藏層。最終的分類是通過softmax函數執行的。使用了ReLU激活函數和Adam優化器。loT入侵檢測的數據集由一系列一維數據組成,因此本文使用了一維卷積神經網絡(conv1D)進行實驗。對于conv1D,本文使用了32個濾波器,核大小為3。池化操作上使用了最大池化。與DFNN類似,對于conv1D,我們應用了relu激活函數和Adam優化器。每個網絡訓練了100個epoch,并使用了提前停止技術。在基線模型中,本文使用了交叉熵作為要對比的損失函數。而在本文提出的模型實現中,使用了焦點損失函數作為一種專門的損失函數。焦點損失函數有兩個超參數,即焦點因子和平衡因子。在Bot-IoT數據集的訓練中,對于DFNN,我們將焦點因子設置為2,平衡因子設置為1;對于 conv1D,我們將這些參數分別設置為5和5。在WUSTL-IIoT-2021數據集上的訓練中,對于DFNN,我們將焦點因子和平衡因子分別設置為 2.5 和 0.15;對于 conv1D,我們將焦點因子和平衡因子分別設置為 2.0 和 0.3。最后,在WUSTL-EHMS-2020數據集上的訓練中,對于 FNN,我們將焦點因子γ和平衡因子α分別設置為 2 和 2;對于 conv1D,我們將焦點因子γ和平衡因子α分別設置為 2 和 0.2。

2.2 評價指標

本文使用以下定量指標來評估各種ML分類器的性能:準確率(Acc)、精確度(Pre)、召回率(Rec)、F1-Score。在我們的實驗中,我們計算了所有四個參數的宏平均,這是評估不平衡數據集方法的期望度量標準。Acc表示算法預測特定事件發生的準確程度;Pre指算法預測的不同類型入侵的頻率。Rec表示算法預測為入侵且實際為入侵的比例。精確度和召回率的調和平均的倒數稱為F1-Score。最近,Matthew's Correlation Coefficient(MCC)在評估分類性能時被證明比準確率和F1-Score產生更真實的評估。MCC只有在四個類別( 真正例TP、假反例FN、真反例TN和假正例FP)中都取得良好結果時才會產生高分。此外,MCC不受數據集不平衡的影響。本文還將MCC作為評估指標之一。各個指標的計算方法如表1所示。

2.3 數據集

2.3.1 WUSTL-lloT-2021數據集

WUSTL-IIoT-2021數據集包含工業物聯網(IIoT)相關的數據。該數據集是使用IIoT測試平臺中描述的監控控制和數據采集架構生成的。該測試平臺旨在盡可能真實地模擬實際的工業系統,并允許進行實際的網絡攻擊。作者已經收集了約2.7GB的數據并對收集到的數據集進行了預處理和清洗過程(刪除缺失值和損壞值,即無效條目)。該數據集具有45個屬性,包含與以下四種不同類型的攻擊相關的數據:DoS、命令注入、偵察和后門。需要強調的是,該數據集沒有單獨的測試和訓練數據集。因此,我們根據數據項的時間戳對數據集進行了排序,然后將前80%的樣本用于訓練,剩余的用于測試。

2.3.2 WUSTL-EHMS-2020數據集

WUSTL-EHMS-2020數據集是使用實時增強型醫療監測系統(EHMS)生成的。測試平臺收集了網絡流量指標和患者生物指標。EHMS測試平臺包括四個組件:醫療傳感器、網關、網絡和控制與可視化。在該測試平臺中,數據流從連接到患者身體的傳感器開始,然后繼續傳輸到網關。使用交換機和路由器,網關將數據傳輸到服務器以進行可視化。數據在到達服務器之前可以被攻擊者截取。這個數據集包含了關于中間人攻擊的數據,包括欺騙和數據注入。在這個數據集中,數據項具有43個特征:其中35個是網絡流量指標,另外8個是患者生物特征。該數據集中的樣本有兩種類型的標簽:正常和攻擊。根據源MAC地址特征,作者將攻擊者電腦的MAC地址標記為1,其余的標記為0。WUSTL-EHMS-2020數據集與WUSTL-IIoT-2021數據集類似,沒有單獨的測試和訓練數據集。由于它不包含時間戳特征,我們隨機地將數據集分割為訓練和測試數據集。

3. 基線模型

OriM:模型是使用原始數據集(即未進行平衡處理的數據集)進行訓練的。我們使用數據集中的原始訓練樣本,使用傳統的損失函數,即交叉熵損失函數,來訓練分類器。BalM:模型是在經過平衡處理的數據集上使用隨機過采樣進行訓練的。我們使用隨機過采樣來平衡三個訓練數據集。隨機過采樣涉及在少數類別中隨機復制樣本,以平衡數據集。在整個采樣過程中,從每個類別中獨立地選擇樣本。經過隨機過采樣平衡訓練數據集后,在Bot-IoT、WUSTL-IIoT-2021和WUSTL-EHMS-2020數據集中,各類別的訓練樣本數量分別約為1233052、797261和10275。Dice:模型是使用Dice損失函數進行訓練的。在處理圖像分割中的數據不平衡問題時,通常會使用Dice損失函數。Dice損失是基于Dice系數計算的。一般情況下,Dice系數可以通過將實際值和預測值的總和除以實際值和預測值的交集的兩倍來計算。本文在所有三個原始訓練數據集上使用Dice損失函數來訓練DL模型,用于多類別和二分類任務。本文將上述三種控制變量得來的處理方法,分別與DFNN和CNN進行組合,并在對應的數據集上進行實驗,以探究本文提出方法的有效性。

3.1 結果分析

3.1.1 Bot-loT數據集

表2包含了我們使用Bot-IoT數據集評估的各種模型的性能結果。DFNN-Focal和CNN-Focal在準確性、精確率、F1分數和MCC分數方面明顯優于設定的基線方法。具體地,就MCC而言,DFNN-Focal和CNN-Focal相對于FNN-OriM和CNN-OriM分別提升了10%和29%。另外,可以看到,DFNN-Focal和CNN-Focal在所有比較的方法中表現最佳。同樣,DFNN-Focal和CNN-Focal的準確率分別比DFNN-OriM和CNN-OriM提高了3%和17%;在F1-Score方面,DFNN-Focal和CNN-Focal分別提高了3%和16%。這種性能上的提升可以歸因于DFNN-Focal和CNN-Focal中使用的焦點損失所實現的動態縮放梯度更新。

3.1.2 WUSTL-lloT-2021數據集

表3包含了不同模型在WUSTL-IIoT-2021數據集上的性能結果。總體而言,所有方法在該數據集上的性能與它們在Bot-IoT數據集上的性能相似。在所有同類方法中,DFNN-Focal和CNN-Focal具有最高的準確性、精確度、F1-Score和MCC。在所有基于DFNN的方法中,DFNN-Focal的MCC比最接近的FNN-OriM高出25%;盡管CNN-Focal的MCC僅比CNN-OriM高2%,但它在所有基于CNN的方法中具有最高的MCC。相對于DFNN-OriM和CNN-OriM,DFNN-Focal和CNN-Focal的F1-Score分別提高了18%和5%。

3.1.3 WUSTL-EHMS-2020數據集

表4描述了基線模型和本文提出的方法在WUSTL-EHMS-2020數據集上的結果。可以看到,無論是在準確性、精確度、F1-Score還是MCC方面,DFNN-Focal和CNN-Focal都表現得比其他基線DL分類器要好。綜合來看,與本文方法最接近的是OriM基線方法,其中,DFNN-Focal的性能分別提高了0.002,2,0.001,0.003和1.1。類似地,與CNN-OriM相比,CNN-Focal在準確性、精確度、F1-Score和MCC方面的性能分別提高了0.019,2,0.004和0.012。因此,無論是DFNN-Focal還是CNN-Focal都只表現出了微小的改善。從這些結果中可以得出結論,使用焦點損失函數的方法在F1分數和MCC方面始終優于所有競爭模型,并且在準確性、精確率和召回率方面也更好。在所有數據集上,DFNN-Dice和CNN-Dice的MCC分數都為零。這是因為Dice損失在少數類上表現不佳。

結語

在過去的十年中,研究人員已經使用機器學習技術設計和實現了計算機網絡的入侵檢測系統,但在物聯網領域的入侵檢測方面,還沒有做太多的工作。本文填補了這一空白,提出了一種新的基于深度學習的物聯網入侵檢測方法,即使用焦點損失函數,并在物聯網的三個不同領域中使用三個不同的數據集進行了性能評估。通過廣泛的實驗評估將本文提出的方法的性能與幾個基線模型進行了比較。我們的評估結果表明,相對于基線模型,加入焦點損失函數的方法在多個數據集上的準確性、精確度、F1-Score和MCC分別提高了多達24%、39%、39%和60%。

參考文獻:

[1]樊琳娜,李城龍,吳毅超,等.物聯網設備識別及異常檢測研究綜述[EB/OL].(2023-5-26)[2023-08-30].https://doi.org/ 10.13328/j.cnki.jos.006818.

[2]劉云,鄭文鳳,張軼.代價約束算法對入侵檢測特征提取的優化研究[J].計算機工程與科學,2022,44(3):447-453.

作者簡介:陳傲晗,本科,研究方向:物聯網網絡安全領域;杜建斌,本科,研究方向:計算機網絡安全領域;景鑫淼,本科,研究方向:威脅防御、網絡安全標準化。

主站蜘蛛池模板: 亚洲成a∧人片在线观看无码| 欧洲精品视频在线观看| 国产本道久久一区二区三区| 日韩国产一区二区三区无码| 久久国产精品电影| 一级毛片免费的| 91久久国产综合精品女同我| 欧美精品xx| 亚洲精品大秀视频| 亚洲精品无码不卡在线播放| 欧美成人影院亚洲综合图| 日韩精品毛片| 亚洲高清在线播放| 99视频国产精品| 久久一色本道亚洲| 丁香婷婷在线视频| 国产综合无码一区二区色蜜蜜| 熟女日韩精品2区| 国产在线精品人成导航| 中文字幕欧美成人免费| 国产内射一区亚洲| 亚洲欧美一区在线| 国产一级视频久久| 99青青青精品视频在线| 自拍中文字幕| 日本一区二区不卡视频| 精品无码国产一区二区三区AV| 日韩欧美中文| 美女啪啪无遮挡| 在线不卡免费视频| 999精品视频在线| 永久免费AⅤ无码网站在线观看| 欧美自慰一级看片免费| 国产成人精品18| 亚洲无码不卡网| 性视频久久| 久久永久精品免费视频| 91精品伊人久久大香线蕉| 国产日韩久久久久无码精品| 国产毛片一区| 91色在线观看| 99久久婷婷国产综合精| 中文字幕日韩丝袜一区| 亚洲成人精品| 在线观看亚洲成人| 亚洲天堂日本| 免费无码AV片在线观看中文| 精品一区二区三区四区五区| 久久免费精品琪琪| 日韩一区精品视频一区二区| 亚洲福利网址| 国产精品永久在线| 国产亚洲高清在线精品99| 免费观看三级毛片| 国产精品午夜福利麻豆| 亚洲成肉网| 亚洲欧美日韩天堂| 国产精品v欧美| 国产成+人+综合+亚洲欧美| 亚洲天堂免费| 国产第一页屁屁影院| 99中文字幕亚洲一区二区| 国产浮力第一页永久地址| 99精品免费欧美成人小视频| 在线播放真实国产乱子伦| 亚洲欧洲日韩综合| 国产成人永久免费视频| 中文字幕 91| 一本久道久综合久久鬼色| 青青青伊人色综合久久| 久久狠狠色噜噜狠狠狠狠97视色| a毛片在线| 美女无遮挡免费视频网站| 国产精品毛片在线直播完整版| 久久人与动人物A级毛片| 一级全黄毛片| 91毛片网| 欧美成人免费午夜全| 日韩中文精品亚洲第三区| 人人91人人澡人人妻人人爽 | 动漫精品啪啪一区二区三区| 中文字幕永久视频|