999精品在线视频,手机成人午夜在线视频,久久不卡国产精品无码,中日无码在线观看,成人av手机在线观看,日韩精品亚洲一区中文字幕,亚洲av无码人妻,四虎国产在线观看 ?

一種基于兩級K-異步聯邦學習的隱私保護入侵檢測方案

2024-12-31 00:00:00陳力奪溫蜜張研博
計算機應用研究 2024年11期

摘 要:5G的廣泛應用導致物聯網的設備和流量激增,降低了物聯網入侵檢測系統的效率和可靠性。目前的入侵檢測系統主要使用同步的分布式深度學習方法,難以應用到現實的分布式異步場景中。另外,在分布式的訓練過程中也可能遭遇推斷攻擊。針對以上問題,提出了一種基于兩級K-異步聯邦學習的隱私保護入侵檢測方案,通過在模型訓練的不同階段使用對應算法,提高異步入侵檢測模型訓練的收斂性和準確率,并設計了一種梯度屏蔽算法防止系統異步訓練過程中的推斷攻擊。實驗結果表明,在強異構場景下,該方案在兩個入侵檢測數據集上訓練的準確率可以分別提高11.8%和9.8%,為提高物聯網場景下入侵檢測系統的效率、可靠性和安全性提供了一種有效方案。

關鍵詞:聯邦學習; 入侵檢測; 隱私保護; 異構機制

中圖分類號:TP309 文獻標志碼:A

文章編號:1001-3695(2024)11-039-3471-06

doi: 10.19734/j.issn.1001-3695.2023.12.0642

Privacy-preserving intrusion detection scheme based on hierarchical K-asynchronous federated learning

Chen Liduo?, Wen Mi, Zhang Yanbo

(College of Computer Science amp; Technology, Shanghai University of Electric Power, Shanghai 200090, China)

Abstract:The widespread application of 5G led to a surge in Internet of Things (IoT) devices and traffic, reducing the efficiency and reliability of IoT intrusion detection systems. Current intrusion detection systems primarily used synchronous distri-buted deep learning methods, which were difficult to apply to real-world distributed asynchronous scenarios. In addition, distributed training processes may suffer from inference attacks. To address these issues, this paper proposed a privacy-preserving intrusion detection scheme based on hierarchical K-asynchronous federated learning. By utilizing corresponding algorithms at different stages of model training, it improved the convergence and accuracy of asynchronous intrusion detection model training. Additionally, this paper designed a gradient masking algorithm to prevent inference attacks during system asynchronous training. Experimental results show that in strongly heterogeneous scenarios, this scheme can increase the accuracy of training on two intrusion detection datasets by 11.8% and 9.8% respectively, offering an effective solution to enhance the efficiency, reliability, and security of intrusion detection systems in IoT environments.

Key words:federated learning; intrusion detection; privacy protection; heterogeneous mechanism

0 引言

近年來,隨著5G工業互聯網的快速發展,工業物聯網(Industrial Internet of Things, IIoT) 范式中邊緣設備的廣泛部署催生了邊緣計算的各種新興應用,例如智能制造、智能交通和智能物流[1]。邊緣設備提供強大的計算資源,為工業物聯網應用提供實時、靈活、快速的決策,極大地促進了工業的發展。但隨著物聯網的擴展,與物聯網設備和系統相關的安全漏洞和威脅的數量和影響顯著增加[2]。為了解決這些問題,入侵檢測系統 (intrusion detection system, IDS) 作為一種早期檢測物聯網攻擊和網絡威脅的方法被廣泛使用[3]。近年來,入侵檢測系統機制通常基于機器學習技術利用設備的網絡流量進行訓練,主要分為集中式入侵檢測和分布式入侵檢測,其目的是準確檢測任何可能的異常行為。其中,基于分布式方法,如霧/邊緣計算的入侵檢測系統,在訓練過程中為了提高入侵檢測性能,通常使用一些不可信的分布式物聯網設備中產生的流量數據。然而,由于不同區域的設備可能需要共享其私有數據,這種方法會引發隱私問題[4]。為了解決隱私問題,谷歌提出了聯邦學習(federated learning, FL)的概念,其中機器學習算法在多個分散的邊緣設備上進行本地訓練[5],各方不共享數據,而是由云服務器來聚合邊緣設備訓練的局部參數或梯度[6, 7]

然而,目前的基于聯邦學習的入侵檢測方案存在兩方面的問題,其一是現有基于聯邦學習的入侵檢測方案研究主要集中在同步聯邦學習(synchronous federated learning, SFL),這需要中央服務器在聚合之前接收所有客戶端上傳的梯度。在入侵檢測任務場景下等待所有這些梯度在同一次迭代中到達并進行聚合,這樣會顯著降低聯邦學習的訓練效率。同時,目前的聯邦學習方案仍然存在隱私問題,最近的研究表明,攻擊者可以直接從共享的明文梯度中恢復參與者的原始數據,而無須任何附加信息。這意味著聯邦學習的參與者可以輕松地從其他參與者傳輸的梯度中提取所有參與者的本地數據,這會使得訓練任務由于數據泄露變得更加脆弱。

針對使用同步聯邦學習的侵檢測方案面對的效率和隱私問題,本文提出了一種安全的基于異步聯邦學習的入侵檢測方案,具體貢獻如下:a)提出一種基于兩級K-異步聯邦學習的隱私保護入侵檢測方案(hierarchical K-asynchronous FL-IDS, HKAFL-IDS),可以改善由于物聯網設備擴張產生的設備異構性對入侵檢測訓練的影響,更適用于5G場景下的大規模物聯網終端接入環境;b)提出了兩級的聯邦學習架構提高入侵檢測訓練的收斂速度,同時設計了動態加權的方法,綜合考慮梯度質量和陳舊性篩選優質梯度參加聚合,并根據陳舊性調整學習率來加速訓練過程,提高模型訓練的準確率;c)通過引入與權重結合的屏蔽技術,HKAFL-IDS可以保護入侵檢測訓練參與者的梯度信息隱私,并進行安全的加權聚合。

1 相關工作

1.1 入侵檢測

入侵檢測系統可分為集中式入侵檢測和分布式入侵檢測兩類。2011年,Ten等人[8]設計了一種入侵檢測方法。這種入侵檢測方法可以創建攻擊者黑名單進行基于特征碼的檢測,從而更好地識別攻擊者。2016年,Rossi等人[9]提出了一種基于異常的入侵檢測方法,他們不是僅調查單個事件來檢測異常,而是對一組事件集進行評估,以檢測異常行為。2017年,Andrysiak等人[10]測試了三種不同的異常,并研究了如何分析時間序列來識別智能電表中的異常。2020年,Zhang等人[11]將極端學習機應用于智能電網的入侵檢測系統以提高系統的安全性。但是集中式入侵檢測可能導致物聯網用戶的隱私泄露,因為攻擊者可以通過分析設備的流量來推斷用戶的日常習慣。其次,考慮到典型物聯網環境的動態性,大量數據與數據中心通信所產生的延遲可能難以承受,甚至可能會降低入侵檢測系統部署的有效性。另一方面,分布式入侵檢測近年來主要集中于基于聯邦學習的方案。Chen等人[12]提出一種基于聯邦學習的入侵檢測方法。允許多個參與者協作訓練全局檢測模型,無須共享本地數據,從而保護數據隱私,并采用重采樣來提高模型性能。Cui等人[13]提出了一種區塊鏈賦能的去中心化聯邦學習框架,用于物聯網系統中的異常檢測,在提高效率的同時確保數據完整性并防止單點故障。Li等人[14]為工業網絡物理系統(cyber-physical systems, CPSs)設計了一種基于深度學習的新型入侵檢測模型,并開發了一個聯合學習框架,允許多個工業 CPS 以保護隱私的方式共同建立一個全面的入侵檢測模型。目前的方案大多考慮同步通信的理想情況,雖然同步聯邦學習在小型物聯網區域或當客戶擁有類似的計算和通信能力時影響很小,但它在具有不同型號、規格和版本的各種硬件設備的大型物聯網中則成為了不可忽視的挑戰。在這種情況下,中央服務器會收到大量具有不同延遲的梯度。如何高效聚合這些異步傳輸的梯度是目前亟待解決的問題。

1.2 聯邦學習隱私保護技術

近年來,研究人員主要使用各種密碼學技術強化聯邦學習的隱私保護能力。邱曉慧等人[15]對聯邦學習的隱私保護技術進行了研究和總結,他們指出目前的聯邦學習隱私保護技術主要包括差分隱私技術、同態加密技術和安全多方計算技術。差分隱私技術方面,Shen等人[16]針對差分隱私的問題,提出一種根據數據敏感性來調整隱私參數的方法,解決了因隱私預算相同而導致的部分參與者隱私保護不足或過度的問題。Han等人[17]提出了一種名為基于差分噪聲加法的聯邦學習差分隱私保護方法,通過分析梯度趨勢、權重參數得到重要性系數,采用微分噪聲加法機制添加噪聲。徐晨陽等人[18]設計了一種差分隱私機制來保護遷移聯邦學習過程中的隱私信息,但是差分隱私可能會降低全局模型的準確性,需要在準確性與隱私保護之間權衡。使用同態加密的方案中,Zhao等人[19]集成半同態加密降低計算和通信負擔,還可以抵御反演攻擊和推斷攻擊,顯著降低了隱私預算。Nguyen等人[20]提出一個使用同態加密的安全聚合協議,并結合零知識證明,既防止了中毒攻擊,又保護了模型的安全。Du等人[21]提出一種多閾值多密鑰同態加密方案,很大程度上降低了計算開銷,實驗證明了這個方法可以在不犧牲模型準確性的情況下保護隱私。然而同態加密技術計算成本巨大,不適合資源受限的場景。

安全多方計算技術也得到了很多關注, 目前大多數研究者主要使用秘密共享技術。Lin等人[22]引入一種附加的秘密共享方案,以抵御聚合服務器、惡意參與者和邊緣節點之間的潛在串通攻擊。Xu等人[23]提出一種基于格的多用途秘密共享方案,以避免在實現后量子安全的同時,將新的秘密共享分配給每一輪聯邦學習的所有參與者。Huang等人[24]利用Shamir的秘密共享技術設計了一種隨機屏蔽方法,以保護局部梯度的機密性。這一方法不僅可以保護數據隱私,還可以緩解訓練過程中由于用戶丟失導致的訓練失敗問題。但是秘密共享技術一方面增加了參與者之間的通信開銷,另一方面也不適用于異步訓練場景。

2 背景知識

2.1 異步聯邦學習

傳統的聯邦學習機制是同步聯邦學習,其特點是服務器在一個輪次內,接收所有終端上傳的梯度,聚合后將全局模型廣播給所有終端,再進行下一輪。同步聯邦學習機制簡單,但是在設備增多,差異增大后,訓練效率受設備通信能力影響嚴重,其全局訓練速度由參與訓練的終端設備中通信能力最差的設備決定,其更新公式如下:

wt+1=wt-γtT∑Ti=1g(wit,ξit)(1)

其中:g(wit,ξit)為第t輪第i個中心路由器上傳到服務器的梯度;wit為模型的參數向量;ξit為第i個中心路由器在第t輪使用的樣本。因此在面對強異構性場景,本文使用異步聯邦學習解決上述問題,異步聯邦學習的特點是服務器只在一定時間內接收梯度,并僅使用此段時間內接收到的梯度進行全局聚合。各終端設備在上傳梯度后不等待返回的全局模型,而是繼續利用本地數據訓練。這樣全局訓練速度僅由服務器掌控,服務器可以不間斷地進行全局聚合,提高了訓練效率。同時,各終端設備也可以持續訓練以充分利用本地數據。

圖1所示為客戶端總數為5時的異步聯邦學習示意圖,紅色長箭頭表示該梯度被服務器接收,紅色短箭頭表示該梯度未被服務器接收,虛線表示該客戶端持續訓練(參見電子版)。

然而在實際應用過程中,異步聯邦學習可能出現某一輪次接收了大量梯度,而某一輪次接收極少梯度的情況,這會導致梯度更新方向產生偏差,模型波動較大。因此本文使用的是K-異步聯邦學習,其在異步聯邦學習的基礎上更改了服務器的聚合方式,改為每輪接收最先到達的K個梯度,其余梯度依次排隊等待下一輪聚合,聚合公式如下:

wt+1=wt-γt∑Ti=1pitg(wit,ξit)(2)

圖2為客戶端總數為5,K為2時的K-異步聯邦學習示意圖。

2.2 梯度遮蔽

假設有n個參與者,xi是參與者ui的局部梯度。為了保護參與者梯度的隱私,任意兩個參與者ui和uj協商生成一個隨機數ri,j。每個參與者ui本地計算屏蔽梯度如下:

每個參與者將〖xi〗發送到云服務器。然后云服務器聚合梯度如下:

3 系統模型

本章詳細描述本文使用的入侵檢測系統架構、組件和工作基本原理,并對其中的威脅模型進行闡述。由于基于5G的物聯網技術不斷發展,物聯網中心服務器所控制的終端設備數量、種類、分布區域都不斷增大。這些因素共同導致了各終端的計算能力、通信能力區別顯著增大。這種情況下,各類設備都會呈現與小型場景不同的特點,同時,各參與方的隱私窺探行為會產生更加嚴重的負面影響,使物聯網系統面臨更大的安全威脅。

3.1 系統架構

本文使用場景為一個設備分布區域廣、設備數量、種類較多的工業物聯網場景,其中主要包含以下四種角色:

a)可信機構。它負責建立整個系統,生成私鑰-公鑰對以及公共參數,它將密鑰對轉發給每個參與者并發布所有公共參數。b)云服務器。作為整體物聯網區域的調度中心,云服務器負責協調各區域中心路由器。在模型建立的初期,云服務器會初始化模型的參數并向所有中心路由器廣播入侵檢測模型,在訓練階段,云服務器負責執行異步訓練算法,對接受的梯度進行異步聚合和分發。c)中心路由器。它是一個小區域內所有終端設備的數據中轉中心,在入侵檢測模型訓練的過程中,負責將區域內終端的流量數據收集起來并利用流量數據訓練本地入侵檢測模型,計算更新梯度并上傳給服務器,并將訓練的全局入侵檢測模型廣播給區域內的所有終端。d)終端設備。它是廣泛分布在工業物聯網區域內的電子設備,如智能充電樁、智能門控、智能機械臂系統等。它們負責在本地執行入侵檢測算法,并將本地數據發送給中心路由器。

3.2 威脅模型

本方案定義了以下威脅模型:可信機構值得信賴并誠實地執行其程序。云服務器和中心路由器是誠實但好奇的。在這個假設下,它們都會誠實地執行一系列操作(例如梯度加密和上傳等)。然而它們可能會嘗試推斷其他中心路由器的本地數據。方案的目的是防止中心路由器本地梯度的隱私泄露。

4 基于兩級異步聯邦學習的隱私保護入侵檢測方案

本文提出了一種基于兩級K-異步聯邦學習的隱私保護入侵檢測方案,即HKAFL-IDS,該方案旨在解決當前物聯網入侵檢測系統中的安全和訓練效率問題。總體來說,本文使用兩級動態加權的異步聯邦學習算法提高訓練的效率,同時使用梯度屏蔽和同態哈希函數的方法保護數據隱私。

4.1 HKAFL-IDS的總體步驟

本方案使用兩級的K-異步聯邦學習算法,使用動態權重的方法篩選出質量高、陳舊性低的梯度,以提高入侵檢測系統的收斂速度和性能,同時使用梯度屏蔽和同態哈希函數的方法保護數據隱私,如圖3所示。方案的整體步驟如下:

a)系統初始化:在識別出本次訓練涉及的中心路由器后,云服務器首先初始化所有中心路由器的模型參數,如學習率、使用的本地數據量、本地訓練輪數、損失函數等。最后,將模型參數廣播給所有中心服務器。

b)異步訓練及梯度屏蔽:在第一輪中,所有中心路由器在收到初始化的模型參數后,使用本地數據集訓練入侵檢測模型,并將反饋信息上傳到云服務器。在接收到第一輪的全局梯度后,接下來中心路由器將不斷地使用本地數據集訓練模型并將梯度質量信息(本地梯度與接收的最新一輪全局梯度的余弦相似度)上傳到云服務器。如果接收到服務器傳輸的參與集合信息,則將梯度經過加權屏蔽后上傳到云服務器。如果收到云服務器傳輸的模型參數,就會更新本地模型。

c)異步安全聚合:云服務器在訓練的初始階段對最先接收到反饋的K個中心路由器返回初始質量參數并完成聚合。當訓練輪次達到要求后,則開始對接收到的梯度質量進行質量判定,同時結合梯度的陳舊度判斷此梯度能否參與聚合。當收集到K個滿足聚合要求的梯度質量信息后,則對此K個中心路由器發送它們的集合信息,并對此K個中心路由器反饋的屏蔽梯度進行加密聚合。

d)更新本地模型:完成聚合后,云服務器將聚合后的全局梯度廣播給所有中心路由器,各中心路由器接收到全局梯度后更新本地入侵檢測模型,并廣播給區域內所有終端設備進行入侵檢測任務。

4.2 兩級K-異步聯邦學習算法

本節介紹設計的異步聯邦學習算法。如2.1節所述,在物聯網場景的入侵檢測訓練過程中,使用同步聯邦學習會導致模型更新速度極慢,使系統對新攻擊方式反應遲鈍。而使用一般的異步聯邦學習會導致模型波動大,或由于設備的通信能力差異導致不同類型的網絡攻擊數據嚴重失衡。這都會使得入侵檢測的準確率下降。而K-異步聯邦學習可以在保證快速更新的同時減小設備的能力差異對數據數量和類型的影響,在物聯網入侵檢測檢測率上具有較大優勢。同時,在使用異步聯邦學習進行入侵檢測訓練的過程中,如果直接對梯度質量進行篩選聚合,訓練的初始階段會篩去大量梯度導致收斂速度慢。本算法使用分級的K-異步聯邦學習方法,在訓練的初始階段對接收梯度進行無篩聚合以快速提煉數據特征,提高收斂速度。

4.2.1 分級的異步方案

為了提高入侵檢測訓練的收斂速度,在訓練的初始階段,云服務器對最先接收到的K個梯度直接進行聚合。如圖4所示,當中心路由器總數為5,K為2時,各中心路由器接收到初始化參數后就向云服務器發送反饋信息,云服務器會對最先接收到的2個中心路由器創建集合,并對集合中的所有中心路由器發送參與者集合,各參與的中心路由器根據集合內容對本地梯度進行屏蔽后發送給云服務器。最后云服務器對所有參與者發送來的梯度進行平均聚合后,將更新的全局模型廣播給所有中心路由器。聚合公式如下:

g(wt)=1K∑Ki=1g(wit,ξit)(5)

直接聚合可以快速提取入侵檢測流量數據集中的特征,防止初始階段由于模型的更新方向波動導致優質梯度被誤篩。初始階段的快速訓練允許入侵檢測系統快速啟動,從而加速模型收斂過程。這對于在分布式環境中訓練大規模模型的系統尤為重要。

接下來,當訓練達到預定輪次后,由于一些劣質梯度參與,若繼續對梯度直接聚合,訓練精度將出現較大波動,同時訓練的最終效果也會較差,所以在訓練基本收斂后,模型轉換為第二級,接受的梯度不再直接參與聚合,而是依據接收梯度的梯度質量和陳舊性來篩選梯度并加權聚合。

4.2.2 基于質量和陳舊性的權重聚合

在梯度聚合時,梯度的質量和陳舊性會對聚合的模型性能產生較大的影響。低質量的梯度可能導致模型不穩定,收斂速度較慢,或者在訓練中陷入局部極小值。通過篩選梯度并選擇高質量的梯度用于更新全局模型,可以改善訓練的效率和模型的性能。而一般認為,陳舊度越高的梯度,其更新方向與理想模型更新方向不一致的概率越大,因此聚合陳舊性高的梯度可能會導致模型參數的偏離和不穩定。

綜合以上兩個因素,在第二級首先對接收到的梯度進行質量篩選,如圖5所示,各中心路由器首先使用上一輪的全局梯度作為估計無偏梯度,并依據無偏梯度計算每個梯度的余弦相似度后再計算質量因數。質量因數計算公式如下:

其中:αgt;0是一個常數。需要注意的是,由于通信延時的原因,并非所有上傳到云服務器的余弦相似度都使用最新的全局梯度作為參考,但由于第一級無篩訓練后,模型更新趨向平穩,每一輪的更新幅度較小,所以使用相鄰t′輪次內的全局梯度作為參考都可以被接受,而使用超出相鄰t′輪次內的全局梯度作為參考的余弦相似度將被丟棄。

同時,考慮梯度的陳舊性,使用梯度的延時數據來估量陳舊性,延時越高,則陳舊性越強。陳舊性的計算公式如下:

st,i=e-βτit(8)

其中:βgt;0是一個常數;τit為第t輪第i個中心路由器的延遲;st,i越大則陳舊性越低,相反st,i越小則陳舊性越高。

最后定義優質因數,即質量因數與陳舊度的和。優質因數越高,則梯度的綜合質量越好,高于優質因數閾值Qmin的梯度才可以參與本輪聚合,而優質因數過低的梯度則被丟棄。優質因數的計算公式如下:

Qt,i=qt,i+st,i(9)

當接收到K個滿足要求的梯度后,便將這些中心路由器的集合信息發送給它們,以便這些中心路由器對本地梯度進行屏蔽。最終根據梯度的優質因數進行加權聚合,以提高高質量、低陳舊度梯度的集合權重,提高模型的訓練速度和性能。加權聚合規則如下:

θt,i=Qt,i/∑Ki=1Qt,i(10)

g(wt)=∑Ki=1θt,ig(wit,ξit)(11)

4.2.3 動態學習率

一般來說,應該選擇較小的學習率來減少梯度的質量和陳舊度帶來的負面影響。先前的方案使用初始陳舊度除以陳舊度的方案來調整學習率,然而在大規模異步聯邦學習情況下,可能存在陳舊度較高的梯度,這將使得學習率變得非常小,導致每次迭代的更新非常微小,訓練時間延長。為了解決這個問題,本文根據每輪接收的K個梯度中最小的陳舊度來調整學習率,這樣避免學習率過小。學習率更新規則如下:

γt0×1τmin,t×δ+1(12)

4.3 適用于異步算法的梯度屏蔽方法

一般的梯度屏蔽方法需要每個用戶在一輪中與其他所有用戶建立密鑰對,這在異步場景中是不現實的,而且屏蔽后的梯度由于隱藏了梯度信息,云服務器無法對梯度進行評估。在本節中設計了一種適用于異步場景的加權屏蔽方法,并將其應用于梯度加密,可以在異步場景下安全的對梯度進行評估,并對其進行加權聚合,主要分為以下幾個步驟:

a) 設置:可信機構首先為每個中心路由器cri隨機創建DH密鑰對(KPKi,KSKi),然后將密鑰對轉發給相應的參與者。最后,利用Diffie-Hellman密鑰協商,每兩個中心路由器cri和crj可以生成隨機數si,j←KAA(KSKi,KPKj)。

b)加權屏蔽:以si,j作為輸入,并使用偽隨機生成器生成隨機數PRG(si,j)。隨機數用于屏蔽每個梯度和數據大小。然而,直接隨機屏蔽不能使隨機數在加權聚合階段被抵消。因此,為了支持加權聚合,每個中心路由器的局部梯度g(wit,ξit)被屏蔽如下:

〖gt,i〗=Qt,ig(wit,ξit)+∑crj∈Rt,ilt;jPRG(si,j)-∑crj∈Rt,igt;jPRG(sj,i)(13)

其中:Rt是第t輪參與聚合的K個中心路由器的集合。

c) 安全加權聚合:云服務器接收到來自每個中心路由器cri的屏蔽梯度〖gt,i〗后,云服務器聚合加密梯度如下:

Gagg=∑crj∈Rt〖gt,i〗=∑crj∈RtQt,ig(wit,ξit)(14)

Qagg=∑crj∈RtQt,i(15)

g(wt)=GaggQagg=∑crj∈Rtθt,ig(wit,ξit)(16)

云服務器加權聚合后,可以在不獲得具體梯度信息的情況下得到正確的聚合結果。

5 實驗結果與分析

本文從入侵檢測場景的訓練收斂速度和訓練精度方面對HKAFL-IDS 方案進行了實驗評估。

5.1 實驗設置

5.1.1 實驗的硬件配置

在本文的實驗中,使用的服務器配置了 i7-7800X CPU、NVIDIA GeForce RTX 2080 Ti GPU 和 12 GB RAM 以及 Linux 操作系統。

5.1.2 數據集和模型

本文的實驗使用UNSW-NB15和NSL-KDD數據集。UNSW-NB15數據集包括真實的良性流量數據和包含各種新型攻擊方法的復雜流量數據。該數據集由澳大利亞安全實驗室使用IXIA PerfectStorm工具創建,由43個帶有類別標簽的特征組成,其中包括1個正常記錄和9個攻擊類別。NSL-KDD數據集是KDD99數據集的優化,去除了一些冗余數據,使數據更加平衡,從而可以更準確地評估不同的技術。該數據集包含4種異常類型和39種攻擊類型,每條記錄包含41個特征和1個類別標識符。為了在更現實的大規模分布式設備場景中驗證HKAFL-IDS方案,本文將客戶端總數(表示為T)設置為1 000。這意味著在異步聯邦學習下存儲和計算1 000個模型副本。由于服務器的顯存有限,為了防止超出顯存,采用了輕量級CNN模型。其中,針對UNSW-NB15數據集的實驗使用的模型由3個具有ReLU激活函數的一維卷積層組成。在最大池化層之后,池化向量被傳遞到全連接層,然后使用對數softmax函數測量損失。而針對NSL-KDD數據集的實驗使用的模型由兩層一維卷積層組成,接著傳遞到全連接層,然后使用對數softmax函數測量損失。

5.1.3 對比方案

本文實驗中比較了三種異步聯邦學習方案,包括加權 K-async FL(WKAFL)[25]、時間加權異步聯邦學習(TWAFL)[26]和具有全局動量的梯度調度(GSGM)[27]。這些方案通過減輕陳舊數據和非獨立同分布數據的影響來提高預測精度。

以上三種方案在原本的論文中都用于圖像分類,在本文的物聯網入侵檢測場景下,由于數據集的差異,對三種方案的模型都統一為5.1.2節所描述的輕量級模型,而協議不變。

本文評估了不同陳舊場景下所提出方案在 UNSW-NB15 和 NSL-KDD 數據集上的性能。具體來說,T(客戶端總數)和 K(客戶端數量)可用于抽象系統的異構強度。本文使用T/K來衡量系統中梯度的整體陳舊程度。在實驗中,考慮了三個陳舊級別:10 (T/K = 1000/100)、20 (T/K=1000/50) 和 100 (T/K=1000/10)。實驗結果如圖6、7所示,最終的預測精度總結在表1中。

5.2 對比實驗結果與分析

接下來本文將從收斂速度、訓練準確率兩個方面對實驗結果進行分析。

1)收斂速度由圖中可見,本文方案HKAFL相比于其他三個方案的收斂速度更快。如圖6所示,在UNSW-NB15數據集中,HKAFL和其他方案相比在T/K=10和T/K=20的兩種異構性稍弱的情況下收斂速度有比較明顯的優勢,其主要原因是本文使用的分級方案。在初始階段,本文方案使用無篩平均聚合的方法,因此在初始階段可以快速地提取入侵檢測數據集中的特征,而其他三個方案都會在初始階段便對梯度進行剪切或是根據梯度質量進行篩選和加權聚合,雖然在第一級訓練穩定后,方案進入第二級會重新收斂影響最終收斂速度,但是初始的快速收斂也有助于入侵檢測系統在物聯網復雜環境下快速進入工作狀態。而在異構性較低的情形下因為聚合梯度較多,可以提取更有效的特征, 所以相比其他方案可以更好地收斂。而異構性較高的情況下,即便不對梯度進行篩選,由于每一輪聚合的梯度有限,提取特征較少,所以在T/K=100的強異構性場景下優勢也不會特別明顯。如圖7所示,在NSL-KDD數據集中亦可以佐證上述分析,因為NSL-KDD數據集相比UNSW-NB15數據集特征更少,因此在收斂性上本方案展現出的優勢更小。

2) 訓練準確率由圖表中可見,本文的方案HKAFL相比于其他三個方案的訓練效果更好。如圖6所示,使用UNSW-NB15數據集訓練時,HKAFL在第一級收斂后即可達到較高的準確率,而第二級收斂后,如表1所示,HKAFL在T/K=10,20,100時準確率可以分別提高0.096、0.123、0.121以上。主要原因之一是在第二級,梯度選擇時考慮了更多因素,其他在進行梯度篩選和權重計算時,有的只考慮了梯度質量,而陳舊度僅用于學習率,有的只考慮了梯度陳舊性和,而且學習率沒有動態變化。HKAFL不僅考慮了梯度質量,同時也考慮了梯度的陳舊性,可以提取更加準確的數據特征,這使得模型訓練方向不會產生較大的偏差。同時由于本文在第二階段聚合時使用了動態權重進行聚合,放大了優質梯度的影響,使得訓練效果更好。其二是由于其他三個聯邦學習方案的模型本身主要用于圖像分類,圖像數據的特征維度較高,其方案更適合高維特征的圖像任務。而本方案主要用于入侵檢測,數據集特征維數較低,因此整體的準確率要高于其他三個方案。另外如圖7所示,使用NSL-KDD數據集訓練時,HKAFL在T/K=10,20,100時準確率可以分別提高0.074、0.098、0.117以上,證明本方案在強異構性場景下有更好的表現,并且HKAFL在第一級收斂后,可以比較穩定地維持準確率,而其他方案都會出現不同程度的準確率跌落,這也是由于HKAFL在訓練的第二級的梯度篩選和加權聚合方法可以提取更加準確的數據特征,使模型訓練方向不會產生較大的偏差。

6 結束語

本文提出了一種基于兩級K-異步聯邦學習的隱私保護入侵檢測方案,其目的是在強異構性的物聯網場景下進行高效安全的入侵檢測訓練。所提出的方案首先使用分級的方法快速提取數據特征,接著使用基于梯度質量和陳舊性的加權方案篩選優質梯度并通過陳舊性來調整學習率。同時,提出的方案通過設計梯度加權屏蔽的方法來加密參與者的梯度,在保證梯度篩選不泄露隱私的同時防止惡意用戶推斷梯度的隱私信息。通過實驗表明,本文方案在強異構性物聯網場景下具有更優秀的收斂性和準確率。在未來的研究中可以考慮使用去中心化的方法,并在保證準確率的情況下減小通信開銷。

參考文獻:

[1]Feng Cheng, Wang Yi, Zheng Kedi,et al. Smart meter data-driven customizing price design for retailers [J]. IEEE Trans on Smart Grid, 2019, 11 (3): 2043-2054.

[2]Khraisat A, Gondal I, Vamplew P, et al. Survey of intrusion detection systems: techniques, datasets and challenges [J]. Cybersecurity, 2019, 2 (1): 1-22.

[3]Garcia N,Alcaniz T, González-Vidal A, et al. Distributed real-time SlowDoS attacks detection over encrypted traffic using artificial intelligence [J]. Journal of Network and Computer Applications, 2021, 173: 102871.

[4]Campos E M, Saura P F, González-Vidal A,et al. Evaluating federated learning for intrusion detection in Internet of Things: review and challenges [J]. Computer Networks, 2022, 203: 108661.

[5]McMahan B, Moore E, Ramage D,et al. Communication-efficient learning of deep networks from decentralized data [C]//Proc of the 20th International Conference on Artificial Intelligence and Statistics. [S.l.]:PMLR, 2017: 1273-1282.

[6]Kumar K P S, Nair S A H, Roy D G,et al. Security and privacy-aware artificial intrusion detection system using federated machine learning [J]. Computers amp; Electrical Engineering, 2021, 96: 107440.

[7]Su Zhou, Wang Yuntao, Luan T H, et al. Secure and efficient federated learning for smart grid with edge-cloud collaboration [J]. IEEE Trans on Industrial Informatics, 2021, 18 (2): 1333-1344.

[8]Ten C W, Hong J, Liu C C. Anomaly detection for cybersecurity of the substations [J]. IEEE Trans on Smart Grid, 2011, 2 (4): 865-873.

[9]Rossi B, Chren S,Buhnova B, et al. Anomaly detection in smart grid data: an experience report [C]// Proc of IEEE International Confe-rence on Systems, Man, and Cybernetics. Piscataway, NJ: IEEE Press, 2016: 2313-2318.

[10]Andrysiak T,Saganowski ?, Kiedrowski P. Anomaly detection in smart metering infrastructure with the use of time series analysis [J]. Journal of Sensors, 2017, 2017: 8782131.

[11]Zhang Ke, Hu Zhi, Zhan Yufei,et al. A smart grid AMI intrusion detection strategy based on extreme learning machine [J]. Energies, 2020, 13 (18): 4907.

[12]Chen Zhuo, Lyu Na, Liu Pengfei, et al. Intrusion detection for wireless edge networks based on federated learning [J]. IEEE Access, 2020, 8: 217463-217472.

[13]Cui Lei, QuYouyang, Xie Gang, et al. Security and privacy-enhanced federated learning for anomaly detection in IoT infrastructures [J]. IEEE Trans on Industrial Informatics, 2021, 18 (5): 3492-3500.

[14]Li Beibei, Wu Yuhao, Song Jiarui,et al. DeepFed: federated deep learning for intrusion detection in industrial cyber-physical systems [J]. IEEE Trans on Industrial Informatics, 2020, 17 (8): 5615-5624.

[15]邱曉慧, 楊波, 趙孟晨, 等. 聯邦學習安全防御與隱私保護技術研究 [J]. 計算機應用研究, 2022, 39 (11): 3220-3231. (Qiu Xiaohui, Yang Bo, Zhao Mengchen, et al. Survey on federated lear-ning security defense and privacy protection technology [J]. Application Research of Computers, 2022, 39 (11): 3220-3231.)

[16]Shen Xiaoying, Jiang Hang, ChenYange, et al. PLDP-FL: federated learning with personalized local differential privacy [J]. Entropy, 2023, 25 (3): 485.

[17]Han Liquan, Fan Di, Liu Jinyuan, et al. Federated learning differential privacy preservation method based on differentiated noise addition [C]// Proc of the 8th International Conference on Cloud Computing and Big Data Analytics. Piscataway, NJ: IEEE Press, 2023: 285-289.

[18]徐晨陽, 葛麗娜, 王哲, 等. 基于差分隱私保護知識遷移的聯邦學習方法 [J]. 計算機應用研究, 2023, 40 (8): 2473-2480. (Xu Chenyang, Ge Lina, Wang Zhe, et al. Federated learning method based on differential privacy protection knowledge transfer [J]. Application Research of Computers, 2023, 40 (8): 2473-2480.)

[19]Zhao Jianzhe, Huang Chenxi, Wang Wenji, et al. Local differentially private federated learning with homomorphic encryption [J]. The Journal of Supercomputing, 2023,79: 19365-19395.

[20]Nguyen T, Thai M T. Preserving privacy and security in federated lear-ning [J]. IEEE/ACM Trans on Networking, 2023,32(1): 833 - 843.

[21]Du Weidong, Li Min, WuLiqiang, et al. A efficient and robust privacy-preserving framework for cross-device federated learning [J]. Complex amp; Intelligent Systems, 2023,9: 4923-4937.

[22]Lin Li, Zhang Xiaoying.PPVerifier: a privacy-preserving and verifiable federated learning method in cloud-edge collaborative computing environment [J]. IEEE Internet of Things Journal, 2022, 10 (10): 8878-8892.

[23]Xu Peng, Hu Manqing, Chen Tianyuan, et al. LaF: lattice-based and communication-efficient federated learning [J]. IEEE Trans on Information Forensics and Security, 2022, 17: 2483-2496.

[24]Huang Chao, Yao Yanqing, Zhang Xiaojun,et al. Robust secure aggregation with lightweight verification for federated learning [C]// Proc of IEEE International Conference on Trust, Security and Privacy in Computing and Communications. Piscataway, NJ: IEEE Press, 2022: 582-589.

[25]Zhou Zihao, Li Yanan, Ren Xuebin, et al. Towards efficient and stable K-asynchronous federated learning with unbounded stale gradients on non-IID data [J]. IEEE Trans on Parallel and Distributed Systems, 2022, 33 (12): 3291-3305.

[26]Chen Yang, Sun Xiaoyan, Jin Yaochu. Communication-efficient federated deep learning with layerwise asynchronous model update and temporally weighted aggregation [J]. IEEE Trans on Neural Networks and Learning Systems, 2019, 31 (10): 4229-4238.

[27]Wang Haozhao, Li Ruixuan, Li Chengjie, et al. Gradient scheduling with global momentum for asynchronous federated learning in edge environment [J]. IEEE Internet of Things Journal, 2022, 9 (19): 18817-18828.

主站蜘蛛池模板: 香蕉蕉亚亚洲aav综合| 中文字幕中文字字幕码一二区| 国产欧美在线| 精品国产自在在线在线观看| 视频在线观看一区二区| 97人人模人人爽人人喊小说| 欧美伦理一区| 国产美女91呻吟求| 国产成人艳妇AA视频在线| 国产一区二区三区日韩精品| 人妻丰满熟妇AV无码区| 国产精品精品视频| 亚洲女同欧美在线| 亚洲中文字幕无码爆乳| 伊人久久大香线蕉aⅴ色| 天天综合网在线| 国产精品精品视频| 亚洲二区视频| 又爽又大又黄a级毛片在线视频| 成AV人片一区二区三区久久| 日韩中文字幕免费在线观看| 91视频99| 114级毛片免费观看| 五月丁香伊人啪啪手机免费观看| 国产人在线成免费视频| 国产簧片免费在线播放| 欧美激情,国产精品| 亚洲欧州色色免费AV| 国产综合精品一区二区| 免费中文字幕在在线不卡| 22sihu国产精品视频影视资讯| 国产欧美精品一区aⅴ影院| 91久久国产综合精品女同我| 国产农村精品一级毛片视频| h网址在线观看| 久久亚洲美女精品国产精品| 亚洲无码精彩视频在线观看| 亚洲制服丝袜第一页| 99精品国产自在现线观看| 白浆视频在线观看| 亚洲欧美人成电影在线观看| 日韩欧美中文在线| 中文字幕无码av专区久久| 久久国产黑丝袜视频| 国产成人久久综合777777麻豆| 午夜不卡福利| 波多野结衣亚洲一区| 四虎永久免费地址在线网站| 最新亚洲人成网站在线观看| 波多野结衣无码AV在线| 找国产毛片看| a色毛片免费视频| 免费高清自慰一区二区三区| 日韩精品免费在线视频| 亚洲无码高清视频在线观看 | 欧美一区二区丝袜高跟鞋| 久青草免费在线视频| 国产免费人成视频网| 无码在线激情片| 91在线国内在线播放老师 | 精品视频一区二区观看| 无码中字出轨中文人妻中文中| 久996视频精品免费观看| 免费A∨中文乱码专区| 午夜在线不卡| 国产精品人成在线播放| 国产香蕉97碰碰视频VA碰碰看| 日本www在线视频| 97se亚洲综合在线天天| 亚洲毛片网站| 午夜福利无码一区二区| 国产精品亚洲综合久久小说| 手机在线国产精品| 国产不卡一级毛片视频| 视频二区亚洲精品| 2020亚洲精品无码| 国产精品久线在线观看| 国产视频大全| 婷婷午夜天| 亚洲IV视频免费在线光看| 亚洲最大在线观看| 国产美女视频黄a视频全免费网站|