





摘 要:常規的物聯網設備通信異常檢測方法易受數據采集間隔變化影響,導致檢測識別效果不佳,因此基于數據挖掘設計了一種全新的物聯網設備通信異常檢測方法。首先提取了物聯網設備通信異常行為特征;然后構建了物聯網設備半監督通信異常檢測模型;最后利用數據挖掘生成物聯網設備通信異常檢測流程,從而實現對物聯網設備通信異常的檢測。實驗結果表明,設計方法在不同通信通道下均能有效進行設備通信異常檢測,證明設計方法的檢測效果較好,具有極高的可靠性和應用價值。
關鍵詞:數據挖掘;物聯網;設備通信;異常行為檢測;半監督;卷積神經網絡;孤立森林算法
中圖分類號:TP309 文獻標識碼:A 文章編號:2095-1302(2025)01-00-03
0 引 言
物聯網設備指的是以信息傳感、紅外感應為原理進行信息交換與通信識別的智能化設備,在各個領域應用廣泛[1-4]。常見的物聯網設備主要包括具備遠程控制功能的家居電器、工業化智能維護網關、健康監控智能手表等[5-6]。物聯網設備的通信方式較多,包括利用無線電波傳輸的局域網通信、利用藍牙的短距離無線通信、利用ZigBee的低能耗遠距離通信、NB-IoT窄帶物聯網通信、以太網連接互聯網通信、串行通信等,需要根據不同的應用場景和需求進行選擇[7]。在通信技術飛速發展的背景下,物聯網設備的通信復雜度越來越高,受到的干擾也越來越多。近幾年我國的物聯網設備通信異常事故頻發,造成了巨大的經濟損失。為解決上述問題,本文基于數據挖掘設計了一種全新的物聯網設備通信異常檢測方法。
1 物聯網設備通信異常數據挖掘檢測方法設計
1.1 提取物聯網設備通信異常行為特征
在通信過程中物聯網設備往往通過Modbus/TCP結構生成通信單元,組成不同的通信字段,因此存在異常的通信信號的功能碼與非異常通信信號的功能碼之間存在一定差異[8-9]。在提取通信異常行為特征之前,可以構建通信異常行為分類模型,如圖1所示。
由圖1可知,通信數據采集是異常行為特征提取的關鍵,可以根據通信過程中的命令結構差異性調整控制數據采集操作[10],優化通信數據分類進程,重新描述編碼向量。此時,可根據功能碼的指令反應狀態計算功能碼權重W(a),如式(1)所示:
(1)
式中:H(f )代表近鄰樣本頻率;H(n)代表隨機樣本頻率。根據上式可以進行功能碼關聯分析,挖掘通信異常檢測數據集的頻繁項集,進行連續控制操作,從而構造有效的功能碼序列,此時得到的物聯網設備通信異常行為特征提取式如式(2)所示:
(2)
式中:sj代表異常檢測支持度;x代表檢測異常權重;t(xi)代表模糊挖掘參數;total代表模糊隸屬函數。使用上述異常行為特征提取式可以對惡意攻擊特征進行有效標記,從而大幅度提高通信異常檢測的敏感性。
1.2 構建物聯網設備半監督通信異常檢測模型
半監督通信異常檢測模型可以按照時間順序劃分通信異常檢測層次,實現實時檢測。因此,本文根據物聯網設備通信異常檢測增量關系構建了半監督通信異常檢測模型。首先需要基于HS-TCN集成學習剔除不符合異常檢測要求的不確定數據,通過疊加法獲取損失函數,此時生成的初始通信異常檢測集Xt如式(3)所示:
Xl=(xl1, xl2, ... , xln) (3)
式中:xl1, xl2, ... , xln均代表初始的未標記數據。此時可以按照上述提取特征的相關性對初始數據進行標記,將原本的數據集劃分為時間跨度相對較小的全新數據集,標記后的數據集分層權重Xu如式(4)所示:
·cl (4)
式中:cl代表時序差值。此時可以對異常檢測數據進行位置訓練,生成通信數據時間軸,再按照疊加原理進行數據評估,獲取累積數據集,由此可以得到異常檢測評估函數p(a),如式(5)所示:
p(a)=P{x-a·pg} " (5)
式中:P代表異常節點的挾持權重;x代表異常節點的干擾系數;pg代表異常檢測矩陣;a代表隨機參數。利用上述異常檢測評估函數可以對測試數據集進行多次分層檢測,調整現有的數據規模,完成遞推訓練。此時生成的半監督通信異常檢測模型E(n)如式(6)所示:
(6)
式中:T代表預設的時序值;μE 代表檢測的異常節點數量;V(E)代表實際節點量。使用上述半監督通信異常檢測模型可以快速完成增量訓練,按照檢測實際要求進行協作處理,能夠提高通信異常檢測的實時性。
1.3 基于數據挖掘生成物聯網設備通信異常檢測流程
數據挖掘技術可以從海量隨機模糊數據中提取潛在的信息,實現高精度檢測。因此,本文引入數據挖掘技術,設計了物聯網設備通信異常檢測流程,如圖2所示。
檢測流程如下:
(1)在檢測初期,需要對存在異常的數據進行挖掘聚類處理,度量特征的相關性,降低計算的復雜度,此時可判斷通信異常數據的屬性差別。
(2)根據物聯網設備通信異常特征屬性進行差極值計算,以描述不同的異常差異等級,生成通信異常檢測集合。
(3)生成設備通信異常檢測訓練集,獲取最優檢測參數,判斷異常節點的位置。
(4)根據實際檢測要求進行參數調整,采用ioctl函數獲取檢測基礎機制。
(5)進行數據挖掘編譯運算,確定檢測遺傳參數。
(6)根據檢測結果對個體進行評估,確定檢測適應度。
(7)進行交叉運算,獲取最優檢測個體。
(8)輸出異常檢測結果。通過上述數據挖掘異常檢測流程可以快速進行異常檢測尋優,從根本上提高了通信檢測的精度。
2 實 驗
為驗證設計的基于數據挖掘的物聯網設備通信異常檢測方法的檢測效果,本文選取了可靠的設備通信數據來源進行了實驗,并將本文方法與文獻[9]、文獻[10]中2種常規的物聯網設備通信異常檢測方法進行了對比。
2.1 實驗準備
根據物聯網設備通信異常檢測的實驗要求,本文選定VCC中央ATP平臺作為實驗環境。本實驗所采用的數據主要來源于某一特定區域,通過外接FSK(頻移鍵控)實驗設備來獲取相關的實驗參數,并對實驗數據進行頻率類型的劃分。在實驗前,需要根據信道數據的感應效果判斷設備的通信狀態,并對不同的通信異常信號進行反饋。在實驗過程中,受物聯網設備的通信運行狀態閾值改變的影響,檢測信號的頻率可能會偏低,不滿足實驗要求。因此,在實驗過程中,需要使用OC-SVM對不同的實驗樣本進行不平衡處理,再利用Python 3.7.6 SCIKIT leam 0.24.1進行數據處理分析,生成滿足實驗要求的滑動窗口模型,輸出可靠的物聯網設備通信異常檢測實驗結果。
2.2 實驗結果與討論
完成上述實驗準備后,進行物聯網設備通信異常檢測實驗,即對預設環境中的物聯網設備通信通道進行編碼處理,采集頻率/峰值電壓/有效電壓數據。分別使用本文設計的基于數據挖掘的物聯網設備通信異常檢測方法、文獻[9]的基于并行深度卷積神經網絡的物聯網設備通信異常檢測方法,以及文獻[10]的考慮孤立森林算法的物聯網設備通信異常檢測方法,進行設備通信異常檢測,判斷3種方法在不同時刻下是否能正常進行設備通信異常檢測,實驗結果見表1。
由表1可知,在不同時刻,本文設計的基于數據挖掘的物聯網設備通信異常檢測方法均能正常進行設備通信異常檢測,而文獻[9]的基于并行深度卷積神經網絡的物聯網設備通信異常檢測方法以及文獻[10]的考慮孤立森林算法的物聯網設備通信異常檢測方法在部分通信通道下無法完成通信異常檢測。上述實驗結果表明,本文設計的基于數據挖掘的物聯網設備通信異常檢測方法的檢測效果較好,具有一定可靠性。
3 結 語
隨著物聯網技術的發展和普及,物聯網設備已經被廣泛應用于智能家居、工業自動化、智慧城市等各個領域。物聯網設備通信是滿足不同應用功能的關鍵,一旦出現物聯網設備通信異常問題會導致數據傳輸中斷、設備控制失效等運行事故。因此,需要研究一種可靠的物聯網設備通信異常檢測方法。常規的物聯網設備通信異常檢測方法主要使用Min-Max Scaling線性函數對異常數據進行歸一化處理,若數據采集間隔變化會影響最終的檢測效果。因此,本文基于數據挖掘設計了一種全新的物聯網設備通信異常檢測方法。實驗結果表明,設計的物聯網設備通信異常檢測方法的檢測效果較好,具有可靠性,有一定的應用價值,能夠為降低物聯網設備的通信風險作出一定的貢獻。
參考文獻
[1]周政雷,陳俊,潘俊濤,等.基于并行深度森林的配用電通信網絡異常流量檢測[J].華東師范大學學報(自然科學版),2023(5):122-134.
[2]楊挺,侯昱丞,趙黎媛,等.基于時-頻域混合特征的變電站通信網異常流量檢測方法[J].電力系統自動化,2020,44(16):79-86.
[3]肖博,劉超,李穎,等.遠距無線通信系統中雜波信號的抑制方法研究[J].電子設計工程,2022,30(9):71-74.
[4]周伯陽,郭志民,王延松,等.基于多尺度低秩模型的電力無線接入網異常流量檢測方法[J].電子學報,2020,48(8):1552-1557.
[5]李悅,馬志勇,俞建杰,等.融合YOLOV5+DSST+KCF的目標檢測跟蹤算法在激光通信中的應用[J].計算機測量與控制,2023,31(10):49-53.
[6]蘇有斌,高 超. LTE監測設備通信數據壓縮速率優化數字模型[J].電子設計工程,2022,30(5):150-153.
[7]翟曉卉,孫凱,趙吉福,等.基于ResSE-SegNet的智能電表通信模塊銘牌檢測與識別[J].哈爾濱理工大學學報,2023,28(2):136-144.
[8]蒲旭敏,楊小瓏,陳前斌.低精度ADC下大規模機器類通信中的低復雜度信號檢測算法[J].重慶郵電大學學報(自然科學版),2023,35(2):263-272.
[9]鄧雪陽,鄧達平,蘇萬靖.基于并行深度卷積神經網絡的艦船通信異常數據檢測研究[J].艦船科學技術,2023,45(15):119-122.
[10]劉杰.基于孤立森林算法的巡檢機器人通信異常數據自動檢測方法[J].信息與電腦(理論版),2023,35(3):86-88.