


收稿日期:2023-10-07
DOI:10.19850/j.cnki.2096-4706.2024.07.034
摘? 要:針對現有態勢感知技術存在數據處理效率低、數據傳輸時間長以及預警反應慢等問題,提出一種融合計算遷移模型的態勢感知策略。首先引入計算遷移模型,在蒙特卡洛-香濃數學思想的指引下將傳感器實時收集的多源異構監測數據分發至邊緣層中各突觸節點;然后對數據進行特征值提取,得到特征值矩陣;最后采用修正余弦相似度算法所對收集的數據加以分析,并做出相應的決策。實驗結果表明,相較于現有方法,該策略可縮減35.3%的數據傳輸與比較時間,提升了20.22%的對比準確度。
關鍵詞:主動預警;態勢感知;多源異構數據;計算遷移模型
中圖分類號:TP301.6 文獻標識碼:A 文章編號:2096-4706(2024)07-0172-07
Research on the Implementation Method of Situational Awareness Strategy Integrating Computational Migration Model
PENG Yongqian
(Department of Big Data and E-Commerce, Qiannan Polytechnic for Nationalities, Duyun? 558022, China)
Abstract: Aiming at the problems of low data processing efficiency, long data transmission time and slow warning response of existing situational awareness technologies, a situational awareness strategy incorporating computational migration model is proposed. Firstly, the computational migration model is introduced, and the heterogeneous monitoring data from multiple sources collected by sensors in real time are distributed to each synaptic node in the edge layer under the guidance of Monte Carlo-Shannon mathematical ideas; then the eigenvalue extraction of the data is carried out to obtain the eigenvalue matrix; finally, the modified cosine similarity algorithm is used to analyze the collected data and make the corresponding decisions. The experimental results show that compared with the existing methods, this strategy can reduce the data transmission and comparison time by 35.3% and improve the comparison accuracy by 20.22%.
Keywords: proactive early warning; situational awareness; multi-source heterogeneous data; computational transfer model
0? 引? 言
態勢感知[1-3]以大數據為基礎,識別、理解和分析相關的數據信息,并在此基礎上對未來的發展趨勢進行預測[4,5],進而適時做出下一步的決策。近年來,隨著人們對網絡安全的愈發重視,態勢感知策略的應用越來越廣泛,逐漸滲透到金融行業、監管機構及安全分析等領域[6],這些領域無時無刻不在產生大量的時序數據[7,8]。因此,對時序數據進行高效預測是規避安全風險的基礎,也是領域研究的熱點和難點。但隨著監測環境的不斷變化,傳統的態勢感知策略已無法應對愈發復雜的監測環境,處理效率和準確性都有所降低。現有的態勢感知策略使用特征矩陣的態勢預測方法,通過將收集到的時序數據映射至對應的時序矩陣[9],并通過提取矩陣的特征來實現時序數據[10,11]的相關態勢預測。
針對上述問題,本文提出一種融合計算遷移模型[12,13]的態勢感知策略(Computational Migration Situational Awareness, CMSA)。主要內容如下:
1)基于工廠運轉數據的時序特征,結合采用Transformer模型、多頭注意力機制、殘差網絡算法構建時序特征矩陣,繼而提出一種基于特征矩陣全新的態勢感知策略(New Situational Awareness, NSA)。
2)在此基礎上,針對NSA策略不適用于單一節點數據量大、計算任務繁重的問題,在蒙特卡洛-香農數學思想的指引下提出一種融合計算遷移模型的態勢感知策略。
3)在計算遷移模型中,通過三層邊緣計算網絡模型實現時序數據的高效采集、分配和處理,在保證高準確度的前提下進一步提升處理效率。
1? 相關工作
目前,許多學者對態勢感知策略進行了深入的研究并取得了一定的研究成果。文獻[14]中提出了基于決策樹的車聯網安全態勢預測模型對特定的屬性進行分類,使用信息增益率構建決策樹,進而實現車聯網安全態勢預測,該模型能夠提高預測的準確性,但卻忽略了車輛行駛的長距離性;文獻[15]中提出一種基于長短期記憶(LSTM)和多頭注意力機制的混合模型,用于預測給定的時間序列,該模型在對稱平均絕對百分比誤差方面優于大多數測試方法,但卻未對時序數據進行特征提取,預警準確性較低;文獻[16]中提出一種時空神經網絡(GCN-DHSTNet)模型,通過圖卷積網絡進行建模,基于節點之間的全局空間關系動態學習流量數據的時空特征,進而同時處理交通流中復雜的動態時空依賴關系,該模型有效地捕獲了動態時間的相關性,但只能在節點距離較小的情況下使用;文獻[17]基于格拉姆角場理論對偏離量變化進行時序相關性理解,建立卷積神經網絡模型預測系統未來發展趨勢,該方法對后續態勢預測的準確率較高,但卻未考慮計算負載;文獻[18]中提出名為IPSO-ABiLSTM的情況預測模型,該模型將改進的粒子群優化算法(IPSO)和注意力機制與雙向長短期記憶(ABiLSTM)相融合,能夠快速收斂神經網絡的參數,但卻未對數據本身進行處理。
2? 基于特征矩陣的態勢感知策略構建
為實現工廠內時序數據的高效對比以及提取特征值的穩定性,基于Transformer自然語言處理模型,融合多頭注意力機制(Multi-Head Attention, MHA)、殘差網絡算法(Residual Network, ResNet)、全局平均池化算法(Global Average Pooling, GAP)以及修正余弦相似度算法(Adjusted Cosine Similarity, ACS),提出了全新的態勢感知策略。
2.1? 從監測數據集到監測數據矩陣的映射
考慮到復雜工廠環境中多目標傳感器收集的實時數據可能存在差異性,本文將傳感器收集到的某時刻監測數據構造為多源異構數據矩陣的形式:
(1)
其中,g表示監測目標編號,k表示某時段內傳感器監測的次數,m表示某時段內傳感器監測數據的方差,n表示某時段內傳感器監測數據的最大值。
由式(1)可得,任意時刻監測設備的M組數據可表示為:
(2)
由式(2)可得,在K時段內構建的多源異構向量Ω可表示為:
(3)
由式(3)可得,在K時段內,L個用戶終端發送給計算節點的向量數據集可表示為:
(4)
其中,所構建的多源異構數據集Γ即為監測數據集矩陣。
2.2? 監測數據矩陣的態勢預測
由上文k時段內各用戶終端的向量數值可知,NSA策略時刻都要處理多個矩陣數據,因此特征值提取速度直接決定了數據的處理速度。基于此,本文利用MHA機制和Transformer模型共同提取矩陣的特征值,直接計算任意兩個位置之間的依賴關系,進而更好地捕捉長距離的依賴關系,防止過擬合現象的發生。同時,每一個注意力頭都可以獨立計算權重比,實現多線程處理數據。與此同時,該策略還引入了ResNet算法,通過增加網絡的深度進一步提高了特征值的提取準確率。監測數據矩陣的特征值提取如圖1所示。
在圖1中,ResNet算法對K時段內的監測數據向量集Г = [Ω1,Ω2,…,ΩL]進行特征值提取,而后通過GAP算法處理提取后的特征數據。GAP算法的特點包括:
1)降維。
2)近似的平移不變性。采用ResNet算法對處理后的特征值進行運算,得到一個q×q的特征塊,進行全連接處理后得出最終待比較的特征向量。
為進一步簡化NSA策略,將上文得出的待比較特征向量的后續處理問題簡化為向量之間的相似度計算,通過ACS算法對待比較的特征向量x1與策略中已保存的設備運轉正常的特征向量x2進行對比:
(5)
比較過程如圖2所示。
圖2? 特征矩陣的態勢預測
由圖2可知,采用ACS算法對分割后的單一特征向量進行相似度計算,計算結果的平均值即為最終的相似度結果。如該值低于某個閾值,意味著未來一段時間內被監測設備可能會出現問題,從而主動發出預警信息。
3? 融合計算遷移模型的態勢感知策略
隨著監測數據呈指數級增長,NSA策略對數據的處理速度逐漸下降。為提高數據處理速度,本文提出了CMSA算法。
3.1? CMSA算法要義
在CMSA算法中,通過計算帶寬資源處理數據的時間以及傳輸數據耗時來判斷是否需要進行數據躍遷處理。假設用戶終端為Xi,i ∈ {1,2,…,N},突觸節點為Yi,i ∈ {1,2,…,M},每個用戶終端可以將計算任務遷移到一個或多個突觸節點中。當用戶終端有任務需要計算時,算法將會發送任務遷移請求,將需要計算的任務數據D發送給其他突觸節點。突觸節點中每個任務都存在如下任務函數:
(6)
其中,Dij表示第i個用戶終端給第j個突觸節點分配的數據;αij表示突觸節點給當前任務分配的算力資源占比;βij表示突觸節點給當前任務分配的帶寬資源占比;λij表示第i個用戶終端給第j個突觸節點分配的傳輸數據時間;σij表示第i個用戶終端給第j個突觸節點分配的處理數據時間。每增加一個突觸節點,其他節點處理的數據量Dj就會被新增的節點平分,即:
(7)
隨著其他節點處理數據量的增多,相應的時間σij會減少,而對應的數據傳輸時間λij會增加。因此CMSA算法的宗旨即是在動態中尋找G(m)的最小值,m為突觸節點最佳使用個數,即:
(8)
第i個突觸節點處理數據所用時間可表示為:
(9)
每次計算任務執行完畢后,函數信息Tij會被重置。假設各用戶終端與突觸節點之間的信道環境與噪聲皆相同,在蒙特卡洛-香農數學思想下上行鏈路速率(Uplink Rate, UR)可以表示為:
(10)
其中,H0表示信道增益常量,Pij表示第i個用戶終端與第j個突觸節點的信號傳輸功率;Fij表示第i個用戶終端與第j個突觸節點的信號損耗功率;dij表示第i個用戶終端與第j個突觸節點的傳輸距離;S0表示傳輸信道路徑損耗系數。由式(6)和式(10)可知,λij的傳輸時間可表示為:
(11)
由上述計算式可知,數據在傳播至突觸節點時,還需考慮傳輸距離帶來的損耗和傳輸時間。
3.2? CMSA算法架構搭建
CMSA算法是一個擁有三層邊緣計算網絡的模型,該算法的架構圖如圖3所示。
第一層是用戶層,該層位于模型的最底層,其中包含多個用戶塊。每個用戶塊包括一個用戶終端和多個種類的傳感器,這些傳感器用于監測運轉機器產生的各類數據,并將數據發送至對應的用戶終端進行數據清洗。
第二層是邊緣層,該層包含M個計算節點,各節點都是NSA策略的一個突觸節點。當數據通過用戶終端上傳到突觸節點時,該策略會對上傳的數據執行特征點提取、優化權重比等操作,還會將各個突觸節點計算的最終特征權重值上傳到云層,便于云層執行下一步的操作。
第三層是云層,該層包含算力更強的服務器,這些服務器是CMSA算法的核心。對機器正常運轉時的各特征值信息與突觸節點上傳的特征值信息進行相似度計算,根據計算結果判斷是否需要預警。
4? 實驗與分析
本文實驗環境為24臺2 TB存儲空間、128 GB RAM、16核24線程i9-13900K CPU的服務器集群,服務器之間采用高速局域網通信,每臺服務器均部署CentOS 7.9.112操作系統。實驗數據集為基于傳感器對某印刷廠海德堡印刷機收集的實時數據,在機器設備的前部、中部、后部分別配置一套傳感器組,每組傳感器均包含電流、電壓、溫度、濕度、壓力五個類型的傳感器,傳感器每隔180秒收集一次數據。從數據傳輸與處理時間、特征值對比準確度、算法魯棒性三個方面驗證CMSA算法所具有的低耗時、高精度和高魯棒性優點。
4.1? 數據預處理
本節主要是對傳感器收集的數據執行預處理操作。對于缺失的數據,通過補采方式補全;對于重復數據,基于基本近鄰排序算法對其進行濾重;對于錯誤數據,直接刪除不遵守分布或回歸方程的值。本次數據預處理模擬收集L個用戶終端、K個時間節點、M = 10 000組數據信息,所收集的部分數據信息如圖4所示。
4.2? 數據傳輸與處理時間對比
在CMSA模型中,假設有5個突觸節點且這5個突觸節點均處于同一服務器內,其帶寬資源均為50 MB/s,計算資源均為200 MB/s,數據傳輸功率、損耗功率以及信道增益常量等性能均相同。每個突觸節點處理數據時,其帶寬資源和計算資源不會發生離散現象,故而αij = 50 MB/s、βij = 200 MB/s。在距離方面,假設后一個突觸節點到用戶終端的距離均為前一個節點的2倍,設d11 = 1單位距離,使用不同數量突觸節點對CMSA算法的影響如表1所示。
由表1中的數據和式(8)可知,當m = 2時,CMSA算法模型獲得了最佳數量的突觸節點。此時,CMSA算法會采用2個突觸節點中的NSA策略來處理數據特征值。為了更加全面地驗證上述實驗的準確性,本節用計算機仿真出50個突觸節點的情況,當各項參數不變時,實驗結果如圖5所示。
通過對圖5實驗數據的觀察可知,當m = 2時,CMSA算法模型獲得了最佳數量的突觸節點。
4.3? 特征值對比準確度
假設所有測試均在同一環境下進行,第一組:傳統神經網絡RNN+余弦相似度;第二組:長短期記憶網絡LSTM+余弦相似度;第三組:Self-attention(自我注意力)的Transformer+余弦相似度;第四組:CMSA算法模型。為了使實驗結果數據更具對比性,在所測試的10 000組數據中,隨機修改12%的數據作為設備的故障數據。各算法處理數據結果如圖6所示。
由圖6可知,在數據處理耗時方面,CMSA算法相比其他三種算法可縮減35.3%的傳輸與比較時間,這是由于該算法使用了計算遷移模型,能有效利用高并發處理大量時序數據,減少了資源的浪費和時間的耗損;在數據處理準確度方面,CMSA算法相比其他三種算法平均提升了20.22%的對比準確度,這是由于CMSA算法在Transformer的基礎上融合了MHA機制和ResNet算法,能夠有效避免梯度爆炸、梯度消失等問題的出現,進而提高了特征值提取和數據處理的準確度。
4.4? 算法魯棒性驗證
驗證CMSA算法的魯棒性,對比實驗沿用上一小節的實驗內容。在本節的實驗中,分別選取4組實驗在相同時間節點處理數據的耗時情況(50個時間節點),如圖7所示。
由圖7可知,相比第一種算法,CMSA算法去除了梯度消失的陷阱,糾正了特征值提取時將會出現的錯誤;相比第二種算法,CMSA算法降低了處理數據耗時的波動幅度,增加了系統的魯棒性;相比第三種算法,CMSA算法降低了處理數據的用時,能夠做到更加合理地分配資源。
5? 結? 論
本文提出一種融合計算遷移模型用于實現工廠主動預警的態勢感知策略方法。首先構建一個三層的邊緣計算網絡模型,各層可滿足不同的功能需求,同時引入了計算遷移模型,將傳感器收集的實時數據分發至邊緣層中的各突觸節點;然后提取數據的特征值,得出對應的特征值矩陣;最后提出修正余弦相似度算法進行向量間的相似度比較,并根據比較結果決定是否進行主動預警。實驗結果表明,相較于現有方法,本文方法在計算效率、預警準確性等方面具有很大優勢,為工廠主動預警的順利實現提供一條有效途徑。
參考文獻:
[1] 張紅斌,尹彥,趙冬梅,等.基于威脅情報的網絡安全態勢感知模型 [J].通信學報,2021,42(6):182-194.
[2] KIM J,KONG J,SOHN M,et al. Layered Ontology-based Multi-sourced Information Integration for Situation Awareness [J].The Journal of Super-Computing,2021,77(9):9780-9809.
[3] 陳軍,張岳,陳曉威,等.基于模糊灰色認知圖的復雜戰場智能態勢感知建模方法 [J].兵工學報,2022,43(5):1093-1106.
[4] SHWET K,KUMAR M P. India perspective: CNN-LSTM Hybrid Deep Learning Model-based COVID-19 Prediction and Current Status of Medical Resource Availability [J].Soft Computing,2021,26(2):645-664.
[5] ARJOMANDI-NEZHAD A,AHMADI A,TAHERI S,et al. Pandemic-aware day-ahead demand forecasting using ensemble learning [J].IEEE Access,2022,10:7098-7106.
[6] XU H,BERRES A,YOGINATH S B,et al. Smart Mobility in the Cloud: Enabling Real-time Situational Awareness and Cyber-physical Control through a Digital Twin for Traffic [J].IEEE Transactions on Intelligent Transportation Systems,2023,24(3):3145-3156.
[7] WAUCHOPE H S,AMANO T,GELDMANN J,et al. Evaluating Impact Using Time-Series Data [J].Trends in Ecology and Evolution,2020,36(3):196-205.
[8] 張仁斌,左藝聰,周澤林,等.基于多模態生成對抗網絡的多元時序數據異常檢測 [J].計算機科學,2023,50(5):355-362.
[9] CUI A J,HE C K,CHANG C H,et al. Identification of FSM State Registers by Analytics of Scan-Dump Data [J].IEEE Transactions on Information Forensics and Security,2021,16:5138-5153.
[10] K?HLER J,SCHWENKEL L,KOCH A,et al. Robust and Optimal Predictive Control of the COVID-19 Outbreak [J].Annual Reviews in Control,2021,51:525-539.
[11] CAO Y X,KUANG J,GAO M,et al. Learning Relation Prototype from Unlabeled Texts for Long-Tail Relation Extraction [J/OL].arXiv:2011.13574v1 [cs.CL].[2023-08-01].https://arxiv.org/abs/2011.13574v1.
[12] 陳思光,陳佳民,趙傳信.基于深度強化學習的云邊協同計算遷移研究 [J].電子學報,2021,49(1):157-166.
[13] HUANG S Z,LIN K Y,HU C L. Intelligent Task Migration with Deep Qlearning in Multi-access Edge Computing [J].IET Communications,2022,16(11):1290-1302.
[14] 唐亮,李飛.基于決策樹的車聯網安全態勢預測模型研究 [J].計算機科學,2021,48(S1):514-517.
[15] ABBASIMEHR H,PAKI R. Improving Time Series Forecasting Using LSTM and Attention Models [J].Journal of Ambient Intelligence and Humanized Computing,2022,13:673-691.
[16] ALI A,ZHU Y,ZAKARYA M. Exploiting Dynamic Spatio-temporal Graph Convolutional Neural Networks for Citywide Traffic Flows Prediction [J].Neural networks,2022,145:233-247.
[17] 林政陽,姜飛,涂春鳴,等.考慮時序相關性的數據驅動電-氣綜合能源系統態勢感知 [J].電網技術,2022,46(9):3385-3394.
[18] ZHAO D M,WU Y X,ZHANG H B. A Situation Awareness Approach for Network Security Using the Fusion Model [J/OL].Mobile Information Systems[2023-08-14].https://doi.org/10.1155/2022/6214738.
作者簡介:彭永倩(1998—),女,布依族,貴州貴定人,講師,碩士研究生,研究方向:計算機網絡、霧計算。