
















摘" 要: 由于云服務器通信網中數據流量龐大且復雜,同時受到網絡結構和配置的多樣性以及動態變化的影響,傳統的主動探測或人工分析方法難以準確識別漏洞弧段,導致故障數據識別的準確性和效率受到限制。因此,研究一種基于被動分簇的云服務器通信串口故障數據識別方法。由被動分簇算法確定云服務器通信串口的通信網的漏洞弧段,基于信息熵的量化方法,提取云服務器通信串口通信網漏洞弧段中節點流量數據的熵值特征,將其作為串口故障數據分類方法的分類目標,并以K?means聚類的方式判定云服務器通信串口流量數據的故障類型,實現被動分簇下云服務器通信串口故障數據識別。實驗結果表明,所提方法在多種網絡入侵行為下對云服務器通信串口故障數據識別時,都有較好的識別效果。
關鍵詞: 被動分簇; 云服務器; 通信串口; 故障數據識別; 分類識別; K?means聚類
中圖分類號: TN929.5?34; TP391" " " " " " " " "文獻標識碼: A" " " " " " " " " " " 文章編號: 1004?373X(2025)04?0068?05
Cloud server communication serial port fault data identification under passive clustering
YU Yanpeng, HUI Xianghui
(College of Information and Management Sciences (College of Software), Henan Agricultural University, Zhengzhou 450000, China)
Abstract: Due to the large and complex data flow in the cloud server communication network, as well as the diversity and dynamic changes in network structure and configuration, traditional active detection or manual analysis methods are difficult to accurately identify vulnerability arcs, which limits the accuracy and efficiency of fault data identification. Therefore, a method of cloud server communication serial port fault data identification based on passive clustering is studied. The passive clustering algorithm is used to determine the vulnerability arc of the communication network of the cloud server communication serial port. Based on the quantification method of information entropy, the entropy characteristics of node traffic data in the vulnerability arc of the cloud server communication serial port communication network are extracted, which are used as the classification target of the serial port fault data classification method. K?means clustering is used to determine the type of fault in the cloud server communication serial port traffic data and realize the identification of cloud server communication serial port fault data under passive clustering. The experimental results show that the proposed method has good recognition performance for cloud server communication serial port fault data under various network intrusion behaviors.
Keywords: passive clustering; cloud server; communication serial port; fault data identification; classification identification; K?means clustering
0" 引" 言
在云服務器中,通信串口是連接服務器與其他設備(如傳感器、外部設備等)的關鍵通道[1?2]。然而,由于各種原因(如硬件老化、軟件錯誤、外部干擾等),通信串口可能會出現故障,導致數據傳輸錯誤、連接丟失等問題,從而影響云服務器的正常運行[3]。傳統的故障識別方法依賴于手動監控和分析,不僅效率低下,而且容易遺漏故障信息。因此,研究通信串口故障數據識別方法具有重要的實際意義和應用價值。
文獻[4]利用集成學習模型提升了通信網絡故障數據的預測準確性和穩定性,但模型參數調優復雜,需要消耗大量實驗和計算資源。文獻[5]研究一種云服務器虛擬機通信串口數據安全監控方法,能實時監測并防范安全威脅,但仿真環境與實際環境的差異可能導致結果偏差,需謹慎對待仿真結果。文獻[6]提出一種基于淺分類器的網絡入侵數據識別方法,在動態IP地址工況中表現良好,但深度神經網絡的復雜性易導致過擬合,使淺分類器在未知故障數據識別中性能下降。文獻[7]設計一種基于生物啟發的混合深度學習網絡入侵檢測模型,結合深度學習和生物啟發技術,能有效識別網絡流量異常;但自動編碼器在特征提取時易受無關特征和噪聲干擾,影響模型性能。
因此,本文提出一種基于被動分簇的云服務器通信串口故障數據識別方法。
1" 云服務器通信串口故障數據識別方法
1.1" 基于被動分簇的串口通信漏洞弧段檢測
傳統方法難以有效識別串口通信安全漏洞,而通過引入被動分簇方法可以更好地確定安全漏洞位置,并提取關鍵特征、實現漏洞檢測,有助于增強串口通信的安全防護。當云服務器通信中出現異常節點時,使用被動分簇算法確定通信網漏洞弧段,縮小檢測范圍,可為故障數據識別提供重要支持。異常節點需依賴中間節點完成流量數據傳輸,如果云服務器通信串口通信網絡的簇中存在異常節點,便需要借助中間節點完成流量數據傳輸[8]。因此,云服務器通信串口通信網絡節點[y]出現安全漏洞的概率為:
[Py=ρRy] (1)
式中:[ρ]、[Ry]分別代表比率系數、節點[y]映射范圍中的簇首數目。本文中利用漏洞弧段檢測安全漏洞,由通信網絡節點判斷安全漏洞弧序列。正常情況下,串口通信網絡節點分布狀態存在隨機性,串口通信網絡節點的相對位置關系如圖1所示。
以圖1中節點1為例,引入虛擬移動法來分析每個節點之間相對位置的關聯性。將節點1按照圖2所示移動軌跡移動至位置1?1,位置1?1與節點2之間的線段和原始節點1與節點2之間線段的角度設成[ξ]。由此方法來控制節點1按照圖2所示移動軌跡移動至位置1?2,位置1?2與節點2之間的線段和原始節點1與節點2之間線段的角度設成v。根據節點1與節點2之間相對位置,設置串口通信網絡兩個節點的位置信息為[o1,ξ],[o1]代表串口通信網絡節點1與節點2的相對距離,[ξ]、[v]的關系是:
[ξ+v=π2] (2)
利用每個通信網絡節點的相對位置數據,基于節點感知半徑[9][?]的協助分析,使用式(3)計算近鄰2個串口通信網絡節點的安全漏洞弧長:
[Z=2Pyarccoso2?] (3)
結合所得漏洞弧長數據,便可判斷安全漏洞弧的方位角[ξ-Z2,ξ+Z2]。因串口通信網絡節點之間存在相交問題,各個節點的2段安全漏洞弧也存在相交性,因此,每個近鄰節點之間的距離將小于[?]的2倍。此時結合每個節點之間的距離狀態,便可判斷漏洞弧段。
1.2" 云服務器通信串口流量數據特征量化方法
利用被動分簇算法成功確定了云服務器通信串口的通信網漏洞弧段,然而僅僅確定漏洞弧段的位置并不足以全面揭示其內在的安全風險。在串口通信網絡漏洞弧段中,各節點的正常流量和異常流量具有明顯的差異和分布特征[10?11],因此,采用基于信息熵的量化方法來提取節點流量數據的熵值特征。信息熵能夠客觀地描述數據的混亂程度和不確定性,從而準確反映流量數據的復雜性和隨機性。
將串口通信網絡漏洞弧段中通信網絡節點的[M]個數據包以時間先后為基準,分成一個單位流量某特征屬性出現的次數,設成[Y=Y1,Y2,…,YM]。按照單位流量,當云服務器通信時,若出現運算異常流量數據,則流經通信串口的流量數據熵值為:
[KY=Zj=1MmjAlnmjA] (4)
式中:[Y=mj,j=1,2,…,M]代表云服務器通信串口流量數據中某特征屬性[j]出現[m]次;[A]代表某流量特征出現次數總值。將[A=j=1Mmj=j=1MY]代入式(4),便可提取單位流量數據熵值[12?13]。
1.3" 串口故障數據識別
在云服務器通信串口的安全防護中,盡管已通過被動分簇算法確定了通信網的漏洞弧段,并基于信息熵提取了節點流量數據的熵值特征,但這些特征數據仍需有效分類以精準識別串口故障數據。因此,采用K?means聚類算法作為故障數據識別方法,該算法能無監督地根據數據內在特征自動劃分聚類,以此對提取的熵值特征進行聚類分析,以識別不同故障類型。將上文提取的漏洞弧段中串口通信網絡節點流量數據熵作為分類樣本,則分類樣本集合是:
[K=K′1,K′2,…,K′m] (5)
式中[m]代表樣本總數。聚類中心集合為[W=w1,w2,…,wm]。串口故障數據分類方法的分類步驟如下。
1) 將提取的漏洞弧段中節點流量數據熵值設置成完全圖的連接點,生成完全圖[FK=U,C,E],[U]、[C]、[E]分別代表完全圖的頂點、邊、邊的權重。引入Kruskal 算法設計完全圖的最小生成樹,由此樹檢索云服務器通信串口流量數據熵樣本的關鍵點。先篩選漏洞弧段中云服務器通信串口流量數據熵關鍵點的候選點,運算[FK]中全部邊的[E],檢索[E]最小值所在邊的樣本點,若串口通信流量數據熵樣本點[ki∈K]、[kj∈K]都屬于權重最小邊上的點,則把[ki]、[kj]歸為集合[Uk],把邊歸為集合[Ck]。[Uk]、[Ck]中存在所有的點和邊,[Ck]內串口通信流量數據熵樣本點會結合邊權重數值從大至小排列。
分析[Ck],把權重最小的邊轉移至最小生成樹,如果轉移一條邊后最小生成樹生成回路,便可在邊集[Ck]、點集[Uk]中去除相應的串口通信流量數據熵樣本點,最后生成最小生成樹[H=C1,C2,…,Ck]。使用最小生成樹逐層檢索距離最近的2個樣本點,2個點中心[L=dki,kj2],[dki,kj]代表樣本點之間的歐氏距離。通過[L]取代2個樣本點的邊,然后將其設成父節點,更新[Uk]、[Ck],[Uk]、[Ck]中數據均減少1。循環上述操作,當最小生成樹僅存在[b]個連接點時,便可把最小生成樹剩下的連接點設成被動分簇的初始聚類中心。
2) 把最小生成樹算法獲取的樣本點設成初始聚類中心[W=w1,w2,…,wm],如果漏洞弧段中串口通信流量數據熵值樣本和聚類中心點的距離小于半徑[R],便將此串口通信數據樣本分類至此聚類中心;反之大于半徑[R],便把此串口通信數據熵值樣本和剩下聚類中心進行對比。
3) 計算漏洞弧段中各節點流量數據熵樣本點的類內距離[?]、類間距離[φ],并提取距離比值[Q]。
[?=i=1vidwi,kivi] (6)
[φ=i=1m1m-1vidwi,ki] (7)
式中:[vi]代表漏洞弧段中,某類串口通信節點流量數據熵樣本的數量;[dwi,ki]代表串口通信節點流量數據熵樣本與聚類中心的歐氏距離。
[Q=?φ] (8)
如果[Q]大于閾值,便需要重新聚類。
漏洞弧段中,節點流量數據熵樣本聚類時,會出現邊緣值,樣本點處于交界處,此類樣本會出現難以識別的問題。為此,引入余弦相似度,用于識別此類串口通信節點流量數據熵樣本。余弦相似度計算公式為:
[cosk,k=j=1mkjkjj=1mk2j·j=1mk2j] (9)
式中:[k]、[k]分別代表交界類內通信節點流量數據熵樣本、交界處通信節點流量數據熵樣本。[k]將被劃分至余弦相似度數值最高的類內。
2" 實驗分析
為了驗證被動分簇下云服務器通信串口故障數據識別方法的識別性能,以基于云服務器的智能家居監測系統作為測試系統,主要使用所提方法作為測試系統的故障數據檢測技術。此測試系統主要使用RS 485串口為通信總線,總線的主設備是ARM開發板,且引入輪詢的模式實現每個接入模塊的傳感器狀態數據通信。傳感器接入模塊屬于RS 485串口的接入設備。接入檢測電路接入單片機的引腳,其功能是實現傳感器接入和移除管理。信號調理電路的功能是將傳感器發送信號和后端電路分離,并轉換成標準輸入信號。此系統主要使用RS 485串口來實現傳感器數據和云端服務器的遠程通信。本文方法所識別的RS 485串口具體參數如表1所示。
為了設計故障數據,在基于云服務器的智能家居監測系統運行時,對通信網絡引入ARP欺騙式入侵行為,入侵目的是改變傳感器傳輸與云服務器數據包中的輪詢地址(監測位置),從而影響系統對家居環境的監測數據。設置2個傳感器的線程輪詢信息,如表2表示。將濕度傳感器線程1中輪詢地址的02刪除,加入入侵輪詢篡改數據;將溫度傳感器線程2中輪詢地址的03刪除,加入入侵輪詢篡改數據,以此構建串口故障數據。串口故障數據詳情如表3所示。
ARP欺騙式入侵行為的入侵示意圖如圖3所示。
設置串口通信時,在輪詢周期為200 ms時基于正常數據,會出現500組故障數據,并持續到500 ms輪詢周期。所提方法對云服務器通信串口故障數據的識別結果如圖4所示。
由圖4可知,云服務器通信串口故障數據的識別結果與前提條件設定的正常數據、故障數據信息一致,說明所提方法在云服務器通信串口故障數據識別中可用。
上述實驗僅對ARP欺騙式入侵行為下的通信串口故障數據識別性能進行測試,為深入測試所提方法對通信串口故障數據的識別能力,設置入侵行為:跨站攻擊、DDoS攻擊、CC攻擊。不同攻擊行為下通信串口數據詳情如表4所示。
基于表4所示數據,測試所提方法對云服務器通信故障數據識別后,識別結果和對應故障類型的關聯度,數值較高,表示故障數據識別結果和對應故障類型數據的匹配度較顯著,識別結果的可信度較顯著;反之,若關聯度數值較低,表示故障數據識別結果和對應故障類型數據的匹配度較差。所提方法對表4中三種攻擊行為下通信串口數據中故障數據識別后,識別結果的關聯度測試結果如圖5所示。
根據圖5實驗數據顯示,不同攻擊行為下通信串口數據中,故障數據識別結果關聯度均大于0.96,說明故障數據識別結果和對應故障類型數據的匹配度符合理想狀態,所提方法的適用性較好。
3" 結" 論
為了有效識別出串口通信故障數據,本文提出一種基于被動分簇的云服務器通信串口故障數據識別方法。該方法結合了被動分簇技術,在識別串口通信網絡漏洞弧段后,通過對云服務器通信串口數據進行聚類分析,將具有相似特征的數據歸為一類,從而識別異常或故障數據類型。經實驗數據顯示,所提方法通過被動分簇技術可以識別出串口故障數據。
參考文獻
[1] 程順達.基于安全性驗證的云數據存儲與訪問算法[J].沈陽工業大學學報,2023,45(5):565?570.
[2] 魏立斐,王勤,張蕾,等.半可信云服務器輔助的高效隱私交集計算協議[J].軟件學報,2023,34(2):932?944.
[3] 孟海寧,童新宇,石月開,等.基于ARIMA?RNN組合模型的云服務器老化預測方法[J].通信學報,2021,42(1):163?171.
[4] 朱圳,劉立芳,齊小剛.基于數據挖掘的通信網絡故障分類研究[J].智能系統學報,2022,17(6):1228?1234.
[5] 劉芳,曹進克.云服務器虛擬機通信串口數據安全性監控仿真[J].計算機仿真,2023,40(8):174?177.
[6] JMILA H, IBN K M. Adversarial machine learning for network intrusion detection: a comparative study [J]. Computer networks, 2022, 214: 1?14.
[7] MOIZUDDIN M D, JOSE M V. A bio?inspired hybrid deep learning model for network intrusion detection [J]. Knowledge?based systems, 2022, 238: 107894.1?107894.20.
[8] 賈珺,馮春燕,夏海輪,等.基于樣本均衡與特征交互的通信網絡故障預測方法[J].北京郵電大學學報,2021,44(6):59?66.
[9] 鄭臣明,姚宣霞,周芳,等.基于硬件虛擬化的云服務器設計與實現[J].工程科學學報,2022,44(11):1935?1945.
[10] 周由勝,陳律君.基于區塊鏈的細粒度云數據安全存儲與刪除方案[J].電子與信息學報,2021,43(7):1856?1863.
[11] 王曉湘,劉洞天,劉南江,等.基于LSTM的震后通信數據異常檢測分析[J].中國地震,2022,38(2):270?279.
[12] 盛忠明.地鐵列車FIP網絡通信故障起因判別及解決方法[J].城市軌道交通研究,2021,24(z1):132?136.
[13] 王杰,周正江,朱小青,等.海上風電機組與Scada系統間通信故障分析[J].船舶工程,2022,44(z2):84?86.
[14] 譚艷嫻,程允麗,雷耀花.基于邊緣計算的人臉身份認證系統中的隱私保護技術研究[J].電子設計工程,2024,32(16):183?186.
作者簡介:于艷朋(1987—),男,河南安陽人,碩士研究生,講師,研究方向為計算機應用、計算機教育教學、計算機理論方向、軟件工程、數據科學與大數據技術。
惠向暉(1980—),男,河南西華人,碩士研究生,副教授,研究方向為云計算、計算機應用、智能機器人。