王江峰



摘 要 對混合網絡病毒入侵特征的準確分類是實現入侵病毒有效檢測的基礎,傳統的分類模型采用C-均值聚類算法,不適應于混合網絡入侵病毒的非線性特征分類。提出一種基于信息熵聚類的混合網絡入侵特征的高效分類模型。構建混合網絡的入侵信號模型,進行信息熵特征提取,設計優化聚類算法實現高效分類。仿真結果表明,采用該算法,能準確實現對入侵病毒的特征分類,避免對病毒入侵特征的錯分和漏分,提高了對網絡病毒的準確檢測能力。
關鍵詞 混合網絡 病毒入侵 分類 檢測
中圖分類號:TP393.08 文獻標識碼:A DOI:10.16400/j.cnki.kjdkx.2015.06.025
Efficient Classification Model and Simulation with
Hybrid Network Intrusion Feature
WANG Jiangfeng
(School of Computer and Information Engineering, Beijing Technology and Business University, Beijing 100048)
Abstract Characteristics of the hybrid network viruses accurate classification is the basis for effective detection of the invading virus, the traditional classification model uses C- means clustering algorithm, suited to the invading virus hybrid network nonlinear characteristics classification. An information entropy clustering proposed hybrid network intrusion signature efficient classification model. Intrusion signal hybrid network model construction, information entropy feature extraction, design optimization clustering algorithm to achieve efficient classification. The simulation results show that the algorithm can accurately achieve the characteristics invading virus free, avoid viruses and leakage characteristics of misclassified points, increased its ability to accurately detect network virus.
Key words hybrid network; viruses; classification; testing
0 引言
隨著網絡技術的不斷發展和普及,網絡安全也日益受到人們的關注。根據美國VIRUS官方統計結果表明,全球平均每分鐘就有三千萬臺計算機在遭受到各種病毒的攻擊,而網絡攻擊檢測是保護計算機系統安全的重要手段,如何建立高效的網絡病毒入侵檢測方法,是目前該領域很多專家研究的一個焦點。混合網絡是無線網絡、局域網和光纖通信網絡以及無線傳感器網絡組合的網絡模式,在混合網絡組網模式下,更容易遭受病毒的入侵,對混合網絡病毒入侵特征的準確分類是實現入侵病毒有效檢測的基礎,研究混合網絡的病毒入侵特征分類算法具有重要意義。①②③
當前,新型的混合網絡病毒的入侵和傳播以正態諧振和非線性特征攻擊方式進行連續攻擊,檢測困難,需要對病毒入侵特征進行準確分類和檢測。傳統的分類模型采用C-均值聚類算法,無法有效檢測這類非線性特征,④提出一種基于信息熵聚類的混合網絡入侵特征的高效分類模型。首先構建混合網絡的入侵信號模型,進行信息熵特征提取,設計聚類算法實現優化分類,仿真實驗驗證了本算法的優越性和可靠性。
1 混合網絡病毒入侵模型及信號模型構建
1.1 問題描述和混合網絡病毒入侵模型
為了實現對混合網絡入侵病毒的有效檢測,需要研究受到攻擊的網絡病毒在連續攻擊下的入侵信號模型,這是實現網絡安全防御的基礎。傳統方法中對網絡病毒感染下的入侵數分類的方法主要采用的是Web跨站腳本漏洞檢測算法和灰階向量鏈路信息映射算法,方法具有不可預測性,對此本文進行模型設計改進。假定混合網絡 = (,)可被分解為個社交群體,…,定義一個€椎畝猿憑卣?= ,其中表示網絡中連接病毒攻擊群和的邊在所有邊中所占的比例。分析受到攻擊的網絡病毒連續攻擊傳播概率模型,實現連續攻擊信號的重疊檢測,受到攻擊的網絡病毒連續攻擊通過單個連接的病毒與移動設備建立連接,傳播的成功與否與連接建立的時間和病毒所需的傳播時間有關,采用基于信息熵的分類屬性描述病毒傳播的種群規模,得到混合網絡病毒入侵模型如圖1所示。
圖1 混合網絡病毒入侵信號轉換模型
圖1中,絡病毒傳播狀態轉換關系模型中與分別表示入侵信號個體從狀態轉化為狀態和狀態的概率,和標記狀態和狀態,由此構建混合網絡攻擊偽裝數據的網絡通信圖(,),即考慮短距離的鏈路進行數據傳輸。在圖(,)中,若兩個結點之間存在一條邊,將整個網絡劃分為若干個邊長相等的正方形區域,依據數據挖掘方法對設計結構的數據進行新的挖掘,提取更加明顯的特征,強化數據分析的能力。⑤
1.2 入侵信號模型構建
在上述網絡病毒入侵模型構建的基礎上,為了提取入侵特征,需要進行信號模型構建,網絡病毒傳播模型中主要由兩類個體組成,這兩類個體呈0-1分布,假設混合網絡病毒傳播信息流表示為:
() = [ + ?+ ] ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ?(1)
式中,表示為混合網絡病毒入侵的方向聚類系數,為病毒轉移中心權向量,為雜波信號,為一種干擾特征,此時混合網絡入侵特征檢測終端接收分析響應特征的計算式表達為:
(,) = () ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ?(2)
其中,是病毒混合網絡入侵過程中第條路徑上接收信號的衰減因子,為第條路徑時滯,為瞬時頻率。通過上述信號模型設計,構建了入侵特征的數學模型。
2 特征提取及分類模型實現
在上述信號模型構建的基礎上,進行特征提取,為入侵特征分類提供準確的原始數據,對混合網絡病毒入侵特征的準確分類是實現入侵病毒有效檢測的基礎,針對傳統方法出現的問題,本文提出一種基于信息熵聚類的混合網絡入侵特征的高效分類模型。假設混合網絡病毒傳播進程中的信息熵為一組非線性時間序列特征,具有非高斯平穩性,設為處理增益,得到入侵病毒信號的自相關函數為:
() = []() ? ? ? ? ? ? ? ? (3)
為了提分類性能,本文采用信息熵特征提取方法,在上述信息熵特征提取的基礎上行,把數據主特征建模和特征提取分類與缺省副本創建處理同步進行處理,得到更小的響應時間,實現準確分類,假設混合網絡中經過每條邊的最短路徑數目,由此得到信息上熵特征提取結果為:
= ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ?(4)
其中,表示節點間最短路徑中包括邊的數量,即按照模塊度值的不同生成對應的社團間邊頂點的集合。若其全網標準化程度中心性大于其在所屬社團內的子網標準化程度中心性,即>,依照病毒入侵行為特征的穩定性,非攻擊用戶訪問服務器的行為特征平穩,當前的行為特征可由之前的行為特征值線性預測,此時進行入侵特征的高效分類。綜上所述,本文設計的分類模型的特征聚類示意圖如圖2所示。
圖2 入侵特征聚類示意圖
3 仿真測試與結果驗證
為了驗證算法在實現網絡入侵特征分類和檢測中的性能,進行仿真測試,建立在Hadoop云平臺下混合網絡環境。Hadoop云平臺采用20臺計算機通過路由實現混合網絡病毒感染集群,其中1臺計算機作為主機控制節點,其它幾臺作為服務器和云計算運算節點和存儲節點,云平臺的操作系統為Ubuntu12.04,Hadoop云平臺版本為1.1.2。病毒入侵過程中,假設具有自干擾信道增益節點樹為,為計算方便,參數取 = 2, = 4,在上述參數設定的基礎上,構建網絡入侵病毒的信號模型,如圖3所示,
圖3 信號時域波形
提取入侵病毒的信息熵特征,對特征進行分類仿真,得到本文算法和傳統算法下的入侵特征分類仿真結果如圖4所示,從圖可見,采用本文算法,能準確實現對入侵病毒的特征分類,不會出現錯分和漏分現象,提高了對網絡病毒的準確檢測能力。
(a)傳統算法
(b)本文算法
圖4 入侵特征分類仿真對比
4 結論
混合網絡組網模式下,更容易遭受病毒的入侵,對混合網絡病毒入侵特征的準確分類是實現入侵病毒有效檢測的基礎,研究混合網絡的病毒入侵特征分類算法具有重要意義。本文提出一種基于信息熵聚類的混合網絡入侵特征的高效分類模型。首先構建混合網絡的入侵信號模型,進行信息熵特征提取,設計聚類算法實現優化分類,仿真結果表明,采用本文算法能準確實現對混合網絡入侵病毒的信號模型構建,并通過準確提取信息熵特征,實現特征分類,分類準確,提高了對入侵病毒的檢測性能,提高網絡安全防護能力。
注釋
① 葉青,黃炎磊.非均勻分布入侵檢測模型的研究與仿真[J].科技通報,2013.29(8):169-171.
② 程東年,汪斌強,王保進等.網絡結構自調整的柔性內涵初探[J],通信學報,2012.33(8):214-222.
③ 焦義文,王元欽,馬宏,等.群時延失真對天線組陣合成信噪比的影響分析[J].信號處理,2015.31(2):145-153.
④ 譚中權.離散與連續時間強相依高斯過程最大值與和的漸近關系[J].應用數學學報,2015.38(1):27-36.
⑤ Csirmaz L, Tardos G. Optimal information rate of secret sharing schemes on trees[J].IEEE Transactions on Information Theory, 2013.59(4):2527-2530.