巢巍, 劉濤, 崔洋, 鄭波, 陳彬, 楊真
(中國移動通信集團設計院有限公司湖南分公司, 湖南, 長沙 410003)
無線通信系統發展迅速,許多黑客利用網絡中的安全缺陷和漏洞攻擊網絡,DDoS攻擊、病毒木馬植入、網絡釣魚和漏洞式攻擊等網絡攻擊方式對無線通信系統安全提出嚴峻挑戰[1]。目前無線通信系統中部署大量入侵防御系統、防火墻、防病毒網關等相關網絡安全設備,這些設備雖可實現網絡漏洞管理、內部威脅檢測等危險檢測,但運行過程中會形成大量日志文件[2],海量日志文件中的信息所描述網絡安全態勢存在較高的誤報以及漏報情況,無法實現無線通信系統整體安全態勢精準感知預測[3]。
安全態勢感知具有較高動態性,可體現整體感知網絡攻擊能力[4-6]。目前已有大量高科技技術應用于無線通信系統安全態勢感知預測中,大數據分析技術以及機器學習技術是目前應用于無線通信系統安全態勢感知預測中的有效方法。通過大數據分析技術的關聯規則挖掘方法挖掘可能影響無線通信系統安全態勢的重要信息[7],利用高效的機器學習算法實現無線通信系統安全態勢精準感知預測,提升無線通信系統整體網絡安全態勢感知預測實時性。
目前針對網絡安全態勢感知研究較多:陳維鵬等[8]研究基于改進的BP神經網絡的網絡空間態勢感知系統安全評估;韓曉露等[9]研究基于IFS-NARX模型的網絡安全態勢預測,均可實現網絡安全態勢感知,但感知精度較差,不具備實用性。研究機器學習與大數據分析的無線通信系統安全態勢感知預測,將機器學習技術與大數據分析技術相結合,實現無線通信系統安全態勢感知預測,提升無線通信系統的通信安全性。
無線通信系統中包含眾多的安全設備,其中包含海量報警信息量,報警信息中包含虛假報警以及真實報警信息,利用關聯分析技術可明確海量日志信息的安全態勢感知的信息來源[10]。大數據具有數據類型復雜、價值密度低以及數量巨大的特點,利用大數據分析技術可提升海量數據處理準確性、效率性以及實時性。研究機器學習與大數據分析的無線通信系統安全態勢感知預測,針對無線通信系統內安全態勢數據具有的多模式、多力度以及海量特點,并行處理海量數據,提升安全態勢感知預測精度。所研究的無線通信系統安全態勢感知預測總體結構圖如圖1所示。從圖1可以看出,通過數據采集、數據預處理、數據存儲、大數據分析以及安全態勢展示層5部分實現無線通信系統安全態勢感知預測。采集無線通信系統內的報警信息,對所采集數據實施數據清洗、數據集成等預處理,將完成預處理數據存儲于HDFS分布式文件系統以及HBase非關系型分布式數據庫中,便于大數據分析技術中的關聯規則挖掘調取,挖掘數據中所包含關聯規則后,利用GA-RBF算法實現安全態勢感知預測,并將預測結果發送至展示界面。

圖1 總體結構圖
利用模糊分區聚類的大數據關聯挖掘算法實現海量關聯數據區域分割處理[11]。G(L1,L2,…,Ln-1,Ln,E)表示海量大數據關聯語義規則特征量層次網絡,其中Li與E?(U(Li×Li+1))分別表示各模糊分區網格內數據存儲節點以及數據聚類內關聯組Li+1和鄰近數據聚類中心Li相連的集合,用uv表示數據聚類中心分布集合內隨機元素,節點v(v∈Li+1)與聚類后所建立層次圖u(u∈Li)相連屬于一組有向向量集。
用m與G(F)={F1,F2,…,Fm}分別表示關聯數據挖掘的集合基數以及第一層節點依據權值聚類所獲取與k關聯的變元對象集合,獲取關聯數據挖掘規則特征分布公式如下:
(1)
式中,ni與nj分別為二維數據的相關度以及層次聚類的收斂系數,α與β分別表示屬性權重以及相似度閾值,wl表示可確定模糊分區的關聯語義集。通過以上過程利用模糊分區方法實現優化聚類所提取的數據關聯特征。
依據聚類結果實現無線通信系統相關數據語義劃分,建立依據檢驗準則和判別統計量實現數據挖掘的聚類屬性判斷[12],獲取大數據關聯挖掘判決統計量公式如下:
(2)


(3)
利用隨機二維關聯數據挖掘相關度獲取相關度矩陣如下:
(4)
獲取數據關聯挖掘判斷準則公式如下:
(5)

(6)
設置閾值Qc,當Q0與〈Qs〉間絕對誤差高于Qc時,令:
p(|Q0-〈Qs〉|>Qc)≤0.05
(7)
設數據關聯挖掘置信度為95%,利用均勻正態分布特性可得公式如下:

(8)
式中,S≥2時,表明數據挖掘在模糊分區聚類中心收斂概率為95%,原假設成立,關聯規則的數據挖掘結果可符合收斂條件。
安全態勢感知預測是定量分析網絡安全性的重要手段,可精細度量網絡安全狀態,對于提升網絡安全具有重要意義。
安全態勢感知預測需依據態勢指標時間序列特點[13],利用合適的粗度粒度分析安全態勢指標實現精準預測。選取GA-RBF算法實現安全態勢感知預測。x=f(t)表示依據態勢指標粗度粒度所建立時間與權值抽象序列,分類指標建立時間序列安全態勢向量集合用X={xj|xj∈R}表示。安全態勢感知預測實際上是將各數據從輸入空間RN映射至輸出空間RM。RBF神經網絡是作為安全態勢感知預測訓練模型具有較高優勢的神經網絡,精確性以及收斂性高,通過全局搜索算法提升隱層節點確定精度。將控制因子與遺傳因子數據集合設置為徑向基函數神經網絡初始集合[14],所獲取精度符合神經網絡訓練需求時,可快速實現收斂。
精度訓練函數公式如下:
(9)
利用式(9)所獲取精度確定復雜度收斂速度,體現期望值與真實值變化趨勢。確定安全態勢感知預測的直接反應收斂速度公式如下:
F2=L
(10)
利用所獲取目標函數實現適應度建立,獲取適應度函數公式如下:
(11)
利用式(11)所獲取的適應度獲取樣本副本,利用適應度將所獲取樣本副本遺傳至下一代。適應度值應為最優,利用以下公式確定適應度值有效性:
(12)
式中,f與fsum分別表示i值的適應值以及全部集合適應值,N表示全部集合數量。
利用適應度值確定下一個集合優化,個體i待復制數量為Vi時,需充分考慮初始集合以及隱含層節點寬度,實現控制因子參數的因子值確定。通過參數因子以及控制因子交叉確定新集合公式如下:

(13)
式中,a表示隨機變換因子。
通過以上交叉因子以及控制因子組合運算,實現生物遺傳突變過程模擬,通過獲取新種群實現快速準確集合變異,獲取神經網絡隱含層節點以及確定最終種群,通過以上過程實現無線通信系統安全態勢感知精準預測。
為驗證所研究機器學習與大數據分析的無線通信系統安全態勢感知預測方法對于無線通信系統安全態勢感知預測有效性,選取某校園網網管中的無線通信系統作為實驗環境,將校園網數據庫中的3 000個數據作為實驗數據,利用SQL Server 2008作為所安裝硬件資產,選取其中1臺臺式機作為客戶端,全部操作集中于該臺式機上,另設置3臺電腦為攻擊終端。選取改進BP神經網絡方法以及IFS-NARX方法作為對比方法。
統計采用3種方法挖掘無線通信系統中通信數據執行時間隨挖掘次數變化情況如圖2所示。從圖2實驗結果可以看出,采用本研究所提方法挖掘無線通信系統網絡通信數據,不同挖掘次數情況下的挖掘時間均低于另2種方法。本研究所提方法由于采用大數據分析技術,具有較高的數據分析效率,針對網絡數據具有較高的挖掘效率,為保障數據安全提供基礎。

圖2 挖掘時間對比
采用本研究所提方法對實驗數據進行模糊分區聚類挖掘關聯規則,測試不同迭代次數情況下無線通信系統吞吐量變化情況,對比結果如圖3所示。從圖3實驗結果可以看出,采用本研究所提方法挖掘實驗數據中的關聯規則均具有較高的吞吐量,采用另2種方法挖掘實驗數據中關聯規則吞吐量明顯低于本研究所提方法。吞吐量越高表明無線通信系統的通信性能越優,有效驗證本研究所提方法具有較高的收斂性能,系統的通信性能較強,關聯規則挖掘效果較好,能夠將安全態勢關聯規則數據準確挖掘,提升安全態勢精準預測能力。

圖3 吞吐量變化對比
將實驗數據隨機分為6組,每組數據數量不固定。統計采用本研究所提方法挖掘不同數據量情況下關聯規則的挖掘均方誤差,挖掘結果如圖4所示。從圖4實驗結果可以看出,采用本研究所提方法挖掘不同數據量情況下關聯規則的均方誤差均明顯低于另2種方法,說明采用本研究所提方法具有較高的數據挖掘性能,可應用于無線通信系統安全態勢感知預測中。

圖4 挖掘均方誤差對比
統計采用本研究所提方法在不同時刻下感知預測安全態勢走勢圖,并將本研究所提方法預測結果與實際安全態勢走勢對比,驗證本研究所提方法的安全態勢感知預測有效性,預測結果如圖5所示。從圖5實驗結果可以看出,采用本研究所提方法感知預測無線通信系統的安全態勢預測值與實際安全態勢值極為接近,驗證本研究所提方法具有較高的安全態勢預測效果。本研究所提方法采用大數據分析技術分析實驗數據,利用遺傳算法優化徑向基神經網絡實現安全態勢感知預測,有效提升安全態勢感知預測結果,具有較高應用性。

圖5 態勢感知對比圖
統計采用本研究所提方法感知預測無線通信系統安全態勢結果的預測精度,并將本研究所提方法與另2種方法對比,對比結果如圖6所示。從圖6實驗結果可以看出,采用本研究所提方法感知預測無線通信網絡安全態勢的預測精度均高于99%,采用另2種方法感知預測無線通信系統安全態勢預測精度均低于98.5%,對比結果有效驗證本研究所提方法具有較高的安全態勢感知預測性能。

圖6 預測精度對比
統計采用本研究所提方法感知預測無線通信系統安全態勢的漏告警率,并將本研究所提方法與另2種方法對比,對比結果如圖7所示。從圖7實驗結果可以看出,采用本研究所提方法感知預測無線通信系統安全態勢漏告警率明顯低于另2種方法,再次驗證采用本研究所提方法感知預測無線通信系統安全態勢精準性。

圖7 漏告警率對比
無線通信系統中包含海量數據,從海量數據中挖掘影響安全態勢的風險數據是安全態勢感知的基礎。將機器學習技術與大數據分析技術相結合應用于無線通信系統安全態勢感知預測中,通過實驗驗證采用該方法感知預測安全態勢具有較高有效性,可應用于無線通信系統網絡安全防護中。本文研究方法可從整體體現無線通信系統安全狀況,對于通信網絡未來安全趨勢同樣具有較強預測精準性,但研究還存在不足之處,在安全態勢感知預測過程中未能針對網絡波動問題作出有效解決方案,今后會著重針對該問題進行深入研究。