胡俊荷 李芯蕊 馬雙斌



摘 要:網絡態勢值是衡量網絡安全的重要指標,其值的高低直接影響網絡安全的優劣。能夠有效地建立起網絡態勢預測模型,其意義對于預防網絡安全事件的發生以及網絡安全防護來講非同尋常。通過對網絡態勢的理解和分析,可知影響網絡態勢的因素很多且關系比較復雜,難以建立較為準確的數學表達式來描述網絡態勢。因此,文章采用改進的粒子群算法優化支持向量回歸機模型的參數,構建起網絡態勢與影響因素兩者中的非線性映射關系,提出一種多種群的混沌粒子優化算法,建立MSCPO-SVR網絡態勢預測模型,并得出預測結果。最后,通過與BP神經網絡和SVR預測模型進行對比,驗證MSCPO-SVR預測模型的預測值與真實值的擬合性比較強。
關鍵詞:計劃行為理論;涉密人員;保密行為;保密行為意向
中圖分類號:TP 309;TP 393 文獻標識碼:A
Abstract: The Network trend value is an important index of network security, and it affects the merits of Network security directly. Its significant to effectively establish the Network Security Situation Prediction Model (NSSP) for the precaution of network intrusion and protection of the network. Through the comprehension and analysis of network security situation, we know there are many factors that can affect the security situation of network and the relationship between them are very complex. Therefore its difficult for us to describe the net security situation in a specific mathematical formula. Under these circumstances, in this essay, an improved particle swarm optimization is used to optimize the parameters of the Support Vector Regression Model, and constructs a non-linear mapping relation between the network situation and the influencing factors. We also proposes a multi-population chaotic particle optimization algorithm, establishes the MSCPO-SVR network trend prediction model and obtains the predicted result. Finally, by comparing the MSCPO-SVR prediction model with BP neural network and SVR prediction model, we prove that the prediction value of MSCPO-SVR prediction model is more fitted with the real value.
Key words: situation prediction; particle swarm optimization algorithm; support vector regression; prediction model
1 引言
“互聯網+”的提出,使很多行業與互聯網進行融合,網絡成為了人們日常生活中密不可分的一部分。隨著其規模日益壯大,網絡已經普遍應用于各個領域。現在攻擊者不僅對各種網絡數據的竊取,而且也開始對一些關鍵性基礎設施、政府、金融機構和能源行業等進行攻擊,給社會和國家帶來了一定的影響。
張偉麗[1]分析了我國等級保護存在的問題,并提出了進一步做好信息安全等級保護工作的建議;李連等[2]分析了云計算的基本特征及面臨的安全問題,總結了目前國際上關于云計算安全問題的研究現狀,討論了云計算安全技術框架和關鍵技術;施超[3]從計算機網絡信息管理內容的分類、計算機網絡信息管理工作中的安全問題分析以及計算機網絡信息安全防護策略分析這三個方面入手,對網絡信息管理進行了較為詳細的分析與闡述,并據此論證了做好這一工作在進一步提升計算機網絡信息管理質量與管理效率的過程中所起到的至關重要的作用與意義;楊家興[4]對新時期的計算網絡通信的現狀和問題進行分析,從而提出發展的策略并研究計算機網絡通信的發展趨勢。
但是,以往傳統的網絡安全保護技術最多只可以描述過去和當前的網絡安全態勢,都無法預測出未來的網絡安全態勢[5]。而本文提出的網絡態勢預測模型能通過模型本身的算法將影響因素與網絡態勢建立復雜的聯系,還可以對未來的網絡安全態勢進行預測分析,使網絡安全的管理從被動變為主動,預防網絡安全事件的發生,降低網絡安全隱患給人們帶來不必要的損失。
本文對國家互聯網應急中心每周在網站上公布的態勢報告進行分析,并對2013年第4期至2016年第37期的態勢報告進行統計,確定了樣本數據集[6]。
通過研究支持向量回歸機,將多種群混沌粒子優化算法(MSCPO)優化支持向量機回歸機模型的參數,通過對樣本數據集進行訓練,建立MSCPO-SVR網絡態勢預測模型,并得出預測結果。
2 粒子群優化算法及其改進算法
設在一個維數為D的搜索空間中,有一個種群x=(x1,x2,…,xn)由n個粒子組成,其中D維空間中第i個粒子的位置用一個D維的向量xi=[xi1,xi2,…xiD]T表示出來,同時這也表示為問題的一個潛在解。其中第i個粒子的速度為Vi=[Vi1,Vi2,…ViD]T,其粒子個體的極值為Pi=[Pi1,Pi2,…PiD]T,種群的全局極值為Pg=[Pg1,Pg2,…PgD]T。
粒子每進行一次尋優,都需要判斷個體極值和全局極值來更新自身的位置和速度,公式如下:
式中:k為當前迭代次數;ω為慣性權重;d=1,2…,D;i=1,2…,n;Vid為粒子速度[7,8];
非負常數C1、C2稱為加速度因子,取值一般根據實際情況確定;r1和r2為區間[0,1]之間的隨機數。
在算法運行的過程中,可能會出現某個粒子發現了疑似最優的位置,而使得其他粒子迅速向其靠攏,使得算法陷入局部最優,早熟收斂的困境,從而導致算法無法在搜索空間中重新繼續搜索[9]。因此本文提出一種多種群混沌粒子優化算法(Multi-Swarm Chaotic Particle Optimization,MSCPO)。該算法是利用混沌原理的隨機性,在初始階段對種群粒子進行初始化,并將粒子分成三個種群,不同種群采用不同的更新策略,通過三個種群之間協同配合和實時信息共享,加快算法的收斂速度。通過種群適應度方差這個指標來判斷粒子是否陷入局部收斂,如果陷入則對其進行混沌處理,幫助其逃離局部收斂點,從而提高算法的優化性能。
MSCPO算法的具體步驟如下所示:
Step1.利用混沌原理的隨機性對種群進行初始化。搜尋空間為[ld,ud],
通過適應度函數算出所有粒子的適應度的值(Fitness Value),對其值進行排序,取種群較優的2/5粒子作為第一種群,慣性權重系數w取最小值0.4;取種群較差的1/5粒子作為第二種群,慣性權重系數 取最大值0.9;剩下種群中間2/5粒子為第三種群[10]。
Step2.對第一個和第二個種群采更新粒子的速度和位置;第三個種群采用本節的自適應更新策略進行更新。
Step3.通過適應度函數算出所有粒子的適應度的值,若其值優于粒子所經歷過的個體最優位置PBesti,則將其值更新為PBesti。若其值優于種群的全局最優位置GBest,則將其值更新為GBest。
Step4.判斷否滿足結束條件,若滿足則輸出其值,不滿足則繼續執行。
Step5.通過種群適應度方差σ2的值來判斷粒子是否陷入局部收斂,如式(5)所示,若σ2小于設定的閾值,繼續執行,否則跳轉到Step2
從而實現種群的混沌變異操作。
多種群混沌粒子優化算法的流程圖如圖1所示。
3 支持向量機
支持向量機(Support Vector Machine,SVM)的主要思想是建立一個分類超平面作為決策曲面,從而使正反例之間的隔離邊緣最大化;支持向量機的理論基礎是結構風險最小化的近似實現。這個原理基于泛化誤差率,即學習機器在測試數據上的誤差率,也就是以訓練誤差率和一個依賴于VC(Vapnik-Chervonenkis dimension)的項的和為界,在可分模式情況下,其置前一項的值為零,并且使第二項的值最小化[11]。所以,支持向量機對于模式分類問題上可以提供良好的泛化性能,這是它特有的屬性。支持向量機具有幾個優點[12]:
通用性:能夠在很廣的各種函數集中構造函數;
魯莽性:不需要微調;
有效性:在解決實際問題中總是屬于最好的方法之一;
計算簡單:方法的實現只需要簡單的優化技術;
理論上完善:基于VC推廣性理論的框架。
支持向量機的體系結構如圖所示。
其中K為核函數,其種類主要有:
4 建立MSCPO-SVR預測模型
根據支持向量機的理論,確定偏離參數 、懲罰參數C和核函數參數 三個參數才能確定SVR的網絡態勢預測模型。設置合理的參數對支持向量回歸模型的泛化能力的優劣具有重要作用,通過判斷模型算法誤差率的大小,可以判斷模型參數的取值是否最優。
本節采用國家互聯網應急中心網站上公布態勢報告,對2013年第4期至2016年第37期每期的態勢報告進行統計,共統計190條樣本數據,其數據包括感染網絡病毒主機數量、被篡改的網站數量、被植入后門的網站總數、網站的仿冒頁面數量和新增信息安全漏洞數量五個安全事件指標[13]。基本態勢分為:優、良、中、差、危。為了便于實驗的進行,需將其轉化為具體數字來看待,如表1所示。
將感染網絡病毒的主機數量(x1)、被篡改的網站數量(x2)、被植入后門的網站總數(x3)、網站的仿冒頁面數量(x4)和新增信息安全漏洞數量(x5)作為網絡態勢值的自變量,將網絡態勢值作為因變量。為了減小樣本數據不同量綱對結果引起不必要的誤差,需對樣本數據進歸一化處理。利用MSCPO算法來優化支持向量機的模型參數,對本文采用的樣本數據集對模型進行測試,選擇較優的偏離參數ε、懲罰參數C和核函數參數σ三個參數,建立MSCPO-SVR預測模型。
MSCPO算法的適應度函數為支持向量回歸模型的均方差,如式(5)所示。
MSCPO-SVR預測模型的建立流程圖如圖3所示。
5 模型預測結果
取樣本數據的前180條數據作為訓練集,后10條數據作為測試集。使用軟件MATLAB 2014b對上述模型進行驗證。MSCPO-SVR預測模型的結果如表2所示。
其預測值與真實值的進行對比,如圖4所示。
由表2和圖4可知,對本文提出的MSCPO-SVR預測模型得出預測結果的絕對誤差均比較小,且預測值與真實值較為接近,擬合性較好。
為了驗證本文提出的MSCPO-SVR預測模型的預測性能,將其與BP神經網絡預測模型和SVR預測模型的預測結果進行對比。其結果如表3所示。
使用平均絕對誤差MAE、平均相對誤差MAPE和平均平方根誤差RMSE這三個評價指標來對比MSCPO-SVR預測模型、BP神經網絡預測模型和SVR預測模型。三個預測模型預測結果的評價指標值如表3所示。
6 結束語
本文采用MSCPO-SVR預測模型對網絡態勢進行預測,得出的預測值與真實值的誤差比較小,具有較強的擬合性,通過與BP神經網絡和SVR預測模型進行對比,該模型預測值的評價指標均比其它兩個預測模型低,可知該模型的預測效果比較好,且預測值與真實值的擬合性較高。
由實驗表明,MSCPO-SVR預測模型可以較好地預測網絡態勢,取得了較好的效果,增強網絡安全防御的主動性,降低網絡攻擊給人們帶來的損失,具有良好的實用性。
參考文獻
[1] 張偉麗.信息安全等級保護現狀淺析[J].網絡空間安全, 2014(9):9-13.
[2] 李連,朱愛紅.云計算安全技術研究綜述[J].網絡空間安全, 2013, 4(5):42-45.
[3] 施超.計算機網絡信息管理及其安全防護策略[J].網絡空間安全, 2012, 3(3):8-10.
[4] 楊家興.新時期計算機網絡通信現狀及發展趨勢研究[J].網絡空間安全, 2013, 4(3):6-7.
[5] 謝麗霞,王亞超,于巾博.基于神經網絡的網絡安全態勢感知[J].清華大學學報(自然科學版), 2013(12):1750-1760.
[6] 中國互聯網信息中心(CNNIC/CC).第39次《中國互聯網絡發展狀況統計報告》,http://www.cnnic.net.cn.
[7] 高昆侖,劉建明,徐茹枝,等.基于支持向量機和粒子群算法的信息網絡安全態勢復合預測模型[J].電網技術, 2011(4):176-182.
[8] 陳善學,楊政,朱江,等.一種基于累加PSO-SVM的網絡安全態勢預測模型[J].計算機應用研究, 2015, 32(6):1778-1781.
[9] Mohandes M A. Modeling global solar radiation using Particle Swarm Optimization (PSO)[J]. Solar Energy, 2012, 86(11):3137-3145.
[10] Xue L, Cai J, Li J, et al. Application of Particle Swarm Optimization (PSO) Algorithm to Determine Dichlorvos Residue on the Surface of Navel Orange with Vis-NIR Spectroscopy[J]. Procedia Engineering, 2012, 29(4):4124-4128.
[11] 王霞,王占岐,金貴,等.基于核函數支持向量回歸機的耕地面積預測[J].農業工程學報, 2014, 30(4):204-211.
[12] Sch C, Laptev I, Caputo B. Recognizing Human Actions: A Local SVM Approach[C]// International Conference on Pattern Recognition. IEEE, 2004:32-36 Vol.3.
[13] CNCERT.網絡安全基本態勢月報[J].2014(14):68。
作者簡介:
胡俊荷(1983-),女,漢族,甘肅蘭州人,甘肅省廣播電視學校,大專;主要研究方向和關注領域:計算機網絡。
李芯蕊(1982-),女,漢族,甘肅蘭州人,蘭州大學,本科;主要研究方向和關注領域:信息安全。
馬雙斌(1990-),女,漢族,甘肅平涼人,蘭州城市學院,本科;主要研究方向和關注領域:信息安全。