閆衛剛
(陜西警官職業學院,陜西 西安 710021)
近年來,隨著全球信息化發展越來越快,人們依賴網絡的程度日漸提高,網絡安全隱患越發引人關注[1]。網絡系統因具有隨機性、模糊性,以往的防御方式難以適應目前的安全要求[2]。網絡安全態勢通過預測和評估可確保網絡安全穩定運行,并得到學者深入研究[3]。
目前,網絡已經深入到社會經濟發展、國家戰略部署、人民日常生活的方方面面[4]。人們在學習、工作、生活等方面均涉及到網絡,但現有防范措施的更新速度難以跟上相關網絡安全威脅的變化速度[5]。由于網絡安全態勢預測在網絡安全態勢感知系統中具有舉足輕重的地位,所以逐漸成為了網絡安全研究的熱點之一[6]。整個預測過程是建立在對態勢進行完整理解以及敏銳察覺的基礎之上[7]。在不斷接觸網絡安全態勢期間,采集多種多樣的信息數據,也是分析網絡安全態勢運行方向的開端[8]。通過對其歷史數據觀測及相關經驗分析,可對未來某段時間內網絡安全態勢發展趨勢進行預測[9]。因而,研究網絡安全態勢預測會對其日后發展產生深遠的影響,并為網絡系統安全運行提供重要保障。在研究過程中會涉及到一些相關的算法和模型,但鑒于外部環境條件數量太多且難以參數化,所以無法將預測模型標準化、統一化,故以往的預測手段難以精確地對此類數據進行預測。因此,本文基于人工智能,對互聯網絡數據安全優化算法進行研究。
常用的智能優化算法分為以下幾類:差分進化算法、遺傳算法、粒子群優化算法。差分進化算法、遺傳算法的運算過程均含有選擇、交叉、變異三個步驟。前者會使種群個體出現一個屬于自身的測試向量,然后對比原始和測試2個向量,選擇更合適的值進行迭代,能夠很好地優化處理傳統測試方程;而后者擅長確定最優解范圍以及在全局范圍內進行搜索,然而其在給定小范圍內搜索最優解的能力有所欠缺,所得結果的精度并不高。粒子群算法的運算過程含有位置以及速度更新2個步驟。其對遷徙動物尋找食物的場景進行模擬,如果個體成功找到食物,便會告知其他種群成員,進而導致群體產生運動。粒子群算法擅長快速鎖定范圍并在其中迅速找出最優解。
通過神經網絡理論進一步發展,研究人員對人腦神經網絡系統特點研究日漸成熟。尤其是對權值的優化,已研發出不同的優化算法來確定其權值,其中最常用的是蟻群算法和遺傳算法等[10]。如何確定RBF神經網絡連接權值?本文主要考慮利用粒子群對其進行優化,能夠使其權值高效迅速地確定為全局最優解。
粒子群優化算法的特點能將鳥群尋找食物時互助行為體現出來,通過同伴間信息交換,從而快速找到食物,將其引申到解決數學問題就是將最優解問題快速解決。該算法屬于一種尋找最優解算法,通過粒子間協作、交換將全局最優解快速求出。在粒子群優化算法中,將最優解作為該算法中一個粒子,任意對每個粒子進行初始化,然后在解的范圍中進行尋找。每個粒子對應一個適應度方程,該方程的解即符合問題條件的最優粒子值,通常由對象方程決定。當粒子搜尋到一個解時,比較適應度函數,若新的值比前一個值對目標函數更適應,則新位置為該粒子暫時最優解;反之,則個體最優解保持不變。個體確定最優解后,對比粒子自身的適應度方程,最恰當的就是全局最優解。再將這二者的適應度方程解進行比較,選擇更加符合條件的那一個。
假設在粒子群優化算法中,有m個粒子群,且n為粒子最優問題解空間維數,則每個粒子改變個體粒子位置的規則包括:在尋找到個體最優位置時,每個粒子對自身位置進行更新;每個粒子根據自身搜索方向搜索;比較全體粒子位置,根據粒子個體最優解進行全局最優位置的更新。


在粒子群優化中,通過對粒子群中粒子速度、位置的更換獲得新種群,進一步提高種群多樣性、遍歷性。離子群優化算法流程需經過如圖1所示的步驟完成。
圖1展現了粒子群優化算法的大致過程,其步驟包括:

圖1 粒子群優化過程
步驟1:確定粒子的搜索頻次、所處位置以及更新速度,并對這些參數一一進行初始化。
步驟2:對全部粒子的適應度值進行一一求解。
步驟3:分析粒子自身個體最優位置,將其與此次位置適應度值展開比較,若后者更加接近問題最優解,則用本次位置替換前者。
步驟4:依據前3步的更新數據信息,重新確定粒子群全局最優位置。個體確定最優解后,對比粒子自身的適應度方程,最恰當的就是全局最優解。再將這二者的適應度方程解進行比較,選擇更加符合條件的那一個。
步驟5:對粒子位置、速度進行確定。
步驟6:若未能達到終止條件,則返回步驟2。
RBF神經網絡結構如圖2所示。輸出層屬于線性結構,可為神經網絡輸入產生對應的輸出;隱含層能夠訓練輸入層的樣本,并對不同數據進行修訂;輸入層能夠識別從外面輸入的樣本集,訓練樣本。

圖2 RBF神經網絡結構
粒子群神經網絡是神經網絡模型的一種,其兼顧了神經網絡的優點和粒子群優化算法的長處。RBF神經網絡擅長模仿學習,而粒子群擅長進行高效迅速地全局搜索,將二者有機結合,能夠大大提高算法的性能。如今,由于樣本數量不足,使用梯度法及線性最小二乘法時,RBF神經網絡的權值優化難以接近最強性能。所以,轉而采用粒子群優化算法來解決這一問題。
假定1臺服務器主機可能遭受的攻擊有以下幾個方面:CSRF漏洞、CGI漏洞、XSS漏洞、應用漏洞、SQL注入,其風險等級賦值量化為W38,W48,W58,W68,W78。在權值優化上,神經網絡沒有求得一個適應所有情況的最優解,所以對其權值優化進行研究至關重要。本文將RBF神經網絡權值進行轉換,形成粒子群中粒子,在解空間中,讓粒子進行全局最優權值的尋找。RBF神經網絡的網絡模型如圖3所示。

圖3 RBF神經網絡的網絡模型
由圖3可知,需優化最優解問題解空間維度為五維。若將求解五維最優空間解在粒子群求解最優解進行映射,需進行RBF神經網絡權值編碼。編碼方式一般來說有兩種:一是對向量進行編碼;二是對矩陣進行編碼。前者是將所有粒子一一對應轉化為向量,在圖3中進行權值優化后,不同粒子所具有的編碼如下:


采用基于粒子群優化RBF神經網絡預測網絡安全態勢。在處理小樣本數據方面,粒子群優化算法最大的特點是快速、準確,RBF神經網絡進行粒子群優化過程如圖4所示,優化過程具體步驟如下:

圖4 RBF神經網絡進行粒子群優化過程
步驟1:對其權值編碼,并將編碼對應到每一個粒子上;
步驟2:確定粒子的搜索頻次、所處位置以及更新速度,并對這些參數一一進行初始化;
步驟3:對RBF神經網絡中心、半徑使用K-均值聚類算法進行計算;
步驟4:重新求解粒子群適應度值,更新相關數據參數;
步驟5:重新確認不同粒子所處的位置以及自身的速度;
步驟6:從以下兩方面判斷是否符合終止條件,一是對全局最優解是否在規定誤差范圍內進行判斷;二是對更新粒子群次數是否已達上限進行判斷,若符合,則完成整個優化過程,反之回到步驟4繼續以上流程,直至符合為止。
在本研究中,網絡安全態勢評估對象為6臺服務器主機,根據熵權理論風險評估模型、多維云模型將其他5臺服務器主機風險值計算出來,分別為0.682 0,0.653 1,0.650 2,0.680 1,0.541 5。因網絡系統主機全部為服務器主機,服務器上架設不同網站,具有同等重要作用,重要性權值均相等,且6個權值之和為1,則每個服務器主機重要性權值等于1/6,則進行加權計算后風險值為0.648 2,表明本系統網絡安全態勢屬于較高風險。
在預測時,選用粒子群優化RBF神經網絡模型,利用其對訓練樣本進行處理,最終通過訓練獲得有效預測模型。預測模型的流程如圖5所示。

圖5 網絡安全態勢預測流程
網絡安全態勢預測研究可以從兩個方面入手,一是把每次遭受到的攻擊看作是獨立事件,進行單次預估,同時還要評估不同攻擊的強度,將不同時刻對應的態勢值預估出來,這樣做的弊端在于評估不同攻擊的強度時通常會受到評價者主觀認知的左右;二是建立一個非線性時序的模型來進行預估,匯總歷史數據,認真分析其內在聯系和共同影響因子,以便對日后網絡的發展方像向進行預估。本文選用經過粒子群優化RBF神經網絡這一方式來進行預測,對來自國家級網絡中心的海量數據信息進行預處理。綜合考量后選取以下影響因子作為規范性指標來對網絡安全態勢進行預估:一是新增信息安全漏洞數量;二是被植入后門的網站數量;三是新增信息安全高風險漏洞;四是感染網絡病毒主機數量;五是網站仿冒頁面數量;六是網絡中被篡改網站數量。將網絡安全態勢值進行劃分,分別為危、差、中、良、優5個級別。對6個指標數據進行統計、分析,5個風險等級量化表見表1所列。

表1 安全等級表
通過本文方法對RBF神經網絡進行優化,從而高效迅速地預測網絡安全態勢。通過對比RBF神經網絡優化前后預測的數值與實際值的差異,表明粒子群優化RBF神經網絡具有準確、快速的優點,具體如圖6所示。

圖6 算法對應的預測誤差圖
由圖6可知,采用本文方法預測網絡安全態勢的收斂速度要比RBF神經網絡快。預測結果誤差圖曲線表明,在進化次數小于10次時,本文方法預測誤差下降很快,隨后在較小誤差附近波動。RBF神經網絡預測誤差圖曲線表明,其進行樣本訓練時產生的預測誤差較大,通常是由于訓練次數或者樣本數量不足導致的。兩種方法預測誤差波動表明,相比于RBF神經網絡,利用本文方法進行預測,誤差出現的起伏更小。鑒于網絡安全態勢數據具備以下三個性質:復雜性、隨機性、模糊性,所以本文方法能夠更好地建立相應預測模型,把誤差的波動控制在較小的程度內。即便是在樣本量不足的情況下,本文方法也能夠在全局范圍內高效迅速地鎖定最優解。采用本文方法進行權值優化,能使神經網絡權值快速收斂,訓練出的網絡安全態勢預測模型更有效。算法對應的預測輸出如圖7所示。

圖7 算法對應的預測輸出
由圖7可看出,在訓練次數較少的情況下,本文算法的預測結果快速且與實際網絡安全態勢值接近,比RBF神經網絡預測模型預測的網絡安全態勢更有效、更快速。表明本文算法預測結果更加擬合實際網絡態勢值。
本文基于人工智能對互聯網絡數據安全優化算法進行研究,分析了互聯網絡數據安全優化算法,得出如下結論:
(1)在網絡安全態勢預測中,預測模型建立在粒子群優化RBF神經網絡的基礎上,在處理信息數據量不多時,粒子群RBF神經網絡算法的運算速度快、精度高,有利于粒子群RBF神經網絡進行快速準確的預測。
(2)通過對比粒子群優化前后的RBF神經網絡,結果表明,對RBF神經網絡進行粒子群優化后,其預測誤差波動能夠很大程度的減小。利用這種方法進行權值優化,能使神經網絡權值快速收斂,訓練的網絡安全態勢預測模型更有效。
(3)比較粒子群優化RBF神經網絡算法預測結果、實際網絡態勢值以及RBF神經網絡預測結果,表明在訓練次數較少情況下,粒子群優化RBF神經網絡算法的預測結果快速且與實際網絡安全態勢值接近,比RBF神經網絡預測模型預測的網絡安全態勢更有效、更快速。