◆常 俊
一種基于大數據的網絡安全防御系統研究
◆常 俊
(江蘇經貿職業技術學院 江蘇 211168)
隨著互聯網、大數據、云計算等技術的快速發展和改進,人們已經進入到了“互聯網+”時代,互聯網也為人們提供了強大的便捷服務,實現信息共享、無紙化辦公、自動化管理,與此同時,互聯網也面臨著較多的安全威脅,比如蠕蟲病毒、勒索病毒等,它們破壞互聯網的安全,給人們帶來不必要的損失。傳統的網絡安全防御技術已經無法滿足需求,亟需引入大數據技術,構建先進的網絡安全防御模型,實現數據采集、安全風險分析、安全評估和安全防御四個功能,利用先進的深度學習、卷積神經網絡等提高網絡安全防御能力。
大數據;網絡安全;安全風險評估;安全風險分析;深度學習
目前,互聯網經過多年的普及和使用已經積累了海量數據資源,人們已經進入到了大數據時代,利用大數據技術也可以提升電子商務、政企辦公、金融理財、智能制造、科研學習水平,提高了人們工作、生活和學習的便捷性。但是,互聯網作為一個虛擬社會也存在許多的不法分子,利用蠕蟲病毒或勒索病毒攻擊人們的應用軟件,盜取人們的隱私數據,甚至可能導致人們的生命財產受到損失[1]。傳統的防御手段多采用防火墻、訪問控制規則或殺毒軟件,無法實現大數據主動查殺和防御,因此亟需改進安全防御技術,提高防御性能。
大數據技術是一種功能非常強大的分析算法,可以從海量的數據中發現潛藏的、有價值的信息,幫助人們進行決策。目前,大數據技術已經在很多領域得到廣泛研究和應用,誕生了許多的算法,比如深度學習、BP神經網絡、支持向量機等,也引入了統計學、信息論、模糊數學等很多理論,提高數據分析的精確度[2]。大數據時代,面對隱藏越來越深的網絡安全攻擊,常規的防御軟件已經無法有效發現攻擊威脅,因此可以引入深度學習、模式識別等大數據技術,利用BP神經網絡、遺傳算法、支持向量機等識別木馬病毒基因,從海量數據中及時發現存在的威脅[3]。網絡安全防御向人工智能方向的發展,可以更加準確地發現潛在的威脅,準確識別木馬、病毒,從而及時地啟動防御工具。本文為了提高大數據安全防御成效,引入了數據挖掘技術,采用先進的互信息無監督數據挖掘方法從海量數據中發現潛藏的威脅,及時地啟動網絡安全殺毒工具,提高大數據安全防御能力。
基于大數據的網絡安全防御模型適應新時期網絡安全防御需求,其主要功能包括數據采集、安全風險分析、安全評估和安全防御,同時還包括數據預處理、算法訓練和學習等模塊,以便能夠形成一個實時的安全防御模型,利用這個模型實現安全分析,獲取網絡中的安全基因[4]。
(1)數據采集。數據采集包括兩個關鍵步驟,一是數據包抓取,另一個是數據預處理。數據包抓取可以利用嗅探軟件等,從海量的網絡數據中抓取數據包,包括網絡傳輸數據、設備運行數據、系統日志數據等,這些數據覆蓋了網絡應用的每一個方面;數據預處理可以針對這些數據進行建模,形成一個個數據矩陣,以便能夠讓深度學習等大數據算法進行分析。
(2)安全風險分析。大數據是一種分析技術,其可以從海量的網絡數據中發現潛在的、有價值的數據,比如攻擊網絡的病毒、木馬基因等,本文采用的大數據技術為深度學習算法,可以利用卷積神經網絡進行統計分析,經過訓練可以形成一個網絡安全分析模型,該模型經過多次迭代學習,獲取實時的網絡安全攻擊基因。
(3)安全評估。安全評估可以引入層次分析方法、灰度統計理論等技術,利用這些技術可以針對數據安全進行評估,劃分為不同的等級,以便能夠啟動不同層次的防御工具,這樣就可以動態的、靈活的增強防御能力,在盡可能的降低殺毒服務器處理工具負載的情況下同時有效防御攻擊,可以更好的體現主動防御的性能。
(4)安全防御。該功能是主動防御系統的關鍵,也是部署防御工具最多的模塊,可以設置一下啟發式防御規則,根據不同的網絡安全攻擊層次啟動不同的防御工具,降低殺毒過程中的負載過重。
大數據在網絡安全防御中的應用處理流程如圖1所示。

圖1 基于大數據的網絡安全防御模型業務流程
基于大數據的網絡安全防御關鍵技術包括兩個方面,一是深度學習,二是安全評估。
深度學習以深度置信網絡(Deep Belief Network, DBN)為基礎,其可以利用先進的模式識別技術發現數據中潛在的病毒或木馬。深度學習包括多個層次,是一種深層次的人工神經網絡技術,將神經元劃分為顯性和隱性等多層,顯性神經元可以接收輸入的數據,隱性神經元可以準確提取木馬、病毒的特征,因此又被稱為特征檢測器。深度學習最頂上的兩層連接是沒有方向的,其可以組成聯合內存,其它較低的層之間可以實現有向連接,最底層能夠表示網絡威脅向量,每一個神經元表示網絡威脅向量的一個維度。深度學習最為關鍵的組成器件是受限玻爾茲曼機(Restricted Boltzmann Machines,RBM),訓練深度學習的過程是一層一層的,每一層都可以將數據向量推斷為隱藏層,然后再把這一個隱藏層當做下一層的數據向量。深度學習的學習過程包括兩個非常關鍵的階段,分別是預訓練和微調。預訓練是采用逐層方式來實施的,其可以針對每一層RBM進行單獨的訓練,而且各層之間的權重和偏差可以保存起來做進一步的分析;在微調階段深度學習模型的權重和偏差通過使用標記輸入數據從而進行的一個反向傳播算法來進行更新。
安全評估采用了層次分析方法和灰度理論,這樣就可以利用模糊處理技術,將未知的、不確定的事務進行準確劃分。網絡安全評估就是這樣,其可以將深度學習分析的結果進行劃分,以便能夠將安全防御模式劃分為重度、輕度、一般和無四個檔次,如果是無風險檔次,則不需要啟動殺毒軟件;如果是一般風險,則可以啟用相同規則模式的防御措施;如果是輕度風險和重度風險,也可以啟動不同防御程序的軟件。
網絡安全防御是一個系統的、動態的工程,基于大數據構建一個網絡安全防御模型,可以利用深度學習等人工智能技術發現網絡中存在的病毒或木馬,及時地啟動網絡安全防御軟件,將病毒或木馬清除,這樣就可以主動的提升網絡安全防御能力,適應大數據時代的安全防御需求,具有重要的作用和意義。
[1] 朱光軍,孟子棟.基于大數據時代背景下的網絡信息安全及防護策略研究[J].中國新通信, 2018.
[2] 管磊,胡光俊,王專.基于大數據的網絡安全態勢感知技術研究[J].信息網絡安全, 2016.
[3] 桑宏偉,劉占強,曾毅等.基于大數據平臺的移動分組網絡安全及IP性能的研究[J].郵電設計技術, 2016.
[4] 劉鎮源.基于交通運輸大數據的網絡安全態勢感知系統結構研究[J].中國新通信, 2