◆董 超 劉 雷
(浙江乾冠信息安全研究院有限公司 浙江 310015)
當前網絡信息技術發展迅速,在社會各領域、各行業得到廣泛應用,人們也越來越關注網絡安全問題。我國互聯網行業起步較晚,在網絡安全技術方面仍然存在較大缺陷,使用大數據技術進行網絡分析,可以有效提高我國的網絡安全技術水平,減少網絡入侵對政治、經濟活動和個人信息、財產安全的損害。本文首先闡述大數據的概念和特點,然后分析其在網絡安全技術中的發展趨勢。
大數據是指大規模的數據集合,通過獲取、管理、存儲、分析大量地的網絡數據,極大地擴充信息處理能力。大數據的基本特點是數據量大、數據流動快、數據類型豐富、來源多樣、價值分散、動態性強。大數據處理技術超出了傳統計算機數據庫軟件的處理能力,需要采用并行處理數據庫、分布式數據庫、分布式文件系統、云計算平臺等對大量數據進行處理。大數據分析處理可以為社會經濟活動提供許多實用信息,幫助企業和政府部門精準分析市場和社會動向,對生產和管理工作進行優化,創造更大的經濟效益和社會效益。
隨著我國信息技術水平不斷提升,大數據的使用范圍越來越廣,而云計算技術為大數據提供了比較完善的設備平臺。通過大數據和云計算的深度結合,可以將互聯網的數據信息轉化為龐大的數據資源,推動大數據進一步發展,擴大其影響力。
隨著現代網絡技術不斷完善,網絡結構也逐漸朝復雜化、精細化、多元化的方向深入發展,在豐富網絡信息功能的同時,也導致網絡安全形勢日趨復雜,網絡安全分析也變得更加困難,技術要求越來越高。過去的網絡安全分析技術主要采用結構化數據庫,對數據進行提前處理和儲存,操作難度較大,需要耗費大量的人力、物力進行工作,處理過程中失誤和漏洞較多,準確性和實效性不強,無法充分保障網絡信息安全。使用大數據進行網絡安全分析,可以極大地降低工作成本、降低工作強度和價值密度,提高數據處理速度,形成準確、高效的安全分析機制,充分提升網絡安全水平。
網絡安全分析技術是通過各種技術和管理方法,來保護計算機系統中的數據信息和軟件、硬件等,保障計算機系統的正常工作運轉,維持其基本操作功能,防止信息數據被竊取、篡改或破壞。網絡安全分析的重點在于對數據流量傳輸的內容進行處理和分析,發現數據流量中存在的安全隱患。使用大數據進行分析,可以將數據內容分析與流量分析結合起來,進一步提高網絡安全分析的有效性,加強對網絡信息的采集、監控和處理能力,全面保障網絡系統的安全性。
(1)采集網絡數據信息
使用大數據技術,可以從海量的網絡信息源中提取非結構化的數據信息,再將其保存到結構化的存儲介質當中。在數據信息采集時,可以使用Chukwa等軟件實現網絡安全分析相關數據的采集工作,該軟件的采集效率高,速度和性能都比較強,使用分布式的數據采集方法,每秒可以采集數百兆以上的網絡信息,還可以使用鏡像采集的方法實現全流量數據采集[1]。
(2)儲存數據信息
現代網絡信息規模不斷擴大,種類和來源日漸豐富,要增強網絡安全分析的準確性和高效性,就必須穩定、高效的儲存網絡數據。在儲存數據信息時,針對不同種類的數據特點,可以采用不同的儲存方式。對于流量和日志等原始數據項目,通常使用Hbade和GBase等方法進行儲存,以便將來調用數據時可以進行快速檢索,提升數據利用的效率。對于分析之后的數據信息,一般采用Hahoop計算其數據架構,然后采用Hive技術分析腳本,實現深層次的數據分析和總結,完善網絡安全分析管理系統,并通過安全分析形成安全警告,將分析結果分類儲存起來。
(3)檢索數據信息
對網絡數據信息進行有效地整理、加工、組織、存儲之后,就可以根據工作中的實際需要,對數據進行檢索,快速查找到所需要的信息。在網絡安全分析技術中,一般使用MapReduce作為基本的數據檢索工具,將所要查找的關鍵詞置于數據庫中的各節點上,以完成數據檢索,獲得所需的目標信息。
(4)對數據進行分析處理
大數據的基本特點就是規模龐大、價值密度低、混亂度高,因此必須使用有效手段,從大數據中提取出有價值、有意義的數據,從而提高網絡安全分析的效率。在網絡安全分析技術中,通常采用Hadoop、MapReduce以及HDGS相結合的方法,快速提取并分析有效數據,查找網絡系統中存在的風險源和攻擊源。Hadoop工具的容錯性較高,對硬件條件的適應性強,通過集群效力的方式實現高效分析與存儲,可以充分滿足大數據分析處理的需求[2]。
(5)對數據進行關聯分析
在關系數據和交易數據等信息載體當中,通過分析數據項目之間的相關性、頻繁模式和因果結構,可以有效發現網絡數據之間的關聯性和多元結構。在大數據當中,通過高效率的數據分析和存儲,可以在較短的時間內完成數據分析挖掘工作,避免在分析過程中附帶異質多元結構,從而尋找到關聯異構數據,及時排查并發現網絡信息異常情況,有效保障網絡環境安全。若網絡系統在運輸過程中,發生主機癱瘓或出現漏洞等情況,也可以通過信息關聯系統及時隔絕危險源,防止其他設備遭到感染,實現網絡系統的實時安全防護,最大限度地降低網絡系統安全隱患[3]。
(1)構建網絡安全平臺
大數據技術還可以用于構建網絡安全平臺。網絡安全平臺的構建層次分為數據分析層、數據存儲層、數據顯示層等。大多數網絡系統的信息安全保護能力存在缺陷,容易泄漏系統信息和用戶個人信息。使用大數據分布式文件系統,可以有效加強數據儲存層的作用,在系統中長期儲存海量的結構化與半結構化數據信息。在數據顯示層中,也可以有效完成信息檢索人物,為用戶提供所需的目標數據,實現可視化展示,體現網絡系統當前的信息安全水平。
(2)數據分析技術
在大數據網絡安全平臺當中,使用 Hive形式對數據進行綜合統計與分析,可以有效檢索非結構化的數據信息,完成對API的封裝處理以及系統插件的數據分析工作。此外,還可以采用Aahout技術挖掘處理網絡安全平臺中的數據,對數據中出現的各類事件進行關聯性分析,查找到危險源。同時還可以使用CPE技術分類處理網絡安全平臺中的不同事件,分門別類地建立關系數據庫,以便將數據轉換到更高級別,及時查找出威脅網絡平臺安全的事件,并進行預警。
當前大數據概念的發展不斷深入,網絡信息系統日趨復雜,人們越來越關注網絡安全問題,對網絡安全保障工作的水平提出了更高要求。使用大數據技術對網絡數據信息進行采集、儲存、檢索、處理和關聯分析,可以有效加強網絡安全分析技術的效果,提升網絡系統的安全性。運用大數據構建網絡信息安全平臺,可以系統地分析并查找網絡安全平臺中存在的風險源和漏洞,提高網絡安全防護工作的準確性和高效性。在網絡安全技術中積極運用大數據技術,可以充分適應新時代網絡信息安全工作的要求,加強我國的網絡安全建設,改善網絡安全環境,為企業、政府、家庭和個人提供充分的安全保障,避免由于網絡安全問題而造成重大經濟損失和社會危害。

圖1 大數據網絡安全平臺的結構