隆文超 湖南司法警官職業學院
大數據挖掘下的網絡安全預警,是一個新的概念,是指將一些零散的、不能形成系統的網絡數據和信息安全系統進行有效的融合,形成數據共享體系,通過智能算法分析數據量化后存在的網絡應用工具和系統的漏洞和潛在風險,給網絡安全提供事前預防。
(一)網絡安全管理問題。隨著大數據技術的發展,互聯網的普及,“網警”這一網絡安全管理職業由此誕生。網警的出現,在一定程度上對網絡安全的管理起到了一定的作用,通過對網絡違法犯罪活動的打擊,凈化了網絡環境,給網民一個安全的上網環境。但是由于很多企業和單位對網絡管理工作不太重視,缺乏一定的網絡管理制度,企業內部人員缺乏安全使用計算機網絡的意識,導致很多網絡黑客對企業的公共網絡進行攻擊和信息竊取,企業卻難以追究責任。由于對計算機網絡缺乏相應的系統化管理,很多網絡安全問題得不到切實的解決。
(二)個人信息的保護。在大數據時代,個人信息安全面臨三大問題:
1.公民個人信息遭泄露。以訂票網站泄露公民隱私,導致黑客撞庫事例為典型,大數據環境下,公民的姓名、身份證號、手機號等信息遭泄露,很多黑客利用“撞庫”獲取用戶密碼,獲得非法牟利。
2.個人網絡消費信息安全面臨危機。大數據時代,人們在利用微信、淘寶進行支付,用微博進行轉發的過程中,個人信息被商家用大數據分析工具截獲。大數據時代,每個人都是數據的貢獻者,在貢獻數據過程中,個人信息的網絡安全面臨著威脅。
3.個人信息遭濫用。在大數據信息的收集過程中,有很多未經授權的個人信息被濫用,還有的個人信息數據經過企業合法收集之后,用于一些非法用途,還有的是黑客轉賣給第三家。
(三)系統面臨的安全問題
1.大數據平臺依托于互聯網面向政府和社會大眾服務,網絡基礎設施和軟硬件系統受制于人,企業系統管理具有不可控因素。
2.網站應用漏洞百出,這是大數據環境下,企業系統平臺面臨的最大威脅之一,雖然有些企業采用了第三方數據庫或者中間件,但是系統的穩定性不容樂觀,還是存在運行風險和漏洞。
3.黑客利用終端惡意軟件、代碼攻擊大數據平臺、竊取企業重要數據。隨著網絡攻擊的方式越來越先進,企業的軟硬件系統不夠強大,雖然一些網絡防火墻和殺毒軟件起到了防護作用,但是在企業互聯網系統運行當中,還是會產生很多漏洞和安全問題。
(一)大數據時代網絡安全及時性的需要。大數據挖掘的網絡安全預警,通過各種算法構建一個自動化網絡安全預警模式,可以有效的提高網絡安全應急系統的及時性,降低網絡應用系統遭受攻擊、篡改、木馬等安全問題,不斷提升網絡安全能力。
(二)大數據時代網絡安全主動防御的需要。網絡安全預警以主動防御為主要特征,其主要功能包括:網絡數據采集、網絡事件和行為評測、網絡異常數據檢測、網絡協議分析和網絡內容檢測等。通過對網絡數據的收集,可以實時分析數據設備運行中的日志數據和網絡數據。利用大數據發掘技術對網絡數據、行為、協議等進行分析,檢測網絡中是否存在異常或者潛在風險,并將其反饋到安全防御系統。
(三)大數據時代網絡提高安全管理的效率的需要。隨著信息系統大集中模式的不斷發展,網絡信息環境變得越來越復雜,隨著網絡數據輸出的規模越來越大,網絡安全問題也受到更多的重視。網絡信息在運行和傳播過程中產生大量的安全問題。針對這些龐大的數據問題,網絡管理員顯得束手無策,不能及時發現安全隱患,降低了網絡信息安全的工作效率。在這種情況下,急需一種有效的自動化網絡管理模式,來提高網絡安全管理工作的效率。
基于網絡安全預警模式分析數據量龐大的特點,人工分析模式不能滿足其實時性和快速性的需求,利用大數據挖掘技術,通過遺傳神經網絡的算法,實現數據分析的自動化和智能化,能夠很好地節省人工成本,節約時間,快速的從海量的網絡數據中提取異常數據,并進行風險評測,對網絡數據中存在的安全問題提前預警。
(一)通過系統自動采集網絡數據,包括應用數據、系統數據、網絡設備數據等。通過將這些數據進行分類存儲和集中管理,整合分布式系統、關系數據庫系統、數據庫集群等,建立混合型數據庫,實現對結構化、半結構化、非結構化的數據的存儲;
(二)根據遺傳神經系統的特點,對采集和存儲的數據建模,目的是將這些網絡數據包轉換為能夠被神經系統識別的數據向量。初始化遺傳神將網絡的訓練樣本、期望輸出、算法、訓練次數等;
(三)根據已知的、達到理想狀態的數據訓練神經網絡。首先,對網絡實行離線訓練,對存儲在數據庫中的數據進行反復的挖掘、計算,實現重復利用,這樣能夠獲取較好的訓練效果,保證訓練結果的可靠性和實用性,進而將其應用到網絡安全預警系統中。遺傳神經網絡系統過程是學習的過程,通過特定的學習樣本庫和期望輸出數據,為遺傳神經網絡節點輸入數據,學習樣本的選擇要滿足以下特點:一是要包括正常的網絡數據;一是要含有典型的帶有攻擊行為特征的典型樣本數據。BP 神經網絡訓練完成之后,將輸出結果和期望結果進行比對,如果輸出結果大于期望值,就要再重復學習過程,指導輸出結果小于期望值以后,才符合網絡安全預警系統模式的要求;
(四)遺傳神經系統網絡訓練結束以后,就可以用權值的形式保存起來了。可以將其用于對網絡數據的檢測,通過在大數據環境下對網絡數據進行檢測,遺傳神經系統充分發揮它檢測數據的優勢,快速的完成數據檢測以后,將處理結果保存到數據庫中;
(五)更新遺傳神經網絡算法,具體要重復執行(三)和(四)步驟的操作,進化神經網絡算法,進行更準確、及時的網絡安全數據分析;
(六)網絡安全響應。在系統發現網絡中的攻擊行為之后,會將其反饋給網絡安全防御系統,對網絡中的不安全因素進行排除,保證網絡安全的正常運行。
綜上所述,大數據環境下的網絡安全形勢越來越嚴峻,通過遺傳神將網絡這種大數據分析技術的應用,可以在訓練之后形成網絡安全預警模型,及時發現網絡數據中潛在的危險,并反饋給安全防御系統,不斷提高網絡安全。