韓昊
摘要:近年來,隨著高職院校信息化建設不斷推進,校園網絡呈現出數據體量大且增長快,網絡結構復雜,信息安全挑戰大等特點。本文首先闡述大數據的概念、特征及發展現狀。接下來結合高職院校網絡安全面臨的新挑戰討論了大數據技術在高職院校網絡安全管理中應用的必要性和意義,提出了新時代引入大數據分析技術高職院校網絡安全的方法,以期能為校園網絡安全建設提供參考。
關鍵詞:大數據;網絡安全;高職院校;信息化
中圖分類號:TP311 文獻標識碼:A 文章編號:1007-9416(2018)07-0215-03
當今世界網絡和信息化技術飛速發展,生活中手機、便攜式電腦、IPAD等廉價移動設備的普及,使得網絡數據正在以前所未有的速度呈現爆炸式增長,推動人類社會進入大數據時代,大數據環境下的各種應用使人們學習工作更加科學、便捷,但同時也帶來了新的網絡安全問題。如2017年WannaCry勒索病毒在全球范圍內大規模爆發,據不完全統計,波及超過150個國家、至少30萬名用戶被病毒感染,損失高達80億美元以上,我國一些Windows操作系統用戶同樣沒能躲過災難,其中國內的科研院所及高校校園網用戶更是首當其沖,大量實驗室數據、報告、畢業設計,文獻資料被鎖定加密,損失慘重。隨著職業化教育對信息化平臺的依賴程度越來越高,高開放性和高密度的特征增加了高職院校校園網絡風險程度,如何抵御大數據時代帶來的各種網絡安全問題,保證校園網安全可靠運行,已成為高職院校網絡安全急需解決的問題。
1 大數據概念及應用
大數據并不是新鮮產物,隨著數據挖掘和云計算等技術的發展近年逐步引起人們的重視。對于大數據的概念至今沒有統一的定義,各國專家從不同的角度嘗試給其定義。維基百科定義大數據(big data)為無法在一定時間范圍內用常規軟件工具進行捕捉、管理和處理的數據集合,是需要新處理模式才能具有更強的決策力、洞察發現力和流程優化能力的海量、高增長率和多樣化的信息資產。中科院李國杰院士則認為,大數據就是“海量數據” 加“復雜數據類型”[1]。據IDC調查顯示,到2020年全球網絡數據總量預計將可能超過40ZB,且大部分是諸如視頻、音頻、圖片等非結構化數據。大數據具有:Volume(大量)、Velocity(高速)、Variety(多樣)、Value(低價值密度)4V特征[2]。而基于大數據的分析技術則是互聯網技術、數據挖掘技術和信息技術高度發展的產物。
目前,大數據分析技術已經廣泛的應用于金融、刑偵、教育、公共服務等領域,用來分析股市發展趨勢,提取案件價值線索,分析學生異常行為等,以便獲取有價值的規律知識,為決策提供支持。
2 高職院校網絡安全面臨的挑戰
經過多年的建設,高職院校信息化水平有了明顯的提高,各校基本都建成了自己的校園網,運行著校內各種業務系統和網絡管理平臺,極大提高了學校各項工作的效率。在享受校園網帶來的高效和便捷的同時,校園網絡安全也面臨一些新的問題,主要的挑戰有:
2.1 數據量規模大,增長快,數據結構多元
隨著高職院校職業化教育不斷和市場接軌,其專業開設,實習實訓等教學管理業務相對于普通本科高等院校具有變化快,信息化依賴程度高,開放性強等特點,導致校園網絡業務數據快速增長,網絡安全設備如下一代防火墻、IPS入侵檢測系統、堡壘機、WAF等截取的數據量也同步呈現幾何級數增長,如何有效挖掘這些海量的業務和安全數據對網絡安全審計和分析能力提出了更高的要求。
2.2 數據結構多元化
高職院校校內各部門由于業務性質不同(特別是針對不同專業的職業技能教育仿真系統),在數據格式、配置信息、數據存儲方式等方面也是千差萬別,這要求網絡安全管理系統能針對不同類型的數據(特別是圖像、視頻、音頻等非結構化數據)進行辨別、分析、判斷。
2.3 數據分析的速度和性能要求高
硬件技術快速發展,高性能服務器和計算機終端使得網絡數據包的發送和接收速度不斷變快,為了能與網絡數據流速度匹配,以達到分析結果及時有效性,要求網絡安全設備和算法必須具有高速的特點。
2.4 傳統分析方法難以滿足網絡安全需求
傳統的網絡安全分析方法在面對類似flood(洪水式)攻擊這種會在短時間產生龐大數據流的攻擊時,受限于網絡硬件設備和分析算法的性能,往往不堪重負,無法及時分析判斷異常情況,截斷數據流,從而導致網絡全面癱瘓。另外,傳統的網絡分析方法只能對知識庫中已有的安全數據或規則進行簡單比對分析,面對快速變化的網絡安全威脅往往顯得滯后,不能及時采取有效防范措施。
3 高職院校網絡安全管理中運用大數據技術的意義
總結上述高職院校網絡安全新威脅,主要是面臨數據體量大,增長速度快,需要極高的處理性能,海量安全數據中有價值的信息占比低,這些正是大數據的特點。同時,面對這些新形勢新問題,需要網絡安全系統具備情景感知和自適應能力,要能進行智能分析。大數據技術可以不同從業務系統和網絡安全設備中采集大量異構數據,擴展數據安全分析的廣度和深度,拉伸分析數據的時間和空間來實現這些需求[3]。校園網絡安全管理中引入大數據分析技術,結合數據挖掘和機器學習技術,可以從海量數據中挖掘有價值的規律知識,形成科學決策并聯合使用多個網絡安全管理工具,可以完成網絡安全管理系統的自學習和智能處置,極大提高網絡防風險和處置能力。
4 大數據技術在高職院校網絡安全中的應用
為了校園網管理中運用大數據分析技術,需要有一個大數據分析中心,中心具有數據感知、數據分析和決策,數據處理功能,能實時地監控,分析數據,錄入安全日志,能運用機器學習的方法完成自學習,能進行在線智能處理。網絡安全管理體系還需要設定一個被認為是正常的網絡態勢數據集,以方便比對和判斷。高職院校基于大數據分析系統架構圖如圖1。
4.1 安全基準態勢
傳統的網絡安全檢測只能比對知識或規則庫中已有的日志信息,面對千變萬化的網絡威脅缺乏自學習自適應能力和智能處理能力。通過定義一種網絡日志、用戶行為記錄等組成的數據集為安全基準態勢,一旦超出這種態勢,就需要通過分析判斷是否為異常,依據判斷結果采取不同的措施。
4.2 網絡安全智能處理方案庫
網絡安全智能處理方案庫是以大數據采集為基礎,結合數據挖掘算法、先驗知識庫和機器學習方法,形成解決方案并能自動更新以供調用的規則知識庫。在遇到未知網絡態勢時,先通過和庫比對,結合算法分析判斷是否為異常現象,如果是則切斷網絡或截斷數據流,否則從庫中得出解決方法,最后更新方案庫,完成自學習。錄入日志供管理人員人工進行判斷,手工更新知識庫。具體流程如圖2所示。
4.3 大數據技術應用
大數據分析中心具有數據感知、大數據分析判斷,決策和響應功能形成閉環[4],如圖3。
通過感知基礎設施層的機器數據、網絡安全數據和應用層各業務系統的數據流,進行實時監控、分析判斷,發現異常波動則比對知識庫,結合一系列算法得出處置方法,比如立刻采取措施截斷數據流或切斷網絡等,同時將記錄日志,更新安全基準態勢,完成機器自學習過程。
5 結語
面對大數據時代高職院校網絡安全新形勢,通過引入大數據技術,建立大數據分析中心,實時監控分析網絡安全數據,比對先驗知識庫,智能生成解決方案并在線自動處理。同時通過機器學習方法不斷更新方案庫,增強網絡安全處理能力,必將有效提高高職院校網絡安全管理效能。
參考文獻
[1]李國杰.對大數據的再認識[J].大數據,2015,1(01):8-16.
[2]嚴霄鳳,張德馨.大數據研究[J].計算機技術與發展,2013,23(04):168-172.
[3]何子軼.高校網絡信息安全的大數據技術應用[J].福建電腦,2016,32(05):142-143+147.
[4]劉樹飛.大數據技術在高校網絡信息安全中的應用[J].信息與電腦(理論版),2017,(15):126-127+134.