◆何堅安
(中國移動通信集團廣東有限公司 廣東 510623)
信息安全防御是當前大數據時代的一項關鍵工作,保證政企單位或個人信息系統的安全成為許多學者的研究熱點,誕生了許多著名的信息安全公司,比如奇虎360、卡巴斯基、瑞星殺毒、江民殺毒、騰訊安全管家,一定程度上提高了信息安全防御水平。但是,當前的網絡病毒和木馬多采用更加先進的脫殼技術或雙層水印技術,導致常規的防御系統無法識別病毒,不能夠提高安全防御能力,為用戶帶來了不可估量的損失。
大數據是當前互聯網及數據庫等計算機技術發展到一定階段的產物,由于各行業開發的分布式管理系統運行產生了海量的數據資源,因此信息系統進入到大數據時代。利用大數據資源開展各類型的工作就顯得非常重要。大數據具有占用空間大、使用數據量多等特點,目前已經在電子商務、文檔分類、在線學習、智能旅游、列車運行、票務管理等多領域得到應用,比如在電子商務領域,基于海量交易大數據挖掘潛在的客戶購買喜好,從而可以積極地為客戶推薦相同類型或相似類型的商品,還可以挖掘客戶的購買喜好和購買潛力。另外,人們基于大數據構建了強大的信息系統云存儲平臺,比如百度公司、騰訊公司、華為公司均根據時代的發展需求,構建了云存儲大數據中心,比如百度云、華為云和騰訊云,利用先進的光纖網絡構建了云存儲架構,進一步滿足了云時代的大數據操作需求。云存儲可以部署許多應用軟件,然后為用戶推送一個云桌面,用戶登錄云桌面即可實施各類型的操作,完現信息加工和處理功能。云存儲利用了先進的虛擬技術,可以擴展實際物理存儲、CPU、內存的大小,按照用戶的需求分配資源,提高系統資源的利用率。云存儲也引入了一些先進的算法,比如深度學習和人工智能算法等,利用這些算法可以優化云存儲的實際應用狀態,比如可以根據應用軟件的優先級或操作頻繁度,為應用軟件分配更多的資源。這些云存儲大數據平臺承載著高清視頻、網絡游戲、金融證券等行業數據,這也是大數據時代的一個重要應用體現。
隨著用戶數量的增多,信息系統安裝和部署的設備越來越多,因此數據信息流量非常大。信息系統監控采集層需要及時采集用戶信息、設備信息和網絡流量信息。信息系統還需要將這些信息進行處理,以便能夠提高安全分析的效率。目前,雖然信息系統管理人員采取了很多的措施,但是由于信息系統攻擊的技術正不斷發展,目前信息系統安全依然存在一些問題,比如作業人員無法實時掌握系統運行狀態,不能夠有效分析網絡流量狀態,導致信息系統不能安全運行。本文為了提高信息安全防御系統響應能力,實現安全防御的智能化、主動化,提出利用人工智能算法和大數據建立一個信息安全防御系統,這個系統可以采集網絡數據,利用人工神經網絡或者其他數據挖掘算法,分析網絡中的數據信息,識別和預測網絡安全攻擊威脅,從而提高響應速度。具體地,基于人工智能和大數據的信息安全防御系統包括四個功能層次,分別是網絡信息采集層、大數據分析層、安全防御層和防御效果評價層,如圖1 所示。

圖1 基于大數據和人工智能的信息安全防御系統運行流程
信息安全防御系統采用先進的大數據分析技術構建一個完善的、動態的和可持續改進的深度學習模型,能夠準確識別網絡中的病毒威脅,以便能夠及時預判網絡病毒的走勢,及時清除網絡病毒[4]。該模型采用了卷積神經網絡,可以將學習過程劃分為六個關鍵層次,分別是輸入層、卷積層C1、池化層S1、卷積層C2、池化層S2 和全連接層,詳細學習結構如圖2 所示。

圖2 大數據分析的關鍵算法運行流程
輸入層的主要作用就是對原始的信息數據進行預處理。
卷積層一般包含兩個操作,分別是特征提取和特征映射,卷積層C1 為特征提取層,C1 與輸入層神經元連接在一起,可以獲取數據的局部特征,同時確定特征之間的相對位置關系,從而減少參數設置的數量。卷積層C2 為特征映射層,可以將數據的特征映射到一個平面上,實現數據特征的壓縮,過濾器對局部的信息數據進行計算,提高卷積準確度。卷積層可以采用的核函數非常多,比如Sigmoid 函數,適用于網絡安全防御。
池化層的主要作用是用來壓縮信息數據和參數的數量,減小過擬合。在卷積層提取的木馬或病毒特征基礎上,池化可以計算某一個局部的卷積特征平均值,也可以計算最大值或最小值,減小卷積層特征的維數,這樣就可以持續降低分類器的計算復雜度,減輕分類器的負擔,也可以避免分類器過度擬合。
全連接層可以輸出分類結果,起到了一個分類器的作用,能夠將訓練好的模型輸出出來,這樣就可以提取木馬或病毒的特征。
信息安全防御是一項非常復雜的、動態的工作,傳統信息安全防御采用被動模式,無法滿足大數據時代的安全防御需求。因此,本文基于大數據和深度學習提出了一個人工智能安全防御模型,構建一個防患于未然的安全防御模型,主動發現信息系統中的病毒或木馬特征,從而及時地將這些數據清除。未來,信息安全防御模型還可以引入效果評估模型,發現殺毒是否徹底,如果不徹底可以持續訓練深度學習模型,從而提高人工智能模型的分析準確度。