面向APT攻擊的網(wǎng)絡安全威脅隱蔽目標識別方法*

2020-06-04 02:53:00王小英劉慶杰龐國莉

沈陽工業(yè)大學學報 2020年3期

王小英，劉慶杰，郭娜，龐國莉

(防災科技學院信息工程學院，河北三河 065201)

計算機網(wǎng)絡技術不斷發(fā)展，各類網(wǎng)絡信息系統(tǒng)已經(jīng)延伸到了眾多領域，并在社會生活中發(fā)揮了巨大作用.網(wǎng)絡信息系統(tǒng)的不斷擴大推動了社會的發(fā)展和進步，同時也出現(xiàn)了較多的網(wǎng)絡安全威脅.在網(wǎng)絡信息社會中，信息系統(tǒng)的安全十分重要，近些年來，各種網(wǎng)絡惡意行為以及網(wǎng)絡漏洞不停出現(xiàn)，網(wǎng)絡入侵也層出不窮，一些復雜的信息系統(tǒng)很容易成為APT攻擊目標，網(wǎng)絡安全狀態(tài)變得更加嚴峻[1-2].

APT攻擊是指對特定網(wǎng)絡的多方位且復雜的攻擊.防御APT攻擊需要針對特定的關聯(lián)組織和目標，通過長期監(jiān)控及信息收集，有針對性地對防護穿透和對抗進行研究，并且檢測不同層次的立體攻擊[3-4]，最終達到目標檢測和情報保護等目的.網(wǎng)絡安全問題關系到社會眾多領域的穩(wěn)定發(fā)展以及巨大利益，因此，對面向APT攻擊的網(wǎng)絡安全威脅隱蔽目標識別的研究成為領域內(nèi)重點課題，近年來也得到一些有意義的研究成果.文獻[5]提出基于One-Class SVM的APT攻擊下安全威脅事件隱蔽關聯(lián)識別方法，該方法利用支持向量機算法，對網(wǎng)絡安全威脅做分類處理，對個體結構定義，利用變異和交叉的方式，優(yōu)化網(wǎng)絡安全威脅隱蔽目標規(guī)則，實現(xiàn)了對網(wǎng)絡安全威脅隱蔽目標識別.文獻[6]提出基于通信特征的APT攻擊下安全威脅事件隱蔽關聯(lián)識別方法.該方法采用APT通信特征，識別網(wǎng)絡安全威脅隱蔽目標.為了提高識別效果，根據(jù)bloom filter對報文做篩選和匹配處理，最終完成了對網(wǎng)絡安全威脅隱蔽目標識別.該方法的規(guī)則適應度較高，但該方法存在攻擊識別耗時長、效率低的問題.

針對上述研究方法中存在的缺陷，提出一種面向APT攻擊的網(wǎng)絡安全威脅隱蔽目標識別方法.利用關聯(lián)規(guī)則構建隱蔽目標識別模型，在此基礎上設計APT攻擊隱蔽目標識別的總體框架及流程，通過APT攻擊的可信度實現(xiàn)網(wǎng)絡安全威脅隱蔽目標識別.

1 網(wǎng)絡安全威脅隱蔽目標識別

1.1 基于關聯(lián)規(guī)則的隱蔽APT目標識別模型

關聯(lián)規(guī)則是數(shù)據(jù)挖掘領域中的重要技術，能夠分析出數(shù)據(jù)庫各個領域間的關聯(lián)，將其應用于APT攻擊數(shù)據(jù)關聯(lián)分析中，根據(jù)數(shù)據(jù)項集的支持度及置信度求出關聯(lián)規(guī)則的可靠程度，根據(jù)可靠程度強關聯(lián)規(guī)則生成隱蔽目標識別模型[7].

關聯(lián)規(guī)則的表現(xiàn)形式可描述為：設I={i1，i2，i3，…，im}為m個項集，并且集合中的ik代表數(shù)據(jù)項，I中的任意子集X代表數(shù)據(jù)項集合.設X的長度為k，則X稱為k項集.事務T代表全部項集I的子集[8]，則有ti={i1，i2，…，ih，ii}，并且X?I，利用t′i來表示各個事務.

不同事務組合表示事務數(shù)據(jù)庫D，D={t1，t2，…，ti，tk}，假設X表示數(shù)據(jù)項集，并且X?I，設B為D中包含的X的事務數(shù)，A為D中事務的總數(shù)量，則X的支持度為

(1)

支持度表示X的重要程度.數(shù)據(jù)項集X置信度的表達式為

(2)

置信度表示X的可靠程度.通常情況下，假設R為關聯(lián)規(guī)則，表現(xiàn)形式為X?Y的蘊含式，且

(3)

X?Y代表數(shù)據(jù)項集X在某個事務中出現(xiàn)時，Y也將出現(xiàn)在其中.Y為結果.

利用式(1)表示R的重要程度，即

sup(R)=sup(X∪Y)

(4)

利用式(2)表示R的可靠程度，即

(5)

最小支持度是數(shù)據(jù)項被關聯(lián)規(guī)則所要求最小值的支持度，用min_sup來表示.最小置信度則是關聯(lián)規(guī)則與可信度相符合的最小值[9]，用min_conf來表示.當同時符合兩者時，稱其為強關聯(lián)規(guī)則.

利用關聯(lián)規(guī)則構建隱蔽目標識別模型的步驟為：1)發(fā)現(xiàn)大于等于min_sup的所有數(shù)據(jù)項集為頻繁項集；2)根據(jù)min_conf，采用頻繁項集來獲得強關聯(lián)規(guī)則，具體步驟為：在所有頻繁項集中，選取頻繁項a，在a中隨機選取非空子集b，若符合

(6)

則可以生成隱蔽目標識別模型，即

(7)

1.2 APT攻擊隱蔽目標識別方法設計

在利用關聯(lián)規(guī)則構建隱蔽目標識別模型的基礎上，進一步識別APT攻擊下的網(wǎng)絡安全威脅隱蔽目標.構建APT攻擊隱蔽目標識別的總體框架，設計識別流程，根據(jù)關聯(lián)規(guī)則提取APT目標檔案數(shù)據(jù)，將不同的網(wǎng)絡安全記錄關聯(lián)起來.在此基礎上求出APT攻擊可信度，根據(jù)絕對相容度更新APT攻擊可信度，實現(xiàn)網(wǎng)絡安全威脅隱蔽目標識別.APT攻擊隱蔽目標識別的總體框架如圖1所示.

圖1 隱蔽目標識別總體框架Fig.1 Overall framework for hidden target recognition

圖1中，F(xiàn)1、F2、F3分別表示操作系統(tǒng)、網(wǎng)絡設備和網(wǎng)絡設備日志.識別流程為：1)采用APT目標檔案根據(jù)屬性相關性將采集到的日志歸成上文；2)利用檢測算法整理，并對隱蔽目標相關的攻擊行為識別.

(8)

根據(jù)關聯(lián)規(guī)則對APT目標檔案數(shù)據(jù)提取，可以將不同的網(wǎng)絡安全記錄關聯(lián)起來，形式化為A′={Si′，R，W，C，G}，其中，Si′為網(wǎng)絡安全的記錄集合；R為上文的關聯(lián)規(guī)則；W為有效時間；C為攻擊的可信度；G為攻擊目標.

面向APT攻擊的網(wǎng)絡安全威脅隱蔽目標識別的步驟為：1)確定APT攻擊目標，其中有敏感、重要的數(shù)據(jù)等，構建APT攻擊目標源，G={G1，G2，G3，…}代表攻擊目標；2)根據(jù)目標節(jié)點構建APT攻擊的階段模型.

對不同來源的記錄做關聯(lián)分析，將形成上文的關聯(lián).利用上文來匹配規(guī)則數(shù)據(jù)庫，可以發(fā)現(xiàn)APT的攻擊，不同的記錄所對應不同的可信度.將所得到的不同網(wǎng)絡設備對APT攻擊的可信度做融合計算，可以獲得新的可信度，融合過程為

(9)

式中，m′i′(uk)、m′j(uk)分別為網(wǎng)絡設備i′和j對APT攻擊的可信度.利用式(9)計算證據(jù)間的相容系數(shù)，可以得到網(wǎng)絡設備i′、j對APT攻擊uk的相容度di′(uk)，即

di′(uk)=Ri′j′(uk) (i，j=1，2，…，n)

(10)

式中：Ri′j′(uk)為APT攻擊的絕對相容度；n為設備總數(shù).對APT攻擊的可信度進行更新，即

m′i′(ui′)_new=di′(uk)ωi′(ui′)

(11)

式中，ωi′(uk)為uk的權重.通過隱蔽目標識別模型的構建以及對APT攻擊的可信度計算，實現(xiàn)了對網(wǎng)絡安全威脅隱蔽目標識別，其表達式為

p=ωi′(uk)+di′(uk)+Ri′j′sup(X)+conf(X)

(12)

2 實驗結果與數(shù)據(jù)分析

為了驗證面向APT攻擊的網(wǎng)絡安全威脅隱蔽目標識別方法的有效性，設計了仿真實驗.以MATLAB軟件為仿真平臺，在軟件中搭建APT攻擊下的網(wǎng)絡實驗環(huán)境，實驗設置用戶終端主機為4臺，通過互聯(lián)網(wǎng)訪問Web服務器，此時APT攻擊端能夠針對特定目標持續(xù)性攻擊主機，威脅網(wǎng)絡安全.實驗環(huán)境如圖2所示.

圖2 實驗環(huán)境Fig.2 Experimental environment

在上述實驗環(huán)境中，根據(jù)用戶習慣攻擊目標主機，并設置每臺主機的隱蔽目標源為20個，分布在100 m×100 m空間內(nèi).

2.1 目標識別準確率測試

測試4臺主機對隱蔽目標識別的準確率，識別結果將準確識別的目標與隱蔽目標重合，顯示出來的是未準確識別的目標.準確率越高，越能擴展復雜隱蔽目標識別能力.采用文獻[5]方法為對照組，得到對比測試結果.其中，二維空間的橫縱軸分別為x、y，實驗結果如圖3所示.

分析圖3可知，4組APT攻擊下的網(wǎng)絡安全隱蔽目標識別實驗中，所提方法的隱蔽目標識別準確率遠高于文獻[5]方法的識別準確率，說明所提方法可以準確地完成對攻擊的識別，還能夠擴展復雜隱蔽目標識別能力.

圖3 不同方法的隱蔽目標識別準確率對比結果Fig.3 Comparison of accuracy for hidden target recognition with different methods

2.2 目標識別耗時情況測試

在對隱蔽目標識別準確率測試的基礎上，進一步測試隱蔽目標識別耗時情況，并與文獻[6]進行對比，對比結果如圖4所示.

在測試網(wǎng)絡安全威脅隱蔽目標識別耗時時，識別耗時越長，APT隱蔽目標識別的效率越低.分析圖4可知，所提方法的隱蔽目標識別耗時較短，說明所提方法可以高效地完成對面向APT攻擊的網(wǎng)絡安全威脅隱蔽目標識別.

圖4 不同方法的隱蔽目標識別耗時對比結果Fig.4 Comparison of time-consumption for hidden target recognition with different methods

3 結論

為了識別APT攻擊中的網(wǎng)絡隱蔽目標，提出面向APT攻擊的網(wǎng)絡安全威脅隱蔽目標識別方法.基于關聯(lián)規(guī)則構建了隱蔽APT目標識別模型，設計隱蔽目標識別總體框架，確定APT攻擊目標，求出APT攻擊可信度，利用絕對相容度更新APT的攻擊可信度，實現(xiàn)網(wǎng)絡安全威脅隱蔽目標識別.分別對隱蔽目標識別準確率和隱蔽目標識別耗時展開測試，測試結果表明，在隱蔽目標識別攻擊時，所提方法具有較高的隱蔽目標識別準確率，隱蔽目標識別耗時較短，可以準確高效地完成對面向APT攻擊的網(wǎng)絡安全威脅隱蔽目標識別.

在未來研究中，將對APT攻擊的入侵方式做出更深入的分析，進一步完善所提出的面向APT攻擊的網(wǎng)絡安全威脅隱蔽目標識別方法研究.