黃玉潔,唐作其,梁 靜
(貴州大學 計算機科學與技術學院,貴陽 550025)
信息安全風險評估是解決信息系統安全問題的有效手段,近年來已經取得一定的研究成果,其中,不僅有完善的國際標準以及符合各國國情的國家標準,還包括在標準的基礎上提出的各種評估模型、評估方法、評估體系。文獻[1]提出了一種基于攻擊防御樹和博弈論的評估方法。文獻[2]利用模糊認知圖獲取資產間關系并通過模糊認知圖推理過程計算系統風險值。文獻[3]把貝葉斯網絡和有序加權平均算子(OWA)結合應用于信息安全威脅評估模型。文獻[4]提出了基于Petri網的CPS信息安全風險評估方法。
風險評估過程是對模糊信息綜合評價的過程,因此出現了基于層次分析法[5]、層次模糊綜合法[6]、灰色綜合評價法[7]、人工神經網絡[8]、逼近理想解排序法(Technique for Order Preference by Similarity to an Ideal Solution,TOPSIS)[9]等信息安全風險評估方法。這些方法在處理模糊信息的過程中都有一定的優勢。其中,TOPSIS方法是一種決策方法,其區間數可充分利用原有信息數據,對每個評價對象進行優劣排序,為專家評估時的權威性問題提供解決方案,因此能很好地應用到信息安全風險評估領域[10]。然而實際案例中對某些取值會有一定的偏好,造成有效信息流失,最終導致評價結果出現偏差。因此,需要一種能充分利用所有信息的區間方法。國內外已有眾多學者對三參數形式的區間進行研究,如文獻[11]研究了以三參數區間數形式給出的有限方案決策問題,用3個參數區間全面覆蓋信息從而在一定程度避免信息的缺失,這類方法在文獻[12]研究下得到進一步改進。針對上述研究的不足,本文提出了將三參數區間數以及信息熵理論運用到信息安全風險評估中的方法,通過信息熵確定指標權重,并采用三參數區間得到評價權重,對權重進行分析得到風險評估結果。
國標GB/T 20984-2007[13]中規定風險評估是通過對風險資產、威脅、脆弱性的識別以及賦值,最終得到信息系統的安全保護等級。通過對國標的詳細解讀,本文在基本原理的基礎上將資產、威脅、脆弱性按照國標的內容分解到更小的指標中,具體如圖1所示。

圖1 風險分析原理
從圖1可以看出,需要從資產保密性、完整性等7個指標評估一個信息安全事件的安全風險等級。因此,風險計算公式可以表示為:
R=f(A1,A2,A3,V1,V2,V3,T1)
(1)
其中,f表示計算風險值的函數。
解決多指標評價問題有多種解決方式,比如AHP、灰色理論等,但無論是哪種方式都需要構造評價矩陣,根據評價矩陣采用某種方式綜合所有評價者的意見,分析評價矩陣計算得到最終結果,這種方式避免了單人評價帶來的人為主觀性。通常傳統型評價矩陣采用對多個單因素等級打分的形式,評估者采用單數值表達打分程度,然后采用層次分析法、熵權法等綜合計算得到各單因素的相對權重,最終求得風險等級。但這種形式忽略了評價者自身的權威性,將所有評價者等同對待,導致信息被利用不完全;同時考慮評價者在信息判定時存在模糊不確定的情況,文獻[10]提出一種新的矩陣評價形式的方法,即區間數評價矩陣。不僅考慮專家評價者的權威性,還采用區間形式表達專家對某個指標打分的不確定與模糊性,從而增加結果的準確性。
本文在上述研究基礎上提出將三參數區間數形式的評價矩陣應用到信息安全風險評估中。國標中采用5個等級表達危害嚴重程度,評估風險等級的目的是確定安全事件一旦發生可能對系統造成的危害程度,然后根據是否可接受進而采取對策和整改措施。由此可知,等級是確定相對危害程度的度量值,因此本文采用9個等級表達危害嚴重程度。一方面為了方便三參數區間表達,另一方面,1~9是人們習慣的數量表達方式。同樣采用區間的形式可表達每個等級的取值范圍。
安全事件確定以后,各專家對上述分析的7個指標進行打分,包含分值的上下限以及可能性最高的值。確定三參數區間形式的評價矩陣Z,通過矩陣確定指標的權重R以及評價者的權重W,從而確定風險事件的風險等級。
Risk=R°Z°W
(2)
其中,符號“°”表示運算法則。
最終得到的風險等級結果是三參數形式的區間數,不僅反映最終結果的區間范圍,更反映風險事件等級最可能的值,使得最終風險等級結果更明確。
定義1設r=[a,b,c]為r取值的三參數區間數形式,其中,a、c分別是區間的上限與下限,b為區間中取值概率最大的數,稱為區間重心,a≤b≤c。
定義2設r1=[a1,b1,c1],r2=[a2,b2,c2],則r1與r2之間的三維歐式距離為:
(3)
定義3設三參數形式的區間數r1=[a1,b1,c1],r2=[a2,b2,c2],其中m(r1)=(a1+c1)/2,m(r2)=(a2+c2)/2,l(r1)=c1-a1,l(r2)=c2-a2,則r1大于r2的可能性記為[12]:
(4)
定義4設A=([aA1,bA1,cA1],[aA2,bA2,cA2],…,[aAn,bAn,cAn]),B=([aB1,bB1,cB1],[aB2,bB2,cB2],…,[aBn,bBn,cBn])為2個三區間形式的向量,則向量A與向量B的關聯綜合距離為[12]:
(5)
其中,i∈(1,2,…,n),wi表示第i個評價指標權重。
在區間決策方法中,通過檢測評價對象與最優解以及最劣解之間的距離來判定評價對象的相對優劣程度。
假設有一個三參數區間評價矩陣Z:
那么,在求矩陣Z的最優解與最劣解之前需要將矩陣規范化。首先需要區分成本型指標與效益型指標,按照不同的處理方法對數據規范化。成本型指標表示評價值與指標值成反比變化,而效益型指標成正比變化[10]。
假設矩陣Z是經過規范化處理的,那么正理想解也即最優解為[12]:
(6)
負理想解也即最劣解為:
(7)
其中,ri由式(4)求得。
在決策方法TOPSIS中,通過評價矩陣與正負理想數求得兩者之間的綜合關聯度,并根據綜合關聯度對評價者的重要度進行排序即區間排序,進而確定評價者的權重。
在信息安全風險評估中,確定風險因素的相對權重通常采用層次分析法。該方法是定性與定量方法相結合的多準則決策方法,通過對指標之間進行兩兩比較,量化分析風險評估過程中各指標相對重要程度。然而這種方法對參與者的專業知識以及經驗水平都有較高的要求。除了層次分析法,信息熵也能夠應用于指標權重的確定,在一定程度上減弱人為主觀因素的影響。文獻[14-17]將信息熵理論應用到權重的確定中,表明信息熵能很好地應用于指標權重確定。
信息熵用來描述隨機事件不確定性的程度,是測量不確定性的量,根據指標變異性的大小可以確定對象的權重,具體信息熵概念如下[18]:
設信息系統處于n種不同的狀態,其中,Si表示系統處于i(i∈(1,2,…,n))種狀態下,pi表示系統處于狀態Si的概率,則信息熵記為:
(8)
指標的變異程度與信息熵成反比,與指標權重成正比。因此,信息熵越大,指標的權重值越小,具體計算如下:
(9)

(10)
采用本文方法的前提是需要對信息系統的資產、脆弱性、威脅進行統計分析,哪些威脅能利用哪些資產的脆弱性,分析三者之間的關聯關系,進而確定信息系統存在的風險事件。然后采用三參數區間數和信息熵的方式對每個風險事件進行分析,確定風險等級。信息安全風險評估的目的是根據風險評估確定信息系統中存在哪些安全事件,是否在能接受的范圍內。該方法的具體風險評估流程如下:
步驟1構建三參數區間形式的評價矩陣。
分析確定的安全風險事件,選定n個指標,請m個專家進行評價,綜合評價結果,整理統計三參數區間評價矩陣Z。
步驟2規范化矩陣。
確定各指標的類型,對其分別處理。對于成本型指標,將最大值賦值0、最小值賦值1、中間值按在[0,1]中的比例賦值,然后將區間前后互換。對于效益型指標,將最大值賦值1、最小值賦值0、中間按占[0,1]中的比值賦值。最終得到規范化的評價矩陣Z。
步驟3計算指標權重。
首先依據規范化的評價矩陣Z確定屬性j的熵值:
(11)
熵值的確定分為兩部分,分別是指標的重心點bij以及三參數形式的區間數的方差Vij。其中,ρ為決策者的判斷系數,0≤ρ≤1。
根據信息熵的理論及式(8)~式(10),確定指標權重:
(12)
步驟4確定評價矩陣的正負理想解。
由式(6)和式(7)分別確定評價矩陣Z的正理想解、負理想解。


步驟5計算評價向量與正負理想解之間的綜合距離。
由式(5),結合確定的評價矩陣的正負理想解,求得正負綜合距離:
(13)
(14)
其中,i∈(1,2,…,m),j∈(1,2,…,n)。
步驟6計算評價向量與正負理想解的貼近度。
綜合評價矩陣與正負理想解之間的綜合距離,求各評價向量與正負理想解之間的貼近度,即:
(15)
其中,i∈(1,2,…,m),j∈(1,2,…,n)。
步驟7確定評價者的相對權重。
綜合評價向量與理想解之間的貼近度,得到評價者的相對權重,即:
(16)
步驟8計算最終風險的區間形式。
通過式(2),得到風險事件三區間形式的各等級得分區間值。
步驟9分析結果,確定風險等級。
通過上述求得的風險事件的區間形式,分析得到風險事件風險發生的可能性等級。
下面以某城市應急管理系統為例展示風險值計算過程。經過分析,該系統面臨幾個風險事件,包括計算機病毒事件、蠕蟲事件、其他有害程序事件、拒絕服務攻擊事件、漏洞攻擊事件、信息丟失事件等。本文以計算機信息丟失事件E1為例,分別采用文中提到的方法與傳統二區間形式的評價矩陣對其進行風險安全等級的評估。
風險安全等級評估方法如下:
1)確定影響E1的安全等級因素
通過前文分析,這里選定資產的保密性(f1)、完整性(f2)、可用性(f3)、技術實現的難易程度(f4)、弱點的流行程度(f5)、已有安全措施(f6)、脆弱性發生的頻率(f7)作為風險因素指標。
2)構造三參數形式的評價矩陣
假設有5位行業專家,分別用p1~p5表示。請每位專家對E1的7個影響因素給出評價,綜合給出的評語建立評價矩陣,如表1所示。

表1 專家評價矩陣Z
3)規范化矩陣
通過7個指標等級高低分別對安全事件風險等級的影響進行分析,確定f1、f2、f3、f5、f7為“效益性”因素,f4、f6為“成本型”因素。依據上述評估流程講述的對于不同的因素類型采用不同的處理方式得到規范化評價矩陣Z:

4)計算指標權重
首先令ρ=0.6,計算各指標的信息熵以及指標權重,通過式(11)和式(12)計算得到結果如表2所示。

表2 指標信息熵以及權重
5)確定評價矩陣的正負理想型解
根據式(6)和式(7)計算得到評價矩陣Z的正負理想解,分別如下:
正理想型解:{[0.33,0.66,1],[0.66,1,1],[0.66,0.66,1],[0.75,0.75,1],[0.66,1,1],[0.875,0.875,1],[0.5,0.5,1]}。
負理想型解:{[0,0.33,0.66],[0,0.33,0.66],[0,0.33,0.33],[0.5,0.5,0.75],[0,0.33,0.66],[0,0.25,0.25],[0,0.25,0.5]}。
6)確定專家相對權重
根據式(13)和式(14)計算得到評價矩陣與正負理想解的綜合距離,如表3所示。

表3 評價矩陣與正負理想解的綜合距離
根據式(15)得到每個專家評價與理想矩陣的貼近度,即:
C=[0.590 9,0.453 9,0.416 8,0.388 6,0.383 8]T
根據式(16)得到專家的相對權重,即:
R=[0.264 4,0.203 1,0.186 5,0.173 9,0.171 7]T
7)確定風險事件風險
通過式(2),綜合專家權重、指標權重,得到風險安全事件E1的安全等級區間為:
Risk=[5.427,6.320,7.080]
從結果可以看出,風險事件E1的風險等級在區間[5,7]之間,且等級為6的概率相對較大,因此可以判定風險事件E1的風險等級為6。其他風險事件等級評估方式同理。
采用文獻[10]中的方法計算風險值,根據上文中評價矩陣Z,得到2個參數區間形式的評價矩陣,即:

正負理想解構造采用如下方式:
正理想型:J+={[aj,cj]|1≤j≤n},其中,aj、cj分別為第j個因素下所有專家評分的下限平均值、上限平均值。
負理想型:J-={[aj,cj]|max(|aij-J+(aj)|+|cij-J+(cj)|)},其中,1≤i≤m,1≤j≤n,aij為評價矩陣中第i個專家對第j個指標的評價。
依照上述方法得到結果為:
正理想解為:{[0.33,0.86],[0.33,0.93],[0.4,0.8],[0.35,0.85],[0.4,0.93],[0.2,0.4],[0.25,0.8]}。
負理想解為:{[0,0.66],[0,0.66],[0,0.33],[0,0.5],[0,0.66],[0.87,1],[0,0.5]}。
將評價矩陣中每個評價區間與正負理想解對比,計算得到每個區間的關聯系數:
ξ+=

ξ-=

通過關聯系數,計算關聯度以及綜合關聯度,得到專家意見的排序,即:
將綜合關聯度歸一化得到專家的相對權重,即:
R= [0.11 0.24 0.23 0.21 0.18]T
最終風險等級區間為:
Risk=R°Z°W=[5.73,7.44]
因此,可以判定安全事件E1的風險等級大于5小于7,但具體偏向哪個等級結果不確定。
通過2種不同表示方法與計算方式得到結果對比如表4所示。

表4 2種區間方法對比結果
由表4可以看出,采用一般區間形式得到的結果是區間形式的,可能性值會擴大,而三區間形式的評估結果雖然也是區間形式,但有一個最大可能的值,因此縮小了取值范圍。
本文采用三參數區間數的形式構建信息安全風險評價矩陣,分析信息熵理論得到評價指標的權重,通過決策方法TOPSIS計算評估專家的權重,結合評價矩陣給出系統安全事件的風險等級。該方法整合并充分利用評估者的全部有用信息,以減弱結果的模糊性。實驗結果表明,與一般區間形式方法相比,三參數區間形式的評估方法在確定最終風險等級時能夠縮小范圍,使得結果更準確。