顧兆軍,辛 倩+
(1.中國民航大學 信息安全測評中心,天津 300300;2.中國民航大學 計算機科學與技術學院,天津 300300)
信息系統安全評估方法主要分為定性評估、定量評估和綜合評估。由于信息系統的安全因素難以量化,大多數學者采用層次分析法、熵權法、模糊理論、故障樹等[1-4]定性與定量相結合的綜合評估方法建立信息系統安全評估模型,但計算復雜、評估結果受主觀因素影響較大,且無法解決非線性問題。為避免這些缺陷,國內外學者采用DS證據理論、支持向量機、神經網絡、貝葉斯網絡等[5-7]人工智能算法構建信息系統安全評估模型,取得了較好的評估結果。de Gusm?o A P H等[8]將事件樹與模糊理論相結合,但在確定事件發生時沒有統一的方法,導致不同方法設置事件發生的概率不同;趙剛等[9]使用熵權法計算指標權重,使模糊合成中的權重更加客觀,但是當信息系統有較多互相關聯的安全因素時,缺乏學習和自適應能力;馬麗儀等[10]采用模糊神經網絡評估信息系統的安全風險,將風險因子進行模糊化后輸入到神經網絡訓練,提高了神經網絡對模糊性的識別能力,但隸屬度矩陣和權重均采用專家評判,客觀性較差,在一定程度上影響整個模型的實用性;趙保華[11]采用層次分析法賦予指標權重,但由于信息系統安全指標較多,導致計算量大,且容易出現殘缺判斷矩陣。
為了進一步提高評估的準確性,針對當前信息系統安全影響因素較多、且各因素之間相互關聯等特點,本文提出了熵權法優化BP神經網絡(back-propagation neural network)的信息系統安全評估模型(熵權-BP),并通過具體實例對熵權-BP信息系統安全評估模型的性能進行檢驗。
信息系統安全評估是非常復雜的過程,影響信息系統安全的因素很多,各因素之間又相互關聯,使得安全因素與信息系統安全評估結果之間呈現出一種復雜的非線性關系。信息系統安全評估模型可以表示為
Y=f(x1,x2,…,xn)
(1)
式中:Y是信息系統安全評估結果,xi表示信息系統的安全影響因素,f()為非線性函數,所以信息系統安全評估結果的準確性與安全因素的選取以及非線性函數f()直接相關。本文根據等保測評要求構建評估指標體系,選擇熵權法對評估指標進行重構,并采用具有高度非線性映射能力的BP神經網絡建立信息系統安全評估模型,熵權-BP安全評估流程如圖1所示。

圖1 熵權-BP安全評估流程
評估信息系統的安全狀況首先是構建評估指標,即安全影響因素。安全影響因素的選取是否科學合理,直接影響評估結果的真實性。本文根據《信息安全技術 信息系統安全等級保護測評要求》[12],從技術和管理兩大層面構建了層次結構的信息系統安全評估指標體系,如圖2所示。其中技術層面包括物理安全、網絡安全和運行安全,管理層面包括制度、機構、人員、建設和運維安全管理。

圖2 信息系統安全評估指標體系
由于影響信息系統安全的因素眾多,必然存在對評估結果無影響的因素,為避免無用信息對BP神經絡學習過程的干擾,應提取重要指標作為BP神經網絡的輸入向量。在對信息系統安全評估時,通常用權重來表示指標的重要性。熵權法屬于客觀賦權法,通過實際數據利用嚴謹的數學理論得到較為客觀的指標權重,避免了主觀方法確定權重的嚴重缺陷,使指標權重更具有科學性和說服力。
信息論中的熵值反映了信息的無序化程度,可用來度量數據所提供信息量的大小。當某項指標在不同系統的變異度越大時,熵值越小,說明該指標傳遞的有效信息量就越大,在綜合評估中起的作用就越大,則該指標的權重也應該越大;反之某項指標的變異度越小,該指標的權重也應越小。因此,本文利用同一評估指標在不同信息系統的變異度,通過信息熵計算得到各指標的權重。
2.2.1 構建評估指標矩陣
利用已完成安全測評的m個信息系統與其n個評估指標形成評估指標矩陣R=(rij)nm
(2)
式中:rij(i=1,2,…,n;j=1,2,…,m) 為第j個信息系統的第i個指標的實際評估結果。
2.2.2 指標權重計算
(1)根據指標矩陣R,計算第i個指標下第j個信息系統的指標值的比重pij
(3)
(2)計算第i個指標的熵權ei
(4)
(3)用lnm對各指標的熵權進行歸一化處理
(5)
(4)引入差異系數1-ei來正向度量指標i的熵權,得到指標i的權重
(6)
BP神經網絡即誤差反向傳播神經網絡,具有較強的自學習和自適應能力,目前被廣泛用在綜合評估領域。由于信息系統安全因素較多,且因素之間相互關聯,為了避免BP神經網絡在學習過程中陷入過擬合,采用熵權法得到評估指標權重,提取出重要指標并將其輸入到BP神經網絡中,從而提高評估指標的質量,消除無用指標對BP神經網絡學習內部知識的干擾。熵權-BP神經網絡結構如圖3所示。

圖3 熵權-BP神經網絡結構
圖中u表示指標體系的所有評估指標,x表示重要評估指標,y表示隱含層神經元的輸出,z表示輸出層神經元的網絡輸出值。wij和wj分別為傳遞層到隱含層與隱含層到輸出層之間的連接權值。l、n和m分別比為輸入層、傳遞層和隱含層神經元的個數。
參照上圖,熵權-BP神經網絡建模過程:
步驟1 第1層為輸入層,其神經元的個數為評估指標體系中的19個指標;
步驟2 第2層為指標提取層,通過構造指標矩陣利用信息熵計算第1層各指標的權重,并提取出重要指標;
步驟3 第3層為傳遞層,將第2層選取出重要指標傳遞到BP神經網絡中;
步驟4 第4層為隱含層,主要處理評估指標到評估結果間的非線性映射,隱含層神經元個數的選取是BP神經網絡建模成功的關鍵,借助經驗公式
(7)
式中:n表示傳遞層神經元個數,β∈[1,10]的常數。
步驟5 第5層是輸出層,根據實際需要只設定一個神經元,代表信息系統安全評估結果。
此時,熵權-BP神經網絡結構的構建已完成,接下里就是第3層到第4層之間與第4層到第5層之間權值的學習過程。

BP神經網絡學習過程:
(1)隨機初始化BP神經網絡所有的權值和閾值;
(2)BP神經網絡正向傳遞信號,傳遞層到隱含層神經元樣本p的計算公式
(8)
隱含層到輸出層神經元樣本p的計算公式
(9)
神經元作用函數為
(10)
式中:θj表示隱含層神經元j(j=1,2,…,m) 的閾值,θ表示輸出層神經元的閾值;
(3)使用α-η聯合算法反向修正權值和閾值;
傳遞層到隱含層以及隱含層到輸出層之間的連接權值修正
(11)
隱含層和輸出層的閾值修正
(12)
其中,δ和δj為誤差項,輸出層和隱含層神經元誤差項
(13)
式中:f′表示對f求導,η∈(0,1)為學習速率,加快網絡的收斂速度;α∈(0,1)為動量因子,避免BP網絡陷入局部最優。
(4)h組樣本擬合誤差函數為
ΔE=E(t+1)-E(t)
(14)
(15)
ΔE<ε
(16)
其中,ε為誤差精度,滿足(0≤ε<1),當網絡誤差達到誤差要求或者達到學習的最大次數T(t≤T),BP網絡學習過程結束,否則轉向步驟(2),繼續學習直到滿足條件為止。
本文收集民航已完成安全測評的30個信息系統作為樣本數據。由于評估指標單位不同,對評估指標用最大最小法歸一化處理
(17)
式中:ui為第i個評估指標的值,uimin和uimax分別為ui的最小值和最大值。
信息系統安全評估指標歸一化后得到新數據,見表1。選擇前22個作為熵權-BP模型的訓練樣本,其余作為測試樣本,用于檢驗熵權-BP模型的安全評估效果。

表1 信息系統安全評估數據
(1)使用已完成安全測評的30組指標數據形成一個指標矩陣R,即
(2)通過2.2.2節的計算步驟,得出各指標的權重
W=(0.17,0.008,0.006,0.24,0.02,0.03,0.03,0.039,0.04,0.1,0.17,0.09,0.01,0.01,0.02,0.035,0.05,0.08,0.06)
對評估指標權重進行排序,經驗證改變權重小于0.05指標的取值對整個評估結果沒有影響,可以作為數據噪聲將其剔除,剩下8個重要指標
W′=(0.24,0.17,0.17,0.1,0.09,0.08,0.06,0.05)
8個重要指標分別為網絡設備安全、物理設備安全、應用軟件安全、終端設備安全、數據庫安全、人員安全管理、運維安全管理和建設安全管理。
將重要指標輸入到BP模型中進行訓練,BP神經網絡的學習率η為0.5,動量因子α為0.85,最大學習次數T為6000,預設誤差ε為0.001,根據經驗公式得到隱含層神經元個數為6個。為了對比,同時對熵權-BP模型和BP模型兩個模型進行訓練,其訓練過程如圖4所示。

圖4 BP神經網絡訓練過程
由圖4可知,在相同學習目標下,以重要指標數據為輸入的BP模型的訓練次數明顯比以原始指標數據為輸入的BP神經網絡模型的訓練次數少。
訓練結果表明,熵權-BP模型通過對重構后的8個重要評估指標數據進行訓練,既保留了重要指標的特征,又減少了無用指標對BP神經網絡學習的干擾,可以提高BP神經網絡的訓練速度。
為了檢驗熵權-BP模型的評估結果,將測試樣本分別輸入到BPNN、AHP-BP和熵權-BP模型中進行安全評估。評估結果和評估精度分析結果分別如圖5和表2所示。

圖5 各模型的網絡輸出值和期望值之間的對比

模型評估精度/%BPNN86.72AHP-BP91.39熵權-BP96.41
從圖5與表2可知,組合的熵權-BP和AHP-BP模型的評估精度高于單一BPNN模型的評估精度,因為這兩種組合模型都對評估指標進行了重構,提取出重要指標,使得BP神經網絡在反向傳播過程中更加逼近真實權值;熵權-BP模型的評估精度高于AHP-BP模型的評估精度,因為熵權-BP模型通過樣本數據計算得到指標的權重更加客觀、真實地反映評估指標的權重,而AHP-BP模型通過專家構造判斷矩陣計算指標權重,指標的權重受主觀因素影響較大,可能會錯誤刪除重要指標??傊?,熵權-BP模型優于其它兩種模型,利用其進行信息系統安全評估是可行的。
信息系統的安全狀況受眾多因素影響、且因素之間相互關聯。BP神經網絡模型訓練速度慢且容易出現過擬合現象,為了提高評估結果的精度,本文構建了熵權神經網絡的信息系統安全評估模型。采用熵權法提取出重要指標作為BP模型的輸入,消除無用指標的干擾,提高模型的訓練速度,同時具有高度非線性處理能力的BP神經網絡能有效解決各因素之間的關聯性,彌補傳統數學評估方法無法處理非線性關系的不足。但安全指標體系的構建還存在缺點,本文只是從等保測評要求中選取了具有代表性的幾大類安全影響因素,而每類因素還包括許多具體的因子,不同安全等級的信息系統每個安全因素的具體因子會有些許不同。后續需要結合實際情況對各類因素進行細分,使評估結果能夠為系統管理員提供更有效的參考依據。