胥林
(中國石油化工股份有限公司勝利油田分公司, 信息化管理中心, 山東, 東營 257000)
隨著信息技術、軟件技術和網絡技術的快速發展,政府、企業等的信息化程度越來越高,信息管理系統應用日益廣泛[1-3]。但是由于信息管理系統的開放性和網絡的不設防性,同時出現了信息安全問題,幾乎所有的信息管理系統都存在不同程度的風險,而信息系統風險評估可以幫助政府、企業的信息管理人員了解風險的變化規律,制定相應的信息系統風險控制措施,因此如何設計性能優異的信息系統風險評估模型是人們關注的焦點[4-6]。
信息系統風險的評價指標多,指標互相影響,又互相關聯,使得信息系統風險變化比較復雜[7],當前有學者提出基于多種類型的信息系統風險評估模型,得到了有效的評估結果,為降低信息系統風險做出了很大貢獻[8-10]。然在實際應用中,這些方法均存在不足,如評估誤差大、耗費時間長、工作效極率低,同時它們沒有區分指標之間差異性,假設所有指標作用相同,使得信息系統風險評估正確不高,信息系統風險評估的效率低下[11-12]。
針對當前信息系統風險評估過程中的指標選擇問題和建模方法選擇問題,為了改善信息系統風險評估效果,提出了因子分析法和RBF神經網絡相融合的信息系統風險評估模型,并進行了指標篩選,減少了指標維量,簡化RBF神經網絡的復雜度,并采用蟻群算法對RBF神經網絡進行優化,提升RBF神經網絡的學習效率,大幅度提升信息系統風險評估正確率,為信息系統風險分析和評估提供了新的研究思路。
信息系統風險與多種因素密切相關,同時多種因素會共同產生風險作用,因此信息系統風險形式十分復雜,很難有一定的規律,同時具有一定的隨機性。在進行信息系統風險變化規律建模與評估時,首先要設計科學、客觀的信息系統風險評估指標體系。本文基于科學性、可操作性、區分性、全面性的原則,設計了指標體系如表1所示。

表1 信息系統風險評估指標體系
從表1可以看出,信息系統風險評估的指標數量比較多,這些指標之間有直接相關性或者間接相關性,這些相關性以重復信息顯示,這些重復信息不僅會對信息系統風險評估產生一定的干擾,指標多,全部用于風險評估,耗長長、效率低,所以采用因子分析法對指標進行篩選,減少指標數量。設共有k個指標,指標量綱不同,使得它們的值差異比較大,影響RBF神經網絡學習時的收斂效率,為此對其進行預處理,具體如式(1):
(1)
式中,xxi表示信息系統風險評估指標的原始值,xi表示處理后的信息系統風險評估指標值。
因子分析法用m(m (2) 式中,ei表示特殊因子,fi表示公共因子,aij表示公共因子的負載。 用矩陣形式表示式(2),得到式(3), X=AF+ε (3) 其中 (4) 為了對式(3)進行求解可以將式(3)轉化為式(5): (5) (6) 根據式(6)得到指標公共因子值,從而得到風險評估指標數量[13]。 X=[x1,x2,…,xn]T為輸入向量,徑向基向量為H=[h1,h1,…,h6]T,則有式(7), (7) 式中,Cj=[cj1,cj2,…,cjn]為節點j的中心矢量,且有式(8)[14]: cji(k)=cji(k-1)+ηΔcji+α(cji(k-1)-…-cji(k-p)) (8) 式中,η為學習速率,α為動量因子,且有式(9), (9) 式中,bj為基寬參數。 網絡的權向量為W=[w1,w1,…]T,那么有式(10): (10) RBF神經網絡網絡的輸出為式(11), ym(k)=w1h1+w2h2+…+wphp (11) 將因子分析法、RBF神經網絡、蟻群算法[15]進行結合,利用它們的優勢,克服當前信息系統風險評估模型存在的不足,本文設計了一種新型的信息系統風險評估模型,具體工作過程如下。 Step1:分析信息系統的工作流程,以及變化特點,建立風險指標體系。 Step2:采集相應指標數據,并對一些錯誤的數據點進行去除,保證信息系統風險評估性能。 Step3:采用因子分析法對信息系統風險評估指標進行處理,去除一些不重要的數據,選擇最優指標,消除無用信息。 Step4:專家根據每一組信息系統風險評估指標值對每一個樣本進行打分,得到信息系統風險值。 Step5:風險值和對應的信息系統風險評估指標數據組合成樣本集合,并將它們劃分為訓練樣本和測試樣本。 Step6:采用信息系統風險評估的訓練樣本訓練RBF神經網絡,通過蟻群算法優化RBF神經網絡的相關參數。 Step7:根據相關參數建立信息系統風險評估模型,流程如圖1所示。 為了分析本文設計的信息系統風險評估的有效性和優越性,收集一個信息系統風險變化的歷史值,同時采集表1中的信息系統風險評估指標的數據,信息系統風險的歷史數據如圖2所示。對圖2的信息系統風險的歷史數據進行分析可以發現,不同時間點,該信息系統風險值之間有一定的相似性,但是有的信息系統風險值差別比較大,具有很強的非平穩性,采用MATLAB工具箱編程實現信息系統風險的仿真實驗。 圖1 因子分析和神經網絡的信息系統風險評估流程 圖2 信息系統風險的歷史數據變化趨勢 采用因子分析法對指標進行分析,得到指標累積貢獻率如圖3所示。從圖3的信息系統風險評估指標的累積貢獻率可以發現,前8個因子的累積貢獻率就超過了95%,這表明前8個因子就可以代表原始信息系統風險評估指標,可以去掉其它對信息系統風險評估結果影響不明顯的因子。 圖3 信息系統風險評估指標的累積貢獻率 為驗證使因子分析法和神經網絡的信息系統風險評估結果具有可比性,采用神經網絡、層次分析法作為對比方法,為避免信息系統風險評估結果的隨機性,選擇不同數量的訓練樣本進行信息系統風險評估測試,評估正確率如圖4所示。從圖4可知,隨著訓練樣本數量的增加,信息系統風險評估正確率不斷的提升,這是因為訓練樣本數量越多,信息系統風險評估建模更加充分,在相同訓練樣本數量條件下,本文模型的信息系統風險評估正確率要高于對比方法,可以更好地描述信息系統風險變化規律。 圖4 3種模型的信息系統風險評估正確率對比 為了更好地描述信息系統風險評估的實時性,選取訓練樣本和測試樣本數量為1∶1的條件下,3種模型的信息系統風險評估訓練和測試時間如圖5所示。從圖5可以發現,本文模型的信息系統風險評估訓練和測試時間要少于對比模型,提高了信息系統風險評估速度。 圖5 3種模型的訓練和測試時間對比 當信息系統風險評估的指標比較多時,指標間信息重復度大,重復信息干擾了評估結果,為了更加準確描述信息系統風險的變化特點,提出了因子分析和神經網絡的信息系統風險評估模型,并通過具體仿真測試得到了如下結論。 (1) 采用因子分析方法選擇對信息系統風險評估作用大的評估指標,可以降低RBF神經網絡的輸入層節點數量,簡化RBF神經網絡的結構,能夠提高信息系統風險評估效率。 (2) RBF神經網絡擬合信息系統風險變化趨勢,可以建立正確率高的信息系統風險評估模型。 (3) 通過與其它信息系統風險評估模型進行比較測試可以知道,本文模型的信息系統風險評估正確率更高,降低了信息系統風險評估誤差而且信息系統風險評估速度更快,具有十分明顯的優越性。
1.3 RBF神經網絡
1.4 信息系統風險評估模型具體設計
2 因子分析和神經網絡的信息系統風險評估模型的性能驗證實驗
2.1 實驗數據


2.2 因子分析法對信息系統風險評估處理的結果

2.3 不同模型的信息系統風險評估正確率和建模效率對比


3 總結