李曉婷 包景嶺 孫建廣 汪冀



摘? 要: 針對傳統信息風險評估系統設計評估準確度較低的問題,設計基于因子分析和神經網絡的信息風險評估系統。該系統設計在原有硬件構成的基礎上,將微處理器與控制器相連接,形成管控中心,利用寄存器組、直接存儲器、定時器等構成控制器群組,構成新的評估系統組織結構?;谝蜃臃治鲈O置信號連續采集和定時采集程序,確定神經網絡中信號所處位置節點,計算評估差異參數,對信息進行風險評估等價劃分,至此該系統設計完成。實驗結果表明,在微型處理器的管控下,設計的信息風險評估系統評估準確度比傳統設計高出6.44%,符合實際需求。
關鍵詞: 信息風險評估系統; 因子分析; 神經網絡; 系統設計; 信息采集; 仿真實驗
中圖分類號: TN915?34; TP309? ? ? ? ? ? ? ? ?文獻標識碼: A? ? ? ? ? ? ? ? ? ? ? ? 文章編號: 1004?373X(2020)04?0123?04
Design of information risk assessment system based on factor analysis and neural network
LI Xiaoting1, BAO Jingling2, SUN Jianguang3, WANG Ji4
(1.Hebei University of Technology, Tianjin 300130, China; 2. Tianjin Environmental Protection Agency, Tianjin 300130, China;
3. School of Mechanical Engineering, Hebei University of Technology, Tianjin 300130, China;
4. Eighteenth Institute of China Electronics Technology Group Company, Tianjin 300130, China)
Abstract: As the low evaluation accuracy of the traditional information risk assessment system, an information risk assessment system based on factor analysis and neural network is designed. On the basis of the original hardware composition, the microprocessor and the controller are connected in the system design to form the control center, and the register group, the direct memory, the timer and so on are applied to compose the controller group, and the organization structure of the new evaluation system is established. The programs of the signal consecutive acquisition and timed acquisition are set up based on the factor analysis, so as to determine the signal location node in the neural network, calculate and evaluate the difference parameters, and conduct the equivalent division of risk assessment for the information. Thus, the system design is completed. The experimental results show that, under the control of microprocessor, the evaluation accuracy of the designed information risk assessment system is 6.44% higher than that of the traditional design, which is in line with the actual requirements.
Keywords: information risk assessment system; factor analysis; neural network; system design; information collection; simulation experiment
0? 引? 言
隨著社會的進步,網絡被廣泛應用,使網絡信息交換增加,給網絡信息安全帶來一定風險[1]。因子分析是將變量群中的因子進行共性分類,將一定規律的因子進行統計。因子分析可以在大量的變量數據中找出具有代表性的隱藏因子,并將同類、同屬性或者同本質的變量歸集成一個因子,通過減少因子數量,快速進行數據分析[2]。神經網絡是將行為進行特征提取,從而進行分布式并行信息處理的計算模型。該網絡依賴于復雜的系統,通過調節大范圍內節點之間連接關系,實現信息處理。因此,針對傳統風險評估系統設計結構單一、評估準確率不高等問題,設計基于因子分析和神經網絡的信息風險評估系統。利用該系統對網絡中的信息風險程度進行精確評估,根據評估結果設計規避風險的運行程序,保證國家網絡信息在信息源頭、信息傳輸途中以及接收信息端的安全,為國家的發展提供強有力的技術支持。
1? 系統硬件設計
本文設計基于因子分析和神經網絡[3]的信息風險評估系統,其系統硬件設計構成如圖1所示。
針對因子分析和神經網絡的多樣性,設計信息風險評估系統中的微處理器。該處理器型號[4]為S3C2416XH?40,內核為ARM926EJ,主頻高達400 MHz。ARM926EJ內核采用5級流水線,由ARM7TDMI、儲存單元、高速緩存單元組成[5]。其中,儲存單元可以對虛擬內存進行管理;緩存單元由16 KB指令和16 KB數據緩存構成,且具有8字行長度。ARM926EJ中含有2個內部處理器,分別為C14,C15。2個內部處理器的作用分別是進行調試控制、系統儲存控制和測試控制。S3C2416XH?40處理器的內部結構如圖2所示。
該微型處理器內部選用新型總線體系結構,這一結構中包含外圍總線以及系統總線,利用橋接器將其與控制器相連接。S3C2416XH?40處理器的集成功能十分強大,主要包括:1.8 V內核供電,3.3 V儲存模塊供電;LCD支持觸摸屏顯示主板;4通道的直接存儲存取器,3通道的異步收發傳輸器,2通道的外圍接口,1通道的多主機總線,1通道的總線控制器;2通道的主機接口,1通道的設備接口,同時還包含4通道的定時器以及1個看門狗定時器。該處理器含有117個輸入與輸出端口,24個中斷源,支持空閑、慢速、勻速和掉電4種工作模式,最大轉換速率為550 KSPS,支持片上采集保持[6]。
S3C2416XH?40處理器利用LCD控制器控制顯示信號。該控制器由寄存器組、LCDCDMA直接存取器、VIDPRCS、定時器以及LPC3532構成。
2? 系統軟件設計
因子分析是對組成成分進行發展及推廣,將關系繁雜的變量整合,提取出其中具有代表性幾個因子,找出變量與因子之間的相互關系,同時對變量分類,找尋變量之間的相關性[7]。
設置一個信息采集程序,對連續信號進行采樣,利用微處理器讀取離散化信號,并將其進行處理。為了避免誤差過大,在進行信號采集時,按照信號的波動頻率[8]進行范圍定位,該頻率計算公式為:
[η=-T2T2f2tatdt]? ?(1)
式中:[T]為反應時間;[a]為離散系數;[t]為離散時間;[f2t]為網絡瞬時信號采集速率函數。此公式對樣本采集頻率進行設置。根據采樣定理可知,由于實際網絡信號中帶有高頻噪聲,因此設置的樣本采集頻率要超出信號自身最大頻率的2倍。
連續性采集方法,該方法在滿足上述條件的基礎上,通過微處理器用最大樣本采集頻率,對信號進行連續采樣以及A/D轉換,當樣本點數達到預設值時采樣結束。在主控程序中,對S3C2416XH?40進行重置,同時對總線時鐘和數據總線寬度也進行設置,初始化各個端口和串口,采取中斷觸發作為上升沿觸發方式并設置中斷向量,打開Eint1中斷等。在處理器中對轉換后的結果加1個采樣點數,判斷此時的點數是否達到了預設的定值。當沒有達到時,返回等待再次中斷,直至采樣點數達到預設目標[9]。
在連續采集的基礎上,信息風險評估系統還要對網絡信息進行處理,根據實際信號的頻率范圍,計算可變采樣頻率進行定時信息數據采集。主控程序的初始化設置與連續采集大致相似,設置一個時間段作為采樣周期,啟動定時器等待轉換后的數據信息。當設定的采樣周期結束后,進入中斷程序,同樣將轉換結果點數加1,然后退出中斷程序,直至采樣點數達到預設定值。該信息采集流程如圖3所示。
信息數據采集完成后,基于神經網絡設置信息風險評估系統結構,先進行網絡層數確定。由于當前的神經網絡為了提高處理非線性問題的能力,包含多個隱藏的網絡層,致使其結構復雜,網絡層數龐大,因此明確神經網絡的層數至關重要。同時利用 “試湊法”明確神經網絡中隱藏層的節點數量,神經元個數,以此確定評估范圍[10]。
在此基礎上,設計信息風險評估系統。該系統主要利用云模型進行風險評價,根據式(1)的計算結果,該模型的計算表達式:
[T=η?Ex1En1W1+Ex2En2W2+…+ExnEnnWnEn1W1+En2W2+…+EnnWn] (2)
式中:[Ex]表示計算云核心,為模糊概念下的樣本數據中心值;[En]表示定性概念的不確定表達,該值增大時,表示所能接收的能力就越強,隨機性能也隨之提高;[W]表示一個信息因素的影響權重;[n]為信息數量。據此設置信息風險評估算法。構建指標集合為[M1,M2,…,Mn],并設置評價集合為[Vn],該集合表示網絡信息風險等級。對信號進行低、中、高評估數據描述,當數據滿足其中一個等級時,判定其風險嚴重程度。
利用Visual Studio 作為該系統的使用環境,該程序語言的核心代碼如下:
#include "math.h"
main()
{
int m,i,k,h=0,leap=1
print("\n")
for(m=低;m=中;m=高;m++)
{k=sqrt(m+1)
if(m++=0)
{leap=0;back}
if(leap) {print(h);h++}
}
print("\n the total",h)
}
利用C++設置好程序代碼后,將每一采樣周期中的數據執行信號風險評估口令,得到風險參數數據,通過提取風險參數特征,將信息風險進行評估,劃分其風險等級。具體步驟如下:
將風險參數進行因子分析,設置成統一特征的參數組并進行統計,計算每一組之間的參數差異,差異相似或差異較小的為同一組別。假設有[A]個參數組,一共存在[An]個參數差異,根據式(2)得到每一參數差異的計算公式為: