吳秦鵬
(國網興平市供電公司,陜西 興平 713100)
隨著互聯網技術的廣泛普及和發展,使得日常的運營和商業交易依賴于網絡信息與數字化技術。然而其為各項服務提供便利的同時,也使得網絡空間產生安全隱患問題[1]。一方面,大多數企業在追求網絡新技術的同時,忽略新技術可能存在的網絡漏洞和網絡本身存在的脆弱性問題[2]。另一方面,當前企業缺少專業的IT 技術人員對網絡空間環境進行安全維護,對于網絡信息安全防護方面的投資沒有側重點,造成重復投資、投資過多等問題[3]。雖提出多種用以實現對網絡信息安全風險識別的方法,但現有方法部分仍然處于理論研究階段,限制著網絡信息安全風險識別發展,無法為保障網絡信息安全提供條件。在電網運行中發生的各種故障、事故影響著電網的正常運行,為促進電力生產安全性提升及可持續發展,本文將引入多尺度加權特征融合方法,開展對網絡信息安全風險識別方法的設計研究。
對網絡空間內電力安全生產過程中產生的安全風險數據進行采集和進一步的挖掘。在生產過程中可能存在的風險包括技術、管理、經濟、環境等,針對能夠充分反應各項風險的網絡信息安全風險數據,其特征分布概率密度函數可表示為
式中:p(y|α,θ)為網絡信息安全風險數據的特征分布概率密度函數;k為網絡信息安全風險數據;αk為符合異構形式特征的表達函數;pk為網絡信息的安全風險特征系數,其取值可以結合網絡信息安全風險的分布特征進行關聯性檢測;μk為分布特征。假設在網絡空間環境中存在一個節點mi,并且mi∈M,引入空間采樣技術對網絡信息安全風險預測和識別。給定網絡信息安全風險識別的統計特征集,對網絡信息傳輸信道中節點mi與其他節點在可觀測范圍內被感染的概率進行計算[4]。再結合信息跟蹤方法,構建一個網絡信道均衡調度函數,獲取網絡信息安全風險預測的統計特征量,公式為
式中:Etotal為網絡信息安全風險預測的統計特征量;α1和α2為異構特征;d1n0、d2n0為分布時間序列;為網絡信道均衡調度函數。對網絡信息安全風險的統計特征進行分析,根據特征聚類得到的結果為后續網絡信息安全風險的預測與識別提供依據[5]。
利用多尺度加權特征融合初步完成對電力安全生產風險威脅源的識別[6]。若加權特征融合系數為0,說明該子集合與該數組類別一致,計算求解出數組基尼因子,公式為
式中:Gi為數組的基尼因子;ai為網絡信息在某一節點上出現的概率;m為該節點對應的標簽序號。構建決策函數,該方法最大的限制是函數對于熵的依賴性。確定網絡信息安全風險數據的矩陣特征,若選取的屬性不是最優解,則會造成決策函數出現局部最優的情況,影響到后續識別結果的準確性[7]。在構造決策函數時,通過計算得出網絡信息的增益率,達到最佳狀態。設網絡信息安全風險特征為X,則此時X存在一個解,將分類信息設置為S,直到S的倒數接近0,電力安全生產網絡信息安全風險數據的增益值將會逐漸接近0[8]。將決策函數中的平衡因素引入算法,降低在決策函數構建過程中出現的多值偏差。
本文選擇零熵值對節點進行量化評價,計算公式為
式中:E(R)為熵值計算結果;pq為帶有決策行為的數據。將提取參數作為識別標準,歸類為網絡信息。得出熵值與電力安全生產風險指標體系中各個分類的標準熵值對比,并組成決策樹分支,給決策樹賦值。得出賦值結果后,將與其相對應的網絡信息歸類于相應的屬性類別當中,實現對網絡信息安全風險數據分類處理。
采用自適應參量融合方式,對各電力安全生產風險進行網絡信息攻擊路徑的預測。引入網絡信息攻擊路徑預測窗口函數,公式為
式中:R2TR2為窗口函數;V2為信道均衡系數。當網絡信息攻擊路徑預測窗口函數R2TR2的取值最小,提取反映網絡信息安全風險的特征量。假設網絡信息攻擊路徑內的安全風險代價函數為
式中:y(t)為安全風險代價函數;P為以實現網絡信息攻擊路徑預測的關聯維數;x(t)為完成網絡信息攻擊路徑風險評價的施加序列;τ為時間延遲。構建網絡信息攻擊路徑預測統計特征量,統計特征函數服從參數為的標準分布,得到網絡信息安全風險評價的模糊評價集為
式中:Lteff為網絡信息安全風險評價特征量;nj為自相關變量;Pjmin為網絡信息安全風險檢測負載遷移;P0min為決策變量。對網絡信息安全風險的識別,可通過應用自適應尋優學習方法,得到準確風險評價特征量,根據函數輸出的結果,實現對網絡信息安全風險的自動識別,保障電力安全生產。
將多尺度加權特征融合應用到網絡信息安全風險識別中,提出全新的識別方法。依托某電力企業,獲取其近幾年的電力安全生產數據作為實驗依據,設計對比實驗。
實驗中將基于數字技術的識別方法作為對照A組,將基于關聯規則的識別方法作為對照B 組,將上述提出的基于多尺度加權特征融合的識別方法作為實驗組。分別利用上述3 種識別方法,對同一網絡運行環境中的信息安全風險進行識別,結果如表1 所示。

表1 識別結果
根據表1,將識別時間作為其識別速度的評價指標,在被識別的數據量相同的情況下,若識別所用的時間越短,則說明識別速度越高;若識別所用的時間越長,則說明識別速度越低。將上述3 種識別方法針對每一種類型數據的識別時間進行記錄,結果如表2 所示。

表2 3 種識別方法識別數據所用時間的對比
由表2 可知,3 種識別方法識別的數據量越多,識別所用的時間越長。對比看出明顯實驗組識別的時間最短,而對照A 組和對照B 組識別方法的識別時間較長,在對IV 類型數據識別時,時間超過10 s,嚴重不符合網絡信息安全風險識別的時效性。結合本文實驗得到的結果可初步驗證,本文設計的基于多尺度加權特征融合的識別方法在實際應用中具備更高的識別速度。
為實現對3 種識別方法識別準確性的對比,選擇將真陽率(True Positive Rate,TPR)作為量化評價指標。TPR 是正確識別數據量與實際歸為該類別總量比值,利用指標可實現對3 種方法網絡信息安全風險識別準確性的比較,計算公式為
式中:TPR(i)為利用識別方法正確識別某一類信息數據的準確率;ei為某一識別方法正確識別某一類型數據的數據量;Ei為某一類別實際安全風險總量。計算得出TPR(i),其取值范圍為0 ~1。若取值越接近0,則說明該識別方法的識別準確性越低;若取值越接近1,說明該識別方法的識別準確性越高。對3 種識別方法識別結果的TPR(i)值進行統計,結果如圖1 所示。

圖1 3 種識別方法的識別結果
根據圖1 得出,實驗組針對每一種數據類型的TPR 值均最高,控制在0.9 以上;對照A 組識別方法的TPR 值較低,保持在0.6 ~0.8;對照B 組識別方法的TPR 值最低,最大值不超過0.4。表明實驗組識別方法的識別準確性最高,其次為對照A 組,最后為對照B 組。
實驗組識別方法無論是在識別速度上,還是在識別準確性上都具備更高的優勢,在實際應用中的識別性能最強,同時能夠促進電力安全生產數據利用價值的提升。
本文引入多尺度加權特征融合,提出全新安全風險識別方法,實驗證明該識別方法具有廣泛的應用條件。將該識別方法應用于實際可以有效促進網絡空間環境中數據和信息安全性的提升,同時提升電力企業部署網絡安全設備資產的安全能力,避免成為攻擊利用的突破口,為用戶提供更加安全的存儲和傳輸服務,促進信息共享,加快數字化時代的前進步伐。