申曉杰,廖 華,李 闖,潘 鵬,李更達
(中國南方電網 超高壓輸電公司 南寧監控中心,廣西 南寧 530025)
隨著“智慧電網”的建設和發展,數字化通信、自動化控制、智能傳感器等新型智能信息化系統也不斷出現在電力行業,傳統電力系統中的發變電、配輸電等各個環節也需要得到進化和升級[1]。通過智能化設備和數字化控制技術將電氣電子設備和各級用戶聯系起來構成智慧電網,能夠保證電力系統大大提升電能利用效率和能源轉化效率,極大地保證了電力系統的供電質量和安全可靠性[2-3]。
電力監控防護系統能夠在電網的安全運維中時刻監視并控制電力系統和電網線路,是智慧電網最重要、最關鍵的核心環節之一。在電力系統的發變電和配輸電過程中,電力監控防護系統能夠更加靈活、平穩和高效地監控電力設備工作狀態。2003年,美國和加拿大出現大面積電力癱瘓,經濟生活受到了嚴重影響。究其原因,是因為電力系統預警提示過程出現了嚴重故障,導致電力監控防護系統不能及時處理。2015年,網絡黑客對烏克蘭的電力監控防護系統進行瘋狂攻擊后,造成了境內大規模電力癱瘓。2019年,網絡黑客對委內瑞拉的電力監控防護系統進行攻擊,最終導致國內出現了大規模停電,嚴重威脅國家安全。所以,當前智慧電網的建設和運維面臨的最大問題是如何能保證電力監控防護系統的安全穩定運行[4-5]。
安全防護方案的關鍵在于實時感知電力監控防護系統的安全態勢。從一個角度來說,常規的安全防護屏障主要設置在網絡系統外部,檢測外部惡意攻擊;而電力監控防護系統在保證感知外部攻擊的同時,還能敏銳察覺來自系統內部漏報的危險和攻擊[6-8]。從另一個角度來說,風險或者攻擊來臨時,如果能夠提前感知異常信號,并做出相應措施,將大大提高安全監控防護系統的準確率和可靠性。因此,實時監控智慧電網和智能電力系統的運行狀態,準確捕捉電力通訊網絡和電力數據系統的異常信號,在構建智慧電網過程中具有重要研究價值。
該文構建了電力監控防護系統安全識別指標體系;構建了基于SVR的安全態勢識別模型;構建了基于GRU的安全態勢預測模型,三個研究點之間關系如圖1所示。去除冗雜安全因素,構建電力監控防護系統安全識別指標體系;基于安全識別指標體系,構建電力監控防護系統安全態勢識別模型;基于安全識別數據和歷史數據,構建電力監控防護系統安全態勢預測模型;設計并實現電力監控防護系統安全態勢識別與預測系統。該研究為電力監控防護系統的安全運維提供重要參考,為構建智慧電網提供了技術支撐。

圖1 研究體系框架
首先,基于支持向量機的遞歸特征消除(SVM-RFE)技術分析了電力監控防護系統中所有安全識別指標的相關性;然后,采用皮爾森相關系數(Pearson)對所有指標之間的冗雜度,去除冗雜特征;最后,構建了最優特征子集目標函數篩選出最優指標集,并建立了電力監控防護系統安全識別指標體系。
該文采用支持向量機(Support Vector Machine,SVM)分類算法將數據分為兩類,并分別貼上標簽secure和danger。通過人工技術對原始樣本數據標注為yi,構成訓練集T:
(1)
在此設定第i條樣本數據為Ti(i∈[1,m]),類別標簽為yi∈{1,-1},樣本數據的評估指標維度為n,第i條樣本數據的第j個評估指標數值為xij,最后將電力監控防護系統的運行狀態定義為安全(secure:1)和不安全(danger:-1)。同時,對于運行狀態的樣本數據定義為x,f(x)是分類決策函數,是對樣本數據x的分類結果,表達式如式(2)所示。式中的αi和b分別為通過訓練得到的拉格朗日乘子和位移,sgn()是符號函數。通過SVM模型訓練樣本數據T,第j個向量ω的指標權重可表達為式(3):
(2)
(3)
通過SVM-RFE進行序列后向選擇(SBS)。對于包含所有安全指標的集合S,逐個去除對模型分類結果影響最小的安全指標x,直到獲得指標相關性排序。特征與模型分類的相關性強度與評價分數cj呈正相關,第j個安全指標的權重系數為ωj,則剔除最小影響的安全指標x可以通過權重平方表達式計算:

(4)
通過SVM-RFE篩除部分冗雜指標之后,安全指標之間仍然會存在識別效果相近的線性冗雜指標,因此,該文采用皮爾森相關系數(Pearson)對冗雜指標的線性相關性進行分析,并進一步剔除冗雜安全指標[9]。Pearson相關系數取值范圍為(-1,0),其絕對值與兩個指標相關度呈正相關,絕對值越大,冗雜度越大,則公式如下:
(5)

通過對電力監控防護系統的所有安全指標進行篩選,再篩選剩下的安全指標構建最優指標子集,最后構成最優安全識別指標體系[10]。該文利用適應函數同時考慮分類準確率和特征子集的豐富度,函數值越大,指標集越優,適應函數表達式為:
(6)
式中,Q是電力監控防護系統的全部安全指標集合,S為剔除冗雜安全指標后進行相關性排序的子集,|S|和|Q|分別為指標集S和Q的指標數量,P(S)為對指標集S進行訓練后的模型分類準確率,P(S)與|S|和|Q|之間的權重因子由μ表示,μ∈[0,1]。
該文共選用35個安全狀態指標構建安全狀態候選指標集,其中包括20個流量特征候選指標和15個設備運行候選指標。模擬網絡對相同設備進行攻擊,計算、統計并提取指標數據,以3 s為間隔獲取設備運行時的400個樣本數據。構建四個安全指標體系對該方法進行驗證。指標體系A:包含所有指標;指標體系B:剔除了大冗余度指標;指標體系C:對指標集進行相關性排序,構成最優特征子集;指標體系D:根據該方法,對剔除冗雜指標的指標集進行相關性排序,構成最優特征子集。通過對四個指標體系進行相應的SVM模型訓練,并基于secure和danger數據樣本以2∶3的比例構成測試集,以驗證SVM分類模型的準確性。
依據文中方法,首先對安全指標進行相關性排序,通過選擇得到了表1的剔除前最優指標集(第1列),剔除了最優指標集中的冗雜指標后,得到了表1的剔除后最優指標集(第2列)。分析表1可知,剔除后的最優指標集較之前缺少了指標retr_counts,這是因為retr_counts和SYN_pkts的冗雜度為0.764,同時retr_counts的相關性較低,因此retr_counts被剔除。對四個指標體系的分類結果進行分析,結果如圖2所示。分析圖2可知,基于SVM的分類準確率從高到低排列為:體系D>體系C>體系B>體系A。因此,剔除冗雜度較大的安全指標可以提高分類準確率(B>A),剔除相關性較小的安全指標也可以提高分類準確率(C>B)。同時,由于體系C不僅剔除了相關性較小的安全指標,也剔除了部分冗雜度較小的安全指標,而體系D同時剔除了相關性較小、冗雜度較大的安全指標,造成分類準確率低于體系D的實驗結果(D>C)。所以,該文構建的最優安全指標集滿足了電力監控防護系統的感知需求。

表1 剔除前后最優指標集構建結果

圖2 四種指標體系實驗結果對比
支持向量回歸(Support Vector Regression,SVR)在面對小樣本、非線性和高維度的實際問題上可以保持優秀的泛化能力,準確識別電力監控防護系統的運行狀態[11]。通過前文得到了m個識別指標的最優安全指標集I(i1,i2,…,im),第i條樣本數據的輸入向量為xi,樣本記錄為Ti(i∈[1,n]),樣本標簽為yi,并構建訓練數據集T:
(7)
在此定義一個函數φ(x)實現輸入空間到高維希爾伯特空間的非線性映射,并且w和b分別為權向量和位移,則高維特征空間的線性回歸函數為:
y=f(x)=wφ(x)+b
(8)
定義變量ε為f(x)與y的最大偏差,損失函數為:
L(f(x),y,ε)=

(9)
因此,該問題可轉化為:
(10)

(i=1,2,…,n)
(11)

(12)
通過上式可對w和b進行求解:
(13)
得到最終的SVR模型:
y=f(x)=wφ(x)+b=
(14)
核函數K(xi,xj)的選擇決定了是否能夠將線性不可分問題轉化為可分問題[13]。高斯徑向基核函數(RBF)能夠在參數少和線性不可分的情況下體現良好的性能,因此選擇RBF作為SVR預測模型的核函數:
(15)
安全態勢的計算前提需要對設備權重w進行賦值dv,第i個設備重要性賦值dvi:
(16)
通過SVR模型識別的第i個設備安全態勢值為yi,則電力監控防護系統的安全態勢值PSS可以通過下式計算:
(17)
為驗證基于SVR構建的安全態勢識別模型的有效性,該文模擬了惡意攻擊,將900個數據樣本以3∶1的比例構建訓練集和測試集。同時,利用粒子群尋優算法(PSO)將最優算法參數定義為:C=83.54,σ=6.67,ε=0.01。對SVR識別模型和BPNN識別模型進行對比分析,實驗結果如圖3和圖4所示。

圖3 模型識別結果對比

圖4 模型實驗結果對比
分析圖3可知,BPNN識別模型的安全態勢識別值和實際值差值波動較大,明顯高于SVR識別模型。這表明SVR識別模型具有更高的識別準確率,并且具有更加穩定的識別效果。分析圖4可知,SVR模型的評估值與實際值誤差絕對值為0、1、2的樣本數量明顯多于BPNN模型,而隨著誤差絕對值越來越大,SVR模型的樣本個數明顯少于BPNN模型。SVR模型的識別精度整體優于BPNN模型。對SVR模型和BPNN模型進一步進行對比,結果如表2。分析表2可知,相較于BPNN模型,SVR模型在RMSE上降低了43.60%,在MAPE上降低了70.23%。這說明,所構建的SVR安全態勢識別模型具有更好的識別能力和模型準確率。對比SVR和BPNN兩個識別模型可知,SVR模型能夠在樣本數量少的情況下保證較高的泛化能力,準確識別未知數據,能夠在降低訓練成本的前提下保證攻擊樣本的類型和壓力。而BPNN往往需要進行大量訓練和參數尋優,如果初始化參數取值不當,BPNN模型容易出現陷入局部最優的情況。同時,BPNN需要構建樣本大、維度高的訓練數據集,面對小樣本的情況還會出現過擬合現象。

表2 模型識別結果對比

(18)
(1)定義神經元輸入為xt,Wz和Uz分別為輸入層到隱藏層、上一個狀態到當前狀態的更新門權重,設置激活函數為sigmoid,矩陣拼接表達為+,更新門zt的表達式為:
(19)

(20)
(3)定義神經元輸入為xt,Wr和Ur分別為輸入層到隱藏層、上一個狀態到當前狀態的重置門權重,設置激活函數為sigmoid,矩陣拼接表達為+,重置門rt的表達式為:
rt=σ(Wrxt+Urht-1)
(21)
為保證預測模型的準確率,同樣采用sigmoid函數作為GRU隱藏層的激活函數。由于函數能夠在處理非線性問題的時候保證較快的收斂速度和較好的處理效果,不會出現梯度消失的問題[16],因此,采用leaky_ReLU函數作為GRU全連接層的激活函數:

(22)
設定損失值為loss,定義yi和ytrue為第i個樣本的模型預測值和實際值,損失函數為:
(23)
該文對比分析了三種模型在進行安全態勢預測的模型預測精度,分別為:徑向基函數(RBF)預測模型[17]、SVR預測模型和該文設計的GRU預測模型,其中RBF神經網絡模型是一種單隱層的三層前饋網絡,采用的是改進布谷鳥搜索法對RBF模型進行優化,并引入了動態發現概率和模擬退火。采用RMSE和MAPE對三種預測模型進行對比分析,結果如表3所示。分析表3可知,設計的GRU預測模型相較于RBF模型和SVR模型的均方差誤差(RMSE)分別降低了19.23%和23.56%,平均絕對百分比誤差(MAPE)降低了48.33%和58.73%。對比三者實驗結果可知,GRU具有更擅長執行時間序列的學習能力,在安全態勢預測上具有更高的預測精度。

表3 模型預測精度對比
截取其中100個數據樣本的預測結果與實際值進行對比分析,預測結果對比分析如圖5所示。數據樣本1~33、34~66和67~100分別對應模型預測的安全態勢在上升階段、峰值階段和下降階段。分析圖5可知,所構建的GRU預測模型在數據樣本安全態勢的上升、下降和峰值預測中均能保證良好的吻合效果,無論是變化趨勢還是預測值準確率,GRU預測模型相較于RBF和SVR模型均具有更小的預測誤差。

圖5 100個數據樣本的模型預測結果對比
所設計的電力監控防護系統主要分為數據分析、安全態勢和用戶交互三個部分,如圖6所示,其中安全態勢部分主要包括指標體系模塊、安全態勢識別模塊和安全態勢預測模塊。

圖6 原型系統功能架構設計
利用python攻擊模擬器對電力監控防護系統進行攻擊模擬。分析模擬結果可知,所設計的電力監控防護系統能夠實時感知系統內部或者外部的惡意攻擊,準確捕捉設備或者網絡運行狀態,能夠及時預警反饋安全問題。當設備或者網絡受到威脅或者攻擊時,能夠實時識別并準確預測,證明了該方法的有效性、準確性以及系統可行性。
為了實現“智慧電網”背景下對電力監控防護系統的精細化、實時化和智能化的復雜要求,從指標體系構建、安全識別模型和狀態預測模型共三個方面對電力監控防護系統的設計進行了研究,并實現了新型電力監控防護系統的可視化,主要創新點如下:
(1)基于支持向量機的遞歸特征消除(SVM-RFE)技術,基于皮爾森相關系數(Pearson)去除冗余特征,構建了電力監控防護系統安全識別指標體系。
(2)基于支持向量回歸(SVR)技術,構建了基于SVR的安全態勢識別模型。相較于BPNN模型,SVR模型的安全態勢識別結果在RMSE上降低了43.60%,在MAPE上降低了70.23%。
(3)基于門循環單元(GRU)神經網絡,構建了基于GRU的安全態勢預測模型。GRU預測模型相較于RBF模型和SVR模型的均方差(RMSE)分別降低了19.23%和23.56%,平均絕對百分比(MAPE)降低了48.33%和58.73%。
(4)實現了電力監控防護系統,通過實驗驗證了系統可行性。
該研究為電力監控防護系統的安全運維提供重要參考,為構建智慧電網提供了技術支撐。