孫向聚,郝 婷,宋 曦,王 雪
(1.國網甘肅省電力公司信息通信公司,甘肅 蘭州 730050;2.國網甘肅省電力公司,甘肅 蘭州 730050)
良好的網絡運行狀況是電網管理的重要指標。隨著電網結構的日益復雜和通信協議的多樣化,管理人員在面對復雜的電網數據時無所適從。針對這種情況,網絡運行態勢感知方法應運而生[1]。然而,隨著電網信息交換頻繁和異常事件的發生,對電網的安全高效運行提出了新的挑戰。有關專家對電網監控通信網的運行情況做了大量的研究。例如,劉紅軍等[2]優先對網絡度量標準進行度量,將靜態經濟收益設定為網絡狀態轉移的判定準則,采用演化博弈論構建復制動態方程,動態再現不同攻擊方的對抗行為,預測各種攻擊行為的變化情況,設定符合當前攻擊的防護措施,進而完成網絡安全態勢感知。程家根等[3]優先分析網絡安全態勢的主要特點,使用RBF神經網絡獲取網絡運行態勢對應的非線性映射關系,同時利用遺傳算法進行尋優,實現網絡運行態勢感知。
由于上述已有方法沒有刪除電網監控通信網絡運行數據的冗余特征,導致感知結果較差,平均計算時間和迭代次數上升。為了解決上述問題,提出一種基于機器學習的電網監控通信網絡運行態勢感知方法。
決策樹是機器學習中使用次數比較多的學習分類算法[4-5],由多個不同的節點組成,分別為根節點、葉節點、中間節點。其中,一種類型的節點代表一種分類結果。
設定T為電網監控通信數據訓練數據集,主要通過特征向量和分類結果對訓練集中的通信數據樣本進行描述。其中,(A1,A2,…,An)代表分類對象屬性,同時全部分類結果共同建立的集合可以表示為{C1,C2,…,Cm}。為了實現中低壓配電網智能化,減少人為操作故障次數,快速定位故障, 針對屬性Ai而言,操作故障值域可以表示為D(Ai)。另外,值域不僅可以是離散分布的,同時也可以是連續分布的。
針對給定訓練集T而言,將不同的故障屬性取值和分類結果放置在[0,1]區間內進行量化處理,同時采用神經網絡進行訓練與定位故障,獲取屬性Ai和分類結果之間的數學關系模型C(X),利用式(1)給出具體的表達形式:
C(X)=F(A1,A2,…,An)
(1)
式中:F為電網運行數據的權值。
針對給定的電網監控通信網絡而言,以上描述是通過權值和閾值進行描述。所以,借助電網通信數據的具體權值和閾值分類特征Ai對不同分類結果之間的具體關系進行分析。在Ai中加入決定強度概念DS(Ai)。其中決定強度DS(Ai)就是屬性Ai對分類結果的決定程度。利用式(2)給出對應的計算結果:
(2)
式中:C(X)為屬性Ai偏導數對應的絕對值;?為閾值。其中,決策強度的計算是通過分類結果C(X)和屬性Ai兩者共同實現的,為電網監控通信網絡設備的現有狀態評估和檢修提供依據。
通過式(3)獲取電網監控通信網絡運行態勢對應的激活函數f(x):
(3)
式中:μ0為任意常數;x為偏導數的取值范圍;th為運行時長。
針對單隱含層前饋神經網絡,能夠準確推算出電網輸出對網絡輸入的偏導數,具體的計算式如下:
(4)
式中:O1為輸出層不同神經元的網絡輸出;Ii為輸入層神經元的網絡輸入。
以下給出基于神經網絡的決策樹建立過程:
1)數據預處理
監控子站內部設備主要包括中壓開關成套設備及其智能終端等,所以電網數據預處理主要包含數據篩選以及屬性取值的量化處理等終端操作。在量化處理過程中,按照某種順序將屬性和分類結果設定在區間[0,1]內。
2)神經網絡訓練
通過給定的樣本對網絡進行訓練[6-7]。
3)建樹算法
選擇強度最大的屬性作為拓展屬性,詳細的操作流程為:
(1)考慮到電網監控通信終端存在著分散、數據量多、距離長,架設有線通信不經濟的問題,對于已經給定的例子集合,選取決定強度最大的屬性Ai作為擴展屬性。
(2)將屬性Ai取值相同的例子劃分到同一子集中。
(3)針對含有不同類的子集,假設分類精度低于預測精度,建立建樹算法。
(4)假設子集為同一類型,標記對應分支的種類,然后返回值調用處。
在上述分析的基礎上,電網監控通信網絡交換數據包括上行的檢測數據、圖像數據、視頻數據和下行的控制命令,需要采用方差過濾器將電網數據集中的冗余特征和無利用價值的特征刪除,進而采用基于神經網絡的決策樹算法完成電網監控通信網絡運行數據特征提取和分類預測[8-9]。
通過K-means算法進行電網監控通信網絡運行態勢感知,詳細的操作過程如下所示。
優先給出K-means算法的詳細操作步驟[10-11]:
(1)優先確定聚類數量k,設定輸入數據向量組為X;同時在n個數據向量中隨機選擇k個向量,將其作為初始聚類中心。
(2)計算各個向量到k個初始聚類中心的歐式距離,同時獲取距離最小值中的向量所在的聚類中心。
(3)假設聚類中的數據向量存在明顯變化,則對聚類中心進行重新計算,該系統通過將儲能電機工作電流多次聚類,得到電網設備的啟動及工作波形,實時監測母線三相電壓、電流值等具體數據,實時監控電網監控通信網絡運行態勢。
(4)重復步驟(2)和步驟(3),直至各個聚類中心不再發生任何變化或者中心距離低于設定的閾值。
通過步驟(4)能夠獲取平方誤差函數E,具體的計算公式為
(5)
式中:k為聚類數量;xi為數據向量;mi為第i個聚類的平均值向量;xj為數據向量組。
通過K-means算法對電網監控通信網絡運行數據進行預處理[12-13]。聚類效果的好壞需要通過輪廓系數取值大小進行判定,選取合適的輪廓系數能夠更好實現凝聚度的分離和結合。其中,輪廓系數的取值越大,則說明聚類效果越好,從而對整個電網監控通信網絡的狀態進行評估。以下給出輪廓系數的詳細計算過程:
(1)計算凝聚度,如式(6)所示:
(6)
式中:aij為凝聚度;xij為向量點;xik為除了xij外的向量點。
(2)計算分離度bij:
(7)
式中:xkl為聚類中除了Xi簇中的點。
(3)針對向量xij,需要獲取輪廓系數計算公式:
(8)
式中:sij為輪廓系數。
另外,輪廓系數還能夠表示為式(9)的形式:
(9)
(4)計算全部向量點對應的輪廓系數,選取輪廓系數平均值s整體輪廓系數,具體計算式如下所示:
(10)
式中:n為向量點總數。
針對態勢因子向量選擇最佳k值,進行數據分析的主要目的需要確保數據的一致性。其中,需要特別注意的是:以電網監控通信網絡運行數據為初始數據,所以在實際運行過程中并沒有任何異常情況的出現。
傳統的K-means算法對初始條件十分敏感,即聚類結果可能會隨著初始聚類中心的變化而發生改變[14-15]。為了有效解決這一問題,需要對K-means算法進行改進,經過改進后的K-means算法操作流程如圖1所示。

圖1 改進的K-means算法的電網監控通信操作流程圖
針對研究項目背景,對電網監控通信網絡運行態勢感知,考慮到骨干網無法組建精準的模型函數,需要借助機器學習完成電網監控通信網絡運行態勢感知。
(11)

(12)


(13)

為了驗證所提基于機器學習的電網監控通信網絡運行態勢感知方法的有效性,需要進行實例測試。
以某電力工程中的調度項目為例,其依據《電力監控系統安全防護規定》(國家發展改革委2014年14號)、《電力監控系統安全防護總體方案》(國能安全[2015]36號)《電力監控系統安全防護管理規定》(Q/HNLCJ-YG04-2018)。在安全Ⅲ區建立系統,在接通安全Ⅰ區的 EMS系統方面,從Ⅰ區到Ⅲ區的單一傳輸規定,采用正向隔離裝置進行網絡安全防范;網絡發令客戶端通過調度數據網直接訪問,要求客戶端進行防火墻設置,滿足并符合網絡安全管理要求。通信網絡應采取保密、完整的措施,以確保本系統數據傳輸過程的安全。通過 VPN、 VLAN等,可以構建虛擬專網,為數據機密性和完整性提供一定的安全性。在每個前端系統的出口網絡上建立兩個不同方向的連接,以保證雙路由的備份,如圖2所示。

圖2 電力工程調度項目的電網監控通信網絡
針對所提方法的感知性能進行測試分析,優先分析所提方法的真實電壓相角和預測到電壓相角兩者之間的差值變化,具體實驗結果如圖3所示。

圖3 所提方法的電網監控通信網絡運行態勢感知性能測試分析
分析圖3中的實驗數據可知,所提方法獲取的感知結果和真實值基本一致,說明所提方法具有較好的感知性能。
以下實驗測試對比分析三種不同方法的感知性能,具體實驗結果如圖4所示。
對圖4中的實驗數據進行詳細分析可知,文獻[2]方法和文獻[3]方法感知性能明顯不如所提方法。由此更進一步驗證了所提方法能夠更好實現電網監控通信網絡運行態勢感知。
以下實驗測試分別從平均計算時間、平均迭代次數以及電壓相角最大絕對誤差三方面進行研究,利用圖5、圖6和表1給出具體的實驗測試分析結果。

圖4 不同方法的電網監控通信網絡運行態勢感知性能測試分析

圖5 電壓相角最大絕對誤差

圖6 平均計算時間

表1 同方法的平均迭代次數測試分析
分析圖5、圖6以及表1中的實驗數據可知,所提方法的電壓相角最大絕對誤差、平均計算時間以及平均迭代次數明顯低于文獻[2]方法和文獻[3]方法。主要是因為所提方法采用方差過濾器刪除數據集中的冗余和無相關特征,避免其他因素對感知性能產生影響,全面提升整個方法的感知性能,使所提方法的各項性能達到最優狀態。
為了獲取更好的電網監控通信網絡感知性能,提出一種基于機器學習的電網監控通信網絡運行態勢感知方法,采用決策樹遞歸特征消除算法,采用方差過濾器將電網數據集中的冗余特征和無利用價值的特征刪除,選取合適的輪廓系數,通過誤差預測值對態勢因子進行誤差修正,能夠大大減少平均計算時間和迭代次數,獲取更加理想的感知結果。