【摘要】為了提高智能變電站繼電保護裝置二次回路故障檢測的效率,提出了基于特征識別的繼電保護二次回路故障檢測方法。通過提取在出現不同故障時監測系統中SV,GOOSE,MMS報文的特征碼,構建特征碼與系統故障的決策樹,在未來的故障檢測過程中,通過提取系統參數的特征碼,使用決策樹預測可能的故障情況,同時將故障與特征碼加入到決策樹中,通過不斷完善決策樹的方法,實現系統故障的檢測。通過對系統監測報文記錄分析和特征提取等裝置,將保護設備和二次回路各環節發生故障時的信息進行整理,構建一套高效的繼電保護及二次回路故障檢測系統。
【關鍵詞】繼電保護;二次回路;特征識別;決策樹
1、 引言
在智能電網時代,傳統電網的物理模擬信號被通信網絡的數字信號所取代,實現二次設備的數字化和網絡化[1]。智能電網系統中,各個繼電保護設備將獲取的數字信號通過網絡發送到智能監控中心,由專業人員根據具體的報文信息來判斷當前系統是否運行正常。但由于現代智能電網的規模非常大,其記錄的信息量非常大且異常復雜,事關電網系統安全的重要信息往往由于缺乏高效的故障特征檢測方法被海量信息所淹沒。
為了解決上述問題,本文從二次設備運行狀態信息入手,提取保護SV/GOOSE/MMS鏈路[2]異常信號和裝置的自檢信息,并根據系統當時的狀態情況,提取系統信號的特征碼,構建特征碼與系統故障的決策樹[3],在未來的故障檢測過程中,通過提取系統參數的特征碼,使用決策樹預測可能的故障情況,通過不斷完善決策樹的方法,實現系統故障的檢測。通過對系統監測報文記錄分析和特征提取等裝置,將保護設備和二次回路各環節發生故障時的信息進行整理,構建一套高效的繼電保護及二次回路故障檢測系統。
2 、信息采集及特征碼提取
2.1 系統架構
繼電保護二次回路的故障檢測的關鍵在于二次回路的信息采集,信息采集的準確性和全面性直接決定了檢測結果的準確性。系統采集的結構如圖1所示。
整個系統包括主站和站端裝置兩部分,在主站端采用網絡報文記錄分析裝置對主站系統進行數據采集,而站端裝置使用保護設備在線監測診斷裝置進行數據的采集。信息采集的主要流程如下:首先由主站節點對站端裝置的采集參數進行配置,然后由保護設備在線監測診斷裝置對數據進行采集,由于變電站內部電磁信號環境復雜,很容易導致一些數據采集的實效或失實,為了降低故障診斷系統的信息處理壓力,降低故障診斷系統的誤判的概率,采集端需要對采集到的數據進行預處理和過濾,然后將數據通過網關節點上傳到主站系統,然后由主站系統對采集信息進行分析診斷,然后將結果顯示在主控界面。
信息采集系統采集到的數據主要包括裝置的運行狀態信息,告警信息,保護動作信息,SV?GOOSE狀態信息等。裝置運行狀態信息主要包括自檢信息,采樣值,開關量信息等,該類信息主要用于變電站的日常檢修。告警信息包括采樣值,開關量異常告警和裝置異常告警信息。保護動作包括保護動作信號和保護出口信號。SV/GOOSE運行狀態信息指的是報文狀態或格式異常信息等。
2.2 特征碼提取方案
通過圖1可以看出,信息采集是由網絡報文記錄分析裝置采集完成。網絡報文記錄分析裝置采集的信息包括采樣值報文,GOOSE報文,MMS報文和時鐘報文,這些報文可以分為穩態文件,暫態文件和狀態文件,其中暫態報文是指鏈路告警出現時所有鏈路信息報文組成的文件。穩態文件表示長時間檢測的報文的集合,如變電站的溫度,壓強,二次回路中的電流等,狀態文件則表示檢測鏈路實時通斷狀態的報文的集合。在實際應用中,狀態文件和穩態文件會以一種固定的頻率發送,而當系統中存在故障告警或穩態文件出現劇烈變化時,系統會上傳暫態文件。由于系統的穩態文件和狀態文件數據量非常巨大,為了降低系統的處理復雜度,在數據預處理過程中,將系統的穩態文件和狀態文件壓縮,具體方法是在傳輸端對文件進行差值傳播。
故障的特征碼指的是當系統發生故障或者出現報警前系統監控信息中異常信息的組合。在系統發生故障前,系統的監控信息會出現與正常狀態下的不同的信號特征,通過對異常信號特征的分析,追蹤其最先發生故障的繼電裝置,則所有最先出現故障繼電裝置的狀態就被認為是該故障的特征碼。假設二次回路系統監測系統包括如下數字單元:
當系統出現故障時,必定是因為SET中某些元件的狀態值出現異常,由于系統故障時,所有的故障值都是順序出現的,因此,回溯找到最初發生異常狀態值的所有元件,則所有元件的狀態值就為當前故障的特征值。
事實上,在操作中,所有的故障碼都是根據事后診斷的結果確定的,通過上述方式,不斷的豐富系統的故障特征碼庫,為后續創建故障診斷決策樹提供原始數據。
3 、決策樹的構建
決策樹是一種基本的分類和回歸方法[4],其根據相關的條件進行分類的一種樹形結構。具體到二次回路故障檢測方法來說,就是通過故障的特征碼與故障的原因構建決策樹,然后通過系統中出現的故障碼來確定故障的所在。
創建決策樹時最關鍵的問題就是選取哪一個特征作為分類特征,好的分類特征能夠最大化的把數據集分開,將無序變為有序。由于智能電站中存在非常多的元件,如何保證系統快速做出診斷,減少因故障產生導致的二次損失,是在決策樹構建過程中首先需要考慮的。在智能電站系統中,所有節點出現的故障的概率是隨機的,為了確定那個節點出現故障的可能性比較大,需要引入熵[5]的概念。
在信息論和概率統計中,設X是一個取有限個值的離散隨機變量,其概率分布為:
則隨機變量X的熵定義為:
為了表示某元件發生故障對智能電站安全性的重要性,也是為了快速定位故障發生的原因,需要計算某個故障的信息增益。也就是條件熵。條件熵H(Y|X)表示在已知隨機變量X的條件下隨機變量Y的不確定性,定義為X給定條件下Y的條件概率分布的熵對X的數學期望[6]。
條件熵的計算公式如下:
當熵和條件熵中的概率由數據估計得到時,所對應的熵與條件熵分別稱為經驗熵和經驗條件熵. 決策樹選擇某個特征作為其分類特征的依據就是該特征對于集合的信息增益最大,即去除該特征后,集合變得最有序。
以信息增益作為劃分訓練數據集的特征,存在偏向于選擇取值較多的特征的問題,使用信息增益比可以對這一問題進行校正。
在故障決策樹生成之后,診斷系統就可以通過故障決策樹對故障類型進行分類,最后通過決策樹的葉子節點,可以判斷最有可能出現故障的節點的位置。
4 、故障診斷過程
當系統通過監測系統獲得故障信息之后,提取該故障信息的特征碼,然后根據決策樹中根節點的順序,自上而下的選擇相關的特征屬性進行檢測,如果系統檢測結果為一個葉子節點,則說明系統檢測到具體的故障類型,如果沒有到達葉子節點,需要計算該特征碼的決策信息熵,然后按照第三節所述方法將該節點加入到決策樹中,通過這種不斷的自學習的方法,豐富系統故障碼決策樹,實現故障的有效監測。
5、結束語
針對目前智能變電站存在的無法進行有效在線監測與故障診斷的問題,結合當前智能站的二次設備情況,通過提取SV,GOOSE,MMS報文的特征碼,構建特征碼與系統故障的決策樹,然后在系統決策過程中,將新遇到的故障逐一添加到決策樹中,從而實現決策樹的決策效果的提升。
參考文獻:
[1].胡敬奎. 智能變電站二次系統的方案設計與應用研究[D].華北電力大學,2015.
[2].常東旭,郭琦,朱益華,任祖怡,白楊,王良. 基于IEC61850的穩控系統站間通信技術[J/OL]. 南方電網技術,2017,(09):1-7(2017-11-06).
[3].徐鵬,林森. 基于C4.5決策樹的流量分類方法[J]. 軟件學報,2009,20(10):2692-2704
[4].王娜,任燕燕. 面板數據分位數回歸模型求解的模式搜索法[J]. 數理統計與管理,2016,35(03):435-444
[5].G.M. Bosyk,G. Bellomo,S. Zozor,M. Portesi,P.W. Lamberti. Unified entropic measures of quantum correlations induced by local measurements[J]. Physica A: Statistical Mechanics and its Applications,2016,:
[6].蔣云良,楊章顯,劉勇. 不協調信息系統快速屬性分布約簡方法[J]. 自動化學報,2012,38(03):382-388