楊建平,肖 飛,葉 康,齊敬先,曹越峰
1(國網上海市電力公司,上海 200122)
2(南瑞集團公司(國網電力科學研究院),南京 211000)
基于改進局部異常因子算法的拓撲辨識技術①
楊建平1,肖 飛1,葉 康1,齊敬先2,曹越峰2
1(國網上海市電力公司,上海 200122)
2(南瑞集團公司(國網電力科學研究院),南京 211000)
針對電網中的拓撲錯誤和不良遙測信息嚴重影響電網的安全運行的現象,提出了基于改進局部異常因子算法的拓撲辨識方法.該方法利用統計理論對開關及刀閘的狀態信息和電網的遙測信息進行評估,同時考慮到遙測及遙信信息對拓撲錯誤辨識的影響不同,采用相對熵對其數據進行加權處理,并在異常拓撲狀態檢測過程中,通過網格來屏蔽那些非異常的對象,提升算法效率.實驗結果表明,該算法能夠快速識別電網中的拓撲錯誤,發現其中的不良遙測信息.
局部異常因子;權重;開關變位;拓撲辨識
電網拓撲結構的正確與否對于狀態估計有重要影響,拓撲錯誤經常導致狀態估計結果不可用或者狀態估計不收斂[1].拓撲錯誤分為支路型拓撲錯誤和廠站拓撲錯誤[2],且支路型拓撲錯誤通常是由廠站拓撲錯誤引起的.目前拓撲錯誤辨識方法主要有規則法[3-5]、人工神經網絡法[6,7]、殘差法[8-11]、新息圖法[12-14]、最小信息損失法[15,16]、轉移潮流法[17]及狀態估計法[18,19].規則法雖然應用簡單,但規則間容易存在沖突現象.人工神經網絡法對于規模較大且網絡拓撲結構經常變化的網絡適應能力較差.殘差法難以區分由不良數據和拓撲錯誤引起的殘差.新息圖法對于單一的不良數據和拓撲錯誤具有良好的效果,但是難以辨識不良數據和拓撲錯誤同時存在的場景.最小信息損失法建模復雜,難以應用于實際的分析.轉移潮流法能夠辨識支路型拓撲錯誤及不良數據,但對于廠站拓撲錯誤辨識困難.
針對上述問題,本文在狀態辨識模型中提出兩個改進方案[21]:(1)在狀態辨識模型中引入更多的信息用于拓撲錯誤辨識;(2)進一步提高狀態辨識求解算法的計算效率.本文采用局部異常因子算法對開關的狀態信息及其遙測數據進行分析,充分利用采集到的多源冗余數據,最大可能性還原電網運行狀態,將電網運行信息轉化為需要進行辨識的對象,通過計算每個對象的局部異確認電網存在拓撲錯誤的可能性.常規的局部異常因子算法由于未考慮對象屬性的權重及對象分布區域密度的因素,導致算法運行效率較低,本文采用相對熵對對象屬性進行權重設置,并通過網格和稠密單元過濾掉非異常的狀態變化信息,進一步提高了算法的效率及結果的可靠性.
電網拓撲錯誤的發生可以分為兩種情況:一種是電網中沒有發生拓撲變化,而表示開關及刀閘狀態的信號反應出狀態變化,即誤發;另一種是在電網中發生了拓撲變化,而開關及刀閘信號卻沒有對其相應的變化做出反應,即漏發.這兩種情況均可以通過設備相關的電氣量測量數據和狀態遙信數據反映出來,因此,通過引用其遙測、遙信信息來對開關及刀閘進行模型定義從而發現處于非正常運行狀態的設備來辨識拓撲錯誤.
電網拓撲狀態由刀閘、開關等設備開斷狀態來決定,某時刻拓撲狀態決定于上一時刻該設備的狀態及其到當前狀態的轉換方式.假設上一時刻不存在不良遙測數據及拓撲錯誤,則可以通過判定狀態轉換的合理性來判定下一時刻電網是否存在拓撲錯誤.因此可以利用遙測變換值及遙信變換值來對狀態轉換進行定義,通過發現異常的狀態轉換來判定電網是否存在拓撲錯誤.
由于在拓撲關系中,刀閘和開關是連接關系的核心,為此,通過定義每個刀閘和開關的狀態轉換來確認電網拓撲正確性.假設t0時刻某開關R的狀態為:

其中YC代表遙測信息,YX代表遙信狀態信息;

t1時刻開關R的狀態為:其中YC’代表遙測信息,YX’代表遙信狀態信息,從而該開關的狀態轉換可以表示為:

即某時刻開關和刀閘的拓撲狀態可以通過該狀態轉換來進行對象定義,并通過判定所有開關和刀閘狀態轉換的合理性,辨識電網運行的拓撲錯誤.
根據設備類型及所連接的其他主設備來對遙測和遙信信息類型進行確認.

表1 設備類型及引用屬性
由于遙測及遙信信息對于判定拓撲錯誤影響不同,故而在進行拓撲錯誤辨識時需要進行屬性權重定義來區別屬性對于異常值的貢獻程度.
2.1 常規局部異常因子算法
局部異常因子(LOF)算法是由Breuning首次提出的一種基于密度的異常檢測算法,它通過賦予對象一個表示其異常程度因子的方式來確認對象相對于其局部鄰域的異常程度.
該算法的流程如下:


第三步,計算對象p與其k距離鄰域中對象的可達距離,對象p相對于對象o的可達距離為:



局部異常因子越大,對象是異常數據的可能性越大.
2.2 改進的局部異常因子算法
為了解決LOF算法計算量大的問題,需要對原始數據進行篩選,通過網格約簡技術的應用可以排除掉那些不可能的異常數據,進而減少了計算量.另一方面,為了提高LOF算法的檢測準確率,在計算對象之間的距離時,以信息論中的相對熵為對象屬性設置權值,達到為對象異常程度較大的屬性賦予較大權值的目的.
改進的局部異常因子算法首先通過確認稠密單元和稠密區域排除不可能的異常點,然后基于相對熵對對象屬性賦權重,最后在常規局部異常因子算法中將對象距離計算公式改為加權的距離計算公式來進行局部異常因子計算,進而確認可能的異常點.
2.2.1 基于網格進行數據約簡
GDLOF算法[21]證明稠密單元和稠密區域中的點不可能是異常點.其基本思想為:將數據集D的每一維度進行等寬劃分,每個子區域稱為一個網格.p是數據集D中的一個對象,若對象p的所有m最近鄰q都在某網格內,并且q的所有m最近鄰o也在該網格內,則稱該網格為稠密單元[23].若單元滿足其中和分別為單元的標識序列),則這兩個單元為鄰居單元.若對象p的所有m最近鄰q都在某網格內,并且q的所有m最近鄰o也在某單元集內,且該單元集內的任意兩個單元均為鄰居單元,則這個單元集合為稠密區域.
通過不斷確認及更新稠密單元和稠密區域,僅對邊緣區域的數據進行LOF計算,從而可以達到數據約簡的目的.
2.2.2 對象屬性權重賦值
信息論是一門將信息作為研究對象,以揭示信息的本質特性及規律為基礎,應用數學方法來研究信息存儲、傳輸、處理、控制和利用等一般規律的科學[22].信息熵可以用來度量一個系統的無序和雜亂程度.熵值越大,系統中的數據越無序.由于信息熵完全建立在原始數據基礎上,故具有很強的客觀性,可以用于識別離群點數據,即確認非正常的狀態轉換,進而確認拓撲錯誤.同時,基于網格對數據約簡后,將大大的減少局部異常因子算法的計算量.
2.2.2.1 信息熵


2.2.2.2 相對熵



在對象集中,每個對象的每個屬性對該對象的異常貢獻度均不一樣,通過確認其屬性的相對熵來為該對象與其他對象距離計算時提供權值.從而對象之間的距離計算公式為:

其中wi為對象p的第i維屬性的權值.
2.2.3 局部異常因子計算
基于常規局部異常因子算法,將加權的對象距離公式(13)替代公式(4)來進行局部異常因子計算.
3.1 常規局部異常因子算法
表2給出了某變電站母聯開關設備特定連續時刻的8個狀態數據,描述屬性包括負荷、電流、遙信值.

表2 母聯開關屬性數據
根據局部異常因子算法計算其結果如表3所示.

表3 常規算法局部異常因子

u2 0.832 u3 18.334 u4 18.138 u5 1.465 u6 0.852 u7 1.214
3.2 改進的局部異常因子算法
3.2.1 基于網格進行數據約簡
基于網格進行數據約簡,將數據每一維進行等分求出數據網格,得出:效果如圖1所示.

圖1 對象網格分布
3.2.2 對象屬性權重賦值
利用公式(12)進行對象屬性權重賦值,各個對象屬性的相對熵如表4所示.

表4 辨識對象的相對熵
加了權重之后的對象基于公式(13)進行對象間距離計算,其局部異常因子結果如表5所示.結果比對如表6.

表5 改進算法局部異常因子

表6 兩種算法異常因子結果對比
由結果可知,通過對數據對象運用相對熵添加相應的權重使得數據的異常因子計算更為準確,在實際運用中可以更加準確的判定數據的異常程度.
3.3 K值影響分析
本文采用某變電站設備實際運行數據進行分析,該站包含8個開關,29個刀閘,通過局部異常因子算法確認其在一段時間內開關和刀閘的連接是否存在拓撲錯誤.將選取的數據進行離散化和歸一化預處理.

圖2 廠站接線圖
最終實驗結果如表7所示.

表7 不同K值實驗結果對比
結果表明本方法對如下三種拓撲異常均能正確辨識:
1)負荷與電流變化較大,遙信未變化;
2)負荷變化較小,電流值變化較大,遙信未變化;
3)負荷與電流變化較小,遙信發生變化.
同時,k值的選擇根據數據規模有所不同,k值過大或過小都會導致最后正確率的下降,導致漏辨識,需要經過反復實驗,該過程可根據最稀疏聚類的密度對k值進行調整,從而確認較為合理的k值,進而提升局部異常因子算法的正確率及工作效率.
本文提出了基于改進局部異常因子算法的拓撲辨識方法,通過電網狀態變化的相關遙測值及遙信值快速辨識拓撲錯誤.網格算法可以對大量數據進行預處理,提高辨識效率,同時將將權重設置應用于節點距離計算,充分利用了數據本身隱含的信息,提高辨識的準確性.實例證明,本文提出的改進方法能夠對電網拓撲狀態進行快速有效的辨識,為后續基于拓撲的電網應用分析打下堅實基礎.
1于爾鏗.電力系統狀態估計.北京:水利電力出版社,1985.
2 Abur A,Gomez A.Power system state estimation:Theory and implementation.New York:Marcel Dekker,2004.
3 Sing N,Glavitsch H.Detection and identification of topological errors in online power system analysis.IEEE Trans.on Power Systems,1991,6(2):324–331.
4 Sing N,Oesch F.Pratical experience with rule-based on-line topology error detection.IEEE Trans.on Power Systems, 1994,9(2):841–847.
5張婷,翟明玉,張海濱,齊苗苗,龔成明,李雷.基于不確定性推理的變電站拓撲錯誤辨識.電力系統自動化,2014,38(6): 49–54.
6 Souza JCS,Leite da Silva AM,Alves da Silva AP.Online topology determination and bad data suppression in power system operation using artifical neutral networks.IEEE Trans. on Power Systems,1998,13(3):796–803.
7 Souza JCS,Leite da Silva AM,Alves da Silva AP.Data debugging for real-time power system monitoring based on pattern analysis.IEEE Trans.on Power Systems,1996,11(3): 1592–1599.
8 Wu FF,Wen H,Liu E.Detection of topology errors by stateestimation.IEEE Trans.on Power Systems,1989,4(1): 176–183.
9 Alsac O,Vempati N,Betal S.Generalized state estimation. IEEE Trans.on Power Systems,1998,13(3):1069–1075.
10 Abur A,Kim H.Identifying the unknown circuit breaker statuses in power networks.IEEE Trans.on Power Systems, 1995,10(4):2029–2037.
11 Mili L,Steeno G,Dobraca F.A robust estimation method for topology erroridentification.IEEE Trans.on Power Systems,1999,14(4):1469–1474.
12周蘇荃,柳焯.新息圖法拓撲錯誤辨識.電力系統自動化, 2000,24(4):23–27.
13周蘇荃,柳焯.新息圖法的智能特征.電力系統自動化,2000, 24(13):15–19.
14周蘇荃,柳焯.新息圖法識別多重網絡結構動態變化.中國電機工程學報,2001,21(10):67–72.
15孫宏斌,高峰,張伯明.最小信息損失狀態估計中潮流和拓撲統一估計的通用理論.中國電機工程學報,2005,25(17): 1–4.
16孫宏斌,高峰,張伯明.最小信息損失狀態估計在拓撲錯誤辨識中的作用.中國電機工潮流的狀態估計模型.電力系統自動化,2010,34(2):39–42.
17 Li Abur A,Hongrae.Identifying the unknown circuit breaker statuses in power networks.IEEE Trans.on Power Systems, 1995,10(4):2029–2037.
18李賓.基于專家系統的不良遙信數據辨識.電力信息化,2010,(7):22–25.
19張凈,孫志揮,宋余慶,倪巍偉,晏燕華.基于信息論的高維海量數據離群點挖掘,2011,38(7):148–151.
20李存華,孫志揮.GridOF:面向大規模數據集的高效異常檢測算法.計算機研究與發展,2004,40(11):1586–1592.
21 Agyemang M,Ezeife CI.Lsc-mine:Algorithm for mining local outliers.Proc.of the 15th Information Resource Management Association(IRMA)International Conference. New Orleans.2004,1.5–8.
22何光宇,常乃超,董樹鋒,等.基于集合論估計的電網狀態辨識:(一)建模.電力系統自動化,2016,40(5):25–31.
Topology Identification Based on Optimized Local Outlier DetectionAlgorithm
YANG Jian-Ping1,XIAO Fei1,YE Kang1,QI Jing-Xian2,CAO Yue-Feng2
1(State Grid Shanghai Municipal Electric Power Company,Shanghai 200122,China)
2(Nari Group Corporation State Grid Electric Power Research Institute,Nanjing 211000,China)
In view of the fact that grid topology errors and bad telemetry information affect the safe operation of power grids seriously,this paper proposes a topology identification method based on improved local outlier factor algorithm. The method uses statistical theory to evaluate the state information of breakers and disconnectors and telemetry information of the power network.While taking into account the different influence of telemetry and remote communication on topology error identification,we weight its data by relative entropy.In the process of abnormal topology state detection,non-anomalous objects are shielded to enhance efficiency of the algorithm.Experimental results show that the algorithm can quickly identify the grid topology errors and find bad telemetry information.
local outlier factor;weight;dislocation;topology identification
2016-08-26;收到修改稿時間:2016-10-08
10.15888/j.cnki.csa.005762