賈玉健 ,孫樹敏 ,孟 瑜 ,尹茂林 ,王 悅
(1.國網山東省電力公司濟南供電公司,山東 濟南 250012;2.國網山東省電力公司電力科學研究院,山東 濟南 250003;3.山東魯能軟件技術有限公司,山東 濟南 250101)
·電網技術·
基于大數據分析的配電網故障監測方法
賈玉健1,孫樹敏2,孟 瑜3,尹茂林1,王 悅1
(1.國網山東省電力公司濟南供電公司,山東 濟南 250012;2.國網山東省電力公司電力科學研究院,山東 濟南 250003;3.山東魯能軟件技術有限公司,山東 濟南 250101)
針對當前配網監測手段有限、數據利用率低等問題,提出一種基于大數據分析的配電網故障監測方法。分析目前供電企業配網調度支持系統技術特點與數據流程,選取海量歷史遙測數據作為研究對象,采用C均值模糊聚類算法辨識配電線路負荷模式并進行負荷預測。定義了考慮隸屬度和歐式距離因素的失配度指標,作為線路故障評價判據。算例分析表明,能有效辨識配電線路負荷模式,較為可靠地判定線路故障,并在一定程度上避免因負荷正常波動造成的誤動作。應用效果顯示,提供了一種簡便、實用的監測手段,能有效監測現有手段監視不到的配電網故障情況。
大數據分析;配網調控;故障監測;數據挖掘;負荷模式
近年來,國家電網公司加大配電網自動化改造力度,深化配電自動化系統(Distribution Automation System,DAS)推廣和應用[1],能夠實現對配電網主干線、部分分支線開關的遙信、遙測、遙控(三遙),并根據線路事故信號和自動化開關的保護信號,自動判斷故障區間,向調控人員發出提示信號或自動完成故障隔離和恢復供電[2],提高了供電可靠性和供電質量。
但是,仍存在以下問題:配電設備種類多、數量多,各地區經濟發展水平不同,配電網中仍然具有相當數量的非自動化設備[3],造成大量分支線路處于無法監視的狀態;自動化設備的通信方式有EPON、電力線載波、無線專網、無線公網[4],可靠性、安全性不同,數據的準確性、可用性不足,導致存在相當數量的錯誤遙信、遙測信息;此外,還存在一定比例的缺陷、故障設備,導致遙信、遙測數據不可用。上述問題導致調控人員無法及時發現并處置非自動化線路的故障情況,無法甄別錯誤的遙信、遙測信息并做出正確處置。隨著分布式發電(DG)大量接入和用戶對供電可靠性要求的不斷提高,現有的技術支持手段對配電網尤其是分支線的掌控能力越來越難以滿足調控運行的需要。
與此同時,諸如OPEN-3000、D5000這類的電網調度自動化系統能夠實現對配電線路主線開關高度可靠的“三遙”控制,具有較高的實時性和準確性,并通過綜合數據平臺存儲著海量的遙測數據,雖然配網調控數據越來越多,目前僅有少量數據能靠人工手動導出并處理,數據利用效率低,亟待通過大數據技術、云計算技術強化應用歸集、傳輸、分析處理,并有效地為配網調控決策服務在現有調控業務[5]。如能對調度自動化系統進行改進,擴展其應用功能,深入挖掘海量數據中蘊藏的有效信息,實現對配電網的故障監測和數據準確性校核,則能有效彌補DAS系統的不足,以較低的成本和簡便的手段提高供電質量和供電可靠性,對供電企業而言是有效、易行的方案。
在能源電力行業,將大數據分析技術應用于故障監測正處于起步階段,尚未形成廣泛通用的技術模式:文獻[6]利用集控中心的遙信變位和遙測變化的時序數據,建立了計及信息時序屬性的變電站輸變電元件規則網絡故障診斷模型;文獻[7]將PMU量測獲得的廣域同步電氣量的實時信息引入電網故障診斷之中,提出一種將開關量與電氣量相結合的故障元件快速識別方法;文獻[8]利用數據挖掘技術和SOA等先進IT技術,設計并實現了一個基于數據挖掘的電力調度管理系統,涵蓋了電力調度運行和生產管理等各方面的數據需求。文獻[9]提出從大量業務數據中挖掘信息并抽取知識,支持智能化調度業務分析與決策,用于電網運行情況統計分析、區域負荷趨勢分析、電網負荷特性分析。
鑒于此,結合現有調度技術支持系統數據特點,提出一種基于大數據分析的配網故障監測技術,采用C均值模糊聚類算法計算線路電流預測值,并結合實時采樣值計算失配度,用以監測配電網中存在的故障。根據某地區10 kV線路運行數據對所提方法進行了驗證,并展示了在某供電企業實際應用效果。
目前,配網調控運行業務的技術支持系統以DAS為主,以能量管理系統(Energy Management System,EMS)系統為輔,兩套系統同時為調控人員提供配電網設備監視、事故處理、操作控制的技術支持。圖1為典型的供電企業配網調控技術支持系統結構。

圖1 配網調控技術支持系統結構
配電終端(包括DTU、FTU、TTU)采集配電網線路上環網柜、開關站、柱上開關、分界開關、配電變壓器等設備的狀態、電壓、電流等信息,通過多種形式的終端接入網和骨干通信網匯集至DAS主站,主要為調控員提供配電線路上各類自動化設備的遙信、遙測數據。DAS系統的優點是覆蓋范圍廣、能提供變電站以外線路上設備的運行數據、數據量大;缺點是通信可靠率較低、數據準確率較低、不能覆蓋非自動化線路或設備。
EMS系統通過安裝在各廠站的RTU,采集變電站內設備的狀態、電壓、電流等信息,通過串行通信和以太網匯集至EMS主站,為配網調控人員提供10 kV母線和配電網主線開關的遙信、遙測數據。同時,將配電網主線開關的遙測電流數據,以每5 min 1個數據點的格式,存儲于歷史數據服務器。在配電網調度業務中,EMS系統的特點是覆蓋所有配網線路、采樣精度高、通信可靠、數據準確率高、歷史數據充足;缺點是對變電站外配電網絡上設備無掌控能力。
配網調控人員通過EMS實現對所有配網主線的監控,通過DAS實現對部分分支線路和配變的監控;對于非自動化、通信失敗、故障的分支線路,目前尚缺乏有效監控手段。EMS歷史數據庫中存儲著大量準確、可靠的電流數據,考慮采用數據挖掘技術進行利用。
從歷史數據庫中大量的、不完全的、有噪聲的、模糊的數據中,提取其隱含的有用信息和模式。考慮到調度業務需求,主要利用預測型模式。
預測型模式是以時間為關鍵參數,對于時間序列型數據,根據其歷史和當前的值去預測其未來的值。常用的方法有:神經網絡預測法、模糊聚類識別預測法[10]。
神經網絡預測法。人工神經網絡能夠建立任意非線性的模型,適用于解決時間序列預報問題。但是由于神經網絡分類方法獲取的模式隱含在網絡結構中,不容易被人們理解和解釋;另外要多次掃描訓練數據,訓練時間較長。不能滿足電網故障監測對易讀性、實時性的要求。
模糊聚類識別預測法。C均值算法和K均值算法是模糊聚類領域中常用的兩種算法,以迭代計算來修正聚類中心,以歐式距離作為判斷樣本隸屬的依據。但是K均值算法對于初始聚類中心的依賴性較大,分類結果缺乏穩定性,因此C均值算法目前依舊是主流使用的算法[11]。
本文選擇較為成熟穩定的C均值模糊類聚算法實現對配電線路負荷預測。
給定樣本 A={X1,X2,…,Xn},其中 Xk=(xk1,xk2,…,xkm),設聚類數為c。則目標函數為

式中:dki為第k個樣本到第i類中心zi的距離,其計算公式為

uki為第k個樣本在第i類中的隸屬度,其計算公式為

給定聚類數c,計算初始聚類中心;計算樣本隸屬度,修正聚類中心;最終通過隸屬度判斷出樣本所屬的類別。
當配電網處于正常運行狀態時,主線電流符合其負荷模式,電流曲線與歷史數據高度契合;當配電網發生故障時,實時采樣值發生突變,與根據歷史數據計算出的預測值失去匹配。因此,只需檢測配電線路實時電流是否存在失配點,即可實現配電網故障監測,進一步通過邏輯判斷確定具體的故障類型。圖2為數據處理與故障監測方法流程,主要包括數據預處理、電流數據聚類、當日負荷匹配、失配度檢測、故障類型研判等模塊。

圖2 數據處理與故障監測方法流程
進行模糊類聚前,通常需要將數據進行標準化,以使數據具有相近的數量級和合適的幅值,常用的標準化方法有最大—最小值法、平均數方差法、總和標準化法、標準差標準化法、極大值標準化法等[10]。
具體到本文的聚類對象,對于一條確定的線路,其歷史電流水平保持在相近的數量級,并且工作日、節假日的負荷差異不應被預處理步驟抹去;同時,考慮到通用性和簡便性,本文選取類似極大值標準化的方法,以線路限流數進行標準化。即

式中:d為線路限流數,根據供電企業實際生產情況,對于所有配電線路,d為一個常數。
對于一條確定的線路,在不發生大規模改造的前提下,其日常負荷曲線在工作日和節假日呈現出不同的負荷模式,具體的差別取決于所接帶的負荷類型及比例。故聚類數c取值2,將線路負荷模式按照工作日、節假日進行聚類,得到2個聚類:
工作日類 A1,聚類中心 Z1=(z11,z12,…,z1m)
非工作日類 A2,聚類中心 Z2=(z21,z22,…,z2m)
讀取該線路截止到當前時刻的t當日負荷數
X0=(x01,x02,…,x0n)
n為t時刻的當日負荷數據長度,n≤m,采用子序列匹配法,確定的所屬類別。選取Z1、Z2的子序列
Z1s=(z11,z12,…,z1n),
Z2s=(z21,z22,…,z2n)
分別計算 X0對 Z1s、Z2s的隸屬度 u01、u02, 通過最大隸屬度法確定當日負荷歸屬的類別。
根據聚類和匹配結果,計算下一個數據點的預測值

讀取線路t時刻的經標準化的采樣值x0(t)。定義失配度指標

式中:u0=max(u01,u02)。
失配度指標既考慮了實時值與預測值的偏差,也考慮了子序列的隸屬度。線路歷史負荷模式越清晰,隸屬度越高,失配度指標對負荷波動越敏感;反之,即使負荷波動相對較大,表現在失配度上也并不明顯。
設置失配度閾值ε,當 Ke(t)≥ε,即判定該線路發生故障。
對于判定為故障的線路,進一步對電流遙測數據進行邏輯分析,確定發生的故障類型。
分支線分閘:電流顯著降低但不為零;
分支線合閘:電流顯著增加;
主線分閘:電流降低為零;
主線合閘:從零增加至某一數值;
聯絡線路合環:兩條線路分別發生分支線分閘和合閘事件,并且電流變化幅值相等、方向相反。
將監測到的故障線路和自動研判出的故障類型推送至調控工作站,由調控人員進行確認和處理。
為了驗證所提的基于大數據分析的配電網故障監測方法的有效性,選取某地區10 kV配電線路L,根據其實際運行數據進行驗證。
因數據量較大,截取2016-12-17T00:00:00至2016-12-25T24:00:00共 9天的數據繪制在圖3中,其中第1、2、8、9日為非工作日,其余5日為工作日。可以看出,線路L的日負荷數據具有顯著的周期性,在工作日和非工作日呈現不同的負荷特征。

圖3 線路L負荷曲線
根據前文提出的方法對日負荷數據進行預處理和聚類,將負荷數據分為兩類,如圖4所示。

圖4 線路L聚類結果
圖4中黑色細線為日負荷曲線,幅值較大的一簇為工作日曲線,幅值較小的一簇為非工作日曲線,兩條紅色粗實線為分別為工作日和非工作日的聚類中心。
某日t時,線路L發生分支線路跳閘,當日電流曲線如圖5所示。其中前123個據點為歷史數據,計算隸屬度,可知,u01=0.991,u02=0.008,確定 d0日數據屬于工作日類,下一數據點的預測值為 x′0(n+1)=0.651。發生故障前實時采樣值 x0(t0-)=0.653,失配度僅為0.02;t時刻,發生故障時實時采樣值 x0(t)=0.496 失配度為 Ke(t)=0.152,故障特征明顯,判定 t時刻線路L發生故障,進一步讀取故障特征,研判為分支線跳閘。經運維人員現場核實,線路L 27支3桿分段開關確實發生跳閘,負荷損失1.07 MW。根據配電線路實際運行經驗,選取ε=0.1。

圖5 線路L故障日負荷曲線與預測值
又如線路M,圖6展示了線路M發生分支線故障的案例,由于負荷性質原因,電流波動較大,隸屬度較低。圖中A點負荷偏離預測值23%,失配度為0.087,判為正常;B點發生分支線跳閘時,失配度為0.121,判為故障。可見,對于負荷波動劇烈的線路,失配度指標可在一定程度上躲過正常波動。

圖6 線路M故障日負荷曲線與預測值
根據本文所提方法,開發了智能配電網大數據多維監測平臺,對某地級供電公司直供區1 005條配電線路部署監測,以B/S架構為配網調控人員和相關專業管理人員提供準實時的故障監測告警。
應用以來,日均監測主干線分合閘事件4.73次,正確檢出率達98.3%;監測分支線分合閘事件26.4次,正確率83.7%;解合環事件3.46次,正確率93.8%,多次檢出傳統手段無法監視的電網故障。監測錯誤的事件主要是由于特殊負荷性質造成。
挖掘EMS系統歷史電流遙測數據的信息用于配電網故障檢測,對供電企業而言在技術上、經濟上是適用的。
采用C均值聚類算法能較好辨識配電線路負荷模式,為故障判定提供參考依據和評價指標。
考慮了隸屬度因素的失配度指標能較為可靠地判定線路故障,并在一定程度上避免因負荷正常波動造成的誤動作。
本文方法能夠有效識別現有手段監視不到的配電網故障情況;受特殊負荷性質、運行方式等因素的影響,雖不能確保絕對準確,但總體而言為一種簡便、實用的監測手段。
[1]沈兵兵,吳琳,王鵬.配電自動化試點工程技術特點及應用成效分析[J].電力系統自動化,2012,36(18):27-32.
[2]劉健,張志華,張小慶,等.繼電保護與配電自動化配合的配電網故障處理[J].電力系統保護與控制,2011,39(16):53-57,113.
[3]李子韻,成樂祥,王自楨,等.配電自動化終端布局規劃方法[J].電網技術,2016,40(4):1 271-1 276.
[4]王曉勇.配電自動化系統中通信網絡的規劃與組建[D].南京:南京郵電大學,2013.
[5]杜剛,孟勇亮,彭暉,等.地區電網智能調度控制系統實踐與展望[J].電力系統自動化,2015,39(1):200-205.
[6]李曼.基于變電站集控中心故障診斷模型的研究[D].廣州:華南理工大學,2013.
[7]劉大偉.基于開關量和電氣量的電網故障診斷[D].濟南:山東大學,2015.
[8]許林生.基于數據挖掘的電力調度管理系統設計與實現[D].成都:電子科技大學,2013.
[9]李勝利,任培民,趙樹然,等.利用數據挖掘和綜合信息平臺構建智能電網調度的業務分析系統[J].廣東電力,2011,24(3):78-82,90.
[10] 王光宏,蔣平.數據挖掘綜述[J].同濟大學學報,2004,32(2):246-251.
[11] 仲偉寬.模糊聚類方法在用戶負荷曲線分析中的應用[J].華東電力,2007,35(8):97-100.
A Method for Distribution Network Fault Monitoring Based on Big Data Analysis
JIA Yujian1,SUN Shumin2,MENG Yu3,YIN Maolin1,WANG Yue1
(1.State Grid Jinan Power Supply Company,Jinan 250012,China;2.State Grid Shandong Electric Power Research Institute,Jinan 250003,China;3.Shandong Luneng Software Technology Co.,Ltd.,Jinan 250101,China)
In order to solve the problems of the limited distribution network monitoring means and inefficient data utilization,a method for distribution network fault monitoring based on big data analysis is proposed.In this paper,the load pattern is identified and the load forecast is carried out by analyzing the current characteristics and the data flow of the distribution network dispatching support system of power supply enterprises,using the massive historical telemetry data as the research object and the C means fuzzy clustering algorithm.The mismatch index is re-defined by taking the membership degree and Euclidean distance into account and used as the evaluation criteria of the line faults.The example presented in this paper shows that the proposed method can effectively identify the load pattern of distribution lines,determine the line faults sufficient accurately and to a certain extent,avoid the mishandling caused by the normal fluctuation of the load.Application results show that the method provides a simple and practical mean of monitoring the fault of the distribution network effectively whose effectiveness is beyond the reach of the existing means.
big data analysis;distribution network dispatching;fault monitoring;data mining;load pattern
TM73
A
1007-9904(2017)10-0001-05
2017-04-10
賈玉健(1988),男,工程師,從事電網調度運行與分析工作。