林志超
(廣東電網(wǎng)有限責任公司惠州供電局,惠州 516001)
二次設備基礎數(shù)據(jù)挖掘系統(tǒng)的設計與實現(xiàn)
林志超
(廣東電網(wǎng)有限責任公司惠州供電局,惠州516001)
南方電網(wǎng)科技項目(No.K-GD2013-0706)
隨著電力系統(tǒng)自動化和信息化的發(fā)展,數(shù)字化電子設備不斷增多,各類相互獨立的監(jiān)控系統(tǒng)、地理信息系統(tǒng)和管理信息系統(tǒng)的投運,電力系統(tǒng)中產(chǎn)生的數(shù)據(jù)正在以指數(shù)速度增長[1]。隨著不同時期建立的各類信息系統(tǒng)之間的交互變得復雜,信息和設備等安全風險日益加劇,電力二次系統(tǒng)安全面臨前所未有的挑戰(zhàn)[2-3],調度操作人員也面臨著越來越大的決策壓力。
近年來,數(shù)據(jù)挖掘技術已經(jīng)在電力系統(tǒng)中得到越來越多的應用[4],包括電力系統(tǒng)安全評估、電網(wǎng)經(jīng)濟調度、負荷預測、故障診斷等方面[5]。這些研究主要集中在電力一次系統(tǒng)。在電網(wǎng)安全風險方面,電力一次系統(tǒng)的風險評已經(jīng)得到了比較深入的研究[6],而對二次系統(tǒng)安全風險研究主要包括從安全防御角度提出構想[7],從運維及安全管理角度進行系統(tǒng)設計[8],或者關注二次設備系統(tǒng)狀態(tài)監(jiān)測[9],數(shù)據(jù)分析與挖掘的研究尚較缺乏。
電力二次系統(tǒng)是指各級電力監(jiān)控系統(tǒng)和調度數(shù)據(jù)網(wǎng)絡以及各級管理信息系統(tǒng)和電力數(shù)據(jù)通信網(wǎng)絡構成的大系統(tǒng)[6],可實現(xiàn)人與一次系統(tǒng)的聯(lián)系監(jiān)視、控制,確保一次系統(tǒng)能安全經(jīng)濟地運行,因而是電力系統(tǒng)不可缺少的重要組成部分。包括控制和信號器具、測量儀表、繼電保護裝置、自動裝置、遠動裝置、操作電源及二次電纜等的電網(wǎng)二次設備成為了電力系統(tǒng)設備可靠性研究的重要組成部分[6]。本文從惠州供電局的二次設備數(shù)據(jù)管理的現(xiàn)狀及需求出發(fā),設計和實現(xiàn)了供電局二次設備基礎數(shù)據(jù)挖掘系統(tǒng),為降低電力二次系統(tǒng)安全風險整體水平,確保電力系統(tǒng)的安全高效運行提供決策支持。
系統(tǒng)總體技術框架如圖1所示。
在各異構數(shù)據(jù)源匯集到業(yè)務應用系統(tǒng)操作平臺的基礎上,二次設備基礎數(shù)據(jù)挖掘系統(tǒng)的數(shù)據(jù)處理與分析主要包括以下環(huán)節(jié):
(1)數(shù)據(jù)預處理
通過分析業(yè)務系統(tǒng)中的數(shù)據(jù),選取合適的數(shù)據(jù),并通過ETL(抽取、轉換、加載)得到提供給數(shù)據(jù)挖掘的完整和一致的綜合數(shù)據(jù)集。
(2)基礎統(tǒng)計
基礎統(tǒng)計提供基本的數(shù)理統(tǒng)計,一方面支持對數(shù)據(jù)的淺層分析,另一方面也可以作為后續(xù)特征分析或數(shù)據(jù)挖掘的預分析階段。
(3)特征分析
通過對特征進行描述性數(shù)據(jù)分析,選取合適的特征以及合適的特征生成參數(shù),如聚合粒度。
(4)數(shù)據(jù)挖掘
通過對業(yè)務需求的深入分析,選定開展的數(shù)據(jù)挖掘方法,開展數(shù)據(jù)挖掘工作[10]。主要的數(shù)據(jù)挖掘方法包括聚類方法、關聯(lián)分析、分類與預測等。
(5)知識表達
根據(jù)數(shù)據(jù)挖掘的結果,轉換為合適的知識表達,并進行初步評估,然后交給業(yè)務部門供決策支持用。

圖1 系統(tǒng)總體技術框架
2.1供電局二次設備數(shù)據(jù)分析
惠州供電局目前的二次設備數(shù)據(jù)管理的現(xiàn)狀是,雖然已經(jīng)有統(tǒng)一安裝實現(xiàn)的生產(chǎn)MIS系統(tǒng),但缺乏在其基礎上通過對二次設備數(shù)據(jù)的整合與挖掘,實現(xiàn)二次數(shù)據(jù)微觀、中觀乃至宏觀的統(tǒng)計、分析、綜合和推理,為二次設備的運維管理工作提供指導和決策參考;通過對數(shù)據(jù)分析,發(fā)現(xiàn)事件間的相互關聯(lián),利用已有的數(shù)據(jù)對未來二次設備的狀態(tài)、定值、潛在缺陷等內容進行預測。
通過業(yè)務需求分析,初步確定待分析的數(shù)據(jù)有:EMS系統(tǒng)告警信息、變電站信息、設備信息、告警類型信息、生產(chǎn)系統(tǒng)缺陷信息等,告警信息又分為:遙信變位、二次遙信告警、事故、遙測越限、遙控操作、遙信操作、遙測操作、SOE等數(shù)據(jù)。這些數(shù)據(jù)的關系如圖2所示。

圖2 待分析的二次設備數(shù)據(jù)
2.2系統(tǒng)主要功能模塊
系統(tǒng)的功能主要包括基礎數(shù)據(jù)管理、基礎統(tǒng)計和數(shù)據(jù)挖掘三個方面。如圖3所示。

圖3 系統(tǒng)功能結構圖
(1)基礎數(shù)據(jù)管理
主要包括用戶管理、變電站管理以及系統(tǒng)日志三個子模塊。用于設定統(tǒng)計分析范圍及數(shù)據(jù)挖掘的訪問權限控制與保留歷史操作痕跡。
(2)基礎統(tǒng)計
主要包括了對變電站告警信息不同范圍以及不同時間粒度的統(tǒng)計,可以按變電站、饋線進行統(tǒng)計,也支持年、月、日、時等不同時間粒度的統(tǒng)計。并且還包括了對SOE告警的延時統(tǒng)計,以及遙信抖動的統(tǒng)計。
(3)數(shù)據(jù)挖掘
關聯(lián)規(guī)則分析:采用經(jīng)典的Apriori算法挖掘告警信息流中的頻繁模式。得到在選定觀測時期內特定觀測窗口時間粒度的滿足設定的最小支持度閾值(min_sup)頻繁告警組合。在頻繁模式挖掘的基礎上進行關聯(lián)規(guī)則提取,分析同時滿足最小支持度閾值(min_sup)和最小置信度閾值(min_conf)的規(guī)則,得到關聯(lián)的告警。
聚類分析:采用經(jīng)典的K-mean聚類算法,基于告警統(tǒng)計信息,進行變電站告警狀況聚類,分離出不同種類的變電站。對聚類的結果進行進一步的類內分析(Intra-Cluster),配合專業(yè)人員的解讀,給出不同聚類群體的分析結論。
未來計劃繼續(xù)增加時間序列分析和分類預測等挖掘業(yè)務。
系統(tǒng)采用J2EE企業(yè)開發(fā)標準,使用SSH框架作為基本開發(fā)構建,使用可以擴展MVC經(jīng)典模式。MVC是一種使用Model View Controller(模型-視圖-控制器)設計創(chuàng)建Web應用程序的模式,在本系統(tǒng)中Model(模型)層對告警數(shù)據(jù)源進行抽取、轉換,并通過統(tǒng)計方法和數(shù)據(jù)挖掘算法建立數(shù)據(jù)分析模型,View(視圖)層以網(wǎng)頁方式把挖掘分析結果以各種圖表方式進行知識表達,建立用戶交互界面,Controller(控制器)層連通底層數(shù)據(jù)模型與用戶交互界面,為知識表達與數(shù)據(jù)分析模型之間提供傳輸通道。系統(tǒng)采用B/S結構進行開發(fā)。主界面如圖4所示,左邊是功能模塊欄目,右邊是信息展示窗口。
數(shù)據(jù)挖掘還支持過程數(shù)據(jù)展示,方便分析人員查閱數(shù)據(jù)挖掘過程的一些中間處理結果。如關聯(lián)規(guī)則分析,圖5所示,可以查看選定變電站每天的告警信息,還可以查閱選定事務窗口(步長)后的數(shù)據(jù)準備結果,并且可以提供刪除相似告警模式的功能。
數(shù)據(jù)挖掘的結果以方便提供輔助決策的知識展示,如關聯(lián)規(guī)則分析的結果包括帶支持度的頻繁項集,以及帶支持度和置信度的關聯(lián)規(guī)則,如圖6所示。

圖4 系統(tǒng)主界面

圖5 關聯(lián)規(guī)則分析挖據(jù)過程

圖6 關聯(lián)規(guī)則分析挖據(jù)結果展示
本文探討了面向二次系統(tǒng)安全風險控制的二次設備基礎數(shù)據(jù)管理與分析問題。從惠州供電局的二次設備數(shù)據(jù)管理的現(xiàn)狀和需求出發(fā),設計和實現(xiàn)了包含基礎統(tǒng)計和數(shù)據(jù)挖掘的決策支持系統(tǒng),可預期能為降低電力二次系統(tǒng)安全風險整體水平,確保電力系統(tǒng)的安全高效運行提供輔助決策。
[1]廖志偉,孫雅明.數(shù)據(jù)挖掘技術及其在電力系統(tǒng)中的應用[J].電力系統(tǒng)自動化,2011,25(11):62-66
[2]帥軍慶.特大型電網(wǎng)高級調度中心關鍵技術[M].北京:中國電力出版社,2010:220-224.
[3]Pearson ILG.Smart Grid Cyber Security for Europe[J].Energy Policy,2011,39(9):5211-5218.
[4]陳星鶯,張曉花,瞿峰,等.數(shù)據(jù)挖掘在電力系統(tǒng)中的應用綜述[J].電力科學與技術學報,2007,22(3):51-56.
[5]Mori H.State-of-Art Overview on Data Mining in Power Systems[C].IEEE Power Engineering Society General Meeting,Canada,2006.
[6]郭創(chuàng)新,陸海波,俞斌,等.電力二次系統(tǒng)安全風險評估研究綜述[J].電網(wǎng)技術,2013,37(1):112-118.
[7]胡炎,辛耀中,韓英鐸.二次系統(tǒng)安全體系結構化設計方法[J].電力系統(tǒng)自動化,2003,27(21):63-68.
[8]徐展強,陳家桐.電力二次系統(tǒng)運維及安全管理系統(tǒng)設計[J].電力信息化,2012,10(11):87-91
[9]袁浩,屈剛,莊衛(wèi)金,等.電網(wǎng)二次設備狀態(tài)監(jiān)測內容探討[J].電力系統(tǒng)自動化,2014,38(12):100-106.
[10]韓家煒,Micheline Kamber,裴健.數(shù)據(jù)挖掘概念與技術(第三版)[J].北京:機械工業(yè)出版社,2012.
Design and Implementation of Basic Data Mining System of Secondary Equipment
LIN Zhi-chao
(Huizhou Power Supply Bureau,Guangdong Power Grid Co.,Ltd.,Huizhou 516001)
林志超(1972-),男,惠州人,碩士,高級工程師,研究方向為繼電保護
2015-11-19
給出面向二次系統(tǒng)輔助決策的供電局二次設備基礎數(shù)據(jù)挖掘系統(tǒng)的技術框架,并從惠州供電局二次設備數(shù)據(jù)管理的現(xiàn)狀及需求出發(fā),設計數(shù)據(jù)挖掘系統(tǒng)的主要功能模塊,主要的數(shù)據(jù)分析功能包括基礎統(tǒng)計及關聯(lián)規(guī)則、聚類分析等數(shù)據(jù)挖掘方法。最后介紹系統(tǒng)實現(xiàn)。
二次設備;告警分析;數(shù)據(jù)挖掘
Presents the technical framework of the secondary equipment data mining system of Power Supply Bureau,which is designed for the decision support of the secondary system in power grid.The main system functional modules are designed based on the analysis of the current situation and requirement of secondary equipment data management in Huizhou Power Supply Bureau.Main data analysis methods include basic statistics,association rules,clustering analysis and other data mining methods.Finally,the implementation of the system is introduced.