祝宇楠,徐 晴,劉 建,田正其,周 超
(國網江蘇省電力公司電力科學研究院國家電網電能計量重點實驗室,江蘇南京210019)
數據挖掘在智能電能表故障分析中的應用
祝宇楠,徐晴,劉建,田正其,周超
(國網江蘇省電力公司電力科學研究院國家電網電能計量重點實驗室,江蘇南京210019)
自2009年推廣以來,全國范圍內已安裝運行數億只智能電能表,國家電網公司采取集中檢定模式對其進行裝出前的管理,并配套了用電信息采集系統監控其現場運行狀態,管理部門可在相應平臺上獲得智能電能表海量的質量數據。文中嘗試在矩陣實驗室(MATLAB)環境下,通過訓練神經網絡,建立現場智能電能表故障數據與檢定數據之間聯系,討論采用數據挖掘技術分析檢定數據以提前獲得智能電能表故障信息的可能性及有效性,為電能表的質量管控提供另一種工具。
智能電能表;數據挖掘;故障分析;神經網絡
隨著信息技術的發展,智能電能表突破傳統業務,集成了雙向多費率計量、實時互動、負荷控制、能效管理等多種功能,由此引入了系統復雜性,可靠性下降。自2009年推廣以來,全國范圍內已安裝運行智能電能表4億多只,不可避免地出現了由設計或工藝問題導致的設備故障。這些電表拆回后雖進行了故障分析,但由于數量多、故障原因繁雜、缺乏規模化分析手段,多數分析結果被當成個體、偶然發生的情況來處理,其反映的深層信息有待進一步研究;同時,未開展故障信息與其他質量數據之間的關聯性研究。
數據挖掘是從大量數據中發現并提取隱藏信息的過程[1],已有數據挖掘在用電及相關信息領域的應用實例。文獻[2]采用數據挖掘技術對AM I計量數據的電能誤差進行分析,發現超差電表,使校準有的放矢。文獻[3]研制了一套計量裝置在線監測和智能診斷系統,可運用數據挖掘技術對用戶違約用電竊電和計量裝置故障進行智能診斷。文獻[4]將數據挖掘技術與用電大數據信息化技術結合,通過臺區線損異常智能診斷模型,對臺區線損異常進行管理,提高了企業的經濟效益。文獻[5]在建立關口電能表性能狀態評估模型的基礎上,采用數據挖掘技術對檢測數據進行誤差變化趨勢分析、狀態研究、性能分析等。可見,采用數據挖掘可以發現傳統統計方法難以確立大量數據之間的隱形關系,為故障診斷等提供有效的分析手段。文中分析了電能表生命周期內的質量數據內容及其來源,然后通過基于神經網絡的數據挖掘技術分析大量智能電能表故障信息與其他質量信息的宏觀關聯性,以期通過數據之間內在聯系發現故障征兆。
1.1智能電能表生命周期
每一只智能電能表都帶有唯一的資產編號,其整個生命周期中,通過該資產編號可將時間維度上的所有質量數據聯系起來。智能電能表的生命周期按時間先后順序可分為以下4個階段。
(1)設計生產:智能電能表廠家依據產品標準、需求方特殊要求等進行表計的設計與生產,為每只電能表分配資產編號,并在出廠前進行參數設置、老化試驗等初步檢測;
(2)檢測驗收:供貨前質量監督信息的統計分析過程,包括到貨后抽樣樣品全性能檢測和整個到貨批次表計的全檢驗收。質量數據包括準確度、電氣要求、電磁兼容、通信功能、一致性、費率控制等試驗結果;
(3)現場運行:裝出后電能表將在現場工作運行,此過程中記錄的各種異常數據或異常事件有時能反映出自身質量缺陷或性能退化;
(4)退出運行:電能表不能正常工作被拆回分揀或超出規定運行時間退出現場運行,可能進行故障分析或分揀,提取故障質量信息。
電能表的質量數據在整個生命周期內是不斷變化和積累的,任何一個階段的質量數據都可能與故障信息相關。
1.2用電信息采集系統與智能電能表的集中檢定
現代的電能計量系統是由智能電能表、數據采集設備、主站及連接這些設備的通信網絡組成。國家電網公司在此基礎上建立了用電信息采集系統(EEDAS)。用電信息采集系統通過對配電變壓器及終端用戶進行用電數據的監測和采集,實現遠程付費、階梯電價、負荷管理,最終達到自動抄表、錯峰用電、用電檢查、負荷預測和節約用電成本等目的。EEDAS已積累了大量的電能表運行數據,蘊含著電能表狀態和性能信息。
另外,國家電網公司還建立了省級集中檢定制度,在供貨初期即對所有智能電能表進行計量檢定,只有符合檢定規范要求的電能表才能配送至現場運行。此過程中,裝出前誤差等反映其性能的檢定數據均記錄在省級計量中心生產調度平臺(MDS)上,這些信息目前僅代表檢定時電能表的某些性能,與電能表的長期性能、質量有無關聯尚無研究。
傳統的數據挖掘技術適用于線性、結構化的數據關系,由于智能電能表質量數據結構不統一,且非線性、持續性及噪音是普遍存在的,因此需要一種不同于傳統的理論和方法來解決大量質量數據關聯分析的問題[6]。在有足夠的數據且網絡足夠大的時候,神經網絡可高效地學習帶有非線性分類的結構模式[7]。基于神經網絡的數據挖掘算法步驟如下∶
(1)生成矩陣形式的數據表;
(2)確定輸出變量,生成輸出量向量表;
(3)確定神經網絡類型、內部算法參數、神經元數量等;
(4)將輸入數據表劃分為訓練集、驗證集、測試集三部分,初始化三者比例,驗證集、測試集中的示例數遠少于訓練集中的示例數;
(5)用訓練集的輸入輸出量訓練神經網絡;
(6)將驗證集提供給訓練好的網絡進行判別;
(7)將測試集提供給訓練好的網絡進行測試;
(8)若驗證、測試結果符合預期,則(9);否則,重新修改神經元數目、或更改訓練集、驗證集、測試集三者比例,重復(5—8);
(9)結束。
3.1故障數據預處理
將智能電能表故障進行分類并導入系統的數據表中備用。智能電能表的故障可分為硬件、軟件、通信3個方面的故障,其中硬件故障又可追溯至整機、模塊、元器件等3層級。國家電網公司在電能表質量管控相關管理辦法中總結了智能電能表的49種故障類型,在剔除外觀、安裝環境等原因明顯的故障類型后,典型的硬件故障按照模塊層級分類如表1所示。

表1 典型的模塊層級故障分類
表1中幾種故障類型均是在現場運行或退出運行環節中發現的,數據均記錄在EEDAS中。為了了解故障發生前,是否能從已有的檢測檢驗數據中發現故障隱患,需要將檢測檢驗數據進行整理。需要說明的是,若故障與檢測檢驗數據含有某種隱形關聯,這種關聯只能通過大量數據的趨勢體現出來。文中根據江蘇省級計量中心現有檢測檢驗手段,提取檢測環節中可獲得的63個實驗結果進行數據關聯分析,這63個試驗結果包括“制造商”、“檢定臺號”、各種平衡負載下的“相對誤差”、“平均誤差”、“采樣值”、“校核計度示數”、“時鐘日計時誤差”等各類數據。
3.2數據挖掘算法實現
數據挖掘的目的是找到輸入變量與每種故障的聯系,以及每個輸入變量(因素或特征)對每種故障的影響量有多大。將EEDAS中導出的所有故障電能表進行預處理后,分別通過唯一的資產編號從記錄檢定檢驗數據的MDS中找到對應的63類數據,生成數據表,作為數據挖掘算法的輸入(訓練項之一)。
為表述清楚起見,下文示例只選取“誤差超差”及“RS-485通信失敗”2種故障,這2種故障均為智能電能表的主要失效模式,示例重點研究上述63種檢測數據結果與這2種故障的關聯。
采用矩陣實驗室(MATLAB)神經網絡模式識別工具箱對輸入數據進行訓練。由于訓練過程中不僅需要上述故障信息,還需要非故障表的相關信息,因此,以1∶2的比例在EEDAS與MDS中隨機提取非故障表的63類數據,與故障數據表合成總數據表,作為模式識別工具箱的輸入。以三維向量[1,0,0],[0,1,0],[0,0,1]分別表示非故障表、通信模塊失效、計量模塊失效3種情況,即輸出量1,2,和3。輸出向量維數=失效模式數+1。
選取前饋神經網絡進行訓練,其具有1個隱藏層和1個輸出層。該神經網絡采用的內部算法為反向傳播共軛梯度法,停止準則選取均方差,當其小于給定閾值時,訓練停止。為得到更好的訓練效果,輸入輸出的向量順序在每次計算時都會重新調整。上述過程流程如圖1所示,選取的神經網絡如圖2所示。

圖1 用電能表數據訓練神經網絡過程流程

圖2 兩層前饋神經網絡

圖3 訓練集70%驗證集15%測試集15%及10神經元時的訓練結果

3.2訓練步驟及結果
為得到最佳訓練效果,設計以下2步訓練步驟。
(1)第Ⅰ步。固定訓練集、驗證集和測試集的比例,調整神經網絡隱藏層中的神經元數量:設定訓練集70%、驗證集15%、測試集15%,神經網絡隱藏層中的神經元數量范圍為10-1000。按照本文第2小結介紹的算法步驟對神經網絡進行訓練。圖3—5表示了神經元數量分別為10,100,1000時各自最好的訓練結果。圖4混淆矩陣中3個訓練結果正確率達到了100%,高于圖3和圖5。由此可見,固定訓練集、驗證集、測試集的比例時,100神經元可達到最好的訓練效果。
(2)第Ⅱ步。固定神經網絡隱藏層中的神經元數量,調整訓練集、驗證集和測試集的比例:固定神經網絡隱藏層神經元數100,調整訓練集、驗證集和測試集比例,圖6中為50%,25%,25%;圖7中比例調整為60%,20%,20%。訓練該神經網絡,圖6、圖7所示分別為各自情況中效果最好的一次,然而均不如比率為75%,15%,和15%時的情況(如圖4所示)。
分析訓練集70%、驗證集15%、測試集15%、100神經元時的訓練結果可知,智能電能表“誤差超差”及“RS-485通信失敗”2種故障與檢測檢驗環節中記錄的63個檢測量結果有一定的關系。按輸出結果顯示,根據檢測檢驗環節預測2種故障的正確性均為75%。

圖5 訓練集70%驗證集15%測試集15%及1000神經元時的訓練結果

圖6 訓練集50%驗證集25%測試集25%及100神經元時的訓練結果


圖7 訓練集60%驗證集20%測試集20%及100神經元時的訓練結果
采用基于神經網絡的數據挖掘技術對故障智能電能表故障分析數據與檢測檢驗環節的記錄數據進行了關聯性分析,驗證了通過前期的檢驗檢測數據預測運行環節中2種故障類型發生的可能性。值得注意的是,文中所訓練的神經網絡是采用6000只故障表和12 000只非故障表組成的數據集合,按照全國電網數以億計的智能表來算,文中所采用的數據遠遠不夠,要想得到準確性更高的預測結果,需將故障表的全集作為輸入數據對神經網絡進行訓練。分析結果可以幫助改進智能電能表的制造過程,制定更有針對性的批次輪換計劃,提高智能電能表整體質量。
[1]李欣.基于神經網絡的數據挖掘方法研究[D].大慶:大慶石油學院,2003.
[2]郭景濤.面向智能電網AM I的網絡計量關鍵技術與用戶用電數據挖掘研究[D].天津:天津大學計算機科學與技術學院,2011.
[3]肖堅紅,嚴小文,周永真,等.基于數據挖掘的計量裝置在線監測與智能診斷系統的設計與實現[J].電測與儀表,2014,51(14):62-67.
[4]宋玉,鄭海雁,尹飛.基于智能用電大數據分析的臺區線損管理[J].電力信息與通信技術,2015,13(8):132-135.
[5]張建偉,曹敏,王昕,等.基于數據挖掘技術的關口電能表檢測數據分析統計平臺設計[C]//2011年云南電力技術論壇-2011年云南電力技術論壇論文集(入選部分).昆明:云南省電機工程學會,2011.
[6]郭慶琳,祖向榮.基于神經網絡與遺傳算法的汽輪機組數據挖掘方法[J].電力自動化設備,2008,28(3):41-44.
[7]ABU-MOSTAFA Y.S,MAGDON-ISMAILM,LIN H.T.Learning from Data,AMLBook.com,2012.
Data M ining App lication in Smart M eter Fault Analysis
ZHU Yunan,XU Qing,LIU Jian,TIAN Zhengqi,ZHOU Chao
(StateGrid Key Laboratory of Electric EnergyMetering,State Grid Jiangsu Electric PowerCompany Electric PowerResearch Institute,Nanjing 210019,China)
Since 2009,hundredsofmillions of smartmeters havebeen installed nationwide.State Grid Corporation of China manages the asset by centralized inspection in large scale.Meanw hile,a system called Pow er User Electric Energy Data Acquire System wasbuiltup tomonitor the operation statusof thesemeters.Therefore,vastamounts of life-time data of the meters can be obtained from the centralized inspection system asw ell as the data acquire system.This paper proposed a way of establishing the connections between fault data and inspection data by training neural network under MATLAB environment.And then the possibility and effectiveness to obtain fault information of smartmeters in advance by datam ining isdiscussed,to providean alternativeway of quality controlof smartmeters.
smartmeter;datam ining;faultanalysis;neuralnetwork
TM 933.4
A
1009-0665(2016)05-0019-05
祝宇楠(1983),女,吉林人,工程師,從事電測量及電測儀器儀表工作;
徐晴(1973),女,江蘇南通人,研究員級高工,從事電測量及電測儀器儀表工作;
劉建(1981),男,河南信陽人,高級工程師,從事電測量及電測儀器儀表工作;
田正其(1987),男,江蘇南通人,工程師,從事電測量及電測儀器儀表工作;
周超(1987),男,江蘇宜興人,工程師,從事電測量及電測儀器儀表工作。
2016-07-05;
2016-08-08