楊世海,李 濤,陳銘明,陳 晶,李志新
(1.國網(wǎng)江蘇省電力公司電力科學(xué)研究院,江蘇 南京 210019;2.福建億榕信息技術(shù)有限公司,福建 福州350003)
基于數(shù)據(jù)挖掘的智能電網(wǎng)在線故障診斷與分析
楊世海1,李 濤2,陳銘明1,陳 晶2,李志新1
(1.國網(wǎng)江蘇省電力公司電力科學(xué)研究院,江蘇 南京 210019;2.福建億榕信息技術(shù)有限公司,福建 福州350003)
基于智能電網(wǎng)故障在線診斷與分析的目的,本文采用基于關(guān)聯(lián)規(guī)則挖掘改進(jìn)的Apriori算法,分析了電網(wǎng)三態(tài)數(shù)據(jù)的特性,并利用關(guān)聯(lián)規(guī)則建立測試數(shù)據(jù)庫,用于故障診斷在線挖掘;對傳統(tǒng)的Apriori算法進(jìn)行改進(jìn),使其只在起始掃描數(shù)據(jù)庫一次,用以獲取當(dāng)前所有項(xiàng)集的支持度計(jì)數(shù),解決了原算法多次掃描數(shù)據(jù)庫的弊端,明顯提高了在線挖掘效率。工程應(yīng)用測試結(jié)果表明,該算法可有效提高在線故障診斷的實(shí)用化水平,具有很好的工程應(yīng)用價(jià)值。
智能電網(wǎng);故障信息;聯(lián)合規(guī)則挖掘;在線故障診斷
隨著智能電網(wǎng)相關(guān)技術(shù)在國內(nèi)的發(fā)展與普及,其自我感知、自我檢測、自我預(yù)防成為電網(wǎng)所必需的智能運(yùn)行能力[1]。其中,自我故障診斷能力具有重要作用,即當(dāng)電網(wǎng)發(fā)生故障時(shí),如何從海量故障數(shù)據(jù)中提取有效信息,自動(dòng)、快速地診斷電網(wǎng)中的故障設(shè)備,輔助調(diào)度運(yùn)行人員及時(shí)處理,成為目前故障在線診斷所急需解決的問題。
傳統(tǒng)的電網(wǎng)在線故障診斷通常基于單一數(shù)據(jù)源,這使得其診斷結(jié)果在正確性、實(shí)時(shí)性及全面性等方面難以達(dá)到預(yù)期效果,以致未能在調(diào)度中心得以實(shí)用[2]。因此,國內(nèi)外諸多學(xué)者針對電網(wǎng)故障的多數(shù)據(jù)源特性先后提出了多種電網(wǎng)故障診斷方法,如專家系統(tǒng)[3]、模糊理論[4]、信息理論[5]等,然而以上方法對于處理海量數(shù)據(jù)信息的能力和不確定故障信息的容錯(cuò)性仍不甚理想。因此近年來有關(guān)數(shù)據(jù)挖掘的相關(guān)技術(shù)被應(yīng)用于電網(wǎng)故障診斷,并取得了較理想的研究成果[6-7],其中,關(guān)聯(lián)規(guī)則挖掘因?qū)Q策的生成具有重要的實(shí)用價(jià)值而備受關(guān)注[8-10],但應(yīng)用于電網(wǎng)故障診斷方面的成果并不多,如文獻(xiàn)[9-10]分別分析了故障信息序列中必有或特有的信息,提出了對應(yīng)的關(guān)聯(lián)規(guī)則挖掘方法。
基于此,文中結(jié)合電網(wǎng)三態(tài)數(shù)據(jù)的特性,將基于關(guān)聯(lián)規(guī)則挖掘改進(jìn)的Apriori算法應(yīng)用于電網(wǎng)在線故障診斷中。利用關(guān)聯(lián)規(guī)則建立建立用于故障診斷在線挖掘的測試數(shù)據(jù)庫;對傳統(tǒng)的Apriori算法進(jìn)行改進(jìn),使其只在起始掃描數(shù)據(jù)庫一次,用以獲取當(dāng)前所有項(xiàng)集的支持度計(jì)數(shù),解決了原算法多次掃描數(shù)據(jù)庫的弊端,明顯提高了在線挖掘效率。工程應(yīng)用算例測試結(jié)果表明,該算法可有效提高在線故障診斷的實(shí)用化水平,具有較高的工程應(yīng)用價(jià)值。
智能電網(wǎng)故障診斷以反映電網(wǎng)設(shè)備故障信息為基礎(chǔ),在線故障診斷所需采集的原始數(shù)據(jù)有:穩(wěn)態(tài)數(shù)據(jù)的開關(guān)變位、保護(hù)告警/動(dòng)作事件、斷路器狀態(tài)、隔離開關(guān)狀態(tài)、保護(hù)定值、通道狀態(tài)、動(dòng)態(tài)數(shù)據(jù)的電壓、電流突變以及暫態(tài)數(shù)據(jù)的電壓、電流突變等,其電網(wǎng)故障數(shù)據(jù)源特性如表1所示。
從時(shí)間維角度可知,電網(wǎng)發(fā)生故障后,穩(wěn)態(tài)和動(dòng)態(tài)數(shù)據(jù)的上送時(shí)間比暫態(tài)數(shù)據(jù)要短的多,故應(yīng)盡量利用穩(wěn)態(tài)和動(dòng)態(tài)數(shù)據(jù);而從空間維角度來看,利用穩(wěn)態(tài)數(shù)據(jù)可實(shí)現(xiàn)故障范圍的全方位監(jiān)視[11-13]。目前,電網(wǎng)故障時(shí)存在的數(shù)據(jù)丟失、上送速度慢及電網(wǎng)正常運(yùn)行時(shí)存在的誤遙信等因素使得3種狀態(tài)的故障數(shù)據(jù)不穩(wěn)定,進(jìn)而導(dǎo)致在線故障診斷實(shí)用化程度較低[12],因此,在線故障診斷在算法設(shè)計(jì)過程中需要充分考慮電網(wǎng)數(shù)據(jù)現(xiàn)狀,綜合運(yùn)用調(diào)度端的多源信息進(jìn)行分析,以減小數(shù)據(jù)可靠性不高對在線故障診斷正確率的影響。

表1 電網(wǎng)故障數(shù)據(jù)源特性
2.1 測試數(shù)據(jù)庫及關(guān)聯(lián)規(guī)則模型的建立
設(shè)C={C1,C2,…,Cm}表示保護(hù)測試條件,D={O}為保護(hù)的動(dòng)作狀況,其中Ci(0≤i≤m)和O都是概念層。保護(hù)測試數(shù)據(jù)庫為T={T1,T2,…,Tn}。T中的每個(gè)元祖 Ti(1≤i≤n)的表示形式為(c1,c2,…,cm,0),其中ci∈Lset(Ci),0∈Lset(0)。在數(shù)據(jù)被存入T之前,對各數(shù)據(jù)進(jìn)行離散化處理[14-15]。
保護(hù)測試關(guān)聯(lián)規(guī)則是形如X?Y的蘊(yùn)涵式,其中,X,Y分別是C和D的模式。規(guī)則X?Y在事務(wù)集W中成立,具有支持度s,其中s是中事務(wù)W包含X∪Y的百分比。規(guī)則X?Y在事務(wù)集W中具有置信度c,其中c是中事務(wù)W包含X的事務(wù)同時(shí)也包含Y的百分比。用相關(guān)規(guī)則表示模式X與模式Y(jié)之間的相關(guān)度:

根據(jù)概率論,若P(X∪Y)=P(X)P(Y)成立,則說明模式X的出現(xiàn)時(shí)獨(dú)立于模式的,若相關(guān)度大于1說明模式X和Y是正相關(guān)的。
2.2 Apriori改進(jìn)算法設(shè)計(jì)
Apriori算法是一種挖掘單維關(guān)聯(lián)規(guī)則頻繁項(xiàng)集的算法,使用逐層搜索迭代,由連接和剪枝兩步構(gòu)成。但該算法在挖掘過程中存在一定的不足:如需多次掃描數(shù)據(jù)庫以確定各個(gè)候選項(xiàng)集的支持度計(jì)數(shù);運(yùn)算時(shí)間受頻繁項(xiàng)集長度影響顯著。針對上述問題,此處提出一種改進(jìn)方案,其改進(jìn)后的算法執(zhí)行流程如圖1所示,其具體步驟為:
1)對D進(jìn)行首次掃描,并對其中的各單項(xiàng)事務(wù)統(tǒng)計(jì)支持度,產(chǎn)生候選l-項(xiàng)集C1。從項(xiàng)集C1中刪除支持度計(jì)數(shù)小于最小支持度的項(xiàng)[16],從而得到頻繁l-項(xiàng)集L1;
2)建立各單項(xiàng)事務(wù)統(tǒng)計(jì)的事務(wù)總列表;
3)利用L1自連接生成候選2-項(xiàng)集C2及其對應(yīng)的各單項(xiàng)事務(wù)列表,并進(jìn)行項(xiàng)集的求交集運(yùn)算;
4)由上一步運(yùn)算得到的中間候選項(xiàng)集C2確定侯選集C2,最終生成頻繁2-項(xiàng)集L2;
5)依次重復(fù)步驟3)直到不再產(chǎn)生新的候選項(xiàng)集即完成挖掘。
3.1 算法改進(jìn)性能驗(yàn)證
在進(jìn)行系統(tǒng)性能實(shí)測之前,需建立故障數(shù)據(jù)挖掘庫,并驗(yàn)證改進(jìn)算法的優(yōu)越性。以福建省供電公司近3年內(nèi)的收集200余次故障記錄數(shù)據(jù)為基礎(chǔ),建立容量為200項(xiàng)的數(shù)據(jù)挖掘庫,容量為20項(xiàng)的無故障測試數(shù)據(jù)庫,并在某服務(wù)器上進(jìn)行挖掘算法測試,其測試內(nèi)容為在挖掘庫中增加50項(xiàng)不良記錄,用于模擬故障事件中的丟失信息、錯(cuò)誤信息和冗余信息,檢驗(yàn)程序的健壯性。分3次測試,第1次測試為只挖掘200項(xiàng)正常的故障記錄;第2次為在增加30項(xiàng)有缺失信息和20項(xiàng)有冗余信息的挖掘測試;第3次為10項(xiàng)有缺失信息和40項(xiàng)有冗余信息的挖掘測試。測試結(jié)果如表2所示,可看出,利用改進(jìn)算法產(chǎn)生的規(guī)則對測試庫中20項(xiàng)故障記錄進(jìn)行診斷,規(guī)則匹配度全部達(dá)到0.8以上,且效率大為提高。在有缺失信息的情況下,適當(dāng)降低可信度仍然可以挖掘出有效的規(guī)則;冗余信息對挖掘的影響較小,說明該算法可把握重要關(guān)聯(lián)規(guī)則,濾除干擾。
3.2 在線故障診斷測試
為測試算法的在線故障診斷功能,以圖2所示的故障電網(wǎng)局部拓?fù)浣Y(jié)構(gòu)為例,進(jìn)行實(shí)地在線診斷。其測試信息序列如表3所示。該改進(jìn)算法診斷的故障結(jié)果為 “線路1過負(fù)荷保護(hù)動(dòng)作,切除線路1成功;線路2中DL2差動(dòng)保護(hù)動(dòng)作電流差動(dòng)保護(hù)動(dòng)作,切除線路2成功,重合閘失敗,引起相鄰線路三相過負(fù)荷誤動(dòng),匹配度0.81,建議檢查過負(fù)荷保護(hù)”。事后分析證明過負(fù)荷保護(hù)和電流差動(dòng)保護(hù)均為誤動(dòng),診斷基本正確。

圖1 Apriori改進(jìn)算法流程圖

表2 不良數(shù)據(jù)記錄的挖掘測試結(jié)果

圖2 故障電網(wǎng)局部拓?fù)鋱D

表3 電網(wǎng)局部主要故障序列
文中研究了智能電網(wǎng)故障在線診斷問題。結(jié)合電網(wǎng)三態(tài)數(shù)據(jù)的特性,利用關(guān)聯(lián)規(guī)則建立建立用于故障診斷在線挖掘的測試數(shù)據(jù)庫;改進(jìn)了傳統(tǒng)的Apriori算法,解決了原算法多次掃描數(shù)據(jù)庫的弊端,減小了計(jì)算量。工程應(yīng)用算例測試結(jié)果表明,該算法可有效提高在線故障診斷的實(shí)用化水平,具有較高的工程應(yīng)用價(jià)值,對智能電網(wǎng)的建設(shè)和應(yīng)用推廣也應(yīng)具有很好的經(jīng)濟(jì)效益和社會(huì)效益。
[1]姚建國,嚴(yán)勝,楊勝春,等.中國特色智能調(diào)度的實(shí)踐與展望[J].電力系統(tǒng)自動(dòng)化,2009,33(17): 16-20.
[2]陳玉林,陳允平,孫金莉,等.電網(wǎng)故障診斷方法綜述[J].中國電力,2006,39(5):27-31.
[3]杜一,張沛超,郁惟鏞.基于事例和規(guī)則混合推理的變電站故障診斷系統(tǒng) [J].電網(wǎng)技術(shù),2004,28(1):34-37.
[4]周明,任建文,李庚銀.基于模糊推理的分布式電力系統(tǒng)故障診斷專家系統(tǒng) [J].電力系統(tǒng)自動(dòng)化,2001,25(24):33-36.
[5]湯磊,孫宏斌,張伯明.基于信息理論的電力系統(tǒng)在線故障診斷 [J].中國電機(jī)工程學(xué)報(bào),2003,23(7):5-11.
[6]于之虹,郭志忠.基于數(shù)據(jù)挖掘理論的電力系統(tǒng)暫態(tài)穩(wěn)定評估[J].電力系統(tǒng)自動(dòng)化,2003,27(8): 45-48.
[7]孫雅明,廖志偉.基于事件序列數(shù)據(jù)挖掘原理的高壓輸電線系統(tǒng)故障診斷[J].電力系統(tǒng)自動(dòng)化,2004,28(5):20-24.
[8]張?jiān)茲谥卫猓瑥埢?關(guān)聯(lián)規(guī)則中頻繁項(xiàng)集高效挖掘的研究[J].計(jì)算機(jī)工程與應(yīng)用,2011(3): 139-141.
[9]張斌,孫哲.關(guān)聯(lián)規(guī)則技術(shù)在電力系統(tǒng)中的應(yīng)用[J].電網(wǎng)技術(shù),2007,5(1):63-66.
[10]李再華,白曉民,周子冠,等.基于特征挖掘的電網(wǎng)故障診斷方法[J].中國電機(jī)工程學(xué)報(bào),2010,30(10):16-22.
[11]Hirokane M,Kouno S,Nomura Y.Extraction of minimum decision algorithm using rough sets and genetic algorithms [C].The Sixth International Conference on Machine Learning and Applications,Kansai University,Osaka,2007.
[12]Chen-Ching L,Marino S,Hanjin Miao.On-line fault diagnosis using sequence-of-events recorder information[J].IEEE Transactions on Automatic Control,1996,31(7):339-344.
[13]閃鑫,趙家慶,張劍,等.基于三態(tài)數(shù)據(jù)的電網(wǎng)在線綜合故障診斷[J].電力系統(tǒng)自動(dòng)化,2012,36(23):79-84.
[14]劉海蓉,閨仁武.一種改進(jìn)的加權(quán)關(guān)聯(lián)規(guī)則挖掘算法[J].現(xiàn)代電子技術(shù),2011,21(12):51-54.
[15]董志赟,樂全明,鄭華珍,等.高壓電網(wǎng)子站故障選線診斷新方案研究[J].繼電器,2006,34(10): 7-11.
[16]朱金壇,數(shù)據(jù)挖掘Apriori算法的改進(jìn)[J].電子設(shè)計(jì)工程,2013,21(15):37-40.
On-line fault diagnosis and analysis of smart power grid based on data mining
YANG Shi-hai1,LI Tao2,CHEN Ming-ming1,CHEN Jing2,LI Zhi-xin1
(1.State Grid Jiangsu Electric Power Research Institute,Nanjing 210019,China;2.Fujian Yirong Information Technology co.,LTD.,F(xiàn)uzhou 350003,China)
For the purpose of on-line fault diagnosis and analysis for smart power grids,this paper designed the improved Apriori algorithm based on united rules mining.Through analyzing the features of power grid three state data,test database which would be used for on-line fault diagnosis was found by using united rules.The traditional Apriori algorithm was improved to scan the database initially,in order to observe the frequency counting of all present itemsets,which solved the shortage of scanning the database frequently,and increased the efficiency on on-line mining.The results of engineering application tests indicated that the algorithm proposed in this paper could enhance the practical level of on-line fault diagnosis,which had good project application benefit.
smart power grid;fault information;united rules mining;on-line fault diagnosis
TN87
:A
:1674-6236(2017)01-0136-04
2015-12-28稿件編號:201512282
楊世海(1976—),男,安徽合肥人,碩士研究生,高級工程師。研究方向:電力系統(tǒng)自動(dòng)化與電能計(jì)量技術(shù)。