高藝文1,龍 呈1,蘇學能1,石 鋮,高紅均
(1.國網四川省電力公司電力科學研究院,四川 成都 610041;2.四川大學電氣工程學院,四川 成都 610065)
配電網直接面向終端用戶,和生產生活息息相關,擔負著重要責任。然而,隨著中國配電網規模的不斷擴大,短路故障發生的次數也在不斷增多,若未及時識別并處理故障,可能會造成設備燒毀、大面積停電等危害。但是,目前市面上的各類終端質量良莠不齊,且施工水平和安裝環境都有較大的差異。這導致一部分終端可能會在配電網發生故障后漏報故障信號或在配電網正常運行時誤報誤傳故障信號[1]。因此,如何在不完備信息的狀況下快速準確地辨識、定位和處理配電網短路故障亟需研究。
文獻[2]提出一種基于粗糙集與決策樹的配電網故障診斷算法,實現了對故障樣本決策表進行無教師的規則提取。文獻[3]基于時序貝葉斯知識庫建立了故障定位模型,提出了一種故障元件與保護動作之間的時序信息表達,充分地利用了報警和時序信息。文獻[4]利用最小故障判定區域這一概念構建了故障指示器故障診斷模型,該模型可以一定程度上克服故障定位中信號漏報誤報的問題。文獻[5]對故障指示器的特點進行了相關的分析,基于此提出了一種組合信號故障診斷方法;文獻[6]通過對配電網故障后2 ms的零序電流進行經驗模態分解,提取其暫態分量中的高頻信號作為特征量,通過模糊神經網絡實現中性點非有效接地的中低壓配電系統的故障分類。文獻[7]提取了故障電流及電流變化率作為特征量,通過BP神經網絡實現電網的故障辨識與定位。但上述文獻仍存在一些問題:單一數據源會導致故障定位的準確率不高;傳統神經網絡算法可以達到比較高的準確率,但容易陷入局部極小值,而且存在迭代時間過長、收斂速度慢等問題。
隨著10 kV配電網數據實時監測系統的不斷完善,諸多區域的大量運行電氣量數據、故障數據等各類信息均可以實時上傳至各類系統。從配電側到用戶側的大量歷史數據,為配電網的行為分析、負荷預測、故障區段定位奠定了堅實的基礎。若能通過深度挖掘同類型數據中蘊含的特征信息以及不同類型數據間隱藏的關聯信息得知故障發生的原因和位置,甚至預知網絡中可能發生的故障,就可以為搶修工作提供一定的理論依據,達到更快更準確排除故障、恢復供電、減少停電損失的目的。但是,配電網大數據研究中數據庫值過多會導致數據過剩、故障診斷效率過低等問題,這些難題都會給配電網及時準確的故障定位帶來巨大的挑戰。
因此,下面基于配電網故障的非健全信息環境,提出將配用電信息系統所采集的多類數據與具有模糊匹配能力的Elman神經網絡相結合,進行10 kV配電網短路故障的區段定位。首先,以配用電信息系統中的多源數據為基礎,分析與配電網短路故障相關的各信號和電氣量,建立故障區段定位的數據特征庫。其次,針對數據特征庫過于龐大的問題,利用I-Relief算法來進行特征降維和篩選,選擇最佳的故障區段定位特征;然后,利用Elman神經網絡進行故障診斷與定位訓練,得到短路故障區段定位的模糊匹配模型;最后,通過實際算例證明了所構建模型的可行性。
配用電信息系統涵蓋了供電電壓檢測、配電變壓器負荷檢測、電能質量、用戶信息采集、可靠性分析等系統。這些系統實時搜集各類數據并上傳至數據中心,運用這些數據可以更加有效準確地對故障進行診斷及定位。配用電信息系統中所記錄的數據來源較為豐富,不僅包括電壓、電流、有功和無功功率等電氣量數據,還包括發生故障時的停電時間、停電區域、保護開關動作、告警信息等故障數據。
在傳統的故障區段定位中,往往只依據斷路器動作和保護動作來定位。但當故障電流較小時,很有可能難以捕捉信號從而不發生跳閘動作,若長期未發現故障,會導致電壓過高,加劇配電網的運行風險。并且當故障發生后,由于各種原因可能會導致監測數據缺失或者不準確。所以應當擴充故障診斷的數據源,通過挖掘多類數據找到可以直接或者間接反映故障位置及發生原因的數據類型,從而在不完備信息的前提下進行配電網故障區段定位。這里將故障區段定位的特征分為斷路器跳閘及保護信號與電氣量。
1)斷路器跳閘及保護信號
保護信號分為母差保護、電流保護、距離保護和差動保護信號等。當配電網發生單相接地故障時,若中性點有效接地,會產生較大的電容電流,此時相應的斷路器和保護裝置便會發生動作來切除故障轉移供電,此類信號較為明顯,可以有效地反映故障的發生。但是,當接地方式為非有效接地時,保護裝置很難察覺其微弱的變化,便需要結合其他電氣量數據來進行綜合判斷。
2)電氣量
配電網在發生各類故障后,即使斷路器和保護裝置未動作,但各系統所采集到的饋線側、配電變壓器側和用戶側的電流、電壓、有功和無功功率等電氣量數據都會發生不同程度的變化。當主線發生故障后,饋線側與配電變壓器側由于離故障位置距離更近,數據變化程度更加明顯;用戶側位置雖較遠,但結合多類數據的特征,也可以反映故障的位置和類型。上述電氣量的數值可以有效反映故障情況,其隨時間的變化率也是故障的重要表征之一。由于故障后的暫態信息量采集困難,只考慮穩態數據。
以斷路器跳閘及保護信號和電氣量作為故障診斷特征量,構建了數據特征庫,如表1所示。

表1 配電網短路故障診斷特征庫
配電網短路故障與網絡中的運行參數及設備質量等多類數據有著復雜的關聯。為了挖掘其關聯規則,首先需要選擇最佳特征以表征故障的發生及其類型。但由于故障診斷特征庫數量龐大,必然會出現故障特征較低或者特征冗余的現象,因此要選出特征性最強且特征之間相關性最弱的主要特征。
I-Relief算法是以特征與類別相關程度為基礎進行特征權重的計算,若某個特征在異類的樣本中差異度較大而在同類樣本差異度較小,則該特征有良好的表征能力。對于一個訓練數據集D,算法會從其中任意選擇一個樣本X,從和X同類以及異類的樣本中分別尋找k個最近鄰樣本集,之后對X和同類最近鄰樣本集、X和異類最近鄰樣本集在不同特征上的間隔進行比較。如果間隔越小,則該特征表征能力強,應加大其占比;反之,則減小其占比。I-Relief算法克服了傳統Relief算法在配電網短路故障區段定位應用中存在的弊病:1)傳統算法只能解決二分類問題,然而實際配電網中短路故障是一個典型的多分類問題,而I-Relief算法可以良好地解決多分類問題;2)由于特征庫中存在大量無用特征,若目標函數中的間隔采用的是平均間隔,當存在異常值時,平均間隔可能出現與預期不符的負值,導致算法性能大大削弱;而I-Relief算法通過引入概率加權平均間隔向量βi代替平均間隔向量αi,將最近鄰樣本視為一種潛在變量,采用期望最大化算法來解決近鄰信息的不確定性,可以良好地解決無關特征大量存在的問題。
將單相接地故障作為同類樣本,三相短路、兩相短路、兩相短路接地以及未故障作為異類樣本,I-Relief算法流程如下:
1)輸入的樣本集合D和特征集合A
(1)
式中:Xi為樣本;N為樣本總數;yi為樣本類別;C為類別數;a(j)為特征,I表示特征數,j=1,2,3…,I。
2)對特征值進行歸一化處理,且將樣本根據時間升序分為故障后樣本和故障前樣本。
3)初始化特征權重ω、樣本抽樣次數T、核參數ε、容許誤差γ。
4)任意選擇一個樣本Xi,在同類樣本集中找到近鄰樣本Hi,從異類樣本集中找到近鄰樣本Mi,且|Hi|=k,|Mi|=k。
5)計算加權平均間隔向量βi

(2)
(3)
(4)
式中:Xi,NM為樣本Xi的同類近鄰樣本;Xi,NH為樣本Xi的異類近鄰樣本;P(Xt=Xi,NM|ω)和P(Xt=Xi,NH|ω)分別為樣本Xt是樣本Xi異類最近鄰和同類最近鄰的概率;ω為特征的權重向量,ωT為向量轉置。
6)計算各個特征的權重
ωg=ωg-diff(g,Xi,Hi)/kT+diff(g,Xi,Mi)/kT
(5)
(6)
(7)
式中:Xig,NHn為樣本Xi的第n個同類近鄰的第g個特征值;Xig,NMn表示樣本Xi的第n個異類近鄰的第g個特征值。
7)利用線性規劃模型不斷更新權重,直至權重誤差小于核參數,輸出結果,作為下一步Elman神經網絡的輸入項來進行配電網故障區段定位。
神經網絡是通過對人腦的模擬,通過抽取樣本的重要特征,實現從輸入數據到輸出結果的連接,具有容錯性好以及自學習和自動匹配等信息處理能力。因此,神經網絡被廣泛應用于配電網的故障監測與診斷中。
與傳統的二分類器不同的是,Elman神經網絡面對非線性曲面仍然具有良好的逼近效果。且不同于一般的神經網絡,Elman神經網絡在第一層設置有反饋節點,可以記錄過往時刻的數據,并運用于下一時段的計算,正因為這個特點,導致了即使兩個Elman網絡擁有相同閾值和權值,也會因反饋節點的存在導致反饋具有較大差異,相同輸入的前提下也會有不同的輸出結果。
配電網短路故障區段定位具有動態性時空變化的特點,若使用本質為靜態空間建模的BP神經網絡必然會出現諸多問題。而Elman神經網絡這種反饋型網絡的特性在于其擁有一個中間層,它的輸出會到達狀態層,在這一層里進行信息存儲,再將輸出連接至中間層的輸入形成反饋,使得Elman神經網絡對輸入層數據的軌跡具有較高的敏感性。且由于網絡具有內部反饋特性,Elman神經網絡對動態信息的處理能力也變得更強,解決了BP神經網絡在反復迭代過程中速度較慢的問題。

圖1 Elman神經網絡模型
Elman神經網絡模型見圖1,包括輸入層、隱含層、連接層和輸出層。隱含層為tansig神經元,輸出層為purelin神經元,在這兩類神經元的特殊組合下形成的網絡傳遞函數,在隱含層的神經元數目足夠多時,可以在連續的有限時段內以足夠高的精度逼近復雜性較高的函數,從而滿足訓練需求。
Elman神經網絡的數學模型為
(8)
式中:w1、w2和w3分別為不同層之間的連接權矩陣;y(k)、x(k)和xc(k)為神經網絡、隱含層和承接層的輸出;u(k-1)為神經網絡的輸入。
Elman神經網絡的目標函數為誤差函數,通過反饋不斷調整權值參數和閾值參數從而最終輸出精度最優的結果。假設該神經網絡的輸出在第k步為yd(k),計算公式為
(9)
式中,T為轉置矩陣或轉置向量的表示符號。
Elman神經網絡在配電網故障區段定位的應用流程如下:首先,基于配電網短路故障的各類樣本對Elman神經網絡進行訓練;然后,確定其具體結構(傳遞函數和神經元數量)和參數(權值和閾值);最后,根據故障特征來對故障進行分類,完成故障集到特征集的連接映射。
基于Elman神經網絡的配電網短路故障區段定位方法如圖2所示。

圖2 配電網短路故障區段定位方法流程
為驗證所提方法的有效性,采用西南某地區近兩年所采集的數據進行10 kV配電網短路故障區段定位的算例分析。該地區電網共有358條10 kV母線和1976條10 kV饋線,其中,網絡的拓撲結構、終端數量和位置以及線路區段劃分均未發生變化的10 kV母線有304條,10 kV饋線有1542條。采用這些未變化的線路進行算例分析。10 kV 饋線側的數據來源為調度自動化系統和配電自動化系統;10 kV 變壓器側數據來源為配電變壓器負荷監測系統;用戶側數據來源為用戶信息采集系統。經過數據篩選與清洗后,將信息不完整和錯誤的數據剔除,提取出近兩年發生的具有完整、準確的特征數據、故障位置和故障類型的1000條配電網短路故障記錄,基于此構建挖掘庫和測試庫。這兩個庫中分別包括500條數據記錄。挖掘庫中故障類型包括三相短路、兩相短路接地、兩相短路和單相接地故障。挖掘庫和測試庫中具有完全相同的數據樣式,唯一的區別是挖掘庫含有故障的具體類別和位置信息,用于分析獲取規則,而測試庫中并未包含任何故障具體信息,用于測試模型的可行性。
首先以前面所建立的斷路器跳閘及保護信號和電氣量等條件特征作為候選特征量,構建了數據特征庫,利用I-Relief算法對特征庫中各特征的故障表征能力進行刻畫與篩選,得到權重較高即表征能力最強的6個關鍵特征及其權重如表2所示。其中,配電變壓器故障相電流變化率、配電變壓器故障相電壓、饋線電流、配電變壓器非故障相電壓、用戶非故障相電流變化率和用戶故障相電流變化率的候選特征權重都在0.12左右,因此選擇這6個候選特征量作為Elman神經網絡的輸入。

表2 特征權重
對比所提基于挖掘庫數據的訓練分別得到的Elman神經網絡模型和BP神經網絡模型,利用兩者分別進行配電網短路故障區段定位測試,診斷準確率對比如表3所示。

表3 Elman和BP診斷準確率對比
在本算例測試下,基于所提方法的配電網短路故障區段定位的準確率較高,全部達到95%以上,均高于BP神經網絡模型。
從時間上來看,由仿真的迭代訓練曲線(圖3)知,Elman網絡訓練次數只要130次就到達設置的誤差精度,而從輸入數據進行訓練到輸出測試結果,BP神經網絡模型花費24 s,而Elman神經網絡模型僅花費6.9 s,定位速度大大提升。綜上所述,不論是在短路故障區段定位的準確率上,還是收斂速度上,Elman神經網絡比BP神經網絡所用時間更少,速度更快、更高效。

圖3 Elman神經網絡訓練曲線
為了進一步測試所提方法在出現各類特征數據信息錯誤、不完整以及故障定位漏報、誤報情況下的準確率,從近兩年的歷史數據中挑選出160條不完備信息,分別添加80條至原來的挖掘庫和測試庫中,每條不完備信息的不完備率保持在10%到25%。在此情況下再次進行測試分析,準確率對比如表4所示。

表4 不完備信息下Elman和BP診斷準確率對比
在本算例中,由于存在數據錯誤或缺失的情況,BP神經網絡模型準確率下降到了85%以下。同樣,Elman神經網絡模型準確率也下降至90%左右,雖然兩者準確率均有一定幅度的下降,但Elman神經網絡模型進行故障研判的準確率仍在可接受范圍之內。
而從時間上來看,從輸入數據進行訓練到輸出測試結果,BP神經網絡模型花費40 s,而Elman神經網絡模型花費10.4 s,都花費了更久的時間。
綜上所述,當原始數據信息正確時,用所建模型進行故障診斷不僅準確率高且速度較快;而當原始數據存在不完備的情況時,雖然與數據完備時相比準確率有所下降且速度變低,但依然在可接受范圍內,說明所做模型具有良好的容錯性和實用性。
快速、精確的配電網短路故障區段定位對提高供電可靠性具有重要意義。上面基于配電網的多類數據,提出了配電網短路故障區段定位方法:
1)以配用電信息系統中的數據為基礎,構建了兼具電氣量、保護量與開關量特征的10 kV配電網短路故障診斷特征庫。
2)所提主法不像傳統故障研判方法一樣只采用單一指標來進行判斷,而是在故障診斷特征庫的基礎上,采用I-Relief算法從特征庫中篩選出6個權重最高的故障診斷關鍵特征量,作為神經網絡的輸入項。采用具有模糊匹配特性的Elman神經網絡進行模型訓練,利用多源數據不斷挖掘其內部信息得到配電網短路故障區段定位模型。
最后,以西南某地區電網為例進行數據計算驗證,從仿真結果分析可知,所建的模型能高效地對10 kV配電網短路故障進行區段定位,相比于BP神經網絡,其具有較高的速率和準確度。在數據不完備的環境下具有良好的容錯性,能夠為故障的及時發現提供一定的理論依據。