張 耀,姚 瑤,陳 卓,袁子霞,熊國江
(1.貴州電網有限責任公司電力調度控制中心,貴州 貴陽 550002;2.貴州大學電氣工程學院,貴州 貴陽 550025)
電力系統故障診斷(fault section diagnosis,FSD)是指通過數據采集系統(supervisory control and data acquisition,SCADA)得到的保護繼電器(protective relays,PRs)和斷路器(circuit breakers,CBs)動作與否的信息來識別故障區段[1]。在電力系統發生故障時,首要的是隔離故障,降低事故范圍,解決故障,從而實現快速恢復供電。因此,對故障實現快速準確的診斷至關重要。當區段發生故障時,首先是其對應的主保護繼電器運行,使得相應的斷路器跳閘,從而隔離故障,降低故障范圍。在隔離故障的過程中,繼電保護系統的動作存在不確定性,如果主保護繼電器或者其對應的斷路器由于某些原因未正確動作,則激活其后備保護以隔離故障。但是在實際過程中,繼電器和斷路器都會存在誤操作、誤動作的可能性,從而導致不確定性增加,這些不確定性會使得FSD的診斷準確率和效率大大降低。針對此類問題,有很多學者提出了不同的方法來解決。
現如今,主要的FSD方法主要包括專家系統[2-4]、貝葉斯網絡[5-7]、Petri網[8-10]、解析模型[11]和神經網絡[12-14]等。基于專家系統的FSD方法通過模擬專家的邏輯建立規則庫,通過與規則庫的對比實現故障診斷,但是針對大規模電網,建立和更新規則庫都面臨著巨大的困難。基于貝葉斯網絡和Petri網的FSD方法都能夠比較直觀地揭示診斷過程,具有較好的解釋性,但是此類方法容錯率較低,面對復雜故障時常常無法正確診斷。基于解析模型的FSD方法的診斷性能依賴于算法的性能和所構建模型的完整性。這些方法在FSD問題上都各有優勢,但是根據無免費午餐定理,如何不斷提高診斷性能仍然存在很多可探索的方向。
神經網絡方法在解決FSD問題上,由于其容錯性好、診斷效率高、泛化能力強等特點成為熱點研究對象。文獻[12]通過將遺傳算法與BP神經網絡結合來解決FSD問題,但BP神經網絡容易陷入局部最優;為解決這個問題,文獻[13]提出將模糊集理論與徑向基函數神經網絡RBF相結合用于該問題;為了適應電網拓撲結構變化,文獻[14]針對電力系統中的元件(線路、變壓器、母線)建立RBF神經網絡。
常用的神經網絡如BP神經網絡、RBF神經網絡都有一個共同的問題,即神經網絡的內部連接權值和閾值需要根據當前模型的輸出值不停地進行調整,當電力系統規模較小時,診斷故障的時間較短,但是當電力系統規模增大時,不停地對參數進行調整則會浪費掉很多時間[15]。而極限學習機(extreme learning machine,ELM)[16]神經網絡可以避免這個問題,因為ELM的部分權重和閾值只需要在初始化階段隨機給定,在整個診斷過程中不需要對其再進行循環調整,這在極大程度上解決了其他常用神經網絡需要不停調整參數的問題。
但是ELM神經網絡的隱含層神經元個數需要提前給定,隱含層神經元個數過少則泛化能力不夠,不能正確診斷出故障,如果過多則會導致過擬合且浪費計算資源。對此,本文選用進化算法對隱含層神經元個數進行尋優。粒子群算法(particle swarm optimization,PSO)[17]和差分進化(differential evolution,DE)算法[18]是最常用的進化算法,但是基本PSO容易陷入局部最優,而DE算法收斂精度不高。考慮到兩者具有互補的優勢,本文提出采用一種多重隨機變異的粒子群差分進化算法(particle swarm differential evolution with multiple random mutation,MRPSODE)來提高ELM隱含層神經元個數的尋優能力。MRPSODE在DE的基礎上加入了PSO的策略,可以很好地實現優勢互補,從而克服兩者的不足[19]。考慮到原始故障樣本數據可能遭受到噪聲的干擾,影響樣本質量,本文采用交叉驗證方法對樣本數據進行處理,降低噪聲對最終實驗結果的影響。最后通過仿真對比分析驗證了所提FSD方法的診斷性能。
ELM作為一種簡單但效果良好的機器學習技術,在大數據時代得到了廣泛的應用。同時,ELM是針對單隱層前饋網絡的有效解決方案之一,其具有學習速度快、泛化能力強和學習精度好等特點。傳統的神經網絡算法常常需要對內部參數進行大量的計算,如傳統的BP算法需要在模型的訓練過程中根據網絡的期望輸出和實際輸出之間的差值不斷調整權重值,但容易陷入局部尋優。而ELM作為單隱層前饋神經網絡,隨機生成隱含層的參數,在模型的訓練過程中不需要調整,即ELM在獲取訓練樣本之前就可以實現隱藏節點的建立[20]。理論上,ELM即使不更新隱藏層的參數,也能保持其通用逼近能力[21],因此不像傳統的基于反向傳播BP神經網絡容易產生局部最優,同時ELM的最小二乘問題的求解速度比傳統BP的梯度方法以及標準向量機的二次規劃問題快很多。因此,ELM的泛化性能更好,學習速度更快。ELM的結構如圖1所示,n為輸入層節點數,m為輸出層節點數。

圖1 ELM結構
假設具有L個隱藏節點,N個訓練樣本,隱含層激活函數為p(·)的ELM可表示為
(1)

上述方程可以簡寫為
Hβ=O
(2)
H被稱為ELM的隱藏層輸出矩陣。ELM可以通過求解式(3)的最小二乘解得到唯一解。
(3)
求解式(3)可得
β=H?O
(4)
式中:H?為矩陣H的廣義逆矩陣。
綜上,在已確定L個隱藏節點的基礎上,ELM可以總結為以下步驟:
a.隨機分配隱含層節點參數(輸入權值和閾值)。
b.利用激活函數計算隱含層的輸出。
c.利用最小二乘法計算輸出權重,解析確定輸出層的權重。
PSO受鳥類獲取食物的啟發在1995年被提出。具有NP個粒子的種群在給定D維解空間被隨機初始化,通過適應度函數評估每個粒子的適應度值,在第t代第i個粒子的速度和位置狀態屬性更新為:
vi,t+1=ρ·vi,t+c1·rand1·(pbest,t-xi,t)+
c2·rand2·(gbest,t-xi,t)
(5)
xi,t+1=xi,t+vi,t+1
(6)
在迭代過程中,每個粒子根據當前的個體極值最優pbest和全局最優gbest更新其速度和位置,以便尋找到最優解。其中,ρ為權重因子;c1、c2為學習因子;rand1、rand2為[0,1]內隨機生成的實數。
DE算法經過變異、交叉和選擇過程完成種群進化。
a.變異。DE算法采用變異操作針對每個目標向量xi,t生成突變向量ki,t+1。其中一種常用的變異策略DE/current-to-rand/1為
ki,t+1=xi,t+F·(xr1,t-xi,t)+F·(xr2,t-xr3,t)
(7)
式中:r1、r2、r3為互斥整數;F為縮放因子。
b.交叉。將目標向量xi,t和突變向量ki,t+1混合,通過交叉得到試驗向量ui,t+1,即
(8)
式中:j=1,2,…,D;CR為交叉概率。
c.選擇。通過計算目標向量xi,t和突變向量ki,t+1的適應度值,較小者保存進下一代中,即
(9)
MRPSODE是基于DE算法提出的一種改進算法,它有效解決了基本DE算法收斂緩慢而導致收斂精度不高的問題。MRPSODE將PSO的更新策略引入DE算法中,從而實現全局收斂能力的提高,同時選用DE/current-to-rand/1的突變策略增加種群多樣性避免陷入局部最優[19]。為了平衡算法的探索和開放能力,MRPSODE結合了3種變異策略,3種變異策略可以有效地發揮各自的優勢,彌補其他策略的不足,從而具有良好穩定性和收斂性的同時保證種群多樣性。針對每個個體,MRPSODE采用參數Pr(取值0.9)和RM(0和1之間隨機數)來確定該個體所采用的變異策略:
a.如果某個隨機數rand小于概率參數Pr,且RM小于0.5,則
(10)
b.如果某個隨機數rand小于概率參數Pr,且RM不小于0.5,則
ki,t+1=xi,t+F·(xr1,t-xi,t)+F·(xr2,t-xr3,t)
(11)
c.否則,有
ki,t+1=xmin+rand·(xmax-xmin)
(12)
式中:xmin和xmax分別為個體位置下限和上限。
值得說明的是,除了變異策略選擇機制外,MRPSODE的其余部分與基本DE保持一致。
ELM的輸入輸出取決于具體的仿真案例,權重和閾值在初始化階段被隨機給定,所以ELM還有一個重要的參數需要給定,那就是隱含層的節點數目。為了確定最佳的隱含層節點數目,常常采用在取值范圍內進行試錯的方法。當取值范圍很大時試錯法需要對每個可能取值進行計算,整個計算過程需要花費很多時間和精力。而利用進化算法可以比較方便快速地確定不同模型中最佳的隱含層節點數目。本文利用MRPSODE對ELM隱含層節點數目進行確定,選用均方根誤差(RMSE)作為適應度函數,即
(13)

基于MRPSODE確定ELM故障診斷模型的最佳隱含層節點數目的流程如圖2所示。根據電力系統網絡結構和保護系統配置提取故障訓練樣本;然后采用MRPSODE自動確定ELM的最佳隱含層節點數目,完成故障診斷模型的構建;故障發生后,通過運行ELM模型實現故障診斷。

圖2 基于MRPSODE的ELM模型構建流程
考慮到訓練樣本中可能包含噪聲數據,會影響到ELM網絡的準確率,為了提高系統的準確率,降低噪聲數據對最終實驗結果的影響,本文選擇使用5折交叉驗證方法對訓練樣本進行處理。將訓練數據劃分為互不相交的5等份,如圖3所示。每1行代表1折交叉驗證,由于本文選擇使用5折交叉驗證方法,所以共有5行。每行把數據分為5份,每份數據所占總數據的比例為20%。如本文所選用的樣本數據共60條,每個框代表里面共有12條樣本。在訓練過程中,每次選其中1份作為驗證數據集(圖中淺色部分),其他4份作為訓練數據集(圖中深色部分)。通過交叉驗證,可以盡可能地降低噪聲數據的影響,提高ELM的容錯能力。

表1 測試系統的實驗結果

圖3 交叉驗證數據劃分
本文采用中國吉林省四平電網發生的真實故障案例[11]來驗證所提出的故障診斷方法。相關的電力系統結構如圖4所示。B2母線出現故障,主保護B2m拒動,相應的后備保護L1Rs、L3Rs、L4Ss動作,使得斷路器8204、1504、3104跳閘;同時B7母線出現故障,主保護B7m動作,斷路器4803、4811、4802跳閘,而斷路器4801拒動,斷路器3170跳閘,受故障電流的影響斷路器3106跳閘。

圖4 吉林四平結構
本文根據圖4構造了60條故障數據。樣本的特征項為圖中線路和母線的主保護、近后備保護、遠后備保護以及斷路器的動作狀態。保護或者斷路器動作,其特征值為1;若保護或者斷路器未動作,其特征值為0。神經網絡的輸出即為線路和母線的故障可能性,大于0.5即認為故障,否則為無故障。故障模式包括“故障”和“無故障”2種模式。由于案例為實際故障,只有1條實際故障信息,所以本文獨立運行100次,以正確診斷出故障的次數除以100作為診斷正確率。由于隱含層的節點個數必須為整數,所以最終的隱含層節點個數為獨立運行100次交叉驗證得出的結果求平均值,再向上取整。設定種群個體數為10,迭代次數為20,ELM隱含層神經元個數的范圍為[1,80]。為了驗證MRPSODE的有效性,將其與DE和PSO進行對比。3個算法的收斂曲線如圖5所示。圖5中,MRPSODE-ELM的收斂速度明顯快于DE-ELM和PSO-ELM,且能夠獲得最小的適應度值RMSE,表明利用MRPSODE對ELM隱含層節點個數進行優化相比于其他對比算法更具競爭力。

圖5 迭代收斂對比
經過100次5折交叉驗證得到的隱含層神經元個數平均值為74.686,但是神經元個數不能為小數,必須是一個整數,所以對求出的平均值進行向上取整,即在該測試案例中最佳的隱含層神經元個數為75。為了驗證經過MRPSODE優化的ELM的診斷性能,將其與BP神經網絡和RBF神經網絡進行對比。本文設定BP神經網絡隱含層個數為75,RBF神經網絡搜索過程中隱含層節點最大值為75,獨立運行100次計算診斷正確率,其實驗結果如表1所示。
由表1可知,在相同結構規模的網絡中,經過優化后的ELM的診斷正確率最高,達到了93%,BP神經網絡最低,為86%,證明了基于MRPSODE的ELM具有更好的診斷性能。
為了提高處理電力系統故障中不確定性的診斷能力,本文提出了一種基于MRPSODE訓練的最優ELM診斷方法。采用實際發生的電力系統故障案例來驗證該方法。仿真結果表明,所采用的MRPSODE能夠確定ELM最佳的隱含層節點個數。在吉林省四平電力系統實際案例中,通過與其他常用神經網絡對比,ELM模型診斷的正確率達到93%,說明了所提出方法在復雜故障方面具有較強的診斷能力。
通過仿真也發現,盡管該ELM的正確率達到了93%,但仍然具有可提升的空間。下一步將繼續對進化算法深入改進,不斷提升ELM的泛化能力,以便在故障診斷問題上獲得更好的性能;另一方面,將所構建的ELM模型應用于更多的實際故障場景。