祝海寧,丁云飛
(1.上海電機學院 資產與實驗室管理處,上海 201306; 2.上海電機學院 電氣學院,上海 201306)
斷路器是一種常見的廣泛應用于電力系統中重要電力設備,不僅基數大,經濟上的投入也很大.斷路器能夠根據電力運行狀態進行切換或通斷,其可靠性直接關系到整個電網的安全穩定性.它自身的故障狀態往往會引發電力系統的較大事故,產生較大的社會和經濟方面的影響.因此,針對斷路器的工作狀態進行準確高效的故障診斷分析,對于電力系統的安全運行以及電網質量的穩定都具有重要的意義.
故障診斷技術是通過對提取的故障數據樣本建立故障診斷模型,然后通過模型對待測樣本進行模式識別和分類.目前應用較多的故障診斷方法都是基于人工智能的方法.專家系統通常是通過對故障信息建立專家知識庫和推理規則,或者與其他方法結合如小波分析等進行診斷[1-3].神經網絡模型容易建立,在斷路器的部分故障狀態下仍可應用于其他單元診斷[4-5],與其他優化算法如粒子群[6]、貝葉斯決策[7]和主成分分析方法[8]相結合可提高斷路器的故障診斷正確率.近來,支持向量機(Support Vector Machine,SVM)作為一種核方法廣泛應用在斷路器故障診斷領域,它還可以結合核主成分分析、因子分析、粒子群優化等方法來簡化輸入特征樣本,優化算法收斂,提高分類準確率[9-11].
然而這些方法在對斷路器故障進行診斷時,會存在一些難點.比如基于專家智能系統的診斷方式的難點是如何建立和更新非常依賴于專家經驗的知識庫,以及如何解釋推理機制;將遺傳算法和神經網絡引入到故障診斷中可使診斷模型更加復雜,模型訓練時需要盡可能多樣本來提高精度,計算量也隨之增大.基于SVM的算法雖然實現了非線性映射,但模型還是需要大量支持向量,隨著樣本增加,運算量增加也很大.
在實際運行中,斷路器故障原因比較復雜.當斷路器處于非正常工作狀態時,斷路器設備所在的回路以及設備本身會伴隨著一些與故障明顯相關的特征,即有關的電氣量波動明顯,而相關的非電氣量也會發生很大變化.本文針對SF6氣體斷路器,通過一種基于核的分層貝葉斯故障診斷方法提取分析相關電氣量以及非電氣量信息,從而能使斷路器故障時快速報警和診斷,并降低誤報的頻次,盡可能保證電網的安全可靠供電.
KPCA是一種核方法,是主成分分析(Principal Component Analysis,PCA)的一種延伸.首先,定義一個樣本空間X及其在高維空間的映射φ(X)為
然后定義一個核函數K,對于任意xi,xj∈X都有如下等式成立:
(1)
目前,應用較多的核函數有多項式核、高斯核、Sigmoid核、B樣條核等.KPCA先將樣本輸入空間里的X轉換到高維向量空間;然后對高維空間中線性可分的映射樣本進行PCA,提取主要成分對應的特征向量;再對原樣本集進行特征提取和降維處理.用C表示高維空間的協方差矩陣,則有
(2)
其特征值λ和特征向量v需要滿足:
(3)

式(3)通過點積可以變為
(4)
由式(4)可推出
(5)
根據式(1)的定義,式(5)可以簡化為
(6)
對式(6)求解就可以得到λ和v.而特征向量在高維空間的映射變為
(7)
KPCA還需要對高維空間進行預處理,則核矩陣可以通過下式完成中心化:
(8)

分層貝葉斯模型是基于貝葉斯概率分析的一種監督學習方法[12].通過對兩層先驗參數的分布進行設定,能令模型中的部分參數系數減少到0,根據需求調節模型的復雜度,提高運行時間.給定N個數據的一個輸入訓練集合D={(x1,y1),(x2,y2),…,(xN,yN)},這里xi∈(1,2,…,N)為D維輸入向量,yi∈(1,2,…,N)為一個二值輸出向量.給定N×M維矩陣H=[h(x1),h(x2),…,h(xN)]T,M為所選基函數個數.于是可以得到含有潛變量z的模型
(9)
式中:z=(z1,z2,…,zN)T;w為符合高斯分布的零均值的單位誤差向量,可以表示為p(w)=φ(w|0,1);β為需要估計的參數.
模型根據z≥0時y=1,以及z<0時y=0來進行分類,即滿足
(10)

對z求取似然函數如下:
(11)
為了便于對β求取參數的估計值,令βi滿足
(12)
模型中z和新引入的τ=[τ1,τ2,…,τM]T都是未知數據,這里將模型分層能夠容易通過期望極大(Expectation Maximization algorithm,EM)方法實現對參數的估計.將Jeffreys分布引入到τ上能夠減少額外參數參與到運算中[13],從而簡化參數估計模型.由式(11)、式(12)能夠得出
(13)

通過EM算法,求出對Υ的期望值V和z的期望值s,這里t是迭代次數,從而得出
(14)
(15)
聯立式(13)~式(15),可以求得參數β為
(16)
為了避免迭代過程中除以零的出現,新定義一矩陣
(17)
則式(16)可以變為
(18)
本文所提出的故障診斷方法,首先采用KPCA對原數據進行特征值提取,從而找出訓練樣本在高維映射中的特征向量.其次,將核方法引入分層貝葉斯模型中,這里的核函數都選擇相同的高斯核函數.同時,由于該分層貝葉斯分類器只能解決兩類分類問題,而生產過程中出現的故障往往是多于兩類的.本文采用故障樹中的二叉樹理論,建立一系列對應不同故障類別的二分類器,進行組合診斷.整體故障診斷如圖1所示.

圖1 基于核的分層貝葉斯故障診斷框圖Fig.1 Kernel based hierarchical Bayesian framework for fault diagnosis
具體的故障診斷算法步驟如下:
步驟1對歷史訓練數據和待測數據標準化,并對模型參數進行初始化和設定迭代終止條件.
步驟2利用高斯核函數如下所示,計算核矩陣K,即
(19)
式中:δ為核寬參數,可以由交叉尋優方法來確定.
步驟3按照式(8)修正核矩陣得到K′.
步驟4根據系統要求,按照式(7)計算特征向量的投影tk,從而得到映射后的訓練數據集X.
步驟5利用核方法對X重新定義,并求取設計矩陣,于是H中的向量變為
(20)
步驟6將H代入到分層貝葉斯模型中,通過式(15)和式(17)分別求得s(t)和Q(t)值.
步驟7利用式(18)求得新的參數向量β(t+1).
步驟8重復步驟6和7,直到滿足算法終止條件.
步驟9對待測樣本進行分類診斷.
步驟10判斷故障類別數c是否等于2.如果是,則輸出診斷結果;如果不是,則采用二叉樹的方法構建多類分類器:首先將故障種類中最經常發生的故障作為第一類,將其他(c-1)類故障看作另一類,重復步驟5~9,建立第1個二分類模型;然后在(c-1)類故障中重復前面的分類,建立第2個二分類模型,直到得到(c-1)個二分類器.待測樣本通過這些分類器得到最后的多分類故障.
實驗以某電氣公司3AP1FG型SF6氣體斷路器在線監測系統進行數據的采集.該系統包括傳感器(如壓力傳感器PMR300和溫度傳感器PT100等)、數據處理系統、通訊網絡(RS485總線)和監控主機.監控主機通過提取分析大量斷路器故障或非正常工作時相關電氣量以及非電氣量歷史信息,利用所提出的故障診斷方法在Matlab上對其進行離線訓練;然后使用訓練好的故障診斷模型對斷路器故障進行在線分析,快速診斷出結果,判斷屬于哪類故障,并在人機界面上直觀展示出來.
高壓斷路器SF6的故障診斷主要依賴于對采集數據的分析.實驗選取能夠為SF6氣體斷路器故障診斷提供重要的參考信息的8個非電氣量,包括SF6氣體微水量、SF6氣體密度、導電接觸部分溫度、絕緣電阻、接觸電阻、分合閘線圈電流、線圈電壓、分合閘時間.這里主要考慮SF6斷路器的常見的4種故障,包括氣體泄漏、機械卡澀、絕緣閃絡和二次回路故障.為驗證所提出的故障診斷算法的有效性,選取故障實驗訓練樣本400個,其中每種故障樣本為100個.另外取100個樣本作為待測數據集,其中每種故障樣本為25個.訓練樣本標準化后通過核主元分析其樣本閾值對主元數據樣本的關系如圖2所示.從圖2中曲線可以看出:KPCA對原訓練樣本的縮減效率,當閾值增加時,縮減的數據組數則減少,也就是說為了達到某一閾值所需要的樣本數量增加了;關系圖的斜率在閾值取0.96~0.98時最大,此時在此閾值區間內對應的縮減樣本所含原信息量在保持一定的縮減成本之下是最大的,即核主元轉換效率最高.所以最優的閾值設為0.97,對應的新的樣本數為280組.

圖2 KPCA閾值與主元樣本量關系圖Fig.2 The relationship KPCA between threshhold and remained samples
將新訓練樣本通過二叉樹訓練出3個基于核的分層貝葉斯模型,然后將100個測試數據分類.在相同的初始條件下,該方法與其他另外兩種廣泛應用的方法進行了比較.① KPCA通過統計方法求取T2和平方預測誤差(Squared Prediction Error,SPE)統計量,判斷樣本的顯著誤差,從而進行故障診斷.② 將SVM和二叉樹結合實現的斷路器的多類故障診斷.其分類結果如表1所示.

表1 故障診斷結果Tab.1 The result of fault diagnosis
表1中:F1~F4表示4類故障中每類故障所對應的錯分樣本數目;正確率是針對整個測試樣本的正確分類的準確率;nsv表示3個二分類模型需要的支持向量的平均個數.從表1中可以看出:分層貝葉斯的分類準確率比其他兩個方法都高些,KPCA較低,并且它是基于統計的方法來判斷故障類別,所以沒有具體的支持向量個數.然而對于SVM而言,它的平均nsv為42個,但分層貝葉斯只需要19個.這說明在分類精度相差不大,甚至更好的情況下,后者所建立的模型參數個數比前者少一半左右,模型的結構要更為簡單,計算效率相應更高.
本文針對電力系統中常見的斷路器設備的故障,提出了一種基于核的分層貝葉斯故障診斷方法.該方法利用斷路器的8個故障特性參數為輸入樣本,利用KPCA對原故障訓練集合進行縮減,并最大限度地保留原始數據集的信息.然后在新數據樣本的基礎上,訓練已經利用核方法改進的分層貝葉斯模型.這樣就可以通過核函數隱式映射為高維線性關系,實現非線性故障診斷.根據故障類別數,結合二叉樹進行多類故障診斷.通過實例分析,該故障診斷方法與另外兩種方法KPCA和SVM的故障診斷結果比較表明,所提出的基于核的分層貝葉斯故障診斷方法在數據樣本縮減、模型參數簡化、分類準確率上都好于另外兩種方法,從而驗證了本文方法的有效性.