,,張作, ,
(1.廣東電網有限責任公司惠州供電局,廣東 惠州 516000;2.西安交通大學電氣學院,陜西 西安 710049)
電力變壓器作為電力系統的關鍵設備,在電網中起到能量傳輸、分配的功能,其運行狀況的健康與否直接關系到整個電網的安全性及穩定性。如未能及時發現電力變壓器的潛在故障,未能及時安排相應的檢修工作,往往會導致該變壓器所管轄的供電區域大面積停電,造成巨額的經濟損失[1-2]。因此,深入研究電力變壓器的故障診斷,降低故障的發生率,避免事故的發生尤為重要。
大型電力變壓器由于其內部結構的復雜性和故障的多樣性,需要通過大量的試驗進行變壓器的狀態評估[3]。其中,油中溶解氣體分析(DGA)通過檢測氣體的組分和含量來分析設備的狀態,不受外界電磁場的干擾,不影響變壓器的正常運行,同時可實現實時在線監測及時發現內部潛伏故障,是檢測電力變壓器內部潛在故障的最主要手段之一,且在《電力設備預防性試驗規程》中被列為首位[4]。
隨著信息技術、人工智能、數據挖掘領域的發展,基于油色譜分析的診斷方法的研究從傳統的三比值法、IEC三比值法、Rogers法、大衛三角形法等轉變為專家系統、粗糙集算法、人工神經網絡、支持向量機等智能信息處理算法[5-6]。其中,支持向量機基于結構風險最小化原則構建分類器,能夠較好地解決小樣本、高維度、非線性數據集的模式識別問題。文獻[7]利用PCA和KICA對變壓器油色譜數據進一步特征提取,并利用支持向量機取得良好的診斷效果。文獻[8]運用多分類概率輸出的方法,通過支持向量機得到發生不同類型故障的概率,進一步降低誤診斷的發生。
在此,結合了油中溶解氣體分析技術和優化多分類支持向量機,通過近鄰算法優化多分類拓撲結構,降低模型復雜度及構建時間,再利用一對一(OVO)及優化后的一對多(OVR)結合的方式實現電力變壓器多類故障診斷及概率輸出。克服了原有單一多分類算法和傳統診斷算法的不足,有效提高了診斷的準確率和結論的可靠性。
在二分類問題中,支持向量機(SVM)利用核函數將低維度數據映射到高維空間,并基于結構風險最小化原則在高維空間內尋找最優分類超平面,ωTφ(x)+b=0,其中ω為權值向量,b為偏置量,盡可能地將2類樣本分隔在超平面的兩側,使得分類的間距最大,提高分類器的抗干擾能力。SVM決策函數輸出形式為:
(1)
x為輸入的待分類樣本;xi為訓練集內的樣本數據;y∈(-1,1)為對應訓練集樣本xi的標簽值;ai為拉格朗日乘子;k(xi,x)為核函數;f(x)為決策函數輸出的確定值。傳統的支持向量機最終基于階躍函數y=sign(f(x)),輸出待分類樣本的分類結果y。
在此,采用Platt[9]提出二分類SVM概率輸出方法,利用Sigmoid函數將傳統支持向量機的決策函數輸出值f(x)映射到[0,1]區間內,輸出待分類樣本隸屬概率值。具體概率輸出式為:
P(y=1|x)≈PA,B(f(x))=
(2)
A,B為Sigmoid函數的待擬合參數,可以利用訓練集樣本的決策函數輸出及標簽值進行極大似然估計獲取。定義訓練集為(f(xi),ti),求解模型為:
(3)
N+為訓練集樣本中標簽為yi=+1的樣本個數;N-為訓練集樣本中標簽為yi=-1的樣本個數。
求解上述模型最優解時,可以利用牛頓法,F(A,B)的梯度矩陣和Hessian矩陣分別為:
(4)
H(F)=
(5)
獲取參數A,B值之后,即可通過概率輸出式求解待分類樣本隸屬于某一類的概率估計值。
SVM分類器最初的設計就是為了解決二分類問題,當處理多類問題時,需要構造合適的多類分類器。目前,構建多分類SVM主要通過組合多個二分類SVM來實現多類分類器的功能,常用的方法有OVR(one-versus-rest)和OVO(one-versus-one)2種[10]。
OVR是通過將多個類別轉化為2類實現多分類功能。假設有K種不同類別的樣本集,只需要訓練K個二分類SVM。構造每個二分類SVM時,將其中某個類別的樣本標記為一類,將剩余的其他樣本都歸為另一類。測試未知樣本時,結合概率輸出,獲取該樣本屬于各類的概率值,選取概率最大的類別作為輸出。
ClassOVR=argmaxi=1,…,kpi
(6)
OVO是通過每2類構成1個SVM子分類器實現多分類功能。同樣假設有K種不同的類別,兩兩訓練,一共得到K×(K-1)/2個SVM子分類器。測試未知樣本時,結合概率輸出,每個SVM子分類器都能輸出該樣本隸屬各類的概率,得到1個K階的概率矩陣G:
(7)
rij代表待測試樣本在第i類和第j類構成的二分類SVM中,隸屬于第i類的概率值;rij∈[0,1],rij+rji=1。最后利用加權投票策略,輸出的樣本類別為:
ClassOVO=argmaxi=1,…,k∑1≤j≠i≤krij
(8)
近鄰算法(KNN)是由Cover等人提出的一種基于不同對象間的特征值距離對目標對象進行有效分類的非參數估計算法[11-13]。其核心思想是:同類樣本擁有相同的特征往往會表征出相似的數據結果,因此通過計算未知樣本與已知樣本之間的特征向量相似度,選取k個相似度最接近的已知樣本,依據其中占優的類別,即可對未知樣本進行類別的判定。算法具體流程如下:
a.輸入未知樣本類別的數據集(記為測試集)及已知樣本類別的數據集(記為訓練集),假設測試集有M個樣本數據,訓練集有N個樣本數據。
b.分別計算測試集未知樣本與訓練集已知樣本之間的特征向量相似度,得到一個N×M的相似度矩陣。其中,每列代表某個未知樣本與所有已知樣本的相似度向量。
c.每列相似度向量均按相似度的遞減關系進行排序。
d.根據相似度數值分布及樣本特性選定合適的k值。
e.依據排序結果,按列選取前k個最大相似度對應的已知樣本,即每個未知樣本對應k個相似度最大的已知樣本。
f.統計每個未知樣本的k個已知樣本所處類別的出現次數。
g.按列返回前k個已知樣本中出現頻率最高的類別,得到M維行向量,其中的元素代表著對應未知樣本的判定類別。
OVO-SVMs分類器通過對概率矩陣G的每行元素進行相加,獲得的累加值來表征樣本屬于各類的程度,選取最大累計值對應的類別作為樣本輸出類別。其中,每個元素rij代表待測試樣本在第i類和第j類構成的二分類SVM中,隸屬于第i類的概率值。假設一個樣本屬于第c類(c≠i≠j),將其作為OVO-SVMs分類器的輸入進行類別判定,得到的概率矩陣中,rij的數值是沒有任何意義,因為樣本本身就不屬于i,j類。理想情況下,期望得到rij≈0.5,這表明該樣本在第i類和第j類構成的二分類SVM中分類不明確,得到該樣本既不屬于第i類,也不屬于第j類的結論。但是實際上,rij的值是多變的,并不會一直保持在0.5的鄰域中,而它的結果會累加在最終的類別判定式(8)中,造成錯誤的輸出。因此,期望對概率矩陣中的每個元素乘上一個權重系數qij來修正輸出的概率值,從而減少上述中的誤分類情況,提高OVO-SVMs分類器的分類準確率。理想情況下,若樣本類別屬于第i類或第j類,qij≈1,否則qij≈0。由于事先并不能得知樣本的真實類別,所以采用qij=max(qi,qj)來估計未知樣本屬于第i類或第j類的概率,此時輸出的樣本類別為:
ClassOVO-OVR=argmaxi=1,…,k∑1≤j≠i≤krij·qij
(9)
qij=max(qi,qj)
(10)

ClassOVO-impOVR=argmaxi=1,…,k∑1≤j≠i≤krij·Qij
(11)
Qij=max(Qi,Qj)
(12)
Qi為第i類與其他所有類構成的改進OVR-SVMs分類器的概率輸出。
運用改進多分類方法對K種不同類別的樣本集進行識別分類,需要構造K×(K-1)/2個OVO-SVMs及K×M個OVR-SVMs。而電力變壓器的故障涉及面廣且類型較多,如果將所有故障一并作為輸入進行訓練,需要構造大量的SVM,花費大量的訓練時間及測試時間。因此,首先采用有向無環圖,對變壓器的故障進行歸類劃分,具體劃分如圖1所示。

圖1 變壓器故障結構樹
變壓器狀態大體分成正常、過熱、放電、多故障并存4個大類,針對不同的大類再進行子故障的細分。在此,采用KNN算法對變壓器故障的4個大類進行初步劃分,選取近鄰中出現頻率較高的2類,再利用改進多分類方法對2個大類下的所有子故障進行多類別細分,輸出隸屬各子故障的概率。經過KNN算法預分類,篩選去除部分故障大類,大大減少構建多分類器的時間,同時規避了多分類器出現誤診的風險,提高了多分類器分類的準確率及穩定性。
由于電力變壓器眾多物理和化學檢測手段中,油中溶解氣體分析通過分析氣體的組分和含量來檢測設備狀態,能夠較好地反映出變壓器故障性質及惡劣程度,及時發現內部潛伏故障。因此,采用變壓器油色譜數據作為模型的輸入,根據油中氣體組分含量,進行變壓器故障診斷。由于油中特征氣體含量大小差異過大,為了減少模型的計算難度及誤差,首先對輸入數據進行如下歸一化處理:
(13)
xgyh代表歸一化后氣體含量;x代表色譜分析檢測到的氣體真實含量;xmin代表氣體含量的最小值;xmax代表氣體含量的最大值;Llow為設定的氣體含量歸一化后的下界;Lup為設定的氣體含量歸一化后的上界。為了方便計算,設定Llow=0,Lup=1,此時xgyh∈[0,1]。具體診斷流程如圖2所示。

圖2 變壓器故障診斷流程
本文從中國南方電網某市供電局中收集得到226組帶標簽的變壓器油色譜數據,其中包含186組8種典型故障,各類故障的樣本數如表1所示。由于獲取的變壓器各類故障樣本數較少,按照訓練集樣本數比測試集樣本數等于1∶1的標準,分別從每個類別中選取一定數量的訓練集樣本及測試集樣本,用于構建OVO-SVMs及改進的OVR-SVMs模型。整合所有訓練集作為KNN的已知樣本集。同時,選取油中溶解的H2,CH4,C2H6,C2H4和C2H2作為氣體特征參數,對每個測試集樣本進行逐一分類,并比較IEC三比值法、OVO-SVMs多分類法及本文提出的多分類方法的診斷結果。

表1 變壓器故障樣本集
在KNN算法預分類的過程中,設定K=12,預選取出現頻率最大的2類故障。如果樣本的真實故障類別屬于KNN算法預分類結果的2種故障大類,則判定KNN算法有效地剔除了無關故障類,克服后續模型診斷耗時長、高復雜的缺點,起到輔助診斷的作用,那么認為KNN算法分類結果正確。KNN算法的預分類結果如表2所示。KNN算法對于故障和正常的分類達到100%的效果,對各大類故障也都有較高的識別率。

表2 KNN算法的預分類結果
本文選取徑向基函數作為支持向量機的核函數,其中核函數參數及懲罰因子的整定,通過網格搜索法[1],對訓練集中的樣本進行留一交叉驗證,選取準確率最高的一組參數。核函數參數取值范圍為10-3,10-2,…,102,103;懲罰因子取值范圍為10-3,10-2,…,102,103。測試集樣本在IEC三比值法、OVO-SVMs和本文方法3種不同方法下的變壓器故障診斷結果比較,如表3所示,其中包含各種子故障的判正數及正確率。

表3 IEC三比值法、OVO-SVMs和本文方法的
注:“—”代表IEC三比值法無法識別該故障類型。由于OVO-SVMs和本文方法需要總數據集的一半作為訓練集,所以測試集樣本僅有IEC三比值法的測試樣本的半數。
由表3可知,相比較其他2種方法,本文提出的近鄰與改進多分類結合的方法整體診斷效果最佳。與IEC三比值法相比,本文的方法不但在多個子故障的分類正確率方面有所提高,而且不受編碼和故障類型的限制。
基于3種不同方法的變壓器故障診斷的相關案例,如表4所示。表4中,IEC三比值法無法對“0,1,1”的編碼有效識別,而本文方法能夠正確地識別及診斷該故障類型。同時,相比IEC三比值法無法對高能放電進行識別,本文方法卻對高能量放電及高能放電兼過熱這2種故障的診斷效果良好,診斷正確率分別達到90.5%和100%。
與傳統的OVO-SVMs對比,本文利用改進OVR算法的輸出對概率矩陣G的每個元素進行修正處理,強化與樣本故障類別相關的分類器的概率輸出結果,對其余分類器輸出結果進行弱化處理,進一步提高了診斷準確率。
除此之外,以本文的9個故障類別(含正常狀態)為例,針對每個未知樣本的診斷,改進多分類算法需要經過45個SVM進行分類,而引入KNN算法進行預分類后,最多需要21個SVM進行識別,最少只需6個SVM即可完成診斷工作,大幅度提高變壓器故障診斷的效率。

表4 IEC三比值法、OVO-SVMs和本文方法的變壓器故障診斷實例
注:“—”代表IEC三比值法無法識別該編碼。
結合KNN算法和多分類策略結合的方法對變壓器故障進行診斷:以OVO-SVMs分類器為基礎,克服了IEC三比值法存在編碼缺失等問題,補充了對高能放電和高能放電兼過熱2種故障的診斷;以改進OVR-SVMs分類器的概率輸出作為概率矩陣G中各元素的權重系數,對概率矩陣G進行更新、修正,合理剔除無關類別訓練成的支持向量機的概率輸出,保留有效支持向量機的概率輸出,提高故障診斷正確率及可靠性;考慮到針對變壓器油色譜在線監測系統的故障診斷實時性,采用有向無環圖的形式先對變壓器故障進行歸類,再利用KNN算法對故障大類進行預分類,縮小故障所屬類別,降低了診斷模型的復雜性,提高了改進多分類算法的運算速率,整體診斷速率可提高2~9倍。從整體診斷效果來看,本文提出的方法與IEC三比值法和傳統的多分類支持向量機相比,在故障診斷范圍、故障診斷正確率以及故障診斷效率上均有所提高。
參考文獻:
[1] 張東波,徐瑜,王耀南.主動差異學習神經網絡集成方法在變壓器DGA故障診斷中的應用[J].中國電機工程學報,2010,30(22):64-70.
[2] Yang Q, Su P, Chen Y.Comparison of impulse wave and sweep frequency response analysis methods for diagnosis of transformer winding faults [J].Energies,2017,10(4):431.
[3] 潘翀,陳偉根,云玉新,等.基于遺傳算法進化小波神經網絡的電力變壓器故障診斷[J].電力系統自動化,2007,31(13):88-92.
[4] 郭創新,朱承治,張琳,等.應用多分類多核學習支持向量機的變壓器故障診斷方法[J].中國電機工程學報,2010,30(13):128-134.
[5] 鄭蕊蕊,趙繼印,趙婷婷,等.基于遺傳支持向量機和灰色人工免疫算法的電力變壓器故障診斷[J].中國電機工程學報,2011,31(7):56-63.
[6] 胡青,孫才新,杜林,等.核主成分分析與隨機森林相結合的變壓器故障診斷方法[J].高電壓技術,2010,36(7):1725-1729.
[7] 唐勇波,桂衛華,彭濤,等.PCA和KICA特征提取的變壓器故障診斷模型[J].高電壓技術,2014,40(2):557-563.
[8] 畢建權,鹿鳴明,郭創新,等.一種基于多分類概率輸出的變壓器故障診斷方法[J].電力系統自動化,2015,39(5):88-93.
[9] Platt J.Probabilistic outputs for support vector machines and comparisons to regularized likelihood methods [J].Advances in Large Margin Classifiers,1999,10(3):61-74.
[10] Chmielnicki W, Stapor K. Using the one-versus-rest strategy with samples balancing to improve pairwise coupling classification[J]. International Journal of Applied Mathematics and Computer Science, 2016,26(1):191-201.
[11] 劉凡,張昀,姚曉,等.基于K近鄰算法的換流變壓器局部放電模式識別[J].電力自動化設備,2013,33(5):89-93.
[12] Galar M, Fernández A, Barrenechea E, et al.Dynamic classifier selection for one-vs-one strategy: avoiding non-competent classifiers[J]. Pattern Recognition, 2013, 46(12): 3412-3424.
[13] 田質廣,張慧芬.基于遺傳聚類算法的油中溶解氣體分析電力變壓器故障診斷[J].電力自動化設備,2008,28(2):15-18.