王鶴,姜鴻儒,王振丁
(1. 東北電力大學,吉林 吉林 132012; 2. 國網山東省電力公司黃島供電公司,山東 青島 266000)
電力變壓器作為電力系統中能量轉換、傳輸的核心,能否快速、準確地診斷出變壓器故障,直接影響系統的安全、穩定運行[1-2]。我國目前已有較多變壓器在長期運行過程中出現絕緣老化、材質劣化等故障隱患,這將導致發生事故的概率不斷增加[3]。由此有必要采取合理的方法來及時的發現變壓器潛伏性故障,進而預防和降低事故發生的概率[4]。
目前,變壓器油中溶解氣體分析法(Dissolved Gas Analysis,DGA)已成為診斷和檢測變壓器內部故障性質的重要方法[5]。基于DGA已形成了IEC推薦的三比值法、Rogers法等傳統診斷方法[6-7]。隨著人工智能技術的發展,國內外學者將人工神經網絡 (ANN)[6]、貝葉斯分類器[8]、極限學習機(ELM)[9]和支持向量機(SVM)[10]等人工智能算法引入到變壓器故障診斷領域,為電力變壓器故障診斷技術的發展提供了新思路。其中,支持向量機因所需訓練樣本數據少、泛化能力強等優點廣泛應用于變壓器故障診斷中[11-12]。文獻[12]利用布谷鳥算法對SVM的參數進行尋優,利用優化后的SVM模型進行變壓器故障判斷。文獻[13]利用建立的快速相關向量機多層次分類模型減少了模型的訓練時間,并利用量子粒子群算法優化了模型參數,提高了診斷的精度。文獻[14]利用多核學習向量機將模型分解為2個凸優問題進行求解,降低了計算復雜度。以上基于SVM的智能算法最終均是以故障類型作為診斷的結果,但是考慮到變壓器結構復雜,故障現象與故障特征間存在著模糊性,其仍存在誤診斷問題。
提出一種基于MCPO模型的變壓器故障診斷方法,其在繼承了SVM優點的基礎上,通過利用Sigmoid函數實現SVM的概率輸出,進而綜合多個二分類輸出結果,將模型的求解轉化為一個凸二次規劃求解問題實現多分類概率輸出。該方法能夠判別故障特征是否明確,減少了對變壓器故障的誤判,仿真結果驗證了基于MCPO模型的變壓器故障診斷方法的有效性。
所建立的基于SVM的MCPO模型是在傳統SVM方法的基礎上,通過引入Sigmoid函數將SVM的決策函數輸出映射為二分類概率輸出,進而綜合多個二分類輸出結果,將模型的求解轉化為一個凸二次規劃求解問題實現多分類概率輸出。
支持向量機的本質是在訓練樣本數據中找出用于構造最優分類超平面的支持向量,在數學上可歸結為求解一個二次優化問題[12]。
對于線性可分的樣本,其可被最優分類超平面區分開,超平面方程為:
ex+f=0,e∈Rn,f∈R
(1)
式中e為超平面法線;f為分類閾值;n為樣本空間維數。
設一組樣本(xi,yi),xi為樣本數據,yi為樣本類別標志。最優分類超平面問題的求解可轉化為求解帶約束條件的優化問題:
(2)
式中l為訓練樣本總數。
對于線性不可分的樣本,在約束條件中引入松弛變量βi來解決分類誤差問題,則約束條件可表示為:
yie·xi+f≥1-βii=1,2,…,l
(3)
由此可得到線性不可分時的最優分類面,其可表示為如式(4)所示的優化問題:
(4)
式中C(C>0)為懲罰參數,其作用是控制對錯分樣本的懲罰程度。
利用拉格朗日函數求解上述優化問題:
(5)
式中ai為拉格朗日乘子。
對于非線性問題,SVM通過引入核函數實現某一非線性變換后的線性分類。文中采用RBF作為模型的核函數:
(6)
式中σ為RBF函數寬度參數。
則SVM的分類決策函數為:
(7)
采用文獻[15]的方法利用Sigmoid函數將g(x)映射在區間[0,1],則概率輸出表達式:
(8)
式中a,b為Sigmoid函數的待定參數。
Sigmoid函數的參數a,b可通過最小化交叉熵誤差函數獲得,其求解模型可表示為:
(9)
其中:
(10)
式中M是樣本類型為yi=1的樣本個數;M′是樣本類型為yi=-1的樣本個數。
式(10)可利用牛頓法獲得最優解,即令G(a,b)的梯度矩陣等于0時的解為最優解。G(a,b)的梯度矩陣如式(11)所示。
(11)
獲得參數a,b后,則可利用Sigmoid函數將g(x)映射成概率輸出形式。對于一個二分類問題,利用式(8)可獲得x屬于某一類(w或v類)的概率估計swv:
(12)
電力變壓器的故障類型眾多,其診斷的過程應屬于多分類問題。一個m分類的問題應該綜合考慮1/2m(m-1)個二分類SVM的結果,進而將其swv綜合為多分類的概率輸出,則x為每一類的概率pw可表示為:
(13)
利用文獻[16]給出的從二分類概率得到多分類概率的方法實現多分類的概率輸出。考慮有:
(14)
即:
swv/svw≈pw/pv
(15)
對上式進行變換并求和:
(16)
利用式(16)求解以下模型進而獲得pw:
(17)
上述模型的求解可轉化為求解一個凸二次規劃問題:
(18)
當滿足式(19)時,其獲得最優解。
(19)
式中e=[1,1, …,1]T,pT=[p1,p2, …,pm]。基于SVM的MCPO模型構建流程見圖1。
MCPO模型的輸入為(x,y),其中x是DGA數據中H2、CH4、C2H6、C2H4、C2H2這五種氣體含量,分別記作x1、x2、x3、x4、x5,則特征向量x=(x1、x2、x3、x4、x5);特征向量y為故障類型,所考慮的故障類型如表1所示。
圖1 MCPO模型構建流程
序號故障類型簡稱樣本數1熱故障t<300 ℃T1502熱故障300 ℃
MCPO模型的輸出為(pT1,pT2,pT3,pPD,pD1,pD2),pT1,pT2,pT3,pPD,pD1,pD2分別代表變壓器的狀態為T1,T2,T3,PD,D1,D2的概率。考慮到DGA數據中各氣體含量存在較大差異,將各種溶解氣體含量換算為[0,1]范圍內的相對含量,按照式(20)對DGA數據進行歸一化處理。
(20)
式中xiq為第i個樣本第q類故障氣體的含量。
所提出的MCPO模型,其參數(C,σ)的選擇對提高故障診斷的準確率至關重要。因此,采用網格搜索的方法,對訓練樣本集進行交叉驗證,并選擇其中準確率最高的一組(C,σ)作為模型的參數。同時,實現概率輸出還要形成Sigmoid函數的參數訓練集,同樣利用交叉驗證的方法形成Sigmoid函數的參數訓練集(gi,yi)。獲得最優參數的流程如下:
(1)給定參數(C,σ);
(2)將樣本隨機分成k個互不相交的子集,每次選擇一個子集作為測試集,其他作為訓練集;
(3)訓練SVM,計算驗證集gi;
(4)k個子集交叉驗證形成Sigmoid函數的訓練集(gi,yi),訓練Sigmoid函數的參數a,b;
(5)計算全部swv,得到多分類概率估計pw,若完成對所有子集的計算,則計算交叉驗證的準確率。否則,返回到第二步。
(1)數據處理,歸一化輸入特征向量,形成訓練、測試集樣本;
(2)確定最優參數(C,σ);
(3)利用最優參數訓練SVM及Sigmoid函數的參數a、b,進而獲得診斷模型;
(4)應用診斷模型對測試樣本進行故障診斷。
選擇了270組已確定故障類型的DGA數據進行研究,并將樣本數據按2∶1比例分為訓練集和測試集。模型參數(C,σ)分別在取值范圍[2-15,2-14,…,214,215],[2-7,2-6,…,26,27]內以指數增長方式獲取。將訓練樣本分為5組進行交叉驗證,得到的最優參數為(2-1,23)。表2列舉了10組測試樣本的DGA數據。表3給出了MCPO模型的診斷結果。
表2 測試樣本DGA數據
由表2可知,MCPO模型的診斷結果是變壓器的狀態為每類故障的概率。如果將概率最大作為判斷故障類型的依據,基于MCPO模型的故障診斷正確率為90%。考慮到上述方法在故障特征不明顯(樣本故障分類概率相差較小)的情況時存在一定的誤判,因此本文進一步對診斷判據進行研究。
利用MCPO模型的故障診斷數據,提出基于最大概率Pm和標準差ε的兩種故障診斷判據。其中,Pm=max{p1、p2、p3、p4、p5、p6},ε為{p1、p2、p3、p4、p5、p6}的標準差。為了能夠方便的說明Pm和ε的意義,對測試樣本進行分類。分類原則如下:如果MCPO模型的診斷結果中概率最大的故障為實際故障,則樣本標記為Rh,若不是樣本標記為Rl。
由表2、表3可知,依據上述分類原則樣本3屬于Rh,此時Pm=83.79%,ε=0.301。樣本4屬于Rl,此時Pm=43.17%,ε=0.15。結果表明,故障特征顯著的樣本,Pm和ε的取值較大;故障特征不顯著的樣本,Pm和ε的取值較小。
表4給出了基于上述分類原則,所有測試樣本的分類結果。
表3 模型診斷結果
表4 測試樣本分類結果
表4中,Pmax-z和εz為Pm和ε的平均值。由表4可知,樣本集Rh中Pmax-z和εz的值均大于樣本集Rl中的值。以上分析結果表明,故障特征明顯的樣本,樣本故障分類概率相差較大,Pm、ε取值較大;故障特征不明顯的樣本,樣本故障分類概率較為接近,Pm、ε取值較小。因此,可以利用Pm和ε表征樣本的故障特征是否顯著。計算了所有測試集的Pm和ε,計算結果見圖2。
圖2 Pm、ε計算結果
由圖2可知,對于故障特征不明確的樣本主要分布在Pm<0.6和ε<0.25的區域中。因此,本文給出判斷標準為Pm=0.6和ε=0.25,即認為Pm<0.6且ε<0.25的樣本為故障特征不明確的樣本,對于這類樣本需要利用MCPO模型的診斷結果針對可能存在的故障做出相應的校正措施。
表5列舉了采用SVM方法和MCPO方法對同樣的樣本進行故障診斷得到的結果。
表5 不同診斷方法的比較
由表5可知,故障特征顯著的樣本利用SVM方法和MCPO方法都能有效的辨別故障類型;故障特征不顯著的樣本,利用SVM方法會導致誤診斷,而MCPO方法可利用基于最大概率Pm和標準差ε的兩種故障診斷判據有效的辨識故障特征不顯著的樣本,對于這類樣本,可參考概率較大的兩三個故障類型進行相應的校正措施,彌補了傳統SVM方法在辨別故障特征不明確的樣本時會導致誤診斷的問題。
提出的基于多分類概率輸出模型的變壓器故障診斷方法分類效果較好,并能夠提供概率信息。針對故障特征不明確的樣本,可參考概率較大的兩三個故障類型進行相應的校正措施,進而降低了對變壓器故障的誤判。通過仿真分析驗證了基于最大概率Pm和標準差ε的兩種故障診斷判據的有效性,為進一步開展合理的校正措施提供了一定的依據。