馮志亮, 肖涵麒, 任文鳳, 杜艷麗
(北華大學電氣與信息工程學院,吉林 吉林 132021)
變壓器是電力系統中最重要的設備之一,承擔輸電、配電樞紐的重任,其安全穩定運行與生產生活息息相關,一旦發生故障,會帶來許多不利的影響。因此,明確變壓器的故障類型,以便對變壓器進行故障處理,對電力系統的安全穩定運行具有十分重要的意義。
變壓器在發生不同故障時,高溫、放電作用于變壓器的絕緣油,會產生不同種類的氣體,變壓器的溶解氣體分析方法(DGA)[1]已經成為研究變壓器故障的重要手段。變壓器DGA故障診斷的方式有常規方法和人工智能方法,常規方法包括特征氣體法和三比值法等[2]。特征氣體法無法全面反映變壓器的故障類型,三比值法存在編碼缺失的情況,在一定程度上降低了診斷正確率。近年來,機器學習和人工智能技術的發展,為變壓器故障診斷技術提供了新的研究方向,模糊理論[3]、神經網絡[4]、貝葉斯分類器、支持向量機[5]等人工智能方法的應用都在特定情況下發揮了很好的作用。文獻[6]利用布谷鳥優化算法對BP神經網絡進行優化,使神經網絡算法易陷入局部最優、收斂困難的問題得到了改善。但神經網絡算法還存在收斂速度慢、系統相對復雜、易過擬合等缺點,文獻[7]采用蝙蝠優化算法對LS-SVM參數進行優化,能更好地處理局部極值和提高泛化能力,但核參數和懲罰因子的選取限制了SVM的分類能力,致使故障診斷準確率不能達到一個比較好的效果。
針對上述問題,本文提出了基于海鷗優化算法(seagulls optimization algorithm, SOA)的支持向量機故障診斷方法,先用PCA方法[8]對選取的多維氣體特征數據進行降維處理,將故障數據的維數遞減,然后用SOA方法對SVM的核參數和懲罰因子這兩個參數進行優化,使之貼合實際故障分類,最后和傳統PSO-SVM優化效果進行比較,確定海鷗算法優化支持向量機進行變壓器故障診斷具有較強的泛化能力和較高的準確率。
油浸式變壓器中的絕緣油是一種含有多種碳氫混合基團的混合物,當變壓器發生故障時,在高溫、放電等條件作用下各種碳氫基團的化學鍵會發生斷裂,裂解產生各種烴類氣體混入變壓器油中,目前對變壓器油的研究處理已成為一個熱門領域。
經過對變壓器故障的統計分析,發現過熱故障和放電故障是變壓器發生的主要故障,而H2、CH4、C2H6、C2H4、C2H2是與這兩類故障相關的主要特征氣體,所以就利用這5種特征氣體對變壓器的故障進行判斷。
使用傳統的 H2、CH4、C2H6、C2H4、C2H25 種故障特征氣體作為DGA輸入變量,會出現局部最優的問題,這5種特征變量所包含的故障信息不完整,導致故障診斷準確率較低,所以在改良三比值法 C2H2/C2H4、CH4/H2、C2H4/C2H6三維故障數據的基礎上,擴充到16維故障數據,再加上原先的H2、CH4、C2H6、C2H4、C2H2五維特征數據,可以有效地提升故障診斷的準確率,多維故障特征數據如表1所示。
表1 多維故障特征數據比值
5種氣體濃度的絕對含量,用S1到S5表示;10種氣體濃度的相對含量,用S6到S15表示;以及六種氣體和總烴TH(CH4+C2H6+C2H4+C2H2)的比值用S16-S21表示。
針對21維數據維數較多的問題,本文采用主成分分析法(PCA)對DGA數據降維,并生成新的綜合變量。累積方差貢獻率法(CPV)如下式所示:
其中PVi為方差貢獻率,。將這21個故障特征作為輸入變量,計算它們的累積可解釋性方差比例,結果如圖1所示。
圖1 累積可解釋性方差貢獻率
根據圖1中所示的累積可解釋性方差貢獻率可知,當降維后的故障特征維數為7時,方差貢獻率可以達到95%以上,之后的方差貢獻率趨于平穩,所以本文所用的PCA降維維數選擇為7。
輸入變量為上述7維變量特征數據,選取低能放電故障(D1)、高能放電故障(D2)、正常狀態(N)、局部放電故障(PD)、低溫過熱故障(T1)、中溫過熱故障(T2)和高溫過熱故障(T3)7種變壓器故障類別作為輸出變量,分類編碼見表2。
表2 故障類型分類編碼
DGA數據有其本身的特點,一是同一種氣體在量值上差異很大;二是這種分布并不均勻,往往大量樣本分布在較小的區間上,而少量樣本分布在較大的區間上;三是不同的類型的故障樣本數量差異較大,有的故障類型數據量較多,有的故障類型數據量較少,所以要對這些故障數據進行數據預處理,使之達到較好的分類效果。
傳統的數據預處理方法有歸一化和標準化。表3為數據歸一化、數據標準化和對數標準化的預處理結果對比。
表3 不同數據預處理形式下的診斷效果
1)歸一化
2)標準化
其中μ和σ分別表示樣本數據的均值和標準差。
3)對數標準化
綜上,本文選用對數標準化對數據進行預處理,可以對數據量級差異較大的情況進行量級壓縮,既可以盡量保留數據原有信息,又可以減少數據的量級差異,加快訓練速度。
為了驗證故障特征在PCA降維后對支持向量機的故障診斷的改善作用,將傳統方法與PCA降維后的故障數據作為輸入變量,用支持向量機進行故障診斷,得出經過PCA降維后的故障數據的診斷準確率和診斷時間有較為明顯的改善,實驗結果如表4所示。
表4 PCA降維前后診斷對比
支持向量機(SVM)是一種基于統計學習理論的新型學習機,是結構風險最小化方法的近似實現,適用于小樣本數據,通過某種非線性映射,將輸入變量x升維到高維空間z,使在低維空間難以線性可分的輸入變量在高維空間易于構造一個最優超平面,將樣本數據分為正例和負例兩個分類,并使之與最優超平面的間隔最大[9],最優超平面的示意圖如圖2所示。SVM 具有求解速度快、泛化能力強等優點,從而被廣泛地應用在許多領域中。
圖2 支持向量機超平面分類示意圖
尋找最優超平面的過程,可以將其表示為一個二次規劃問題,如下式所示:
標準SVM是二分類線性模型,而故障診斷是多分類模型,本文采用一對一的多分類支持向量機進行故障診斷,不會使計算量增加太多,而且保持比較高的分類準確率,并引入徑向基核函數(RBF)向高維空間映射,表達式如下:
根據文獻[10-12]中收集到的變壓器故障數據,共188組樣本數據,如表5所示。
表5 變壓器故障樣本
用支持向量機對故障數據進行仿真分析,用網格搜索法對SVM的核參數和懲罰因子進行參數尋優,其中懲罰因子的搜索范圍為[0.001,120]共30個搜索間隔,核參數的搜索范圍為:[0.001,50]共30個搜索范圍,形成一個30×30的搜索網格。參數尋優的效果圖如圖3所示,由網格搜索法可得到核參數和懲罰因子的最優值分別為:2.472、109.245,故障診斷準確率為84.31%。
圖3 SVM參數尋優示意圖
海鷗是最常見的海鳥之一,群居生活。海鷗最重要的特征是遷徙和覓食,遷徙時每只海鷗朝著最佳位置方向前進,以獲取豐富的食物資源,海鷗經常以螺旋形態攻擊其他鳥類,其行為如圖4所示。
圖4 海鷗遷徙和攻擊行為示意圖
根據文獻[13],可知海鷗優化算法的數學原理為:
1)遷徙
遷徙時,該算法模仿海鷗從一個位置飛到另一個位置,在遷徙過程中,海鷗群應該滿足3個條件。
避免碰撞:為了不與其他海鷗發生碰撞,在計算海鷗的新位置時添加附加變量A。
最佳位置方向:海鷗在避免與其他同類發生碰撞的同時,會向最佳位置的方向前進。
靠近最佳位置:海鷗向著最佳位置方向前進,到達新的位置。
其中Ds(t)就是海鷗的新位置。
2)攻擊(局部搜索)
海鷗在遷徙的時候通過翅膀和體重保持適當的高度,以不斷改變攻擊時的角度和速度。當海鷗在覓食攻擊獵物的時候,以螺旋形方式進行移動,海鷗的攻擊位置式子可得:
通過對海鷗算法的理論分析,可以將變壓器故障診斷尋優的過程歸納為以下步驟:
步驟一:從發表的文獻和資料中搜集有確切結論的變壓器故障數據,將5種氣體分數特征和16種比值特征共21維特征數據作為輸入變量。
步驟二:對步驟一處理后的輸入變量進行對數標準化處理,減少數據的離散程度,再經過PCA降維,將21維數據降為7維數據。然后將這些故障數據按照7∶3的比例分為互不相交兩部分,分別為訓練集和測試集,并對故障類型進行編號處理。
步驟三:采用海鷗優化算法對支持向量機的參數進行尋優,選擇出支持向量機達到最高準確率時的參數C和g,確定故障診斷模型。
步驟四:將測試集數據輸入到最佳參數確定的故障診斷模型中,對所建立的故障診斷模型的分類性能進行測試和評估。變壓器故障診斷的流程圖如圖5所示。
圖5 變壓器故障診斷流程圖
從發表的文獻和資料中收集到343個樣本數據,按照7∶3的比例將樣本數據分為240個訓練集樣本數據和103個測試集樣本數據,使用海鷗優化算法優化支持向量機參數的變壓器故障診斷,算法優化出的最優參數組合Bestc和Bestg分別為:297.191和0.998。從訓練集樣本數據和測試集樣本數據中分別隨機選擇出40個樣本,其實際故障與預測故障對比如圖6所示。
圖6 PSO-SVM樣本診斷示意圖
在本次仿真實驗中,訓練集的準確率達到了94.17%。從圖7的測試集樣本混淆矩陣中可以看出,測試集樣本有103個,其中94個樣本正確分類,測試集樣本分類準確率為:91.26%,達到了較好的分類效果。
圖7 測試集樣本混淆矩陣
在本次實驗中,表現效果不佳的低能放電故障,故障診斷正確率為83.33%,有兩個低能放電故障分別被分類為局部放電和高溫故障。低溫過熱故障和高溫過熱故障的診斷正確率分別為87.50%和88.89%,而高能放電故障、中溫過熱故障、局部放電故障和正常狀態的診斷正確率都達到了90%以上,其中局部放電故障和正常狀態的診斷正確率都達到了100%,如表6所示。
表6 決策模型診斷實例
文獻[14]提出了一種基于改進人工蜂群優化支持向量機(IABC-SVM)的故障診斷方法,該方法通過種群初始化和食物源更新的改進實現了收斂性的提高。為了驗證本文方法的尋優能力,將本文方法與IABC-SVM方法進行比較。將種群數量設置為20,最大迭代次數為100,優化得到的C和g的參數分別為12.106和5.645,IABC-SVM測試集的診斷正確率為90.29%。本文方法的測試集故障診斷正確率達到了91.26%,本文方法與IABC-SVM方法相比,診斷正確率有了提高。并且通過圖8中兩種方法的適應度曲線可以看出,本文方法的收斂速度較快,可以通過較少的迭代達到收斂狀態,收斂性能得到提高。
圖8 IABC-SVM與SOA-SVM適應度曲線
為了驗證基于SOA-SVM的變壓器故障診斷方法的可行性和有效性,分別利用遺傳算法GA、粒子群PSO這兩種常用的參數優化方法和神經網絡算法對變壓器故障進行診斷,故障樣本數據采用上文所用的343個樣本。采用文獻[15]提出的QPSO算法優化支持向量機參數,QPSO相關參數設置為:種群規模為100,種群權重系數為0.8,迭代次數為100次;GA相關參數設置為:種群規模為200,變異概率為0.01,交叉概率為0.6,進化迭代次數為300次;神經網絡算法使用4層網絡,使用L1正則化。
將以上三種優化方法分別對變壓器故障進行診斷,對這三種算法選取40個測試集樣本,其實際故障與預測故障對比如圖9所示。
圖9 各優化算法故障診斷分類模型
使用QPSO-SVM算法的故障診斷率為86.41%,使用GA-SVM方法的故障診斷率達到了85.43%,使用神經網絡模型的正確率為82.52%,而采用本文所使用的SOA-SVM算法的故障診斷正確率達到91.26%,與以上幾種算法相比,準確率分別提高了4.85%、5.83%、8.74%,其診斷結果如表7所示。仿真結果表明,在測試樣本中采用SOA-SVM方法的故障診斷正確率高于其他三種方法,該方法的診斷結果與實際故障具有較高的一致性,驗證了本文提出的優化算法對于變壓器故障診斷的有效性,也從側面反映出SOA-SVM具有較強的全局尋優能力。
表7 診斷結果比較
本文提出了基于SOA-SVM算法的變壓器故障診斷方法,對傳統變壓器特征氣體分數做了進一步處理,與傳統溶解氣體分析法相比,增加了16個氣體比值變量,使采集到的變壓器的故障信息更加具體完整,并且使用海鷗優化算法優化支持向量機的參數,提高了支持向量機的泛化能力和故障診斷準確性,有效解決了傳統支持向量機訓練大規模樣本數據容易造成“維數災難”的問題。并將本文所提出的方法與傳統QPSO-SVM、GA-SVM以及神經網絡故障診斷方法進行比較。結果表明,本文方法對支持向量機核參數和懲罰因子的參數尋優方面的故障準確率有明顯的優勢,克服了其他方法容易陷入局部最優的缺點,提高了全局搜索能力。根據仿真實例,本文方法對變壓器故障診斷的正確率達到了91.26%,高于其他傳統算法,證明了基于海鷗算法優化支持向量機在變壓器故障診斷過程中的有效性,能夠對變壓器故障做出較為精確的診斷,具有較強的泛化能力,并且具備一定的研究價值和工程應用價值。