摘要:為了提高基于油中溶解氣體分析(dissolved gas analysis, DGA)的變壓器故障診斷正確率,彌補單子空間特征提取的局限性,提出了基于雙子空間特征提取的變壓器故障分層診斷模型.首先,將DGA測試樣本在一個子空間內進行特征提取后,為避免核函數及其參數的選擇難題,以及利用多核支持向量機(multiplekernel support vector machine, MKSVM)魯棒性強和精度高的特點,采用MKSVM作為分類器對測試樣本進行預測.依據預測結果將測試樣本分為難分類和易分類樣本,對易分類樣本直接進行分類識別;對難分類樣本則將該樣本再次投影到另一子空間進行特征提取后,同樣采用MKSVM作為分類器對難分類樣本進行預測,綜合兩次預測結果進行分類識別,實現兩分類MKSVM的雙子空間特征提取算法.最后,根據故障特征,建立基于雙子空間特征提取算法的變壓器故障分層診斷模型.診斷實例表明,該模型具有較高的診斷正確率和推廣能力.
關鍵詞:故障診斷;雙空間算法;特征提取;多核學習;支持向量機
中圖分類號:TM411;TP277文獻標識碼:A
電力變壓器的安全運行直接影響輸電網系統的安全性,油中溶解氣體分析(dissolved gas analysis,DGA)是油浸式變壓器故障診斷最有效的手段之一.IEC三比值法等經典方法一直對基于DGA的變壓器故障類型分析發揮著重要作用,但存在缺編碼及臨界值判據缺損等問題[1].
近年來,人工智能方法如神經網絡、模糊聚類分析、灰關聯分析、支持向量機等,廣泛應用于變壓器故障診斷中,取得了較好的診斷效果.文獻[2]將主成分分析(principal component analysis, PCA)用于DGA數據分析.文獻[3]通過核主成分分析(kernel PCA, KPCA)將DGA樣本從低維的特征空間非線性地映射到高維核空間,故障診斷均取得了一定的效果.然而,任何一種單子空間特征提取算法都有其局限性.文獻[4]提出了基于PCA和獨立成分分析(independent component analysis, ICA)的雙空間特征提取算法并應用于人臉識別,較好地彌補了單子空間特征提取算法的不足.雙空間算法的思想是利用兩個特征子空間的互補性,在某一個特征子空間,有些模式易于識別,有些難于識別,將難識別的模式投影到另一個特征子空間有可能變成易于識別的模式.
支持向量機(support vector machine,SVM)采用結構風險最小化原理來提高泛化能力,較好地解決了小樣本、非線性、局部極小點等問題,適宜用于變壓器故障診斷.文獻[5-6]采用SVM構造分類器對變壓器故障類型進行診斷,取得了較好的診斷效果.然而,SVM的診斷性能過于依賴核函數及其參數的選擇,在不同的應用場合,核函數的性能表現差別很大,核函數的構造或選擇尚未有完善的理論依據,當樣本特征含有異構信息,樣本規模大,多維數據不規則,采用單個簡單核進行映射的方式處理并不合理[7].核融合利用各基本核的特征映射能力,較好地解決了核函數的選擇與模型的選擇難題.文獻[8-9]將多核學習的思想應用于研究SVM的建模問題,提高了建模精度.
本文利用DGA檢測數據,先將DGA測試樣本在一個子空間內進行特征提取,采用多核支持向量機(multiplekernel SVM, MKSVM)作為分類器對測試樣本進行預分類,對于難分類的測試樣本再次投影到另一子空間特征提取,綜合預分類結果進行識別,提出了2分類MKSVM的雙子空間特征提取算法,建立了變壓器故障分層診斷模型并驗證了模型的有效性.
4診斷實例分析
正常樣本取自某供電局檢測DGA樣本400例,其中,200例用于建模,200例用于訓練和測試.收集歷年來相關期刊公布的變壓器油中溶解氣體分析數據和少部分實際故障樣本,選出結論明確的135例樣本,其中,高溫過熱故障樣本50例,中低溫過熱樣本29例,低能放電樣本24例,高能放電樣本32例.實驗采用5折交叉驗證法,每次做實驗時,先從200例正常樣本中隨機選擇40例并從135例故障樣本中隨機選擇27例(高溫過熱樣本10例,中低溫過熱樣本6例,高能放電樣本6例,低能放電樣本5例)作為測試樣本集,其余268個樣本作為訓練樣本集.
5結論
本文提出了基于雙空間特征提取的變壓器故障分層診斷模型.利用多核支持向量機魯棒性強和精度高的特點,并依據多核支持向量機的預測結果進行預分類,將難識別的測試樣本投影到不同的特征子空間中進行綜合,避免了分類器選擇及支持向量機核參數選擇不當而導致的性能下降問題.從本文雙空間算法的實驗結果可以看出,采用具有互補性的雙空間進行特征提取,可以得到較高的識別率.先PCA或KPCA特征提取,而以ICA或KICA作為補空間更恰當.其中PCAKICA雙空間算法的識別率最高,達到88.15%,高于性能較優的單空間算法KICASVM的分類正確率達10百分點,且遠高于IEC三比值法23百分點.即使是分類性能較差的ICAPCA雙空間算法,分類正確率也達到82.22%,且各類的分類正確率都高于KICASVM和IEC三比值法,驗證了本文提出的基于雙空間特征提取算法的變壓器故障分層診斷模型的有效性.
參考文獻
[1]操敦奎. 變壓器油中氣體分析診斷與故障檢查[M].北京:中國電力出版社,2005.
[2]唐勇波, 桂衛華, 彭濤, 等. 基于重構貢獻和灰關聯熵的變壓器診斷方法[J].儀器儀表學報, 2012, 33(1):132-138.
[3]胡青, 孫才新, 杜林, 等. 核主成分分析與隨機森林相結合的變壓器故障診斷方法[J]. 高電壓技術, 2010, 36(7): 1725-1729.
[4]王衛東, 韓斌, 楊靜宇. 基于PCA及ICA的雙空間特征提取算法[J]. 中國圖象圖形學報, 2008,13(11):2163-2169.
[5]FEI Shengwei, ZHANG Xiaobin. Fault diagnosis of power transformer based on support vector machine with genetic algorithm[J]. Expert Systems with Applications, 2009,36: 11352-11357.
[6]BACHA K, SOUAHLIA S, GOSSA M. Power transformer fault diagnosis based on dissolved gas analysis by support rector machine[J]. Electric Power Systems Research, 2012, 83: 73-79.
[7]汪洪橋, 孫富春, 蔡艷寧, 等. 多核學習方法[J]. 自動化學報, 2010,36(8): 1037-1050.
[8]CHEN Zhenyu, LI Jianping, WEI Liwei, et al. Multiple kernel SVM based multipletask oriented data mining system for gene expression data analysis[J]. Expert Systems with Applications, 2011,38:12151-12159.
[9]YEH Chiyuan,HUANG Chiwei,LEE Shiejue. A multiple kernel support vector regression approach for stock market price forecasting[J]. Expert Systems with Applications, 2011, 38:2177-2186.
[10]LEE J M, YOO C, CHOI S W, et al. Nonlinear process monitoring using kernel principal component analysis[J]. Chemical Engineering Science, 2004,59(1):223-234.
[11]HYVARINEN A, OJA E. Independent component analysis: algorithms and applications[J]. Neural Networks, 2000, 13: 411-430.
[12]韋琦, 魏新勞. 應用核獨立分量分析的電力用戶負荷曲線估計[J]. 中國電機工程學報, 2008, 28(16):103-107.
[13]CAO L J,KEERTHI S S,ONG C J, et al. Developing parallel sequential minimal optimization for fast training support vector machine[J]. Neurocomputing, 2006,70: 93-104.