梁銀林,劉 慶
(1.東方汽輪機有限公司,四川德陽618000; 2.東方電機有限公司,四川德陽618000)
集成KPCA-SVM的汽輪發電機組故障診斷
梁銀林1,劉 慶2
(1.東方汽輪機有限公司,四川德陽618000; 2.東方電機有限公司,四川德陽618000)
針對汽輪發電機組系統故障數據呈現出的強非線性、數據高維等特點,將非線性數據處理方法KPCA和小樣本分類器SVM相結合,提出了一種集成KPCA-SVM的故障診斷方法。首先,該方法將利用KPCA對非線性數據的處理能力強的特點,在高維特征空間提取故障特征信息;其次,將故障特征信息輸入SVM模型,構建分類模型,克服SVM訓練不充分、無針對性的缺點。對汽輪發電機組模擬故障進行仿真實驗表明,提出的方法與SVM和PCA-SVM方法相比,能夠更好地處理非線性數據,提取有效的分類特征信息,獲得更高的故障模式識別準確率。
汽輪發電機組;特征提取;故障診斷;KPCA;SVM
汽輪發電機組是一類由大型旋轉動力機械設備、自動化控制設備等通過機、電、液、熱、信息等多介質耦合而成的復雜機電系統。這類發電系統通過TSI系統和DCS系統監控和記錄了整個系統運行過程狀態,存儲了海量多態數據。汽輪發電機組故障診斷是一個非常復雜的系統工程,融合了多學科領域的相關知識,而且故障本身的多因素特點,使得難以通過理論分析的方法在故障原因和故障特征之間建立其對應關系,而數據驅動的方法是挖掘海量、高維、多態數據中蘊含的故障信息。因此,研究數據驅動的汽輪發電機組[1-3],對于及時發現機組故障原因、避免重特大安全事故發生、實現機組安全、穩定、長周期高效運行具有重要意義。
傳統的汽輪發電機組故障診斷技術大多針對某一具體設備的固定部位和設備自身的運行狀態,缺乏系統層面整體性的研究。汽輪發電機組結構復雜、工作條件特殊 (高溫、高壓、高轉速 ),系統故障信號具有背景噪聲干擾大、非平穩、非線性的特點,其傳播過程途徑與衰減特性復雜,往往是多故障源信號混疊在一起,對故障信息的正確分析與獲取,進而準確地診斷故障造成困難。因此,從系統層面研究汽輪發電機組故障信號的特征分析與提取技術,從系統監測數據中獲取有效的、正確的故障特征信息,是進行準確故障診斷的技術關鍵[4]。
由汽輪發電機組的工作原理可知,機組轉子系統的振動是反映汽輪機運行狀態的重要指標,采用數據驅動的方法提取軸系振動信號中的故障特征信息,識別機組故障模式,進而對故障原因部位、程度進行分析,是對機組運行維護維修提供技術支持的一種有效途徑。本文采用KPCA[5-9]的非線性特征提取方法有效挖掘變量間的非線性關系,結合SVM處理分類問題的非線性和小樣本特點[9-11],提出集成KPCA-SVM的汽輪機組故障診斷方法,通過實驗數據分析對比,驗證了本方法的有效性和實用性。
核主成分分析方法——KPCA是PCA的非線性擴展。其核心思想是:通過非線性映射函數將輸入空間數據映射到高維的特征空間F,在F上進行PCA分析,其基本原理如下所述[5]:

(1)
Mλα=Kα
(2)
通過對上式求解,即可獲得要求的特征值λ和與之對應的特征向量ν。則X在F空間向量νk上的投影為:
(3)
(4)
其中En為單位矩陣。
支持量機(SVM)是一種基于統計學習理論和結構風險最小化原理的機器學習算法,相比于傳統學習方法,SVM具有精度高、運算速度快、泛化推廣能力強等特點,能夠解決傳統學習方法的過學習、模型選擇、維數災難、非線性等問題,因此,支持向量機廣泛應用于多個領域。
SVM的內涵是通過核函數將原始數據嵌入高維特征空間,從而在核特征空間中求取最優超平面分類器實現線性分類。SVM的實質是通過求解二次優化問題解決線性不可分和非線性可分兩類問題,其中線性不可分問題的判別函數:
f(x)=sgn[(w·x)+b]=
(5)
但在大多數情況下,因研究對象常伴有諸多非線性因素,實際采集的數據分類呈非線性可分。對此,引入核函數,將輸入空間的非線性可分轉變為高維特征空間的線性可分,其最優分類函數為:
f(x)=sgn((w·x)+b)=
(6)
由上述原理可知,SVM不僅可以用于模式線性分類,而且還能夠利用“核技巧”解決非線性模式分類問題。
SVM本質是一種針對兩分類問題的分類器,但是實際模式分類往往是針對多分類問題。對于多分類問題,SVM的解決途徑通常有兩種:一種是通過多個兩類SVM分類器的組合實現多分類,如一對多(One-Against-Rest)、一對一(One-against-One)和導向無環圖(DGASVM);第二種是通過求解多個分類決策函數的最優化問題實現多分類。兩者相比較,后者的問題求解涉及變量多,求解復雜,導致訓練速度慢、分類精度差。針對汽輪機組運行數據的海量多態、非線性等特點,本文SVM將采用一對一分類策略實現故障模式多分類。
本文提出一種集成KPCA-SVM的汽輪機組故障診斷方法,用來提取原始數據中的有效分類信息,挖掘原始數據特征中的整體特征信息作為分類特征,從而進行故障模式識別。利用KPCA對原始數據進行非線性特征提取,并將其作為SVM模型的輸入進行訓練,建立故障模式分類模型。
基于集成KPCA-SVM建模方法具體步驟如下:
(1)集成KPCA-SVM故障模式診斷模型建立
(a)對汽輪機組故障案例數據X,通過KPCA提取數據非線性主元,將其當作SVM分類器的訓練數據。

(c)通過上述條件,建立第k個支持向量機分類器模型:
(7)
(d)重復步驟(b)和(c),直到獲得故障模式案例數據所有的支持向量分類器。
(2)KPCA-SVM故障模式在線診斷模型建立
(a) 裝入SVM模型參數。

(c)根據決策值輸出故障模式類型。
集成KPCA-SVM診斷模型的構建,需要根據研究系統的特點,選取適數據性的KPCA核參數和主元個數,以及SVM核參數及正則參數,目前研究只是給出了一般性的指導原則[2,4],本文不失一般性的選取合適的模型參數,以便對集成KPCA-SVM的方法的正確性及實用性進行驗證。
汽輪發電機組故障具有多樣性、多層次性、復雜性、非線性、模糊性以及隨機性等特點,因此研究汽輪發電機組故障診斷方法需要大量故障實驗數據,但在實際應用中從很難從豐富的機組監測數據獲取有效全面的故障數據信息,進而準確地診斷出故障的類型、嚴重程度以及發生部位。本文擬采用試驗臺模擬汽輪發電機組運行狀況,建立汽輪發電機組故障案例庫,有針對性地對機組典型故障進行分析,驗證方法的準確性和可靠性,掌握故障分析方法的影響因素(如監測變量的選取、機組運行參數和機組結構等),積累分析經驗,對實際生產過程出現的機組故障提供科學有效的技術支持。因此本文主要研究汽輪發電機組常見的4種振動故障,用同步整周期采樣方法采集故障數據進行分析,每周朗采樣32點,采樣點數為1 024點,故障樣本數據見表1。研究表明,這4種故障對分析機組軸瓦異常振動、提取故障特征值及故障診斷有十分重要的意義。

表1 故障測試樣本數據集
故障特征的提取是故障診斷的關鍵步驟,因時域波形為原始振動信號的信息來源,頻域分析則是對系統動態特征的分析,這里綜合考慮時域與頻域信息,選取反映時域波形特征的6個無量綱參數和頻域信息中的8個頻率(或頻段)的譜值(譜值和)作為分析樣本的特征屬性。樣本特征屬性如下:
[K,C,I,L,Kv,S,0.01~0.49f,0.5f,1f,
2f,3f,(3~5)f,(5~10)f,oddf]
(8)
式中:K為波形指標;C為脈沖指標;I為峰值指標;L為裕度指標;Kv為歪度指標;S為峭度指標;f為工作頻率;oddf為奇倍頻譜值和。
汽輪發電機組振動信號的頻域和時域特征是對同一信號的不同方面指標分析,信息冗余量大,故障特征屬性存在非線性,使得故障模式錯分率高。將本文提出的方法應用于實驗數據分析,對實驗樣本數據進行KPCA非線性特征提取,在高維特征空間選取有效的故障特征并降低特征維數,提取的故障特征作為SVM的輸入,構建SVM故障模式分類模型,對測試樣本進行故障模式分類。同時,為了呈現KPCA-SVM對汽輪發電機組故障診斷效果的優越性,本文將SVM、PCA-SVM和KPCA-SVM進行對比分析,實驗結果如表2所示。在實驗數據分析中,SVM和KPCA中的核函數都采用高斯核函數,其中SVM核參數采用默認設置,KPCA方法中核參數取σ=60,核主元個數通過CPV(主元累積貢獻率法)獲得m=3。

表2 三種故障模式識別對比
由表2可見,KPCA-SVM的識別率明顯優于SVM和PCA-SVM,其實驗結果如圖1、圖2、圖3所示。由圖可進一步看出,錯分主要存在故障4,在3種方法中,其最后兩個測試樣本都被錯分為故障2,主要原因是訓練樣本集以及診斷模型參數的選擇有關。進一步對SVM和PCA-SVM 分類結果對比分析,可以看出兩種方法的分類率相近,并遠小于KPCA-SVM的判別率,從而驗證了汽輪發電機組故障數據集的非線性特性,并說明采用非線性方法提取故障特征的可行性。從整體上看,KPCA-SVM的效果優于其他兩類,這也說明了KPCA-SVM可以汽輪發電機組的故障模式診斷,且具有較好的診斷效果。

圖1 SVM故障分類結果圖
可見,通過KPCA方法提取機組監測數據中的有效的故障信息,并在高維特征空間反映了數據之間的可分性,融合SVM對小樣本數據分類處理能力,從而可以有效提高故障診斷的正確率。在實際生產過程的應用中,汽輪發電機組設備龐大、系統復雜、自動化程度高,TSI系統和DCS系統監控監測變量多,因此,選取與機組故障關聯強的監測變量,剔除系統一些“非正常”數據,分層次、分模塊地自適應的建立系統動態的KPCA-SVM故障診斷模型(模型參數適數據性的選取方法),可以有效地提高KPCA-SVM故障診斷方法的可用性和準確性。

圖2 PCA-SVM故障分類結果圖

圖3 KPCA-SVM故障分類結果圖
汽輪發電機組系統運行過程中的故障診斷包括故障特征提取和故障模式分類兩大部分。提取的原始數據故障特征越準確,故障模式的可分離能力越強,識別的準確率則越高。本文基于集成KPCA-SVM的方法,利用KPCA的非線性處理能力提取原始數據中的有效故障特征,在降低數據維數的基礎上能夠更加準確地捕獲數據分類特征信息,并用于SVM的輸入,從而提高SVM的分類效果。將集成KPCA-SVM方法在汽輪發電機組模擬多種故障模式下進行仿真測試,并與SVM和PCA-SVM分類方法得到結果相比較,本文提出的集成KPCA-SVM方法能夠得到更高的識別正確率。在后期工作中,需要進一步對模型的參數選取方法進行深入研究,以期能進一步提高系統故障診斷的準確性和可靠性。
[1] 翟永杰,王東風,韓璞.基于多類支持向量機的汽輪發電機組故障診斷[J].動力工程學報,2003,23(5):2694-2698.
[2] 司娟寧,劉金園,董澤,等.基于主成分分析與支持向量機的汽輪機故障診斷[J].汽輪機技術,2011,53(2):139-142..
[3] 嚴可國.大型汽輪發電機組故障診斷方法及監測保護系統研究[D].北京:華北電力大學,2009:17-32.
[4] 張曦,閻威武,劉振亞,等.基于核主元分析和鄰近支持向量機的汽輪機凝汽器過程監控和故障診斷[J].中國電機工程學報,2007,27(14):56-61.
[5] 何青,解芳芳,李紅,等.基于流形學習方法的汽輪機組振動特征提取[J].振動、測試與診斷,2014,34(4):705-708.
[6] 肖健華.智能模式識別方法[M].廣州:華南理工大學出版社,2006:126-133.
[7] 黃保海,李巖,王東風.基于 KPCA 和 KFCM 集成的汽輪機故障診斷[J].電力自動化設備,2010,30(7):84-87.
[8] 鄧曉剛,田學民.一種基于 KPCA 的非線性故障診斷方法[J].山東大學學報(工學版),2005,35(3):103-106.
[9] 王加祥,吳斌,蘇紅偉.基于核主元分析和支持向量機相結合的齒輪箱齒輪故障識別方法[J].上海電機學院學報,2015,18(4):221-226.
[10] ANDREW A M.An Introduction to support vector machines and other kernel‐based learning methods[M]// An Introduction to Support Vector Machines:China Machine Press,2005:1-28.
[11] 石志標,苗瑩.基于FOA-SVM 的汽輪機振動故障診斷[J].振動與沖擊,2014,33(22):111-114.
The Steam Turbine Fault Diagnosis Based on KPCA and SVM Ensemble
LIANG Yinlin1,LIU Qing2
(1.Dong Fang Steam Turbine Corporation,Deyang 618000,China; 2.Dong Fang Electric Machinery Corporation,Deyang 618000,China)
A steam turbine fault diagnosis method based on KPCA and SVM ensemble is proposed for the fault data with high-dimensional and non-linear characteristics,which combines the nonlinear data processing method with small sample classifier.Firstly,the method is used to extract the fault feature information in the high dimensional feature space,considering of the excellent nonlinear processing ability of KPCA.Secondly,a classification SVM model with the fault feature information is set up to overcome the disadvantages of SVM model.The simulation results of steam turbine proves the better capability of processing nonlinear data,effective classification feature information extraction and higher fault pattern recognition accuracy of the proposed method,compared with the SVM method and PCA-SVM method.
steam turbine; feature extraction; fault diagnosis; SVM; KPCA
10.3969/j.ISSN.1672-0792.2017.01.005
2016-09-05。
TP391;TK267
1672-0792(2017)01-0027-05
梁銀林(1987-),男,碩士研究生,研究方向為汽輪機狀態監測和故障診斷。