基于模糊核聚類和引力搜索的風電齒輪箱故障診斷
李狀馬志勇胡亮柳亦兵
華北電力大學,北京,102206
摘要:為了診斷風電齒輪箱已知類別和未知類別的故障,提出了基于模糊核聚類和引力搜索的故障診斷方法。首先建立以訓練樣本分類錯誤率為目標的聚類模型,利用模糊核聚類對訓練樣本進行分類;然后利用引力搜索算法求解聚類模型,獲得最優分類結果下每個類的類心;最后根據新樣本與各類心之間的核空間樣本相似度判斷屬于已知故障或者未知故障。結果表明,該方法準確度高,可有效用于風電齒輪箱故障診斷。
關鍵詞:模糊核聚類;引力搜索;風電機組齒輪箱;故障診斷
中圖分類號:TH165.3
收稿日期:2015-03-26
基金項目:國家自然科學基金資助項目(51305135);中央高校基本科研業務費專項資金資助項目(2014XS15);中國華能集團科技項目(HNKJ13-H20-05)
作者簡介:李狀,男,1987年生。華北電力大學能源動力與機械工程學院博士研究生。主要研究方向為旋轉機械設備故障診斷。發表論文6篇。馬志勇,男,1974年生。華北電力大學能源動力與機械工程學院副教授。胡亮,男,1988年生。華北電力大學能源動力與機械工程學院博士研究生。柳亦兵,男,1961年生。華北電力大學能源動力與機械工程學院教授、博士研究生導師。
Fault Diagnosis of Wind Turbine Gearbox Based on Kernel Fuzzy C-means
Clustering and Gravitational Search
Li ZhuangMa ZhiyongHu LiangLiu Yibing
North China Electric Power University,Beijing,102206
Abstract:In order to diagnose known faults and unknown faults of wind turbine gearbox, a method was proposed based on kernel fuzzy c-means clustering and gravitational search. Firstly, the clustering model was built based on wrong classification rate of training samples. The training samples were classified by kernel fuzzy c-means clustering. Then the gravitational search method was introduced for solving the clustering model. The class centers of optimal clustering result were acquired. Finally, the similarity parameters in kernel space between new data samples and the class centers were calculated for diagnosing whether the new data sample belonged to the known faults. The results show that the proposed method has higher precision, which can be applied to diagnose fault of wind turbine gearbox.
Key words:kernel fuzzy c-means clustering; gravitational search; wind turbine gearbox; fault diagnosis
0引言
齒輪箱是風電機組傳動鏈的關鍵設備,風電機組運行環境惡劣,導致齒輪箱故障頻繁發生,不僅事后維修工作難度大,而且費用高。因此對風電機組齒輪箱進行有效的監測和故障診斷具有重要意義。
故障診斷的本質是對故障信息的模式識別與分類[1]。近年來,國內外的許多學者將模式識別方法引入到風電機組故障診斷中。目前,大量的研究多采用基于有監督學習的模式識別方法,例如BP神經網絡、支持向量機、故障樹分析法[2-6]。這些方法是通過對大量已知故障類別的訓練樣本的學習,實現待識別樣本的分類與診斷。但是這種方法只能識別訓練樣本中含有的故障類別,當有新類別的樣本數據出現時,會給出錯誤的識別結果,導致錯誤診斷。實際故障診斷中,獲取所有已知故障的大樣本數據需要花費大量的人力和時間,難以獲取完備的故障樣本,這使得基于有監督學習的模式識別方法難以得到有效的應用。
模糊核聚類(kernel fuzzy c-means clustering,KFCM)是一種基于無監督學習的聚類算法,它利用核函數將原始輸入空間中的樣本數據映射到高維特征空間中再進行模糊聚類,能有效改善復雜數據集的聚類性能[7],在氣動系統、汽輪機、變壓器、衛星控制系統[8-11]等故障診斷領域得到了應用。但是在實際工程應用中,KFCM的分類效果依賴初始聚類中心和核函數參數的選擇。本文針對上述問題,結合KFCM算法和引力搜索算法(gravitational search algorithm,GSA)[12],提出一種基于模糊核聚類和引力搜索的風電機組齒輪箱故障診斷方法,實現風電齒輪箱已知和未知類別故障的自動診斷。
1模糊核聚類算法
模糊核聚類算法利用核函數,通過非線性映射將原始特征空間X映射至高維特征空間F后再進行聚類。非線性映射Ф可表示為
Φ∶xk∈X→Φ(xk)∈F
(1)
式中,xk為原始特征空間樣本,xk∈X。
KFCM算法的聚類目標函數為

(2)
式中,vi為原始特征空間中第i類的聚類中心,i=1,2,…,c;c為類別數;n為原始特征空間樣本數量;μik為第k個樣本xk對第i類的隸屬度,μik∈[0,1];m為加權指數。
如果直接將樣本映射到高維空間后再進行聚類,則存在確定非線性映射函數的形式和參數、特征空間維數等問題,但采用核函數可以有效地解決該問題。定義核函數K(x,y)=ΦT(x)Φ(y),這樣式(2)中高維空間的歐氏距離可表示為
‖Φ(xk)-Φ(vi)‖2=K(xk,xk)+
K(vi,vi)-2K(xk,vi)
(3)
常見的核函數有高斯核函數、多項式核函數、Sigmoid核函數等,本文選用高斯核函數:
K(x,y)=exp[-‖x-y‖2/(2σ2)]
(4)
式中,σ為高斯核參數。
根據約束條件,結合式(3)、式(4),運用拉格朗日乘子法求式(2)的極小值,可求得隸屬度和聚類中心:
(5)
(6)

2引力搜索算法
假設在一個d維搜索空間中有N個粒子,定義第l個粒子位置Ql=(ql1,ql2,…,qld),l=1,2,…,N。
根據牛頓引力定理,在第t次迭代中,第r維上第l個粒子受到第j個粒子的引力為
(7)
G(t)=G0e-αt/T
(8)
式中,ε為一個非常小的常量;MPl(t)為第l個粒子的被動引力質量;MAj(t)為第j個粒子的主動引力質量;G(t)為引力常數;G0=100,α=20;T為最大迭代次數。
所以在第t次迭代,第l個粒子受到來自其他粒子引力合力為
(9)
式中,ωj為區間[0,1]內的一個隨機數。
根據牛頓第二定理,粒子Ql在第t次迭代時產生的加速度為
alr(t)=Flr(t)/MIl(t)
(10)
式中,MIl(t)為粒子Ql的慣性質量。
在第t次迭代中,定義粒子Ql的質量為Ml(t),假設引力質量與慣性質量相等,則有MAl(t)=MPl(t)=MIl(t)=Ml(t)。定義
(11)
(12)
(13)
(14)
式中,fl(t)為在第t次迭代時的適應度值。
在每一次迭代過程中,粒子Ql根據計算得到的加速度來更新粒子的速度和位置,更新公式為
vlr(t+1)=τlvlr(t)+alr(t)
(15)
qlr(t+1)=qlr(t)+vlr(t+1)
(16)
式中,vlr、alr分別為粒子Ql的速度和加速度;τl為區間[0,1]內的一個隨機數。
3基于KFCM和GSA故障診斷方法的實現
3.1GSA求解KFCM聚類模型
本文首先利用KFCM法對已知類別的訓練樣本進行分類。定義一個含有c類、樣本特征維數為d的訓練樣本X,以訓練樣本的分類錯誤率評價聚類有效性,并以此為聚類目標建立聚類模型,根據文獻[13],訓練樣本的分類錯誤率為
(17)
式中,Ci為數據集X經過KFCM聚類運算后分在第i類的樣本集;Ui、|Ui|分別為數據集X中第i類的樣本集和所含樣本數量;|Ci∩Ui|為Ci和Ui的交集所含元素數量。
利用GSA求解聚類模型,以初始聚類中心和核函數參數為優化變量,定義初始聚類中心Zi=(zi1,zi2,…,zid),i=1,2,…,c,高斯核參數σ。GSA搜索算法粒子的編碼為
Ql=(z11,z12,…,z1d,z21,z22,…,z2d,…,
zc1,zc2,…,zcd,σ)
(18)
以式(17)為目標函數,以聚類中心和高斯核參數為優化變量,搜索W的極小值,則定義適應度函數f=W。GSA求解KFCM聚類模型流程如圖1所示。

圖1 GSA求解KFCM聚類模型流程圖
3.2故障診斷流程
基于KFCM和GSA的故障診斷步驟如下:
(1)將已知c類故障的歷史數據作為訓練樣本集X;
(2)利用KFCM對訓練樣本集進行分類,利用GSA求解KFCM聚類模型,獲得最優分類結果的第i類的類心oi;
(3)對于待診斷的新樣本xnew,首先根據式(19)計算新樣本xnew與類心oi之間的核空間樣本相似度[11]:
(19)
davg=∑d(x,oi)/|Ci|,x∈Ci
(20)
式中,d(xnew,oi)為xnew與類心oi在核空間上的歐氏距離;davg為第i類中所有樣本與類心oi在核空間上的平均歐式距離;|Ci|為分在第i類的樣本數量。



圖2 基于KFCM和GSA的故障診斷流程圖
4實例分析
4.1風電機組齒輪箱測試描述
以某風電場1.5MW雙饋風力發電機組為研究對象,風輪工作轉速范圍為11~21r/min,齒輪箱采用一級行星輪與兩級平行軸結合的傳動方案,如圖3所示。所選的風電機組齒輪箱在運行過程中曾出現中速級小齒輪裂紋故障(記為F1)、高速級小齒輪點蝕故障(記為F2)和高速輸出軸軸承內圈故障(記為F3)。在齒輪箱高速軸軸承座位置安裝了壓電加速度傳感器,采集了風輪工作轉速下的正常運行狀態(記為N)和3種故障狀態的加速度信號,信號采樣頻率為8192Hz,圖4為4種狀態下的部分原始時域波形圖。

圖3 風電機組齒輪箱結構示意圖
4.2特征值提取
考慮風電齒輪箱振動信號具有非平穩性,本文選用相對小波包能量作為風電機組齒輪箱振動信號特征值。小波包變換能夠對非平穩信號進行有效的分析,相對小波包能量能夠反應信號在不同頻帶內的能量分布,文獻[14]給出了相對小波包能量能特征值提取方法,定義如下。

(a)正常

(b)中速級小齒輪裂紋故障

(c)高速級小齒輪點蝕故障

(d)高速輸出軸軸承內圈故障 圖4 四種狀態振動加速度信號時域波形
離散時間信號x(t)經過J層小波包變換后,可以得到2J個頻率段的小波包系數CL(k),L=0,1,…,2J-1,某一頻段上的小波包能量定義為該頻率段的小波系數的平方和:
(21)
因此,所有頻段的總能量為
(22)
相對小波包能量為
εL=EL/E
(23)
為了驗證本文提出的方法能夠對已知故障進行識別,本文將N、F1和F2作為已知故障,分別編號為1、2、3,并分別從3種狀態信號中選取30組樣本作為訓練樣本,總共獲得90組訓練樣本,同時每個狀態選取3組樣本作為測試樣本。為了驗證提出的方法能夠對未知故障進行判斷,將狀態F3作為未知故障,并從對應的振動信號中提取3組樣本作為測試樣本。每個樣本采樣點數為2048。對每個訓練樣本和測試樣本進行3層小波包變換,根據式(21)~式(23)計算每個頻段上的相對小波包能量,并將其作為每個樣本信號的特征值,部分訓練樣本和測試樣本數據如表1和表2所示。利用KFCM對訓練樣本進行分類,運用GSA求解最優分類結果,獲得最優分類結果對應的各個類的聚類中心,最終按照圖2所示的故障診斷流程對測試樣本進行故障分類。
4.3KFCM和GSA參數設置
KFCM和GSA的參數設置如下:類別數量c=3,特征維數d=8,加權指數m=2,群體粒子個數N=50,最大迭代次數T=100,第k個粒子的初始速度vk=0,k=1,2,…,50。運用GSA求解KFCM聚類模型后,得到最優分類結果以及最優分類結果對應的每個類別的聚類中心和核函數參數σ,如表3所示。

表1 風電齒輪箱部分訓練樣本特征值

表2 風電齒輪箱測試樣本特征值

表3 最優分類結果對應的每個類的聚類中心矢量
4.4診斷結果與分析
根據圖2所示的診斷流程,對表2中的測試樣本進行分類診斷。根據文獻[13]給出的λ取值范圍,本文選取閾值常數λ=0.2,診斷結果如表4所示。從表4可以看出,前9個樣本中,每個樣本到各個聚類中心的核空間樣本相似度的最大值均大于λ,這表明樣本1~9屬于已知類別的故障。進一步觀察樣本1~9與各個聚類中心的核空間歐氏距離可以看出,樣本1~3與第1類聚類中心之間的核空間歐氏距離最小,所以樣本1~3分為第1類;樣本4~6與第2類聚類中心之間的核空間歐氏距離最小,所以樣本4~6分為第2類;樣本7~9與第3類聚類中心之間的核空間歐氏距離最小,所以樣本7~9分在為第3類。樣本10~12每個樣本到各個聚類中心的核空間樣本相似度的最大值均小于λ,表明這3個樣本類別不屬于訓練樣本中的已知故障類別,屬于未知故障,因此將樣本10~12編號為“4”,診斷結果與實際情況相符。

表4 KFCM+GSA診斷結果
最后,本文分別采用BP神經網絡和KFCM方法進行故障診斷,診斷結果如表5所示。從表5可以看出,基于有監督學習的BP神經網絡可以對已知類別的測試樣本1~9給出正確的分類結果,但是對未知類別的測試樣本10~12進行分類時,BP神經網絡將測試樣本分類在已知的故障類別中,與實際結果不符。這是因為BP神經網絡只記憶了訓練樣本中的類別,因此給出了錯誤的診斷結果。而本文提出的方法將未知類別樣本分在第4類,即不屬于原有訓練樣本中的已知故障類別。直接利用KFCM算法由于受到初始聚類中心和核函數參數選取的影響,在對已知類別和未知類別的測試樣本分類時均出現了錯誤分類。與表4的診斷結果進行對比,可以看出本文提出的故障診斷方法更加準確。

表5 BP神經網絡和KFCM診斷結果
5結語
本文提出了一種基于模糊核聚類和引力搜索的風電齒輪箱故障診斷方法,結合實際風電齒輪箱故障樣本數據對提出的方法進行了驗證,并與傳統BP神經網絡和KFCM分類方法進行了比較。結果表明,本文提出的方法不僅能夠準確地識別診斷出已知類別的故障樣本,而且能有效地識別判斷出未知類別的故障樣本,為風電機組齒輪箱狀態監測與故障診斷提供了一種新的思路。
參考文獻:
[1]Su Zuqiang,Tang Baoping,Deng Lei,et al. Fault Diagnosis Method Using Supervised Extended Local Tangent Space Alignment for Dimension Reduction[J]. Measurement,2015,62:1-14.
[2]李勝,張培林,李兵,等. 量子BP神經網絡在發動機故障診斷中的應用[J]. 中國機械工程,2014,25(16):2159-2163.
Li Sheng,Zhang Peilin,Li Bing,et al. Applications of Quantum BP Neural Network in Engine Fault Diagnosis[J]. China Mechanical Engineering,2014,25(16):2159-2163.
[3]龍泉,劉永前,楊勇平. 基于粒子群優化BP神經網絡的風電機組齒輪箱故障診斷方法[J]. 太陽能學報,2012,33(1):120-125.
Long Quang,Liu Yongqian,Yang Yongping. Fault Diagnosis Method of Wind Turbine Gearbox Based on BP Neural Network Trained by Particle Swarm Optimization Algorithm[J]. Acta Energiae Solaris Sinica,2012,33(1):120-125.
[4]劉麗娟,陳果,郝騰飛. 基于流形學習與一類支持向量機的滾動軸承早期故障識別方法[J]. 中國機械工程,2013,24(5):628-633.
Liu Lijuan,Chen Guo,Hao Tengfei. Incipient Fault Recognition of Rolling Bearings Based on Manifold Learning and One-class SVM[J]. China Mechanical Engineering,2013,24(5):628-633.
[5]Tang Baoping,Song Tao,Li Feng,et al. Fault Diagnosis for a Wind Turbine Transmission System Based on Manifold Learning and Shannon Wavelet Support Vector Machine[J]. Renewable Energy,2014,62(3):1-9.
[6]Yang Zhiling,Wang Bin,Dong Xinghui,et al. Expert System of Fault Diagnosis for Gearbox in Wind Turbine[J]. Systems Engineering Procedia,2012,4:189-195.
[7]Liu Jingwei,Xu Meizhi. Kernelized Fuzzy Attribute C-means Clustering Algorithm[J]. Fuzzy Sets and Systems,2008,159(18):2428-2445.
[8]蔣全勝,賈民平,胡建中,等. 一種基于人工免疫的模糊核聚類算法[J]. 中國機械工程,2008,19(5):594-597.
Jiang Quansheng,Jia Minping,Hu Jianzhong,et al. A New Artificial Immunity Based Fuzzy Kernel Clustering Algorithm[J]. China Mechanical Engineering,2008,19(5):594-597.
[9]黃保海,李巖,王東風,等. 基于KPCA和KFCM集成的汽輪機故障診斷[J]. 電力自動化設備,2010,30(7):84-87.
Huang Baohai,Li Yan,Wang Dongfeng,et al. Steam Turbine Fault Diagnosis Based on KPCA and KFCM Ensemble[J]. Electric Power Automation Equipment,2010,30(7):84-87.
[10]Ma Hui,Ekanayake, C,Saha, T K. Power Transformer Fault Diagnosis under Measurement Originated Uncertainties[J]. IEEE Transactions on Dielectrics and Electrical Insulation,2012,19(6):1982-1990.
[11]Hu Di,Sarosh A,Dong Fengyun. A Novel KFCM Based Fault Diagnosis Method for Unknown Faults in Satellite Reaction Wheels[J]. ISA Transactions,2012,51(2):309-316.
[12]Rashedi E, Nezamabadi-Pour H, Saryazdi S. GSA: a Gravitational Search Algorithm[J]. Information Sciences,2009,179(13):2232-2248.
[13]Li Chaoshun, Zhou Jianzhong. Semi-supervised Weighted Kernel Clustering Based on Gravitational Search for Fault Diagnosis[J]. ISA Transactions,2014,53(5):1534-1543.
[14]Shao Renping,Hu Wentao,Wang Yayun,et al. The Fault Feature Extraction and Classification of Gear Using Principal Component Analysis and Kernel Principal Component Analysis Based on the Wavelet Packet Transform[J]. Measurement,2014,54(6):118-132.
(編輯張洋)