周厚金,樓軍偉,胡赤兵
(1.蘭州理工大學 高新技術成果轉化中心,蘭州 730050;2.蘭州理工大學 機電工程學院,蘭州 730050)
滾動軸承故障小波核函數SVM分類識別研究
周厚金1,樓軍偉2,胡赤兵2
(1.蘭州理工大學 高新技術成果轉化中心,蘭州 730050;2.蘭州理工大學 機電工程學院,蘭州 730050)
對于非線性樣本,在提取了能反映故障信息的特征向量后關鍵是如何根據這些特征向量設計合理的分類器進行故障分類識別[1]。神經網絡作為一種無判別函數的、自適應的模式識別技術,能夠充分利用故障樣本信息進行訓練和識別,在機械故障診斷領域得到了廣泛的應用[2~5]:Paya A利用小波變換提取故障信息再用人工神經網絡進行旋轉機械故障診斷;楊宇等人利用經驗模態分解和神經網絡實現了滾動軸承故障診斷;芮執元等人利用小波和神經網絡實現齒輪故障診斷等。但是由于神經網絡自身的理論、算法、需要大量樣本、易收斂于局部極小值等問題使得其應用受到一定限制。相比于神經網絡,由Vapnik[6]基于統計學理論提出的支持向量機,能夠在小樣本下尋找出最優解,用核函數解決非線性分類識別問題,不存在收斂于局部極小值等問題。
SVM對于非線性樣本分類識別的實質是利用核函數將輸入數據映射到高維線性可分特征空間,然后進行分類識別,因此,核函數的性能會影響SVM分類識別的準確性。若核函數具有系數可變以及多尺度差值[7],就可提高SVM核函數的逼近精度和范化能力,而小波函數恰好具有以上兩點性質。 因此,文章基于平移不變核函數條件,將小波基函數構造成SVM核函數,研究小波核函數SVM的分類識別性能,并與傳統的徑向基核函數SVM作比較,比較結果表明小波核函數SVM對滾動軸承故障的分類識別準確性更高。
實驗所需數據是在圖1所示的實驗平臺上采集的,實驗臺主要由電機、齒輪箱、制動器、數據采集系統、計算機等組成。實驗臺、傳感器和數據采集系統主要參數和性能如表1所示。

圖1 實驗平臺
在Ⅰ軸軸承座水平和垂直方向上布置加速度傳感器。分別設置了軸承正常和內圈、外圈、滾動體單點點蝕故障,點蝕是通過電火花加工得到,點蝕直徑分別為0.17mm,深度為2.5mm,這樣組成四種模式。在電機轉速為2000rpm,采樣頻率為12KHz下,采集了軸承正常和內圈、外圈、滾動體點蝕故障數據各25組。
實際采集過程中噪聲或是脈沖干擾是均勻分布在所采集數據的整個區域,造成數據和噪聲各自頻譜的重疊。傳統的信號降噪方法是在頻域上用濾波器(低通、高通、帶通、帶阻)把信號和噪聲進行分離的,其前提是數據和噪聲各自的頻譜沒有重疊、混合,因此傳統的降噪方式存在一定的局限性。本文選擇對數據進行自動尋找軟閾值小波降噪處理,經反復試驗確定3層分解、sym8小波,Sqtwolog軟閾值的降噪效果最佳,圖2(a),(b)分別為其中1組軸承正常和內圈故障數據降噪前后波形對比,可發現降噪后提高了信噪比,保留了有用信號。

表1 實驗臺、傳感器、數據采集系統主要參數和性能

圖2 數據降噪前后對比
樣本熵[8](Sample Entropy,簡稱SampEn)是用一個非負數來表示時間序列的復雜性, 越復雜的時間序列樣本熵越大, 越規則的時間序列樣本熵越小。但對于非平穩、非線性數據,直接應用樣本熵計算復雜性區別度不高,因此,引入EEMD[9]。在EEMD分解后保留真實分量,再計算每個真實分量的樣本熵,EEMD樣本熵提取故障特征信息的過程如下:
在降噪后數據x(t)中加入白噪聲ni(t),其均值為0,標準差取信號標準差的0.4倍,則數據變為x(t),對x(t)進行EMD分解,得到本征模態分量(Intrinsic Mode Function,簡稱IMF)cij(t)以及余項ri,j(t),下標i,j表示第i次加入白噪聲分解得到的第j個IMF分量和余項,當分解結束時信號可表示為:

重復以上步驟N次,并對所有IMF分量進行總體平均運算,消除白噪聲,得到 EEMD分解后的IMF分量,即:

式中:N 越大白噪聲的和越趨于零。
在真實分量cj(t)中間隔的取M=2000個數據點,取相似容限系數r=0.25SD(c), SD(c)為cj(t)的標準差,取模式維數m=2,重構m維向量:

式中:k=1,2,…,M-m
計算c(k)與c(k+l)間的距離dkl:

式中:l=0,1,…,M-m。
統計每一個dkl小于r的數目以及此數目與距離總數M-m-1的比值Bkm(r):

按上述過程,在EEMD分解時設置白噪聲幅值0.1,運行100次,最終得到各組信號去除趨勢項后的12個IMF分量,其中IMF1表示原信號,IMF2-IMF12按頻率從高到低排序。由于EEMD分解必定存在虛假分量,因此,按相關系數法計算得到各組數據12個IMF分量的相關系數,按相關系數來濾除虛假分量。表2為其中1組外圈故障數據12個IMF分量的相關系數。

表2 外圈故障數據各IMF分量相關系數
從表中可知除了IMF1為原信號其相關系數為1外,只有IMF2 - IMF5的相關系數較大,IMF5分量以后快速減小趨于零,因此,軸承外圈故障真實分量為IMF1-IMF5分量,圖3為真實分量波形圖。對EEMD分解后的全部數據計算了相關系數,計算結果表明真實分量基本都為IMF1-IMF5分量,限于篇幅,文中未給出軸承正常和內圈、滾動體點蝕故障EEMD分解后真實分量。

圖3 濾除虛假分量后的外圈故障EEMD分解真實分量
全部數據保留真實分量后,按式(4)-(8)計算得到各組數據真實分量IMF1-IMF5的樣本熵。表3列出了其中1組軸承正常和內圈、外圈、滾動體故障數據真實分量IMF1-IMF5的樣本熵,并將其制作成SVM可以識別的格式:[label][index1]:[value1][index2]:[value2]…。句中:[label]為分類的種類;[index]為索引;[value]為用來訓練的數據。分析表3中的數據可以發現:
1)各組信號IMF分量的EEMD樣本熵均是IMF1>IMF2>IMF3>IMF4>IMF5,變化趨勢與圖3中波形的變化趨勢一致,符合越復雜的數據樣本熵越大,越規則的數據樣本熵越小的規律。
2)正常時EEMD樣本熵較小,故障時EEMD樣本熵增大,這種變化趨勢表明故障時產生了較多的故障信息。
3)EEMD樣本熵可以有效提取故障特征信息,能作為SVM分類識別的特征向量。
設線性可分樣本為xi, (i= 1 ,2,· · ·,n),輸出為yi= 1 或 -1,(i= 1 ,2,···,n),xi的分類線方程為:

要使分類線將ix全部正確分離,那么ix和iy必須滿足如下關系:

將式(10)轉化并引入拉格朗日乘子αi>0,i=1,2,n,則有:

現分對式(11)按w,b求偏導并等于零,得到在約束條件(12)下求關于αi函數式(13)的最小值:

設α*為上式的最小值,那么求解可得到線性可分下的最優分類函數為:

對于非線性樣本,SVM是利用核函數將輸入數據映射到高維線性可分特征空間。核函數k(x,x' )可以是點積形式,也可以是平移不變形式[10],用核函數k(x,x' )代替式(14)中的點積形式函數,就得到非線性下SVM最優分類函數:

表3 EEMD樣本熵

如果k(x,x')=k(x?x)滿足Mercer定理,當且僅當式(16)中k(x)的傅式變換成立,那么平移不變函數可作為SVM核函數[9]。

構造平移不變形式的小波核函數為:

式中:ai為尺度參數,大于0。
選擇墨西哥草帽小波基函數,根據式(17)構造的墨西哥草帽小波核函數為:

將式(18)構造的墨西哥草帽小波核函數代入式(16),經運算得到式(19)所示結果,由此驗證了所構造的小波核函數滿足平移不變條件,可以作為SVM的核函數。

支持向量機多分類方法有一對多、一對一、有向無環圖、決策有向無環圖、二叉樹法等[11]。本文選擇一對多算法進行分類,結合4種軸承模式,只需要4個二分類支持向量機分類器。
在訓練SVM1分類器時,若是正常軸承則輸出SVM1=1,不是則輸出SVM1=-1;訓練SVM2時,若是內圈故障則輸出SVM2=1,不是則輸出SVM2=-1;SVM3和SVM4采樣類似的方法訓練。
為了驗證小波核函數SVM的分類識別效果,與傳統的徑向基核函數SVM進行比較,經反復試驗,確定懲罰因子C都為1000,小波核函數的變換范圍為[-8,8],徑向基核函數參數σ=2。兩種核函數識別結果統計如表4所示。

表4 兩種核函數SVM分類識別結果統計
在訓練樣本各為10組,識別樣本各為15組時對比可知:
1)小波核函數SVM和徑向基核函數SVM在識別滾動軸承正常和滾動體故障時準確率均達到100%。
2)小波核函數SVM正確識別14個外圈故障樣本、14個內圈故障樣本,徑向基核函數SVM正確識別12個外圈故障樣本、13個內圈故障樣本。
3)小波核函數SVM總體識別準確率達96.65%,而徑向基核函數SVM總體識別準確率只有91.68%。
1)實驗中采集了軸承正常和內圈、外圈、滾動體故障數據,用自動尋找軟閾值小波降噪對數據進行了降噪處理,保留了有用信號,消除了噪聲的影響。
2)采用EEMD分解信號,相關系數法濾除虛假分量,得到了全部數據的真實分量IMF1-IMF5,用樣本熵表征全部真實分量的復雜性,得到了能反映故障特征信息的EEMD樣本熵。
3)尋找到非線性樣本下SVM的最優分類函數,為了提高SVM的分類識別精度,基于平移不變核函數條件和小波函數系數可變、多尺度差值的性質,構造和證明了墨西哥草帽小波核函數SVM。
4)根據4種滾動軸承數據模式,設計了4個二分類支持向量機分類器,為了驗證小波核函數SVM分類識別性能,與徑向基核函數SVM進行比較。比較結果表明,對于軸承正常和內圈、外圈、滾動體故障,小波核函數SVM的分類識別準確性較徑向基核函數SVM的高。
5)小波函數具有對任意函數強大的擬合能力,在本文的研究中小波核函數表現出良好的性能,因此,小波核函數也可應用在其他模式的SVM分類識別中。
[1]陳進.信號處理在機械設備故障診斷中的應用[J].振動與沖擊,1999,18(3):91-93.
[2]Paya A, Esat I I,Badi M N M. Artificial neural network based fault diagnosis of rotating machinery using wavelet transforms as processor[J].Mechanical Systems and Signal Processing,1997,11(5):751-765.
[3]楊宇,于德介,程軍圣.基于EMD與神經網絡的滾動軸承故障診斷方法[J].振動與沖擊,2005,24(1):85-88.
[4]Lai Wuxing,Peter W Yse, Zhang Guicai, etcl. Classif i cation of gear faults using cumulants and the radial basis function network[J].Mechanical Systems and Signal Processing,2004,18(2):381-389.
[5]芮執元,徐龍云,馮瑞成,等.基于小波神經網絡(WNN)的齒輪故障診斷[J].機械傳動,2008,32(1):80-83.
[6]Vapnik V N.The Nature of Statistical Learning Theory[M].NewYork:SpringVerag,1995:21-22.
[7]林繼鵬,劉君華.基于小波的支持向量機算法研究[J].西安交通大學學報,2005,39(8):816-819.
[8]Richman J S, J.RandallMoorman. Physiological time series analysis using approximate entropy and sample entropy[J].Am J Physiol Heart Physio,2000,278(6):2039-2049.
[9]WU Zhaohua,Huang Norden E.Ensemble empirical mode decomposition: a noise-assisted data analysis method[J].Advances in Adaptive Data Analysis,2009,1(1):1-41.
[10]S Amari,S Wu.Improving support vector machine classifiers by modifying kernel functions[J].Neural Networks,1999,12(6):783-789
[11]Chih Wei H su, Chih JenLin.A Comparison of methods for multiclass support vector machines[J].IEEE Trans.on Neural Networks,2002,13(2):415-425.
Research on rolling bearing fault wavelet kernel function sVM classification and recognition
ZHOU Hou-jin1, LOU Jun-wei2, HU Chi-bing2
支持向量機(Support Vector Machine, 簡稱SVM)是通過核函數來分類識別非線性樣本的,
為了提高SVM的分類識別精度,基于平移不變核函數條件,構造和證明了墨西哥草帽小波核函數SVM。實驗中采集了軸承正常和內圈、外圈、滾動體點蝕的故障數據,利用總體平均經驗模態分解(Ensemble Empirical Mode Decomposition,簡稱EEMD)和樣本熵提取了故障特征信息,將EEMD樣本熵作為小波核函數SVM的特征向量進行故障分類識別,并與徑向基核函數SVM的分類識別結果進行比較,比較結果表明小波核函數SVM的分類識別準確性更高。
滾動軸承;EEMD;樣本熵;SVM;小波核函數;分類識別
周厚金(1962 -),男,四川人,高級工程師,博士,研究方向為設備狀態監測和診斷。
book=4,ebook=104
TH133.33;TP206+.3
A
1009-0134(2014)05(下)-0048-04
10.3969/j.issn.1009-0134.2014.05(下).14
2013-12-06
甘肅省科技支撐計劃資助(1204GKCA068)