鄭近德 程軍圣 楊 宇
湖南大學汽車車身先進設計制造國家重點實驗室,長沙,410082
時頻分析方法由于能夠提供振動信號時域和頻域局部信息而在故障診斷領域得到了廣泛應用,是目前故障診斷的重要手段[1-2]。該方法通過對信號進行小波分析[3]或經驗模態分解[4-5],將非平穩信號分解為若干個簡單的平穩信號之和,然后對每個分量進行處理,提取時頻域信息,進而得到原始信號的完整時頻信息。然而,由于機械運轉過程中的摩擦、振動以及負載等因素,機械系統振動信號往往表現出非線性行為,采用時頻分析的方法,將信號分解為平穩信號,難免有一定的局限性。非線性分析的方法可以不經過對原始信號分解,而能夠直接提取隱藏在機械系統振動信號中其他方法無法提取的故障信息[6]。
近年來,越來越多的非線性分析方法被用于機械故障診斷,如關聯維數、近似熵、樣本熵、多尺度熵等。徐玉秀等[7]研究了旋轉機械的分形特征及故障診斷,Yan等[8]將近似熵應用于機械系統健康狀態監測,Zhang等[9]將多尺度熵應用于滾動軸承的故障診斷。然而,分形維數的計算依賴數據長度,且較耗時,不適合在線監測;近似熵相對一致性較差[9];多尺度熵[10-11]是基于樣本熵而定義的,計算較耗時,且受時間序列的非平穩性和異常值的影響。
排列熵[12]是一種新的隨機性和動力學突變的檢測方法,它具有計算簡單,抗噪能力強,且得到較穩定的系統特征值所需時間序列短,適合在線監測等優點,在肌電信號處理[13]、心率信號處理[14]、氣溫復雜度[15]等方面都取得了良好的效果。Yan等[6]將其應用于旋轉機械振動信號的特征提取,并將其與近似熵和Lempel-Ziv復雜度進行了對比,結果表明,排列熵能夠有效地檢測和放大振動信號的動態變化,并且能夠表征滾動軸承在不同狀態下的工況特征。然而,與傳統的基于單一尺度分析的非線性參數類似,排列熵只是檢測時間序列在單一尺度上的隨機性和動力學突變。Aziz等[16]提出了多尺度排列熵(multiscale permutation entropy,MPE)的概念,用于衡量時間序列在不同尺度下的復雜性和隨機性,并通過分析生理信號,將其與多尺度熵進行了對比,結果表明,相對于多尺度熵,MPE更具有魯棒性。由于機械系統比較復雜,振動信號不僅在單一尺度上包含有重要信息,而且在其他尺度上也包含有重要信息,因此,對振動信號進行多尺度分析是一種有效的方法。
本文將MPE引入到機械故障診斷領域,應用于滾動軸承的故障特征的提取。由于正常滾動軸承的振動信號是隨機振動信號,而當滾動軸承發生故障時,振動信號隨機性和動力學行為會發生變化。因此,本文考慮用MPE來衡量振動信號的隨機性變化和動力學突變,并將MPE值作為特征參數,提取滾動軸承的故障特征。在此基礎上,結合支持向量機(support vector mechine,SVM)[17-18]作為模式識別分類,提出一種基于MPE和SVM的滾動軸承故障診斷方法,并將其應用于滾動軸承實驗數據的分析,結果表明,新提出的方法能夠有效地診斷滾動軸承的故障類型。
排列熵的原理在于不考慮數據具體值,而是基于相鄰數據的對比。下面說明其計算方法。
考慮長度為N 的時間序列{x(i),i=1,2,…,N},對其進行相空間重構,得到如下的時間序列:

式中,m為嵌入維數;λ為時延。
將X(i)的m個數據按照升序重新排列,即

如果存在x(i+ (ji1-1)λ)=x(i+ (ji2-1)λ),此時按j值的大小來進行排序,即當jk1<jk2,有x(i+(ji1-1)λ)≤x(i+(ji2-1)λ),所以,任意一個數據X(i)都可以得到一組符號序列:

其中,g =1,2,…,k,k ≤ m!,m 個不同的符號{j1,j2,…,jm}共有m!種不同的排列,對應地,共有m!種不同的符號序列,S(g)是m!種符號序列中的一種。計算每一種符號序列出現的概率=1,此時,時間序列{x(i),i=1,2,…,N}的排列熵就可以按照Shannon熵的形式定義為

注意到,當Pg=1/m!時,Hp(m)達到最大值ln(m!),因此,可以通過ln(m!)將排列熵Hp(m)進行標準化處理,即

顯然,Hp的取值范圍是0≤Hp≤1。Hp值的大小表示時間序列的復雜和隨機程度。Hp越大,說明時間序列越隨機,反之,則說明時間序列越規則。Hp值的變化反映和放大了時間序列的局部細微變化。
在排列熵的計算中,有3個參數值需要考慮和設定,即時間序列長度N、嵌入維數m和時延λ。Bandt等[12]建議嵌入維數m取3~7,因為如果m等于1或2,此時重構的序列中包含太少的狀態,算法失去意義和有效性,不能檢測時間序列的動力學突變。但是,如果m取值過大,也不合適,因為相空間的重構將會均勻化時間序列,此時不僅計算比較耗時,而且也無法反映序列的細微變化[8,15]。
為研究數據長度N對排列熵值的影響,以長度分別為128、256、512、1024和2048的高斯白噪聲信號為例,求得對應排列熵值,分別記為PE1~PE5,如圖1所示,它們在不同嵌入維數下差值如表1所示。

圖1 不同長度的高斯白噪聲的排列熵

表1 不同長度高斯白噪聲信號排列熵在不同嵌入維數下的差值
由圖1和表1可以發現,以嵌入維數m=6為例,數據長度分別為1024和512時,熵值相差0.0659,而數據長度分別為2048和1024時,則熵值僅相差0.0309,因此,此時選數據長度為1024較合適。而對m=5而言,數據長度分別為1024和256的信號的熵值僅相差0.0502,此時,數據長度為256已經可以估計合理的排列熵值。一般,嵌入維數較小時,數據長度則要求越小。
時延λ對時間序列的計算影響較小,以長度為512的高斯白噪聲信號為例,在不同λ下的排列熵值隨嵌入維數的變化關系如圖2所示,由圖可以看出,時延對信號熵值的影響較小,因此,本文取λ=1。

圖2 高斯白噪聲信號在不同時延下的排列熵
多尺度排列熵定義為不同尺度下的排列熵,計算方法如下:
(1)考慮時間序列{x(i),i=1,2,…,N},對其進行粗粒化處理,得到粗粒化序列的表達式為

其中,[N/τ]表示對N/τ取整;τ為尺度因子,τ=1,2,…。顯然τ=1,粗粒化序列即為原始序列;τ>1時,原始序列被粗粒化為長度為[N/τ]的粗粒序列。
(2)計算每個粗粒序列的排列熵,并畫成尺度因子的函數,上述過程即稱為多尺度排列熵分析。
尺度因子的最大值一般取大于10即可,但要保證粗粒化序列長度[N/τ]不影響熵值的計算。
為了選取合適的計算MPE的嵌入維數,仍以高斯白噪聲為例,數據長度為2048,尺度因子最大值為12,λ=1,在m 分別為4、5、6和7時,求得它們的MPE,相對耗時分別為0.1880s、0.6710s、3.8290s和27.6710s,將MPE畫成尺度因子的函數,如圖3所示。
由圖3可以看出,若m 取值太小,則PE值隨尺度因子的增大而減小,但m越大,計算越耗時,因此,本文選取m=6。此外,由圖3可以看出,高斯白噪聲的MPE隨著尺度因子的增大而單調遞減,這說明白噪聲只在最小尺度上包含有主要信息。

圖3 高斯白噪聲在不同嵌入維數下的MPE
在上述理論的基礎上,本文提出基于MPE和SVM的滾動軸承故障診斷方法。首先,從滾動軸承的原始振動信號從提取MPE;其次,依據MPE提取合適的故障特征向量;第三,采用SVM進行故障分類,從而實現滾動軸承故障類別的診斷。
為了說明本文方法的有效性,本文將該方法應用于實驗數據分析。本文實驗數據采用Case Western Reserve University(CWRU)軸承數據中心提供的滾動軸承試驗數據[9]。測試軸承為6205-2RS JEM SKF深溝球軸承,電機功率約為2206.4963W,轉速為1730r/min,采用電火花加工技術在軸承上布置單點故障,故障直徑為0.5334mm,深度為0.2794mm。在此情況下采集到正常(normal,簡稱 NORM)、內圈故障(inner race fault,IRF)、外圈故障(outer race fault,ORF)和滾動體故障(rolling element fault,REF)4種狀態的振動信號,各30組數據,數據長度為2048,采樣頻率為12kHz,4種狀態軸承的振動信號時域波形如圖4所示。

圖4 正常和不同故障軸承振動信號的時域波形
從圖4不易發現正常和故障軸承振動信號的明顯區別,尤其是正常和滾動體故障,以及內圈故障和外圈故障。因此,本文首先對振動信號進行MPE分析,取嵌入維數m=6,時延λ=1,最大尺度因子為12,4種狀態滾動軸承的多尺度排列熵畫成尺度因子的函數,如圖5所示。

圖5 正常和故障滾動軸承振動信號的多尺度排列熵
在尺度因子等于1時,即為原始振動信號的排列熵,由于熵值比較接近,無法明顯地區別三種故障和正常軸承的類型,因此有必要對振動信號進行多尺度分析。為此,以多尺度排列熵值為特征參數,同時建立基于SVM的分類器,進行訓練和測試。如果采用全部的12個特征值進行訓練,會造成信息的冗余,且訓練比較耗時,也需要較多的訓練樣本,且由圖5也可以看出,前幾個尺度的熵值表征了振動信號的主要信息,因此,采用前4個尺度的排列熵值作為特征向量,即T=(PE1,PE2,PE3,PE4)。因此,本文的方法如下:
首先,提取特征參數,即對振動信號進行MPE分析,提取特征參數T。正常、滾動體故障、內圈故障和外圈故障4種狀態,每種狀態取30個樣本,故每種狀態可得到30個表征故障特征的特征向量,共得到120個特征向量。
其次,訓練分類器。由于有3種故障狀態和正常狀態,因此,需建立3個SVM,其中SVM1為正常對3種故障分類器,SVM2為內圈故障對滾動體和外圈故障分類器,SVM3為滾動體故障和外圈故障分類器。每種狀態隨機抽取10個樣本進行訓練,并將每組30個樣本用來測試。經過訓練,SVM1和SVM3采用徑向基核函數,SVM2采用多項式核函數。基于SVM的多故障分類器如圖6所示。

圖6 多類故障支持向量機分類器示意圖
最后,測試分類器。對已訓練的SVM1、SVM2和SVM3,用全部樣本進行測試,詳細測試樣本輸出結果如表2所示。

表2 測試樣本SVM分類器的輸出結果
由表2可以看出,本文提出的方法有很好的效果,在全部樣本用來測試中,只有一組外圈故障的樣本被錯分為滾動體故障,其他都得到了正確的分類,正確識別率為99.17%。為了比較,下面建立以 BP 神 經 網 絡 為 基 礎 的 多 分 類 器[9,19-20],BP分類器除輸入層外,第一層隱含層有8個節點,第二層輸出層有4個節點。為表述方便,標記正常為1類,內圈故障為2類,滾動體為3類,外圈故障為4類。BP分類器的訓練和測試樣本與支持向量機相同,其分類結果如圖7所示。

圖7 BP神經網絡分類器輸出結果
圖7中,訓練樣本作測試時,全部分類正確,而測試樣本作測試時有3組分類錯誤,準確率為97.5%。這說明支持向量機的分類效果要優于BP神經網絡。而且,在訓練時間上,支持向量機也比BP神經網絡短得多。
為了說明進行多尺度分析的必要性,下面選取尺度因子等于1時(即原始信號)的排列熵值作為特征參數,分別通過SVM和BP神經網絡分類器進行訓練和測試。其中,SVM分類器中,有6組樣本分類錯誤,如表3所示;而BP神經網絡分類器也有6組樣本分類錯誤,如圖8所示。

表3 測試樣本SVM分類器的輸出結果

圖8 BP神經網絡分類器輸出結果
從上文可以看出,原始信號單一尺度的排列熵作為特征參數,分類效果不理想,這說明了單一尺度上原始振動信號的排列熵并不能反映故障的本質,而多個尺度上的排列熵值則能夠更好地實現分類。另外易發現,特征值的選取對分類結果的影響尤為關鍵。本文選取特征值為前4個尺度上的特征值,主要基于以下原因考慮:如果特征值過少,不能完全反映故障的特征信息,而特征值過多會造成信息冗余,且需要增加訓練樣本和訓練時間,因此,本文選取了前4個尺度上的特征值。文獻[9]中選擇多尺度熵值的統計量時,將最大值、最小值、代數平均、幾何平均和標準差作為特征向量,但統計量方法忽略了特征值之間的內在關系,因此,采用前4個尺度因子的排列熵值作為特征參數。
機械系統發生故障時,振動信號會在不同尺度上表現出不同程度的隨機性和動力學突變,基于此,本文提出了一種新的基于多尺度排列熵和支持向量機的滾動軸承故障診斷方法,并將支持向量機與BP神經網絡分類效果進行了對比。結果表明,支持向量機在訓練時間和準確率方面,都優于BP神經網絡。此外,本文還將特征向量包含多個尺度上熵值與特征向量僅包含原始信號單一尺度上排列熵值進行了對比,結果表明,原始信號單一尺度上排列熵值的不能全部反映故障的本質,而多尺度的排列熵值則有很好的診斷效果。本文提出的方法為故障診斷提供了一種新的思路和手段。
[1]于德介,程軍圣,楊宇.機械故障診斷的 Hilbert-Huang變換方法[M].北京:科學出版社,2007.
[2]何正嘉,陳進,王太勇,等.機械故障診斷理論及應用[M].北京:高等教育出版社,2010.
[3]程軍圣,于德介,鄧乾旺,等.連續小波變換在滾動軸承故障診斷中的應用[J].中國機械工程,2003,14(23):2037-2040.Cheng Junsheng,Yu Dejie,Deng Qianwang,et al.Rolling Bearing Fault Diagnosis Using Continuous Wavelet Transform[J].China Mechanical Engineering,2003,14(23):2037-2040.
[4]Huang N E,Wu Z.A Review on Hilbert-Huang Transform:Method and Its Applications to Geophysical Studies[J].Advances in Adaptive Data Analysis,2009,1:1-23.
[5]Yu Dejie,Cheng Junsheng,Yang Yu.Application of EMD Method and Hilbert Spectrum to the Fault Diagnosis of Roller Bearings[J].Mechanical Systems and Signal Processing,2005,19:259-270.
[6]Yan Ruqiang,Liu Yongbin,Gao R X.Permutation Entropy:A Nonlinear Statistical Measure for Status Characterization of Rotary Machines[J].Mechanical Systems and Signal Processing,2012,29:474-484.
[7]徐玉秀,鐘建軍,聞邦椿.旋轉機械動態特性的分形特征及故障診斷[J].機械工程學報,2005,41(12):186-189.Xu Yuxiu,Zhong Jianjun,Wen Bangchun.Fractal Fault Diagnosis and Classification to Modal Characteristic of Rotor System[J].Journal of Chinese Mechanical Engineering,2005,41(12):186-189.
[8]Yan Ruqiang,Gao R X.Approximate Entropy as a Diagnostic Tool for Machine Health Monitoring[J].Mech.Syst.Signal Process,2007,21:824-839.
[9]Zhang Long,Xiong Guoliang,Liu Hesheng.Bearing Fault Diagnosis Using Multi-scale Entropy and Adaptive Neuro-fuzzy Inference[J].Expert Systems with Applications,2010,37:6077-6085.
[10]Richman J S,Moorman J R.Physiological Timeseries Analysis Using Approximate Entropy and Sample Entropy[J].American Journal of Physiology-Heart and Circulatory Physiology,2000,278:2039-2049.
[11]Costa M,Goldberger A L,Peng C K.Multiscale Entropy Analysis of Physiologic Time Series[J].Physical Review Letters,The American Physiological Society,2002:068102(1-4).
[12]Bandt C,Pompe B.Permutation Entropy:a Natural Complexity Measure for Time Series[J].Physical Review Letters,The American Physiological Society,2002:174102(1-4).
[13]袁明,羅志增.基于排列組合熵的表面肌電信號特征分析[J].杭州電子科技大學學報,2012,32(1):64-67.Yuan Ming,Luo Zhizeng.Feature Analysis of SEMG Based on Permutation Entropy[J].Journalof Hangzhou Dianzi University,2012,32(1):64-67.
[14]馬千里,卞春華.改進排列熵方法及其在心率變異復雜度分析中的應用[J].中國組織工程研究與臨床康復,2010,52(14):9781-9785.Ma Qianli,Bian Chunhua.Application of Modified Permutation Entropy in Heart Rate Variability Analysis[J].Journal of Clinical Rehabilitative Tissue Engineering Research,2010,52(14):9781-9785.
[15]侯威,封國林,董文杰,等.利用排列熵檢測近40年華北地區氣溫突變的研究[J].物理學報,2006,55(55):2663-2668.Hou Wei,Feng Guolin,Dong Wenjie,et al.A Technique for Distinguishing Dynamical Species in the Temperature Time Series of North China[J].Acta Physica Sinica,2006,55(55):2663-2668.
[16]Aziz W,Arif M.Multiscale Permutation Entropy of Physiological Time Series[C]//Proceeding of IEEE International Multi-topic Conference,INMIC,2005.
[17]李岳,陶利民,溫熙森.用于滾動軸承故障檢測與分類的支持向量機方法[J].中國機械工程,2005,16(6):498-501.Li Yue,Tao Limin,Wen Xisen.Support Vector Machines Based Approach for Ball Bearing Fault Detection and Classification[J].China Mechanical Engineering,2005,16(6):498-501.
[18]Yang Yu,Yu Dejie,Cheng Junsheng.A Fault Diagnosis Approach for Roller Bearing Based on IMF Envelope Spectrum and SVM[J].Measurement,2007,40:943-950.
[19]李永強,劉杰,侯祥林,等.人工神經網絡的混合算法及其工程應用[J].機械工程學報,2004,40(1):127-130.Li Yongqiang,Liu Jie,Hou Xianglin,et al.Mixed Method of Artificial Neural Network and Its Application on Fault Diagnosis for Rotational Machine[J].Journal of Chinese Mechanical Engineering,2004,40(1):127-130.
[20]飛思科技產品研發中心.神經網絡理論與 MATLAB7實現[M].北京:電子工業出版社,2005.