鄭近德,代俊習,朱小龍,潘海洋,潘紫微
(安徽工業大學 機械工程學院,安徽 馬鞍山 243032)
滾動軸承是各類旋轉機械中最通用的機械部件,其運行狀態是否正常往往影響到整臺機器的性能[1],因此,對滾動軸承運行狀態和故障診斷的研究具有重要的理論和實際意義。隨著非線性理論的發展,許多非線性動力學方法為非平穩信號的處理提供了新的思路與方法[2–7]。如呂志民等把分形維數作為故障特征量用于滾動軸承的故障診斷[2],但是分形維數對噪聲比較敏感;文獻[3]把近似熵作為衡量標準并應用于軸承狀態監測;胥永剛等把分形維數與近似熵同時用于度量振動信號的復雜性[4],結果表明近似熵具有一定抗噪、抗野點的能力,但是,其存在自身匹配難、依賴時間序列長度等缺陷。趙志宏等提出將集成經驗模態分解與樣本熵結合[6],應用于滾動軸承故障的診斷,結果表明該方法比單一樣本熵識別率更高。
Costa等在樣本熵的基礎上,提出了多尺度熵(Multiscale entropy,MSE)[8–9]。鄭近德等將多尺度熵與樣本熵分別作為軸承故障信號復雜性的度量,結果表明多尺度熵優于單一尺度樣本熵[10]。但是研究發現,粗粒化會導致多尺度熵隨著尺度因子的增大,產生“飛翼”現象,同時,粗粒化可以看做是對時間序列在不同尺度下進行線性插值,而振動信號一般是非平穩、非線性的采用線性的手段勢必有一定的局限。因此,筆者考慮采用三次樣條插值時間序列代替粗粒化過程,提出了插值多尺度熵(Interpolation Multiscale Entropy,InMSE),并將其用于滾動軸承非線性故障特征的提取。
在提取故障特征后,由于故障特征類之間的隸屬關系比較模糊,不易分辨。模糊C-均值聚類(Fuzzy C-means,FCM)是模糊聚類中應用最為廣泛的聚類算法,它通過迭代優化目標函數,把數據按照數據的某種屬性聚集成多個類的過程,使同一類對象之間的相似性很高,不同類之間的相似性很差。FCM聚類算法在機械故障診斷等多個領域得到了廣泛應用[11–13],因此,論文考慮采用FCM來識別滾動軸承故障類型。
基于上述分析,論文提出了一種基于插值多尺度熵與FCM模糊聚類的滾動軸承故障診斷方法。通過對滾動軸承數據試驗分析,結果表明了論文方法的有效性和優越性。
多尺度熵定義為時間序列在不同尺度因子下的樣本熵[8–9],其計算步驟如下。
(1)設原始數據為X={x1,x2…,xN} ,長度為N,建立粗粒化序列

其中τ是正整數,稱為尺度因子。事實上,pj(1)即為是原時間序列。當τ=1時,粗粒化后的序列與原始序列是相同的。對于非零τ,{xi}被分割成τ個長度為(表示不大于的正整數)的粗粒化序列{pj(τ)} 。
(2)分別計算τ個粗粒序列的樣本熵,并畫成尺度因子τ的函數。即計算各尺度下的時間序列的樣本熵。
其中,樣本熵的計算參考文獻[5]。樣本熵從單一尺度衡量時間序列復雜性,而多尺度熵法克服了單一尺度熵分析復雜性的缺陷,可以有效地從多尺度衡量時間序列的復雜性。但是由公式(1)可以發現,當尺度因子為2時,多尺度化法只考慮了數據點x1,x2和x3,x4,…的特征信息,并沒有考慮到數據點x2,x3和x4,x5,…之間的特征信息;其次,粗粒化過程可以近似看做是在不同尺度下對時間序列數據點兩兩之間線性插值而得(求平均),而振動信號往往具有非線性性和非平穩性,因此,考慮用三次樣條插值來代替多尺度化法,提出了插值多尺度熵算法。
插值多尺度熵計算步驟如下:
(1)設原始數據為X={x1,x2,…,xN},長度為N,插值點的構造如圖1所示。

圖1 尺度因子為1、2和3時的插值點示意圖
當τ=1時,粗粒化序列仍取原時間序列;在原始粗粒化過程中,粗粒化是求x1,x2,x3,x4,……xN-1,xN的均值,即下標t=1.5,2.5,……,N-0.5處的函數值,該數值是線性插值的結果。由于信號具有非線性和非平穩的特性,因此本文用三次樣條插值方法代替線性插值。當尺度τ=2時,即在區間[x1,x2]、[x2,x3]、……、[xN-1,xN]上 給 定 1 個 插 值 節 點以及相應的下標t的值1.5,2.5,……,N-1.5,N-0.5,得到新序列,該數據為插值后的時間序列。當尺度τ=3時,在區間上給定1個插值節點 ,以及相應下標處t的值1.5,2.5,……,N-2.5,N-1.5 ;得 到 新 序 列;依次類推,計算出所有
(2)分別計算τ個粗粒序列的樣本熵,并畫成尺度因子τ的函數。即計算各尺度下的時間序列的樣本熵[5]。
與多尺度熵相比,插值多尺度熵不僅一定程度上克服了由時間序列變短帶來的影響,而且還充分挖掘了時間序列的信息,同時采用三次樣條插值時間序列,也很好地考慮了振動信號的非線性特性。
為了說明時間序列的長度對InMSE的影響,取長度分別為1 000,1 500,2 000,2 500,3 000,3 500,4 000的高斯白噪聲和1/f噪聲作為研究對象。分別計算二者的MSE和InMSE,結果如圖2(a)-圖2(d)所示,其中m=2,r=0.15SD(SD是原始數據的標準差),最大尺度因子為20。

圖2 時間序列長度對熵值的影響
首先,從圖2可以看出,隨著數據序列長度的增加,InMSE熵值曲線比MSE熵值曲線穩定,無論長度是1 500還是3 500,熵值曲線的趨勢始終一樣,這說明InMSE對數據序列長度的依賴更小。同時,當N>2 000時,時間序列長度對InMSE熵值的影響更小;其次,隨著尺度因子τ的增加,MSE曲線在右端出現了比較大的波動,而InMSE幾乎沒有波動,這說明InMSE更具有穩定性和優越性;最后,從兩種信號的變化趨勢來看,高斯白噪聲信號的MSE和InMSE曲線隨著尺度因子的增大而逐漸遞減,這說明高斯白噪聲信號較為簡單,只在較低的尺度包含信息。1/f噪聲的MSE曲線隨著尺度因子的增大而變化緩慢,基本穩定在一個恒定值附近,雖然InMSE曲線呈現出下降趨勢,但是從熵值的大小可以看出變化不是很大,這說明1/f噪聲較白噪聲信號復雜,不僅在較低的尺度包含信息,而且在其它尺度也包含有重要信息,這與我們關于白噪聲和1/f噪聲信號的定義和認識相符。
為了研究相似容限r對InMSE的影響,以相同長度的高斯白噪聲和1/f噪聲作為研究對象,取長度N=5 000。對不同的r=0.05SD,0.10SD,0.15SD,0.20SD,0.25SD(SD是原始數據的標準差),分別計算二者的MSE和InMSE,其中m=2,尺度因子取20,表示模糊函數邊界的寬度,結果如圖3(a)-圖 3(d)所示。

圖3 相似容限對熵值的影響
首先由圖3可以看出,相似容限對MSE和InMSE的計算結果影響較大,r越大,匹配的模板越少,熵值越小,r越小,匹配的模板越多,熵值越大;其次,當容限r過小時,InMSE熵值曲線相比較于MSE曲線光滑,隨著容限的增大,InMSE熵值變化較小且波動較小,這表明InMSE對r依賴較小。一 般 取SD,本文
在提取故障特征后,由于故障特征類之間的隸屬關系比較模糊,不易分辨,因此選用聚類效果較好模糊C-均值(Fuzzy C-means,FCM)用于故障特征識別。FCM的基本原理如下:
假設樣本X={x1,x2,……,xn}是一個d維數據,并假設其具有C類。定義mj為第j類中心j={1,2,……,C} ,模糊隸屬度矩陣,其中uj(xi)為第i個樣本屬于第j類的隸屬度。公式如下


通過隸屬度函數進而確定新的聚類中心

此時聚類損失函數可以表示為

FCM算法的原理就是通過迭代方法對式(2)和式(4)進行求解,給定聚類數目C和加權指數b,步驟如下:
1)初始化隸屬度矩陣uj(xi),使其值的范圍在(0,1)之間,并使隸屬度矩陣uj(xi)滿足式(3)的約束條件;
2)初始化樣本中每一個聚類中心mj;
① 用每一類的mj根據式(2)計算隸屬度函數。
② 根據①計算出的隸屬度函數根據式(4)重新計算各類中心。
通過上述步驟的計算,可以得到樣本中各類聚類中心以及每一類相對于樣本的隸屬度,由此完成了模糊聚類劃分。
振動信號一般表現出非平穩和非線性等特性,還受干擾信號和噪聲的影響。因此,故障診斷的關鍵是如何從振動信號中提取故障的特征信息。論文將InMSE算法用于振動信號的特征提取,提出了基于插值多尺度熵和模糊C-均值的滾動軸承故障診斷方法。具體步驟如下:
(1)假設滾動軸承有K種故障類別;每種狀態下取mK個樣本,共有個樣本,計算每一類樣本的插值多尺度熵,得到們的特征集 (TK,K),TK∈Rmk×τmax;
采用美國Case Western Reserve University的滾動軸承試驗數據[14]對論文方法進行驗證。測試軸承為6205-2RS JEM SKF深溝球軸承,轉速為1797 r/min,故障直徑為:0.5334 mm,共采集到正常(Norm)、外圈(Outer Race,OR)、滾動體故障(Ball Element,BE)和內圈(Inner Race,IR)四種狀態的振動信號,數據長度為2 048。正常、具有內圈故障、外圈故障以及滾動體故障的滾動軸承振動信號的時域波形如圖4(a)-圖4(d)所示。

圖4 滾動軸承振動信號的時域波形
分別計算上述四種工況數據的MSE和InMSE,其中,每種工況選取58組數據,數據長度為2 048。MSE和InMSE熵值均方差曲線如圖5(a)、圖5(b)所示。首先,從圖中可以看出,雖然不同故障類型的振動信號在不同尺度下的樣本熵熵值均不同,但是多尺度熵曲線總體波動較大,而且隨著尺度因子的增大,內圈故障、外圈故障和滾動體故障這三類熵值比較接近(熵值曲線走勢一致,且越來越接近),而插值多尺度熵曲線波動較小且光滑,隨著尺度因子的增大,不同故障類型的熵值相互之間區別比較明顯,進而有助于提高識別率;其次正常的滾動軸承是隨機和無規則的振動,隨著尺度因子的增大,熵值曲線下降緩慢,這說明正常滾動軸承信號不僅在低尺度包含重要信息,而且在較高的尺度也包含了信息;最后,由于滾動軸承本身運動的特性(內圈隨軸承運動而外圈固定),外圈故障特征頻率比內圈故障特征頻率小,因此,外圈故障的熵值要比內圈故障的更小。上述分析結果表明,InMSE能明顯地區別不同故障類型的滾動軸承,且區分效果要優于MSE。
將原始信號進行插值多尺度熵和多尺度熵計算,將得到的特征向量輸入到模糊C-均值分類器中。其中,模糊C-均值分類器設置聚類類別數為4,終止條件的最大迭代次數為100,隸屬度最小變化量迭代終止條件10-5,隸屬度矩陣的指數為2。對上述4種軸承故障類型信號各取58組數據作為測試樣本,根據上述方法分別計算多尺度熵與插值多尺度熵,取尺度因子τ=20,構成一個232×20的特征向量矩陣。通過計算測試樣本T和第k個狀態Ck的海明貼近度來衡量FCM分類的正確與否,其中k=1,2,3,4,即

由貼近度定義可知,貼近度最大者為一類,當存在兩組測試樣本的貼近度相差小于0.01時,即無法識別或者識別率較低。對232組數據分別計算MSE和InMSE的平均貼進度,得到4種狀態的測試樣本相對于聚類中心的平均貼近度。MSE和InMSE的平均貼近度如圖6(a)、圖6(b)所示,由圖6(a)可知,當采用MSE方法時,雖然正常信號、內圈故障中的最大貼近度接近于1,且其它貼近度相差比較明顯,但是滾動體故障、外圈故障中有兩個貼近度接近于1,不利于故障的辨識;當采用InMSE方法時,正常信號、滾動體故障和外圈故障中的最大貼近度接近于1,且其它貼近度相差較明顯,只有內圈故障中兩個貼近度之間的差值不怎么明顯。這說明InMSE方法相比較于MSE有很好的優越性,對特征的提取更全面。
由表1可以看出,首先,InMSE與FCM聚類結合方法的聚類分類系數F要比MSE的大,而且更接近于1,這說明在特征識別過程中,InMSE提取的特征更明顯;其次,InMSE與FCM聚類結合方法的平均模糊熵H更接近于0,這說明基于InMSE與FCM方法的聚類效果要好于基于MSE與FCM的方法。綜上所述,InMSE提取的故障特征在FCM方法中的聚類效果優于MSE提取的特征。

圖5 MSE和InMSE熵值曲線

圖6 平均貼近度分布

表1 兩種方法的檢驗結果
為了說明InMSE相對于MSE的優勢,基于MSE和InMSE故障診斷方法的識別率如表2所示。

表2 MSE和InMSE識別率/(%)
從表2可以看出,首先InMSE故障診斷方法的識別率,除了正常信號低于MSE,外圈故障、內圈故障和滾動體故障識別率均高于MSE,由圖6可以看出,正常、外圈故障、內圈故障和滾動體故障的InMSE熵值雖然在尺度較低時相互之間的插值比較明顯,但是在尺度因子較大時,這四類熵值比較接近,而MSE無論是低尺度還是尺度較高時,熵值均比較接近;其次,分析時采用的樣本量多,而改進的插值多尺度熵識別率97.4%明顯高于多尺度熵的93.95%,這說明InMSE具有很好的穩定性。綜上,此試驗表明,InMSE能夠明顯地區分正常和故障滾動軸承的類型,是一種有效的滾動軸承故障診斷方法。
(1)提出了InMSE算法,通過仿真信號將其與MSE進行了對比分析,結果表明,與MSE相比,隨尺度因子的增加,InMSE曲線的變化趨勢更加平緩,克服了MSE右端“飛翼”的現象,具有一定的優越性。
(2)研究了數據長度和相似容限的選擇對InMSE和MSE的影響,結果表明,相比較于MSE,InMSE在尺度因子較大時受數據長度的變化更小,只需較短的數據便可得到穩定的熵值。
(3)將InMSE與FCM算法結合應用于滾動軸承故障的診斷,并對故障發生的機理及振動信號的特性進行解釋,結果表明,基于InMSE特征提取方法能夠有效地將同種故障類型數據聚在聚類點中心附近。
InMSE是一種有效的時間序列復雜性衡量的非線性動力學方法,但其也有不足之處,如運算時間久等問題,有必要對其進一步研究并加以改善。
[1]梅宏斌.滾動軸承振動監測與診斷理論·方法·系統[M].北京:機械工業出版社,1996.
[2]呂智民,徐金梧,翟緒圣.分形維數及其在滾動軸承故障診斷中的應用[J].機械工程學報,1999,35(2):88-91.
[3]YAN RUQIANG,GAO R X.Approximate entropy as a diagnostic tool for machine health monitoring[J].Mechanical Systems and Signal Processing,2007,21(2):824-839.
[4]胥永剛,何正嘉.分形維數和近似熵用于度量信號復雜性的比較研究[J].振動與沖擊,2003,22(3):25-27.
[5]RICHMAN J S,MOORMAN J R.Physiological time series analysis using approximate entropy and sample entropy[J].American Journal of Physiology Heart and Circulatory Physiology,2000,278(6):2039-2049.
[6]趙志宏,楊紹普.一種基于樣本熵的軸承故障診斷方法[J].振動與沖擊,2012,31(6):136-154.
[7]鄭近德,潘海洋,戚曉利,等.復合層次模糊熵及其在滾動軸承故障診斷中的應用[J].中國機械工程,2016,27(15):2048-2055.
[8]COSTA M,GOLDBERGER A L,PENG C K.Multiscale entropy analysis ofbiologicalsignals[J].Physical Review E,2005,71:1-18.
[9]COSTA M,GOLDBERGER A L,PENG C K.Multiscale entropy analysis of complex physiologic time series[J].Physical Review Letters,2002,89(6):1-18.
[10]鄭近德,程軍圣,楊宇.基于多尺度熵的滾動軸承故障診斷方法 [J].湖南大學學報,2012,39(5):38-41.
[11]郭謀發,徐麗蘭,廖希仁,等.采用時頻矩陣奇異值分解的配電開關振動信號特征量提取方法[J].中國電機工程學報,2014,34(28):4990-4997.
[12]張淑清,孫國秀,李亮,等.基于LMD近似熵和FCM聚類的機械故障診斷研究[J].儀器儀表學報,2013,34(3):714-720.
[13]周川,伍星,劉暢,等.基于EMD和模糊C-均值聚類的滾動軸承故障診斷[J].昆明理工大學學報,2009,34(6):34-39.
[14]The Case Western Reserve University Bearing Data Center.Bearing Data Center Fault Test Data[EB/OL].[2012-03-01].http://www,eecs,cwru,edu/laboratory/bearing.