張 龍,吳榮真,雷 兵,周建民
(華東交通大學 機電與車輛工程學院,南昌330013)
滾動軸承作為旋轉(zhuǎn)機械的重要“關節(jié)”,是機械系統(tǒng)的重要零部件之一。事實上,超過50%的機械缺陷與軸承故障相關[1],而滾動軸承一旦發(fā)生故障,將嚴重影響機械設備的可靠運行。因此,如何準確地在線判斷軸承健康狀態(tài)是當前研究熱點之一。
目前,滾動軸承故障診斷方法呈現(xiàn)百花齊放態(tài)勢,根據(jù)測試信號性質(zhì)不同,可分為振動法、噪聲法、電信號法、油樣分析法和聲發(fā)射法等[2]。振動信號由于具有信息量大、易采集等優(yōu)點而被廣泛采用。
振動診斷通常包括特征提取、特征選擇或壓縮以及故障識別3個步驟。其中特征提取是指從原始信號中提取出最能代表該模式信號的特征向量;特征選擇或壓縮是原始特征向量中得到最能反映待識別模式的特征量,以減少后續(xù)故障識別模型的復雜度和計算量并改善識別效果;故障識別是通過模式識別或機器學習方法實現(xiàn)故障模式的自動分類識別。從而,振動診斷法成為目前國內(nèi)外軸承故障診斷研究方法的主流。
故障診斷中的特征提取方法層出不窮。如文獻[3]先用Morlet 小波對振動信號進行濾波,濾波后利用包絡譜分析對軸承振動信號進行特征提取,并提出一種包絡譜譜峰因子作為適應度函數(shù)來比較不同組合下的濾波效果。文獻[4]先利用MED 對軸承振動信號進行降噪處理,濾波后進行包絡分析,再利用倒頻譜分析對包絡信號進行特征提取。上述方法雖然取得了一定的成果,但都只適用于平穩(wěn)線性信號分析,而在實際情況中,滾動軸承一旦發(fā)生故障,其振動信往往呈現(xiàn)出非平穩(wěn)非線性特征[5-6]。目前非線性時間序列分析方法有Lyapunov 指數(shù)、信息熵、關聯(lián)維數(shù)、K 熵、樣本熵等。其中,樣本熵與上述其它方法相比具有得到穩(wěn)定估計值所需的數(shù)據(jù)短、抗噪聲和干擾能力強、在參數(shù)大取值范圍內(nèi)一致性好等優(yōu)點[7]。文獻[8]利用樣本熵和峭度對傳感器輸出的時間序列進行特征提取,再導入支持向量機中實現(xiàn)氣體傳感器的分類診斷。文獻[9]提出一種基于放電電壓樣本熵特征的電池健康智能預測方法,利用樣本熵作為蓄電池健康狀況的指標,并使用支持向量機和相關向量機進行剩余壽命預測效果。上述方法雖然都取得了一定的效果,但都只在單一尺度上對時間序列進行描述,未考慮到多尺度下時間序列的跨尺度復雜性。因此,本文利用多尺度熵對不同健康狀態(tài)軸承振動信號進行特征提取。
模式識別常用的方法有神經(jīng)網(wǎng)絡、專家系統(tǒng)和支持向量機等方法[10]。雖然以上診斷方法都能實現(xiàn)軸承故障智能診斷,但都存在明顯的不足。神經(jīng)網(wǎng)絡結(jié)構(gòu)選擇較為困難,且診斷正確率受收斂速度影響[11];專家診斷方法存在適應能力差、知識獲取存在瓶頸以及實時性差等缺點[10];支持向量機模型參數(shù)估計存在一定的主觀性,需要大計算量的優(yōu)化算法[12]。可拓學是由我國學者蔡文在1983年創(chuàng)立的一門新學科[13],相比于上述幾種模式識別方法,可拓學不但具有結(jié)構(gòu)簡單、可拓性強、無繁雜的參數(shù)確定等優(yōu)點外,還具有分析矛盾問題的可拓性、規(guī)律性的能力[14],因此目前也有不少學者將其運用于故障診斷領域中[14-16]。
鑒于滾動軸承振動信號中存在的多尺度相關性和非線性以及可拓學在模式識別中的上述優(yōu)勢,本文提出一種基于多尺度熵的軸承故障可拓智能識別方法。首先計算軸承振動信號的多尺度熵作為原始特征向量,再利用Fisher比進行特征降維,最后將降維后得到的特征向量作為軸承不同健康狀態(tài)可拓學物元模型經(jīng)典域和節(jié)域的確定依據(jù),并以此建立不同健康狀態(tài)下的軸承運行物元模型以及關聯(lián)函數(shù)。在測試階段將待測信號代入不同狀態(tài)下的軸承物元模型進行關聯(lián)度計算,根據(jù)所得到的關聯(lián)度值大小實現(xiàn)故障診斷智能識別。利用電機軸承數(shù)據(jù)對所提出的方法進行了驗證。
多尺度熵是由Costa等[17-18]在2002年首先提出,是對樣本熵的深度挖掘應用,克服了樣本熵只能在單一尺度上描述信號復雜程度的缺點,并具有一定的抗干擾和抗噪能力。其具體算法如下
(1)根據(jù)給定嵌入維數(shù)m和相似容限r(nóng)對長度為n的原始時間序列X={χ1,χ2,…,χn}進行粗粒化,則可得到粗粒化序列

式中:τ為尺度因子,每個粗粒化序列的長度變?yōu)樵瓡r間序列長度的1∕τ,當尺度因子為1時,粗粒化時間序列與原時間序列相同。
(2)對每個尺度的粗粒時間序列求樣本熵值,將所有得到的樣本熵的值看成為尺度因子的函數(shù),稱其為多尺度熵分析。函數(shù)表示為

在多尺度熵的計算中,嵌入維數(shù)m一般取1 或2,相似容限r(nóng)一般為(0.1~0.25)S(S為原信號的標準差)。綜上,本文選取m=1,r=0.15,n=2 048。
可拓學(早期稱物元分析)是由我國學者蔡文在1983年創(chuàng)立的一門新學科[13]。它以不相容問題作為研究的中心,尋求事物矛盾的內(nèi)在機制。可拓學的邏輯細胞是物元,并利用物元來描述事物及其變化規(guī)律。物元可表示R=(N,C,V),其中N為待研究事物,C為事物N的特征,V是事物N關于特征C的量值,稱N、C、V構(gòu)成物元R的三要素。實際情況中,一般利用多維特征來描述事物N的性質(zhì),從而構(gòu)成n維物元

式中:C=(c1,c2,…,cn)表示事物N的特征集,V=(v1,v2,…,vn)表示與特征C相對應的量值。
關聯(lián)函數(shù)是可拓學中另一重要概念,其能定性定量描述事物的特征具有某一性質(zhì)的程度及其變化。在同一個域內(nèi)的元素,根據(jù)關聯(lián)函數(shù)的數(shù)值大小可分為不同的關聯(lián)層次,將“類內(nèi)即同,類間即異”的關系發(fā)展成“類內(nèi)仍可分為不同層次”。距作為關聯(lián)函數(shù)的基礎,也是定性描述擴展為定量描述的基礎,距的定義為實軸上任意點χ0與有限實區(qū)間X=<a,b>的距離。其表達式如下

關聯(lián)函數(shù)在距的基礎上,將“具有某一性質(zhì)P”的定性描述擴展為“具有某一性質(zhì)P的程度”的定量描述。設χ0為實域上的任意元素,區(qū)間X=<a,b>,X0=<c,d>,且X?X0,X、X0無公共端點,取其最優(yōu)點為區(qū)間中點,則其初等關聯(lián)函數(shù)可表示為

式中:ρ(χ0,X)和ρ(χ0,X0)分別表示元素χ0與區(qū)間X和X0的距。k(χ0)表示元素χ0關于區(qū)間X的關聯(lián)度,其正負和大小表明χ0屬于或不屬于X的程度。
在模式識別中,F(xiàn)isher準則是將特征向量投影到最佳方向而得到的最大類間距離[19]。Fisher 比在Fisher準則的基礎上進行改進,主要內(nèi)容為同一維度特征類間離散度和類內(nèi)離散度的比值,具有去除冗余信息等的功能。其表達式如下

其中:F(k)表示第k維特征的Fisher比值,S(bk)表示第k維特征的類間離散度,S(wk)表示第k維特征的類內(nèi)離散度。特征分量的類間離散度反映了不同尺度特征樣本之間差異的程度,而類內(nèi)離散度反映了同一尺度特征樣本之間的密集程度,當Fisher比越大時,即類間離散度越大,類內(nèi)離散度越小時,說明此特征分量的區(qū)分效果好,具有較好的代表性。
設c類模式共有L個樣本,L=L1+L2+…+Lc,即第c類模式有Lc個樣本,集合表示為ωc={χj(c),j=1,2…,Lc},令m(ki)、mk分別為第i類模型中所有樣本的第k維特征的平均值、所有樣本的第k維特征的平均值,其中i=1,2,…,c。則有

提出的基于多尺度熵和可拓學的軸承故障可拓智能識別方法流程如圖1所示。

圖1 滾動軸承故障可拓智能診斷流程圖
具體步驟如下:
(1)設共有c種滾動軸承健康狀態(tài),每種狀態(tài)已有N個信號可供訓練,計算所有c×N個樣本在m個尺度上的樣本熵,構(gòu)成一個由多尺度熵構(gòu)成的(c×N)×m原始訓練特征矩陣;
(2)利用Fisher 比對訓練樣本的m個尺度上的熵進行打分,按照得分高低依次排序,選擇得分最高的k個尺度上的熵作為最終特征,最后得到(c×N)×k的訓練特征矩陣,其中k<m;
(3)以上述訓練矩陣中的元素作為特征參數(shù),構(gòu)建軸承不同健康狀態(tài)物元的經(jīng)典域、節(jié)域,進而建立軸承不同健康狀態(tài)物元模型;
(4)計算待測信號在由Fisher 比選擇的k個尺度上的樣本熵,構(gòu)成測試樣本特征向量并依次代入軸承不同健康狀態(tài)的物元模型,利用關聯(lián)函數(shù)分別計算出待測樣本與軸承不同健康狀態(tài)物元模型的關聯(lián)度值;
(5)根據(jù)與軸承不同健康狀態(tài)物元模型的關聯(lián)度值判斷出滾動軸承的健康狀態(tài),即無故障或何種故障類型。
實驗數(shù)據(jù)來自美國凱斯西儲大學(Case Western Reserve University,CWRU)軸承數(shù)據(jù)中心[20]。實驗中采用驅(qū)動端軸承數(shù)據(jù),軸承型號為SKF-6205,電機轉(zhuǎn)速為1 797 r/min,采樣頻率為12 kHz。采樣軸承類型分為無故障、內(nèi)圈故障、滾動體故障、外圈故障4 類,其中外圈故障采用故障位于6 點鐘方向數(shù)據(jù)。3種故障的故障直徑均為0.177 8 mm,由電火花加工形成。將無故障信號和3種故障信號均分割為長度等于2 048 的樣本數(shù)據(jù),其中無故障狀態(tài)包含119個樣本數(shù)據(jù),3類故障信號各有59個樣本數(shù)據(jù)。
從4類不同狀態(tài)的軸承信號中隨機各抽選30個樣本數(shù)據(jù)作為訓練樣本,全體數(shù)據(jù)樣本作為測試樣本。利用MSE對上述訓練樣本進行分析,尺度因子τ=20,所得結(jié)果如圖2所示。

圖2 4種健康狀態(tài)下軸承的MSE均值和標準偏差曲線
圖中豎線的長短表示各類軸承樣本數(shù)據(jù)在該尺度上樣本熵值的標準偏差值大小。從圖2可以看出,4 種不同軸承健康狀態(tài)的熵值變化趨勢大致一致,都隨尺度因子的增加而降低,說明4種狀態(tài)下的軸承振動信號的主要信息都儲存于小尺度之中。無故障狀態(tài)下的軸承信號熵值均高于其余3種狀態(tài)下的熵值,說明無故障狀態(tài)下的軸承振動信號序列的不規(guī)則程度最高,事實上無故障狀態(tài)下的軸承振動主要是由滾動接觸副表面粗糙度、游隙以及滾動體位置變化引起的,因此振動信號接近隨機信號。從圖2還可以看到外圈故障的熵值最小,說明外圈故障軸承振動信號序列規(guī)則程度最高,這與軸承發(fā)生外圈故障時其振動信號的周期性最強的觀點相一致,同時軸承外圈故障沖擊到傳感器的傳遞路徑也是最短的。內(nèi)圈故障和外圈故障振動信號的標準偏差值隨尺度因子的變化不大,而無故障狀態(tài)和滾動體故障振動信號的標準偏差值隨尺度因子的增大而增大。從圖2中還可以看出內(nèi)圈故障和滾動體故障振動信號的MSE值相差不大,且具有交叉重合的現(xiàn)象,若直接根據(jù)MSE值去進行軸承故障分類識別的話顯然具有很大的局限性,并且存在信息冗余等問題。
為解決上述問題,需要對特征向量進行降維,并利用模式識別方法對軸承健康狀態(tài)進行判別。計算訓練集的20個尺度上的樣本熵的Fisher比值結(jié)果如圖3所示。
可以看到在尺度因子為1~12 時,隨著尺度因子的增加Fisher 比值逐漸減小,在尺度因子為13~20 時,F(xiàn)isher 比值趨于穩(wěn)定,只在小范圍內(nèi)波動,這也說明前面選擇最大尺度因子τ=20 是合理的。并且在圖2中還可得出前5 個尺度因子的Fisher 比值最大,說明4 種狀態(tài)下的軸承振動信號序列主要信息存儲于前5個尺度振動信號序列中。

圖3 各尺度上樣本熵的Fisher比
可拓模式識別中如何確定物元模型的經(jīng)典域及節(jié)域是建立物元模型的關鍵,也是實現(xiàn)滾動軸承故障可拓模式識別的前提。結(jié)合上述特征提取及特征選擇方法,選定前5 個尺度上的樣本熵作為特征參數(shù),從各類健康狀態(tài)的樣本中隨機選擇的30個樣本作為訓練數(shù)據(jù)建立不同健康狀態(tài)下的軸承物元模型。令無故障、內(nèi)圈故障、滾動體故障、外圈故障類型的經(jīng)典域物元模型分別為R1、R2、R3、R4,要求實際屬于各物元模型所對應的軸承健康狀態(tài)的樣本有95%的概率數(shù)據(jù)落入經(jīng)典域內(nèi),根據(jù)文獻[21],確定各自物元模型的經(jīng)典域為訓練樣本均值加減4.47倍的標準偏差,即各個特征參數(shù)的經(jīng)典域為[Z-4.47σ,Z+4.47σ],其中Z為該特征參數(shù)平均值,σ為其標準偏差。4 個物元模型中各特征參數(shù)的Z和σ取值由各軸承健康狀態(tài)樣本中隨機選擇的30 個訓練樣本決定。4個物元模型的具體表達式為式(8)至式(11)。

由上述4類不同軸承狀態(tài)所確定的經(jīng)典域物元模型可得出滾動軸承健康狀態(tài)的節(jié)域物元模型Rp,其中Np表示4 種不同狀態(tài)下的滾動軸承集合,C為能表征不同狀態(tài)的滾動軸承多尺度熵,VP為4 類軸承健康狀態(tài)在同一尺度因子下的樣本熵取值范圍,可表示為[Cmin,Cmax],其中Cmin、Cmax分別為同一尺度下所有狀況樣本熵的最小值和最大值,表達式為

將滾動軸承運行狀態(tài)分為4 種:無故障狀態(tài)(j=1),內(nèi)圈故障狀態(tài)(j=2)、滾動體故障狀態(tài)(j=3)、外圈故障狀態(tài)(j=4)。此時關聯(lián)度函數(shù)由式(5)變?yōu)?/p>

其中:kj(χi)表示待測樣本χi在第i個特征尺度下與第j類滾動軸承的關聯(lián)度(i=1,2,…,c),Vji表示第j類狀態(tài)下的第i個特征尺度的取值區(qū)間,Vpi表示第i個特征尺度在節(jié)域下的取值區(qū)間。進而可將5個特征尺度的關聯(lián)度函數(shù)綜合式寫出,得到待測樣本與每一類健康狀態(tài)的綜合關聯(lián)度函數(shù),具體表達式為

Kj(χ)表示待測樣本數(shù)據(jù)χ與滾動軸承第j類健康狀態(tài)的綜合關聯(lián)度,ωi為權(quán)重系數(shù),表示為第i個特征尺度熵在5 個特征尺度熵中所占的權(quán)重,且有∑ωi=1。將5 個特征尺度的Fisher 比值與5 個特征尺度總Fisher比值的比重作為權(quán)重,表達式為

將包含訓練樣本在內(nèi)的全體樣本作為測試樣本,因為前期建立了4 個表示軸承健康狀態(tài)的物元模型,因此每個測試信號均可以得到4個關聯(lián)度值。全體樣本的關聯(lián)度值計算結(jié)果見圖4。
由圖4可以看出1~119、120~178、179~237、238~296號測試樣本分別與正常狀態(tài)、外圈故障、內(nèi)圈故障、滾動體故障狀態(tài)物元模型綜合關聯(lián)度值最大。結(jié)合待測樣本數(shù)據(jù)順序類別及數(shù)量,得出滾動軸承故障識別率為100%。各測試信號的最大關聯(lián)度值均來自各所屬的物元模型,且明顯高于與其余3類物元模型的綜合關聯(lián)度值。正常狀態(tài)、外圈故障、內(nèi)圈故障這3 類測試樣本數(shù)據(jù)的4 個關聯(lián)度值中均只有與各自所屬物元模型的關聯(lián)度值大于0,說明這3 類測試樣本數(shù)據(jù)只與自身的物元模型為正相關。而滾動體故障測試樣本數(shù)據(jù)還存在與內(nèi)圈故障物元模型綜合關聯(lián)度大于0 的情況,說明此類測試樣本數(shù)據(jù)與內(nèi)圈故障物元模型存在一定的正相關性。

圖4 全體待測樣本與四類軸承狀態(tài)的關聯(lián)度值
為避免偶然誤差給實驗帶來的影響,提高實驗結(jié)果的可靠性,從不同狀態(tài)的軸承數(shù)據(jù)中再次隨機選取30個樣本數(shù)據(jù)作為訓練樣本,全體數(shù)據(jù)樣本作為測試樣本,并重復該過程100 次,得到100 次的測試結(jié)果。結(jié)果顯示,在重復100 次的試驗中沒有任何誤判現(xiàn)象,說明基于可拓模式識別與MSE結(jié)合的方法在該實驗下效果可靠。
本文實驗分析所采用的軸承公開數(shù)據(jù)已被許多故障診斷研究論文所采用。如文獻[22-25]中均利用小波包分解與BP 神經(jīng)網(wǎng)絡進行軸承故障診斷。為證明可拓模式識別與MSE 結(jié)合的方法分析該實驗數(shù)據(jù)的優(yōu)越性,將其與小波包分解與BP神經(jīng)網(wǎng)絡結(jié)合的方法進行對比。
小波包分解中采用Db10 小波對所有樣本信號均進行3層小波分解,選擇低頻到高頻8個自帶信號的能量作為特征參數(shù),構(gòu)建一個包含8 個輸入節(jié)點和1 個輸出節(jié)點的3 層BP 神經(jīng)網(wǎng)絡,其中網(wǎng)絡隱含層節(jié)點數(shù)由經(jīng)驗公式m=2n+1(其中m為隱含層節(jié)點數(shù),n為輸入層節(jié)點數(shù))取為17。訓練函數(shù)選擇trainlm,學習方法為learnglm,性能函數(shù)為mse,最大訓練次數(shù)為1 000次,訓練目標為0.001,學習速率為0.05。與本文方法的實驗分析一致,每次從各軸承健康狀態(tài)隨機選擇30個樣本作為訓練樣本,全體數(shù)據(jù)作為測試樣本,并重復100次,每次識別錯誤的樣本數(shù)量如圖5所示。
在循環(huán)100次的結(jié)果中共有55次測試出現(xiàn)誤判現(xiàn)象,總共誤判數(shù)為90 個,且誤判最多的測試中誤判樣本數(shù)量達5個,雖然總體效果尚可,但在實際工況中,一旦出現(xiàn)誤判等現(xiàn)象將會耗費一定的人力物力。相比之下,基于可拓模式識別與MSE結(jié)合的可拓智能診斷方法在該實驗數(shù)據(jù)分析中具有一定的優(yōu)越性。

圖5 小波包分解和BP網(wǎng)絡方法在100次測試中誤判樣本數(shù)量
(1)利用MSE方法實現(xiàn)對不同健康狀態(tài)軸承振動信號的特征提取,利用Fisher比實現(xiàn)特征選擇,為后續(xù)可拓物元模型經(jīng)典域及節(jié)域的確定奠定基礎;
(2)將可拓模式識別運用于滾動軸承故障診斷中,將特征選擇所得的5 個尺度上的樣本熵作為特征向量,根據(jù)測試樣本與滾動軸承不同健康狀態(tài)物元模型的關聯(lián)度值實現(xiàn)軸承診斷的定性定量分析;
(3)實驗結(jié)果表明提出的滾動軸承故障可拓智能診斷方法分析該實驗數(shù)據(jù)效果顯著,故障識別率達到100%,對比小波包分解與BP神經(jīng)網(wǎng)絡的方法具有一定的優(yōu)越性。