楊 慧,張瑞君,陳國良
(1.安徽文達信息工程學院 智能制造學院,安徽 合肥 230001;2.西安交通大學 機械工程學院,陜西 西安 710049;3.聯合傳動及軸承技術研究中心,寧夏 石嘴山 753000)
滾動軸承是旋轉設備的重要部件,軸承運行狀態直接影響整個設備的使用壽命,及時準確地識別出軸承故障具有重要意義[1]。
目前,基于機器學習的軸承故障診斷方法得到了廣泛應用[2,3]。SOUALHI A等人[4]采用了改進蟻群算法,優化了支持向量機,從而對軸承進行了故障識別,取得了較高的故障識別準確率;但蟻群算法存在效率較低的缺陷。BAZAN G H等人[5]將信息論引入了軸承振動信號分析中;但信息論依賴專家經驗,缺乏自適應性。
由此可見,基于機器學習模型的軸承故障診斷方法需要借助復雜的信號處理算法提取相關特征,從而限制了機器學習技術的應用范圍。
卷積神經網絡(convolutional neural networks,CNN)能自動從信號中學習故障判別性特征,因而也得到了廣泛應用。HOANG D T等人[6]利用CNN,結合信息融合技術,對滾動軸承故障進行了有效地診斷;但CNN受噪聲影響較大,網絡收斂速度較慢。KAO I H等人[7]利用一維CNN進行了軸承自動故障診斷,取得了97%以上的診斷準確率;但CNN抗噪能力較差。
基于CNN的軸承故障診斷研究雖然取得了一定成果,但模型普遍缺乏判別特征的學習機制,難以學習判別性故障特征[8]。若直接將軸承原始振動信號輸入卷積神經網絡,環境噪聲的存在會降低卷積神經網絡的故障診斷準確率[9]。
而Laplace小波與軸承故障振動信號形狀相似,適合作為振動信號濾波前處理方法。
因此,筆者將Laplace小波和改進卷積神經網絡-雙向門控循環單元(improved convolutional neural network-bi-directional gated recurrent unit,ICNN-BiGRU)模型結合,提出了一種滾動軸承故障診斷模型(方法)。
筆者首先使用Laplace小波對振動信號進行相關濾波,并進行功率譜變換;然后,利用ICNN-BiGRU自動提取功率譜特征;最后,采用西安交通大學-昇陽科技聯合實驗室(XJTU-SY)滾動軸承加速壽命試驗數據集,對提出ICNN-BiGRU模型進行驗證。
Laplace小波表達式如下:
Ψ(ω,ζ,τ,t)=

(1)
式中:ξ—阻尼比;τ—時間參數;Ws—小波支撐區間。
由于ω=2πf,f的大小決定了小波振蕩頻率的快慢。
定義向量F、Z和T分別為:
F={f1,f2,…fm}
Z={ξ1,ξ2,…ξn}
T={τ1,τ2,…τp}
(2)
Laplace小波濾波可看作從基函數庫ψ中選擇與故障信號最為相似的波形所對應的參數,參數滿足下式:
ψ={ψγ:γ∈Γ}={ψ(f,ξ,τ,t):f∈F,ξ∈Ζ,τ∈T}
(3)
Laplace小波與x(t)的內積公式為:
〈ψγ(t),x(t)〉=‖ψγ‖2‖x‖2cosθ
(4)
x(t)與ψγ(t)的相似度計算如下:
(5)
當Kr最大時,Laplace小波的波形與軸承故障信號最相似,然后做出每個時刻相關系數Kr峰值的功率譜,進而完成相關濾波[10]。
輸入層將信號每隔M點采集一次,連續采集N次生成一個子段,最后將信號分割為M段,每段N個數據點。
筆者對每段信號進行Laplace小波相關濾波,然后得到功率譜,輸入層數據結構如下:
X=[x1,x2,x3,…,xM]
(6)
式中:X—模型輸入;xi—功率譜。
1維卷積層對輸入X在第j個卷積核處的計算公式sj如下:
sj=[sj(1),sj(2),…,sj(N-FL+1)]
(7)
式中:FL—卷積核長度。
其中:
(8)
式中:Hjc—第j個卷積核的第c通道;fj—第j個卷積核的激活函數;bj—第j個卷積核偏置,q:q+FL-1—第q個卷積區域。
其中:
q∈[1,2,…,N-FL-1]
(9)
輸入X在第1卷積層的輸出向量S計算如下:
S=[s1,s2,…,sFN]
(10)
池化操作提取特征如下:
Z=[z1,z2,…,zFN]
(11)
zj=[zj(1),zj(2),…,zj(Np)]
(12)
zj(v)=max(sj(v-1)K+1,…sj(vK))
(13)
式中:zj—池化層輸出;K—池化長度。
動態選擇(dynamic selection,DS)能自動選擇特征向量中有用的通道信息,進一步提高模型的特征學習能力。DS層包括1個平均池化層和2個全連接層。
特征向量Z通過平均池化層得到C為:
C=[c1,c2,…,cFN]
(14)
其中:
(15)
C通過2個全連接層,生成一個包含不同權重的信息通道段d,計算如下:
d=f(U2f(U1C+b1)+b2)
(16)
式中:U1,U2—權重矩陣;b1,b2—偏置;f—激活函數。
筆者將d與Z進行通道式相乘操作,獲得新的特征向量M,如下:
M=d?Z=[m1,m2,…,mFN],mj∈RNp
(17)
式中:?—對應通道相乘。
DS過程如圖1所示。

圖1 DS過程
雙向門控循環單元(bi-directional gated recurrent unit,BiGRU)結構,如圖2所示。

圖2 BiGRU層結構

隱藏狀態ht計算如下:
(18)
(19)
(20)
式中:V—隱藏狀態權值矩陣;W—輸入信息權值矩陣;ht—t時刻隱藏狀態。
自注意力(self-attention,SA)機制可調整不同特征向量的注意力權重,以弱化冗余特征信息,保留目標特征。
SA模型結構如圖3所示。

圖3 SA模型結構
SA層通過柔性最大函數(soft version of max,SoftMax)后,計算公式如下:
(21)
式中:ht—特征向量;q—查詢向量;F—評分函數。
F計算如下:
(22)
當分段特征概率分布生成時,整個SA輸出如下:
(23)
式中:αt—注意力分布。
筆者將特征向量v輸入全連接層后使用SoftMax函數,實現故障診斷,計算如下:
e=f(Wrv+br)
(24)
y=SoftMax(Wfe+bf)
(25)
式中:f—ReLU激活函數;Wr,Wf—全連接層權重矩陣;br,bf—全連接層偏置。
ICNN-BiGRU故障診斷的步驟如下:
(1)使用加速度傳感器采集軸承振動信號;
(2)對信號進行樣本劃分;
(3)使用Laplace小波對樣本進行相關濾波得到功率譜;
(4)將信號功率譜樣本輸入模型框架進行訓練,即首先通過2個1維卷積層和2個最大池化層提取功率譜特征;其次為突出有效信息通道,在每1個最大池化層后,構造一個DS層;然后,將提取的特征通過BiGRU層,考慮到BiGRU層輸出的特征向量不一定對軸承故障識別都具有同等貢獻,引入SA層調整不同特征向量的注意力權重,過濾冗余特征,保留目標特征;最后,堆疊1個全連接層和1個輸出層實現軸承多故障診斷。
ICNN-BiGRU框架如圖4所示。

圖4 ICNN-BiGRU模型框架
為了驗證模型有效性,筆者采用XJTU-SY軸承加速壽命試驗數據進行驗證,試驗臺如圖5所示。

圖5 軸承試驗臺
試驗臺主要由電機、轉速控制器、加速度傳感器和測試軸承等組成。
其中,2個加速度傳感器分別安裝在測試軸承的垂直和水平方向,測試軸承型號為UER204,電機轉速為2 400 r/min,徑向力10 kN,采樣頻率25.6 kHz,采樣間隔1 min,每次采樣時長1.28 s。
軸承參數如表1所示。

表1 軸承參數
軸承加速壽命試驗結束后,軸承3_1出現了外圈故障,軸承3_2出現了滾動體故障,軸承3_4出現內圈故障,因此,筆者采用軸承3_1、3_2和3_4的全壽命周期數據進行分析。
文獻[11]中,將軸承3_1全壽命數據中第525、2 350、2 475和2 538(單位:mm)對應的4組數據作為4種軸承狀態(正常、外圈輕微故障、外圈中度故障、外圈重度故障),將軸承3_2全壽命數據中第1 279、1 362和1 642(單位:min)對應的3組數據作為3種軸承狀態(滾動體輕度故障、滾動體中度故障和滾動體重度故障);同時,將軸承3_4全壽命數據中第1 417、1 445和1 479(單位:min)對應的3組數據作為其他3種軸承狀態(內圈輕度故障、內圈中度故障和內圈重度故障),共10種軸承狀態。
筆者采用滑動分割方法對樣本進行劃分(每個樣本的長度和滑動分割的步長分別為2 048和28,共10 500個樣本數據),最后對樣本數據預處理進行標準化操作;對于每種故障信號,選取80%作為訓練集,剩余20%作為測試集。
軸承故障數據集詳細描述如表2所示。

表2 軸承故障數據集詳細描述
10種軸承狀態的時域波形如圖6所示。

圖6 10種工況信號時域波形
由圖6可知:軸承振動信號的時域圖受噪聲干擾嚴重,難以直接進行軸承故障工況辨識。以工況h為例,經計算軸承滾動體的故障特征頻率f0約125 Hz,功率譜如圖7所示。

圖7 工況h振動信號功率譜
由圖7可知:功率譜中故障頻率被噪聲淹沒,難以進行故障診斷。將Laplace小波原子參數設置為F={2 500∶30∶3 500},Z={{0.005∶0.005∶0.2}U{0.3∶0.1∶0.9},T={0∶0.001∶0.1},Laplace小波相關濾波后的功率譜如圖8所示。

圖8 Laplace小波相關濾波后的功率譜
由圖8可知故障頻率及其2倍頻,由此證明,Laplace小波相關濾波法是有效的。
ICNN-BiGRU模型的參數如表3所示。

表3 ICNN-BiGRU模型的參數
筆者討論DS模塊對模型識別性能的影響,為此建立包含3個、2個、1個、0個DS層的4種結構,分別記作:3DS,2DS,1DS和0DS。
在試驗過程中,筆者通過在信號中加入高斯白噪聲干擾,均采用Laplace小波相關濾波法作為信號前處理方法。
在高斯白噪聲為-5 dB情況下,DS模塊有效性試驗結果如表4所示。

表4 DS模塊有效性試驗結果
表4中,當DS模塊數量為2時,模型性能最高;當繼續增加DS模塊數量時,模型性能下降(原因可能是過多的DS模塊導致模型過擬合);2DS比0DS的準確率增加近7%,表明DS模塊可通過增強某些特征通道有效提高網絡的特征學習能力,從而使整個網絡具有更好的性能。
為了進一步理解DS模塊的內部運行過程,筆者對通道向量的輸出進行可視化,DS層通道向量輸出特征圖如圖9所示。

圖9 DS層通道向量輸出特征圖
圖9中:DS模塊會抑制模型無用的特征通道,增強有用的特征通道。尤其是第2個DS模塊,只選擇幾個特征通道,但性能卻得到了有效提升,進一步證明采用DS模塊進行通道特征選擇的有效性。
在高斯白噪聲為-5 dB情況下,筆者驗證SA層對模型故障識別性能的影響。同樣,試驗建立2種網絡結構,即0SA和1SA。
驗證結果如表5所示。

表5 SA層試驗結果 (%)
表5中,1SA比0SA的故障診斷準確率增加了約4.2%,并非所有特征對于故障診斷都有效;移除SA層后,網絡最后輸出的每個特征都具有相同的概率權重,無法過濾冗余特征,從而導致性能下降。
筆者對SA層輸出權重概率進行可視化,如圖10所示。

圖10 SA層輸出權重概率
圖10中:當軸承處于正常工況時,注意力概率權重分布在大多數序列段,這表明大部分序列對于故障識別的輸出貢獻基本相同;當軸承處于滾動體故障工況時,注意力概率權重分散在少數序列段,這表明這些少數序列對于最終的輸出結果起著重要作用。
筆者首先在不同噪聲環境下,將ICNN-BiGRU與正交正則化一維卷積神經網絡(orthogonal regularization 1D convolutional neural network,OR1D-CNN)[12]、貝葉斯優化卷積神經網絡(bayesian optimization convolutional neural network,BOCNN)[13]和改進門控循環單元網絡(modified gated recurrent unit network,MGRU)[14]的性能進行比較;信號濾波方法均為Laplace小波相關濾波法。
不同深層網絡模型故障識別率均值對比結果,如表6所示。

表6 不同深層網絡模型故障識別率均值對比 (%)
表6中:隨噪聲強度的增加,各模型性能都有所下降,但是ICNN-BiGRU模型的準確率要顯著好于其他3種模型,特別是在SNB=-5 dB時,ICNN-BiGRU模型的準確率仍達到了93.13%。
對比實驗結果證明,ICNN-BiGRU模型在不同噪聲背景下具有優越的診斷性能[15]。
第1次試驗結果的多分類混淆矩陣如圖11所示。

圖11 第1次測試結果的混淆矩陣
圖11中:10種軸承診斷準確率均達到99%以上。
然后,筆者在不同噪聲環境下,將Laplace小波相關濾波(Laplace wavelet correlation filtering,LWCL)與Morlet小波相關濾波(morlet wavelet correlation filtering,MWCL)[16]和Morlet連續小波變換濾波(morlet continuous wavelet transform filtering,MCWTL)[17]的性能進行比較。
不同濾波方法的故障識別率均值對比結果,如表7所示。

表7 不同濾波方法的故障識別率均值對比 (%)
表7中:LWCL作為信號前處理方法時,模型的準確率優于其他2種濾波方法。對比試驗結果表明:Laplace小波能為ICNN-BiGRU提供更為優秀的訓練樣本。
以MWCL方法為例,經MWCL處理后工況h信號的功率譜,如圖12所示。

圖12 MWCF處理后信號的功率譜
圖12中:經MWCF處理后的信號功率譜只能提取到轉頻,且功率譜中分布著大量噪聲頻率分量,難以為ICNN-BiGRU提供優秀的訓練樣本。
為驗證不同轉速和負載下的模型診斷性能,筆者根據西安交大-昇陽軸承加速壽命試驗數據集,取3大類工況進行分析。
軸承加速壽命試驗工況如表8所示。

表8 軸承加速壽命試驗工況
表8共有3種軸承狀態,分別為:軸承Bearing 1_2對應1種軸承狀態(外圈輕微故障),軸承Bearing 2_3對應1種軸承狀態(保持架輕微故障),Bearing3_3對應1種軸承狀態(內圈輕微故障)。
筆者同樣采用滑動分割方法對其進行樣本劃分,每個樣本的長度和滑動分割的步長分別為2 048和28,得到10 500個樣本數據,選取80%作為訓練集,剩余20%作為測試集。
筆者將ICNN-BiGRU與3.4節所列出的OR1D-CNN、BOCNN和MGRU模型性能進行比較,驗證結果的均值如表9所示。

表9 不同深層網絡模型故障識別率對比 (%)
表9中:在不同轉速不同負載工況下,ICNN-BiGRU模型的診斷準確率顯著好于其他3種網絡模型,對比實驗結果證明,ICNN-BiGRU模型在不同轉速負載工況下有優越的診斷性能。
為了解決噪聲環境下滾動軸承故障識別率較低的問題,筆者首先利用Laplace小波優越的降噪能力,對軸承振動信號進行了相關濾波降噪;然后,利用ICNN-BiGRU的自動特征提取能力與故障識別能力,對滾動軸承故障進行了診斷;最后,通過測試數據對試驗結果進行了驗證。
研究結論如下:
(1)基于Laplace小波降噪的ICNN-BiGRU模型識別準確率達99.65%,相比基于Morlet小波降噪高出近2.4%,Laplace小波作為信號的前處理方法能為ICNN-BiGRU模型提供了優秀的訓練樣本;
(2)ICNN-BiGRU模型通過引入動態選擇DS模塊能有效抑制模型的無用通道信息,增強了模型特征學習能力;并通過引入自注意力機制SA對信號序列的特征段進行了有效篩選,進一步增強了模型的特征提取能力。
在后續的研究中,筆者將進一步優化Laplace小波濾波方法和ICNN-BiGRU更為有效的優化方法,以滿足軸承大數據時代的智能化故障識別的需求。