孟德乾,徐軍楊,袁建平,吳月超
(華東勘測設計研究院有限公司,浙江 杭州 310000)
滾動軸承作為機械設備的重要部件,在長期運行中極易疲勞,一旦發生故障,將影響整個機械設備的穩定運行[1]。因此,對滾動軸承開展故障診斷研究,具有重要的理論意義與工程實際價值[2]。
為解決滾動軸承的故障診斷問題,卷積神經網絡(convolutional neural network,CNN)憑借其優異的特征提取能力,被廣泛應用于故障診斷領域。如趙小強等人[3]提出一種基于二維CNN 的滾動軸承故障診斷方法,將構建好的二維特征圖輸入到CNN 中,以識別滾動軸承的故障狀態。Huang 等人[4]針對故障特征的多尺度特性,提出多尺度CNN 結構,較好地實現了軸承狀態分類。然而,CNN 雖具備較強的特征提取能力,卻難以充分獲取故障信號在時間方面的內在表達。
與CNN 相比,循環神經網絡(recurrent neural network,RNN)則在獲取時間關聯性方面有較強的優勢。在后續出現的基于RNN 的不同網絡中,長短時記憶網絡(long short term memory network,LSTM)應用最為廣泛。如鄭直等[5]針對凱斯西楚大學滾動軸承數據集,提出基于改進鯨魚算法優化LSTM 網絡的故障診斷模型,取得了97%的識別準確率。樊家偉等[6]在增強故障特征的基礎上,采用LSTM 網絡對行星齒輪箱不同局部故障進行診斷。雖取得一定的應用效果,但LSTM 結構復雜,導致網絡訓練難度加大,而基于LSTM 的門控循環單元(gated recurrent unit,GRU)則有效解決了模型的訓練難問題。
考慮CNN 和GRU 的各自優勢,為提升強噪聲下網絡的診斷性能,研究提出了一種基于深度特征提取與遷移學習的滾動軸承故障診斷模型。首先,構建MSCNN-BiGRU 深度特征提取網絡,提取強噪聲下的多尺度特征和時序特征,并通過注意力機制模塊進行重要特征選擇。其次,引入遷移學習,通過多級距離公式度量源域與目標域特征分布差異,并將度量結果添加到損失函數中,利用損失的反向傳播,實現源域與目標域特征分布對齊,以解決變工況下源域與目標域特征分布不同的問題。最后通過softmax 層進行故障模式識別。
卷積神經網絡主要由卷積層、池化層和全連接層組成[7]。卷積層使用卷積核對輸入數據的局部區域進行卷積運算,并使用激活函數進一步生成輸出特征。計算過程如下:
池化層可以進一步降低網絡參數。選用最大值池化方式,其計算式為:
式中:ul(i,t)為第l層中第i個特征張量的第t神經元;w為卷積核寬度。
對于多分類任務,全連接層常采用softmax 函數進行分類,其表達式如下:
式中:C為類別個數;φi為第i類的輸出值;αi為第i類的概率。
滾動軸承常運行在變工況環境下,為實現有效診斷,需綜合考慮來自不同工況下的域數據進行分析。假設在A 工況和B 工況下采集到的滾動軸承數據集分別為:源域和目標域。其中xi為源域樣本特征,yi為源域樣本標簽,xj為目標域樣本特征。源域和目標域有相同的特征空間和類別空間,但兩者的邊緣分布和條件分均不同[8]。
為衡量兩個域之間的分布差異,引入MMD 進行量化分析,其將源域與目標域中的特征同步映射到再生核希爾伯特空間中,通過計算兩域均值的距離以表征域間數據分布差異。其計算公式為:
式中:ns和nt分別是源、目標域樣本個數。
滾動軸承工作環境復雜,采集信號中有效成分常被噪聲而淹沒[9]。考慮MSCNN 網絡能自適應提取信號中的多尺度特征,進而獲取更豐富的故障特征信息,以及BiGRU 網絡可以從前后兩個方向學習振動信號的時間關聯性,本研究有機融合兩種網絡的優勢并引入注意力機制,構建基于MSCNN-BiGRU-Attention 的深度特征提取網絡,其結構如圖1 所示。

圖1 深度特征提取網絡結構
在損失函數中分別嵌入MK-MMD 和JMMD,度量源域與目標域的特征分布差異,并將度量結果添加在損失函數中,構建具有一定域適應能力的深度遷移網絡。其結構如圖2 所示,由狀態識別和域適應2 個模塊組成。狀態識別模塊包括MSCNN-BiGRUAttention 特征提取網絡、瓶頸層和標簽分類器,其中瓶頸層和標簽分類器均采用單層全連接網絡,神經元個數分別為256 和5。域適應模塊由MK-MMD 度量和JMMD 度量組成。

圖2 深度遷移網絡結構
基于所提深度遷移網絡的診斷模型主要實現步驟如下:
Step 1:數據預處理。采用滑動窗口對原始振動信號進行不重疊切割;同時為將每個樣本的輸入值保持在一定范圍內,采用歸一化方法。
Step 2:網絡預訓練。在前30 次訓練中,只利用帶標簽源域樣本對狀態識別模塊進行預訓練,以使特征提取網絡、瓶頸層和標簽分類器獲得較好的模型參數。
Step 3:域遷移訓練。在帶標簽源域樣本訓練模型的基礎上,增加無標簽的目標域樣本進行同時訓練。其中,MK-MMD 產生LM損失,JMMD 產生LJ損失,兩者與標簽分類損失一起構成總損失,再通過反向傳播以減小源域和目標域特征分布差異。
Step 4:故障診斷。利用訓練完備的模型對測試集的無標簽目標域樣本進行狀態識別,完成診斷。
如圖3 所示,所提模型的損失函數L包含三部分,即標簽分類損失LP、MK-MMD 度量損失LM與JMMD 度量分布損失LJ。損失函數L公式描述如下:

圖3 機械故障實驗臺
式中:θG表示特征提取網絡參數,θB為瓶頸層參數,θP為標簽分類器參數。
2.3.1 標簽分類損失
通過帶標簽的源域樣本對特征提取網絡、瓶頸層和標簽分類器進行有監督訓練,標簽分類損失采用交叉熵損失函數衡量,其公式如下:
式中:GG代表特征提取網絡,GB為瓶頸層,GP代表標簽分類器。
2.3.2 多核最大均值度量損失
MMD 雖具有一定的差異度量能力,但其基于單一核變換,難以多空間衡量分布差異,為此引入多核模式,即由多個核進行線性組合,具體如下:
式中:βu是不同內核的加權參數。
基于上式得到表征能力更強的多核MMD 度量(MK-MMD),進而得到MK-MMD 度量損失LM,其表達式如下:
2.3.3 聯合最大均值度量損失
借鑒文獻[10],引入JMMD,同時度量源域與目標域之間的邊緣分布和條件分布差異。JMMD 的公式如下:
本研究基于Spectra Quest 公司設計的機械故障綜合模擬實驗臺進行故障數據采集,如圖3 所示,其主要由轉速控制器、旋轉軸和加速度傳感器等部件組成。加速度傳感器型號為PCB352C33,實驗軸承的型號為ER12KCL,實驗滾動軸承的直徑為19.05 mm。
分別在1400 r/min、1800 r/min 和2200 r/min 轉速下收集實驗數據。采樣頻率為12.8 kHz,采集時間10 s。滾動軸承有內圈(IF)、外圈(OF)、滾動體(BF)和綜合(CF)四種故障狀態及正常狀態(N),如圖4 所示。

圖4 不同狀態下的滾動軸承
對原始數據進行不重疊切割。基于采樣頻率,選擇三個采樣周期,即樣本長度設為1024,最終每類故障獲得125 個樣本,見表1。為消除樣本奇異數據導致的不良影響,進行歸一化處理。

表1 故障數據集說明
選擇2 dB 強噪聲背景,用A、B、C 分別代表1400 r/min、1800 r/min 和2200 r/min 三種轉速數據集,六組遷移任務分別用A to B、A to C、B to A、B to C、C to A、C to B 表示,如A to B 表示:源域為1400 r/min數據集及目標域為1800 r/min 數據集。分別從帶標簽源域樣本集和無標簽目標域樣本集選取80%作為訓練集,目標域樣本集的剩余20%作為測試集。
為驗證所提模型的遷移性能,將其與DCORAL、DAN、JAN、DANN、CDAN 等五種域適應模型進行比較。其中,DAN、JAN 和DCORAL 是基于顯式距離度量的深度域適應模型,DANN 和CDAN 是基于對抗學習的深度域適應模型。實驗使用Pytorch 深度學習框架,batch 為64,學習率為0.001,epoch 為100。對六組遷移任務分別同時進行5 次實驗,并取實驗結果的平均值進行模型性能評估。不同任務的遷移診斷結果如圖5 所示,每個模型在所有任務的平均準確率及標準差見表2。

表2 不同模型的故障診斷結果

圖5 不同任務的遷移診斷結果
由遷移結果對比可知,DCORAL 模型的診斷性能最差,識別準確率僅為75.07%。其中DAN 和DANN兩種模型都只關注邊緣分布適配,識別準確率分別為88.75%和90.60%,但兩者的準確率明顯高于DCORAL。JAN 模型將邊緣分布與條件分布同時適配,準確率為90.15%,略高于DAN 模型。CDAN 模型是在DAN 模型基礎上改進的,識別準確率為90.85%。對比而言,所提遷移方法的識別準確率96.56%最高,且標準差最小,明顯優于5 種對比模型。
強噪聲下基于深度特征提取與遷移學習的滾動軸承故障診斷模型,其深度特征提取網絡通過融合MSCNN 與BiGRU 并引入注意力機制模塊,對帶噪聲的振動信號進行深度故障特征挖掘。針對變工況導致源域與目標域數據分布不同的問題,在模型中引入遷移學習,通過多級距離度量以減小源域與目標域特征分布差異,進而實現對無標簽目標域樣本的故障診斷。