鄧飛躍,丁 浩,郝如江
(1.石家莊鐵道大學 省部共建交通工程結構力學行為與系統安全國家重點實驗室,石家莊 050043;2.石家莊鐵道大學 河北省工程機械動力與傳動控制重點實驗室,石家莊 050043;3.石家莊鐵道大學 機械工程學院,石家莊 050043)
旋轉機械在現代工業系統運轉過程中起著至關重要的作用,軸承、齒輪等旋轉部件的健康狀態直接影響整個機械系統的運行可靠性。旋轉部件一旦發生故障,將造成嚴重的安全事故和巨大的經濟損失[1]。因此建立有效的旋轉機械狀態監測和故障識別系統,對于確保設備安全運行及人員安全具有重大意義。
近年來,傳統的振動信號分析方法在設備故障診斷中得到了廣泛應用,尤其是各種時頻分解方法不斷發展,例如:小波變換(wavelet transform, WT)[2]、經驗模態分解(empirical mode decomposition, EMD)[3]、變分模態分解(variational mode decomposition,VMD)[4]、經驗小波分解(empirical wavelet transform, EWT)[5],上述方法用于故障信號特征提取得到了較好效果。與此同時,“基于信號處理特征提取+機器學習”的故障診斷方法也不斷涌現:Cerrada等[6]分別提取信號時域、頻域和時頻域統計特征輸入隨機森林模型診斷齒輪箱故障;Dong等[7]利用LMD方法提取信號故障特征并結合K-最近鄰(K-nearest neighbor, KNN)模型識別軸承不同故障損傷程度。但這類方法仍有明顯不足:一是應用信號處理方法往往需要過多的先驗知識,難以準確提取故障特征;二是淺層機器學習模型無法準確表征特征信息與健康狀態之間復雜的映射關系[8]。
在人工智能技術推動下,基于深度學習的故障診斷方法蓬勃發展。此類方法以數據驅動為基礎,將特征學習與智能識別融合在一起,相比傳統方法擺脫了對信號預處理及專家知識的依賴,尤其是分析海量監測數據時具有明顯優勢。深度信念網絡(deep belief network,DBN)[9]、自編碼(auto-encoder,AE)[10]網絡等無監督學習模型中參數較多,訓練過程困難且非常耗時。而卷積神經網絡(convolutional neural network, CNN)由于采用了局部感受野和權值共享策略,使模型復雜度和過擬合風險大大降低[11],近年來受到了廣泛關注。Hoang等[12]在對一維振動信號進行預處理的基礎上,建立二維CNN模型用于滾動軸承故障診斷;鄢仁武等[13]采用連續小波變換處理信號,構建AlexNet網絡實現了對斷路器故障的準確診斷;Zhao等[14]在傳統殘差神經網絡模型(residual neural networks, ResNets)中加入了可變的動態權重層,提高了殘差網絡的診斷精度。雖然CNN在實際應用中取得了很好的效果,但仍面臨一些問題亟待解決:一是隨著網絡層數的增加,梯度消失現象明顯,網絡訓練困難;二是運行工況日趨復雜及環境噪聲污染增大,傳統CNN提取故障相關特征能力不斷減弱。
為解決上述問題,本文提出一種新的多尺度特征融合殘差塊(multi-scale feature fusion residual block, MSFFRB)的設計方法,基于此構建了一維殘差神經網絡用于旋轉機械故障診斷。該網絡可以將一維數據直接作為輸入,無需進行人為預處理或二維圖像信號轉化。同時該網絡還摒棄了傳統殘差塊中卷積核尺寸固定的設計思路,通過在殘差塊中將不同尺度的卷積層級聯在一起,不僅克服了網絡梯度消失問題,還能提取多尺度特征信息,進一步提高了網絡的診斷準確度。試驗結果表明,該模型具有較強的特征學習能力,在含噪聲信號測試中具有較高的診斷精度。
CNN是一種前饋神經網絡,主要由卷積層、池化層和全連接層組成,批標準化層和激活層也是其重要組成部分。近年來,LeNet、AlexNet、ResNet等新的網絡結構不斷涌現,而且在圖像識別、語音處理等領域取得了很大成功[15]。
卷積層通過對上一層網絡輸出特征進行局部卷積操作,將學習到的特征提取到下一層,其過程表示為
y=f(W*x+b)
(1)
式中:x為卷積層輸入;y為卷積層的輸出;W為當前層的權重矩陣;*為卷積操作;b為卷積核的偏置;f()為激活函數,用于增強學習特征的非線性表達能力。目前,ReLU非線性映射函數應用最為廣泛,不僅可以加速網絡收斂,而且在反向傳播過程中更容易學習優化。
池化層可以壓縮特征圖尺寸,降低空間特征維數,簡化網絡計算的復雜度。池化層通常添加在卷積層后。常見的池化操作有:平均池化(average pooling)、最大池化(max pooling)、全局平均池化(global average pooling,GAP)等。本文中在網絡模型最后采用了GAP,它通過對每一個特征圖計算均值,在實現降維同時,極大的減少了網絡參數。
批標準化(batch normalization,BN)層通常在卷積層和激活層之間使用,用于減少內部協方差的漂移,加速網絡訓練過程。BN層可以將特征歸一化為固定分布,具體操作為
(2)

全連接層(full-connected layer)通常位于整個CNN結構的最后,通過使用Softmax函數起到“分類器”的作用,以最小交叉熵損失作為目標函數,對所學習到的特征信息進行分類識別。Softmax函數定義為
(3)
式中:xi和f(xi)分別為Softmax的輸入和輸出;Nclass為分類個數;f(xi)為屬于第i類的預測概率。
ResNets由He等[16]首次提出,它在CNN基礎上引入了殘差塊(residual block, RB)的結構。RB包含一個跨層連接(shortcut connection)和一個由多個卷積操作構成的主連接,RB最初結構如圖1(a)所示。
傳統CNN隨著層數加深而導致網絡梯度逐漸消失,而在ResNets中,網絡梯度不僅可以逐層反向傳播,而且可以直接從RB尾端流向首端。這種跨層間的恒等映射連接有效解決了網絡深度增加時的梯度消失問題,加快了模型的訓練速度,優化了訓練效果。2016年,He等對RB結構做了進一步改進,如圖1(b)所示,一方面調整了BN層、ReLU激活層及卷積層的次序;另一方面擴大了Shortcut連接的恒等映射范圍。改進后ResNets訓練更為容易,泛化性更好。

圖1 殘差塊結構
旋轉機械故障信號是典型的非線性、非平穩信號,故障信息存在于信號不同的敏感頻帶范圍內[17]。傳統特征提取方法中,多尺度故障特征能夠更好地表征機械故障信息,例如:多尺度模糊熵[18]、多尺度形態學濾波[19]、多尺度小波分析[20]等等。然而,在現有ResNets中,殘差塊中卷積核的尺寸是固定不變的,因此只能提取出特定尺度下的故障特征信息。卷積操作的尺度不同,對應結果的頻率分辨率也不相同。因此,通過不同尺度大小的卷積層學習,能夠提取出更為全面的特征信息,進而更為準確地表征故障特征。
基于此,本文提出了一種新的RB設計方法。與Huang等提出多尺度級聯卷積神經網絡(multi-scale cascade convolutional neural networks,MC-CNNs)不同,該方法不是將多尺度卷積層單獨置于網絡頂端,而是將其引入到RB中,取代了原有固定尺度的卷積層。該方法能夠在RB內部實現多尺度故障特征的提取與融合,兼顧了跨層恒等映射與多尺度特征提取的優勢。所提出的MSFFRB結構如圖2所示,首先分別采用1×1,1×9,1×25,1×49等4種不同尺寸卷積核進行卷積操作,提取不同尺度的特征信息;然后通過層間級聯(Concat),將不同尺度的特征信息融合成新的輸出特征,接著進行第二次多尺度卷積操作,通過層間級聯再次進行融合;最后通過一個步長為2的最大池化操作來降低所學習到的空間特征維數,進一步提取較為重要的特征信息。為提高網絡的泛化能力,加速網絡的收斂速度,在所提RB中,卷積層前均采用了ReLU激活層,卷積層后均使用BN層。此外,在恒等映射過程中,我們采用了一個步長為2的1×1卷積操作,來保證殘差塊首尾兩端空間特征維數相同。

圖2 多尺度特征融合殘差塊
本文所提出的多尺度特征融合殘差網絡結構,如圖3所示。借鑒文獻[21]中思想,故障沖擊共振波形及沖擊周期是表征部件故障狀態的重要因素,網絡首層采用了一個大尺度的卷積層來提取至少一個完整周期的故障沖擊特征。本文采用的是步長為1,尺寸為1×100的32個卷積核對輸入數據進行卷積操作,對于不同尺寸卷積核的影響,我們會在后面試驗部分做進一步對比分析。隨后,網絡模型采用的是2個MSFFRB。殘差塊數量過少會無法充分提取數據特征信息,而數量過多又會導致網絡結構復雜,運行效率下降。本文通過分析對比,最后選取2個MSFFRB構建模型,后面通過網絡模型t-SNE可視化后特征信息聚類效果,進一步驗證了其合理性。接著對每個輸出特征圖進行GAP處理,然后通過Dropout層減緩過擬合的影響。最后,使用全連接層并進行Softmax分類輸出,對旋轉部件不同健康狀態進行智能識別。網絡模型的具體參數設置如表1所示。需要說明的是,本文所提出的殘差網絡模型在結構上具有較強的靈活性,可以根據所分析數據的不同,選擇合適數量的RB搭建網絡模型。

圖3 多尺度特征融合殘差網絡
試驗是在動力傳動故障診斷綜合試驗臺(drivetrain dynamics simulator, DDS)上完成的。試驗臺結構如圖4所示,主要由電機、二級平行軸齒輪箱、磁勵制動器等組成。齒輪箱中滾動軸承和齒輪存在多種故障形式,試驗共測試了13類不同工況,包括:1類正常、4類軸承故障、4類齒輪故障和4類軸承、齒輪復合故障,其中部分軸承和齒輪故障類型,如圖5所示,13類不同工況如表2所示。試驗過程中,加速度傳感器安裝在齒輪箱頂蓋上,采樣頻率為12 800 Hz,齒輪箱輸入軸轉速為2 100 r/min。

圖4 測試試驗臺

圖5 軸承、齒輪故障類型

表2 齒輪箱13類健康狀態
試驗分析時,我們采用的深度學習框架為TensorFlow,Python編程語言。計算機配置為:英特爾酷睿i7-9700K CPU,英偉達GeForce RTX 2070GPU顯卡,32 G內存。
針對每類工況,我們分別采集了1 200個信號樣本,每個樣本包含1 024個數據點,13工況共15 600個樣本。每類工況中,我們隨機選取1 000樣本作為訓練樣本,200個作為測試樣本。訓練樣本又被平均分為5個子集,一個子集作為驗證集,其余4個是訓練集。我們采用五折交叉驗證方法對網絡進行訓練,進而確定最優網絡模型。將測試集輸入網絡模型進行分析,測試過程重復5次,最終測試結果取均值。
樣本信號輸入網絡模型前,統一進行了歸一化處理。試驗過程采用了Adam優化算法更新網絡參數,網絡的超參數設置參考了Zhao等和He等的研究。網絡訓練過程中,初始學習率為0.001,每10個迭代步學習率減小到原來的1/10,共進行40個迭代步訓練,批量大小為16。13類樣本信號輸入本文所提網絡后訓練和測試的分類準確度和損失值,分別如圖6和圖7所示。從圖中可知,在網絡訓練和測試過程中,網絡輸出的分類準確率均達到100%,損失值為0,并且兩者在20個迭代步后都能夠達到有效收斂并保持穩定。上述結果表明,網絡模型超參數選取較為合理,參數優化過程基本正確,我們通過該網絡可以較為準確地識別齒輪箱13類不同健康狀態。

圖6 網絡的分類準確度

圖7 網絡的分類損失度
為更符合實際工況,我們在原信號基礎上添加了不同信噪比(signal noise ratio, SNR)的高斯白噪聲,信噪比分別為-10 dB,-8 dB,-5 dB,-3 dB,3 dB和5 dB。將這些含噪信號輸入網絡,來進一步驗證所提網絡模型在噪聲工況下的可靠性。
根據Jia等[22]的研究,CNN中第1個卷積層相當于一組帶通濾波器,不同尺寸大小的卷積核能夠提取信號中不同頻帶范圍內的特征信息,卷積核尺寸越大,可以提取的頻帶范圍越寬,尺寸越小,可以提取的頻帶范圍越窄。因此,本文首先分析了所提網絡中首層卷積中卷積核尺寸大小對網絡性能的影響。首層卷積核尺寸分別設置為1×3,1×5,1×7,1×9,1×25,1×49,1×100,1×200,1×300和1×400,噪聲信號的測試結果如表3所示。從表3中可知,隨著首層卷積核尺寸的不斷增大,診斷結果均出現了一個由遞增到遞減的變化過程。究其原因,如果首層卷積中頻帶范圍過小,特征信息會無法提取或提取不足;頻帶范圍過大,提取的信息中又包含了過多的干擾成分。整體來看,當所提網絡模型首層卷積的卷積核尺寸為1×100時,網絡模型性能達到最優。

表3 首層不同尺寸卷積核的分類結果
為進一步分析本文所提網絡模型的優越性,我們選取傳統CNNs、1D-LeNets、1D-AlexNets、ResNets及MC-CNNs等5種網絡模型與本文所提網絡進行對比。其中,傳統CNNs中卷積層數與本文所提方法相同,ResNets采用的是改進后殘差塊(見圖1(b)),殘差塊數量與本文所提網絡殘差塊數量相同。針對不同信噪比的噪聲信號及原信號,上述方法的診斷結果如圖8所示。從圖8中可知,隨著噪聲的增大,所有方法的診斷精度均明顯下降,可見信號中噪聲干擾會嚴重影響網絡模型的診斷精度。因此網絡模型抗噪性的優劣程度很大程度上決定了該網絡的整體性能。總的來看,本文方法在分析不同信噪比信號時,診斷精度均為最優,尤其是針對信噪比為-10 dB的樣本信號時,MC-CNNs和ResNets方法的準確率分別為72.42%和66.96%,本文方法要分別高出4.77%和10.23%。通過上述對比分析,證實了所提方法在不同程度噪聲干擾下,具有更好的抗噪性能,診斷精度更高。

圖8 不同噪聲程度下測試結果的比較
t-SNE作為一種用于挖掘高維數據的非線性降維算法,能夠很好的將高維數據映射到二維空間。基于此,我們通過t-SNE對所提網絡不同階段的特征聚類結果進行可視化分析,進而觀察網絡內部的特征學習過程。原信號輸入所提網絡后不同階段的特征分布情況,如圖9所示。從圖9中可知,在網絡輸入端,不同工況的特征信息混在一起,隨著網絡深度增加,逐漸分離。第2個MSFFRB后,不同工況的特征信息已彼此分離,沒有疊加。最終,在網絡輸出端,13類不同工況的特征信息彼此完全分離。作為對比,我們構建了由3個MSFFRB組成的網絡模型,同樣對原信號進行分析,該網絡模型不同階段的特征分布情況,如圖10所示。從圖10中可知,不同工況的特征信息也在第2個MSFFRB后出現了較為明顯的聚類分離,模型最終的分類準確率也為100%。上述分析說明本文選取2個MSFFRB構建網絡模型可以準確識別不同類型的健康狀態。

圖9 所提網絡的可視化結果

圖10 包含3個MSFFRB網絡的可視化結果
(1)本文提出了一種新的多尺度特征融合殘差塊設計方法。該方法能夠將不同尺度的卷積操作級聯在一起,提取多尺度特征信息,克服了傳統卷積操作只能提取單一尺度特征信息的缺點。并且,該方法是在殘差塊內部實現了多尺度特征信息的提取與融合,同時兼顧了殘差網絡跨層恒等映射與多尺度特征提取的優勢。
(2)本文基于MSFFRB構建了一維殘差神經網絡模型,不僅有效解決了網絡深度增加時梯度消失問題,還能較為全面地提取信號中多尺度特征信息。通過與當前多種網絡模型進行比較,所提方法具有更好的抗噪性能,分類準確性更好,可有效用于旋轉機械故障診斷。同時,該網絡在結構上具有較強的靈活性,可根據實際情況進行擴展。