董紹江 楊舒婷 吳文亮
(1.重慶交通大學 機電與車輛工程學院,重慶 400074;2.西南交通大學 磁浮技術與磁浮列車教育部重點實驗室,成都 610031)
軸承作為現代制造業的重要組成部分,在大多數旋轉機械的運行中發揮著至關重要的作用,其健康狀況直接影響機構性能的穩定性與壽命,因此軸承故障診斷對機械系統運行的可靠性和安全性具有重大意義。在實際應用中,機械系統的工作環境變化很大。由于振動信號容易被噪聲污染,因此在工業生產中不可避免地會產生噪聲。在嘈雜的環境下診斷故障類型的能力至關重要且具有挑戰性。
防止軸承可能損壞的最常見方法是在旋轉機構運行時對振動進行實時監控,目前常應用智能的故障診斷方法來識別故障類型[1-3]。Amar等[4]提出了一種故障診斷方法,該方法使用預處理的快速傅里葉變換(fast Fourier transform,FFT)頻譜圖像作為人工神經網絡的輸入。從原始振動信號生成的FFT頻譜圖像首先使用2D平均濾波器進行平均,然后通過適當的閾值選擇轉換為二進制圖像。Shao等[5]針對滾動軸承故障診斷提出一種帶有壓縮感知的改進卷積深度置信網絡,即先用高斯可見單位構造一個新的卷積深度置信模型,以增強壓縮數據的特征學習能力;其次采用指數移動平均技術來提高構造的深度模型的泛化性能。
近年來,隨著深度學習[6]在各種研究領域中作為計算框架的迅速普及,研究人員嘗試使用卷積神經網絡(convolutional neural networks,CNN)來診斷機械零件的故障。Wang等[7]提出了一種新的自適應深度卷積神經網絡用于滾動軸承的故障診斷:首先,將深度CNN模型進行自動特征學習;其次,采用粒子群算法確定深度CNN模型的主要參數。Janssens等[8]提出一種用于旋轉機械狀態識別的CNN模型,其輸入是從彼此垂直放置的兩個傳感器收集的兩行信號的離散傅里葉變換(discrete Fourier transform,DFT)。Abdeljaber等[9]提出一種自適應1D CNN模型,用來對旋轉機械進行檢測和定位結構損傷。Guo等[10]提出了一種分層自適應CNN模型,該CNN模型通過將故障位置確定層和故障大小評估層按層次排列來實現故障診斷。以上這些模型在軸承故障診斷方面取得了不錯的效果,但是并沒有考慮在嘈雜的環境下診斷故障類型的能力,難以保證精度。
綜上所述,本文提出了一種基于抗噪多核卷積神經網絡(anti-noise multi-core convolutional neural network,AMCNN)的軸承故障識別新方法,在訓練中,為增加樣本數,抑制過擬合,對原始訓練樣本進行加噪、重疊采樣處理,獲得軸承信號樣本并實現標簽化。然后,根據標簽化軸承樣本訓練改進的AMCNN軸承故障診斷模型,為提高模型抗噪能力,將AMCNN的一層設為dropout層。
CNN的基本結構由正向傳播和反向傳播組成[11]。正向傳播的參數通過反向傳播算法進行優化。正向傳播由多個卷積層、池化層和幾個完全連接的層組成,卷積層的目的是在輸入數據通過各層傳播時提取它們的不同特征。CNN訓練過程如下。
步驟1卷積

(1)
步驟2批量標準化
在將輸入數據映射到非線性函數之前,批量標準化(batch normalization,BN)可減少內部協方差的移位,加快深度神經網絡的訓練過程,迫使輸入數據分布呈標準正態分布。輸入到該層的數據落入激活函數的敏感區域,以避免梯度消失。通過始終保持較大梯度的狀態,可以調整神經網絡的參數以更快地收斂。BN層的轉換如下。
(2)
(3)
(4)
(5)

步驟3激活函數
最常見的激活函數為修正線性單元(rectified linear unit,ReLU)[13]。ReLU解決了S型局部梯度爆炸和梯度消失的問題,加速CNN的收斂。ReLU的算法如下。
(6)

步驟4池化
池化層可以有效地減小矩陣的尺寸,不僅可以加快計算速度,而且可以防止過擬合[14]。通過簡單的最大值計算該層的前向傳播,轉換如下。
(7)
式中,Ui表示cl的第i個特征矩陣。
步驟5SoftMax回歸
在神經網絡的輸出進入SoftMax分類之前,執行全連接層。SoftMax回歸模型可以是用于優化分類結果的學習算法[15],它將神經網絡的輸出轉換為概率分布,該概率分布繪制了不同事件發生的概率。其轉換如下。
(8)
式中,y′i表示神經網絡的第i個預測值,S(·)表示SoftMax函數,di表示匯聚層的第i個輸出,n是神經網絡預測值的數量。
步驟6交叉熵
交叉熵是評估神經網絡輸出的指標,它描述了模型的預測分布與真實標簽分布之間的距離。輸入參數相應標簽值y′的交叉熵由神經網絡的預測分布y-表示,轉換如下。
(9)
式中,H(y-,y′)描繪了用y-表達y′的難度。交叉熵是神經網絡的損失函數,當交叉熵的值較小時,神經網絡的預測值接近真實值。
步驟7損失函數
損失函數是神經網絡優化的目標函數。神經網絡的優化是使損傷函數最小化的過程,損失函數值越小,則預測值越接近實際結果,其轉換如下。
(10)

步驟8梯度下降
通過梯度下降法對模型的參數進行優化[16],其公式如下。
(11)
(12)

多核卷積是高靈活性的非線性學習模型,本文針對噪聲下的軸承信號,采用AMCNN模型來增強模型的提取特征能力,提高識別精度。所提出的AMCNN識別模型建立了12層模型,包括1個輸入層、5個卷積層、4個池化層、1個全連接層和1個輸出層,第三卷積層采用多核卷積。同時,通過BN方法對數據進行處理。BN層使得輸入到該層的數據落入敏感的非線性變換函數區域中,以避免梯度消失。
數據集增強技術通過添加訓練樣本的方式實現最大化神經連接的通用性目標。AMCNN模型需要大量的訓練數據,對于軸承信號的特征,在采樣時采用重疊采樣的方式以增加訓練樣本的數量。這種采樣方式不僅可以在相鄰元素之間保持盡可能多的相關性,同時增加了參與模型的樣本數量,從而可以使模型學習到更強的分類特性。
此外,神經網絡的訓練過程容易造成過擬合,在測試集上的識別率不佳,通用性較差。因此,在測試樣本中加入了-10~50 dB信噪比的隨機高斯白噪聲,以增加有限的樣本數量,減弱神經網絡的神經元之間的連接關系。加入隨機高斯白噪聲相當于增加樣本,減少神經網絡過擬合,高斯白噪聲可由下列方法得到。
(13)
(14)
(15)
式中,Pn是噪聲序列的功率,Pave是信號序列的平均功率,x(·)是信號序列,N是信號序列中的總點數,k是信噪比,z表示噪聲能量的大小。同時,在神經網絡的第一層采用了dropout層,模擬真實環境對信號的干擾,以增強神經網絡對噪聲的抗干擾能力。
最后構建軸承故障識別模型,其結構如圖1所示。首先,將原始信號進行預處理,獲得軸承信號樣本并實現標簽化。然后,根據標簽化軸承樣本訓練改進的AMCNN軸承壽命狀態識別模型。在訓練過程中,為抑制過擬合對原始訓練樣本進行加噪、重疊采樣處理,為提高模型抗干擾能力,將dropout層作為第一層。
在實際應用中,機械系統的工作環境變化很大,其中主要涉及兩種變化:首先,工作負荷可能會隨著生產的需要而不斷變化,所以需要對訓練樣本進行分類和標記;其次,工業生產中噪聲是不可避免的,振動信號容易受到噪聲的污染。
實驗數據來自美國凱斯西儲大學(Case Western Reserve University,CWRU)軸承故障信號,選取了包含無故障樣本數據在內的10類數據。分別選取內圈、外圈、滾動體在輕度損傷、中度損傷和重度損傷下的信號各200個樣本,采用重疊采樣的方式以增加訓練樣本的數量,每個樣本長度為2 048(3種損傷分別采用電火花加工出0.177 8、0.355 6、0.533 4 mm單點故障),另外還包含正常數據共10類數據,采樣頻率為12 kHz,訓練和測試集中的樣本個數比為4∶1。實驗數據詳細介紹見文獻[18]。
AMCNN模型各層的參數見表1。
在實驗中使用的所提CNN結構由5層卷積和4層池化層組成,緊接著是全連接層和SoftMax層,其中第3層卷積層是由多核卷積核組成,實驗使用Google的TensorFlow工具箱實現。第一個卷積內核的大小為1×64,合適的第一個卷積內核可以起到抗干擾作用[19,10],第3層多核卷積核的尺寸分別為1×1、1×4、1×8、1×16,多核卷積核對復雜特征提取能力更強,更具魯棒性,能夠更好適用于噪聲環境。卷積層其余內核大小為1×4,激活函數為ReLU。池化類型為最大池化,在每個卷積層和全連接層之后,批量歸一化用于改善CNN的性能。
本節通過對CNN訓練過程的可視化展示模型特征提取過程。選用t分布隨機領域嵌入(t-distributed stochastic neighbor embedding,t-SNE)算法,通過基于具有多個特征數據點的相似性識別觀察到的模式來找出數據中的規律,將高維數據降低到2維以進行可視化,使相似的數據離得更近,不相似的數據離得更遠。圖2給出了從每個卷積層通過t-SNE方法提取的1 000個測試樣本的特征分布的可視化結果。由圖2可以看出,在最初的特征分布圖中,各類的特征分布是不可分的,但最后的全連接層中各個類別的特征點是完全可分的。
由此可見,隨著層的深入,特征變得越來越可分割,特別是在通過第三層的多核卷積之后,各類特征點的分布有了顯著的變化,使得各個類別特征點的分布有了明顯的區分,可見多核卷積核在故障分類識別中起到了關鍵的作用。同時,也驗證了所提模型在故障分類上的有效性。
將本文所提模型與其他模型進行對比,驗證不同模型性能的優劣。為了檢驗本文網絡模型每個改進部分的效果,設置了3種情形:情形1將傳統CNN和AMCNN進行對比,傳統CNN結構中無多核卷積核,其他參數與AMCNN參數一致;情形2設置為是否在訓練樣本中添加噪聲;情形3設置為是否添加dropout層作為AMCNN網絡模型的第一層,其中dropout的值設為50%[20]。
表2中比較了不同信噪比環境下4種分類模型的識別正確率。

表2 不同信噪比環境下不同模型識別正確率Table 2 Accuracy of different models in different environments
AMCNN為文中所提出的方法,對訓練樣本進行加噪處理,第一層為dropout層;CNN模型為傳統CNN結構,訓練樣本加噪,第一層為dropout層;AMCNN(無dropout)模型為采用AMCNN結構,訓練樣本加噪,第一層無dropout層;AMCNN(未加噪)模型為采用AMCNN結構,訓練樣本未加噪,第一層為dropout層。
由表2可以看出,當SNR為10 dB時,所有模型均顯示出更高的精度(接近100%的正確率)。隨著SNR的增加,CNN的準確性大大提升。CNN模型、AMCNN(無dropout)模型、AMCNN(未加噪)模型在SNR從-10 dB上升到10 dB時,正確率從10%~20%顯著上升到接近100%。相比之下,AMCNN模型最為穩定,從-10 dB下的36%到10 dB下的99.66%。AMCNN模型在高噪聲環境下的正確率都大大高于其他模型,如在-10 dB下,AMCNN模型的正確率比其他模型高出15%~25%,體現出本文所提方法的優越性,即在噪聲環境下良好的抗噪能力和極高的故障診斷能力。
隨著信噪比的上升,4個模型的識別正確率均呈現上升趨勢,在信噪比高于6 dB的環境中,4個模型的識別正確率都能到達到99%以上,AMCNN模型與其余模型相比識別正確率差值小于0.32%。顯然,隨著信噪比進一步上升,4個模型識別正確率的差別將會越來越小,均接近100%。但在高噪聲環境下,AMCNN模型與CNN模型相比,在-10 dB環境下識別正確率高出20.75%,在-8 dB環境下高出11.24%,表明在高噪聲環境下AMCNN模型比傳統CNN模型在抗噪能力上更優。同理,比較AMCNN模型與AMCNN(無dropout)模型,AMCNN模型的識別正確率在-10 dB環境下高出14.70%,在-8 dB環境下高出17.79%,在AMCNN模型的第一層中加入dropout層會使得識別模型在高噪聲下的表現更加良好,比未改進前的AMCNN模型具有更好的抗噪能力。比較AMCNN模型與AMCNN(未加噪)模型,AMCNN模型的識別正確率在-10 dB環境下高出23.99%,在-8 dB環境下高出26.53%,表明加入噪聲訓練方法的樣本可以抑制模型的過擬合,使得識別模型在高噪聲環境下的表現更優。綜上,這些實驗驗證了在低噪聲環境下,本文所提模型能夠實現高識別正確率(達99%以上),同時在高噪聲環境下本文的改進部分具有有效性,比其他模型具有更高的識別率。
表3為支持向量機(support vector machine,SVM)、深度神經網絡(DNN)、convolutional neural networks with wide first-layer kernels (WDCNN)[21]、多層感知器(MLP)等模型在信噪比從-5 dB到0 dB環境下對軸承故障的平均識別正確率。

表3 -5 dB到0 dB環境下不同分類模型平均識別正確率Table 3 Average accuracy of different models in the range -5 dB to 0 dB
由表3的比較結果可以看出,本文所提方法在信噪比從-5 dB到0 dB強噪聲環境下的平均識別準確度要高于其他方法。主要原因是深度學習方法可以有效地從輸入數據中學習基本特征,SVM等傳統方法的效率在很大程度上取決于人工牽引;同時,本文針對噪聲環境對模型進行了改進,其表現出的效果比部分神經網絡算法更好。本文針對噪聲環境改進了原始結構和參數,在從原始特征集中選擇最敏感的特征或具有優異特性的一些新特征后,診斷結果將得到進一步改善。與人工提取特征的傳統方法和其他深度學習方法相比,本文提出方法自動特征學習能力更強大。
(1) 本文提出了一種新的解決故障診斷問題模型AMCNN,包括兩個主要的抗干擾結構,即多核卷積核和外加dropout層,其中多卷核結構通過使用不同大小的卷積核對輸入信號進行并行處理以增加模型的寬度,使得模型對復雜特征提取能力更強。AMCNN直接處理原始振動信號,無需任何費時的人工特征提取過程,為抑制過擬合,對原始訓練樣本進行加噪處理;為提高模型抗干擾能力,將dropout層作為AMCNN的第一層。
(2)針對在噪聲環境下的軸承信號,所提出的帶有dropout結構的模型相比其他模型對噪聲的容忍度更高;所提出的樣本數據加噪的訓練方法有效地抑制了神經網絡的過擬合問題。
(3)實驗驗證結果表明相較于其他模型,本文所提出的AMCNN的網絡結構在噪聲環境下對故障類型具有更好的識別率,在信噪比從-5 dB到0 dB強噪聲環境下的平均識別正確率為94.21%。