黃扣 袁 偉 陳紅衛
(江蘇科技大學電子信息學院 鎮江 212100)
軸承作為大多數機械設備的重要組成部分之一,在整個設備中起到必不可少的作用。軸承故障將嚴重影響整個設備的運行,因此針對機械設備軸承的故障診斷具有很大的意義[1]。
故障診斷技術是對運行的機械設備進行檢測并對發生的故障進行診斷的技術[2]。近年來人工智能診斷方法中的基于深度學習的智能故障檢測方法由于其能夠自動挖掘大數據隱藏的深層特征成為故障診斷研究的熱門。姜洪開等[3]闡述了深度學習在故障診斷領域中最新研究現狀以及基于深度學習模型的故障診斷思路,雷亞國[4]提出了基于DNN-BP 的深度學習理論的機械裝備大數據健康監測方法,實現了對機械健康狀況的檢測診斷。Chen Lu等[5]將訓練有素的CNN用于診斷滾動軸承的故障,結合貪婪學習和反向傳播提高滾動軸承相對于環境噪聲和工作條件波動的故障模式分類精度。Hongkai Jiang等[6]提出了基于改進深度遞歸神經網絡的滾動軸承故障診斷智能方法。許理等[7]提出了基于小波包與CNN 的滾動軸承故障診斷方法。張文風等[8]提出了基于Dropout-CNN 的滾動軸承故障診斷研究方法。以上學者的研究在一定程度上提高了故障診斷準確率,但其中大多數的研究中都需要對數據做很復雜的處理,并且建立模型的算法單一,模型結構過于簡易,故障診斷分類的精確度仍有待進一步的提高。
鑒于深度卷積神經網絡能大批量訓練數據并自動挖掘學習數據中的隱藏特征,找出深層信號特征與故障狀態之間復雜的映射關系;小波可以去掉數據中無用的噪聲信號并保留信號特征[9];Dropout正則化技術能夠簡單有效地抑制神經網絡的過擬合[10];支持向量機在分類問題上常有顯著的實驗效果。因此文章創新性地提出將小波、深度卷積神經網絡、Dropout正則化和支持向量機結合,建立基于深度學習的故障智能診斷模型進行軸承的智能診斷方法研究,實驗仿真結果證明所提出的故障診斷模型訓練時間較少,且有更高的穩定度和準確度。
深度卷積神經網絡(DCNN)是具有更深層結構的卷積神經網絡,其中會疊加多個卷積層,池化層或全連接層。卷積層中卷積核進行卷積運算,將矩陣格式的輸入數據中的對應元素與翻轉后的卷積核相乘后相加,從中提取特征,見式(1)。

式中,x、y分別是輸入矩陣的行號和列號;z(x,y)、f(x,y)分別是輸出矩陣和輸入矩陣中對應行列的元素值;k(x,y)是卷積核。
卷積層中多個不同卷積核通過訓練獲得不同權值,因此從輸入中提取不同的特征。每個卷積核與卷積層輸入進行卷積計算后,將卷積結果輸入給定的非線性激勵函數中,由此可以得到一個特征圖,由多個卷積核就可以得到多張特征圖[11]。特征圖經過池化層轉換后作為下一卷積層的輸入。卷積層越多,提取到的特征也更復雜。卷積層運算見式(2)[12]。

式中,l是當前層數;Mj是輸入特征圖集合;是l層第j個特征圖;是l-1層第i個特征圖;是卷積核的權值矩陣;是當前輸出特征圖對應的偏置項;f(.) 是非線性激勵函數。
池化層接在卷積層后面,在實現卷積層輸出特征降維的同時進行二次特征提取[13]。根據池化核的大小對卷積層輸出的特征圖進行分割并進行相應池化計算,其計算公式見式(3)。

式中,β、b分別是乘法偏置和加法偏置;down(.)是降采樣函數。
全連接層一般跟在卷積層和池化層的后面,其中的每個神經元與前面一層的所有神經元連接[14],計算見式(4)。

對最后一層卷積層和池化層提取的特征進行整合,輸出數據的一維高級特征,并傳給輸出層。
支持向量機(SVM)主要用于解決模式識別領域中的數據分類問題,其主要思想是找到空間中的一個能夠將所有數據樣本劃開的超平面,并且使得樣本所有數據到這個超平面的距離最短,實現“間隔最大化”,主要通過目標函數使“分類間隔”最大,從而獲得最優決策面。對于數據樣本集(xi,yi),xi∈Rd,yi∈{-1,1},i=1,2,…,n,在滿足條件式(5)的情況下,求解最優化見式(6)。

式中:ω代表權重參數;b表示偏移向量;ξi表示松弛向量;C表示懲罰因子。
文章提出的診斷模型結構如圖1。其中C1、C3、C5、C7 和C9 為卷積層;S2、S4、S6、S8 和S10 為池化層;FC 為全連接層;SVM 為輸出層。每層具體網絡參數見表1。

表1 模型具體結構與參數

圖1 模型結構圖
故障診斷步驟總結如下:
1)對原始軸承振動數據進行小波去噪處理、數據標簽處理和數據的標準差歸一化處理。
2)構建深度卷積神經網絡,將處理后的數據代模型訓練,經全連接層獲得深層的故障特征向量,加入Dropout層。
3)使用機器學習庫SKlearn中的SVC模塊搭建SVM分類器,將從深度卷積神經網絡提取到的深層故障特征特征向量送入SVM 分類器進行多分類訓練,并使用Adam優化器優化。
4)根據訓練識別準確精度,調整DCNN 結構、Dropout 正則化參數以及SVM 的參數,包括DCNN結構中激活函數的選取和支持向量機中核函數、懲罰因子的選擇等,確定最佳的故障診斷結構。
文章采用的實驗數據是CWRU 的滾動軸承0負載,采樣頻率12000Hz,驅動端的加速度數據。包括軸承內圈、外圈及滾動體故障和正常狀態幾種工況。三種位置故障有0.007 英寸、0.014 英寸和0.021 英寸三種故障直徑。如圖2 所示,為小波去噪后的軸承工況信號時域圖。文章選取了軸承內圈、外圈及滾動體位置的各三種不同故障直徑的9種故障數據及正常工況數據共10 種類型數據進行診斷。其中每種類型使用1000 個樣本,共10000個樣本,每個樣本包括2048 個數據點。每種類型選取訓練樣本700 個,測試樣本300 個,共7000 個訓練樣本,3000個測試樣本。

圖2 小波去噪后軸承部分工況下的信號時域圖
5.2.1 激勵函數對結果的影響
激活函數對神經網絡的識別率有一定程度的影響[15]。常見的激活函數有“Logistic”、“Sin”、“Tanh”、“ReLU”和“Sig”類型。文章分別使用以上五種激勵函數構建模型得到的診斷結果如圖3 和表2所示。

圖3 不同激勵函數下的診斷識別率

表2 激活函數結果對比
由圖3 和表2 可以看出,使用“ReLU”類型的激勵函數在識別率、訓練損失及訓練時長方面都有較為明顯的優勢。因此文章選取識別效果最好的“ReLU”作為激勵函數。
5.2.2 Dropout正則化對實驗結果影響
Dropout 是深度學習中有效簡單的正則化技術,能夠抑制神經網絡的過擬合[16]。為了提高收斂速度且避免過擬合,在控制模型其他參數一致的情況下,實驗為Dropout 參數值的最優選取進行了多次的訓練。將Dropout 的參數值分別設為0.1、0.3、0.5、0.7和0.9,在不同參數值下,實驗的平均故障診斷準確率見表3,可以看出當Dropout 的參數設為0.5 時,故障診斷準確率最高,因此實驗中設置的Dropout參數值為0.5。

表3 Dropout不同參數值的診斷平均準確率
5.2.3 SVM模塊中參數對實驗結果的影響
文章根據查閱資料經驗[17],默認取SVM 的核函數“RBF kernel”,取懲罰參數在[0.1,10]范圍內研究,實驗結果見表4,可以看出當C=0.9 時,系統的識別性能最優,故本文的診斷系統中懲罰因子設為0.9。

表4 SVM中懲罰因子參數對識別性能影響
5.2.4 多種方法下的故障診斷對比
為了體現文章提出的故障診斷算法的診斷優越性,采取了以下多種對比算法:1)基于深度卷積神經網絡的故障診斷,使用softmax 函數作為分類器,簡稱為“DCNN”方法。2)采用基于LSTM 的故障診斷模型,簡稱為“LSTM”方法。3)基于支持向量機的故障診斷,其中人工提取10 種故障特征包括峭度、最大值、最小值、均方根值、峰值、波峰因子、方差及變量均方根值等[22],輸入SVM 實現診斷分類,簡稱“Tezheng+SVM”方法。4)基于單層CNN神經網絡的故障診斷,簡稱為“CNN”方法。5)基于小波包和CNN 的故障診斷,簡稱為“WCNN”方法。6)基于Dropout-CNN 故障診斷,簡稱“DPCNN”方法。使用上述方法依次建立軸承故障診斷模型,分別進行20次迭代訓練,統計診斷結果如圖4。

圖4 多種不同方法的軸承故障診斷率
由圖4 可以看出,20 迭代訓練后,所有模型診斷結果都最終收斂,但文章所提方法診斷精確度有明顯的優勢,特別是針對“CNN”方法和“tezheng+SVM”方法。為了避免單次實驗的偶然性,采用以上方法分別進行10 次故障診斷實驗,得到的結果見圖5,表5。

圖5 多種方法下的10次實驗結果對比

表5 多種方法下的實驗結果
觀察表5,可以看出文章所提的方法故障診斷準確率和穩定度均最高;從時長看,“CNN”方法訓練速度最快,“LSTM”方法訓練速度最慢。最后綜合訓練結果和訓練時長得出文章提出的方法在故障診斷方面具有更多的優越性。
5.2.5 故障診斷識別
采用文章提出的基于深度學習的軸承故障智能診斷方法對軸承正常狀態、軸承內圈、軸承外圈及軸承滾動體故障共十種工況進行三次故障診斷識別。三次任意選取每種工況數據樣本20 個,10種工況共計200 個樣本,診斷結果使用混淆矩陣圖表示。如圖6~8。
圖6 為第一次軸承故障診斷結果,在200 個數據樣本的診斷中僅有一處診斷錯誤,誤將0.014 英寸的內圈故障識別為0.007 英寸的內圈故障。圖7~8 為其他兩次故障診斷結果圖,診斷識別全部正確。

圖6 第一次故障診斷結果圖

圖7 第二次故障診斷結果圖

圖8 第三次故障診斷結果圖
文章提出了基于深度學習的軸承故障智能診斷算法,創新性地結合了小波,深度卷積神經網絡,Dropout,支持向量機,利用它們在診斷識別方面的優越性建立故障診斷模型進行軸承的診斷算法研究,解決了一些診斷模型結構單一造成的診斷精度不高和診斷結果不穩定的問題,使得滾動軸承故障診斷更加智能化和高效化。