康 濤,王 書,陳志剛,劉 菲,景騰飛
(1.北京航天萬源科技有限公司,北京 100176;2.北京航天拓撲高科技有限責任公司,北京 100176)
旋轉機械設備廣泛應用在航天、交通、工業制造和風力發電等重要工程領域[1],其在重大工程中扮演著不可或缺的角色,設備發生故障或者停機可能造成嚴重后果。旋轉機械設備中滾動軸承是其非常重要的零部件[2],同時滾動軸承在惡劣工況下容易出現磨損、裂紋、斷裂等故障[3]。因此,采用故障診斷技術對滾動軸承狀態的準確識別,可以有效防止軸承故障引起的意外事故。傳統的故障診斷技術有:自回歸滑動平均模型(Autoregressive moving average model,ARMA)[4]、變分模態分解(Variational Mode Decomposition,VMD)[5]、小波分析[6]、概率神經網絡(Probabilistic Neural Network,PNN)[7]等得到了廣泛的應用。隨著大數據時代的到來,利用海量數據驅動軸承故障診斷算法成為近些年的研究熱點。其中基于深度學習算法的軸承故障診斷成為現階段的主流。主要手段如下:首先人為處理原始信號,然后將信號輸入到深度學習算法中,再通過分類器對故障識別。
然而上述介紹的故障診斷方法將故障診斷分割為信號預處理、特征提取、故障分類三個孤立的部分,無法將各個部分形成有效的耦合關系,可能導致在數據傳遞的過程中出現故障特征損失的情況發生。針對此問題,提出一種端到端的滾動軸承故障診斷模型,將三個步驟直接整合到一個模型中,直接將原始振動信號輸入模型中,經過模型計算、算法處理后得到軸承故障類型。提出了一種基于一維卷積神經網絡的滾動軸承故障診斷模型。利用一維卷積神經網絡強大的特征提取能力,對原始信號提取特征。然后將提取的特征輸入到全連接,通過全連接層對特征分類得到故障識別。同時考慮到一維信號的特點,設計了大卷積核的診斷模型。減少了數據傳遞過程中故障特征損失。
卷積神經網絡(Convolution Neural Networks,CNN)是共享權重、局部特征提取、特征池化的多層神經網絡[8]。其中共享權重可以使其泛化能力增強,局部特征提取使卷積神經網絡訓練速度得到了很大提高,特征池化降低特征維度放大特征明顯區域。卷積神經網絡主要由前向傳播算法和反向傳播算法相結合,前向傳播算法用于接收輸入數據直至輸出產生誤差,反向傳播算法是將減少輸出層的誤差并同時更新權重。
卷積神經網絡根據輸入類型不同,可以將其分為一維(1D)和二維(2D)卷積神經網絡。本文采用一維卷積神經網絡對原始一維振動信號處理,其中1D-CNN 包括隱含層、輸出層及輸入層,而隱含層包含一維卷積層(Convolutional Layers)、激活函數層(Activation Layers)以及池化層(Pooling Layers)等,隱含層主要用于接收輸入層的輸出并完成對數據特征的提取。
為驗證本文提出方法的有效性,試驗選用來自美國凱斯西儲大學的軸承數據集[9]。滾動軸承運行狀態可以分成四種分別為:健康、內圈故障、外圈故障和滾珠故障,正常狀態時域如圖1 所示,內圈故障時域如圖2 所示,外圈故障如圖3 所示,滾珠故障如圖4 所示,根據圖片很難分辨出故障類型。每種故障狀態包含三種故障尺寸:小(0.18 mm)、中(0.36 mm)和大(0.54 mm)。根據上述介紹軸承狀態共有10 種情況。

圖1 正常狀態

圖2 內圈故障

圖3 外圈故障

圖4 滾珠故障
提升模型對樣本的泛化效果,試驗采取重疊采樣的操作對數據集進行增強,實現模型魯棒性的提升。重疊采樣如圖5 所示。數據集具體信息見表1。

表1 數據集信息

圖5 重疊采樣
為了使1D-CNN 診斷模型具有效果更佳的診斷效果,需對其模型結構進行設計。常見的二維卷積神經網絡,比如ResNet[10]和VGGnet[11]采用堆疊式的3×3的卷積核,可以實現少參數大感受野的效果,從而防止過擬合現象。但是對于一維振動信號采用堆疊式3×1的卷積結構,以6 個權值為代價,只得到5×1的感受野,反而將上述優勢變成了劣勢。因此根據一維振動信號的特點,將1D-CNN 診斷模型的第一層設計為大卷積核,其作用提取短時特征。其余的卷積層為3×1的小卷積核,減少模型參數防止過擬合現象。
為了選擇合適的第一層卷積核的參數,通過對比實驗進行比較分析,設計三種1D-CNN 診斷模型。這三種模型的第一層卷積核分別為32×1、64×1、128×1,每個模型共有4 層卷積核池化層,除了第一層外,剩下的卷積核均為3×1,全連接層為10 個輸出對應著軸承的10 種狀態。模型對比實驗結果見表2。

表2 模型對比實驗
由表2 可以看出,隨著卷積核尺寸的增加,模型在測試集中的準確率隨之提高,當卷積核尺寸由32 增加到64 時,準確率由96.01%提升到99.33%,提高了3.46%,計算時間變化不大,當卷積核尺寸由64 增加到128 時,準確率提升不多,僅提升0.44%,但由于計算參數的增加,計算所消耗的時間增加了0.02 s,對網絡準確率提升不高,卻造成了比較多的資源消耗,因此選擇64×1 作為第一層卷積核的尺寸。具體診斷網絡模型參數見表3。

表3 故障診斷網絡參數
使用上述數據集,對比所確立的模型進行訓練。訓練過程中,全連接層使用Dropout 防止過擬合問題,Dropout 比率設置為0.2,Adam 算法的學習率為0.001。為了保證模型的可靠性,在訓練工程中,每個數據集迭代60 次。為了直觀地觀察模型對每種故障的識別情況,采用混淆矩陣表示實驗結果如圖6 所示,圖中行表示實際分類,列表示預測分類。其中在混淆矩陣中,0~9 分別代表不同的類別,具體混淆矩陣標識說明見表4。

表4 混淆矩陣標識說明

圖6 故障診斷混淆矩陣
根據混淆矩陣圖可以看出,所提出的基于1D-CNN的故障診斷網絡,在美國凱斯西儲大學數據集中所進行的實驗,在同故障尺寸之間容易發生混淆,例如對于故障尺寸為0.36 mm 中內圈故障(標識4)和外圈故障(標識6)發生混淆。雖然發生了混淆,但是每種故障識別準確率都高于97%。并且模型的類間平均準確率為99.33%,可以滿足對軸承故障的準確識別。
提出了一種基于一維卷積神經網絡的端到端軸承故障診斷模型,直接將原始信號輸入,減少了數據傳遞中特征損失。針對一維原始振動信號特點,在CNN 設計方法的基礎上,設計了三種第一層大卷積核模型,通過實驗數據集測試,確定了一種最優的CNN 網絡模型。通過實驗美國凱斯西儲大學數據集驗證,所提模型的類間平均準確率為99.33%,測試時間為0.03 s。實現了快速識別高準確率的診斷性能,證明了所提出方法的可行性,具有較好的技術應用前景。