陳洪明,孟威,譚力,王建景,林群煦
(五邑大學軌道交通學院,廣東江門 529020)
滾動軸承是機械設備中的一個重要組成部分,它的狀態對機械設備的安全運轉起到至關重要的作用,因此非常有必要對滾動軸承進行狀態監測與故障診斷。通常而言,軸承故障診斷主要分為以下4個步驟:1)收集振動信號;2)信號處理;3)從信號數據中提取特征;4)構建模型并進行故障診斷[1]。傳統的故障診斷方法包括經驗模式分解(Empirical Mode Decomposition, EMD)[2]、支持向量機(Support Vector Machine, SVM)[3]、信念網絡(Belief Network, BN)[4]等,這些方法應用于數據量較少的數據集時,它們通常能夠取得良好的效果。但是當它們應用于大量數據的數據集時,通常需要經驗豐富的專家提取特征用于故障診斷,耗時費力。而且,由于這些網絡模型層數較淺,難以處理大量的計算,因此往往診斷效果不佳。
針對傳統故障診斷方法存在的不足,深度學習(Deep Learning)方法被提出,深度學習具有從振動信號中自動提取特征的能力,因此使用深度神經網絡進行軸承故障診斷能夠實現端到端的故障診斷。卷積神經網絡(CNN)作為應用較為普遍的深度神經網絡,它在圖像分類和視覺識別的任務中表現卓越,由于卷積層的存在,CNN模型具有共享權值和局部連接的特點。這些特點也使CNN模型與傳統的淺層神經網絡相比,能夠更好地泛化,并且在網絡深度增加時避免過擬合。然而,雖然CNN可以有效地對軸承進行故障診斷,但是通常情況下需要長時間的模型訓練和大量的參數,因此容易導致模型的診斷效率低下。
基于上面所述,輕量化模型的概念被提出,輕量化模型能夠降低對內存的需求與提高模型效率。由于輕量化模型的網絡參數較少,因此模型的計算速度也會更快。常用的輕量化模型主要包括SqueezeNet[5]、Xception[6]、MobileNet[7]和ShuffleNet[8],這4種輕量化模型分別以不同的方法網絡參數,與傳統的模型相比,它們在處理海量數據時,計算量和網絡參數都大幅減少,因此它們的損失精度也大幅減少。
為減少模型的網絡參數并加快其運行速度,本文提出一種智能化的軸承故障診斷方法,即以軸承的一維原始振動信號作為輸入,在模型的前兩個卷積層中采用寬卷積核,寬卷積核對一維數據做卷積處理時,能夠以較少的參數獲得更大的感受野[9],感受野越大,獲得的全局性信息也就越多,因此也更加有利于學習軸承信號的特征信息,從而有利于提升模型的診斷性能。而且,對于深度網絡而言,感受野越大,特征信息也就越不容易丟失,因此采用前兩層寬卷積核的卷積神經網絡不僅能夠有效使模型輕量化,而且能夠提升模型的診斷性能。
卷積神經網絡是一種前饋的深度網絡模型,它主要包括卷積層、池化層和全連接層這三大部分。其中,卷積層的主要操作為權值共享和局部卷積,池化層的主要操作為下采樣降低特征維度,而全連接則是起到“分類器”的作用。CNN模型的原理如圖1所示。首先,卷積層通過權值共享的方式對輸入數據做局部卷積處理操作,然后將卷積得到的特征圖輸入池化層中,經過幾次反復的卷積-池化后得到特征圖作為全連接層的輸入,特征圖經過展平處理后全連接輸入全連接層,最后在全連接層中由Softmax函數分類輸入分類結果。

圖1 CNN的工作原理
寬卷積核在提取特征時,旨在以較少的參數獲得較大的感受野。感受野的定義是特征圖上的一個像素點所對應到輸入圖上的區域。由于本文以一維振動信號作為輸入,因此下面將介紹一維卷積運算過程的工作原理。以寬度為3的卷積核為例介紹卷積運算過程,如圖2所示,前兩層的卷積核寬度均為3,那么第二個特征圖上的像素點對應到輸入上的感受野是5,即兩個卷積核的參數量為(3+3=6)得到的感受野大小為5。但是如果第一個卷積核的寬度為5,那么在第一個特征圖上的一個像素點對應到輸入上的感受野也是5,那么這個卷積過程是以5個參數也是獲得5個感受野。以此類推,加大卷積核寬度,能夠以較少的參數獲得較大的感受野,大幅減少網絡的連接參數,有助于抑制模型過擬合,實現輕量化。同時,一維卷積運算的原理為



圖2 一維卷積運算過程

1D-TWCNN模型的結構與結構參數如圖3所示,圖中的括號中的數字代表對應層級結構參數,如卷積層中的(64, 32, 2)分別代表(卷積核數量,卷積核寬度,步長),而池化層中的(2, 1)則代表(池化窗口大小,步長)。在1DTWCNN模型提取特征的前饋傳播過程中,首先,第一層寬核卷積層對輸入信號做卷積處理,提取出輸入信號的泛化特征,接著由最大池化層對泛化特征進行下采樣操作降維,提取出泛化特征中更具有代表性的特征。然后,經過兩次“寬核卷積-池化”后,輸出的泛化特征輸入卷積核尺寸為3的卷積層中,這是因為經過兩層寬核卷積后,模型學習到了輸入信號的全局特征,為保證模型提取到特征的多樣性,還有學習到更多的局部細節信息,在寬卷積核之后采用小的卷積核去做卷積處理。最后,經過4次“卷積-池化”后,提取出的特征經過批標準化就進行展平,輸入全連接層進行分類輸出結果。

圖3 1D-TWCNN模型結構
經過模型的前饋傳播后輸出分類期望結果,通過損失函數與目標結果對比后,得到損失值并進行反向傳播,不斷地調整模型的權重參數,直到損失值降到最小。
在本節的實驗驗證中,采用的數據集來自美國凱斯西儲大學(Case Western Reserve University, CWRU)軸承數據中心[10],該數據集被視為世界上驗證軸承方法的權威數據集之一。產生軸承數據的試驗臺如圖4所示,主要由一個2馬力(hp)的電動機、一個轉矩傳感器,一個功率測試計和電子控制器構成。在試驗臺上,采用型號為SKF6205的深溝球軸承作為加工對象,且由電火花加工的單點損傷作為軸承故障損傷,損傷的位置主要包括內圈、外圈和球體,其中外圈故障又分為3點鐘、6點鐘和12點鐘3個位置的損傷,且6點鐘位置的損傷最為常用。在本節的實驗中,還有采樣頻率為12 kHz,電動機載荷為3 hp,電動機主軸轉速為1730 r/min,來自驅動端(DE)的軸承數據。實驗中采取了10種故障類型的軸承數據來進行驗證,它們的具體信息如表1所示。實驗數據分為訓練集和驗證集,訓練集和驗證集的樣本個數分別有1500個(包含10種故障類型樣本,每種故障類型的樣本數量為150)。

圖4 CWRU數據集的試驗臺

表1 實驗數據集的具體信息
做滾動軸承故障診斷時,為驗證基于1D-TWCNN模型相對于基于其他輕量化模型做故障診斷的優越性,本文將輕量級模型MobileNetV3(7BN)和ShuffleNetV2作為1D-TWCNN模型的對照模型。其中,1D-TWCNN模型以軸承的一維的原始振動信號作為輸入,實現端到端的軸承故障診斷,而MobileNetV3(6BN)模型和ShuffleNetV2模型則是以二維的連續小波變換(Continuous Wavelet Transform, CWT)時頻圖作為輸入,實現端到端的軸承故障診斷(CWT時頻圖是由軸承的一維振動信號通過CWT函數變換而來)[11]。而且,MobileNetV3(6BN)模型是由MobileNetV3(Small)模型改進而來,MobileNetV3(Small)模型中包含11個瓶頸(BottleNeck)結構,由于本文采用二維CWT時頻圖的尺寸為32×32,包含的數據量不大,為避免MobileNetV3(Small)模型處理本文實驗數據時相對過于復雜,使模型過擬合而導致性能下降,本文將MobileNetV3(Small)模型中的11個瓶頸結構改為6個瓶頸結構的MobileNetV3(6BN)模型,且在處理本文實驗數據時,它的性能不降反升。還有ShuffleNetV2模型是由經典的輕量化模型ShufflenetV1的基礎上改進而來。
在實驗中,將損失函數設置為交叉熵函數,優化器設置為Adam,訓練批次設置為10,訓練的迭代次數設為50個epochs。而且在模型的訓練過程中,采用自適應學習率,它可根據模型收斂快慢自主調整增大或減少,初始學習率設為0.0001。
模型的大小一般由參數量(parameter)來衡量,模型的總參數量越大,說明模型所需的內存存儲空間也就越大,且模型的可訓練參數越多,說明所需的計算量越大,那么運行時間也就越久。如表2所示,在3種輕量化模型中,1D-TWCNN模型的總參數為82 026個,可訓練參數為81 962個,兩者在3種模型中不僅都是最小值,而且還分別遠遠小于其他2種模型中的總參數個數和可訓練參數個數。這充分說明了1D-TWCNN模型比MobileNetV3(6BN)模型和ShuffleNetV2模型占用的內存更小,且運行速度更快。也就是說1D-TWCNN模型比MobileNetV3(6BN)模型和ShuffleNetV2模型更加輕量化。

表2 模型的參數比較
在滾動軸承故障診斷中,通常以 診 斷 精 度(Accuracy)和函數損失(Loss)值這兩項指標作為診斷方法的評價指標,診斷精度越高,說明模型對故障類型的分類更加準確,函數的損失值越低,說明模型輸出的期望結果與目標結果的差距越小,模型的性能也就更好。如圖5所示,3種輕量化模型在訓練過程當中的驗證精度變化分別由3種不同特征的曲線表示,可以明顯看出,代表1DTWCNN模型的曲線不僅在充分迭代后驗證精度最高,達到100%,而且它的收斂速度最快,僅在模型訓練迭代達到6個epoch后就基本收斂。然而,對于MobileNetV3(6BN)模型,它的收斂速度不僅落后于1D-TWCNN模型,而且它在充分迭代后所達到的驗證精度也不高,僅有96.5%左右。還有,對于ShuffleNetV2模型,雖然充分迭代后它的驗證精度能夠達到99.4%左右,與1D-TWCNN模型的驗證精度非常接近,但是它的收斂速度在3種輕量化模型中最慢。之所以發生上述現象,究其原因發現,與其他模型相比,1D-TWCNN模型的參數更少,它的運行速度也就更快,因此收斂速度也就更快。而且由于1D-TWCNN模型的擬合程度更好,得到的驗證精度也就越高。所以,我們可以得出結論,1D-TWCNN模型不僅更加輕量化,而且它的性能也更好。

圖5 3 種輕量化模型的驗證精度
同樣,如圖6 所示,在3種輕量化模型中,可以清楚地發現,與其他模型相比,代表1D -TWCNN 模型驗證損失值的曲線最接近于底線,幾乎等于0。而且,它的收斂速度比其他2種輕量化模型的收斂速度快。上述現象也充分說明了在3種輕量化模型中,通過充分訓練迭代后,1D-TWCNN 模型能夠輸出與目標結果相差無幾的期望值,而且所需的充分訓練迭代時間更短。換句話說,與其他優秀的輕量化模型相比 ,1D -TWCNN 模型做軸承故障診斷時的速度更快、精度更高。

圖6 3 種輕量化模型的驗證損失值
本文提出一種新型的輕量化神經網絡模型(1D-TWCNN),可用于滾動軸承的故障診斷。該模型針對軸承原始振動信號具有一維時序性的特點,在模型的前兩個卷積層上使用寬卷積核,由于模型在處理軸承信號的過程中,寬卷積核不僅能夠抑制高頻噪聲干擾,而且還能夠以較少的參數獲得更大的感受野,因此,與其他輕量化模型相比,1D-TWCNN模型不僅占用內存更少(總參數更少),而且診斷性能更高。因此,針對于滾動軸承的故障診斷,1D-TWCNN模型在輕量化方面取得了一定的進步。