李峰, 陳皖皖, 楊義
(上海電力大學 電氣工程學院,上海 200090)
滾動軸承作為機械設備的關鍵組成,在工作過程中承擔著連接部件、承受載荷等重要作用,一旦故障將會造成嚴重的經濟損失[1]。因此,有必要研究一種軸承故障診斷方法,及時發現和診斷軸承故障狀態,提高機械設備的運行可靠性。
滾動軸承在運行過程中不可避免地會產生機械振動,這些振動包含了大量的設備狀態信息,可通過獲取振動信號的時頻特征信息實現其運行狀態的監測。目前,常用的時頻分析方法有短時傅里葉變換[2]、Wigner-Will分布[3]、小波變換[4]和S變換[5]等,其中,短時傅里葉變換時頻分辨率固定、自適應性較差,Wigner-Will分布時頻分辨率較好,但存在交叉干擾,小波變換方向性差、缺乏相位信息[6-8]。S變換則融合了短時傅里葉變換和連續小波變換的優點,具有很好的時頻分析能力,但其自適應能力有限,限制了其在實際工程的應用。而稀疏自適應S變換通過對窗函數進行二維優化[9], 可獲得更高分辨率和更強自適應性的時頻矩陣,保證了振動信號時頻特征提取的準確性。然而,時頻圖像特征維度較高,依靠傳統人工提取圖像特征并進行識別的方法難以取得很好的效果。
隨著人工智能的快速發展,深度學習方法在軸承故障診斷方面的應用得到了快速的發展。其中,卷積神經網絡(convolutional neural network,CNN)作為深度學習的重要分支,基于局部感知和權值共享機制減少網絡參數,具備自適應性好,計算成本低等特點,在高維圖像特征識別方面得到廣泛應用。深度殘差網絡(deep residual networks,ResNet)是卷積神經網絡深層結構拓展模型,解決了傳統深層網絡存在的模型性能退化的問題,具備很強的特征學習和特征表達能力[10],在圖像識別領域取得突破性進展。
針對上述問題,本文從軸承振動信號的時頻特性出發,提出了一種基于稀疏自適應S變換和深度殘差網絡的軸承故障診斷方法。首先,利用稀疏自適應S變換提取振動信號的時頻圖像特征;然后,將其輸入至深度殘差網絡中,據此建立了基于深度殘差網絡的軸承故障診斷模型。最后,以凱斯西儲大學軸承故障振動信號為例進行分析,以驗證所提方法的有效性。
S變換是基于短時傅里葉變換和小波變換基礎改進的時頻分析方法,既有多尺度分析能力,又保留了信號的相位信息。對信號x(t)的一維連續S變換定義為[11]:
(1)
式中:ω(τ-t,f)為窗函數;τ為時移參數;t為時間;f為頻率。
通常S變換的離散形式可以利用快速傅里葉變換實現,對于離散信號x(kT)(k=0,1,2,…,N-1)的S變換離散表達式為:
(2)
式中:N為采樣點數;T為采樣間隔;j、m、n的取值范圍為0,1,2,…,N。
由于S變換的時頻窗函數的窗寬隨頻率的變化而固定,在實際運用中時頻聚集性較差。稀疏自適應S變換在S變換的基礎上優化了窗口函數,自適應的對非平穩信號頻率成份的突變進行正則化處理,提高了時頻分析能力,具體計算過程為[12]:
1)對離散信號x(kT)的頻譜x(n/NT)進行平滑處理,得
(3)
2)對xζ(n)進行Min-Max歸一化處理后,計算各個頻率上最佳窗口長度,得
(4)
式中xnor(n)為xζ(n)歸一化后的值。
3)基于各個頻率窗長即可得到自適應窗,所得稀疏自適應S變換為:
(5)
式(5)在式(2)基礎上進行了窗口優化,增強了S變換時頻分析能力,同時未改變其計算復雜度,可以更好的應用于復雜信號的分析。
傳統CNN主要由輸入層、卷積層、池化層等組成[13],典型的CNN網絡結構如圖1所示。

圖1 CNN網絡結構Fig.1 Network structure of CNN
CNN的輸入為統一尺寸的圖像,經過卷積層和池化層交替作用,得到圖像的低維特征矩陣,最終由全連接層和輸出層實現分類。對輸入圖像X,經一層卷積層后特征圖Yi可表示為
Yi=f(Wi?X+bi)。
(6)
式中:Wi為第i層卷積核的權值;b為偏置;f為非線性函數;?為卷積運算符。
池化層對上層圖像特征進行約簡,減少網絡參數,提高網絡魯棒性,計算公式為
Yc=f(βdown(Yi)+bc)。
(7)
式中:β為乘性偏置;down為下采樣函數;f為非線性函數。目前常用的池化方式有最大池化和平均池化兩種。其中,最大池化更多地保留圖像特征的紋理信息,平均池化則更多的保留整體的圖像信息。
CNN的全連接層用于融合網絡所學習到的深度特征,最常使用softmax函數來實現分類任務。
在進行圖像識別任務時,CNN實現了特征提取和分類過程的統一,避免了傳統的圖像特征提取步驟。因具備局部感知和權值共享機制,CNN神經元只感受圖像的局部特征,同一特征平面上的神經元權值彼此共享,計算成本大大降低。
傳統卷積神經網絡的深度越深,網絡可以提取到的信息越豐富,其非線性表達能力越強。但隨著網絡層數的增加,存在著梯度消失或爆炸現象,會致使識別準確精度降低。深度殘差網絡在傳統網絡的基礎上增加了殘差學習模塊,如圖2所示。

圖2 殘差學習模塊Fig.2 Residual learning module
其中:x為輸入值;F(x)為殘差映射;H(x)為輸出值;Relu為激活函數。由圖2可知,殘差單元的輸出由多個卷積層級聯的輸出和恒等映射后的輸入構成,實現網絡梯度從高層次向低層次更好地傳播,從而有效地避免了模型性能退化問題[14]。
綜上,可得基于稀疏自適應S變換和深度殘差網絡的軸承故障識別流程如圖3所示。

圖3 軸承典型故障識別流程圖Fig.3 Typical fault identification flow chart of bearing
為了驗證上述所提方法的有效性,采用美國凱斯西儲大學滾動軸承振動數據集進行測試,該試驗臺由電動機、扭矩傳感器、功率測試計等器件組成。該試驗臺模擬了正常運行、內圈故障、滾子故障和外圈故障4種運行工況,故障直徑設置為7、14和21 mils。測試時,電機分別在1 797、1 772、1 750和1 730 r/min轉速下運行,并在驅動端、風扇端和基座放置了加速度傳感器,采樣頻率設置為12和24 kHz。其中,12 kHz采樣頻率、1 797 r/min轉速下正常運行和7 mils故障直徑的驅動端振動信號波形圖如圖4所示。

圖4 軸承振動信號時域波形Fig.4 Time domain waveform of bearing vibration signals
從軸承振動數據集中選取12 kHz采樣頻率,1 797 r/min轉速下驅動端振動數據構成樣本數據集,具體分布情況如表1所示。數據集由4種故障狀態及3種故障程度各100個樣本構成。

表1 數據集樣本分布Table 1 Sample distribution of data sets
限于篇幅,仍以滾動軸承驅動端正常運行和7 mils故障直徑時的各工況振動數據為例進行分析,時頻結果如圖5和圖6所示。由圖5可知,S變換方法所提取的時頻特征能量泄露嚴重,相鄰特征頻率之間存在嚴重的混疊,不能很好地區分各頻率成份信息。由圖6可知,相較于S變換,稀疏自適應S變換所提取的時頻特征能量聚集性高,故障頻率清晰,具有較高的時頻分辨率和特征表達能力。

圖5 S變換振動信號時頻圖Fig.5 S transform spectrum of vibration signal

圖6 稀疏自適應S變換振動信號時頻圖Fig.6 Adaptive sparse S transform spectrum of vibration signal
考慮到深度殘差網絡的運算成本、識別精度以及故障樣本的時頻分布特征,本文在VGG網絡結構的基礎上添加了殘差學習單元,構造了殘差網絡ResNet18網絡結構,網絡模型如圖7所示。

圖7 殘差網絡模型Fig.7 Residual network model
由圖7可知,深度殘差網絡模型共包含1個卷積層,2個池化層,1個全連接層,8個殘差塊,其中每個殘差模塊中包含兩個卷積層。同時,利用全局平均池化層替代一層全連接層,減少參數和計算量,避免了全連接層帶來的過擬合風險[15]。在每次進行卷積運算后,需要進行一次批量歸一化和非線性運算,以此加快模型的收斂速度,緩解梯度消失或爆炸的問題。
在進行診斷任務時,網絡參數的選擇對深度殘差網絡識別性能有很大的影響,如優化器、初始學習率、批大小等。因此,在進行診斷任務前需要確定如下網絡參數的最佳值。
1)優化器。
優化器用于計算和更新影響模型性能的網絡參數,使其趨近于最優值。目前,較為常用優化器有SGDM、Rmsprop和Adam,相同參數下深度殘差網絡不同優化器的迭代曲線結果如圖8所示。由圖8可知,Rmspro優化器在訓練過程中,多次出現了小范圍的震蕩,不能保證很好的收斂性。相較于SGDM優化器,Adam優化器收斂速度更快,穩定性更好。因此,優化器的選擇為Adam型。

圖8 不同優化器的殘差網絡迭代曲線Fig.8 ResNet iteration curves of different optimizers
2)初始學習率。
學習率表示了權重參數逆梯度方向上調節的步長,直接影響了模型的收斂狀態。初始學習率設置過小則會導致收斂速度慢,設置過大則會導致網絡模型無法收斂。圖9中給出了不同初始學習率下深度殘差網絡的損失值結果。由圖9可知,殘差網絡的損失值隨初始學習率的增加,呈現出先增加后下降趨勢。當初始學習率設置為10-4時,模型的損失值最小。因此,設置模型初始學習率為10-4是較為合理的。

圖9 不同學習率下殘差網絡損失值結果Fig.9 Results of residual network loss under different learning rates
3)批大小。
網絡在訓練的過程中,每次調整參數前所選取的樣本數,即為批大小,其影響著模型的訓練成本、泛化能力等。當學習率固定時,存在一個最佳批大小,最大限度地提升網絡性能[16]。殘差模型初始學習率為10-4時,默認的批大小為32,為了使模型性能最佳,設置不同批大小進行訓練所得結果如表2所示。由表2可知,在一定范圍內殘差網絡的訓練時間和損失值隨著批大小的增加而減少。當批大小為64時,訓練時間和損失值達到最小,繼續增大批大小,網絡性能反而有所效降,則初始學習率為10-4時,殘差網絡模型的最佳批大小選擇為64。

表2 不同批大小下殘差網絡結果對比Table 2 Comparisons of ResNet results under different batch sizes
綜合上述深度殘差網絡主要參數的分析結果,確定網絡使用Adam優化器,初始學習率為10-4,批大小為64,所得診斷結果如圖10所示。由圖10可知,訓練集準確率曲線在迭代16次之后,識別率基本穩定于100%,表明該訓練模型具有較高的識別性能。測試集準確率曲線隨著迭代次數的增加迅速上升并趨于穩定,最終穩定于100%。

圖10 深度殘差網絡的訓練及測試曲線Fig.10 Training and testing curves of ResNet
為了進一步說明所提方法的有效性,本節將本文方法與現有研究成果進行了對比:1)EMD-FCM方法[17],利用EMD-PWVD將振動信號轉化為輪廓時頻圖像,計算時頻圖像的能量分布特征并將其輸入至模糊C均值(fuzzy C-means, FCM)聚類算法中去完成分類任務;2)DWT-RF方法[18],使用DWT對振動信號進行分解,然后構造sigmoid熵特征向量矩陣,輸入到隨機森林(random forest,RF)算法中進行診斷;3)VMD-KFCM方法[19],將采集的振動信號通過VMD算法進行預處理,然后基于核模糊C均值聚類(Kernel-based fuzzy C-means clustering, KFCM)算法對典型故障進行分類;4)STFT-SDAE模型[20],將原始振動信號進行短時傅里葉變換得到時頻圖樣本,再將二維時頻圖像進行灰度化處理,然后提取樣本的GLCM紋理特征向量,輸入到結合堆棧去噪自編碼網絡(stacked denoising auto-encoders, SDAE)中進行學習,實現軸承故障狀態識別;5)EMD-SVM方法[21],采用改進的EMD算法對振動信號進行分解并提取能量信息特征向量,結合SVM算法實現軸承運行狀態的診斷;6)WT-DCNN模型[22],利用小波變換(wavelet transform, WT)算法構建振動信號的時頻圖像,結合可變形卷積神經網絡DCNN來實現軸承運行狀態的判別;7)S變換-SAE模型[23],通過S變換提取振動信號的時頻特征,據此構建基于稀疏自編碼網絡(sparse autoencoders,SAE)的軸承故障診斷模型;8)VMD-AlexNet模型[24],基于VMD算法和分層模糊熵算法提取出故障特征指標,應用AlexNet網絡對軸承典型故障進行識別;9)LWPT-多分類器方法[25],利用提升小波包變換(lifting wavelet packet transform,LWPT)的分解結果,提取各分量樣本熵組成特征向量,輸入至由BP神經網絡、Elman神經網絡與RBF神經網絡構建的多分類器模型中進行故障診斷;10)稀疏自適應S變換-ResNet18模型,利用稀疏自適應S變換提取振動信號的時頻圖像,結合深度殘差網絡模型實現軸承各機械運行狀態的識別。為了保證結果具有比較性,上述算法中的故障數據均來自于美國凱斯西儲大學軸承數據集,對比結果如表3所示。

表3 識別結果對比Table 3 Comparison of recognition results
由表3可知,時頻分析方法在軸承故障診斷中得到了廣泛應用。雖然一些方法在不同的運行工況下可以達到很高的識別精度,但卻未對傳統時頻分析方法中存在的難題進一步討論和解決。其中,部分識別方法中,為了提高識別精度而引入大量的協助算法,在狀態識別過程中步驟較為麻煩,程序較為繁瑣,基本喪失了普適性及推廣性。本文所提稀疏自適應S變換可以有效解決傳統時頻分析方法存在的問題,同時,引入深度殘差網絡模型執行診斷任務,具有很強的動態學習能力和泛化性能,保證了識別性能的穩定。實驗結果表明,即使在10種滾動軸承工況下進行診斷任務,該方法也能達到100%的識別準確率。
本文在軸承振動信號時頻分布特性的基礎上,提出了基于稀疏自適應S變換與深度殘差網絡的故障診斷方法,結果表明:
1)基于稀疏自適應S變換的特征提取方法能有效實現軸承振動信號的高分辨率時頻表示,避免了傳統S變換存在的時頻信息丟失問題,提高了時頻分析的準確性。
2)深度殘差網絡的優化器、初始學習率等網絡參數的確定結合了軸承振動信號的特征信息,增強了網絡的識別性能。相較于傳統的CNN模型,深度殘差網絡選用較小尺寸的卷積核,減小了模型的計算復雜度,加快了模型的訓練速度。
3)所提出的基于稀疏自適應S變換和深度殘差網絡的故障診斷模型,在不同故障狀態和故障嚴重程度的軸承振動信號的分析和識別中,體現出了良好的分類性能,實現了高效、準確的軸承機械運行狀態的識別。