張智恒,周鳳星,嚴保康,喻尚
(武漢科技大學 信息科學與工程學院,武漢 430081)
滾動軸承被稱為“工業的關節”,在旋轉機械中廣泛應用。由于長期處于工作狀態且工作環境惡劣等原因,導致軸承成為易損壞的關鍵部件[1-2]。
在機械設備的大型化和自動化趨勢下,設備故障可能導致巨大的經濟損失甚至一系列災難性的后果。因此,提高機械設備的故障診斷能力將是工業未來發展的重要方向。
基于振動信號的滾動軸承故障診斷技術主要可以分為信號采集、特征提取、特征選擇和故障識別4個步驟[3]。其中,故障的特征提取是決定能否準確判斷滾動軸承故障類別的關鍵步驟。常見的特征提取方法有快速傅里葉變換、小波變換、奇異值分解、共振解調、經驗模態分解、局部均值分解等,同時越來越多的現代信號處理方法也不斷應用于滾動軸承的故障診斷。文獻[4]將局部特征尺度分解與奇異值差分譜相結合,并通過試驗表明該方法能夠準確、快速地提取出滾動軸承的故障特征。文獻[5]針對滾動軸承原始振動信號信噪比小等問題,提出了一種基于局部均值分解和共振解調的滾動軸承故障診斷方法,最終成功提取到了故障特征頻率。文獻[6]提出了一種基于小波包與倒頻譜結合的滾動軸承故障診斷方法,也獲得了較好的特征提取性能。以上方法都具備較好的故障特征提取能力,但在診斷過程中均需要大量的先驗知識以及信號處理知識,而且需要人工調節參數,增加了分析的難度以及診斷結果的不確定性。
深度學習作為深層網絡,可以對原始信號進行逐層特征變換,將樣本在原空間的特征表示變換到新的特征空間,自動學習得到層次化的特征表示,從而更有利于分類或特征的可視化。稀疏降噪自編碼器(Sparse Denoising Auto-Encoder,SDAE)是一種典型的深度學習模型,能夠很好地建立從底層信號到高層語義的映射關系[7],且具備較強的魯棒性和泛化性,已被廣泛應用于滾動軸承的故障診斷。如文獻[8]在自編碼器中加入稀疏限制和損傷噪聲,在滾動軸承故障診斷中取得了較好的效果;文獻[9]采用粒子群算法訓練SDAE網絡,實現編碼器網絡參數的自適應選取,并通過試驗證明了該方法在滾動軸承故障診斷中具備很好的泛化性和故障識別率;文獻[10]采用深度卷積網絡和SDAE分別對多個傳感器信號進行處理并將結果輸入D-S證據理論進行信息融合,最終的診斷結果表明該方法在一定程度上降低了單一傳感器的信息不全面性和單一模型的不確定性,提高了對滾動軸承的故障診斷能力。以上研究表明,基于SDAE的滾動軸承故障診斷方法具備良好的診斷效果。
然而,為了加強SDAE算法的性能,通常會對信號進行多次加噪處理以獲取更多的訓練樣本,但是隨著加噪次數的增加,計算復雜度和訓練時間也都隨之增加。為解決這個問題,文獻[11]于2012年提出了邊緣化降噪自編碼器(Marginalized Denoising Auto-Encoder,MDAE),該算法采用泰勒展開式近似表示平均損失函數,從而降低了計算的復雜度。相比于降噪自編碼器具備更快的收斂速度以及更好的診斷效果。受MDAE算法的啟發,對堆疊稀疏降噪自編碼器(Stacked Sparse Denoising Auto-Encoder,SSDAE)進行優化,提出了一種基于堆疊邊緣化稀疏降噪自編碼器(Stacked Marginalized Sparse Denoising Auto-Encoder,SMSDAE)的滾動軸承故障診斷方法,以實現噪聲環境下滾動軸承故障信號更精準、更快速的智能診斷。
自編碼器(Auto-Encoder,AE)是具有一級隱含層的神經網絡,思路是讓輸出盡可能等于輸入,讓編碼器自主的提取輸入數據的特征。其網絡結構如圖1所示。假設輸入樣本集為{x1,x2,…,xm},首先使用編碼函數f提取訓練樣本xn的特征表達h,隨后由解碼函數g將特征表達h映射為輸出y,最后用損失函數J(W,b)表示輸入輸出的相似度。

圖1 自編碼器網絡結構圖
編碼過程函數為
h=f(x)=sg(Wx+b),
(1)
解碼過程函數為
y=g(h)=sf(W′h+b′),
(2)
損失函數為
(3)
式中:sg,sf均為非線性函數,一般選擇sigmoid函數;θ為編碼網絡的參數矩陣{W,b};nl為網絡層數;sl為第l層的單元數目;m為樣本個數;λ為權重衰減系數,其作用為減少權重幅值,防止過擬合。
由于自編碼器提取的特征并不能簡明表達輸入層數據,于是文獻[12]提出了稀疏自編碼器(Spare Auto-Encoder,SAE),其采用向損失函數添加稀疏懲罰性的方法實現了對數據特征的稀疏提取,提高了特征提取的效率,增強了自編碼器的性能。

(4)

(5)
則增加懲罰因子后,進行稀疏性限制的稀疏自編碼器的損失函數表示為
(6)
式中:β為稀疏性限制條件的權重系數。
降噪自編碼器[13](Denoising Auto-Encoder,DAE)在AE的基礎上,為防止過擬合問題而對輸入數據加入噪聲,使編碼器學習到的特征表達具備較強的魯棒性,從而增強模型的泛化能力。


圖2 DAE算法流程圖
(7)
DAE算法的實現方法主要分為2種:一種是在數據中加入高斯白噪聲,另一種則是按設定的概率隨機置零輸入的數據,即讓原始數據部分丟失。為使編碼器同時具備魯棒性和稀疏性,在DAE算法的損失函數中添加稀疏限制條件即可得到SDAE,其損失函數表示為
(8)
SDAE已經具備了較強的特征提取能力及魯棒性,但仍屬于一個淺層網絡,并不能提取深層次的數據特征信息,因此采用逐層貪婪訓練策略[14]將多個SDAE逐層疊加構成堆疊稀疏降噪自編碼器,從而實現對數據深層次特征的挖掘。
SSDAE既具備了SAE的稀疏性,又具備了DAE對噪聲干擾的魯棒性,因此擁有較好的診斷性能。然而,作為一種深層神經網絡結構,需要逐層進行訓練,存在計算量巨大、訓練速度慢等缺點。針對以上問題,基于MDAE收斂速度快的特性對SSDAE的損失函數進行邊緣化處理,并結合逐層貪婪策略得到了SMSDAE,實現對算法的優化改進。

(9)
受到文獻[15]的啟發,采用極限的思想,令m→∞,對(9)式求取平均損失函數可得
(10)
(11)

對(11)式兩端求期望可得
(12)

(13)

(14)
(15)
結合以上公式可知MSDAE的損失函數為
(16)



表1 干擾分布及其均值和方差

表2 不同損失函數及其相關導數
在本文中,MSDAE算法采用加入高斯白噪聲的方法實現數據的加噪,選取平方誤差作為重構誤差函數,根據表1和表2以及(16)式,可推導出MSDAE的損失函數公式為

(17)
式中:γ為邊緣限制條件的權重系數。

SMSDAE由多個MSDAE堆疊而成,將其最后的輸出層與Softmax分類器相連接就能構成一個完整的深度學習模型。作為一種監督方式,Softmax分類器為SMSDAE的訓練提供了類別信息,有效地優化了網絡參數,增強了網絡的特征提取能力,這一優化過程通常被稱作微調。
基于SMSDAE-Softmax的特征提取過程由3個部分構成:預學習、微調以及特征提取。
2.2.1 預學習
采用逐層貪婪訓練策略,依次訓練SMSDAE網絡的每一層,訓練完成后再將各層首尾相連,形成所有權值已初始化的SMSDAE網絡。
2.2.2 微調
預學習完成后,將Softmax分類器添加到SMSDAE網絡的最后一層,然后輸入帶標簽的信號,利用信號標簽通過反向傳播算法對整個網絡進行訓練,微調網絡權值,使其具備更強的特征提取能力。
2.2.3 特征提取
完成微調后,去掉Softmax層,將剩余的SMSDAE網絡作為特征提取網絡,輸入信號即可提取特征。
基于SMSDAE網絡的故障診斷流程具有以下4個步驟:
1)數據的預處理。首先采集滾動軸承不同故障的振動信號,然后運用(18)式對信號進行量綱一化處理,提高信號的泛化能力,最后將信號按一定比例分為訓練集和樣本集,并做好標簽。
(18)
2)根據試驗經驗設置網絡的各項參數,如各層神經元個數、迭代次數、稀疏懲罰項參數、邊緣限制參數等。
3)特征提取模型的訓練。將訓練集作為SMSDAE-Softmax模型的輸入,完成網絡的訓練。
4)診斷率準確率的計算。將測試集輸入到訓練完成的SMSDAE網絡中,實現測試集信號的特征提取。再將提取到的特征輸入到SVM多分類器中,得到算法的故障準確率。
為驗證基于邊緣化堆疊稀疏降噪自編碼器實現的深度神經網絡對滾動軸承故障信號的診斷效果,采用故障診斷試驗平臺(圖3)采集到的滾動軸承信號作為分析對象,該平臺由底座、變速驅動電動機、齒輪箱、軸承、調速器、偏重轉盤等結構組成。

圖3 故障診斷試驗平臺
振動信號來源于QPZZ-Ⅱ旋轉機械振動故障試驗臺,試驗軸承為N205EM型圓柱滾子軸承,滾子組節圓直徑為39.5 mm,滾子直徑為7.5 mm,滾子個數為12。在內、外圈滾道及滾子滾動面上切割寬0.2 mm、深0.2 mm的凹槽模擬軸承故障。采用IMI M626B03型加速度傳感器進行信號采集,采樣頻率為20 kHz,采樣點數為65 536,故障軸承轉速為900 r/min。
從各段信號第1個數據點開始,每隔20個數據點作為一個樣本采集起始點,采集連續的500個數據點作為一個樣本,每種狀態各采集2 000個樣本作為訓練集。測試集數據選取的范圍在訓練集采集結束后0.5 s之后的區間內,每種狀態隨機選取200個數據點作為采集起點,采集連續的500個數據點作為測試集。
在訓練過程中,網絡參數的細微變化都會對網絡性能產生巨大的影響。經過多次試驗調整,最終設定隱藏層個數為3,網絡各層神經元個數為500-250-150-50-4,邊緣化權重系數λ為0.000 1,稀疏性權重系數β為0.01,稀疏性參數ρ為0.1。
為驗證SMSDAE網絡的特征提取能力,分別采用SMSDAE和SSDAE進行故障信號的特征提取,結果如圖4所示。對比可知,SMSDAE模型與SSDAE模型相比具備以下3個優點:

圖4 SSDAE和SMSDAE各層的訓練迭代誤差曲線
1)收斂速度更快。達到相同的重構誤差時的迭代次數更少,表明SMSDAE模型具備更快的收斂速度,能夠有效降低程序計算的復雜度。
2)運行時間更短。在相同的迭代次數下,需要更短的運行時間,表明SMSDAE模型減少了調節參數所需的時間,能夠降低訓練參數的難度。
3)重構誤差更小。在迭代完成時,具備更小的重構誤差,表明SMSDAE模型能夠更好地實現信號的特征提取,保留了更完備的原始特征。
為驗證SMSDAE算法的診斷性能,選擇與SMSDAE相同網絡結構的SSDAE和堆疊邊緣化降噪自編碼器(SMDAE)進行對比試驗,結果見表3。由表可知,3種算法均取得了較好的診斷效果,平均準確率均達到了99%以上。其中,SMSDAE算法的平均準確率高達99.88%,高于其他算法。與SMDAE相比,SMSDAE算法考慮了對輸入信號的稀疏性限制,因此具備更好的分類效果。與SSDAE相比,SMSDAE算法的損失函數中含有高階特性,擁有更好的特征提取能力,因此具有更好的診斷效果。對比試驗結果表明,本文提出的改進方法有效提升了算法的分類性能。

表3 診斷準確率對比
為驗證SMSDAE算法的降噪性能,選取SSAE算法作為對比模型,通過向原始訓練集中加入不同信噪比的高斯白噪聲模擬實際生產過程中環境的干擾。訓練集數據描述見表4。

表4 訓練集數據描述
分別將訓練集1,2,3輸入到本文模型和對比模型中進行訓練,并用測試集分別計算出各訓練集的診斷率,為避免試驗結果的隨機性,采用10次連續試驗結果的平均值,診斷結果見表5。由表可知,在原始數據集下,SMSDAE與SSAE算法都獲取了較高的平均故障診斷準確率。但是隨著噪聲的加入,SSAE算法的故障診斷準確率顯著下降,當輸入噪聲的信噪比達到10 dB時,SSAE算法的平均故障診斷準確率降到了90.31%,顯然無法滿足實際生產中的診斷需求,而SMSDAE算法的故障診斷準確率仍然達到了96.34%,說明SMSDAE算法的魯棒性較好,在噪聲環境中也能取得較好的特征提取效果。

表5 不同模型診斷結果
為驗證改進算法在面對不同軸承信號時的普適性以及面對多種故障類型時的診斷性能,將美國西儲大學軸承數據中心0負載條件下的10種軸承故障信號作為研究對象,振動信號來源于型號為SKF6205的驅動端軸承,采樣頻率為12 kHz,采用電火花分別在軸承的內、外圈溝道以及鋼球上分別加工了直徑為0.178,0.356,0.533 mm的凹槽來模擬軸承在運行過程中形成的不同損傷程度。
經過多次試驗調試,最終對網絡參數進行如下設置:隱藏層個數為3,網絡各層神經元個數為1024-512-512-256-10,邊緣化權重系數λ為0.000 3,稀疏性權重系數β為0.008,稀疏性參數ρ為0.05,訓練集數量為2 500,測試集數量為200。其中訓練集與測試集的制作過程參見3.1節所述內容,數據集詳細信息見表6。

表6 軸承故障狀態
最近一次得到的測試集分類混淆矩陣如圖5所示,圖中對角線展示了各類型信號的具體預測結果。由圖5可知,SMSDAE算法對每一類信號的故障診斷率都達到了95%以上,整個測試集的平均分類準確率達到了98.5%,在驗證SMSDAE算法普適性的同時也證明了其在面對多種故障時也具備較好的分類性能。

圖5 分類混淆矩陣
提出了一種基于堆疊邊緣化稀疏降噪自編碼器的滾動軸承故障診斷方法,該算法對SSDAE的損失函數進行邊緣化處理,既具備了SSAE的稀疏限制特性,又結合了MDAE收斂快速的特性,因此擁有更好的診斷性能。對比試驗表明,提出的SMSDAE算法具備更快的收斂速度,更好的特征提取能力,更佳的魯棒性,以及更高的診斷精度。而普適性試驗結果表明,SMSDAE算法在面對不同類型的軸承故障以及多種故障信號時,也展現了良好的分類性能,具有一定的普適性。