趙志宏, 趙敬嬌, 魏子洋
(1.石家莊鐵道大學 信息科學與技術學院,石家莊 050043;2.石家莊鐵道大學 省部共建交通工程結構力學行為與系統安全國家重點實驗室,石家莊 050043)
滾動軸承作為機械基礎器件在高速動車組、飛機等現代設施,以及風力發電機組、空氣壓縮機、燃氣輪機等大型設備都不可或缺。由于長時間工作在惡劣、復雜的環境中,滾動軸承極易發生故障,為保證機械設備正常運行,對滾動軸承進行故障診斷十分必要[1]。滾動軸承的故障診斷包括兩部分:確定故障部位的定性診斷,確定損壞程度的定量診斷[2]。故障位置的定性診斷可以及時對故障部位進行單獨的維護和維修,避免整個機械設備受損;損壞程度的定量診斷可以了解軸承的使用情況,在損壞前及時更換,減少損失,避免機械出現事故。
目前眾多滾動軸承故障診斷方法中,基于振動信號分析技術的故障診斷方法是使用最多的。滾動軸承故障識別方法一般由特征提取和狀態識別[3]兩部分組成。傳統滾動軸承故障診斷方法主要是從原始輸入信號中提取出如峰值、峭度、峰值因子等時域特征、頻域特征、時頻域特征[4-5],再結合模式識別的方法進行診斷。在傳統故障識別方法方面,國內外已經有許多研究成果。徐濤等[6]根據諧波小波包技術分解振動信號數據得到特征能量,利用多類SVM識別故障類型。孟宗等[7]用局部均值分解(LMD)分解故障信號,得到瞬間能量作為故障特征輸入,隱馬爾科夫模型(HMM)作為分類器進行模式識別。趙志宏等[8]根據EEMD原理,提出將EEMD分解振動信號得到的樣本熵作為特征輸入,再用SVM識別故障類別。Ocak等[9]用小波包分解技術從正常和故障軸承的振振動信號中提取選定節點能量作為特征,用HMM分類器識別故障類型。Qu等[10]利用雙樹復小波包變換得到不同頻帶分量,將分量能量歸一化后作為特征輸入,用多分類器識別故障類型。
軸承數據每時每刻都在不斷增加,形成了龐大的數據,由于傳統滾動軸承故障診斷需要人工提取特征向量,依靠專業技術人員手動分析并不現實。深度學習模擬人腦學習的過程,通過構建深層次的模型,能夠對輸入逐層認知、抽象,進行表征學習,挖掘深層次的內在規律[11-12],利用訓練數據不斷學習其內在特征,最終得到一個好分類結果。
深度學習的方法既可以用于特征提取,也可以用于模式識別。趙春華等[13]選用降噪自編碼器提取信號特征,以WOA-SVM為分類器進行故障診斷。廖寧等[14]先提取瞬時能量作為特征輸入,再利用深度置信網絡進行分類,實現了滾動軸承故障的診斷。已有研究表明,利用采集的滾動軸承的加速度的幅值作為學習樣本,通過神經網絡進行特征自提取以及模式識別,可以建立一個有效的端到端的智能滾動軸承故障模型。
用于軸承故障診斷的深度學習神經網絡有卷積神經網絡、自編碼器、循環神經網絡等。卷積神經網絡在處理圖像方面具有一定的優越性,但對于軸承的時域振動信號的處理的表現并不突出;淺層自編碼器特征提取能力有限,無法很好地表征特征;循環神經網絡具有記憶性,在時序數據處理方面更有優勢。長短期記憶網絡[15](LSTM)是循環神經網絡的一種,在故障診斷方面取得了較好的成果。王鑫等[16]提出了一種基于LSTM的故障時間序列預測方法,省去了人工特征提取的環節,證明其在故障診斷方面的可行性。陳偉[17]提出了一種RS-LSTM的軸承故障診斷方法,取得了優異的診斷精確度。Graves等[18]將BiLSTM模型應用于分類問題,證明在分類問題方面BiLSTM神經網絡的效果更好。Zhao等[19]將CNN和BiLSTM結合,提出了一種預測刀具磨損情況的CBLSTM模型,利用CNN提取局部特征,然后用BiLSTM對時間信息進行編碼,實驗結果表明該模型優于當前的RNN、LSTM等方法。葛瑞等[20]利用BiLSTM提取時空特征的優越性,將其應用到視頻行為識別中。本文設計并實現了一種基于BiLSTM神經網絡的滾動軸承故障診斷模型,并與其它方法進行了比較,實驗結果表明該模型在滾動軸承故障診斷具有一定的優越性。
長短期記憶網絡是循環神經網絡的改進模型,具有循環神經網絡的可記憶性優點,能夠高效地學習時間序列的非線性特征。并且,由于LSTM的內部結構中隱層節點激活方式非常復雜,通過有選擇的記憶,遺忘作用小的信息,記住時間間隔較大處的有用信息,解決了長時間序列的梯度消失和梯度爆炸[21]的問題。LSTM的記憶單元由輸入門、輸出門和遺忘門三個門結構組成,其網絡結構如圖1所示。這些門保證了信息能夠有選擇的通過,而傳輸單元的狀態僅僅由一些線性運算得到,從而保證了信息在傳輸時的不變性。通過有選擇的記憶信息,能夠保證有效利用樣本數據中的大部分信息,學習其深層特征,進而進行故障診斷。

圖1 LSTM的網絡結構
在LSTM中,樣本數據會經歷以下三步:經過遺忘門,決定哪些信息需要保留,哪些信息需要遺忘;經過輸入門,實現細胞狀態的更新以及確定更新的信息;經過輸出門,得到輸出信息。
當前樣本輸入xt與上一序列輸出ht-1共同確定細胞狀態Ct-1中的哪些信息需要被記憶下來。
ft=σ(Wf·(ht-1,xt)+bf)
(1)
式中:σ為sigmoid激活函數;Wf為權重;bf為偏置。Ct-1表示細胞狀態,用來保存前一時刻記憶信息,ft表示遺忘門對細胞狀態的遺忘程度。通過輸入門決定需要加入到細胞狀態的新信息,并且更新細胞狀態。
it=σ(Wi·(ht-1,xt)+bc)
(2)

(3)

(4)

ot=σ(Wo·(ht-1,xt)+bo)
(5)
ht=ot·tanh(Ct)
(6)
式中:ot代表輸出門的信息輸出,ht為隱藏層的輸出。同時輸出ht也將輸入下一個LSTM單元。
其中,sigmoid函數為
σ(x)=(1+e-x)-1
(7)
Tanh函數為
h(t)=σ(W1x(t)+b1)
(8)
LSTM神經網絡雖然具有記憶功能,能夠學習到歷史信息,但是其只能學習到前向信息,而無法有效利用后向信息。雙向長短期記憶神經網絡模型是對LSTM的改進,有效的解決了這一問題,較LSTM學習能力進一步得到提高。BiLSTM結構如圖2所示,BiLSTM神經網絡有兩個方向的傳輸層,前傳層前向訓練時間序列,后傳層后向訓練時間序列,前傳和后傳層都與輸出層連接。

圖2 BiLSTM結構圖
原始振動信號直接通過輸入層將信息輸入到BiLSTM網絡層,輸入的樣本信號經過正向LSTM計算得到一個值,同時經過反向LSTM計算得到一個值,傳入隱藏層的值由這兩個值共同決定。公式如下:

(9)

(10)

(11)

傳統的軸承故障識別方法都是將源數據預處理,再人工提取時域特征信息或頻域特征信息,繼而進行模式識別,而故障診斷的準確性主要依靠特征選擇和特征提取[22]。利用深度學習理論,將原始振動信號數據直接輸入滾動軸承故障診斷模型,而無需人工提取特征。通過人工神經網絡學習其深層信息,輸出故障類型,實現端到端的智能故障診斷。LSTM網絡作為深度神經網絡的一種,不僅能夠提取特征,而且具有循環神經網絡的“記憶功能”,能夠克服長期依賴的問題。由于軸承故障診斷數據為時域振動加速度數據,BiLSTM循環神經網絡考慮到前向信息的輸入的同時也考慮到后向信息的輸入,較單向LSTM能更有效的利用振動信號信息。
滾動軸承時域振動信號有一定的周期性,但是由于不同數據正向傳遞和反向傳遞的信號數值不盡相同,而BiLSTM能利用雙向信息學習其內在特征,從而提高故障識別準確率。基于BiLSTM的滾動軸承故障診斷模型如圖3所示。振動數據樣本輸入到BiLSTM,經由計算前向輸出值和后向輸出值,二者相加成為BiLSTM隱層的輸出,再經過softmax網絡層,對樣本進行分類。通過網絡訓練不斷優化網絡模型參數,最終實現故障診斷。基于BiLSTM的故障診斷步驟:

圖3 基于BiLSTM的軸承故障診斷模型
步驟1 獲取滾動軸承的時域加速度數據,將不同狀態的軸承振動數據截取成固定時間長度的序列,進行統一的標準化預處理,再分別編號。將其劃分成訓練集和測試集,作為深度神經網絡故障診斷模型輸入。
步驟2 BiLSTM層初始化權重以及偏置,在訓練過程中將訓練樣本分批次輸入網絡,選擇合適的學習率、BiLSTM單元數等參數以及訓練次數。
步驟3 通過BiLSTM層對時序數據進行雙向計算,計算值整合后輸入到softmax層。
步驟4 Softmax層實現對故障狀態的分類,根據樣本的輸出概率與真實值對比,得出損失率,再根據梯度下降算法不斷優化權重以及偏置。
步驟5 達到訓練次數后模型訓練完成,將測試樣本輸入模型中,根據建立的模型計算預測分類的輸出結果,并與真實的類別作比較,進而計算測試集上的分類準確率。
實驗數據采用美國凱斯西儲大學軸承數據中心[23]的SKF型軸承的DE驅動端加速度數據,軸承轉速為1 730 r/min,樣本采樣頻率為48 kHz。滾動軸承實驗臺如圖4所示。實驗選用軸承單點直徑損傷分別為0.177 8 mm、0.355 6 mm、0.533 4 mm的故障。此外,根據損傷部位的不同,分為滾動體、內圈、外圈六點鐘方向故障。圖5為抽取的部分正常及不同故障狀態的樣本振動信號。

圖4 滾動軸承實驗臺
實驗數據集采用文獻[24]的方法,樣本共10類,詳細數據及標簽如表1所示。樣本包含9種故障類型數據和1類正常數據。每類樣本數據選取290個,其中訓練數據樣本240個,測試數據樣本50個,每個樣本的采樣點數為1 600。
數據長度為1 600的滾動軸承振動信號數據輸入BiLSTM網絡,設定BiLSTM的單元數為1 600;然后將相應的信息再通過softmax輸出層,將BiLSTM網絡層的輸出維度與最后的分類數目相匹配,學習率設置為0.001。采用梯度下降優化器,不斷更新網絡參數,得到一個滾動軸承故障診斷模型。根據模型得到預測分類結果輸出,將其與真實的類別作比較,計算測試集上的分類預測準確率。

(a) 正常狀態

(b) 0.177 8 mm的滾動體故障

(c) 0.177 8 mm的內圈故障

(d) 0.177 8 mm的外圈六點鐘方向故障

表1 實驗數據集
3.2.1 基于BiLSTM軸承故障診斷模型結果
準確率是判別滾動軸承故障診斷模型優異的重要判斷依據,現階段滾動軸承故障診斷的目標主要是不斷提高診斷精度,保證滾動軸承能夠得到及時維護。測試樣本診斷結果如表2所示,該模型在識別中僅出現1個錯誤,將正常狀態誤判為0.355 6 mm的內圈故障,其余故障都識別無誤,總測試準確率為99.8%。經過多次實驗,結果表明提出的BiLSTM模型用于滾動軸承故障診斷的效果非常好。

表2 測試樣本診斷結果表
基于軸承故障診斷模型準確率及損失率變化曲線如圖6所示。由于權重和偏置為隨機設置,初始訓練測試集故障識別準確率不高,僅為10%左右。但隨著訓練增加,150次的訓練后準確率便達到了99%以上。訓練200次后,識別準確率緩慢上升并趨于穩定。最終,基于BiLSTM的故障診斷模型識別準確率達到99.8%以上。損失率曲線顯示前50次損失率波動較大,訓練次數增加后,損失率曲線平穩下降,在訓練200步后損失率逐漸平穩且趨近與0。由此可見,隨著不斷學習,能實現對故障狀態診斷的準確識別。

(a) 模型準確率曲線圖

(b) 模型損失率曲線圖
3.2.2 不同參數取值和優化器選擇的影響
優化器的選擇影響參數優化的速度和模型最終的準確率,合適的優化器能大大提高訓練效率。學習率和BiLSTM單元數是影響模型性能的重要參數。學習率直接影響深度學習網絡的學習速度和模型的準確率。一般而言,學習率過大會導致權重更新過大,模型性能劇烈振動;而學習率過小又會導致學習速度緩慢。兩者均可能得不到全局最優的結果。隱層的BiLSTM單元數表示用于記憶和儲存過去狀態的節點個數,其單元數量將會影響診斷速度以及準確率。
基于以上原因,實驗研究了優化器、不同參數設置對實驗結果的影響。最終確定基于BiLSTM故障診斷模型的學習率、BiLSTM單元數以及優化器。
(1) 優化器選擇的影響
本文選用GradientDescent、Adadelta、RMSPro、Adam優化器進行對比實驗。不同優化器訓練結果如圖7所示,從圖中可知,GradientDescent和Adam優化器訓練穩定且速度更快。

(a) GradientDescent

(b) Adadelta

(c) RMSPro

(d) Adam
(2) 學習率的影響
實驗參數設置為輸入為1 600,batch為2 400,BiLSTM單元數為1 600,訓練次數為1 000,不同學習率條件下訓練200次的準確率及損失率結果如表3所示。可以看到學習率為0.001時的準確率最高,此時其損失率也最低;訓練1 000次時的準確率及損失率如表4所示,學習率為0.001時準確率達到了100%,而且損失率也較低,因此本文學習率設置為0.001。

表3 不同學習率在訓練200次時的準確率及損失率

表4 不同學習率在訓練1 000次時的準確率及損失率
(3) 單元數的影響
實驗參數設置輸入為1 600,batch為2 400,訓練次數為1 000,學習率設置為0.001。不同BiLSTM單元數下的準確率如圖8所示。結果顯示:當LSTM單元數設置低于400時其準確率低,且后期準確率上升緩慢;當LSTM單元數設為800、1 600時,在500次訓練后準確率就能夠達到99.8%以上。

圖8 不同單元數的準確率
LSTM單元數設置較大時,時間消耗過大,對于準確率的貢獻并不大,因此對LSTM單元數的選擇不宜過大,經過多次的反復實驗,LSTM單元數選擇1 600能達到較好的效果。
3.2.3 與其它模型的比較
在相同數據集、同等條件下,本文也進行了LSTM神經網絡的模型測試。參數相同情況下,訓練500次的LSTM和BiLSTM網絡模型準確率如圖9所示。經過前200次的訓練,BiLSTM準確率能達到99.3%,而LSTM模型僅97.2%。訓練500次后,BiLSTM模型準確率為100%。訓練500次的LSTM和BiLSTM網絡模型損失率如圖10所示,200次訓練后,BiLSTM較LSTM的損失率低。訓練500次后,BiLSTM損失率為2.44%。從結果來看,BiLSTM雖然較單向LSTM初始階段波動大,但收斂速度快,訓練更高效。

圖9 BiLSTM和LSTM準確率曲線對比圖

圖10 BiLSTM和LSTM損失率曲線對比圖
利用文獻[24]結果,在相同數據集下,不同模型準確率如表5所示,CNN的準確率為98.8%,DNN的準確率為80.8%,而傳統的故障診斷方法如EMD與決策樹的方法準確率僅為77%。對比本文的基于BiLSTM的神經網絡診斷模型,準確率最終能達到99.8%以上,說明本文提出的模型優于以上其它神經網絡模型。

表5 不同模型準確率
雖然單向LSTM也能達到較高準確率,但與之相比,BiLSTM效率更高,能更快學習到故障特征信息,收斂速度更快。循環神經網絡比起CNN網絡模型和DNN網絡模型在識別準確率上明顯效果更好。與傳統故障診斷方法相比,基于BiLSTM故障診斷模型實現了故障特征自提取的智能故障診斷。
(1) 本文設計并實現了一種基于BiLSTM的滾動軸承故障模型,避免人工提取特征的不便,實現了端到端的軸承故障診斷。
(2) 相比傳統的故障診斷方法,基于BiLSTM的故障診斷模型能更加便捷、有效地實現故障診斷,并且準確率較高。
(3) 軸承早期故障診斷、軸承損傷程度的識別仍需要進一步研究。