裴 沛,李彩偉
(1.北京中油瑞飛信息技術有限責任公司,北京 100007;2.國家工業信息安全發展研究中心,北京 100040)
大型機械設備具有體積大型化、結構復雜化、零件多樣化等特點,一旦發生故障將會給個人、企業和國家帶來巨大的經濟損失。滾動軸承作為大型旋轉機械設備中的關鍵零件,具有負載重、轉速快等特點,使其成為最易發生故障的工業零件之一。據統計,在旋轉機械的所有故障中,因軸承失效造成的故障約占30%[1,2]。因此,實現滾動軸承的故障診斷與狀態監測,對保證設備安全運行、減少運營維護成本十分重要。
早期的狀態監測主要依據滾動軸承的振動機理,利用信號分析和數理統計知識提取振動信號特征,如頻譜分析、包絡分析、時頻分析、經驗模式分解[3,4]等,然后根據專家的經驗知識對信號特征進行分析,實現滾動軸承的狀態監測。此類方法過于依賴專家診斷經驗且診斷效率和準確率較低。隨后,國內外研究者提出采用支持向量機(SVM)[5]、決策樹[6]、淺層BP 神經網絡[7]等機器學習方法對人工提取的特征進行學習,實現軸承的狀態監測,并在小樣本數據上獲得較好的診斷結果。然而,隨著機械設備的廣泛應用,監測系統采集的數據量越來越大,上述方法已不再適用。深度學習作為一種特殊的機器學習,由于其非線性,多層性,自適應性等特點,被廣泛應用于圖像識別、自然語言處理和狀態監測等領域,并取得不錯的結果。因此,越來越多的學者將深度學習應用于滾動軸承的故障診斷。研究表明:深度神經網絡具有強大的特征提取能力,在處理大數據上具有顯著優勢。文獻[8]利用小波包變換對振動信號進行特征提取,通過長短時記憶網絡診斷風電機組滾動軸承的常見故障。文獻[9]提出一種基于希爾伯特黃變換和稀疏自編碼器的軸承故障狀態識別方法,進一步提高了驅動端和風扇端的軸承故障診斷準確率。文獻[10]提出一種基于雙樹復小波包的自適應深度置信網絡的方法,結果表明該方法可以有效識別滾動軸承故障。文獻[11]采用卷積神經網絡(CNN),解決了基于傳統方法很難診斷的旋轉機械中外圈滾道故障問題和潤滑性能退化問題。
綜上可知,傳統的狀態檢測方法將信號預處理、特征提取和狀態識別分為3 個獨立階段,破壞了各階段的耦合關系,也降低了診斷效率。尤其是特征提取過程過于依賴人工提取特征,無法滿足實際應用中端對端的需求。因此,將數據預處理、特征提取和故障診斷組合到一個模型,進而實現端對端的自動狀態監測模式是目前亟待解決的問題。
為解決上述問題,提出一種LSTM-BP 組合神經網絡模型,該模型能自動提取振動信號的特征并完成狀態分類,實現端到端的滾動軸承故障的自動診斷,在不同損傷程度的數據集上進行驗證。實驗結果表明,該模型的泛化性能高,魯棒性好,有望在工程實際中得到應用,對機械設備診斷技術的發展具有十分重要的理論意義和實際應用價值。
人工神經網絡最早來源于人類神經網絡的研究,是一種以網絡拓撲結構為基礎,模擬人腦神經網絡對復雜信息處理機制的一種數學模型,也是一種基于數據驅動的方法[12]。人工神經網絡具有非線性映射功能,可以將原始空間的特征表示變換到一個新的特征空間,實現信號的空間變換與降維。本文主要研究BP 神經網絡和LSTM 神經網絡。LSTM 作為經典的深度神經網絡之一,其本身具有特征提取和特征空間映射的功能[13,14]。
BP 神經網絡是一種按照誤差反向傳播算法進行訓練的多層前饋神經網絡,由輸入層、隱藏層和輸出層組成,該網絡各層間的神經元互不相連,相鄰層的神經元則相互連接,網絡結構如圖1 所示。BP 神經網絡的訓練過程就是輸入信息從輸入層經隱藏層到輸出層的過程,包括前向傳播過程和后向傳播過程。前向傳播過程如下:

式中,xp={x1,x2,x3,...xn},n 為樣本的維度,H1是隱藏層節點的輸出,Z={Z1,Z2,...Zm} 是輸出層節點的輸出,w1,b1分別為輸入層與隱藏層之間的權重矩陣和偏置向量,w2,b2分別為隱藏層與輸出層之間的權重矩陣和偏置向量,隱藏層的傳遞函數是f1(*),輸出層的傳遞函數是f2(*),一般是sigmoid 或tanh 函數。BP 的前向傳播過程完成了n 維空間向k 維空間的映射。BP 神經網絡反向傳播過程如下:
假設有m 樣本集{(x1,y1),(x2,y2),...(xm,ym)},其中xp=。通常將平方誤差函數作為目標函數,公式如下:

其中,J(W,b;xi,yi)是單個樣本的誤差,J(W,b)是m 個樣本的全局誤差。BP 神經網絡的反響傳播過程就是利用隨機梯度下降法調整參數W,b,最小化全局誤差。實際上,網絡的訓練過程就是診斷知識獲取的過程,網絡訓練結束后神經元之間的連接權值就是輸入數據的特有知識。
滾動軸承的狀態監測不僅要分析當前時刻振動信號的信息,還要結合前后時刻的振動信號信息。傳統的神經網絡只關注當前時刻輸入的信息,忽略了樣本之間的信息傳遞,不具備處理時序序列的功能。循環神經網絡(Recurrent Neural Networks,RNN)可以將當前單元學習的信息輸入下一個神經元,具有記憶功能,適合處理時間序列數據。RNN 展開相當于多層神經網絡,隨著層數的增加會產生梯度消失、梯度爆炸和歷史信息損失等問題,LSTM 網絡通過對RNN 加入記憶單元結構,有效解決了上述問題。其記憶單元結構如圖2 所示。其中xt表示t 時刻的輸入,ht-1,ht分別表示t-1 時刻和t 的輸出;Ct-1,Ct分別表示t-1 和t 時刻記憶單元的狀態值,表示t 時刻記憶單元的候選值;it,ft,和ot分別表示輸入門、遺忘門和輸出門;Wf,Wt,Wc,Wo表示遺忘門,輸入門,輸出門和輸入狀態單元的權重矩陣;σ 為sigmoid 激活函數,tanh 為tanh 激活函數。
LSTM 網絡與BP 網絡相同包括前向傳播和誤差反向傳播兩部分,對于單個記憶單元結構,前向傳播過程如下:

圖1 BP 神經網絡

圖2 LSTM 記憶單元結構
(1)通過讀取ht-1,xt信息。計算遺忘門、輸入門和輸出門,公式如下:

遺忘門用于控制前一時刻記憶單元狀態值對當前記憶單元狀態值的影響;輸入門用來保存當前時刻輸入的有用信息,控制對當前記憶單元狀態值的影響;輸出門根據當前記憶狀態單元值決定當前時刻輸出。
(2)計算當前記憶單元候選值,并根據輸入門和遺忘門計算當前時刻記憶單元值。

(3)根據輸出門和當前記憶單元值計算當前時刻的輸出。

式(4)~(9)中,bf,bt,bo,bc分別表示遺忘門,輸入門,輸出門和t 時刻輸入狀態單元的偏置項,?表示按元素相乘。
LSTM 反向傳播與BP 神經網絡類似,都是利用隨機梯度下降算法反向傳播誤差更新網絡參數,進而優化網絡模型。與BP神經網絡不同的是,LSTM 反向傳播算法包括時間和網絡層級兩部分。
利用LSTM 和BP 網絡特性,采用級聯的形式構建LSTMBP 網絡模型。其中BP 神經網絡包括3 層,2 個隱藏層1 個輸出層,輸出層的神經元個數等于軸承狀態類別數。該模型可以自動提取軸承信號特征并完成軸承狀態識別,簡化數據處理過程的同時保留原始數據豐富的細節,其模型結構如圖3 所示。圖中,xi為輸入數據,其維度為n×1,T 為樣本的時間長度,H1是{H11,H12,...H1s}LSTM 隱藏層的輸出。
基于LSTM-BP 組合網絡的滾動軸承狀態監測原理:①將振動信號輸入LSTM 神經網絡,利用LSTM 的記憶結構,提取信號時間維度特征;②將LSTM 神經網絡隱藏層的輸出作為BP 神經網絡的輸入,實現信息傳遞;③通過BP 神經網絡結構完成信號的進一步學習,并實現軸承狀態的分類識別。
LSTM-BP 組合神經網絡,每一層隱藏層都是數據的不同階表達,層數越高提取的特征越抽象,其訓練過程就是模型不斷優化的過程。
基于LSTM-BP 組合網絡的滾動軸承狀態監測過程分為以下3 步:
(1)樣本采集與預處理。將采集到的信號歸一化使其幅值范圍為[0,1]。按照6:1 的比例將數據分為訓練數據和測試數據。
(2)模型訓練。初始化LSTM-BP 神經網絡(包括各層網絡的神經元數,BP 網絡的隱藏層數,迭代次數,最小誤差等參數),將帶標簽的訓練數據輸入LSTM 網絡,得到隱藏層輸出H1,然后輸入BP 神經網絡和Softmax 層,得到實際輸出值。將實際輸出值與理論值的交叉熵損失函數作為誤差計算公式,利用隨機梯度下降法調整LSTM 和BP 神經網絡的權重和偏置,最小化誤差,進而優化網絡模型。

圖3 LSTM-BP 組合網絡
(3)模型驗證。將測試數據直接輸入上述訓練好的網絡模型中,網絡輸出對應軸承狀態的概率,取最高概率作為狀態識別結果。
Softmax 回歸層本質是一個全連接層,其功能是將BP 神經網絡的多個神經元輸出映射到(0,1)區間,計算每種分類的概率情況。其交叉熵損失函數如下:

式中,θ 為模型參數,N 為樣本數,zi是預測值,yi為實際值,k 為類別數。
BP 神經網絡存在收斂速度慢和陷入局部最優的風險。為了加快訓練速度、提高診斷精度、降低網絡陷入局部最優的風險,本文采用Batch Normalization 方法對每個隱藏層的激活值做處理,公式如下:

式中,μ,σ 分別是每批次數據的滑動平均值和方差,γ 和β分別是縮放和偏移系數。此外,Batch Normalization 加入了網絡噪聲,在一定程度上起到正則化的作用,有效防止網絡產生過擬合的現象。
實驗數據來自美國凱斯西儲大學驅動端軸承的振動信號。振動信號的詳細信息見表1。軸承數據做預處理后分為訓練樣本和測試樣本,其中訓練樣本6000 組,測試數據為1000 組,每組包含512 個采樣數據。

表1 西儲大學軸承振動信號
在LSTM-BP 組合神經網絡中,將預處理后的數據以(batch_size,64,8)形式輸入LSTM 網絡,獲取LSTM 的隱藏層輸出,將其作為BP 神經網絡的輸入。BP 神經網絡包括2 個隱藏層和1 個輸出層。隱藏層神經元數量對模型性能有重要影響,神經元個數太少,學習能力差,導致狀態識別準確率低;神經元個數太多,訓練時間長,容易導致模型過擬合。經過前期實驗,設置BP 隱藏層神經個數分別為16 和8。其中,batch_size 為200,迭代次數為100,記錄每次迭代后訓練樣本和測試樣本的損失值和準確率,并繪制訓練數據和測試數據的損失值變化曲線和準確率變化曲線,見圖4、圖5。準確率指每組數據中分類正確的樣本數與整組樣本數的比值。
由圖4、圖5 可知,模型經過100 次迭代后,測試數據和訓練數據的損失值趨于穩定。訓練數據準確率幾乎達到100%,測試數據的準確率約為99.20%,訓練數據和測試數據的損失值和準確率的曲線變化趨勢同步,未產生過擬合現象。實驗結果表明,本文提出的方法可以從原始數據有效提取軸承信號的特征并實現軸承正常狀態、內圈故障、外圈故障和滾珠故障的準確分類。

圖4 損失值變化曲線

圖5 準確率變化曲線
為了驗證基于LSTM-BP 網絡的故障診斷方法在故障診斷精度方面的優越性,在相同數據集、同等條件下,訓練SVM、淺層BP 網絡和LSTM 網絡,實驗結果如表2 所示。結果表明,SVM、淺層BP 網絡以及LSTM 網絡雖然訓練速度快,但診斷精度低。

表2 不同方法的診斷結果
模型的泛化能力是驗證模型優劣的重要指標,而單個數據集很難檢驗模型的泛化能力。因此,引入西儲大學驅動端軸承不同損傷程度的數據以及其隨機混合數據對其進一步驗證。振動信號的詳細信息見表3。不同損傷程度的數據及其混合數據狀態識別準確率趨勢如圖6~8 所示。

表3 西儲大學軸承振動信號

圖6 數據集A 的狀態識別準確率

圖7 數據集B 的狀態識別準確率

圖8 混合數據集的狀態識別準確率
由圖6~8 可知,模型經過100 次迭代后收斂至穩定,3 種不同數據集的測試集和訓練集的準確率曲線走勢相同,未產生過擬合現象。實驗結果表明本文提出的方法可以實現對不同來源軸承信號的4 種狀況自動診斷,且診斷準確率達到99.50%。驗證了基于LSTM-BP 網絡的滾動軸承自動診斷方法,在損傷程度、采樣頻率不同的軸承信號上,仍可以實現滾動軸承故障的自動識別,且診斷精度高、泛化性能高、具備同時診斷復雜混合數據的故障類型的能力。
提出一種基于LSTM-BP 組合網絡的狀態識別方法,結合LSTM 網絡特征提取和特征空間映射的功能,實現滾動軸承狀態的自動識別,滿足實際應用中端對端需求。實驗結果表明:①該方法的狀態識別準確率高達99.20%,遠高于SVM、淺層BP網絡和LSTM 神經網絡;②該方法可以同時對不同損傷程度、不同位置和不同來源的軸承信號進行準確識別;③該方法具有更高的泛化能力。