莊雨璇,李 奇,楊冰如,陳 良,沈長青
(1.蘇州大學 機電工程學院,江蘇 蘇州215006;2.蘇州大學 軌道交通學院,江蘇 蘇州215006)
滾動體軸承是機械傳動系統的基本組成部件。軸承故障與失靈直接導致設備無法正常運行,造成經濟損失,甚至危害工作人員的安全。因此,及時、準確地診斷出軸承的故障具有重要的意義。軸承的故障診斷一直備受學者們關注與研究,傳統方法是將時域數據轉換成頻域數據,進行軸承的檢測與診斷。鄭紅等提出一種基于譜峭度與雙譜的軸承故障診斷方法,通過計算低頻矩形區域的局部雙譜圖進行故障診斷[1]。楊青,孫佰聰等利用小波包技術進行多層次特征提取,通過結合小波包熵和聚類分析方法對軸承進行故障診斷[2]。付云驍、賈利民等從多維時頻域特征的角度,運用BP神經網絡對滾動體軸承進行故障診斷[3]。姜濤等改進小波神經網絡模型[4],解決基于BP算法的故障診斷收斂速度慢、易陷入局部極小值等問題。LI等通過層次模熵方法提取故障特征[5],運用拉普拉斯變換細化故障特征,改進基于支持向量機的二叉樹方法,診斷軸承故障。向丹等運用經驗模態分解、核主元分析方法提取原始振動信號特征并進行與信息融合,運用支持向量機診斷軸承的故障[6]。上述傳統方法將原始時域信號轉換成頻域信號或提取頻域特征,無法直接通過時域數據進行軸承故障的檢測與診斷。
近年來,深度學習的出現為軸承故障診斷提供了新方法、新思路。基于深度學習的故障診斷方法最初以卷積神經網絡CNN為主,將振動信號轉換成二維空間上的數據圖譜[7],然后輸入到CNN 模型中診斷軸承故障。WEN 等基于LeNet-5 提出一種CNN 模型[8],無需手工選取特征即可進行軸承故障診斷。WANG 等提出一種復合診斷模型[9],將短時傅里葉變換與CNN 結合,通過CNN 自適應地提取頻域特征來表示信號與健康狀態之間的復雜映射關系,進行軸承故障診斷。提出的方法綜合了CNN模型和改進特征融合算法的優點[10],能對不同負載條件下的軸承進行故障診斷。GUO 等提出一種基于CNN 的分層故障診斷方法[11],在故障模式識別和故障尺寸評估方面體現了令人滿意的性能。
基于CNN 的新方法極大地提高了軸承故障診斷的準確性,但將振動信號轉換成二維空間圖譜的做法缺乏理論依據。考慮到振動信號本質上是一個時間序列,如果能夠直接將時域信號輸入一個故障診斷模型,則算法會更簡潔,更自然,更易于實際應用。目前,文獻中已有相關報道,以下研究利用深度神經網絡直接通過軸承原始時域信號進行故障特征提取與故障診斷。張西寧等通過對比傳統的卷積神經網絡模型用于軸承故障診斷的結果,說明卷積自編碼器CAE對軸承故障具有較高的識別精度[12]。劉正平等搭建基于堆棧降噪自編碼SDAE的故障診斷模型分析不同的電機負載對軸承故障診斷的影響[13]。李巍華等利用DBN 從原始振動信號中提取軸承的分布式特征進行故障診斷與識別[14]。趙光權等提出一種基于DBN的軸承故障診斷方法,能有效識別多種工況下的軸承故障,具有較強適應性和通用性[15]。
綜上所述,深度學習模型已經逐步被應用于軸承故障診斷的研究,具有兩個明顯的優勢:一是可以直接利用時域信號,二是深度神經網絡具有優異的故障特征提取能力,從而擺脫傳統方法對人工特征選取的依賴。然而,上述的研究仍存在一個明顯的不足:為實現較好的診斷識別效果,上述故障診斷方法往往是復合方法,一般是由2種及2種以上的機器學習模型組成的混合結構。復合診斷模型在架構上過于復雜,表現為多層次、多步驟、多算法集成[11]。這些方法泛化能力弱,只對特定場景下的軸承故障診斷有效,且計算量大、訓練過程比較漫長、實時性欠佳。
因此,針對以上缺點提出一種直接輸入時域信號且具備端到端故障診斷能力的新方法e2e-LSTM,即end-to-end Long Short Term Memory Network。相比其他神經網絡結構,LSTM 所建模型屬于時間序列模型,能夠有效提取軸承振動信號的時間和空間特征,進一步提高軸承故障診斷的精度。LSTM 能夠進行全局化處理和持續記憶多時刻的信息,易發現數據信息在時間上的相關特性。LSTM的上述特點對具有時序特征和周期性特征的軸承振動信號具有重要意義,因此,選取LSTM 作為診斷模型相比CNN 等其他神經網絡,對于軸承故障診斷更有優勢。e2e-LSTM通過一個長短時記憶網絡(包含3個LSTM 層、2 個全連接層、1 個softmax 層),輸入原始時域數據,可以一次性、接近100%診斷出滾動體軸承的故障類型與故障尺寸。該方法避免多步驟、分層次地診斷故障,將故障特征提取和故障分類合二為一,極大地縮短模型訓練和算法運行的時間,有助于實際工業化應用。
1997年,Hochreater 和Schmidhuber 提出LSTM的網絡結構,LSTM 模型是一種特殊的RNN 循環體結構,它能夠解決RNN模型中遇到的梯度爆炸和梯度消失問題[16]。LSTM 的主要特點是通過“門”結構控制神經網絡中每個時刻的信息狀態。
LSTM的單元模型內部數據操作如圖1所示。

圖1 LSTM的單元結構圖
xt表示當前時刻的輸入,ct-1表示此刻之前的長期記憶向量,ht-1表示前一單元的輸出量,ct表示當前時刻的長期記憶向量,ht表示當前時刻的輸出量。操作過程如下:
(1)將前一時刻的輸出向量與當前時刻的輸入向量拼接成一個向量Z;
(2)利用激活函數將向量Z分別與不同狀態的參數W、b進行矩陣相乘,得到gf、gi、go,同時得到c't;
(3)gf與前一時刻ct-1組合成nt,實現對前一時刻狀態的記憶或遺忘效果;gi與c't組成mt,形成輸入門對輸入向量的控制;將mt與nt結合形成ct;
(4)用Tanh 激活函數對ct操作,與go向量組合成ht,形成對輸出向量的控制,得到ht;
(5)將ct、ht作為當前時刻的狀態向量與輸出向量輸入到下一個LSTM單元模型中。
本研究提出的端到端故障診斷方法e2e-LSTM的框架圖如圖2所示。
首先將原始數據集分為訓練集和測試集,訓練集用于訓練e2e-LSTM,更新模型參數來優化模型;測試集輸入到已訓練好的e2e-LSTM 模型中,用來檢測模型的故障診斷能力。

圖2 e2e-LSTM的模型框架圖

圖3 e2e-LSTM的模型原理
e2e-LSTM 包含3 個LSTM 基礎單元模型層、2個全連接層和1 個邏輯回歸層。圖3為e2e-LSTM的具體模型構成,通過LSTM 基礎單元將輸入特征向量與之前的輸出記憶向量高效融合,不斷傳遞和處理信息,輸出一維特征信息狀態[h0,h1,……,hn]。
e2e-LSTM方法包含特征提取和分類2個過程,3個LSTM層對軸承數據進行特征提取,全連接層通過對軸承特征進行加權計算實現特征空間轉換,全連接層的層數與模型的復雜度、診斷能力密切相關,過多的全連接層會導致模型參數急劇增多,過少的全連接層會限制模型的非線性表達能力。本研究搭建激活函數為Tanh 函數的2 個全連接層,將前幾層網絡經過訓練取得的分布式特征映射到樣本標記空間,最后通過softmax層輸出該模型預測結果。
表1給出了e2e-LSTM模型的主要參數。

表1 e2e-LSTM模型的參數值
在e2e-LSTM 的訓練過程中,首先輸入一維向量X,經過3個LSTM層,再經過2個全連接層,提取到的特征被映射到樣本標記空間,最后通過softmax層,e2e-LSTM 模型將輸出預測值Y’。計算預測值Y’與真實值Y之間的交叉熵損失函數值,通過多次迭代,運用ADAM 優化算法更新e2e-LSTM 網絡中的參數W、b,使得損失函數值逐漸減小,從而使得e2e-LSTM具有較好的診斷能力。
實驗數據來自美國凱斯西儲大學的軸承故障數據集[17]。在不同的電機負載場景下使用加速度計測量驅動端、扇葉端軸承的振動信號,如表2所示。
該實驗中的負載是可變的,分別有0、1 hp、2 hp、3 hp 4種設定。在實驗中,每種負載條件下的數據集構成一個特定的場景。如圖2所示,每種場景包含健康軸承和3種故障類型(內圈故障IR、滾動體故障B、外圈故障OR),每種故障類型包含3 種故障尺寸(輕度故障007、中度故障014、重度故障021)。

表2 軸承數據場景
每個軸承故障診斷樣本是一個包含1 200 個采樣點的時間序列,實驗中共采用1 000 個樣本。其中,500個樣本作為訓練集,500個樣本作為測試集。在訓練過程中,采用批量梯度下降法訓練e2e-LSTM模型。首先將500個訓練樣本分成50組,每組10個樣本輸入到e2e-LSTM模型中,通過3個LSTM模型和2 個全連接層對數據特征進行提取和處理,最后通過softmax層進行分類。
實驗結果表明,針對CWRU 的實驗平臺,e2e-LSTM對軸承故障的識別率最高可達100%,平均準確率達到99.8%。圖4是電機負載為0 時的軸承故障診斷結果,由圖可知,500 個測試樣本輸入到e2e-LSTM模型中,僅有1個樣本被診斷錯誤。

圖4 基于e2e-LSTM的軸承故障診斷結果
目前文獻上已有的軸承故障診斷方法大多只適用于特定應用場景,在可變負載的情況下泛化能力欠佳。本文提出的e2e-LSTM 方法在變負載場景下的故障診斷結果如圖5所示。
結果表明在電機負載分別是0、1 hp、2 hp、3 hp的4種場景下,e2e-LSTM方法均具有較高的故障診斷能力。實驗中,每個場景有500個測試樣本,一共有13 個故障樣本診斷錯誤,識別準確率達到99.4%。

圖5 CWRU軸承數據的故障診斷結果
為進一步說明e2e-LSTM 方法的有效性,文中對比了Conv-LSTM[18]、Bi-LSTM[19]等方法在不同負載場景下的故障診斷能力。圖6為基于Conv-LSTM混合網絡模型的軸承故障診斷結果,Conv-LSTM對不同場景的診斷能力相差較大,其中電機負載為3 hp 時的故障識別率達到91.4%,而電機負載為2 hp時的故障識別率僅有79.2%,該混合模型對不同場景的診斷能力較不穩定。

圖6 在不同場景下基于Conv-LSTM的故障診斷結果
Bi-LSTM 采用的是一個分步驟方法:先診斷軸承的故障類型,再診斷軸承的故障尺寸,軸承的故障診斷過程復雜,圖7為在不同場景下基于Bi-LSTM的故障診斷結果,相比e2e-LSTM效果較差。
表3為3種軸承故障診斷方法的結構對比,e2e-LSTM包含3個LSTM層,Conv-LSTM是由2個卷積層、3個LSTM層組成的混合神經網絡模型結構,Bi-LSTM 是包含3 個雙向LSTM 層的復合故障診斷方法。在識別準確率方面,e2e-LSTM對不同場景的故障診斷平均識別率達到99.4 %,高于Conv-LSTM、Bi-LSTM故障診斷方法的故障識別準確率。

圖7 Bi-LSTM在不同場景下的故障診斷結果

表3 3種軸承故障診斷方法的結構對比
e2e-LSTM 方法對不同負載場景下的軸承故障識別具有較強的泛化能力。從表4中可以看到,相比Conv-LSTM、Bi-LSTM 方法,在不改變模型任何參數的情況下,e2e-LSTM 對不同的軸承故障場景均具有較好的診斷識別能力。此外,e2e-LSTM 的迭代次數為600 次,訓練時間為46 min,是Conv-LSTM所用時間的67%,Bi-LSTM方法所用時間的12%,極大縮短運行時間,提高故障診斷效率。

表4 3種故障診斷方法的結果對比
建有的軸承故障診斷實驗平臺,如圖8所示,該平臺由驅動電機、測試軸承、測功機、加速度計、數據采集系統等裝置組成。加速度計分別在不同負載情況下采集軸承的振動信號,包含健康軸承和3 種軸承故障類型(健康、內圈故障、滾動體故障和外圈故障),每一種軸承故障類型包含3種故障尺寸(2 mm、4 mm、6 mm)。該實驗包含4種不同負載(0、1 kN、2 kN、3 kN),每組實驗隨機選取500 個樣本作為訓練集,500個樣本作為測試集。

圖8 軸承實驗數據采集平臺
圖9至圖12分別為在不同負載下的軸承故障診斷結果,2 000個測試樣本中有29個軸承樣本被錯誤識別,準確率達到98.55%。
通過可視化分析可以發現,本文方法具有較強的故障識別和分類能力。以負載為0 時為例,將軸承振動信號數據輸入到e2e-LSTM 模型中進行故障診斷時,獲取最后一個全連接層的特征,利用t-SNE方法對這些特征進行降維與聚類可視化。

圖9 負載為0 時的軸承故障診斷結果

圖10 負載為1 kN時的軸承故障診斷結果
如圖13所示。對于10 種軸承故障分別用不同顏色表示其降維后的特征聚類情況,由圖可見,e2e-LSTM能夠有效提取軸承的故障特征,并根據故障類型與故障尺寸有效分類,減少誤診斷。

圖11 負載為2 kN時的軸承故障診斷結果

圖12 負載為3 kN的軸承故障診斷結果

圖13 基于e2e-LSTM的軸承故障特征三維圖
文中提出的e2e-LSTM 方法實現了端到端模式的軸承故障診斷,通過美國凱斯西儲大學的CWRU數據集與自有實驗平臺的軸承數據集,證明了e2e-LSTM方法能夠準確識別不同負載場景下的軸承故障類型和故障尺寸。與Conv-LSTM、Bi-LSTM等復合診斷模型相比,該方法具有結構簡潔、迭代次數少、運行時間短、泛化能力強等特點,這些都表明e2e-LSTM 方法對軸承故障診斷的適應性和實用價值。