池永為, 楊世錫, 焦衛東
(1.浙江大學機械工程學院 杭州,310027) (2.浙江師范大學工學院 金華,321004)
近年來,隨著人工智能技術(artificial intelligence, 簡稱AI)的發展,AI技術已被應用于旋轉機械故障診斷中。利用特征提取方法對檢測信號進行處理得到特征序列,并利用AI技術對特征序列進行模式識別,從而完成旋轉機械的故障診斷[1]。滾動軸承是旋轉機械設備的關鍵零部件,容易發生點蝕、剝落或裂紋等故障。當滾動軸承發生故障時,將直接影響旋轉機械系統的正常運行甚至引發安全事故[2]。滾動軸承初期故障一般表現于在滾動軸承外圈、內圈或滾子上出現點蝕現象。當滾動部件上的點蝕位置與其他零部件發生運動接觸時,將引發系統內零部件復雜的周期性沖擊現象。這種周期性沖擊現象在頻譜上體現為序列的能量變化,頻譜的序列能量分布包含著滾動軸承的故障信息。經過包絡分析、譜峭度分析方法[3-4]或循環平穩分析方法[5-6]解調處理后的滾動軸承振動信號特征序列故障信息更加顯,充分利用該序列所包含的故障模式信息進行模式識別,對提高故障識別準確率意義重大。
循環神經網絡(RNN)適合處理考慮序列前后關系的序列識別問題。針對RNN訓練過程中的梯度消失問題提出了長短時記憶神經網絡模型(LSTM-RNN),該模型已被應用于語義分析[7]、視頻分類[8]及情感分類[9]等問題。在故障診斷領域,LSTM-RNN被應用于航空發動機的故障診斷與預測[10]。由于滾動軸承故障信號具有復雜的調制現象,故障特征序列中的故障特征頻率及其邊頻帶包含著豐富的故障模式信息。利用LSTM-RNN模型具有記憶功能的特點對滾動軸承故障特征序列進行模式識別,訓練模型不僅可以學習故障特征頻率與邊頻帶之間的能量分布,而且可以學習各個特征頻率段之間的相互關系。
多標簽分類方法適用于樣本具有多種類別的分類問題,每個輸入樣本對應多個目標標簽[11],多標簽分類方法已被應用于音樂創作[12]、動作識別[13]及臨床診斷等領域[14]。為了充分利用滾動軸承故障特征信息,進一步提高LSTM-RNN模型的故障分類準確率并減少模型的訓練樣本量,筆者在已有的多標簽分類方法基礎上,結合滾動軸承故障特征分類特點,將多標簽按照權重比組合成為綜合標簽,并利用綜合標簽提高LSTM-RNN模型分類準確性。首先,建立滾動軸承故障信號仿真模型,分析多種滾動軸承故障特征;其次,基于滾動軸承故障特征提出多標簽LSTM-RNN分類方法,并利用滾動軸承故障仿真信號對多標簽LSTM-RNN分類方法進行驗證;最后,搭建滾動軸承故障模擬試驗平臺,利用多種轉速滾動軸承故障信號的多種故障特征向量驗證多標簽LSTM-RNN故障分類方法的有效性。
RNN模型引入了定向循環的結構,這種結構使RNN相比于前饋神經網絡(feedforward neural network, 簡稱FNN)更加善于解決具有長期依賴特性的序列學習問題[15]。RNN主要應用在處理考慮歷史數據影響的序列數據。因此,不同于FNN神經網絡模型,如圖1所示,RNN神經網絡在隱藏層內前后單元是連接的。例如,第i個神經元每一個隱藏層單元接受的信息來自于第i個輸入單元和第i-1個隱藏層單元。這樣的網絡結構使RNN能夠處理現實環境中的很多應用,如語音識別、機器翻譯及動作識別等。如果將滾動軸承故障特征矢量劃分為一組序列,RNN同樣具有處理滾動軸承故障分類的能力。

圖1 RNN網絡結構圖Fig.1 Network structure of RNN
RNN模型的分類原理是通過正向傳播階段和誤差反向傳播階段訓練RNN模型[16]。在正向傳播階段輸入信號經過隱含層處理達到輸出層,計算期望輸出Hj和實際輸出Oj之間的誤差,均方差為
(1)
在模型訓練的反向傳播階段,輸出層誤差沿原路徑反向傳播,到達輸入層。反向傳播過程中修改各層神經元的連接權值,使得期望輸出與實際輸出的總體誤差逐步達到最小。修正量為
(k=1,2,…,K;i=1,2,I)
(2)
其中:k為輸入模式的個數;i為隱含層神經元個數;α為動量因子;η為學習率;m為迭代次數。
當誤差縮小到事先指定的范圍或迭代次數達到設定值,則訓練結束。通過以上兩個過程,可以完成RNN模型的訓練。訓練結束后采用交叉熵函數進行判別期望輸出序列與標簽之間的相似度,相似度大的標簽判別為序列所屬類別。
隨著RNN模型中序列數量的不斷累加,在反饋過程中誤差信息的損失量也在累加,當損失量積累到一定程度,初始信息就會退化,出現梯度消失效應。梯度消失是阻礙RNN應用的重要問題,當序列到達一定長度后,歷史信息無法在后續的單元中進行體現,這樣就喪失了RNN的序列學習功能。
針對RNN的梯度消失問題,一種更加復雜的結構形式LSTM被引入作為RNN的隱藏層單元。LSTM結構可以根據輸入信息與細胞狀態決定對細胞記憶覆蓋、取回或保留,有效解決了RNN梯度消失問題[17]。為了更多地保留細胞信息,避免由于門關閉細胞信息的丟失,在LSTM記憶模塊結構中增加窺視孔連接[18]。針對滾動軸承故障診斷的特點,需要加強序列中各個細胞狀態之間的關聯性,筆者采用帶有窺視孔連接的LSTM記憶模塊結構形式[19]。LSTM記憶模塊包括遺忘門、輸入門和輸出門結構,通過這3個門結構取舍輸入信息并更新細胞狀態。如圖2所示,遺忘門結構由sigmoid層和乘法單元組成;輸入門由sigmoid層、tanh層和乘法單元組成;輸出門由sigmoid層、乘法單元和tanh層組成。

圖2 帶有窺視孔連接的LSTM記憶模塊結構圖
Fig.2 Memory module structure diagram of LSTM with peephole connection
[20]
ft=sigm(Wxt,ftxt+Wht-1,ftht-1+WCt-1,ftCt-1+bft)
(3)
it=sigm(Wxt,itxt+Wht-1,itht-1+WCt-1,itCt-1+bit)
(4)
gt=sigm(Wxt,itxt+Wht-1,itht-1+WCt-1,itCt-1+bit)
(5)
Ct=ftCt-1+itgt
(6)
ot=sigm(Wxt,otxt+Wht,otht-1+WCt,otCt+bot)
(7)
ht=ottanh(Ct)
(8)
其中:xt為輸入單元;ht為輸出單元;ft為遺忘門狀態;it為輸入門狀態;ot為輸出門狀態;Ct為細胞狀態;gt為候選細胞狀態;W為權重系數;b為偏置系數;sigm()為Sigmoid函數;tanh()為雙曲正切函數。
帶有窺視孔連接的LSTM記憶模塊能夠使前一個細胞狀態參與到遺忘門、輸入門和輸出門的計算過程中。由式(3)~(8)所示,在LSTM-RNN模型不斷學習過程中,輸入序列中各個元素與前一個細胞狀態共同作為細胞訓練的輸入量,使LSTM-RNN模型具有了記憶功能。在滾動軸承故障分類過程中,解調后的頻譜特征作為主要的故障識別特征被廣泛應用。滾動軸承故障信號各個特征頻率間的幅值關系是判斷故障類型的主要依據。因此,具有記憶功能的LSTM-RNN模型符合滾動軸承故障分類要求。
當滾動軸承部件上的點蝕位置與其他零部件發生運動接觸時,點蝕故障將引發振動信號中的周期性沖擊現象。沖擊頻率取決于點蝕發生的零部件位置,當滾動軸承幾何結構確定后,外圈、內圈、滾子等零部件上發生點蝕故障時產生的故障沖擊頻率可由式(9)~(11)計算[21]
(9)
(10)
(11)
其中:fout為外圈故障頻率;fin為內圈故障頻率;fball為滾子故障頻率;Nb為滾子數量;d為滾子直徑;D為軸承節圓直徑;fr為轉動頻率;θ為壓力角。
針對不同滾動軸承故障類型,故障信號仿真模型主要考慮由點蝕引起的沖擊振蕩信號和環境噪聲信號,其中沖擊幅值受到不同旋轉體轉動調制。滾動軸承故障信號仿真模型為
(12)
其中:x(t)為滾動軸承故障振動信號;Ai為第i次沖擊的幅值;s(t)為點蝕故障產生的沖擊振蕩;T為2次沖擊之間的時間間隔;τi為第i次故障沖擊時軸承滾子打滑引起的周期T的波動;n(t)為零均值平穩隨機噪聲;t為時間。
第i次沖擊的幅值Ai為
Ai=cos(2πfAt+φA)+CA+randn(t)
(13)
其中:fA為調制頻率,為零均值隨機信號;φA和CA為任意常數。
根據點蝕故障位置不同,fA的取值不同,外圈發生故障時fA=0,內圈發生故障時fA=fr,滾子發生故障時fA=fc,fc為保持架轉動頻率
(14)
沖擊振蕩s(t)是以系統固有頻率為振蕩頻率的振蕩衰減信號
s(t)=e-Btsin2πfnt
(15)
其中:fn為系統固有頻率;B為常數。
表1為滾動軸承故障信號仿真建模所采用的參數,利用MB ER-12K滾動軸承尺寸計算滾動軸承特征頻率,其中MB ER-12K滾動軸承為試驗系統中所裝配的軸承型號。

表1 故障信號仿真建模參數表
利用式(12)~(15)和表1中參數得到一組轉頻為40Hz的滾動軸承故障仿真信號,經過歸一化后的時域信號如圖3所示,按照式(9)~(11)計算得到3種故障信號沖擊頻率。內圈故障和滾子故障仿真時域信號沖擊幅值調制現象比外圈故障信號更加明顯,周期性沖擊及其調制現象都會在頻譜上體現。

圖3 滾動軸承故障仿真信號Fig.3 Simulated fault signal of rolling bearings
當滾動部件上的點蝕位置與其他零部件發生運動接觸時,點蝕故障將引發周期性沖擊現象。滾動軸承振動信號經頻域分析后,特定故障頻率的振動能量成分能夠反映滾動軸承故障類型。但由于故障特征淹沒在高頻噪聲中,滾動軸承故障信號需要經過解調處理提取故障特征,常用的解調方法有包絡分析、譜峭度分析方法及循環平穩分析方法。將圖3中滾動軸承故障仿真信號進行平方包絡后再進行傅里葉變換,分別得到滾動軸承外圈故障、內圈故障和滾子故障信號頻譜圖,見圖4。為了對比說明滾動軸承故障特征頻率,利用式(9)~(11)和式(14)計算轉頻為40Hz時的故障特征頻率,如表2所示。

圖4 滾動軸承故障仿真信號平方包絡頻譜圖Fig.4 Frequency spectrum of square envelope signal of faulty rolling bearing

表2 滾動軸承故障特征頻率表
如圖4(a)所示的外圈故障仿真信號頻譜中,在外圈故障特征頻率123.4Hz和其2倍頻處有明顯峰值;圖4(b)所示的內圈故障仿真信號頻譜中,在轉動頻率2倍頻80.47Hz、3倍頻120.3Hz和外圈故障頻率200Hz處有明顯峰值;圖4(c)所示的滾子故障仿真信號頻譜中,在保持架轉頻2倍頻30.47Hz、3倍頻48.44Hz和滾子故障頻率78.91Hz處有明顯峰值。在故障信號建模過程中考慮了軸承滾子隨機打滑因素,導致特征頻率在計算值附近產生一定波動。利用譜峭度濾波方法和循環平穩分析方法均可以得到故障特征向量。在試驗研究中將對不同特征提取方法得到的特征向量進行機器學習并進行分類,以分類結果分析討論特征提取方法的特點。
在對滾動軸承進行故障診斷過程中,維護人員以頻譜作為主要的判斷依據。由式(9)~(11)得到滾動軸承故障特征頻率,利用故障特征頻率、轉頻及其倍頻和邊頻帶的幅值大小關系可以說明滾動軸承故障類型。
基于以上對滾動軸承故障診斷經驗的分析,筆者提出以轉頻、2~6倍轉頻、外圈故障特征頻率、內圈故障特征頻率及滾子故障特征頻率為中心頻率、20Hz為帶寬生成10個頻譜序列。以此序列為LSTM-RNN模型的學習目標。這種特征編碼方式既保留了特征頻率點的邊頻帶信息,又考慮了多個特征頻率段之間的關系,且特征頻率序列包含了滾動軸承打滑所引起特征頻率隨機波動信息。特征頻率序列包含了故障分類所需要的信息,為LSTM-RNN學習模型提供充足信息保證分類成功率。
分類標簽采用L1,L2,L3及L4分別作為健康狀態、外圈故障、內圈故障及滾子故障。其中
(16)

筆者基于滾動軸承故障特征提出一種多標簽LSTM-RNN故障分類模型。LSTM-RNN分類模型利用式(3)~(9)進行正向傳播計算,并利用誤差反向傳播算法對序列中各個細胞狀態進行更新,如圖5所示。

圖5 LSTM-RNN分類模型結構圖Fig.5 Structure diagram of LSTM-RNN classification model
多標簽LSTM-RNN分類模型與單標簽分類模型的區別如下:多標簽模型中輸入序列中每個元素都對應1個輸出元素,每個輸出元素均采用絕對值損失函數進行誤差反向傳播更新序列內細胞狀態;而單標簽模型中只在最后一個元素位置采用絕對值損失函數進行誤差反向傳播更新全序列細胞狀態。
在LSTM-RNN模型訓練結束后,可以利用該模型進行故障分類。將測試數據集帶入模型得到輸出數據,并將輸出數據帶入多標簽分類器中進行分類。多標簽分類器的操作流程是先利用Softmax函數對每個元素內的輸出值進行歸一化處理,再利用交叉熵函數判定輸出值與標簽之間的相似性。單個標簽和輸出元素之間損失值計算如下

(17)

基于每個標簽的損失值可以計算序列的損失值,判斷序列相似性
(18)
其中:αi為權重系數。
αi由訓練集數據計算得到,將訓練集數據序列中的每個元素與標簽序列中的每個標簽進行交叉熵計算,并將交叉熵值帶入Softmax函數,得到每個標簽的權重系數αi。
單標簽分類方法僅采用最后一個標簽進行故障分類,而多標簽分類方法則通過所有標簽進行故障分類,并分配了每個標簽的權重比例。因此,多標簽分類方法對特征向量信息利用的更加充分。
分別利用多標簽和單標簽LSTM-RNN分類模型對滾動軸承故障仿真信號特征向量進行分類,驗證多標簽LSTM-RNN方法的有效性。首先,將圖4中滾動軸承故障仿真信號特征向量訓練集按照前述編碼方法進行特征編碼;其次,分別利用多標簽和單標簽LSTM-RNN分類模型對滾動軸承故障仿真信號進行分類,利用滾動軸承仿真信號測試集進行分類正確率驗證。其中:訓練模型參數學習率設置為0.1;動量因子設置為0.5;學習率變化因子設置為0.5。
多標簽LSTM-RNN分類模型中各標簽權重比例如圖6所示,按照此權重比例分配各個標簽在序列分類中的所占比重。

圖6 仿真故障信號各標簽權重比例分配圖Fig.6 Weight distribution of each label for the simulated fault signal
為了對比多標簽LSTM-RNN分類模型和單標簽LSTM-RNN分類模型的分類效果,對不同樣本量訓練集進行分類并統計分類正確率,如圖7所示。隨著訓練集樣本量逐漸增加時,多標簽和單標簽LSTM-RNN分類模型的分類正確率均有所提高。利用多項式擬合圖7中樣本點,虛線型擬合曲線最高點代表多標簽LSTM-RNN分類模型最高正確率Rm=0.89,相同方法得到單標簽LSTM-RNN分類模型正確率最高為Ro=0.62。取擬合曲線與最高正確率位置水平線交點,在交點中取最小橫坐標值作為多標簽和單標簽分類方法達到最大正確率時所需樣本量Sm和So,其中Sm=949,So=1 171。仿真數據集分類結果說明,多標簽LSTM-RNN分類方法比單標簽LSTM-RNN分類方法正確率更高,訓練所需要樣本量更少。

圖7 多標簽和單標簽LSTM-RNN分類正確率對比圖Fig.7 Comparison of classification accuracy between multi-label and single-label LSTM-RNN
滾動軸承故障模擬試驗臺由電機、調速器、聯軸器、轉子盤、主軸和軸承組成,振動信號由加速度傳感器采集,采集頻率為25.6kHz。圖8 (a)為滾動軸承故障模擬試驗臺的軸系結構。軸承可拆卸替換為4種健康狀態軸承,分別為健康軸承、外圈故障軸承、內圈故障軸承和滾子故障軸承。點蝕故障發生位置分別為外圈、內圈和滾子。圖8 (b)為滾動軸承不同故障類型的故障零部件。

圖8 滾動軸承故障模擬試驗裝置Fig.8 Experiment device for fault simulation of rolling bearing
分別采集健康狀態軸承、外圈故障軸承、內圈故障軸承和滾子故障軸承振動信號,如圖9所示。利用平方包絡、譜峭度濾波和循環平穩方法對不同類型振動信號進行特征提取,將3類特征向量劃分為訓練集和測試集作為分類試驗的數據集。

圖9 滾動軸承不同狀態時域信號Fig.9 Time domain signals of rolling bearings in different states
滾動軸承故障信號平方包絡信號頻譜如圖10所示。健康軸承信號頻譜中在轉頻、2倍轉頻和4倍轉頻處有明顯突出幅值成分;外圈故障信號頻譜中在轉頻、2倍轉頻和外圈故障頻率處有明顯突出幅值成分;內圈故障信號頻譜中在轉頻、2倍轉頻和內圈故障頻率處有明顯突出幅值成分。

圖10 滾動軸承不同狀態平方包絡信號頻譜Fig.10 Spectrum of square envelope signal of rolling bearing in different states
分別對實測滾動軸承故障特征向量進行編碼,并利用單標簽和多標簽LSTM-RNN分類方法對特征序列進行分類試驗。以轉頻40Hz的平方包絡振動信號的頻率特征向量數據集為例,說明分類結果的評價指標。
訓練樣本量為4 000,測試樣本量為500。樣本采集、特征提取、模型訓練和測試等試驗流程如下:
1) 分3次采集90s滾動軸承振動加速度數據,每次采集時間為30s,采樣頻率為25.6kHz;
2) 將90s振動加速度信號劃分為4 000個訓練樣本和500個測試樣本;
3) 對訓練樣本和測試樣本進行數據特征提取,可得到平方包絡頻譜、譜峭度濾波頻譜或循環平穩度;
4) 將每個樣本劃分為由若干特征頻率段組成的一組序列;
5) 將4 000個樣本分別代入多標簽和單標簽LSTM-RNN模型中進行訓練,每隔40個樣本進行1次測試,測試分類準確率;
6) 將式(18)中權重系數提取出來繪制標簽權重分配圖,如圖11(a)所示;
7) 將不同樣本量下測試樣本準確率提取出來繪制準確率變化曲線,如圖11(b)所示。
利用實測滾動軸承數據訓練集分別訓練多標簽和單標簽LSTM-RNN分類模型,用測試集測試不同樣本量情況下的分類正確率,如圖11(a)所示。為了對比多標簽和單標簽LSTM-RNN分類方法的有效性,利用多標簽分類方法最大正確率Rm和單標簽分類方法Ro評估分類正確率。利用多項式擬合圖11(b)中樣本點,取擬合曲線與最高正確率位置水平線交點,在交點中取最小橫坐標值作為多標簽和單標簽分類方法達到最大正確率時所需樣本量Sm和So,并以此評估分類方法的效率。

圖11 特征序列F1訓練模型分類結果Fig.11 Classification results of training model with feature sequence F1
采用不同特征頻率序列進行LSTM-RNN模型的訓練和故障分類試驗。設特征序列F1特征頻率為1/2倍轉頻、轉頻、2~6倍轉頻、外圈故障特征頻率、內圈故障特征頻率及滾子故障特征頻率,共10段序列;設特征序列F2為轉頻、2~5倍轉頻、外圈故障特征頻率、內圈故障特征頻率、滾子故障特征頻率、2倍外圈故障特征頻率、2倍內圈故障特征頻率及2倍滾子故障特征頻率,共10段序列。特征序列F1中每段序列頻率范圍為20Hz,特征序列F2中每段序列頻率范圍為45Hz。對比2類不同特征序列情況,圖11為F1特征序列訓練分類結果,圖12為F2特征序列訓練分類結果。利用特征F1和特征F2序列進行多標簽分類時,最大正確率相同,特征F2序列在單標簽分類時分類正確率會提高。本研究后續試驗采用特征F1序列進行試驗。

圖12 特征序列F2訓練模型分類結果Fig.12 Classification results of training model with feature sequence F2
分別利用多標簽和單標簽LSTM-RNN分類方法對實測滾動軸承數據訓練集進行故障分類試驗。數據集包括3類轉頻信號,分別為35,40和45Hz。每種轉頻信號使用3種特征提取方法得到3類特征向量,分別為平方包絡信號頻譜、譜峭度濾波信號頻譜和循環平穩度。分類試驗對共計9組數據集分別進行訓練和測試,測試結果分別以正確率和所需樣本量為評價指標,見圖11。
多標簽分類方法正確率Rm和單標簽分類方法正確率Ro統計結果見表3。取9組數據的正確率差值平均值,多標簽分類方法比單標簽分類方法正確率平均高30.14%。利用多標簽分類方法對由3種特征提取方法得到的特征向量進行分類,正確率均可接近100%。但是如果使用單標簽分類方法,基于循環平穩度的分類正確率偏低,原因在于經過循環平穩分析方法解調后得到的循環平穩度信息量相對較少。雖然特征頻率相比于其他特征提取方法更加明顯,但是訓練樣本信息量過少不利于分類模型進行學習。

表3 多標簽分類模型與單標簽分類模型分類正確率對比統計表
多標簽分類方法訓練所需樣本量Sm和單標簽分類方法訓練所需樣本量So統計結果見表4。取9組數據中正確率差ΔR<20%的數據組,其多標簽分類方法訓練所需數據量比單標簽分類方法訓練所需數據量平均減少69.55%,說明當2種分類方法正確率接近的情況下,多標簽分類方法訓練速度更

表4 多標簽分類模型與單標簽分類模型所需樣本量對比統計表
ΔS=(So-Sm)/S。
快,完成訓練需要樣本量更少。對比3種特征向量所需樣本量,循環平穩度數據集所需訓練樣本量更多。
多標簽LSTM-RNN分類方法相比于單標簽分類方法能夠學習更多特征信息。滾動軸承故障分類試驗結果顯示其正確率更高,所需樣本量更少,因此,多標簽LSTM-RNN分類方法更加適合滾動軸承故障分類。
1) 具有記憶功能的LSTM-RNN模型適合于滾動軸承故障特征序列多個元素之間的關系學習,按照每個標簽的相似程度分配多個標簽的決策比重,多標簽分類方法更加充分利用滾動軸承特征序列信息進行分類。
2) 在平方包絡信號頻譜、譜峭度濾波信號頻譜和循環平穩度3類特征向量中,在保證相同分類正確率的前提下,循環平穩度由于數據量少導致需要更多訓練樣本。
3) 經過仿真數據和試驗數據驗證,多標簽LSTM-RNN分類方法相比于單標簽分類方法正確率平均高30.14%。在保證2種分類方法正確率20%以內的情況下,多標簽LSTM-RNN分類方法訓練所需樣本量比單標簽分類方法平均減少69.55%。