于飛, 樊清川, 宣敏
(海軍工程大學 電氣工程學院,湖北 武漢 430033)
滾動軸承的運行狀態能夠直接影響電機的整體性能,電機故障中有40%左右是由軸承故障引發[1],是電機健康監測的重要對象,通過有效評估電機軸承的退化狀態并及時預測軸承故障,進行早期維護和檢修,可以避免工業中的經濟損失和重大安全事故。電機軸承故障預測的關鍵在于兩點:一是確定合適的軸承性能退化指標,二是搭建有效的故障預測模型。
性能退化指標是故障判別標準的關鍵,現有的研究中大多用峰度、均方根、峰峰值等無量綱參數作為性能退化指標,預測模型是故障預測的核心,近年來有許多學者利用機器學習算法有效地實現了軸承的故障預測。文獻[2]利用字典學習法對振動信號進行降噪處理,并采用反向傳播(back propagation,BP)神經網絡進行軸承故障預測,證明了BP神經網絡在軸承故障預測中的有效性,但其權值和閾值的設置較大地影響了預測的精度;文獻[3]使用遞歸能量化分析以及自回歸模型實現了退化的檢測和狀態的預測;文獻[4]引入了兩種新型混合模型相互結合,實現了軸承的剩余壽命預測;文獻[5]提出利用堆疊去噪自編碼累積和時滯最小二乘支持向量機的牽引電機狀態預測方法,利用堆疊去噪自編碼器進行特征降維并獲得相關退化指標,通過對退化指標的預測實現運行狀態預測;文獻[6]利用核主元分析法構建T2和SPE統計量作為電機軸承退化指標,將預處理過的振動信號輸入支持向量機進行回歸計算,實現了軸承性能退化趨勢的合理追蹤。循環神經網絡(recurrent neural network, RNN)早已應用在軸承的健康狀態預測中[7]。基于前人的研究,本文利用RNN的一個優秀變體——長短時記憶網絡(long short-term memory, LSTM),LSTM具有良好的記憶存儲特性,記錄序列有用信息從而獲得更優的預測精度。文獻[8]將“波形熵”作為性能退化指標,利用LSTM網絡實現了滾動軸承的壽命預測。上述方法都實現了軸承退化狀態的有效預測,但在方法的精度和穩定性上有待提高。
高質量的數據特征能夠大大提高預測分析的性能,集合經驗模態分解(ensemble empirical mode decomposition, EEMD)作為一種自主分解數據方法解決了經驗模態分解存在的模態混疊等現象,在處理振動信號時效果較好,但其分解后遺留在分量中的白噪聲會出現重構誤差,為解決以上問題,本文選擇利用互補經驗模態分解[9]提取振動信號的固有模態分量(intrinsic mode function,IMF),并計算各組IMF分量的奇異值能量譜確定性能退化指標,再提出使用蝗蟲優化算法優化雙向長短時記憶網絡(bidirectional long short-term memory,Bi-LSTM)的故障預測模型。將該模型應用在電機軸承故障預測中,最后,實驗對比分析證實了本文所提方法在電機軸承故障預測中的優越性。
模態分解的方法很多,互補集合經驗模態分解(complementary ensemble empirical mode decomposition,CEEMD)是基于經驗模態分解(empirical mode decomposition,EMD)和EEMD分解改進而來,既消除了EMD分解中時常存在的模態混疊現象,又優化了EEMD分解過程效率較低、時間過長的情況。CEEMD分解在信號中引入互補的高斯白噪聲,借助噪聲信號相互獨立,絕對負相關,信號分解時能夠盡可能地抵消掉冗余的噪聲[10]。CEEMD分解過程如下:
1)在預處理的信號x(t)中加入N次幅值相同的互補白噪聲μ,組成新的序列為:
(1)

(2)
式中cj為CEEMD分解的第j個IMF分量。
當電機軸承將要出現故障時,各IMF的能量都會發生變化,信號能量逐漸分散,奇異值能量隨之變化。當出現明顯故障狀態時,噪聲比例快速增加,信號能量迅速增大,奇異值能量迅速增大。鑒于上述分析,奇異值能量譜可以作為表征電機軸承狀態退化的性能指標。
振動信號經過CEMMD分解,得到IMF分量矩陣為
B=[IMF1,IMF2,…,IMFk]T。
(3)
對每組IMF分量進行奇異值分解(singular value decomposition,SVD),該項技術以其出色的去噪和周期成分提取效果,在故障診斷領域早有研究,奇異值分解的具體過程如下:
一個實矩陣A∈Rm×n,一定存在一個正交矩陣U=[u1,u2,…,um]∈Rm×n和正交矩陣V=[v1,v2,…,vn]∈Rm×n,使得
A=USVT。
(4)
式中S=[diag(s1,s2,…,sk),O],或其轉置,O表示零矩陣,k=min(m,n),且有s1≥s2,…,≥sk>0,即為A的奇異值[12]。
解出矩陣B對應的奇異值矩陣為
S=[s1,s2,…,sk]T。
(5)
由文獻[13]可知,信號能量可表示為
(6)
蝗蟲優化算法(grasshopper optimization algorithm,GOA)是2017年由Arora[14]等人提出的一種新的啟發式優化算法。算法思想是基于蝗蟲覓食得來,每個蝗蟲個體即為搜索空間的一個搜索個體,成蟲的搜索范圍較廣、跳躍能力較強,負責種群全局搜索任務,幼蟲的搜索范圍較窄,負責種群的局部搜索任務。GOA的具體過程如下:
1)初始化種群規模N、種群位置Xi、最大迭代次數Tmax以及參數cmax和cmin,則
Xi=Si+Gi+Ai。
(7)
式中:Si表示種群個體之間對第i個個體的影響;Gi表示第i只蝗蟲受到的重力影響;Ai表示第i只蝗蟲受到的風力作用。計算式子為:
(8)
s(r)=fe-r/l-e-r。
(9)
式中:|xi-xj|表示第i只蝗蟲與第j只蝗蟲間的距離;s(r)表示蝗蟲個體間的相互作用力,當s>0時,個體間相互吸引,當s<0時,個體間相互排斥;f、l分別表示吸引力度和吸引尺度,均為常數,本文取值f=0.5,l=1.5。則有
(10)
(11)

2)計算每只蝗蟲個體的適應度函數值,并將最優蝗蟲個體寄存在變量Ffit。
3)基于下式更新參數c,表達式為
(12)
式中t表示當前的迭代次數。
4)基于下式更新蝗蟲個體的位置并計算每只個體的適應度值,表達式為
(13)


6)判斷是否達到迭代終止條件,若是則返回最優個體,否則重復步驟3)~步驟5)。
GOA算法流程如圖1所示。

圖1 GOA算法流程
長短時記憶網絡繼承了循環神經網絡的可記憶性功能,有利于讀取信號序列的非線性特點,LSTM網絡還引入了門控單元,從而解決長序列數據的長期依賴問題,避免網絡訓練過程中出現梯度消失或爆炸,以便保留每一循環單元的不同時間尺度信息特征[15-16]。LSTM單元結構如圖2所示。

圖2 LSTM的單元結構
LSTM網絡的計算過程如下:
1)由遺忘門判斷是否保留前一時刻細胞的狀態信息Ct-1。遺忘門輸入前一時刻的隱藏狀態ht-1和新輸入的數據Xt,輸出遺忘門的值為
ft=σ(Wf[ht-1,xt]+bf)。
(14)

it=σ(Wi[ht-1,xt]+bi);
(15)
(16)

ht=ottanh(Ct);
(17)
Ot=σ(Wo[ht-1,xt]+bo)。
(18)
式中:Wf,Wi,Wc,Wo和bf,bi,bc,bo對應各門的權重矩陣和偏差;σ表示sigmoid函數。此處介紹的是前向LSTM,后向LSTM的基本結構與此相同,區別在于將原信號以倒序的方式輸入網絡。
雖然LSTM網絡記憶功能強大,能夠提取歷史序列中的有用信息,但其只能提取序列的前向信息,從而造成后向序列中的有用信息被浪費掉。Bi-LSTM是對LSTM的改進,該網絡連接了一前一后兩個反向的LSTM網絡,使得模型的序列信息提取能力有了進一步提升。Bi-LSTM網絡結構如圖3所示,前傳層訓練前向序列,后傳層訓練后向序列,共同作用。

圖3 Bi-LSTM網絡結構
Bi-LSTM網絡數學表達式為:
(19)
(20)
(21)

利用Bi-LSTM模型進行預測時,超參數眾多影響著模型的精度與效率,其中初始學習率α、隱藏層神經元個數m以及迭代次數H影響作用較大[17]。本文利用GOA算法對這3個參數進行迭代尋優,以增強模型的故障預測性能。基于GOA優化的Bi-LSTM電機軸承故障預測流程如圖4所示,步驟如下:

圖4 電機軸承故障預測流程圖
1)數據采集。在電機軸承的垂直方向和水平方向布置兩個振動傳感器,采集不同工況下的原始振動數據。
2)數據與處理。采集電機軸承的振動信號,利用CEEMD分解提取振動信號的IMF分量并進行歸一化。
3)建立退化指標。計算每組IMF分量的奇異值并求其能量組成奇異值能量譜,并進行平滑去噪處理,將奇異值能量譜作為性能退化指標。
4)訓練模型。將奇異值能量譜以一定比例分為訓練集和測試集,基于訓練集數據,以真實值與預測值的均方根誤差為適應度值,利用蝗蟲優化算法優化Bi-LSTM網絡。
5)故障預測。將訓練好的最優超參數代入Bi-LSTM網絡,進行故障預測測試并與真實狀態進行對比。
為驗證本文建立模型有效可行,使用辛辛那提大學軸承退化數據集[18]進行實驗驗證。該數據集振動信號的采樣頻率為20 kHz,采樣周期為10 min,第一組實驗包含4個軸承,本文選用3號軸承的振動數據,3號軸承共有2 156組振動數據,每組數據包含20 180個點,反映了3號軸承從正常運行到出現內圈嚴重故障,整個運行周期的振動信號。為了加快運算速度,這里提取每組數據的前10 000個點進行計算,得到信號波形如圖5所示。

圖5 振動信號波形圖
首先,利用CEEMD算法對軸承振動信號進行分解,得到10個IMF分量以及1個剩余分量。然后,計算各組IMF分量的奇異值能量,得到奇異值能量譜如圖6所示,可以看出,數據中存在很多噪聲,這會影響預測效果,于是對其進行平滑降噪處理,如圖7所示。

圖6 原始信號奇異值能量譜

圖7 降噪后的奇異值能量譜
軸承的時域振動信號近似呈高斯分布,由圖6可知,電機軸承衰退過程中,在每個階段其性能退化指標會出現局部差異的特點,可將整個周期的運行退化情況劃分成三個階段:階段Ⅰ,實驗剛起步,振動信號僅出現少量的頻率成分,能量較為集中,奇異值分解結果也僅集中在少數成分上,求得奇異值能量較小,隨時間變化非常穩定,軸承狀態優良、運行穩定、未發生故障;階段Ⅱ,軸承正常運轉,局部奇異值能量時而出現不合理的波動,表示在其工作過程中可能出現機械整體抖動或是輕微磨損的情況,屬于正常現象,利用Bi-LSTM模型進行故障預測是基于時序信號的整體趨勢,出現這種現象并不會影響預測的效果;階段Ⅲ,隨著波動頻率增多,此時軸承磨損加重,信號中出現了復雜的故障頻率與共振頻率,信號的能量以及分解的奇異值也隨之分散,導致奇異值能量增大,軸承處于性能衰退期,故障程度也隨之加劇。根據實驗經驗,設置故障閾值為70,奇異值能量超過閾值則被認定為嚴重故障,為避免振動信號出現波動或誤采樣的情況,規定指標超過閾值5次,電機停機進行檢修。
由于電機在運行至21 560 min時軸承故障程度已經加劇,應當更早地停止運行,因此在故障加劇后的數據不具有預測意義,選取第1 900組到2 125組的數據作為訓練集,第2 126組到2 150組的數據作為測試集。利用訓練集數據訓練GOA-Bi-LSTM模型,蝗蟲優化算法初始參數如表1所示,為了比較GOA算法的優越性,這里同時使用鯨魚優化算法(whale optimization algorithm,WOA)進行優化,依據經驗設置WOA的參數,以均方根誤差(root mean square error,RMSE)作為適應度函數,其隨迭代次數變化曲線如圖8所示。獲得最優超參數為:初始學習率α=0.003、隱藏層神經元個數m=152以及迭代次數H=237。

表1 GOA參數

圖8 迭代尋優過程
由圖8可得,GOA算法在迭代進行到第20代時開始有了較好的收斂效果,WOA算法在第13次迭代時開始了收斂,收斂速度較快,但其收斂時未達到最低適應度值,說明WOA算法容易陷入局部最優解。其次,GOA算法在收斂時的均方根誤差也較小,表明其預測精度更優。
利用訓練好的Bi-LSTM網絡進行一步迭代預測,在進行每一次預測時,將前一次預測的結果加在當前輸入的結尾,預測結果如圖9所示。

圖9 GOA-Bi-LSTM故障預測結果
為驗證本文所建立模型的優越性,選取極限學習機(extreme learning machine,ELM)、時滯性支持向量回歸(time delay support vector regression,TD-SVR)模型、深度卷積神經網絡(deep convolutional neural network, DCNN)模型進行對比實驗,數據集劃分與本文完全相同,參數設置完全依照經驗數據,預測結果如圖10~圖12所示。

圖10 ELM故障預測結果

圖11 TD-SVR故障預測結果

圖12 DCNN故障預測結果
從圖9~圖12可以直觀地看出,本文所建立的模型預測精度要優于其他模型的精度。為了準確評估模型預測的精度,本文利用RMSE和那什系數(Nash-Sutcliffe efficiency coefficient, NSE)作為評估標準,表達式為:
(22)
(23)


表2 預測結果對比
由表2可以看出,相較于ELM、RD-SVR、DCNN模型,本文所提模型的NSE值最接近于1,RMSE值最小,僅有5.713,說明GOA-Bi-LSTM的擬合效果最好,相比于ELM、TD-SVR、DCNN模型在電機軸承故障預測領域的預測精度最高。


表3 誤采樣對預測結果的影響

圖13 容錯性分析預測結果

本文建立了一種基于GOA優化Bi-LSTM模型的電機軸承故障預測方法。首先,利用CEEMD分解振動信號,提取振動信號的特征分量并計算奇異值能量譜構造性能退化指標;其次,利用GOA對Bi-LSTM網絡進行優化返回最優超參數;最后,利用優化好的Bi-LSTM網絡實現電機軸承的故障預測,得到結論如下:
1)利用奇異值能量譜作為性能退化指標,能夠很好地體現出電機軸承狀態的變化趨勢,能夠間接反應電機軸承的故障變化。
2)利用蝗蟲優化算法對雙向長短時記憶網絡的超參數進行優化,蝗蟲優化算法相較于鯨魚優化算法具有更高的收斂精度。
3)針對LSTM網絡處理前向序列,僅考慮前向信息而忽略了后向信息的情況,提出Bi-LSTM網絡,具有一前一后兩個互補的LSTM網絡,分別處理時間序列的前向和后向信息,提高了模型信息提取能力。
4)基于開源數據集,將本文模型與ELM、TD-SVR、DCNN模型進行對比分析,本文模型具有更高的預測精度以及更強的魯棒性。