趙志宏,李樂豪,楊紹普,李 晴
(1.石家莊鐵道大學 省部共建交通工程結構力學行為與系統安全國家重點試驗室,河北 石家莊 050043;2.石家莊鐵道大學 信息科學與技術學院,河北 石家莊 050043)
滾動軸承是機械設備中最常使用的零部件之一,對于機械設備的可靠性至關重要,滾動軸承的損壞輕則停機檢修,重則危害乘客的生命安全,因此對其展開健康監測具有重要意義。在滾動軸承監測過程中,對軸承進行剩余壽命預測是實現預測性維護的重要途徑[1]。
隨著滾動軸承壽命研究的不斷發展,壽命預測方法逐漸走向成熟,現有的預測方法有3種:基于失效機理的壽命預測、基于統計學的壽命預測和基于模型的壽命預測。基于模型的壽命預測中機器學習方法可以很好地針對不同退化趨勢進行擬合,具有原理簡單、專家經驗依賴少、適用性較廣等優點[2];文獻[3]利用支持向量機建立軸承壽命預測模型,較為準確地預測了滾動軸承的剩余壽命;文獻[4]以方根均值為特征指標評估軸承的退化狀態,并結合多變量支持向量機在小樣本下實現了軸承剩余壽命預測;文獻[5]使用多層感知機進行軸承剩余壽命預測,并與自回歸移動平均方法進行對比,驗證了多層感知機具有更好的預測效果。
2006年,文獻[6]提出了深度學習理論,深度學習以其強大的函數擬合、特征提取能力推動了很多領域的發展,由于深度學習模型相較于傳統的機器學習模型具有更深的網絡結構和更強的非線性能力,越來越多的專家學者使用深度學習模型展開軸承剩余壽命的研究;文獻[7]提出一種基于深度可分離卷積神經網絡(depthwise separable convolutional,DSC)的軸承壽命預測方法,得到了優于其他深度學習方法的預測結果;文獻[8]提出一種基于全卷積神經網絡的軸承壽命預測方法,并使用加權平均方法對預測值進行降噪,提高了預測精度,獲取了較為準確的軸承剩余壽命;文獻[9]提出一種基于多尺度卷積神經網絡的剩余壽命預測方法,提取軸承的多尺度退化特征信息,獲取了較高的預測精度。
本文使用深度可分離卷積提取軸承振動信號中的空間特征信息,利用門控循環單元(gated recurrent unit,GRU)進一步提取振動信號中蘊含的時間特征信息,并通過全連接層進一步進行特征提取和輸出健康指標(heath indicator,HI),利用Savitzky-Golay濾波器對獲取的健康指標進行降噪,然后將健康指標擬合為自變量為時間、因變量為已使用壽命的一次函數,較為準確地預測了軸承的剩余壽命。
深度可分離卷積的結構如圖1所示,主要由深度卷積和逐點卷積組成。傳統卷積每個通道中卷積核的數量與輸入的通道數一致,而深度卷積的一個通道只有一個卷積核,因而深度卷積可以大幅減小參數量和計算量;逐點卷積為一種卷積核大小為1×1的傳統卷積,通過逐點卷積可以融合每個通道對應位置提取到的特征,避免關鍵特征只存在于一個通道中,并且可以通過合理設置通道數實現特征的升維和降維。

圖1 深度可分離卷積結構
自注意力機制(Self-attention)是Transformer神經網絡的重要組成部分[10],常用于自然語言處理。自注意力機制計算時,每一個特征都會和其他特征進行加權計算,可以注意到不同特征之間的關系,并根據特征與特征之間的相關程度決定所提取的特征。自注意力機制的計算流程如圖2所示。

圖2 自注意力機制的計算流程
自注意力機制所提取的特征Z可通過softmax將Q、K之間的相關程度轉化為權重并乘以V獲取:
(1)
Q=X?WQ
(2)
K=X?WK
(3)
V=X?WV
(4)
式中:dk——Q的維度;
X——輸入數據;
Q、K、V——分別為X與WQ、WK、WV相乘后經過線性變換所提取到的特征;
Q?KT——Q、K之間的相關程度。
GRU是一種長短期記憶神經網絡(long short-term memory,LSTM)的變體,為門控循環單元,可以解決循環神經網絡梯度消失、梯度爆炸問題,是一種可以較好地捕獲時間序列中較遠時間距離依賴關系的神經網絡[11]。相較于LSTM,GRU單元3個門(遺忘門、輸入門和更新門)減少到了2個門:重置門和更新門,重置門決定了如何將新的輸入數據與前面GRU的狀態信息相結合,更新門決定了前面的狀態信息保存到當前時間GRU的量。GRU的結構如圖3所示。

圖3 GRU結構
當前GRU的狀態信息,即GRU輸出ht的計算方式為:
(5)
rt=σ(Wr?[ht-1,xt])
(6)
zt=σ(Wz?[ht-1,xt])
(7)
h't=tanh(Wh?[rt·ht-1,xt])
(8)

rt、zt——分別為重置門和更新門的輸出;
Wr、Wz和Wh——權值矩陣;
xt——當前GRU的輸入數據。
為解決軸承壽命預測問題,本文提出一種基于深度可分離卷積和門控循環單元、結合自注意力機制的DSC-Attention-GRU模型。DSC-Attention-GRU模型的網絡結構如圖4所示,圖4中,MaxPool為最大池化層(MaxPooling Layer),Dense為全連接層,DSConv為深度可分離卷積。

圖4 DSC-Attention-GRU模型網格結構
首先使用LayerNorm對輸入數據進行標準化[12],LayerNorm的計算方式為:
(9)
式中:x——輸入數據;
E(x)——求均值函數;
Var(x)——求標準差函數;
γ、β——分別為權值和偏置,是通過訓練確定的參數;
ε——極小的正數。
使用深度可分離卷積提取每個時間樣本的空間特征,深度可分離卷積網絡具有相同的參數,在深度可分離卷積層間使用PReLU激活函數增強模型的非線性能力,使用最大池化層縮減特征尺寸;使用Self-Attention關注對于軸承壽命預測有用的信息;使用殘差連接將深度可分離卷積所提取的特征和自注意力層提取的特征融合;使用GRU提取特征間存在的時序信息,獲取蘊含軸承剩余壽命信息的特征;最后使用全連接層進一步提取特征,輸出剩余壽命。神經網絡中的重要參數如表1所示。

表1 網絡參數
基于DSC-Attention-GRU的剩余壽命預測流程如圖5所示。可以分為訓練階段和測試階段。
(1) 第一步,構建DSC-Attention-GRU模型。
(2) 第二步,選擇DSC-Attention-GRU模型中的卷積核數量、通道數、學習率等超參數。
(3) 第三步,將訓練數據集中的每15段連續時間對應的水平和垂直方向的2個振動信號作為一個樣本,并以軸承已使用壽命為樣本制作標簽,該標簽為軸承實際的健康指標,具體計算方式為:
(10)
式中:HIj——第j個樣本對應的健康指標;
m——樣本個數。
使用訓練數據迭代訓練DSC-Attention-GRU模型,使用Adam優化器進行參數優化調整權重。
(4) 第四步,評估模型。如果損失收斂到設定的閾值,保存模型,進入測試階段;否則返回第三步繼續訓練。

圖5 剩余壽命預測流程
(1) 第一步,將測試數據輸入DSC-Attention-GRU模型得到健康指標;
(2) 第二步,使用Savitzky-Golay濾波器[13]對健康指標進行降噪;
(3) 第三步,對降噪后的健康指標進行一次函數擬合,擬合成時間為自變量,健康指標為因變量的一次函數。在一次函數下計算健康指標為1時對應的時間,該時間與當前時間的差值即為預測的剩余壽命。
為驗證本文所提方法在軸承剩余壽命預測中的有效性,使用PHM2012滾動軸承全壽命數據集[14]進行試驗。采集數據的試驗臺主要由采集模塊、調壓器、壓力傳感器、加速度計、交流電機、測試軸承等組成(圖6)。

圖6 數據采集試驗臺
測試軸承的型號為6804DU,試驗時對軸承施加徑向負載以加速軸承損壞,每隔10 s采集0.1 s的水平和垂直方向的振動加速度信號,采樣頻率為25.6 kHz,加速度超過20g時停機。分別在3種工況下對17個軸承進行了試驗,工況1的轉速為1 800 r/min,負載為4 000 N;工況2的轉速為1 650 r/min,負載為4 200 N;工況3的轉速為1 500 r/min,負載為5 000 N。軸承與其數據組成如表2所示。

表2 試驗數據
為了充分訓練模型以得到較好的預測結果,使用軸承1_3和軸承2_6作為測試集,其余軸承作為訓練集。模型訓練過程的損失曲線如圖7所示。從圖7可以看出,損失下降的速度較快,同時收斂的過程也較為穩定,沒有出現大幅度的波動,最終損失函數收斂至0.002 81,表明對訓練集的擬合情況較好。

圖7 損失曲線
在測試集軸承1_3和軸承2_6上獲取的健康指標如圖8所示,可以看到獲取的健康指標曲線圍繞實際的健康指標曲線上下波動,經過Savitzky-Golay濾波平滑后,整體曲線較為光滑,可以反映軸承從健康至完全失效的退化過程。降噪前后的單調性和趨勢性的對比如表3所示,可以看到單調性顯著增加;趨勢性也略有增加,在軸承1_3上增加了0.006,在軸承2_6上增加了0.037。通過圖8和表3可以看出,Savitzky-Golay濾波器降噪效果較好,可以有效改善健康指標的單調性和趨勢性,更好地擬合軸承的退化過程。

表3 降噪前后軸承健康指標單調性與趨勢性對比
使用t-SNE降維可視化方法[15]對軸承2_6的全壽命數據經過GRU提取的特征進行可視化,可視化結果如圖9所示。圖9中由淺到深的點代表從初始時刻到完全損壞時刻的樣本,可以看到不同階段的樣本排列有序,反映出DSC-Attention-GRU模型可以有效提取軸承的退化特征。

圖9 t-SNE降維可視化結果
在實時獲取健康指標后,將降噪后的健康指標擬合為一次函數,然后計算該一次函數增長至1所用的時間,使用誤差百分比對預測效果進行評價,誤差百分比Er的計算方式為:
(11)
式中:ActRUL——預測剩余壽命;
RUL——真實剩余壽命。
軸承1_3和軸承2_6在多個壽命階段的剩余壽命預測結果如表4所示。從表4中可以看到,軸承1_3隨著已使用壽命的增加,壽命預測效果逐漸改善,在已使用9 500 s和14 250 s時取得了較好的壽命預測效果,與真實剩余壽命的誤差較小;軸承2_6在多個壽命階段均都取得了較好的預測效果。

表4 剩余壽命預測結果
本文提出了一種使用自注意力機制的深度可分離卷積和門控循環單元的剩余壽命預測模型,使用Savitzky-Golay濾波器平滑健康指標,并結合一次函數擬合獲取剩余壽命值,實現了軸承的剩余壽命預測。壽命預測試驗結果表明:DSC-Attention-GRU模型可以較好地從振動信號中提取軸承的退化特征,可以有效擬合從振動信號到健康指標的映射關系。Savitzky-Golay濾波器對健康指標的平滑降噪效果較好,可以顯著提升健康指標的單調性,通過一次線性擬合可以較好地預測剩余壽命。