姜苗, 向陽, 魏建紅
(1.武漢理工大學 船海與能源動力工程學院,湖北 武漢 430000; 2.高性能船舶技術教育部重點實驗室(武漢理工大學),湖北 武漢 430000)
旋轉機械在現代社會中扮演著重要角色,廣泛應用于航天、交通、工業生產等行業,滾動軸承作為應用的核心部件,運行狀態將直接影響旋轉機械的運行狀態[1]。預測與健康管理(prognostic and health management, PHM)提高了旋轉機械的可靠性和安全性,剩余壽命(remaining useful life,RUL)預測作為PHM中的一項預測任務,預測了相關機械的RUL,維護機械,防止旋轉機械發生故障[2]。機械RUL預測建模被分為基于數學模型和基于數據驅動2類[3]。基于數學模型根據機械設備的退化失效機制、退化失效行為進行數學建模預測其RUL[3]。實際應用中,受機械工作環境及系統復雜性等因素的影響,完整實現機械系統數學建模較為困難。而隨著科學技術的發展,基于數據驅動的方法已逐步成為主流,其主要分為基于淺層機器學習的方法、基于深度學習的方法。深度學習技術也被不斷深入探索挖掘,由于其自適應的提取特征能力,克服了淺層機器學習技術的固有缺陷,減少了人為干預錯誤,使機械維護更加智能、準確、高效,廣泛應用在機械健康管理領域[4]。Babu等[5]提出的基于卷積神經網絡(convolution neural network, CNN)的回歸方法預測RUL將卷積神經網絡用于預測RUL。Ding等[6]為提高預測模型準確性和泛化能力對CNN進行改進,提出了深度卷積神經網絡(depth convolution neural network, DCNN)的網絡結構預測RUL。通過3個卷積層和2個全連接層構建了沒有池化層的DCNN剩余使用壽命預測模型。以上方法雖然實現了RUL的預測,但是忽略了壽命預測特征在時間上的相關性。
長期短時記憶(long short-term memory, LSTM)增加3個邏輯門對信息進行篩選,克服了傳統時間序列預測建模算法循環神經網絡(recurrent neural network, RNN)存在梯度消失和梯度爆炸問題。但缺點是增加了網絡計算時間。門控循環單元(gated recurrent unit, GRU)合并LSTM的輸入門與遺忘門,并構成更新門,減少了計算時間。Chen 等[7]提出基于溫度的門控循環單元神經網絡實現了鋰電池健康預測。Msa等[8]提出基于GRU的網絡入侵預警預測方法,根據報警歷史數據對模型進行訓練,實現了對未來可能入侵的報警預測。Tong等[9]根據復雜機械特征多樣、內部結構復雜、時序信息耦合等特點提出一種基于GRU的網絡模型預測復雜機械的RUL,通過剔除無效數據、降噪、計算特征等方法提高了復雜機械RUL的預測準確率。但是以上方法都是使用同一研究對象的壽命數據進行訓練和驗證,沒有使用未訓練工況下的數據驗證模型的預測性能。經試驗證明,使用某一個軸承數據訓練模型的預測能力存在局限性,不適用于預測其他軸承的RUL,在預測RUL時,模型的預測性能非常不穩定,預測準確率會下降。
本文考慮軸承狀態受歷史狀態影響,使用GRU搭建RUL預測模型。并提出使用遷移學習策略,即用未訓練軸承正常階段的特征預訓練模型,使模型學習到新軸承的狀態知識,然后預測軸承退化階段的RUL,提高預測模型的準確性以及泛化能力。
不同信號特征包含軸承不同維度的狀態信息,軸承的狀態信息越多,預測RUL的精確度越高。軸承信號的時域特征、頻域特征以及模糊熵作可為預測模型的輸入。通常采集的數據包含噪聲,為減小噪聲對預測精度的影響,使用五點三次平滑算法對原始數據進行預處理[10],再對處理的信號進行特征計算。
振動信號時域特征包含有量綱參數和無量綱參數,無量綱參數不會隨運行工況的變化而變化,反映了軸承的健康狀態[11]。偏度Cw、峭度Cq、波形因子Sf、峰值因子Ip這4個預測特征分別為:
(1)
(2)
(3)
(4)

時域特征能夠直觀地反映軸承狀態隨時間變化關系,但不能提供振動信號中關鍵頻率信息,因此本文對軸承振動信號進行了頻域特征提取。重心頻率fg和均方根頻率fe能不同程度的反映出信號頻率分布[12],2種預測特征分別為:
(5)
(6)
式中:fk為頻率幅值;P(k)為對應的功率譜值。
熵用于度量系統或一段信息中的不確定性或混亂程度,模糊熵克服了近似熵與樣本熵在計算過程中隨數據波動而變化的缺點[13]。模糊熵通過均值運算,使用指數函數代替絕對幅值差,消除了基線漂移和數據波動的影響。計算過程為:

(7)
(8)

(9)
式中:i,j=1,2,…,N-m,i≠j。

(10)
式中n、r分別為邊界梯度和寬度。
4)計算除自身外所有隸屬度平均:
(11)
5)m=m+1,重復步驟3)、4)。
6)計算模糊熵:
KFE(t)=lnφm(t)-lnφm+1(t)
(12)
式中:N為模糊熵與數據長度;m為參數嵌入維度,取值1或2;r為相似容限,取值范圍在0.1~0.5[13];n為模糊函數隸屬度,通常取值為2。以上參數存在相關性,當N為1 500時,m為2,n為2,r為0.2。經過以上流程得到軸承1-1的模糊熵如圖1所示。

圖1 軸承1-1 模糊熵
從圖1水平采集振動信號模糊熵H-FE以及垂直采集振動信號模糊熵V-FE可以看出隨軸承運行時間的增加,軸承的退化程度越來越嚴重,模糊熵值也越來越小,表明模糊熵可以直觀地反映軸承的運行狀態。
當模型的輸入特征量綱不一致,會降低模型的預測性能,對特征量綱進行標準化處理可消除這一影響,再代入預測模型時對所有的預測特征進行標準化處理為:
(13)
本文對軸承的狀態進行階段劃分,利用融合的退化狀態特征,結合“3σ”準則判定初始退化點。當軸承的實時退化特征超出準則值時軸承開始退化,進而劃分出軸承的正常與退化階段。軸承在正常階段的磨損量小,運行狀態穩定,RUL為常數值;進入退化階段后RUL呈線性下降。本文以西安交通大學機械裝備健康監測聯合實驗室的XJTU-SY數據集為數據基礎,選擇了該數據集2種工況下10個滾動軸承的全壽命周期振動信號,具體工況如表1所示,軸承具體的失效模式如表2所示。

表1 軸承運行工況

表2 軸承故障信息
軸承加速退化實驗臺架如圖2所示,該實驗臺架由交流電動機、電動機轉速控制器、轉軸、支持軸承、加速度傳感器、液壓加載系統和測試軸承組成。交流電機用于輸出轉矩,以達到改變軸承運行工況的作用。液壓加載系統用于軸承徑向加載,以達到加速軸承退化的作用。在水平和垂直方向安裝有2個加速度傳感器,用于采集軸承的全壽命周期信號,其采集頻率為25.6 kHz,采樣間隔為1 min,每次采樣時長為1.28 s。

圖2 滾動軸承實驗臺
“3σ”準則常用于檢測數據的異常值,其計算過程為:假設數據滿足正態分布,先計算出數據的標準差,再按照一定概率確定一個區間,當數據中的某個數不在這個區間內則認為該值為誤差值。
本文對軸承1-1原始信號的幅值進行統計,通過Matlab正態分布函數擬合數據的分布,得到該軸承的信號振幅值分布如圖3所示。

圖3 軸承1-1 信號幅值概率分布
從圖3可以看出,軸承1-1水平方向、垂直方向采集的全壽命信號的振幅概率分布完全滿足正態分布,因此本文可以使用“3σ”準則對軸承進行初始退化點確定,步驟為:
1)根據“3σ”準則以及本文研究目標,設置退化準則。按照當前采集時間步t計算退化指標的標準差δ及均值μ為:
(14)
(15)
式中xi為時間步采集的振動信號退化指標。
2)得到每次時間步采集信號的判斷閾值φ。
φ=μ+3δ
(16)
3)當xt>φ則認為該時間步為初始退化點。
信號的峰峰值z1、絕對均值z2、方差z3、均方根值z4可以直接反映機械的狀態信息[14],因此本文以上述4個時域特征為軸承的退化指標,融合公式為:
(17)
式中Zi為融合后的退化特征。
圖4中H-F為水平傳感器采集信號的融合特征V-F為垂直傳感器采集信號的融合特征,從圖中可以看出,在軸承正常階段退化特征較小且變化平緩,當進入退化階段退化后,退化特征值和波動較大。因此得出結論,本文計算退化特征能夠較好地劃分出軸承正常階段和退化階段。

圖4 軸承1-1的融合退化特征
利用2.1節的退化準則確定軸承的退化點,圖5為使用融合退化特征確定軸承1-1,軸承2-1的初始退化點。從圖5的分割線可以看出,本文劃分的初始退化點對應軸承全壽命周期信號時域信號振幅突變區間,劃分的退化階段符合軸承的實際狀態。因此可以使用本文的退化準則劃分軸承的不同階段。

圖5 軸承的初始退化點
RNN具有較強的處理時間序列能力,但是該網絡在反向傳播過程中會丟失先前記錄的狀態信息,同時還存在梯度消失或爆炸的問題,LSTM、GRU可解決RNN不適合用于處理長期依賴問題[15]。
GRU網絡通過合并輸入門與遺忘門的單元狀態和隱藏狀態,構成了更新門[16]。GRU包括重置門和更新門2個邏輯門,其結構如圖6所示。

圖6 GRU單元框架

zt=σ(Wz·[ht-1,xt]+bz)
(18)
rt=σ(Wr·[ht-1,xt]+br)
(19)
(20)
(21)
yt=?(Wohh+bo)
(22)

遷移學習是將學到的已有知識應用到新的領域,它不同于常規機器學習的假設1(學習樣本與測試樣本滿足獨立分布),假設2(使用足夠多的訓練樣本才能獲得足夠好的學習能力)[17]。遷移學習可以解決目標領域標簽樣本少,模型訓練時間長,模型泛化能力低的問題。常見的遷移學習分為:基于核學習、基于強化學習、基于流行學以及、基于深度學習的遷移學習。
遷移學習中,一個領域D為:
D=γp(x)
(23)
式中:γ表示特征空間;p(x)為X={x1,x2,…,xn}∈γ;xi∈Rd,i=1,2,…,n的邊緣分布。

Γs=Yf(·)
(24)


本文根據遷移學習原理,提出使用某一工況下某一軸承的全壽命周期特征訓練建立的RUL預測模型,結合遷移學習使用其他未訓練軸承的全壽命數據作為驗證集,先使用軸承正常階段數據對訓練好的模型進行預訓練,然后對軸承的退化階段進行RUL預測。
為實現滾動軸承的RUL預測,本文構建了如圖7的網絡框架。

圖7 預測模型框架
本文設計的整體預測框架如圖8所示。首先選擇軸承1-1的全壽命周期數據作為訓練樣本,計算其時域特征、頻域特征以及模糊熵作為模型輸入,再設置模型參數訓練并保存模型,最后計算其他軸承全壽命周期數據的預測特征。結合遷移學習,用正常階段特征數據對模型進行預訓練,使模型學習到新的軸承狀態知識,以實現新軸承退化階段RUL的準確預測。

圖8 軸承RUL的預測框架
為準確預測出滾動軸承的RUL,經過多次調試模型,最終得到模型的超參數如表3所示。

表3 GRU預測模型的超參數設置
首先為驗證GRU在計算時間上優于LSTM,建立了除記憶層不同其他結構層都相同的預測模型。使用預測評價指標,如均方根誤差(root mean square error, RMSE)、積累相對準確度(cumulative relative accuracy, CRA)以及百分比誤差(mean absolute error, MAE)評價預測的結果[18-19]。預測指標RMSE與MAE值越小說明預測RUL的誤差越小,更加吻合軸承的真實RUL,該值越小其預測精度越好。CRA越大說明預測軸承的RUL越接近真實值。CRA為0.92,其余得到2種預測模型的結果如表4所示。

表4 訓練模型評價指標
從表4以及圖9可以看出,使用相同結構網絡搭建的GRU和LSTM預測模型,在訓練預測精準度以及訓練評價指標值上都非常接近,2種方法得到的預測結果與軸承真實RUL也極其吻合,但是GRU模型的訓練時間優于LSTM模型,因此選擇GRU建立軸承RUL預測模型。同時為驗證GRU層數對預測結果的影響,設置了3組實驗,每組實驗中除GRU層數不同,其他的網絡結構參數均相同。選擇軸承1-1的全壽命周期特征數據作為訓練數據訓練模型,得到3組訓練結果如表5所示。

表5 優化GRU層數評價指標

圖9 遷移學習預測軸承的RUL結果
根據表5預測指標值可知,當GRU層在2層時RMSE與MAE最小,CRA最大,此時模型預測性能最佳,因此本文設置GRU層數為2。
訓練完模型后,使用其他軸承的全壽命周期數據來驗證模型,不同軸承的預測RUL指標如表6所示,根據評價指標值可知:未使用遷移學習的預測模型預測泛化能力差,預測結果不理想。為提高預測模型的預測泛化能力,提出使用遷移學習策略:先選擇不同軸承正常階段的數據對模型進行預訓練,使模型學習到不同失效軸承的狀態知識,然后對退化階段進行RUL預測,最終得到其評價指標如表7所示,預測結果如圖9所示。

表6 不使用遷移學習預測軸承RUL的評價指標

表7 使用遷移學習預測軸承RUL的評價指標
根據圖9可以看出,使用遷移學習策略能夠準確的預測出軸承RUL,其預測RUL不僅與實際RUL有著相同下降趨勢,在RUL值上也能夠吻合真實值。根據表7預測指標分析可得:使用遷移學習的預測模型,其RMSE值與MAE更小,更加符合實際RUL,CRA值也都大于未使用遷移學習的預測結果。經過計算,遷移學習優化的預測模型RMSE值提升范圍為2.30~449.59,CRA值提升范圍為0~0.13,MAE值提升范圍為9.90~935。綜上可得:使用遷移學習可提高預測模型的穩定性。
1)本文計算了軸承信號時域特征,頻域特征,模糊熵作為預測模型的輸入,保證了軸承狀態信息量,防止因輸入信息量不足導致模型預測精度低。
2)融合能直接反映機械狀態信息的峰峰值、絕對均值、方差、均方根值作為退化指標。并結合“3σ”準則對軸承的狀態進行了階段劃分,減少了模型數據的計算量,提升了模型的預測性能。
3)經過遷移學習改進的預測模型,預測RUL平均RMSE從原來的451.62減小到214.40,平均MAE從295.51減小到了94.50,平均CRA從0.77提高到了0.80。不僅提高了預測準確率,也提高了預測RUL的穩定性,使預測的RUL值更吻合軸承真實的RUL。