孟祥龍,丁華,呂彥寶,施瑞
(1.太原理工大學 機械與運載工程學院,太原 030024;2.煤礦綜采裝備山西省重點實驗室,太原 030024)
滾動軸承廣泛應用于眾多機械設備中,作為關鍵的承載部件,長期處于復雜、惡劣的工作環境中,具有故障率高,易損壞的特點,是機械故障的主要源頭,因此軸承剩余使用壽命(Remaining Useful Life, RUL)預測對于機械設備的預測性維護有著重要意義[1]。精準地預測軸承剩余使用壽命,可以讓機器以最小的維護成本來獲得最長的安全運行時間,進而提升機器運行過程中的安全性和經濟性。
人工智能的發展使數據驅動的軸承健康監測維護[2]相比傳統方法更具優越性,基于數據驅動的軸承剩余壽命預測主要分2步:1)從采集的振動加速度信號中提取軸承性能退化特征;2)構建預測模型,利用機器學習或深度學習卓越的非線性映射能力尋找數據特征與剩余使用壽命之間的潛在關系[3]。特征提取是數據驅動方法的重要步驟,其關鍵在于從監測數據中挖掘機械設備運行狀態信息,對剩余使用壽命預測精度有很大影響。傳統特征提取方法是從原始振動信號中提取退化特征,如提取時域的均方根值、頻域的平均幅值以及時頻域的小波包能量譜等[4];文獻[5]則利用卷積神經網絡特有的局部卷積、權值共享等特性直接對原始信號進行特征自學習,省去了專家先驗知識,實現了端對端的剩余使用壽命預測。然而,原始信號中含有大量噪聲,軸承的退化特征極易被噪聲淹沒,影響剩余使用壽命預測精度。當從不同分析域中提取特征指標后,很難判斷其中哪些特征對軸承缺陷發展更加敏感[6];并且這些特征仍是高維,需要通過降維融合剔除冗余信息,獲得能全面反應軸承性能退化趨勢的綜合指標。文獻[7]利用主成分分析從多維數據中獲取優勢信息的特性來實現特征的融合降維,文獻[8]采用自編碼器構建了低維性能退化指標;然而,主成分分析處理線性問題具有優勢,卻難以充分挖掘軸承變化的有效信息;自編碼器是將高維數據映射為低維特定數值[9]而不是某種分布,得到的低維特征受到約束,退化趨勢較單一。
針對以上問題,本文提出一種基于離散小波變換(Discrete Wavelet Transform,DWT)和變分自編碼器(Variational Auto-Encoder,VAE)的滾動軸承剩余使用壽命預測方法。通過離散小波變換對軸承振動信號進行逐級分解以抑制信號中的環境噪聲和無關成分,從而選取有效信息成分多、噪聲成分少的分量作為后續算法處理的對象,實現降噪預處理的效果;同時,利用變分自編碼器強大的無監督特征學習能力和抗干擾能力獲得更符合軸承退化趨勢的綜合特征;最后,通過分層抽樣劃分數據集,并引入長短時記憶(Long Short-Term Memory,LSTM)網絡實現滾動軸承剩余使用壽命預測。


(1)
則稱為一個基本小波或母小波,將母函數ψ(t)經伸縮和平移后,可以得到一個小波序列。
對于連續的情況,小波序列為

(2)
連續小波變換為
(3)
式中:a為伸縮因子;b為平移因子。
對于離散的情況,小波序列為
(4)
通常取a0=2,b0=1,則 (4) 式變為
(5)
3層離散小波變換的原理如圖1所示,其中H(w)為低通濾波器,可以濾除曲線中的高頻部分,得到近似部分(低頻成分);G(w)為高通濾波器,可以濾除曲線中的低頻部分,得到細節成分(高頻成分);從而將信號的時頻結構準確無冗余地展現出來。

圖1 3層離散小波變換原理示意圖
變分自編碼器是一種基于自編碼器的無監督學習方法,同時也是一種生成模型,通過編碼器獲得潛在空間特征的概率分布,融入隨機噪聲并以解碼器的形式生成新數據,其基本結構如圖2所示。與自編碼器直接將輸入x映射到隱含向量z不同,變分自編碼器的編碼部分是將輸入x映射到隱變量概率分布的參數(均值、方差),再加入隨機噪聲后采樣得到隱變量z,最后由解碼部分生成新的數據。

圖2 變分自編碼器基本結構
變分自編碼器包含編碼器、解碼器和損失函數3部分。編碼器是一個神經網絡,輸入為x,輸出為隱向量z,參數為θ,可表示為pθ(z∣x);解碼器也是一個神經網絡,輸入為隱向量z,輸出為重構的x,參數為φ,可表示為qφ(x∣z);損失函數為
L(θ,φ)=Ez~pθ(z∣x)[lgqφ(x∣z)]+
DKL[pθ(z∣x)p(z)],
(6)
等式右側第1項為重構損失,與其他自編碼器的損失函數一樣,目的是讓生成數據與原始數據盡可能相近;第2項為KL 散度(相對熵),是正則項,用來衡量2種不同概率分布之間的偏離程度。
在變分自編碼器中,隱空間先驗分布p(z)被設定為標準正態分布,正則項的存在是要讓后驗分布pθ(z∣x)也接近先驗分布。如果沒有正則項,模型為了減小重構損失會不斷減小隨機性,也就是編碼器輸出的方差,沒有隨機性時,變分自編碼器無法生成各種數據。若編碼器輸出的z不服從標準正態分布,將會在損失函數中對編碼器施加懲罰。
變分自編碼器中,pθ(z∣x)確定一個高斯分布并從中采樣得到隱變量z,然而采樣操作的不可導使模型無法反向傳播。在實際模型中,采用重參數技巧解決后驗分布采樣過程中梯度不可計算的問題,即從均值μ和標準偏差σ的正態分布中采樣,等價于先從標準正態分布中采樣,然后再對其進行變換,即
z=μ+σ⊙,
(7)
在實際應用中,軸承運行前期振動信號的振幅十分平穩,可視為健康運行階段。軸承運行一段時間后,在某一時刻發生初始故障,標志著軸承開始進入退化階段,軸承振動信號振幅不再趨于平穩而是劇烈振蕩且伴隨著軸承性能的急劇下降,直至軸承失效,如圖3a所示。由于軸承在健康階段并沒有出現一定的退化演變趨勢,使用圖3b中線性剩余使用壽命標簽進行剩余使用壽命預測時效果較差。因此,在軸承運行健康階段,將剩余使用壽命設定為一個常數值較為合理[10],直到出現初始故障,軸承開始進入退化階段,剩余使用壽命才開始逐漸減小,可以采用分段函數表示[11],如圖3b中虛線所示。

(a)原始振動信號
長短時記憶網絡是循環神經網絡的一個變體,可以有效地解決循環神經網絡的梯度爆炸或消失問題,其在循環神經網絡的基礎上引入門控機制控制信息的累積速度,包括有選擇地加入新信息,有選擇地遺忘之前累積的信息。長短時記憶網絡的具體公式為
it=σ(Wxixt+Whiht-1+bi),
(8)
ft=σ(Wxfxt+Whfht-1+bf),
(9)
ot=σ(Wxoxt+Whoht-1+bo),
(10)
ct=ft⊙ct-1+it⊙tanh(Wxcxt+Whcht-1=bc),
(11)
ht=ot⊙tanh(ct),
(12)
式中:it,ft,ot分別為輸入門、遺忘門和輸出門;c,h分別為記憶單元和外部狀態;σ為 Logistic函數,輸出區間為(0,1);W為各神經元的權重,其與輸入矢量xt和外部狀態ht-1直接點乘。
長短時記憶網絡的循環單元結構如圖4所示,其計算過程為:1)利用上一時刻的外部狀態ht-1和當前時刻的輸入xt,計算出3個門it,ft,ot以及候選狀態ct;2)結合遺忘門ft和輸入門it更新記憶單元ct;3)結合輸出門ot將內部狀態的信息傳遞給外部狀態ht。通過長短時記憶網絡循環單元,整個網絡可以建立較長距離的時序依賴關系。

圖4 長短時記憶網絡結構示意圖
試驗數據來自美國辛辛那提大學IMS中心軸承試驗臺[12],試驗軸承為 ZA-2115型滾動軸承,軸轉速為 2 000 r/min,由彈簧機構施加 26.67 kN 的徑向力加速軸承退化,采用高靈敏度PCB-353B33加速度傳感器收集軸承振動信號,采樣頻率為20.48 kHz,采樣間隔為10 min,采樣時間1 s,故每次采樣點數為20 480。選擇第2組試驗中軸承1的全壽命周期振動數據進行分析,其在歷時9 840 min后發生疲勞失效(拆機發現外圈出現裂紋),其振動信號在后期產生劇烈變化,反映出軸承發生了急劇退化。
首先需要確定軸承初始故障發生的時刻,并以此作為初始退化點來劃分軸承運行的健康階段和退化階段。由于軸承早期故障特征難以檢測,致使初始退化點難以確定,采用文獻[13]中所提方法進行初始退化點檢測。軸承發生故障時會在其頻譜中有所體現,可以利用頻譜中最大峰值頻率的改變找出初始退化發生的時刻。將每次采樣得到的振動信號進行快速傅里葉變換得到頻譜,把頻譜中幅值最大的頻率記錄下來,得到的散點圖如圖5所示:軸承運行前期只存在1 000 Hz的頻率,隨著軸承持續運行,第7 000 min以后開始持續出現4 476 Hz的故障頻率,故將第7 000 min確定為軸承的初始退化時刻。

圖5 初始退化點檢測
分段函數將0~7 000 min視為健康狀態,歸一化后RUL標簽為1;第7 000 min之后視為退化狀態,其標簽值遞減直至為0,表征軸承損壞已達閾值,無法再正常運行,如圖6所示。

圖6 歸一化分段函數RUL標簽
在特征提取方面。考慮到db小波基函數具有正交性、緊支撐性以及對不規則信號更敏感等特性,選擇db4小波作為基函數,將軸承原始振動信號進行3層離散小波變換處理,得到近似分量信號和細節分量信號并從中分別提取標準差、方根幅值、均方根、偏度、峭度以及波形因子特征,結果如圖7所示。
從圖7中剔除對軸承退化趨勢不敏感的偏度、峭度以及波形因子,選擇單調趨勢性較好的標準差、方根幅值和均方根作為敏感特征構建高維特征集,如圖8所示:從近似分量中提取的均方根在退化階段的單調上升趨勢更符合指數型增長,其明顯優于細節分量中提取的方根幅值;而從局部放大圖中可以看出,近似分量的均方根在健康階段非常平穩,而細節分量的方根幅值在健康階段已有輕微的起伏上升,表明細節分量特征對于軸承的損壞更加敏感,能提取到軸承早期微弱的退化信息;因此,單單使用均方根或方根幅值無法完整表達軸承整個壽命周期的退化趨勢,需要通過特征融合獲得反映軸承退化的綜合性能指標。

圖7 離散小波變換處理后軸承振動信號的特征指標Fig.7 Feature indexes of bearing vibration signal after DWT processing

圖8 離散小波變換處理后軸承振動信號的部分敏感特征
利用歸一化操作對敏感特征構成的高維特征集進行縮放并輸入變分自編碼器中進行無監督特征融合降維,將高維特征集降至一維后所得軸承的深層本質特征如圖9所示,其中x軸代表時間點,y軸代表將高維特征集輸入到變分自編碼器后融合降維得到的一維深層特征值。由圖9可知:由

圖9 變分自編碼器降維得到的一維特征
離散小波變換和變分自編碼器提取出的深層特征具有良好的單調性,既能體現健康階段的輕微損傷(局部放大圖),又能在退化階段表現出良好的指數型單調上升,能夠綜合表征軸承整個生命周期的衰退過程,可以將其作為基本特征輸入長短時記憶網絡模型進行軸承剩余使用壽命預測。
試驗軸承全壽命周期數據共有984個時間點,最后8個時刻的監控數據與實際趨勢不一致,誤差較大。為避免這一誤差的影響,將這部分數據剔除。采用分層抽樣的方法將全壽命周期數據劃分為訓練集和測試集[14],以10個時間點為一層,以7:3的比例對每一層數據進行隨機抽樣構建訓練集和測試集,訓練集和測試集分別占全壽命周期數據的70%和30%,最后得到訓練集與測試集樣本數的比為683:293。
長短時記憶網絡模型重要的超參數有時間步長、隱藏層狀態數、批量大小和學習率,超參數的選擇會影響預測結果的精確性,因此采用粒子群優化算法(Particle Swarm Optimization,PSO) 對超參數進行設定,設置粒子群優化算法搜索空間的上、下界分別為[20,128,100,0.01],[2,8,10,0.000 1],種群數量為20,使模型預測效果達到最優的超參數為[10,70,32,0.005 3]。另外,由于Adam作為自適應優化算法能夠動態更新學習率,因此選擇Adam優化器進行梯度優化。
長短時記憶網絡模型在測試集上的預測結果如圖10所示,預測值與RUL標簽有很高的重合度。為評估剩余使用壽命預測的不確定性,采用文獻[15]方法對性能退化階段進行區間估計,在預測值附近設置 95%置信水平的置信區間。雖然有些預測值偏離RUL標簽曲線(局部放大圖),但絕大部分預測值均落在置信區間內,說明預測值趨勢與RUL標簽曲線趨勢一致。

圖10 試驗軸承在測試集上的RUL預測結果
為驗證方法的有效性,采用3種特征提取方法:1)直接從原始振動信號中提取時頻特征;2)對原始信號進行小波軟硬閾值折衷法去噪后[16]提取時頻特征;3)對原始信號進行離散小波變換,對信號子分量提取敏感特征。融合降維則使用2種方法,即堆疊自編碼器(Stacked Auto-Encoder,SAE)和變分自編碼器。將3種特征提取方法與2種融合降維方法相互組合,共形成6種方法進行對比,其得到的一維特征如圖11所示。

圖11 不同特征提取和降維融合方法提取的一維深層特征Fig.11 One-dimensional deep features extracted by different eature extraction and dimension reduction fusion methods
由圖11可知:1)原始信號深層特征在健康階段起伏上升現象明顯,而經過小波軟硬閾值折衷法去噪和離散小波變換處理后所提取深層特征在健康階段十分平穩,起伏上升得到大幅抑制,且離散小波變換所提取特征在退化階段呈指數型上升,更符合軸承退化趨勢,對軸承振動信號特征提取的效果更好;2)以小波去噪為例,堆疊自編碼器提取的深層特征在退化階段表現出先輕微下降再緩慢上升,即“愈合”現象,而變分自編碼器提取的深層特征在退化階段先趨于穩定再快速上升,退化趨勢明顯更優,說明相對于堆疊自編碼器,變分自編碼器的融合降維效果更佳,可以有效抑制退化階段的“愈合”現象[17],獲得單調性更優的特征指標。
從定量分析的角度,進一步對一維深層特征的趨勢性、單調性和魯棒性進行分析[18],其計算結果見表1,表明離散小波變換和變分自編碼器算法所提取深層特征的綜合性能更優。

表1 不同方法所提取深層特征的定量評價指標
采用分層抽樣對每種方法得到的深層特征劃分訓練集與測試集,通過訓練集來訓練長短時記憶網絡模型,并使用測試集驗證預測效果,結果如圖12所示。

圖12 不同方法所構建模型對試驗軸承在測試集上的剩余使用壽命預測結果Fig.12 RUL prediction results of test bearing on test set by models constructed by different methods
選擇能反映測量精度的均方根誤差(Root Mean Square Error,RMSE)和能反映預測誤差實際情況的平均絕對誤差(Mean Absolute Error,MAE)作為模型的評價指標[19](表2),評價指標對應的計算公式為

表2 不同方法所構建預測模型的評價指標
(13)
(14)

分析圖12和表2可以看出,基于離散小波變換和變分自編碼器的滾動軸承剩余使用壽命預測方法的誤差更小,精度更高。
上述分析中,軸承初始退化點被確定為第7 000 min并以此劃分健康階段和退化階段,然而文獻[20]指出軸承在第5 330 min已發生輕微退化,到第7 000 min已是中度退化狀態。因此,本文嘗試分析不同初始退化點的選擇是否會對所提方法產生影響,故將第5 330 min設定為初始退化點,則健康階段為0~5 330 min,退化階段為5 330~9 840 min。相應的分段函數如圖13所示,其余處理與上述方法一致,得到的預測結果如圖14所示。

圖13 不同初始退化點時的剩余使用壽命分段函數
由圖14可知:對于從原始振動信號中提取時頻特征再融合降維得到的一維深層特征,其在5 330~7 000 min區間起伏上升明顯,故在選取不同初始退化點時,測試集(1 600~2 100 min,即5 330×30%~ 7 000×30%)的預測效果略優于小波去噪和離散小波變換方法,但是第2 100 min之后的預測效果卻遠不如離散小波變換和變分自編碼器相結合的方法,從整體上看,離散小波變換與變分自編碼器相結合的方法依舊能達到最優的預測效果。

圖14 不同初始退化點時各種模型在測試集上的RUL預測結果Fig.14 RUL prediction results of various models on test set at different initial degradation points
針對滾動軸承工作環境中噪聲干擾使有效特征難提取的問題,提出一種基于離散小波變換和變分自編碼器的軸承剩余使用壽命預測方法,試驗結果表明:
1)利用離散小波變換分解信號后對其子分量提取特征,能夠有效抑制軸承退化中的“愈合”現象,使提取的特征更具單調趨勢性,準確地反映軸承生命周期的退化過程。
2)利用變分自編碼器強大的無監督學習能力和抗干擾能力,能夠獲得綜合表征軸承退化趨勢的性能指標,從而提高軸承剩余使用壽命預測精度。
3)選擇不同初始退化點時,離散小波變換和變分自編碼器相結合的特征提取方法依然能精準的預測剩余使用壽命。