邵辰彤, 王景霖, 徐 智, 楊 樂, 李勝男, 封錦琦
(1.故障診斷與健康管理技術航空科技重點實驗室,上海 201601; 2.航空工業北京長城測控技術研究所,北京 101111)
對于滾動軸承來說,高溫、高壓以及多變的負載情況是其常見的工作環境。因此,故障發生的頻率也較高[1]。所以,通過分析滾動軸承的退化趨勢并及時維修和更換不僅有利于工程設備的維護和保養,更能防止其故障發生后對其他部件帶來的二次損害,在工程實際應用中具有重要意義[2]。
滾動軸承的退化趨勢預測通過對運行中的軸承數據進行采集并預測軸承下一步的退化狀態趨勢,可以及時對軸承的可靠性做出有效判斷并進行安全性維修,避免軸承超出使用壽命導致失效或未達到預期使用壽命導致成本增加[3]。軸承的退化趨勢預測按照順序基本可以分為以下幾個部分:信號預處理、特征提取、趨勢預測。在軸承振動信號的采集中由于存在噪聲覆蓋初始信號、傳感器精度不足等問題,且振動信號往往呈現出非平穩非線性的狀態,導致難以從中提取軸承故障特征,因此需要對軸承信號進行預處理。信號預處理中常用的方法有經驗模態分解[4](Empirical Mode Decomposition,EMD)、奇異值分解[5](Singular Value Decomposition,SVD)、小波降噪[6]等,王奉濤等[7]使用EMD方法分析了滾動軸承的振動信號,并基于神經網絡搭建了基于堆棧稀疏自編碼器(Stacked Sparse Auto Encoder,SSAE)的故障診斷模型,簡化了特征提取過程,提高了軸承的診斷正確率;胡曉依等[8]使用SVD剔除了軌跡矩陣中的噪聲并使用STFT技術進行軸承信號的解調分析,結果表明,其能夠更早一步發現軸承的早期故障。軸承信號的特征提取按照方法可分為時域指標特征提取、頻域指標特征提取和時頻域指標的特征提取[9]。軸承的退化趨勢預測目前主要應用的是基于數據驅動的退化趨勢預測方法,包括統計方法和人工智能預測方法。其中,統計方法包括自回歸滑動平均(Auto Regressive Moving Average,ARMA)模型、回歸分析法、卡爾曼濾波法等[10];而人工智能法則包括人工神經網絡(Artificial Neural Network,ANN)、支持向量機(Support Vector Machine,SVM)、深度學習法等[11]。陳昌等[12]基于威布爾分布和最小二乘支持向量機對滾動軸承全壽命軸承實驗數據進行了退化趨勢預測,并取得了較準確的預測結果;李鋒等[13]提出了一種基于雙隱層量子線路循環單元神經網絡(Double Hidden Layer Quantum Circuit Recurrent Unit Neural Network,DHL-QCRUNN),設計了雙隱層結構以完成旋轉機械狀態的退化趨勢預測,結果表明,該方法具有較高的預測精度和較高的計算效率。
滾動軸承的振動信號作為一種時序數據,當前采樣點的數據與過去采樣點的數據密切相關,同樣也會影響未來的數據。循環神經網絡(Recurrent Neural Network,RNN)由于其網絡結構的特殊性,對于處理跟時間相關的數據與其他神經網絡相比有明顯的優勢,而其變體長短期記憶(Long Short-Term Memory,LSTM)神經網絡不僅擁有RNN時序數據預測良好的特性,而且解決了傳統RNN梯度消失的問題[14]。由于其更為復雜的結構,因此具有更優秀的保留之前數據重要信息的功能,對于時序數據的預測有更好的能力。
主成分分析(Principal Component Analysis,PCA)是一種能夠將高維數據進行降維的數據處理方法。通過從各個維度對數據進行分析,提取出數據中的重要信息,剔除冗余信息,降低數據計算量,提高計算速度。
本文提取了滾動軸承振動信號的時域特征指標、頻域特征指標并依據時間相關性、單調性、退化階段可分性對特征參數進行選擇,剔除一些相關性不高的數據。采用PCA方法對篩選后的數據進行數據融合,提取出能夠反映總體退化趨勢的主成分,建立基于PCA-LSTM網絡的軸承退化趨勢預測模型,并對其進行精度驗證。
在提取滾動軸承的特征參數時,若選擇全部特征參數進行趨勢預測,不僅會使計算復雜度大大增加,而且會導致數據的大量冗余。主成分分析[15]利用降維的思想對多個參數指標進行線性組合變換從而形成新變量,將原來的n維特征映射到k維上,且n>k,k維變量互不相關,且能反映原始數據足夠多的信息。
如式(1)所示,將k個n維的新變量Z1,Z2,…,Zk用x1,x2,…,xm的線性組合來表示,令變換后的新變量的方差達到最小。
(1)
式中,αi=[αi1,αi2,…,αim]T(i=1,2,…,k)是協方差矩陣C中特征值λi的特征向量。協方差矩陣C為
(2)
通過主成分貢獻率公式計算各個主成分的貢獻率,由高到低依次選取特征值λ1,λ2,…,λm對應的主成分Zi,貢獻率公式為
(3)
累計貢獻率公式為
(4)
一般來說,累計貢獻率達到85%~95%即可反映出絕大部分數據的信息[16],同時能有效降低原數據維度。
LSTM不僅能從時間序列數據中提取數據之間的依賴關系,同時也解決了標準循環神經網絡中不能連接到遠處數據的問題。滾動軸承的振動信號數據是時序數據,當前時刻的振動信號與過去和未來之間的數據有著密切的聯系。
LSTM神經網絡由于其“門”結構的特殊性,能夠連接到遠處的數據,并保留過去數據的重要信息,其神經元結構如圖1所示。

圖1 LSTM神經元的具體結構
LSTM的工作原理如下。
① 上一時刻神經元的輸出數據與當前時刻輸入一并進入第一個交互層遺忘門中,經遺忘門處理后輸出ft,其值為[0,1],與重要程度呈正相關性,此時遺忘門輸出值表達式為
ft=σ[Wf·(ht-1,xt)+bf]
(5)

it=σ[Wi·(ht-1,xt)+bi]
(6)
(7)
(8)
③ 輸出門通過上一時刻數據與當前輸入生成原始輸出ot,并通過tanh層將細胞狀態Ct與ot相乘,得到最終的輸出結果ht。計算公式為
ot=σ[Wo·(ht-1,xt)+bo]
(9)
ht=ot° tanh(Ct)
(10)
式中,W為各個門與細胞狀態的權重矩陣;b為各個門和細胞狀態的偏置項;σ為sigmoid激活函數;“·”為矩陣點積;“° ”為矩陣按元素相乘。
圖2為本文的LSTM網絡模型的拓撲結構,提取滾動軸承的時域特征參數和頻域特征參數后使用PCA方法進行主成分的確定,隱含層設置為三層,分別是LSTM層、隨機失活層(dropout)和回歸層,最終輸出預測的退化趨勢。

圖2 LSTM網絡在滾動軸承退化趨勢預測的拓撲結構
1.2.1 數據標準化
由于在實際輸入數據時可能出現量綱不同、范圍不同的情況,對于神經網絡來說需要平等地處理每個參數的影響。所以對最終輸入的數據會進行標準化處理。標準化的計算公式為
(11)

(12)
1.2.2 LSTM的模型參數選擇
在實際對模型進行訓練時,需要確定LSTM的一系列超參數,本文的LSTM預測模型的超參數設置如表1所示。

表1 LSTM網絡訓練參數
為了防止發生過擬合的現象,在LSTM隱含層中添加了一層隨機失活層,可以有效避免其在測試集中表現出的過擬合現象,隨機失活概率設置為0.2。在求解器方面選擇了Adam自適應矩估計求解器,初始學習率設置為0.005,并在每經過一半的訓練之后乘以0.2以降低學習率,梯度閾值設置為1以防止梯度爆炸,激活函數則為tanh。
1.2.3 模型評價指標
通過預測值和真實值的對比可以看出LSTM在退化趨勢預測中的表現,為了量化其預測效果,選取RMSE(Root Mean Square Error,均方根誤差)和MAPE(Mean Absolute Percentage Error,平均百分比誤差)以對算法的預測性能進行衡量,RMSE和MAPE的計算公式為
(13)
(14)
式中,ypi為在i時刻的預測值;yti為在i時刻的真實值。
本文采用的滾動軸承退化趨勢數據是由西安交通大學雷亞國教授團隊提供的[17]。該數據集記錄了滾動軸承從正常狀態到由于故障失效狀態的完整的全壽命周期數據,滾動軸承的數據試驗臺如圖3所示。

圖3 滾動軸承全壽命試驗臺
試驗軸承為LDK UER204滾動軸承,在進行試驗時,分別將兩個PCB 253C33單向加速度傳感器安裝在豎直方向和水平方向上,振動信號通過DT9837便攜式動態信號采集器采集,采樣頻率為25.6 kHz,采樣間隔為1 min,每次采樣時長為1.28 s。具體采樣設置情況如圖4所示。

圖4 振動信號的采樣設置
試驗總共有3種工況,每一類工況下選取額定壽命相同的5個軸承進行試驗,以工況一為例,5個軸承在失效時的失效位置并不相同,分別包括內圈故障、外圈故障和保持架故障,具體失效位置如圖5所示。
在對軸承進行退化趨勢預測時,需要根據軸承振動量的大小來確定軸承是否具有典型的全壽命退化特征,根據選擇比較之后確定了數據集中的軸承1_1具有典型的軸承退化趨勢,其趨勢具有明顯的時間相關性、單調性和退化可分性[18]。軸承1_1的振動信號如圖6所示。

圖5 軸承各失效位置示意圖

圖6 軸承1_1的振動信號
對振動信號提取其時域特征參數和頻域特征參數后進行篩選,刪除其中表現效果較差和與時間序列相關性不大的特征指標,最終得到了5個指標:時域均方根值、頻域方差、時域方差、時域絕對值的平均值和頻域平均幅值,具體如圖7所示。

圖7 軸承1_1退化特征參數集
對上述5個特征指標進行PCA的數據融合后,主成分的累計貢獻率如表2所示。
由表2可知,第一個主成分Z1貢獻率為96.531%,而累計貢獻率一般設置在85%~95%,說明第一個主成分Z1與原始數據高度相關,基本可以反映其全部信息,所以只選取第一個主成分作為神經網絡的預測對象,具體圖像和其他參數指標對比如圖8所示。

表2 主成分貢獻率及累計貢獻率

圖8 主成分分析和其他指標參數對比
由圖8可看出,主成分Z1具有比除方差外的其他指標更好的特征區分性,且相比于方差有更好的平滑性,說明PCA能夠在特征可分性和單調性上取得較為均衡的效果。
對主成分分析Z1的數據進行訓練集和測試集的劃分,將第一個點作為訓練集的起始點,用全壽命的退化趨勢數據進行退化趨勢預測。在數據劃分過程中,若訓練集過少,會導致網絡訓練不準確,若訓練集過多,則可能發生過擬合現象。多次實驗后確定使用前85%的數據作為訓練集,后15%的數據作為測試集驗證網絡的預測準確度。并且在隱含層之后加了一層隨機失活層防止其過擬合現象的發生。在預測過程中,每次預測下一個點時,使用真實值來更新網絡,防止累計誤差的產生。為了顯示LSTM網絡預測的良好性,選用Matlab中的非線性自回歸(Nonline Auto Regressive,NAR)神經網絡與其進行對比[19]。NAR模型也是一種對時間序列進行分析的動態神經網絡模型,由于NAR神經網絡的輸出信息也會作為輸入信息進行反饋,所以也十分適合對時間序列數據進行預測。經反復調整后確定NAR神經網絡為3層網絡,分別是輸入層、隱含層和輸出層,其隱含層節點數為10個,延遲階數為10。預測結果如圖9所示。
由圖9可看出,基于PCA-LSTM的神經網絡的退

圖9 不同神經網絡預測對比
化趨勢預測模型明顯優于基于PCA-NAR的神經網絡,說明了LSTM對時序數據有良好的預測能力,為了量化其預測效果,將不同神經網絡的RMSE和MAPE分別列出,如表3所示。

表3 不同神經網絡的評價指標對比
由圖9和表3可知,基于PCA-LSTM的滾動軸承退化趨勢預測模型在RMSE和MAPE上均優于NAR神經網絡,RMSE減少了0.1638,MAPE降低了8.0163%。上述數據充分說明了LSTM網絡在滾動軸承退化趨勢預測上的優越性,能夠有效預測之后的退化趨勢。
本文使用了主成分分析對滾動軸承的特征指標進行了數據融合,并使用LSTM神經網絡對主成分分析之后的指標進行了趨勢預測,取得了較好的預測結果,相比于其他神經網絡更為精確,為軸承的退化趨勢預測提供了一種新的思路。
① 主成分分析有效地反映了滾動軸承在退化過程中的不同階段,相對于方差等指標有更好的平滑性,在單調性和趨勢可分性上取得了較為平衡的效果,并且降低了數據的輸入維度,減小了高維數據的計算量。
② 通過LSTM神經網絡對融合后的主成分進行趨勢預測,加入了隨機失活層,防止因網絡參數和訓練集的原因導致過擬合現象的發生,加強了其泛化性。
③ 預測結果表明基于PCA-LSTM的滾動軸承退化趨勢預測模型能夠有效預測軸承退化趨勢,且誤差相比于其他神經網絡(NAR網絡)明顯較低,顯示出其在滾動軸承退化趨勢預測上的有效性和優越性。