中圖分類號:TH133.33 文獻標志碼:A文章編號:1006-0316(2025)07-0017-08
doi: 10.3969/j.issn.1006-0316.2025.07.003
Abstract :In the data-driven prediction ofremaining useful life ofrolling bearings,in actual working conditions, due to the limited amount of degradation data and changes in working conditions,there are generally discrepancies between training dataand testing data. It results in the reduction in the performance of remaining useful life (RUL)prediction.Aimingat solving the problem of insufficient data volume and inconsistent distribution of data characteristics under different operating conditions,this paper constructs atransfer learning life prediction model based on Convolutional Neural Network with Long Short Term Memory (CNNLSTM). Domain adaptation is achieved between the source domain and the target domain by using the Maximum Mean Discrepancy (MMD)metric combined with adversarial transfer strategies.The distribution between the two domains is narrowed so as to extract domain invariant features more effectively.The transfer learning method is used to predict the lifespan of roling bearings under diffrent working conditions. Comparative experiments are conducted among CNNLSTM,Domain adaptive Neural Network (DaNN),and Domain Adversarial Training of Neural Networks (DANN). The results indicate that the method proposed in this paper is superior to the above three methods and has better accuracy in prediction ofremaining useful life of cross-domain rolling bearings.
Key words rolling bearings iremaining useful life prediction iconvolutional neural network with long short term memory ; transfer learning
近年來,深度學習已經在圖像處理、語音識別等領域取得了很多研究成果。同時,深度學習在剩余壽命 (RemainingUsefulLife,RUL)預測領域中也應用廣泛。目前,深度神經網絡(Deep Neural Networks,DNN)[1-2]、深度置信網絡(Deep Belief Networks,DBN)[3-4]、卷積神經網絡(Convolutional NeuralNetworks,CNN)[4-5]、循環神經網絡(Recurrent NeuralNetworks,RNN)[6-7],以及它們的變體和組合[8-10]的回歸方法已被研究和驗證,并用于RUL的點估計。周福娜等[11]利用主成分分析技術,通過將高維態故障特性轉換成一維狀態,利用DNN和非線性擬合法,建立系統的RUL預測模型。王佳瑜等[12]利用改進的BP(BackPropagation,反向傳播)網絡對RUL進行預測,并有相應的效果。因此,用多種指標綜合反映軸承的性能退化,是目前國內外研究的重點[13]。
王妍等[14提出一種基于數據分布自適應的刀具RUL預測的深度遷移學習方法,與遷移前的模型相比,遷移后的模型提高了新衰退規律下刀具RUL預測的準確性。Ding等[15提出一種核回歸深度傳遞度量學習方法,能夠提取域不變深度特征,并準確預測軸承在新工況下的RUL。Duan等[1提出一種基于對抗訓練的對抗判別域自適應預測方法,以提高不同工況下跨域預測的準確率。Sun等[17提出一種基于稀疏自編碼器的深度遷移學習網絡,可以在沒有監督信息的情況下預測新對象的RUL,通過刀具RUL預測算例驗證了該方法的有效性,預測結果具有較高的精度。Schwendemann等[l8提出一種基于遷移學習的新型方法,用于小數據集和低采樣率的不同軸承類型的RUL估計,該方法基于一個中間域,該域根據軸承的故障頻率抽象出軸承的特征,特征由卷積層處理,最后使用長短時記憶神經網絡(LongShortTermMemoryNetwork,LSTM)預測軸承的RUL,結果表明該方法適用于低頻傳感器數據以及不同軸承類型之間的有效遷移學習預測。
通過以上研究現狀可以看出,機器學習、深度學習等各種算法在單工況場景下的分類和回歸問題中表現優異,遷移學習已經逐步運用于RUL預測,但這些算法大多需要滿足測試集和訓練集的數據分布一致性。而在實際應用中,由于生產環境的復雜性,不同工況下的數據分布往往不同,存在數據特征分布不一致的問題。盡管一些算法考慮了數據特征分布不一致的問題,但大多數算法都是基于一個數據集,沒有對不同的數據集和不同的機器進行相關研究。因此,本文構建了一個基于卷積長短時記憶神經網絡(Convolutional Long Short Term MemoryNetwork,CNNLSTM)的遷移學習模型,以解決不同數據集、不同設備在不同工況下滾動軸承的RUL預測問題。首先,本文采用一維CNN網絡從原始振動波形中自動提取深度退化特征,避免人工提取特征所帶來的人為誤差。然后,通過最小化深度退化特征的最大均值差異(Max Mean Discrepancy,MMD)距離,并使用域分類器提取源域和目標域中的常見退化特征,解決訓練集和測試集之間數據分布不一致的問題。最后,基于PHM2012和XJTU-SY兩個數據集,對5類16種遷移學習進行仿真實驗。該實驗不僅包括同一數據集在不同工況下的遷移,還包括不同數據集在不同工況下的遷移。為進一步說明本文模型的優勢,與經典的遷移學習模型領域自適應網絡(DomainadaptiveNeuralNetwork,DaNN)和域對抗遷移網絡(Domain-Adversarial Training of Neural Networks, DANN)進行了對比仿真實驗。
1理論依據
1.1長短時記憶神經網絡
軸承衰退的狀況是一個逐步累積、不斷發展的歷程,其狀態的變化與動態監測數據,以及歷史時刻的監控數據密切相關[19]。為能夠更好地提取狀態監測數據中的時間序列信息,本文對傳統的RNN展開優化,構建了LSTM網絡[20]。LSTM網絡的隱藏層采用長時存儲模塊,存儲模塊由3個控制閾值和1個細胞結構構成。如圖1所示,記憶細胞主要用矩形方框表達。
LSTM網絡層以訓練樣本滑動窗口的特征序列為輸入,然后通過多個LSTM網絡,能夠聯接全連接層。在第 n 層的LSTM網絡第 t 時間周期中,周期神經元的狀態可以表示為:

htn=otn?tanh(ctn)

yLSTMout=ReLU(ωhtn+b)
式中: ct(n) 、 W 為權重矩陣; yLSTMout 為最后一層LSTM網絡的輸出;ReLU(RectifiedLinearUnit)為激活函數; ω 為權重矩陣; htn 為第 n 層LSTM網絡的第 t 時刻的短期記憶 ?σ?σ 為偏置。
圖1LSTM結構圖

LSTM網絡在對模型進行訓練時,傳播方向以時間軸為主,根據前向運算對各節點的輸出展開計算,如果達到某一條件,便會終止訓練,如果沒有達到某一要求,則進行迭代。該方法通過訓練,能夠對時序數據進行特征提取,反映出在時間域內的軸承退化過程,因此能較好地預測出目前時刻以后的時間序列。
1.2遷移學習
遷移學習的域是學習的主體,它包括了其數據產生的概率分布;任務是學習的目標,主要由標簽與標簽對應的函數組成。遷移學習的主旨是運用給定具備標簽的源域來實現不具備標簽的目標域。
領域自適應問題是遷移學習的研究內容之一,側重于解決特征空間一致、類別空間一致,僅特征分布不一致的問題。領域自適應技術可以在訓練集與測試集數據分布相似的情況下進行分類與預測,所以本文采取領域自適應技術來解決不同失效類型的軸承RUL預測中所存在的數據分布不一致問題,利用有標簽的數據與部分無標簽的輔助數據去學習一個分類器,來提高目標域上的預測精度。
2 模型構建
軸承退化過程是一個隨時間變化的序列,且軸承自前的狀態與輸入特性、前一時刻的狀態和后一時刻的狀態密切相關[21],本文基于LSTM,將前一時刻、后一時刻狀態和當前輸入特征相結合,建立了一種具有端對端CNNLSTM的混合模型,其具體的結構模型如圖2。首先,采取軸承的原始振動信號作為網絡模型的輸入,由于原始波形中含有豐富的退化特征信息,先采用CNN網絡對輸入信號進行空間特征提取,并實現特征降維。并通過平面層對所提取的特征進行鋪平鏈接;隨后,使用LSTM網絡對所提取的空間特征進行軸承退化趨勢的獲取,即利用時間序列編碼學習對隱藏在數據中的時序關聯特征進行逐層挖掘,獲取隱藏在數據中的時序相關性。最后采取全連接層實現退化特征到RUL的直接映射。該方法充分利用原始數據中的退化特征,且避免了人工提取特征的步驟,大大節約了人力成本,實現高效率的RUL預測,更好的指導后續維修策略的制定。
圖2CNNLSTM網絡結構圖

本文所構建的遷移網絡模型如圖3所示。主要由兩個模塊組成: ① 回歸預測模塊,采取一維CNN為主體來提取原始波形中的退化趨勢特征,并采取LSTM網絡來進行RUL預測;② 領域自適應模塊,主要采用度量策略與對抗遷移策略相結合的方式來解決不同工況下軸承數據分布不一致的問題。其中,度量策略通過數據概率分布差異度量來實現領域自適應,對抗遷移策略采取最大化域分類器誤差來實現領域自適應。領域自適應模塊連接在特征提取器后,用來輔助遷移卷積模型學習域不變特征。
本文所構建的軸承RUL預測框架如圖4所示。主要分為三個部分: ① 采用CNN網絡進行原始波形的特征提取; ② 采取領域自適應技術對不同工況下的軸承振動信號進行數據分布對齊; ③ 采用LSTM網絡進行“端到端”式的軸承RUL預測。具體為:首先通過振動傳感器獲取不同工況下軸承的振動信號,構建數據集,并給訓練集工況下的軸承進行標簽標注,然后將訓練數據、訓練標簽、輔助集數據一同輸入至CNN網絡,進行不同工況下的特征提取。利用MMD度量與對抗遷移策略對所提取的退化特征進行對齊處理,消除不同工況下軸承振動的信號差異,最后采用LSTM網絡進行特征到RUL的直接映射,從而得到適用于不同工況軸承預測的遷移網絡模型。
3案例分析
3.1數據集描述
本文選用了與機泵軸承工況相近的數據集如表1所示[22-23]。以A軸承數據集為例,將采取工況一下的軸承作為源域、工況二下的軸承作為目標域進行實驗,A軸承部分軸承退化數據如圖5所示。可以看出,工況一(軸承1-1和1-2)與工況二(軸承2-1和2-2)下的軸承數據退化趨勢存在一定的差異性。
3.2不同工況滾動軸承剩余壽命預測
為全面驗證所提出方法的泛化性,本文在設置同數據集里面的軸承RUL仿真實驗分別為任務A、任務B和任務C;在不同數據集的軸承RUL仿真實驗為任務 D 具體的遷移任務如表2、表3所示。
實驗模型的具體參數設置如下。在特征提取部分,采取兩層卷積與池化層網絡結構,卷積核與普通池化核分別設置為5和2。在全連接層和LSTM遷移部分,MMD距離計算選取RBF函數作為核函數,核寬度為1。
GRL(GradientReversalLayer)為梯度反轉層。
圖3遷移網絡結構模型

圖4本文的軸承RUL預測流程圖

表1軸承數據集

圖5部分軸承退化數據圖

表2遷移任務劃分情況1

表3遷移任務劃分情況2



式中: RRMSE 為均方根誤差; M?MAE 為平均絕對誤差; ?m 為預測值個數;
為預測值; y 為真實值。
當MMD度量損失函數占總損失的0.25時網絡達到最優效果。學習率為0.001。批大小為16,其中一半數據來自于源域,一半來自于目標域。迭代次數為150。評價指標采用均方根誤差(Root Mean Squared Error,RMSE)和平均絕對誤差(Mean Absolute Error,MAE),分別計算為:
這兩個指標值越低,對應遷移壽命預測方法的性能越好。具體預測結果如表4所示。
如表5所示,為驗證本文模型的優越性,將本文模型與傳統的CNNLSTM模型、遷移學習中經典的DaNN及目前較先進的DANN進行對比。為保證對比效果的準確性,所采用對比模型的結構和超參數與本文模型的設置一致。可以看出:
(1)有無遷移的對比。相比于CNNLSTM模型,本文模型在添加遷移學習后,模型的預測能力在測試集上均得到了一定改進,并在每個測試軸承上均表現出最優的預測效果。
(2)與其他遷移學習進行對比。DaNN是通過將源域與自標域特征映射到一個高維的再生希爾伯特空間,在此空間里,最小化源域與目標域的距離。DANN采取對抗策略來學習源域與目標域的不變特征,從而實現在測試集上較高的預測精度。這兩個模型的特征提取部分仍使用CNN模塊進行。由表4可知,在不同工況下軸承預測結果中,本文基于MMD遷移機制組合對抗遷移策略的CNNLSTM網絡均得到不錯的預測結果。主要原因是本文模型不僅采取了領域自適應的技術去解決訓練集與測試集數據分布不一致的問題,而且采取了CNN來提高網絡的特征提取能力,從而進一步提升其遷移效果。
表4本文模型的預測效果

表5模型對比

為進一步說明本文模型的優越性,將本文模型與經典遷移模型 DaNN[24]、DANN[25]進行對比實驗,結果如表6所示。
可以看出,本文模型在訓練集與測試集上均呈現出較好的效果。多數軸承均在RMSE評價指標上得到了良好的效果。本文模型在任務A的軸承2-5和任務B的軸承2-5預測效果分別略低于DaNN和DANN的預測效果,可能的原因是任務A的軸承2-5和任務B的軸承2-5的退化趨勢與對應任務A和任務B的訓練集的軸承退化趨勢基本一致,采取雙重遷移策略可能會導致數據差異糾正過度。
表6預測效果評價RMSE對比

4結論與展望
本文構建了一種基于CNNLSTM的遷移學習模型,用于解決不同工況下軸承的RUL預測。首先,本文采取一維CNN,從原始振動波形中自動提取深層退化特征,避免了人工提取特征所帶來的人為誤差。然后,基于MMD遷移機制與對抗遷移機制對CNNLSTM模型進行改進,通過最小化深度退化特征的MMD距離與采用域分類器提取源域、目標域公共退化特征,從而解決訓練集與測試集數據分布不一致的問題。最后,在2個數據集上進行了5類16個遷移學習的仿真實驗,該實驗不僅包含同數據集不同工況的遷移,也包含不同數據集不同工況的遷移。為進一步說明本文模型的優越性,將其與經典的遷移學習模型DaNN和DANN進行了對比仿真實驗。對比結果得出,本文方法所采取的領域自適應模塊在不同工況下的軸承預測中提高了跨工況軸承RUL預測精度,為設備的失效預警和維修決策的準確性以及時效性提供了一定的理論依據。
由于數據特征分布不一致的問題影響著預測精度,未來可通過進一步拉近數據特征的分布以及構建更優的遷移學習方法去更好地學習域的不變特征。盡管本文的遷移學習實現了軸承跨域和跨工況的RUL預測,但只用該方法研究了滾動軸承的RUL,未來可在齒輪箱等其他轉動部件上進行進一步研究。
參考文獻:
[1]RENL,CUIJ,SUNY,etal.Multi-bearing remaining useful life collaborative prediction:A deep learning approach[J].Manuf. Syst, 2017 (43):248-256.
[2]RENL,SUNY,CUI J,etal.Bearingremaininguseful life pre-diction based on deep autoencoder and deep neural networks[J]. Manuf.Syst.,2018 (48):71-77.
[3]ZHANGC,LIMP,QINA,etal.Multiobjective deepbelief networks ensemble forremaininguseful lifeestimationin prognostics[J].IEEE Trans.Neural Netw.Learn.Syst,2017,28 (10): 2306-2318.
[4]LIAO L,JIN W,PAVEL R.Enhanced restricted Boltzmann machine with prognosability regularization for prognosticsand health assessment[J].IEEE Trans.Ind.Electron,2016,63 (11) :7076-7083.
[5]BABUGS,ZHAOP,LIXL.Deep convolutional neural network based regression approach for estimation of remaining useful life[C]. Proc.Int. Conf. Database Syst. Adv. Appl. (DASFAA),2016 : 214-228.
[6]LI X,DING Q,SUN J Q. Remaining useful life estimation in prognostics using deep convolution neural networks[J]. Rel. Eng. Syst. Saf,2018 (172):1-11.
[7]WU Y,YUAN M,DONG S,et al. Remaining useful life estimation of engineered systems using vanilla LSTM neural networks[J].Neurocomputing,2018,275:167-179.
[8]ZHENG S,RISTOVSKI K, FARAHAT A, et al. Long short-term memory network for remaining useful life estimation[C].Proc. IEEE Int.Conf.Prognostics Health Manage.(PHM),2017:88-95.
[9]ZHAO R,YANR,WANG J, et al. Learning to monitor ma-chine health with convolutional bi-directional LSTM networks[J].Sensors, 2017,17 (2) : 273.
[10]ZHAO R, WANG D, YAN R, et al. Machine health monitoring using local feature-based gated recurrent unit networks[J].IEEE Trans.Ind.Electron,2018,65(2):1539-1548.
[11]周福娜,高育林,王佳瑜,等.基于深度學習的緩變故障早期 診斷及壽命預測[J].山東大學學報(工學版),2017,47(5): 30-37.
[12]王佳瑜.數據驅動的緩變微小故障早期診斷及RUL[D].鄭 州:河南大學,2017.
[13]于舒揚.基于遷移學習的工業故障診斷與預測模型的研究與 實現[D].北京:北京郵電大學,2020.
[14]王妍,胡小鋒.基于深度遷移學習的刀具剩余壽命預測[J].組 合機床與自動化加工技術,2022(8):133-136.
[15]DING YF,JIA MP,MIAO QH, et al. Remaining useful life estimationusing deepmetric transfer learning for kernel regression[J]. Reliability Engineering amp; System Safety,2021,212 : 107583.
[16]DUAN,YH,XIAO J,LI HH,et al. Cross-Domain Remaining Useful Life Prediction Based on Adversarial Training[J]. Machines, 2022,10(6):438.
[17]SUN C,MA M, ZHAO Z B, et al. Deep Transfer Learning Based on Sparse Autoencoder for Remaining Useful Life Prediction of Tool in Manufacturing[J]. IEEE Transactions on Industrial Informatics, 2019,15(4):2416-2425.
[18]SCHWENDEMANN, SEBASTIAN,SIKORA, et al. TransferLearning-Based Estimation of the Remaining Useful Life of Heterogeneous Bearing Types Using Low-Frequency Accelerometers[J]. Journal of imaging,2023,9(2):43.
[19]武臣臣.滾動軸承剩余壽命預測的方法及不確定性度量研究 [D].沈陽:東北大學,2021.
[20]姜廣君,楊金森,穆東明.基于CNN-LSTM的機床滾動軸承 性能退化趨勢和壽命預測[J].機床與液壓,2024,52(6):184-189. [21]劉文彪,段禮祥,耿帆,等.基于CNN-BLSTM 網絡的軸承 性能退化預測[J].電子測量與儀器學報,2021,35(2):80-86. [22]NECTOUX P,GOURIVEAU R,MEDJAHER K, et al. An experimental platform for bearings accelerated degradation tests[C]. IEEEInternational Conference on Prognosticsand Health Management IEEE,2012.
[23]KUMAR S,FELIXL,MARCUS L. A Comprehensive guide to BayesianConvolutionalNeuralNetworkwithVariational Inference[J].arXiv preprint arXiv,2019 (1901): 02731.
[24]GHIFARY M, KLEIJN W B, ZHANG M. Domain adaptive neural networks for object recognition ∵ Pacific Rim International Conference on Artificial Intelligence[C].Springer : Cham, 2014. [25]PANSJ,TSANGIW,KWOKJT,et al.omainadaptationvia transfer component analysis[J]. IEEE Trans.Neural Netw,2011,22 (2) : 199-210.