基于卷積神經(jīng)網(wǎng)絡的軸承剩余壽命預測方法

2024-12-31 00:00:00張浩趙軍王鹿張銀龍程思宇

現(xiàn)代信息科技 2024年10期

摘" 要：為提高自動扶梯軸承剩余使用壽命（RUL）預測模型的預測精度和泛化能力，提出一種基于卷積神經(jīng)網(wǎng)絡（CNN）的軸承RUL預測方法。首先基于3σ準則對原始數(shù)據(jù)進行去噪，通過快速傅里葉變換獲得其頻率特征，其次將不同于傳統(tǒng)時間序列數(shù)據(jù)劃分方法的分層抽樣應用于數(shù)據(jù)劃分，并構造一個由三個卷積層和兩個全連通層組成的深度卷積神經(jīng)網(wǎng)絡DCNN模型，最后利用NASA IMS數(shù)據(jù)集對預處理方法、DCNN模型精度和泛化能力進行評估，證明了該方法的優(yōu)越性。

關鍵詞：剩余壽命預測；3σ準則；分層抽樣；DCNN；泛化能力

中圖分類號：TP391；TH133.3 文獻標識碼：A 文章編號：2096-4706（2024）10-0032-06

Prediction Method for Bearing Remaining Useful Life Based on

Convolutional Neural Networks

ZHANG Hao1， ZHAO Jun1， WANG Lu1， ZHANG Yinlong2， CHENG Siyu2

（1.Nanjing Metro Construction Co.， Ltd.， Nanjing" 211806， China;

2.China Railway Siyuan Survey and Design Group Co.， Ltd.， Wuhan" 430063， China）

Abstract： To improve the prediction accuracy and generalization ability of the Remaining Useful Life （RUL） prediction model for escalator bearings， a bearing RUL prediction method based on Convolutional Neural Network （CNN） is proposed. Firstly， it denoises the original data based on 3σ criterion， obtains its frequency characteristics through fast Fourier transformation. Secondly， it applies layered sampling different from traditional time series data partitioning methods to data partitioning， and constructs a Deep Convolutional Neural Network （DCNN） model consisting of three convolutional layers and two fully connected layers. Finally， the NASA IMS dataset is used to evaluate the preprocessing method， DCNN model accuracy， and generalization ability， proving the superiority of this method.

Keywords： RUL prediction; 3σ criterion; layered sampling; DCNN; generalization ability

0" 引" 言

自動扶梯軸承剩余使用壽命（Remain Useful Life， RUL）預測對公共安全極其重要，精確的RUL預測可以減少自動扶梯的維修停梯時間，提高運營效益并降低運營成本[1-3]，確保采取適當?shù)木S護決策[4]，避免扶梯設備造成的人員傷亡和財產(chǎn)損失[5]，研究和提高自動扶梯軸承RUL預測技術的準確性具有較強的現(xiàn)實意義[6-8]。

深度學習結合不同的神經(jīng)網(wǎng)絡可以在RUL預測中取得優(yōu)異的結果，泛化能力是評價模型預測性能的重要指標[9]。基于此，本文提出了一種用于軸承RUL預測的方法，利用3σ準則去除原始數(shù)據(jù)中的粗監(jiān)測誤差，通過快速傅里葉變換從時域數(shù)據(jù)中獲得軸承的頻率特征，基于時間和頻率特征通過分層抽樣構建訓練集和測試集。如果訓練后損失函數(shù)最小，則保存訓練后的模型。如果損失函數(shù)不是最小的，則采用反向傳播法來調整卷積層和全連接層的權重W和偏置B，直到損失函數(shù)達到最小。最后使用測試數(shù)據(jù)對訓練好的模型進行測試。如果指數(shù)值是最佳的，則獲得預測的RUL。如果指數(shù)值不是最優(yōu)的，則調整訓練次數(shù)、核大小和隱藏層深度，以獲得最優(yōu)的指數(shù)值。

1" 數(shù)據(jù)預處理

1.1" 數(shù)據(jù)去噪

假設數(shù)據(jù)服從高斯分布，采用3σ準則來消除測量數(shù)據(jù)中的粗差，數(shù)據(jù)分布幾乎完全集中在（μ-3σ，μ+3σ）區(qū)間，超過該區(qū)間的數(shù)據(jù)比例為0.27%，區(qū)間之外的數(shù)據(jù)在此步驟被去除。

1.2" 時間和頻率特征選擇

通過快速傅里葉變換從原始時域獲取頻率特征，如表1所示。

1.3" 跟蹤度量

跟蹤度量是壽命分析的基礎，包括穩(wěn)定性和準確性，反映軸承振動趨勢和可靠性。均方根值能夠反映整個數(shù)據(jù)集的變化趨勢，具有合理的穩(wěn)定性，滿足跟蹤指標的要求。每組的均方根描述了數(shù)據(jù)集在相應時間點的振動，整個數(shù)據(jù)集的均方根反映了振幅的變化趨勢。均方根值表示為：

其中，xi表示第i點的監(jiān)測數(shù)據(jù)。

1.4" 標準化

監(jiān)測數(shù)據(jù)包括軸承運行中每個點的振幅[10]。數(shù)據(jù)中的正負信號代表振幅的方向，歸一化數(shù)據(jù)在[0，1]中變化。去噪數(shù)據(jù)被歸一化以避免過大或過小的值：

其中，xi表示第i點的監(jiān)測數(shù)據(jù)，xmin和xmax表示數(shù)據(jù)去噪后同一時間點的最小值和最大值。

1.5" 數(shù)據(jù)分區(qū)

采用分層抽樣的方法對預測模型構建訓練集和測試集，學習軸承運行過程中各階段的特征。軸承運行的完整歷史數(shù)據(jù)包括時間和頻率特征，根據(jù)時間序列將其分組。每組包含5個數(shù)據(jù)點，按4：1的比例提取，即每4個數(shù)據(jù)點中提取1個數(shù)據(jù)點。提取的數(shù)據(jù)作為測試集，剩余的數(shù)據(jù)構成訓練集。

2" 預測模型構建

2.1" 預測模型結構

本文構建了一個基于DCNN的預測模型，應用ReLU作為激活函數(shù)，精確擬合數(shù)據(jù)并進行預測；表達式如式（4）所示。在DCNN正向傳播中應用了丟包來避免過擬合，提高了模型的泛化能力，丟包值被設置為0.7；應用損失函數(shù)評價模型的準確性作為反向優(yōu)化的指標，表達式如式（5）所示；Adam優(yōu)化算法用于改善結果。Adam函數(shù)的主要思想是通過使用梯度的一階矩估計和二階矩估計來調整每個參數(shù)的學習率。偏差修正后，學習率集中在一定范圍內穩(wěn)定參數(shù)。使用Adam算法優(yōu)化模型包括4個步驟：計算每個參數(shù)的梯度，如式（6）所示；計算速度更新量和修改的速度更新量，如式（7）和（8）所示，其可以根據(jù)更新的參數(shù)和梯度累積平方來動態(tài)調整速度；計算梯度累積平方和修正梯度累積平方，如式（9）和（10）所示，速度更新量和梯度累積平方是Adam優(yōu)化的關鍵技術；更新參數(shù)，如式（11）所示，其中η表示步長因子，其取決于速度更新量和梯度累積平方。測試集被輸入到訓練好的模型中以預測RUL并分析其可靠性：

其中，ω表示參數(shù)，dω表示ω的一階矩，L（ω）表示ω的函數(shù)。

v = β1v + （1 - β1）dω" " " " " " " " " " "（6）

其中，β1表示一階矩估計的指數(shù)衰減率，v表示速度更新量。

其中，表示當前時刻第一時刻估計的指數(shù)衰減率，v'表示修正的速度更新量。

Sdω = β2Sdω + （1 - β1）dω2" " " " " " " " " " " " " "（8）

其中，β2表示二階矩估計的指數(shù)衰減率，Sdω是梯度累加平方，dω2表示ω的二階矩。

其中，表示當前時刻二階矩估計的指數(shù)衰減率，Sdω'表示修正的梯度累加平方。

輸入特征被轉換成一維向量，6個元素中的每一個在相同的時間點對應于6個特征（如表1所示），使得第一組代表第一時間點。第一個卷積層中的核大小是6×1，步長是6，這意味著核為每個操作同時計算6個特征。兩個具有1×1核的卷積層跟隨以增強特征學習的能力。第一個全連接層在卷積后集成了這些功能，第二個全連接層計算預測結果。

2.2" 模型評估

該模型由均方根誤差（Rm）、擬合優(yōu)度（R2）、調整后的擬合優(yōu)度（調整后的R2）進行評估。

Rm表示一個衡量預測值和實際值之間差異的指數(shù)。Rm越接近0，預測結果越準確，計算式為：

其中，yi表示實際值，表示預測值。

R2表示統(tǒng)計學中用于評估回歸模型擬合度的優(yōu)秀標準。R2值通常在[0，1]范圍內變化。值越接近1，模型的擬合越好。當模型擬合不好時，函數(shù)值接近于0。計算式為：

其中，表示平均值，n表示數(shù)據(jù)中的樣本數(shù)。

根據(jù)式（12），當樣本數(shù)量相對較大時，R2增加，因此擬合優(yōu)度可能不能準確地表示評估模型的性能，尤其是在大樣本量的情況下。為了克服這個問題，提出了一種調整的" 來避免數(shù)據(jù)樣本數(shù)量對模型評價的影響。計算式為：

其中，n表示數(shù)據(jù)中的樣本數(shù)量，p表示數(shù)據(jù)中的特征數(shù)量。

3" 實驗分析

本文利用NASA IMS數(shù)據(jù)集中的3個軸承運行的監(jiān)測信息來進行模型驗證。每個軸承都配有一個傳感器，每次記錄20 480個點的振動。

3.1" 模型比較

選擇RNN、LSTM作為比較模型。為了使比較更有說服力和有效性，選擇每個模型的最優(yōu)預測結果進行比較；因此，每個模型數(shù)據(jù)集的劃分比例是不同的：

1）RNN。為了保證比較的公平性，基于TensorFlow框架構建了RNN預測模型。將數(shù)據(jù)以8：2的比例分成訓練集和測試集，并構建4個RNN層。最后一層是全連接層。采用ReLU作為激活函數(shù)，均方誤差作為損失函數(shù)，采用Adam優(yōu)化算法。每層神經(jīng)元分別為33、17、6、1，丟包值設置為0.7。

2）LSTM。基于TensorFlow框架，構造了一個具有三個隱藏層的LSTM預測模型。數(shù)據(jù)集按照7：3的比例分為訓練集和測試集。最后一層應用ReLU作為激活函數(shù)。損失函數(shù)采用均方誤差，采用Adam優(yōu)化算法。LSTM由四層組成；每層神經(jīng)元分別為35、24、11和1，丟包值設置為0.7。

3）DCNN。對于本文提出DCNN模型，數(shù)據(jù)集按照4：1的比例分為訓練集和測試集。

3.2" 模型驗證

選擇第二組IMS數(shù)據(jù)集中軸承1的監(jiān)測數(shù)據(jù)作為模型訓練數(shù)據(jù)。通過兩個實驗驗證了該方法的有效性。實驗一評估了本文提出數(shù)據(jù)去噪方法的有效性，實驗二評估了模型的泛化能力。

3.2.1" 實驗一

對于第1個軸承的運行數(shù)據(jù)，使用不同的數(shù)據(jù)預處理方法（無去噪、硬閾值去噪、軟閾值去噪和3σ準則去噪）比較3個模型（RNN、LSTM、DCNN）的預測，以確定去噪方法對預測精度的影響：

1）沒有去噪的數(shù)據(jù)。實驗結果如圖1所示，RNN和LSTM模型的預測曲線與真實曲線有很大的不同，就95%置信區(qū)間和預測誤差而言，最小波動出現(xiàn)在DCNN中，各模型的評價指標如表2所示。

表2中的定量分析表明，各評價指標的最優(yōu)值為Rm = 0.018 18，R2 = 0.958 46，調整后的R2 = 0.958 12，均由DCNN模型實現(xiàn)。綜合定性和定量分析表明，當數(shù)據(jù)未去噪時，DCNN模型的預測值最接近真實值。

2）硬閾值去噪。硬閾值去噪在提高精度方面是有效的，結果如圖2所示，評價指標如表3所示。

表3中的定量分析表明，除了得分指標之外，DCNN可以實現(xiàn)每個評估指標的最佳值，因為得分函數(shù)對高估給出了較大的懲罰，對預測不足給出了較小的懲罰。最優(yōu)值為Rm = 0.057 53，R2 = 0.993 82，調整后的R2 = 0.993 38。

綜合分析表明，DCNN可以在硬閾值去噪的情況下獲得理想的預測結果，連續(xù)卷積操作有助于提高模型的預測能力。

3）3σ準則去噪。本文提出的3σ準則去噪后模型的結果如圖3所示，評價指標如表4所示。

表5中的定量分析表明，各評價指標的最優(yōu)值為Rm = 0.005 25，R2 = 0.997 62，調整后的R2 = 0.997 60，均由DCNN模型實現(xiàn)。

根據(jù)對三者的定量分析，用3σ準則去噪，預測值與實際值最接近。綜合比較后可知采用3σ準則去噪結合DCNN可以得到最佳的預測結果。

3.2.2" 實驗二

由于各軸承的退化趨勢不同，選擇第2、3軸承的運行數(shù)據(jù)作為實驗測試數(shù)據(jù)，以驗證模型的泛化能力，并評估模型依賴于每個數(shù)據(jù)集的性能。實驗一結果如圖4、圖5所示，3σ準則去噪最大化了DCNN模型的預測精度。為了驗證預測性能最好的模型（帶3σ去噪的DCNN）的泛化能力，實驗二仍然采用3σ準則去噪，應用3σ準則去噪時，3個模型的參數(shù)和結構與實驗一一致。通過不同的數(shù)據(jù)集驗證了模型的泛化能力。

各模型的評價統(tǒng)計如6表所示，不同軸承的最佳評估指標值以粗體顯示，所有這些評價指標都是通過DCNN實現(xiàn)的。

由表可知RNN和LSTM的評價指標值與DCNN模型存在較大差距；也就是說，預測結果是最差的，同時與軸承1的評價指標也有較大出入反映出其泛化能力也較弱。

表6的綜合分析結果表明，RNN和LSTM的預測能力較差，DCNN對于不同退化趨勢的軸承可以獲得較好的預測結果，即DCNN的泛化能力最好。

3.3" 結果分析

實驗一的結果分析，如表3至表6所示，表明DCNN模型的預測評價指標值最接近理想值；因此，DCNN模型的預測精度最高。通過3σ準則去噪預處理，提高了模型的預測評價指標值，表明3σ準則去噪效果最好。因此，結合DCNN模型的3σ準則去噪預處理方法對3個評價指標進行了優(yōu)化，最優(yōu)值為Rm = 0.005 25，R2 = 0.997 62， = 0.997 60。

實驗二的結果分析，如表6所示，比較了每個模型的相應評價指標值。RNN、LSTM模型的相應評價尺度變化較大，表明RNN、LSTM嚴重依賴數(shù)據(jù)集，易受數(shù)據(jù)結構的影響，泛化能力弱。對應于DCNN模型的每個評估指標的值的變化最小。這一發(fā)現(xiàn)表明，該模型對數(shù)據(jù)集具有很強的適應性和最好的泛化能力。DCNN模型預測的評估指數(shù)值的范圍如下：Rm （0.005 25，0.010 84）、R2 （0.993 45，0.997 62）、（0.993 39，0.997 60），DCNN模型的變異范圍最小，泛化能力最好。

4" 結" 論

本文提出了一種基于神經(jīng)網(wǎng)絡理論的軸承RUL預測方法，該方法預測能力強，泛化能力強。通過3σ準則法有效地去除了數(shù)據(jù)中的粗監(jiān)測誤差，提高了模型預測精度，得到的評價指標值比其他去噪方法得到的結果更接近理想結果。構造了由三個卷積層和兩個全連通層組成的DCNN模型。并通過模型驗證實驗表明，基于3σ準則和分層抽樣結合DCNN的去噪方法具有最高的預測精度和最強的泛化能力。

參考文獻：

[1] 梁敏健，彭曉軍，劉德陽.基于一維卷積神經(jīng)網(wǎng)絡的自動扶梯機械故障分類研究 [J].測控技術，2022，41（7）：87-92+110.

[2] KHAN S，YAIRI T. A Review on the Application of Deep Learning in System Health Management [J].Mechanical Systems and Signal Processing，2018，107：241-265.

[3] KUNDU P，DARPE A K，KULKARNI M S. Weibull Accelerated Failure Time Regression Model for Remaining Useful Life Prediction of Bearing Working Under Multiple Operating Conditions [J].Mechanical Systems and Signal Processing，2019，134：106302[2023-06-10].https：//doi.org/10.1016/j.ymssp.2019.106302.

[4] 關鵬，張毅.自動扶梯軸承健康指標提取及剩余壽命預測方法研究 [J].機電工程，2022，39（2）：202-209.

[5] LEE J，WU F J，ZHAO W Y，et al. Prognostics and Health Management Design for Rotary Machinery Systems—Reviews， Methodology and Applications [J].Mechanical Systems and Signal Processing，2014，42（1-2）：314-334.

[6] LEI Y G，LI N P，GONTARZ S，et al. A Model-Based Method for Remaining Useful Life Prediction of Machinery [J].IEEE Transactions on Reliability，2016，65（3）：1314-1326.

[7] 杜澤厚.基于深度學習的軸承健康因子構建及壽命預測研究 [D].青島：青島科技大學，2022.

[8] QIAN Y N，YAN R Q，GAO R X. A Multi-Time Scale Approach to Remaining Useful Life Prediction in Rolling Bearing [J].Mechanical Systems and Signal Processing，2017，83：549-567.

[9] 鄭琪，趙春暉.軸承磨損階段劃分與分段剩余壽命估計方法 [J].控制工程，2022，29（4）：593-599+636.

[10] LEI Y G，LI N P，GUO L，et al. Machinery Health Prognostics： A Systematic Review from Data Acquisition to RUL Prediction [J].Mechanical Systems and Signal Processing，2018，104：799-834.

作者簡介：張浩（1983—），男，漢族，江蘇南京人，高級工程師，碩士研究生，研究方向：機械設計。