張繼冬 鄒益勝 鄧佳林 張笑璐
西南交通大學機械工程學院,成都,610031
得益于信號采集與計算機技術的發展,在設備運行過程中獲取大量的狀態監測數據成為可能,這推動了數據驅動的機械設備剩余壽命預測方法研究的發展。
傳統的剩余壽命預測方法需要2個基礎步驟:①建立性能退化指標;②研究預測模型。性能退化指標的建立旨在從采集的振動加速度信號中得到能表征軸承性能退化過程的指標;預測模型針對性能指標的退化趨勢進行預測,以達到預測壽命的目的。性能退化指標構建的一種方法是從原始信號中提取單一的統計特征并將其作為性能退化指標,如LI等[1]采用的均方根和峭度,王冰等[2]采用的基于多尺度形態分解譜熵,李洪儒等[3]采用的二元多尺度熵。使用單一的時域或時頻域特征來人工構造性能退化指標,需要大量的經驗與專業知識,且單一的統計特征也難以保證后續的預測精度。除此之外,還有將多種指標融合的性能退化指標構造方法,如WANG等[4]采用的主成分分析方法,王建利[5]采用自組織圖譜融合構造新性能退化指標的方法。這些利用數據降維進行特征融合的方法在降維過程中會損失部分信息,且這些方法都是基于無監督學習的方法,在降維中沒有加入與剩余壽命相關的約束條件,無法保證這些損失的信息都是與軸承剩余壽命相關度低的信息。在數據驅動的機械設備剩余壽命預測方法的研究中,高斯博[6]利用線性Wiener過程,LIU等[7]采用隱馬爾可夫模型,李洪儒等[3]使用極限學習機,申中杰[8]使用支持向量機,陳法法等[9]使用小波支持向量機進行剩余壽命預測。以上方法均需要先人工構造特征,且所用方法在模型復雜度和學習能力上較以卷積神經網絡為代表的深度學習方法存在差距,所以預測精度仍有提升空間。
以上剩余壽命預測方法的重點在于性能退化指標的構建。傳統方法的性能指標需要人工提取信號的某種或某些特征,再進行篩選和融合。在這個過程中,為了提取合適的特征,需要對所采集信號的特性有相當程度的了解,并且特征的篩選和融合需要一定的經驗與知識,所以合適特征的提取與融合需要投入大量的精力。另外,單一的性能退化指標往往不適用于大多數的退化過程,它在不同個體的剩余壽命預測中的表現不穩定。
針對上述問題,筆者提出基于全卷積層神經網絡的軸承剩余壽命預測方法,將卷積神經網絡用于軸承剩余壽命預測可以免去傳統方法中的特征提取、篩選與融合等步驟,而這些步驟往往需要一定的經驗與相關知識。本文方法將全連接層全部換為卷積層與池化層,利用卷積層的局部連接和權值共享的特性,簡化網絡的權值參數,降低對訓練樣本量的需求,提高網絡泛化能力。直接將原始振動信號作為網絡的輸入時,輸出的預測結果曲線中會存在大量的噪聲,故本文將加權平均的方法用于預測結果的降噪,該方法只需用到當前預測點以及其前面的數據,適用于剩余壽命預測過程中的降噪。
卷積神經網絡的核心在于特征的自主學習,與傳統的壽命預測方法相比,它減少了人工的特征提取等操作。使用多層卷積神經網絡時,每個卷積層將提取信號不同層次的特征,能更好地反映數據本身的特點。傳統的卷積神經網絡包括卷積層、池化層和全連接層,如圖1所示,本文中用作參考的傳統卷積神經網絡表的結構共有13層,包括1個輸入層、用于特征學習的3個卷積層(C1~C3)和3個池化層(P1~P3)、用于將特征展開到一維的1個扁平化層(F)、用于預測剩余壽命的5個全連接層(D1~D5)。考慮到全連接層的參數較多,采用了dropout方法防止過擬合。

圖1 傳統卷積神經網絡結構示意圖Fig.1 Schematic diagram of traditional convolutional neural network structure
全卷積層神經網絡將傳統卷積神經網絡最后的全連接層更換為卷積層和池化層,利用卷積層的權值共享、局部連接等特性,減少了網絡權值等在訓練中需優化參數的數量[10],在減小訓練樣本需求的同時提高了結果的可靠性。如圖2所示,該網絡共有14層,包括1個輸入層、7個卷積層(C1~C7)、6個池化層(P1~P6)。首先,由輸入層將原始的振動數據輸入到第1個卷積層;然后,經過多個卷積層和池化層,提取信號中的特征并降低數據維度;網絡的最后一個池化層輸出的一個單值數據表示剩余壽命。全卷積層神經網絡的前7層與傳統的卷積神經網絡相同,但全卷積層神經網絡的后6個全連接層改為4個卷積層與3個池化層,并舍棄了dropout等正則化過程。

圖2 全卷積層神經網絡結構示意圖Fig.2 Schematic diagram of full convolutional neural network structure
全卷積層神經網絡的核心是卷積層,它對輸入的數據進行卷積運算,增強原始信號中的有效信息并抑制噪聲的影響。每個卷積層都有一個卷積核,每個卷積核只與輸入信號的部分區間相連,形成局部連接,而傳統的全連接層要求每個輸入單元與每個輸出單元都產生交互。兩種連接方式如圖3所示,局部連接比全連接需要更少的權重參數,不僅降低了模型的存儲需求,而且提高了計算效率。

圖3 網絡連接方式示意圖Fig.3 Network connection diagram
每個卷積層的計算如下:
(1)
式中,*表示卷積操作;In為與卷積核相連的部分輸入單元;N為該部分輸入單元的數量;zi為第i個輸出單元;wi,n為與第i個輸出單元相連的所有輸入單元中第n個單元的權重;bi為該輸出單元的偏置。
由于上述卷積操作為線性變化,而線性模型的表達能力有所欠缺,所以需通過非線性激活函數來得到下一層的輸入。本文選擇relu(線性整流函數)作為激活函數,其定義如下:
yi=max(0,zi)
(2)
式中,yi為經過激活函數的輸出。
池化層對卷積層的輸出起到降采樣的作用,以減少數據維度。它能夠對特征進行壓縮,不僅減小后續網絡的計算量,并且能夠突出更重要的特征。輸入到池化層的數據先被分割成一系列的片段,再由池化函數計算出片段中最有價值的信息來代替這一片段的信息,從而完成對特征的壓縮。本文選用的最大池化方法將片段yi-yi+1內的最大值作為特征來代替片段yi-yi+1。
建立好全卷積層神經網絡模型后,需要對其輸入訓練樣本{(xi,yi)}進行訓練,其中,xi為訓練的輸入數據,本文中為采集到的原始振動數據;yi為訓練樣本的標簽,本文中為振動數據對應的剩余壽命。訓練時,將訓練樣本xi輸入模型,得到計算出的剩余壽命yi,t,計算模型的剩余壽命計算值yi,t與實際剩余壽命yi間的均方誤差作為損失函數,均方誤差的計算公式為
(3)
式中,M為訓練樣本的總數。
以減小均方誤差L作為優化目標,在訓練集上最小化L來優化模型的參數。
本文模型的輸入為原始振動數據,將原始振動數據輸入預測模型后直接得到預測值。預測值中存在相當大的噪聲,導致預測的剩余壽命曲線存在相當大的波動,造成預測結果誤差大。剩余壽命預測中,預測某一時刻的剩余壽命時,只有當前時刻和以前時刻的預測值,基于數據驅動的預測方法在應用時,將采集的數據作為輸入才能預測剩余壽命。一般的滑動平均降噪方法需要預測時刻前后的數據,即需要使用未來的數據才能對該點進行平滑,所以滑動平均方法不適用。本文采用加權平均方法,用一個時間段內預測值的加權平均值代替最后一個時刻的預測值,靠近當前預測點的數據具有更大的權重。此外,為了取得更好的降噪效果,在計算最新時刻的結果時,采用已經降噪過的數據進行迭代計算,即在計算Ym時,用計算好的Ym-5~Ym代替Pm-5~Pm進行計算,這樣,該時刻的降噪計算結果實質上是所選時間段內當前時刻的未降噪預測結果與之前時刻已降噪結果的加權平均,具體的計算方法如下:
(4)
式中,m為時間長度;wi為權重,取等差數列;Yi為已降噪結果;Pm為當前時刻未降噪的預測值。
本文的實驗數據為從滾動軸承加速壽命臺架試驗采集的振動加速度數據,它來源于IEEE 2012年的PHM數據挑戰賽[11]。該數據集包含3種工況下的17個滾動軸承的全生命周期振動數據,每10 s采集一次數據,采樣頻率為25.6 kHz,一次采樣時間為0.1 s,所以每次采集可得到2 560個振動加速度,振動加速度的測量值達到預先設定的閾值時認為的軸承失效,軸承的剩余使用壽命結束。本文模型不考慮工況的影響,用軸承數據集中的16個構建訓練樣本,將剩余的1個作為測試樣本進行試驗。每條訓練樣本{(xi,yi)}中的xi為第i次采集到的振動加速數據,即0.1 s內傳感器采集的數據(共有2 560個數值),圖4所示為原始振動信號。yi為該次采集時所對應的剩余壽命——當前時刻與失效時刻間的時間與起始時刻和失效時刻間時間的比值。如某一軸承共有2 803條采集數據,其使用壽命為28 030 s,當前樣本為其第1 500條采集數據時,剩余壽命為13 030 s,訓練時的標簽yi即為剩余壽命0.464 859。

圖4 原始振動信號Fig.4 Original vibration signal
首先,對本文的全卷積層神經網絡設置參數,其中,7個卷積層中的前5個卷積核的尺寸均為6,后2個卷積核的尺寸依次為3和2;7個卷積層中,卷積核的數量分別為20、40、80、40、20、10、1;6個池化層的池化窗口長度分別為4、4、4、5、4、2。建立好的模型中每層網絡的輸出數據如圖2所示,其中,輸入信號為2560×1的一維振動信號,第1個卷積層的輸出數據維度為2 560×20,第1個池化層輸出數據維度為640×20,以此類推,最終輸出1個單值數據——預測的剩余壽命,如圖5所示,可以看出有些相鄰時間點的剩余壽命預測結果相差很大,整體波動明顯,預測誤差較大,所以需要對整個預測結果進行降噪處理。

圖5 降噪處理前的預測結果Fig.5 Prediction results before noise reduction processing
本文采用加權平均降噪方法,時間窗長度為6,即將Pi-5~Pi的加權平均值作為ti時刻的預測值,預測值不足6個時,計算所有值的加權平均,其中,權重為差是1的等差數列,Pi-n,Pi-n+1,…,Pi對應的權重為1,2,…,n(n<6);當預測值達到6個時,則Pi-5,Pi-4,…,Pi對應的權重為1,2,…,6,利用式(4)迭代求得降噪后的預測值如圖6所示,可以看到噪聲明顯減小,降噪后的預測值曲線更加貼近實際剩余壽命線,并且原來偏離程度較大的預測點在降噪后,與實際值的偏離程度均有所減小。

圖6 全卷積層神經網絡剩余壽命預測結果Fig.6 Full convolutional neural networks prediction results
將本文預測結果與傳統的支持向量回歸(support vector regression ,SVR)[12]、傳統卷積神經網絡[13]的預測結果進行對比。SVR方法的性能退化指標為均方根和峭度,傳統卷積神經網絡(圖1)采用與全卷積層神經網絡相同的數據輸入格式,即2 560×1的一維振動信號,網絡每層的數據輸出格式如圖1所示,最終輸出壽命預測值(單值)。3種模型均采用相同的方法構建訓練集與測試集,將訓練集輸入各模型進行模型訓練,對訓練好的模型輸入測試數據,得到測試結果,采用相同的降噪方法處理以得到最后預測結果,同一軸承的3種模型的剩余壽命預測如圖6~圖8所示。

圖7 支持向量回歸的剩余壽命預測結果Fig.7 SVR remaining life prediction results

圖8 卷積神經網絡剩余壽命預測結果Fig.8 Convolutional neural network remaining life prediction results
由圖6~圖8可以看出,SVR方法與其他2種方法相比,在預測精度上有較大的差距,證明了深度學習方法的優越性,并且本文方法預測值更接近實際剩余壽命。計算3個模型預測結果的平均相對誤差與最大相對誤差并進行對比。預測結果是剩余壽命與總壽命的比值,所以計算預測結果相對于總壽命的平均相對誤差和最大相對誤差分別為
(5)
em=max{Pi-Yi}
(6)
3個測試樣本的誤差結果如表1所示。

表1 3種模型預測誤差Tab.1 Prediction errors of 3 models
從誤差統計可以看出,全卷積層神經網絡比SVR方法的預測平均相對誤差減小了64.88%,最大相對誤差減小了43.63%;比傳統卷積神經網絡的平均相對誤差降低39.54%,最大相對誤差減小了31.94%。
(1)與傳統的先人工構建性能退化指標、再預測的方法相比,將卷積神經網絡自學習特征用于軸承剩余壽命預測的方法,不僅減少了需要人工參與的環節,還大幅提高了預測精度。
(2)將傳統卷積神經網絡改進為全卷積層神經網絡,可提高小樣本情況下的軸承剩余壽命預測精度。
(3)引入加權平均方法對預測結果進行降噪,提高了預測精度。