高 謙 肖 維
(1.河海大學 南京 210000)(2.深圳大學 深圳 518000)
液壓缸的復雜工況導致其具有故障多發、壽命短暫的特點,工程作業中液壓缸的失效將導致工程事故或停產,進而造成一定的經濟損失[1]。因此,建立可靠的壽命預測系統對液壓缸的壽命進行精確預測以提前更換即將失效的液壓缸可有效地避免這些問題。由于系統需采集液壓缸整個生命周期的數據,且各監測點的采樣頻率較高,因此系統采集到的數據規模很大,致使液壓缸的壽命預測需要用大數據的方法解決[2]。
深度學習是大數據分析技術中的杰出代表,但是在液壓設備壽命預測領域中應用較少[3]。因此,本文提出了基于深度學習的液壓缸壽命預測方法。該方法相比傳統的機器學習方法,其優勢在于:通過建立深度學習模型,擺脫了對大規模數據處理技術和行業專家知識的依賴,直接從大量數據中自適應地進行特征提取與特征選擇,實現更具魯棒性與泛化能力的液壓缸壽命預測方法[4]。
深度學習區別于傳統的模式識別方法在于它能夠從大規模數據中自適地進行特征提取與特征選擇,而非采用人工方法[5]。特征提取與特征選擇都是通過改變數據分布的方法從原始特征中尋求最有效的特征,以提高模式識別系統的性能。而特征提取與特征選擇的區別在于:特征提取的方法通過改變屬性間的關系來改變數據分布,原有的特征空間發生了變化;特征選擇的方法則是從原始特征集中選擇出最有效的特征子集,原有的特征空間沒有發生變化[7]。
在液壓缸壽命預測領域,BP 神經網絡模型應用最為廣泛。其單隱層的淺層結構限制了分類器的特征提取與特征選擇的能力,而采用具有多隱層的深度結構會導致訓練出的分類器易陷入局部最優。深度學習將底層特征進行組合并構成更加抽象的高層表示,以挖掘出更加有效的特征表示,使得深層網絡的訓練問題有了很大的改善。深度學習用于液壓缸壽命預測的方法:先以非監督學習算法對網絡模型進行預訓練,以獲得更加有效的信號特征表示。然后利用監督學習算法對信號特征進行分類,使得網絡結構具有預測能力[8]。本文使用DAE 算法作為預訓練階段的非監督算法,并將Adaboost算法作為分類階段的監督算法。
DAE(Denoising autoencoder)算法模型又被稱為降噪自動編碼機,該模型通過在訓練數據中加入隨機噪聲來訓練神經網絡,神經網絡可以習得無噪聲的輸入特征以及噪聲的主要特征[9]。該方法能夠使神經網絡在測試數據中表現出更強的泛化性,使得神經網絡具有去噪以獲取無噪聲數據的能力。因此,本文選擇DAE 作為特征提取算法的目的在于提高模式識別系統對噪聲的魯棒性。
DAE 算法的結構如圖1 所示,其訓練過程:加噪網絡通過噪聲函數fθ向輸入樣本XR中加入隨機噪聲,獲得含噪樣本:

tf為加噪網絡的激活函數;θ為加噪網絡的參數集,且θ={W,b};R為樣本的特征維度。然后編碼網絡通過編碼函數hφ對含噪樣本進行編碼,獲得編碼樣本:

sh為編碼網絡的激活函數;φ為編碼網絡的參數集,且φ={V,d};R'為編碼樣本的維度,此過程中,樣本維度發生了改變。然后解碼網絡通過解碼函數對編碼樣本進行解碼重構,獲得解碼樣本:

為解碼網絡的激活函數,φ'為解碼網絡的參數集,且φ'={V',d'} ;經過解碼重構,解碼樣本的維度與輸入樣本XR的維度一致。最后,網絡將根據輸入樣本XR與解碼樣本X^R計算出重構誤差


圖1 DAE算法模型結構
Adaboost 算法的思想是合并多個弱分類器的輸出構成強分類器以獲得更加有效的分類,本文選擇BP 神經網絡模型作為弱分類器,經Adaboost 算法合并構成BP-Adaboost 強分類器作為深度網絡分類階段特征選擇的監督算法[10],其結構如圖2 所示。
該方法需按規則將訓練數據進行分組,并將各組數據輸入多個弱分類器進行迭代運算,對于分類失敗的樣本個體賦予較大的權值,下一次迭代運算時將著重關注。強分類器則采用加權多數表決的方法合并弱分類器,分類結果越好的弱分類器,其對應的權重越大[11]。該算法的訓練過程如下。
1)給出特征維度為R 的樣本空間(XR,Y),從中搜索出 2R-1 個可能的非空特征子集{Xt} =(X1,t,X2,t,…,Xs,t),并將 (Xt,Y)作為各弱分類器的訓練數據集,其滿足:

t為各訓練數據集和對應弱分類器的序列,且t=1,2,…,2R-1;s 為樣本空間中的樣本個數,均布各訓練數據集的初始權值:

然后根據特征子集的維度確定各BP神經網絡模型的結構以及迭代次數N。
2)使用權值為Dn,t的訓練數據集進行學習,得到弱分類器Gn(X),n為迭代序列,且n=1,2,…,N。
3)計算Gn(X)的在訓練數據集上的分類誤差:

4)計算Gn(X )在強分類器中的權值:

5)計算下一輪迭代運算的權值:

Bn為權值系數,可使權值的比例與總和保持不變;Xi,t∈{Xt} ,且i=1,2,…,s。
6)將弱分類器函數進行加權合并獲得強分類器函數:

有效的特征數據所訓練出的弱分類器分類效果較好,在強分類器加權合并時將獲得較大的權值,以此達到特征選擇的目的[12]。而攜帶噪聲的樣本在弱分類器迭代運算時將會表現出較差的分類效果,并會被賦予較大的權值,進而對分類器的性能產生不良影響[13]。因此,利用DAE 算法對數據進行去噪聲預處理,可有效解決這一問題。

圖2 強分類器結構
提出方法將多個DAE 模型逐層堆疊作為深度網絡預訓練階段的無監督算法[14],并將訓練結果輸入BP-Adaboost 強分類器,作為分類階段的監督訓練數據,深度網絡的結構如圖3所示。
本文以液壓缸的壽命預測方法為研究對象,所以應采集液壓缸整個生命周期的數據用來訓練深度網絡[14]。通過對液壓缸壽命影響因素及表現形式進行分析,提出將安裝在液壓缸上的傳感器所監測到的數據作為深度網絡的輸入變量,其形式可以表示為X={x1,x2,x3,x4,x5} 各元素含義如表 1 所示;將液壓缸的生命周期按時間降序分級作為深度網絡的輸出變量,表示為Y={y1,y2,y3,y4,y5,y6} ,各元素含義如表2所示。

圖3 深度網絡的結構

表1 深度網絡輸入變量

表2 深度網絡輸出變量
本次實驗從客戶端的液壓缸采集了2000 組均布在整個生命周期內的數據,隨機選取其中的1600 組對深度網絡進行訓練,利用剩余數據對學習器進行測試。
為了驗證提出方法的特征提取性能,利用主成分分析法提取數據特征的前三個主成分[14],分析結果如圖4 所示。圖4(a)為提出方法特征提取的主成分散點圖,可以看出液壓缸的同一壽命等級散點很好地聚集在一起,不同的壽命等級散點被有效的分離,可知提出方法的特征提取效果顯著。圖4(b)為多隱層BP 神經網絡模型特征提取的主成分散點圖,可觀察到,部分同一壽命等級的散點聚集較好,但是與不同壽命等級散點之間存在交叉,因此多隱層BP 神經網絡的特征提取性能存在不足。圖4(c)為單隱層BP神經網絡模型特征提取的主成分散點圖,可以看出不同壽命等級的散點相互交叉,分布的規律性較差,因而單隱層BP神經網絡模型特征提取性能最差。
上述分析表明,DAE算法可根據傳感器信號自適應地提取有效的特征,而BP 神經網絡由于其結構的限制,特征提取性能較差[15]。

圖4 主成分分析散點圖
為了驗證提出方法的特征選擇性能,在Matlab環境下對BP-Adaboost 強分類器與BP 弱分類器進行仿真實驗,并對比兩者的測試結果,測試結果如圖5 所示。橫坐標為測試樣本的編號;縱坐標為分類器預測誤差的絕對值,分類器的預測值為液壓缸的壽命值,范圍為[0 , 100 ];星形標識代表強分類器的預測結果;圓形標識表示弱分類器的預測結果。從圖中可以看出,對于絕大部分的測試樣本,強分類器的預測誤差遠小于弱分類器的預測誤差。且強分類器的預測誤差值大都小于5,可得強分類器的預測精度可到達95%,該精度可滿足實際工程應用的要求。因此,提出方法的特征選擇性能可靠。

圖5 分類器測試結果
論文簡述了深度學習理論的特點,指出傳統機器學習在液壓缸壽命預測方面的不足。并提出基于特征提取與特征選擇的深度學習方法,該方法改善了傳統機器學習算法在處理深層網絡時的不足,可以更準確地對液壓缸的壽命狀況進行預測。