張智禹, 尹愛軍, 譚 建
(1. 重慶大學 機械工程學院 機械傳動國家重點實驗室,重慶 400044;2. 中國石油西南油氣田分公司重慶氣礦,重慶 400021)
齒輪箱作為機械傳動系統中關鍵組件,由于其結構復雜、工況環境多變等因素導致其經常出現故障,因此齒輪箱故障診斷方法研究引起廣泛關注[1]。而在變工況條件下,同類故障間的振動幅值、能量存在較大差異使得齒輪箱故障診斷更加困難,經常出現誤診和漏診問題[2]。因此,提出一種針對變工況下齒輪箱故障診斷方法十分必要。
近年來,基于深度學習的故障診斷算法快速發展, Liu等[3]直接使用長短期記憶神經網絡對時域信號進行特征提取,用于診斷旋轉機械故障。張小強等[4]利用時域與頻域特征結合進行行星齒輪磨損和斷齒的檢測。Chen等[5]提出結合時頻域信號處理方法離散小波變換與卷積神經網絡用于行星齒輪箱故障診斷。然而時域、頻域特征由于對非平穩信號不敏感[6]、特征性能不穩定[7]等原因單獨作為齒輪箱故障診斷特征參數不適用,時頻域特征受Heisenberg測不準原理對非平穩信號分析存在局限[8]。因此,為了獲得齒輪箱全面的、多維度的信息,本文提取振動信號的時域、頻域、小波包時頻域特征形成高維特征集。
在獲得全面的特征集合后,如何挖掘內在信息從而精確識別變工況條件下齒輪箱故障是至關重要。部分學者通過增加深度學習模型層數,通過大規模參數訓練來學習齒輪箱故障特征[9-10],由此帶來網絡模型訓練時間長、收斂困難等問題[11]。針對這些問題,本文利用深度置信網絡(deep belief networks, DBN)具有的貪心學習優勢,分別對三個維度特征進行深度挖掘;同時為解決多個網絡輸出間串行連接無權重分配機制問題[12],結合注意力機制,對變工況齒輪箱狀態特征自適應 “注意”。最后改進DBN中Softmax損失函數為余弦損失函數,將損失從歐幾里德空間映射到角空間從而降低對變工況引起的信號強度的敏感性。
本文提出了融合注意力機制的改進DBN變工況齒輪箱故障診斷方法,為解決單一故障特征診斷準確性低的問題,提出融合時域、頻域、小波包時頻域特征作為故障診斷參數。使用余弦損失函數改進后的DBN網絡結合注意力機制解決變工況敏感性問題及網絡輸出動態加權問題。試驗表明,該方法在變工況齒輪箱故障診斷中具有較好的效果。
DBN是由多個受限玻爾茲曼機(restricted Boltzmann machines, RBM)棧式疊加而成[13]。其中RBM可視為一個無向圖模型,是一種基于能量函數的概率建模方法。如圖1所示,RBM包含一個可見層v=(v1,v2,…,vn)與一個隱藏層h=(h1,h2,…,hm),層間通過權重矩陣Wn×m實現雙向全連接,層內單元無連接。

圖1 RBM結構
對于一組給定的狀態(v,h),其能量函數定義為
(1)
式中:wij為可見單元vi與隱藏單元hj間的連接權重;bi為可見層中第i個神經元的偏置;cj為隱藏層中第j個神經元的偏置。
基于能量函數得到任一組(v,h)的聯合概率分布為
(2)
當給定各可見層單元狀態v,可得隱藏層單元的激活概率為
(3)
相應的給定隱藏單元狀態h,可得可見層單元激活概率為
(4)
式中,S函數為Sigmoid函數,定義為
S(x)=1/(1+e-x)
(5)
為訓練RBM,通過最大化訓練集上的對數似然來調整參數,對于連接權重wij,其偏導為

(6)
式中, 〈vihj〉d,〈vihj〉m分別為數據分布與模型分布的期望。由于〈vihj〉m計算復雜度高,因此采用對比散度(contrastive divergence, CD)方法[14]進行梯度估計。因此權重參數wij可以通過式(7)進行更新。
Vwij=η(〈vihj〉d-〈vihj〉r)
(7)
式中: 〈vihj〉r為可見層重構的分布期望;η為學習率; 相應的bi,cj偏置參數可通過相同方法進行更新。
利用RBM結構擁有的無監督貪婪學習優勢及數據特征凸顯能力分別對時域、頻域、小波包特征進行挖掘,學習其中對齒輪箱故障有效的深度特征。
在1.1節獲得多個維度的深度特征后,需要結合這些特征以獲得更全面的故障信息,目前部分學者在結合多網絡輸出、多域特征時常采用串行連接方式,如圖2所示,此方式明顯忽略了不同特征對故障診斷結果貢獻度大小不同的因素。

圖2 傳統結合多網絡輸出方式
因此本文引入注意力機制[15],他是模仿人類在觀察不同事物時,自動將注意力轉移到自己感興趣部分,而減弱對無關信息的關注,從而提升信息的獲取能力,本文提出的融合注意力機制的DBN模型,如圖3所示。

圖3 注意力DBN模型
利用注意力機制將1.1節通過RBM后獲取的時域、頻域、小波包深度特征結合形成齒輪箱故障診斷的全局特征計算為
ui=tanh(Wwhi+bw)
(8)
(9)
(10)
式中:hi分別為時域、頻域、小波域深度特征;ai為與之相對應的重要性權值;c為通過注意力機制獲得的全局特征。
余弦損失函數為在Softmax損失函數基礎上,保留其擴大類間差異的優勢[16],但減小其對不同信號強度的敏感性,而更加注重向量在方向上的差異,如圖4所示。

圖4 余弦損失示意圖
對于相同故障信號q1,q2,其對于故障標簽為p1,在以Softmax作為損失函數時,得到最終損失函數Ls如式(11)所示。
(11)
式中:B,N分別為一批次訓練樣本數與故障類別數;x為隱藏層輸出;W為權重矩陣;θ為其間夾角。由式(11)及圖3可知, Softmax損失與信號幅值相關。而以1-余弦相似度作為損失函數,得到最終損失函數Lc如式(12)所示。
(12)
由式(12)看出,式中‖x‖2可消去,因此余弦損失與信號幅值無關。因此將余弦損失作為齒輪箱故障診斷損失函數,可將損失從歐幾里德空間轉換為角空間從而消除信號幅值影響,降低網絡的擬合負擔。
設在齒輪箱上采集到的振動信號為s(t),對s(t)提取時域、頻域、小波包特征構成特征集后分別輸入至改進后DBN中,利用注意力機制結合各維度深度特征后映射至不同故障類型。完成模型訓練后,輸入實時采集到的振動信號診斷齒輪箱故障。具體流程如圖5所示。

圖5 融合注意力機制的改進DBN變工況齒輪箱故障診斷流程
由圖5可知,具體步驟為:
步驟1輸入采集的齒輪箱振動信號s(t),提取其峭度、偏度、有效值等11個時域特征,提取其均值頻率、一階重心等13個頻域特征;利用小波包變換提取其能量特征,本文采用db5小波進行3層分解;
步驟2利用DBN的貪婪學習方法分別對三個維度特征進行深度挖掘,形成P1,P2,P3三個深度特征集合;
步驟3利用注意力機制對P1,P2,P3進行自適應動態加權形成最終特征集合P,并輸入全連接層,完成齒輪箱故障識別;
步驟4利用改進后損失函數對模型進行訓練,完成在訓練集上齒輪箱故障精確識別;
步驟5對運行中的齒輪箱持續提取振動信號s(t),按照步驟1~步驟3對其進行處理,從而識別當前齒輪箱運行狀態,最后輸出齒輪箱故障識別結果。
為驗證所提方法的有效性,本文采用變工況下齒輪箱多類故障診斷試驗進行驗證。試驗臺如圖6所示,電機通過聯軸器驅動齒輪箱軸1,軸間通過斜齒輪(模數= 2.25,壓力角= 20°,螺旋角= 20°,Z1=30,Z2=Z3=45,Z4=80)傳動,輸出軸3通過皮帶連接電磁扭矩負載。在箱體上安裝加速度傳感器采集齒輪箱振動信號,最終通過NI DAQ 6062E采集卡采集數據,采樣頻率為50 kHz,采樣時長為10 s。

圖6 變工況齒輪箱故障識別裝置
分別在轉速為480 r/min,720 r/min,900 r/min、負載為0,10 V,30 V下,分別測試Z3點蝕、Z4齒根裂紋、軸承B1內圈、外圈、滾動體故障等10類故障及一種正常狀態,各故障實拍圖如圖7所示。

圖7 齒輪箱各故障圖
重復5次試驗完成齒輪箱振動數據采集,因此共得到9種工況下11類齒輪箱狀態。為便于分析,對每一類故障/正常振動信號各取50組作為測試樣本,100組作為訓練樣本對所提注意力DBN模型進行訓練。訓練完成后,輸入測試數據得到,該方法綜合故障診斷率達到99.09%,各分類故障診斷結果如圖8所示。

圖8 注意力DBN的各類故障診斷結果
為進一步驗證所提方法的有效性及泛化能力,將機器學習中經典故障診斷模型SVM、通用深度學習算法BP神經網絡及DBN模型應用相同的數據,分別得到其在訓練及測試階段的齒輪箱故障診斷精度與本文提出的方法診斷精度對比,如表1所示。

表1 與其他經典故障診斷算法的對比結果
由表1可知,本文中提出的融合注意力機制的改進DBN變工況齒輪箱故障診斷方法具有最高的診斷精度。同時根據訓練精度與測試精度的差值列看出,本文方法(0.18%)相比DBN(1.38%),SVM(1.67%),BP(2.01%)擁有更強的泛化能力。
分別畫出本文提出的方法與DBN方法訓練時診斷精度隨迭代次數變化曲線,如圖9所示。

圖9 本文提出的方法與DBN方法訓練時故障診斷率曲線
由圖9可知,本文提出的方法相比DBN更快收斂于較高的診斷精度,因此可減少訓練時間。從試驗結果可以得知,本文方法在相對提高模型收斂速度與泛化能力的基礎上,對變工況齒輪箱故障擁有更高的診斷精度。
為驗證所提余弦損失函數關于降低模型對振動信號幅值變化敏感性的效果,同時為與現有研究成果進行對比。本文利用西儲大學軸承故障試驗數據再次進行驗證。試驗描述可參見Lu等的研究,本文以2 048個點長度截取故障信號,采用負載工況為2 238 W時樣本作為訓練集,負載工況分別為0,746 W,1 492 W時樣本作為測試集,測試在變負載工況下包含不同缺陷大小的各故障模型識別精度。得到各類故障識別精度如圖10所示,其中1~4分別代表正常運行、內圈故障、外圈故障、滾動體故障四種運行模式。

圖10 不同負載下軸承各類故障識別精度
由圖10可知,本文所提方法對于訓練時未出現過的負載工況也有著很高的故障識別精度。為可視化故障特征學習過程,引入t-SNE對所提模型的軸承故障特征輸入層、注意力動態加權輸出層、全連接層特征進行三維可視化,結果如圖11所示。
由圖11可知,隨著故障特征經過注意力動態加權輸出層、全連接層,不同類別故障間分布邊界逐漸清晰,可分性逐漸增加。在全連接層幾乎全部可分,實現故障的準確識別。

圖11 各層特征的t-SNE可視化
與已發表的現有研究成果進行對比,對不同工況下(0~1 492 W)相同故障模式識別結果求和取平均后作為該類故障模式的總體識別精度。表2給出了各類故障識別方法對不同故障模式詳細的識別結果。

表2 現有方法與本文所提方法的故障識別精度對比
由表2可知,本文所提方法相比深度自編碼器方法、卷積神經網絡方法等具有更高的故障識別精度,證實了所提方法的有效性。
針對在變工況運行條件下,齒輪箱故障難以識別且精度降低的問題,本文提出融合注意力機制的改進DBN變工況齒輪箱故障診斷方法。通過試驗驗證及與其他常用故障診斷方法對比,結果表明:
(1) 該方法在利用時域、頻域、小波包等多維度特征的基礎上,利用注意力機制融合深度特征,有效提高了變工況環境下齒輪箱故障診斷的精確度。
(2) 通過改進DBN模型損失函數,降低了模型對故障信號幅值的敏感性,因此減輕了網絡擬合負擔、提高了泛化能力。
在未來工作中,將對于實際生產中數據缺乏標簽問題,利用DBN模型的無監督學習能力,搭建半監督故障診斷模型,減少對標簽數據的依賴。