向宙,張西寧,張雯雯,余迪
(西安交通大學機械制造系統工程國家重點實驗室,710049,西安)
故障診斷是機械設備全生命周期中重要的一環,在高速列車、風力發電機組、工程機械等設備中至關重要。然而,這些設備往往裝備量大、數據測點多且頻率高、運行工況復雜多變,推動機械故障診斷進入了大數據時代,帶來了數據總量大、形式多、價值密度低等新的挑戰[1-2]。傳統機械智能故障診斷通常采取“人工特征提取+模式識別”的模式,需要診斷專家對特定部件在特定工況下進行分析后,人工設計特征對采集到的信號進行表征,然后再將特征輸入到分類模型中進行識別[2],這顯然不能滿足機電大數據時代的需求,因而急需對相關理論進行研究,實現數據驅動的特征自動提取。
深度學習模型依靠多個隱含層可以很好地實現高變函數等復雜高維映射的表示,在特征自動提取上具有很多其他網絡學習算法不可比擬的優勢[3-5]。由多個自編碼網絡堆疊而成的堆疊自編碼網絡(SAE)是深度學習中最重要的模型之一,在機械故障診斷中取得了眾多進展。雷亞國等人利用SAE在頻域上自動提取旋轉機械的特征,在滾動軸承和齒輪箱的故障診斷上取得了比淺層網絡更好的效果[6];張紹輝將稀疏SAE與平方預測誤差結合,用于軸承狀態監測,實現了軸承故障時間、位置的有效監測[7];王麗華等利用降噪SAE從異步電機電流信號和振動頻域信號中提取特征,實現了對異步電機99.86%的診斷正確率[4];此外,SAE在變壓器[8]、核電設備[9]、風力發電機組設備[10]等復雜機電系統的故障診斷領域均有應用,并取得了良好的效果。
當前對SAE的研究已經從引進應用轉入到優化改進階段。例如:邵海東等對SAE的損失函數進行了改進,并用人工魚群算法對網絡超參數進行了優化,在齒輪箱以及列車滾動軸承的故障中取得了比標準SAE更好的診斷效果[11];崔江等用經過灰色關聯度優化后的SAE提取特征,支持向量機分類,實現了航空發電機旋轉整流器二極管的故障診斷[12];張西寧等從神經元激活值分布的角度,分析了SAE在參數較多時性能退化的原因,提出了一種標準化策略,有效地改善了神經元激活值分布于激活函數飽和區的問題[13];此外為了更好地從時域振動信號中提取特征,文獻[14-15]分別從給SAE添加約束和利用卷積操作兩個不同方面進行了改進,均在滾動軸承故障診斷上取得了較好的識別效果。
本文在分析了標準SAE在特征提取過程中可能導致分類信息模糊的問題后,提出了一種區分自編碼網絡,在自編碼網絡的隱層加上全連接層和Softmax分類器,直接將標簽信息融入到SAE每層的特征提取中。運用改進前后的SAE進行滾動軸承故障特征自動提取,分別在實驗室定轉速和變轉速多載荷數據集上進行了測試,并與經典人工設計的42個特征進行了對比。
自編碼網絡(AE)是一種典型的單隱層神經網絡,由編碼和解碼兩部分組成。編碼通過下式以全連接和激活函數的方式將輸入映射到隱層
Hs=f(WaXs+ba)
(1)
式中:Xs=(x1,x2,…,xD)、Hs=(h1,h2,…,hd)分別為輸入、輸出層神經元的激活值。解碼通過下式以同樣的方式將隱層映射回輸入
Zs=f(WsHs+bs)
(2)
式中:Zs=(z1,z2,…,zD)為隱藏層神經元的激活值。標準AE通常以最小化重構誤差為目標,通過梯度反向傳播的相關算法進行訓練[16]
(3)
式中:θ={Wa∈RD×d,Ws∈Rd×D,ba∈Rd,bs∈RD}為需要優化求解的權值和偏置;m為樣本個數。本文選擇的激活函數ELU(exponential linear unit)表達式如下
(4)
ELU函數在正值區間減輕了梯度彌散問題,在負值區間具有軟飽和特性,提升了網絡對噪聲的魯棒性。標準自編碼網絡結構見圖1。

圖1 標準自編碼網絡結構
自編碼網絡的本質是對輸入的一種無損編碼,其單純以重構誤差最小的目標函數可能會導致分類信息在特征提取過程中變得模糊,因為分類信息可能只在高維空間中的部分維度存在。例如,在滾動軸承這類旋轉機械的振動信號中,轉頻、齒輪嚙合頻率、共振等廣泛存在并占主導,如果單純以重構誤差最小進行特征提取,很可能會將不占主導的故障信息忽略。

(a)編碼前

(b)標準AE編碼

(c)d-AE編碼圖2 編碼前后模型數據集特征的對比
為了說明這個問題,構造模擬數據集:數據集由100個樣本(50個正類,50個負類)組成,每個樣本具有10維特征;所有樣本的前9維特征在0~4之間均勻分布,標準差為0.5;第10維特征,正、負類分別在常數1、3上下以0.5為標準差分布。由圖2a可以看到,第10維特征對樣本具有良好的可分性;但是用標準AE對圖2a降維到2維后,結果如圖2b所示,已經很難發現其分類信息了。

圖3 區分自編碼網絡結構
為了解決標準AE單純最小化重構誤差而導致的分類信息模糊問題,本文提出了如圖3所示的區分自編碼網絡(d-AE)。在標準AE的隱層連接一個全連接層,加上分類器Softmax,將分類器的輸出與標簽信息的交叉熵加入到原來的損失函數上,以該復合損失函數最小為目標對網絡進行訓練。
d-AE從輸入X到重構Z的過程與標準AE一致,可用式(1)(2)進行計算。從隱層Hs到分類器Softmax的輸出Y可計算如下
Os=f(WoHs+bo)
(5)
(6)
式中:Hs=(h1,h2,…,hd)、Os=(o1,o2,…,ot)分別為全連接層輸入、輸出(同時也是分類器Softmax的輸入)神經元的激活值;Wo∈Rd×t,bo∈Rt為全連接層的權值和偏置;yi為分類器Softmax的輸出;t為分類類別數。
d-AE在標準AE損失函數式(3)的基礎上加入了與分類相關的信息,構成如下復合損失函數
(7)
式中:μ為平衡重構誤差與交叉熵之間的常數。不難看出,式(7)第2項衡量的是分類器的輸出與one-hot標簽之間分布的差異性,因而d-AE能夠在減小重構誤差與保持分類信息之間取得平衡。
由式(1)(2)(5)可知,d-AE的映射過程只有簡單的矩陣乘法和加法,由式(6)(7)可知,分類器Softmax和復合損失函數可導,因而d-AE可采用梯度反向傳播的相關算法進行求解。求得梯度后,本文利用了自適應動量項(Adam)算法更新需要訓練的參數[17]。為了減少網絡訓練過程中數據的過擬合現象,本文在d-AE的訓練過程中還使用了Dropout訓練技巧[18],在網絡訓練時將不用比例的網絡輸出置零。
利用提出的d-AE將圖2a的模擬數據編碼到二維,如圖2c所示,可以看到,編碼后的特征依然具有較好的分類信息。
如圖4所示,將d-AE堆疊,即將上一層d-AE的隱層作為下一層d-AE的輸入,即構成堆疊區分自編碼網絡(Sd-AE)。Sd-AE是一種逐層的特征提取方法,在各層d-AE訓練中需要用到樣本標簽,因而是一種有監督的逐層學習方式。每一層Sd-AE都是淺層神經網絡,可充分發揮淺層神經網絡凸優化的優勢,降低網絡陷入局部最優的風險。本質上,這種逐層編碼就是將抽象特征進行逐步提取的過程(提取過程中會兼顧主要信息與分類信息),隨著層級的增加,這種特征提取能力就愈加抽象,具有全局整體特性。

圖4 堆疊區分自編碼網絡結構
為了驗證提出的Sd-AE在特征自動提取上的能力,本文在實驗室軸承實驗臺上,采集了復雜程度不同的兩套數據集(定轉速數據集和變轉速多載荷數據集)進行測試。

圖5 軸承實驗臺原理圖
如圖5所示,軸承實驗臺主要由可調電源、直流電機、主軸、支架、軸向預緊裝置、徑向加載裝置、加速度和電渦流傳感器以及配套數采裝置等組成。加速度傳感器為壓電電荷型,靈敏度為8.8 pC/(m·s-2),頻率測量范圍為0.27~10 kHz;電渦流傳感器靈敏度為8×10-3V/μm。測試時,加速度傳感器測量軸承安裝座上的振動,電渦流傳感器測量主軸鍵向信號,然后信號被傳送到數采卡UA300,進行采集后存儲到計算機上。實驗臺直流電源可手動調節,因而直流電機轉速可變;徑向加載主要由重物提供,實驗中加載物分別為7.7、25.5、48.1 kg,為變轉速多載荷數據集的采集提供了條件。
定轉速數據集中被測對象為5種狀態的6308深溝球軸承,分別為正常、外圈剝落、內圈剝落、滾動體剝落和保持架故障。實驗時,保持軸承內圈轉速為1 200 r/min,采樣頻率為10 kHz,每個樣本采樣長度為2 400個點,每種狀態采集400個樣本,共計2 000個。每種狀態軸承隨機選擇200個作為訓練樣本,另外200個作為測試樣本。因而,訓練集有1 000(200×5)個樣本,測試集也有1 000(200×5)個樣本。
在頻域內進行自動特征提取,對各樣本做快速傅里葉變換后忽略相位,直接將頻譜分別輸入SAE和Sd-AE。特征自動提取各操作步驟及其需要的訓練參數如表1所示,最終提取得到100個特征。

表1 網絡結構及訓練超參數
圖6a、6b為訓練集各樣本通過標準SAE和Sd-AE提取得到的特征,可以看到,Sd-AE提取的特征在不同狀態軸承之間的區分度要明顯大于標準SAE提取的特征。
作為對比,本文從時域、頻域、時頻域提取了表2所示的42個人工提取的經典特征[19]。通過t分布隨機鄰域嵌入技術(t-SNE)對標準SAE、Sd-AE以及人工提取的特征降為二維并進行可視化,結果如圖7所示[20]。從圖中可以看出,標準SAE提取的特征不能將樣本很好地分開,保持架故障樣本與滾動體故障樣本有明顯重合;Sd-AE提取的特征效果和人工提取的特征效果相當,均能有效地對不同狀態的樣本進行區分。為了定量對比3種方法提取特征的效果,計算類內距、類間距如下
(8)

表2 42個人工提取的經典特征

(a)標準SAE

(b)Sd-AE圖6 不同方法提取的特征
(9)
式中:Ci為第i類樣本的協方差矩陣;tr表示取矩陣的跡;P(wi)為i類樣本占總樣本的比例;Mi和M0分別為第i類樣本和總體樣本的均值矩陣。

(a)標準SAE

(b)Sd-AE

(c)人工提取圖7 不同方法提取特征的可視化比較
利用式(8)(9)計算降維后特征的類內距和類間距,結果如表3所示。從中可以看出,Sd-AE提取特征的類內距比標準SAE提取得小,比人工提取得大;Sd-AE和人工提取的特征的類間距效果相當,均高于標準SAE提取的特征。

表3 不同方法提取特征的類內距和類間距
注:本文方法類內距比標準SAE小8.26%,類間距比標準SAE大23.02%。
進一步說明Sd-AE自動提取的特征能夠適用于滾動軸承故障診斷。用支持向量機(SVM)、隨機森林(RF)、BP神經網絡這3種常用分類器,分別對以上3種方法提取的特征做故障分類。如前所述,訓練集和測試集各1 000個樣本,訓練集樣本用來訓練提取特征的網絡并得到訓練集特征,測試集特征利用訓練好的網絡得到。對于人工提取的特征,訓練集和測試集特征均按照相同的規則進行提取并歸一化。3種方法提取特征的故障分類正確率如表4所示,可以看出,Sd-AE提取特征的診斷正確率和人工提取特征相當,均接近100%,高于標準SAE提取特征的診斷正確率。

表4 不同方法提取特征的診斷正確率
特征可視化、定量計算以及利用這些特征進行故障診斷的結果均說明,提出的Sd-AE在滾動軸承故障特征自動提取上比標準SAE具有更好的效果,達到了人工設計特征的水平。
為了進一步驗證本文Sd-AE的性能,在圖5所示軸承實驗臺上,采集了更為復雜的變轉速多載荷數據進行了測試。測試共用到了外圈剝落、內圈剝落、滾動體剝落、正常4類狀態的軸承,每類軸承分為輕微、中等、嚴重、極嚴重4個不同程度,每類程度有4個軸承,因而數據集共有64(4×4×4)個軸承。不同程度的各類軸承故障如圖8所示。這些軸承的編號由一位字母和兩位數字組成,其中字母表示軸承狀態(O為外圈剝落,I為內圈剝落,B為滾動體剝落,N為正常),第1位數字表示故障嚴重程度(1為輕微,2為中等,3為嚴重,4為極嚴重),第2位數字為同故障類型同故障程度軸承的編號。
如圖9所示,每類故障程度均選取3個訓練軸承,1個測試軸承。訓練軸承和測試軸承均在圖5所示的3種不同的徑向載荷下采集40個樣本,得到訓練集和測試集如表5所示。
在樣本的采集過程中,需要手工調節直流電源旋鈕使軸承轉速大幅度波動。例如,軸承O11和I11在載荷為7.7 kg時的轉速波動如圖10所示。
由于在變速情形下軸承會有振動波動大、沖擊間隔不均勻、樣本相位不一致以及噪聲干擾等問題,本文選擇將經過Teager能量算子解調并重采樣后的階次譜,輸入到標準SAE和Sd-AE中進行自動特征提取。提取特征的網絡結構與定轉速數據集一致,如表1所示。將2種網絡各層提取的特征通過t-SNE降為二維后進行可視化,如圖11所示。從結果可以看出,隨著網絡的加深,同類樣本逐漸聚集,說明網絡的每一層都有特征提取能力,隨著網絡的加深,特征提取效果逐漸變好。對比標準SAE和Sd-AE提取的特征可以清晰看到,Sd-AE提取特征的區分度好于標準SAE提取的特征。同樣,按照式(8)(9)定量計算降維后特征的類內距和類間距,結果如表6所示。從結果可以看出,Sd-AE提取特征的類內距比標準SAE提取得小,類間距比標準SAE提取得大。單獨對比Sd-AE各層提取特征的類內距和類間距可以發現,隨著網絡的加深,類內距逐漸減小而類間距逐漸增大,再一次說明了隨著網絡的加深,Sd-AE提取效果逐漸變好的特性。

圖8 不同程度的各類軸承故障情況及正常軸承編號

數據集軸承軸承數量載荷/kg故障類型故障程度樣本數量訓練集訓練軸承487.7, 25.5, 48.1O, I, B, N1, 2, 3, 45 760測試集測試軸承167.7, 25.5, 48.1O, I, B, N1, 2, 3, 41 920

(b)軸承I11,載荷7.7 kg圖10 部分軸承信號采集過程中的速度波動
對表2所示的42個經典特征,用3種常用分類器對3種方法提取的特征進行分類,分類正確率如表7所示。從中可以看到,Sd-AE提取的特征具有最高的訓練集正確率和測試集正確率,人工設計的特征診斷正確率最低。這說明提出的Sd-AE在變轉速多載荷這樣的復雜工況下也能有效地自動提取特征,而人工設計的特征不能有效地對軸承狀態進行表征。

(a)標準SAE第1層 (b)標準SAE第2層 (c)標準SAE第3層 (d)標準SAE第4層 (600個樣本) (400個樣本) (200個樣本) (100個樣本)

(e)Sd-AE第1層 (f)Sd-AE第2層 (g)Sd-AE第3層 (h)Sd-AE第4層(600個樣本) (400個樣本) (200個樣本) (100個樣本)圖11 不同樣本數下標準SAE和Sd-AE各層提取特征可視化對比

方法類內距第1層第2層第3層第4層類間距第1層第2層第3層第4層標準SAE71.7657.6357.9854.8841.6944.3839.7440.30Sd-AE(本文方法)69.9654.2150.5248.1243.1154.1458.1959.27

表7 不同方法提取特征的分類正確率情況

圖12 Sd-AE提取特征分類混淆矩陣
將Sd-AE提取的特征進行故障診斷的結果表示成混淆矩陣如圖12所示,可以看到,16個測試軸承都大概率地被分到了正確的類別,分類正確率最低的軸承B34也達到了64%,說明本文提出的Sd-AE在變轉速多載荷滾動軸承的故障診斷上基本滿足工程需求。
為了解決標準SAE在特征自動提取過程中導致的分類信息模糊問題,本文在各層特征提取過程中融入先驗的標簽信息,提出了一種有監督的網絡Sd-AE。運用Sd-AE和標準SAE分別進行滾動軸承故障特征自動提取,在實驗室定轉速和變轉速多載荷數據集上進行了測試,得出如下結論。
(1)在定轉速數據集上,Sd-AE提取的特征對比標準SAE提取的特征,類內距減小了8.26%,類間距增加23.02%;利用提取的特征進行故障診斷,Sd-AE診斷正確率(99.10%~100%)遠高于標準SAE診斷正確率(73.72%~83.62%),和人工設計特征的診斷正確率(100%)相當。這說明,在標準SAE的編碼解碼過程中添加先驗的標簽信息,有助于網絡提取更加有表征能力的特征,在定轉速數據集上達到了和人工設計特征相當的水平。
(2)在變轉速多載荷數據上,定量計算的類內距和類間距結果再一次說明了Sd-AE提取的特征優于標準SAE提取的特征。單獨分析Sd-AE各層特征的類內距和類間距發現,隨著網絡的加深,類內距逐漸減小而類間距逐漸增大,說明隨著網絡的加深,Sd-AE的特征提取效果逐漸變好。故障診斷的結果顯示,Sd-AE診斷正確率(82.03%~82.88%)遠高于標準SAE診斷正確率(72.26%~74.84%)和人工設計特征的診斷正確率(67.81%~71.15%)。這說明,Sd-AE具有良好的不隨工況變化的特征自動提取能力,而人工設計的特征具有很強的工況依賴性。
(3)由Sd-AE進行故障診斷的混淆矩陣發現,16個測試軸承都大概率被分到了正確的類別,分類正確率最低的軸承B34也達到了64%。這說明,本文提出的Sd-AE在變轉速多載荷滾動軸承的故障診斷上基本滿足工程需求。
本文提出的Sd-AE可取代有標簽情形下的標準SAE,應用在機械故障診斷的特征自動提取階段。