李曉花 江星星
1(商丘職業技術學院 河南 商丘 476000)2(蘇州大學城市軌道交通學院 江蘇 蘇州 215137)
隨著科學技術的迅速發展,現代旋轉機械呈現出高速、大規模化、集成化的特點,并在不同行業中起著越來越重要的作用[1]。滾動軸承不僅是旋轉機械中最重要的部件,也是一種易受損部件,因此,能夠自動、及時地識別軸承運行狀態對于減少意外停機和經濟損失變得越來越重要[2]。
智能診斷是近年來機械故障檢測技術的新的發展趨勢,它能夠有效地分析收集到海量數據,并自動提供可靠的診斷結果[3-4]。在各種智能診斷方法中,人工神經網絡(Artificial Neural Network,ANN)和支持向量機(Support Vector Machine,SVM)是近幾十年來應用最廣泛的兩種方法[5-6],但它們的診斷性能在很大程度上依賴于特征提取和選擇,如何針對不同的診斷任務從原始特征集中選擇最敏感的特征向量是限制上述方法的關鍵問題。因此,亟需發展一種深度架構,能夠實現對原始振動數據的無監督特征學習。
DAE是一種無監督的特征學習模型,由于其兼容性較強得到了廣泛的關注。然而,將標準DAE直接應用于軸承智能故障診斷還是存在著一定的難度。因為在實際工程中,從軸承收集到的振動信號往往十分復雜,噪聲較大且不穩定,而標準DAE的激活函數Sigmoid函數很難建立軸承各種狀態與振動信號之間的映射關系[7]。小波函數能夠通過改變尺度因子和位移因子,具有良好的時頻局部化特性和聚焦特征,并且成功地作為新激活函數構建了所謂小波神經網絡[8]。本文提出一種基于深度小波去噪自動編碼器和極限學習機的新型方法,用于滾動承軸的智能故障診斷。實驗結果表明,該方法克服了對手動特征提取的依賴性問題,且比傳統方法和標準深度學習方法更為有效。
去噪自動編碼器作為一種無監督神經網絡[9],能夠使得輸入數據和輸出結果之間的重構誤差最小化。標準去噪自動編碼器的結構如圖1所示,包括輸入層、隱含層和輸出層。

圖1 標準去噪自動編碼器結構圖
該編碼器的激活函數為Sigmoid函數。對于訓練樣本x=[x1,x2,…,xm]T,首先通過Sigmoid激活函數將輸入數據轉換為一個隱含特征向量h=[h1,h2,…,hp]T,相應的轉換公式如下:
h=sigm(Wx+b)
(1)
sigm(t)=1/(1+e-t)
(2)


(3)
式中:θ′={W′,b′}為隱含層與輸出層之間的參數集。訓練去噪自動編碼器是為了將參數集θ={θ,θ′}={W,b,W′,b′}的重構誤差優化至最小。對于含有S個未標記訓練樣本的樣本集{x1,x2,…,xS},定義重構誤差為:
(4)

標準去噪自動編碼器具有強自適應、強魯棒性、強推理能力和無監督特征學習能力的特點[10]。小波變換具有時頻局部化和聚焦特征。因此,結合標準去噪自動編碼器和小波變換的優點來解決實際問題具有重要的意義。本文提出一種新型的無監督神經網絡——小波去噪自動編碼器,它具有較強的信號捕獲能力,能夠從復雜和非平穩振動信號中獲取典型信息。
WAE模型用小波函數作為激活函數,從而代替傳統的Sigmoid函數,可以用不同的分辨率描述不同的信號特征。輸入層和輸出層都有m個節點,隱含層有p個節點。對于一個訓練樣本x=[x1,x2,…,xm]T,隱含層節點j的輸出為:
(5)
式中:ψ(·)為小波激活函數;xk為訓練樣本的第k維輸入;Wjk為輸入節點k與隱含層節點j之間的連接權值;aj和cj分別表示隱含層節點j的小波激活函數的尺度因子和平移因子。
Morlet小波在時域被定義為復指數函數,在頻域具有高斯窗的形狀。在各種小波函數中,由于Morlet小波與機械脈沖信號有著很高的相似性,是應用最廣泛的旋轉機械特征提取和故障診斷方法[11]。但是,Morlet小波在不同中心頻率條件下可能表現出不同的性質,當中心頻率值大于5 Hz時,Morlet小波作用有限。因此,如何確定Morlet小波的參數對于信號處理是非常重要的。根據參考文獻[11]以及從不同工作狀況采集的振動信號的要求,本文采用Morlet小波實部作為非線性激活函數來設計WAE,其表達式如下:
ψ(t)=cos(5t)exp(-t2/2)
(6)
基于Morlet小波的隱含層節點j的輸出可表示為:
(7)
相應的WAE輸出可以表示為:
(8)

為了更好地獲得輸入數據的特征并且克服特征學習的過度完備性,通常將基于Kullback-Leibler (KL)散度的稀疏表示技術引入到不同類型的去噪自動編碼器的重構誤差函數中[12]。定義WAE的改進重構誤差函數為:
(9)

WAE訓練的目的是優化參數集θWAE={Wij,Wjk,aj,cj},使重構誤差最小。反向傳播算法是一種常用的神經網絡訓練方法,為了進一步提高收斂速度,引入了動量項。最后,參數的新規則可以表示為:
(10)
(11)
(12)
(13)
式中:η為學習速率;α∈[0.9,1]為動量因子;E(t)為第t次迭代時WAE的重構誤差。
為了進一步提高學習特征的質量,在WAEs的基礎上構建深度架構。由三種WAE組成的DWAE逐層構建:首先,利用采集到的振動數據訓練第一個WAE,將采集到的振動數據從輸入層轉換為隱含層,學習特征Ⅰ;然后,特征Ⅰ成為第二個WAE的輸入,用來獲取特征Ⅱ;第三個WAE將繼續按照該模式進行訓練,以獲得特性Ⅲ。最后,將學習到的最高層次特征輸入分類器進行故障模式識別。
為了實現故障模式的自動識別,需要在DWAE的頂層增加一個智能分類器。極限學習機(ELM)是一種新型的分類器[13],它可以看作是一種單隱含層前饋神經網絡。與其他分類算法不同,ELM在訓練精度和訓練速度方面表現出不錯的特點,比較適用于監督學習和非監督學習問題[14]。


(14)
式中:g(·)為ELM的Sigmoid激活函數;Wj=[wi1,wi2,…,wip]T為隱含層節點i的輸入權重;βi為隱含層節點i的輸出權重;bi為隱含層節點i的偏差;oj為第j個樣本的ELM分類器的結果輸出。式(14)可以簡寫成:
Hβ=T
(15)
(16)

(17)
式中:H為隱含層的輸出矩陣,H的第i列是對應訓練樣本的第i個隱含層節點輸出;β是隱含層和輸出層之間的輸出權重向量;T是目標矩陣。ELM訓練旨在找到參數β在輸出矩陣和目標矩陣之間的最小誤差。根據參考文獻[15],輸出權重β為:
β=H+T
(18)
式中:H+為隱含層輸出矩陣H的Moore-Penrose廣義逆。
該方法的流程如圖2所示,一般步驟如下:

圖2 智能故障診斷流程
1) 利用加速傳感器測量滾動軸承的振動數據。
2) 不進行任何信號預處理或特征提取,將原始振動數據分為訓練樣本和測試樣本。
3) 構造深度小波自動編碼,用于原始振動數據的無監督特征學習。
(1) 選擇Morlet小波作為激活函數,用來設計小波去噪自動編碼器。
(2) 使用訓練樣本對第一個WAE進行訓練,然后使用式(7)和式(8)計算隱含層和輸出層的輸出。
(3) 使用式(9)計算第一次WAE的損失函數,使用式(10)-式(13)校正參數。
(4) 完成第一次WAE的訓練。
(5) 使用第一個WAE的隱含觀測量作為第二個WAE的輸入數據,可以根據相同的規則進行訓練。
(6) 重復步驟(1)到步驟(5)直到最后一個WAE,然后就能成功構造出DWAE,可以對原始振動數據進行無監督特征學習。
4) 利用學習到的訓練樣本的深度特征訓練ELM分類器。
5) 通過測試樣本驗證該方法的有效性。
以凱斯西儲大學實驗室的滾動軸承實驗數據為研究對象[16]。實驗裝置如圖3所示,主要由三相感應電機、測試軸承和負載電機組成。每個軸承分別在四種不同負荷(0、1、2、3馬力)下進行測試,將故障直徑分別為0.178、0.355、0.533、0.710 mm的單點故障引入軸承。在驅動端附近放置一個加速度計來收集振動信號。

圖3 滾動軸承實驗裝置
本文利用采集到的1 797 r/min以下的振動數據來構建數據樣本。建立了12種軸承運行狀態,包括不同的故障類型、不同的故障程度和不同的故障定位。每個軸承狀況由150個樣本組成,每個樣本代表一個采集到的振動信號,包含800個數據點。為了避免診斷結果的偶然性,每種狀況隨機抽取100個樣本進行訓練,其余50個樣本進行測試。圖4為12種承軸狀態的原始數據樣本(前800個數據點)。

圖4 12種滾動軸承運行狀況的振動信號
每次去噪自動編碼器訓練或WAE訓練的目的都是優化參數,使重構誤差最小。將本文方法中最高階基模型的重構誤差曲線與標準DAE的進行比較,如圖5所示。可以看出,該方法的重構誤差曲線收斂速度更快。

圖5 重構誤差對比曲線
為了顯示該方法的特征學習能力,對DWAE學習的深度特征、DAE學習的深度特征和手動提取的特征質量進行了比較和評價。以第一次實驗為例,考慮到DWAE學習的深度特征(80維)、DAE學習的深度特征(100維)和手動提取的特征(80維)均為高維數據,利用核主成分分析(KPCA)進行可視化。圖6和圖7分別是不同類型特征的二維和三維可視化,其中KPCA1、KPCA2和KPCA3分別代表前三種主要成分。可以看出,與其他兩種特征相比,DWAE學習到的深度特征能夠更清晰地表示輸入數據。主要原因:(1) 所提出的深度模型具有較強的從輸入數據中學習代表性信息的能力;(2) 小波激活函數具有時頻局部化特性和聚焦特性,對非平穩信號處理非常有效。

圖6 KPCA實現不同特征的二維可視化

圖7 KPCA實現不同特征的三維可視化
為了進一步評價故障模式分類中不同冗余特征的質量,計算了類間協方差SB和類內協方差SW。定義兩個參數[17]為:
(19)
(20)
(21)
(22)

類間協方差可以用來描述不同類間的離散程度,類內協方差表示同一類內的聚類程度。一般來說,越大的類間協方差以及越小類內協方差,表明輸入數據集具有較強的類區分度。本文采用四個評價指標對不同特征的質量進行綜合定量描述:
(23)
(24)
(25)
(26)
式中:tr(A)表示矩陣A的跡。
指標Ji(i=1,2,3,4)結合了類間協方差和類內協方差,計算結果如圖8和表1所示。根據評價標準,更大的Ji(i=1,2,3,4)意味著更好的分類結果。可以發現,基于DWAE的深度特征學習的四個評價指標分別是1.277 5、0.391 7、0.625 5和2.669 2,都略大于基于DAE的深度特征學習,且遠大于人為提取特征。實際上,利用DWAE的深度特征學習存在著最大的類間協方差以及最小的類內協方差。

圖8 不同特征的歸一化評價指標

表1 不同特征的定量評價
為了驗證本文提出方法的有效性,將該方法與標準DAE、小波神經網絡(Wavelet Neural Network,WNN)、BP神經網絡(Back Propagation Neural Network,BPNN)、SVM等四種傳統的智能診斷方法對同一數據集進行對比分析。其中所有深度學習方法的輸入都是800維原始振動數據。標準DAE的分類器有兩種類型:傳統的Softmax分類器和提出的ELM分類器。本文提出的方法側重于滾動軸承的智能故障診斷,不需要任何信號預處理或特征提取,這與傳統的智能方法完全不同。
另外,WNN、BPNN和SVM有兩種輸入類型。一個是800維原始振動數據,另一個是從每個頻段信號中提取80個特征參數。
其他7種方法的主要參數描述如下:
方法2(標準DAE+Softmax):采用Softmax分類器。由實驗確定,標準DAE的體系結構是800-400-200-100。其學習速率為0.1,迭代次數為120。
方法3(標準DAE+ELM):通過實驗確定,DAE體系結構為800-400-200-100。其學習速率為0.1,迭代次數為120。采用ELM分類器(100-270-12)。
方法4(使用原始數據的BPNN):由指導原則和經驗決定,體系結構為800-1400-12。其學習速率為0.1,迭代次數為600。
方法5(利用手動特征的BPNN):體系結構為80-150-12,學習速率為0.1,迭代次數為400。
方法6(使用原始數據的WNN):選擇Morlet小波函數作為激活函數。由指導原則和經驗決定,體系結構為800-1200-12。其學習速率為0.1,迭代次數為600。
方法7(利用手動特征的WNN):采用小波函數作為激活函數,體系結構為80-140-12。其學習速率為0.1,迭代次數為400。
方法8(使用原始數據的SVM):利用徑向基函數核。將懲罰因子和核函數半徑分別設置為40和0.18。每一個都是通過10倍交叉驗證確定的。
方法9(利用手動特征的SVM):利用徑向基函數核。將懲罰因子和核函數半徑分別設置為30和0.32。
通過五次實驗來驗證方法的穩定性,圖9為每次實驗的詳細結果,平均測試精度如表2所示。可以看出,所提出的基于深度小波去噪自動編碼器和極限學習機相結合的方法每次實驗的檢測精度分別為95.5%、95.12%、95.33%、95.05%和95.17%。從表2可以觀察到,該方法的平均精度為95.23%,而使用原始振動數據的標準DAE+Softmax、標準DAE+ELM、BPNN、WNN和SVM平均測試精度分別為89.55%、89.83%、49.39%、52.48%和54.07%。在特征提取后,雖然BPNN、WNN和SVM的準確率分別提高到85.14%、88.59%和87.91%,但它們的性能仍然無法與本文方法相比。此外, 本文方法的標準差為0.217 3,遠小于其他8種方法。圖10給出了所有方法的平均計算時間,包括特征學習階段和故障分類階段。本文方法的平均計算時間為255.89 s,而其他方法的平均計算時間分別為266.89、227.6、256.92、31.21、208.71、24.8、163.91和20.41 s。通過比較可知:(1) 小波神經網絡、SVM和BPNN的診斷性能在很大程度上依賴于人工特征提取。通過設計一些新特征或從原始的特征集中選擇最敏感特征,進一步提高測試的準確性,但是會大幅增加計算時間和難度。(2) 在使用原始振動數據時,深度學習方法(DWAE和DAE)與BPNN、WNN和SVM相比,具有更高的測試精度和更好的穩定性。深度學習方法的優勢主要來自逐層特征學習過程,能夠從原始數據中自動獲取有用的代表性信息。(3) 本文方法的診斷精度略高于采用Softmax或ELM分類器的標準DAE。其原因是該方法充分利用了DAE和小波激活函數,可以進一步提高非平穩振動信號的特征學習能力。(4) 由于隱含層的增加,使得當前深度學習的計算時間大于BPNN、WNN和SVM。然而,隨著現代硬件技術和訓練算法的快速發展,可以充分相信,各種深度學習模型可以更高效地完成[3]。

表2 不同方法的診斷結果

圖9 不同方法的診斷結果對比

圖10 不同方法的平均計算時間
本文提出的DWAE包含一個輸入層和三個隱含層,由三個WAE組成。ELM是在DWAE學習到的深度特征數據基礎上進行故障分類的,它包含一個輸入層、一個隱含層和一個輸出層。深度學習模型的框架設計仍然是一個很大的挑戰,目前還沒有理論方法來解決這個問題。本文采用類似于文獻[14]的簡單思想,通過實驗選擇了一種具有三個隱含層的DWAE。式(9)中的稀疏懲罰因子β和稀疏參數ρ是DWAE的兩個重要參數。本文采用交叉驗證方法來確定最優參數集(β,ρ),β的候選集為[1,2,3,4,5,6,7,8,9],ρ的候選集為[0.1,0.2,0.3,0.4,0.5,0.6,0.7,0.8,0.9]。圖11為第一次實驗的精度與參數集(β,ρ)之間的關系。可以看到,精度對稀疏參數ρ較為敏感,較小的稀疏值似乎是更好的選擇。
本文提出一種新型的基于深度小波自動編碼和極限學習機相結合的方法用于軸承智能故障診斷。應用該方法對實驗得到的軸承振動信號進行了分析,結果表明:
(1) DWAE克服了手動特征提取的依賴,大大地簡化特征選取的步驟,而且對比DAE能夠更加精確地選擇原始振動信號中的敏感特征信號。
(2) 深度學習方法相較于淺層學習來說具有更高的測試精度和更好的穩定性。
(3) DWAE與ELM相結合的軸承智能故障診斷方法能夠保證較高的故障診斷率。