陳鵬,趙小強
(1.蘭州石化職業技術大學 電子電氣工程學院,蘭州 730060;2.蘭州理工大學 電氣工程與信息工程學院,蘭州 730050)
滾動軸承是旋轉機械的關鍵部件,在運行過程中極易損傷,為保證軸承的健康運行,國內外學者針對軸承的狀態監測和故障診斷方法進行了大量的研究[1]?;谛盘柼幚砗蜏\層機器學習的故障診斷方法對變工況下的軸承故障診斷能力不足,深度學習方法具有深層架構和強特征自提取能力,在軸承故障診斷中得到了初步應用。
文獻[2]通過卷積門控循環網絡實現了軸承的故障診斷,文獻[3]利用獨立自適應學習率改進深度信念網絡實現軸承的故障診斷,文獻[4]將螢火蟲優化的核自動編碼器應用于中介軸承的故障診斷:這些方法直接實現了端到端的軸承故障診斷,證明了深度學習在軸承恒工況下的故障診斷能力較優。而在變工況下,文獻[5-6]分別提出了改進Alexnet和改進殘差神經網絡的滾動軸承變工況故障診斷方法,但其前提都是假設不同工況下的樣本分布一樣,與實際工況不符,也不具備很強的泛化能力。因此,本文結合卷積神經網絡的強大非線特征提取能力和域自適應的遷移學習能力,提出一種改進一維卷積神經網絡的滾動軸承變工況故障診斷方法。
以一維卷積神經網絡(One-Dimensional Convolutional Neural Network,1DCNN)為診斷主框架,將其全連接(Full Connection,FC)層通過全局均值池化(Global Avearge Pool,GAP)層代替,減少模型的大量參數訓練。同時,在GAP層引入最大均值差異(Maximum Mean Discrepancy,MMD)的域自適應(Domin Adaptation,DA)學習方法,構建基于交叉損失熵和MMD分布差異損失的最小準則實現特征的遷移學習,從而實現滾動軸承的變工況故障診斷。
在傳統1DCNN模型中,卷積層與池化層堆疊之后通過FC層與softmax分類器連接,這導致1DCNN 網絡泛化性能較弱,易產生過擬合。FC層的大量參數會增加網絡訓練和測試的計算量,導致訓練比較耗時。在此,使用GAP層代替FC層,用于計算與之連接的上一層輸出特征圖的全局平局值,其優點是無需對該層參數進行優化,避免過多池化操作導致信息丟失和過度擬合,從而有效提升模型的泛化性能[8]。GAP的表達式為

(1)


圖1 改進1DCNN的網絡結構
域自適應通過將源域和目標域的數據投影到新子空間中同一區域來提取跨域不變特征,從源數據中學習到的知識可以很好地推廣到目標域[9],其原理如圖2所示。

圖2 域自適應
領域:一個領域D相當于一種工況,該領域主要由訓練數據集X及其邊緣概率分布P(X)組成,其中X=[x1,x2,…,xn]∈χ表示訓練數據集,D={χ,P(X)}。
任務:一個任務T主要由分類標簽集y和預測函數f(X)組成,預測函數可以從訓練集X中學習獲得,f(X)為條件概率分布,即
f(X)=Q(Y|X),T={y,f(X)|。
遷移學習:主要是通過對源域Ds和任務Ts,目標域Dt和學習任務Tt的共性知識進行學習獲得目標域函數ft(X),實現對目標任務的分類,其中Ds≠Dt或Ts≠Tt,當Ds=Dt或Ts=Tt時,遷移學習就變為傳統的機器學習。
最大均值差異是用于測量2種不同分布數據集之間差異的指標,可以估計非參數距離,避免計算分布的中間密度,其定義為再生核希爾伯特空間中邊緣分布核嵌入之間的平方距離,表達式為
(2)
式中:Xs,Xt為數據集,P(Xs)≠P(Xt);φ為非線性映射函數,用于產生再生核空間H。
通過(2)式可知,2個分布差異的評估就是2個數據分布在再生核希爾伯特空間中的距離,其值越接近于零意味著2個分布越匹配。在遷移學習中,最大均值差異被用來在特征學習中重構正則化項,使得2個不同分布的學習特征更加相似[9]。
在改進1DCNN的優化目標中,主要有源域監督和分布差異最小化2個部分組成。
首先,通過交叉熵損失函數實現傳統監督機器學習中源標簽數據經驗分類誤差Ls最小。
(3)

然后,通過最大均值差異測量源域與目標域中不同分布的差異,最大均值差異的損失函數Ld被定義為
Ld=Dk(FS,FT),
(4)
式中:FS,FT分別為GAP層中源域、目標域學習特征的分布。
最后,對最大均值差異值和交叉熵損失函數進行優化,以達到改進1DCNN模型的優化目標。最終的優化目標定義為
minLopt=Ls+αLd,
(5)
式中:α為Ld的系數,α∈(0,1)。
在模型的訓練過程中,其參數在每次迭代過程中可以表示為

(6)
式中:β為學習率;θ為參數。
通過美國凱斯西儲大學公開軸承數據進行算法的性能驗證,該數據集主要為風扇端和驅動端軸承分別運行在轉速和負載為(1 797 r/min,0hp),(1 772 r/min,1hp),(1 750 r/min,2hp),(1 730 r/min,3hp)工況下的數據[11]。每種工況下的軸承故障類型如下:故障直徑為0.178,0.533 mm時,各有內圈、鋼球和外圈3,6,12點鐘方向5種故障類型;故障直徑為0.356 mm時,有內圈、鋼球和外圈6點鐘方向3種故障類型;故障直徑為0.711 mm時,有內圈和鋼球故障2種故障類型。以上15種故障類型與正常運行軸承共構成16種不同類型的故障數據集,所有故障數據的采樣頻率均為12 kHz,數據集的詳細劃分見表1。

表1 變工況軸承故障數據集的劃分
仿真試驗基于深度學習的Pytorch框架,編程語言為Python,在Windows7系統、英特爾酷睿i5-5200U處理器和4 GB內存的計算機上運行。采用SGD優化算法更新網絡訓練參數,學習效率參數為0.01,迭代批數為100,每個迭代批次大小為100。該方法的參數設計類似卷積神經網絡,參數設置見表2。

表2 改進1DCNN的參數設置
將改進1DCNN,ResNet和1DCNN+DA方法同時用于未加入人工噪聲的軸承變工況故障診斷,結果如圖3所示:ResNet屬于傳統的深度學習方法,無法適應變工況,軸承故障診斷能力不足;1DCNN與DA相結合的方法由于引入了DA遷移學習,在軸承變工況下的故障診斷準確率相比傳統ResNet模型得到了提高;改進1DCNN方法在1—2,1—3,2—3和3—2變工況下的故障診斷準確率均達到了100%,故障診斷能力得到了很大提升。綜上可知,在未加入噪聲的變工況下,改進1DCNN方法具有較好的診斷效果,可以解決傳統信號處理方法在復雜工況下故障診斷能力欠佳的問題。

圖3 變工況(未加入噪聲)下不同方法的軸承故障診斷結果
在上述工況中分別加入信噪比6,9,12 dB的噪聲以進一步驗證改進1DCNN方法在軸承變工況下的故障診斷能力,各方法對加入不同噪聲振動信號的試驗結果如圖4(圖中數值為平均故障診斷準確率)所示:ResNet的診斷結果表明信噪比對診斷準確率有較大的影響,信噪比越低(即加入噪聲越大)診斷準確率越低,這是由于噪聲大會導致原始信號在調制后被淹沒,從而難以識別;由于1DCNN模型本身結構相比ResNet結構存在缺陷,DA特征遷移學習的引入并未從整體上提高軸承變工況下的故障診斷準確率,甚至還略有降低;而在1DCNN模型中用GAP代替FC,并與DA遷移學習相結合提高整個模型的泛化性,使其在軸承變工況下的故障診斷準確率得到大幅提升,說明改進1DCNN與DA相結合的故障診斷方法在變工況下具有一定的優越性,可以進行推廣和應用。

圖4 變工況(加入3,6,9 dB的噪聲)下不同方法的軸承故障診斷結果
提出了改進1DCNN的滾動軸承變工況故障診斷方法,使用GAP代替傳統1DCNN的FC層,解決了傳統1DCNN中訓練參數過多的問題,同時在GAP層引入DA遷移學習機制,實現滾動軸承變工況下的特征遷移學習。通過改進1DCNN故障診斷方法實現了滾動軸承的變工況故障診斷,相比ResNet,以及未改進1DCNN與DA結合的方法,本文所提方法的診斷效果更優,可以應用于不同工況下的軸承故障診斷。但在實際應用中,模型的計算效率、輕量化等方面還有待進一步研究。