金余豐,劉曉鋒,姚美常,黃鳳良
(1.南京師范大學電氣與自動化工程學院,江蘇 南京 210046;2.江蘇方天電力科技有限公司,江蘇 南京 211106;3.南京方一測控科技有限公司,江蘇 南京 211102)
滾動軸承是機械設備中通用的零件,在工作過程中承擔應力、傳遞載荷,大多處于高轉速、重負載、長期連續運行的工況,廣泛應用于各行業中[1]。對滾動軸承的智能診斷研究直接關系到機械設備的使用與壽命,具有重要意義。
基于數據驅動的診斷是滾動軸承智能診斷研究中較為深入的一類方法,主要有基于特征工程的機器學習診斷方法[2]和無需特征工程的深度學習診斷方法[3]。其多在定工況的前提下開展,識別準確率較高。然而,機械設備實際運行多為變工況條件,滾動軸承狀態受環境影響而非恒定,易導致振動信號的數據分布發生變化,給故障診斷帶來嚴峻挑戰[4-5]。因此,有必要對變工況的滾動軸承故障診斷進行深入研究。
變工況下的故障診斷常被歸結為不同領域間的自適應問題(簡稱“領域自適應”)。跨領域的故障診斷是利用一種工況的數據(源域)訓練模型,并對訓練完成的模型采用適應技術后用于另一種工況(目標域)的故障診斷。研究者多從遷移學習出發解決故障診斷的領域自適應問題。文獻[6]基于傳統遷移方法,在提取的信號特征基礎上,利用遷移成分分析方法(transfer component analysis,TCA),提取了域間可遷移的特征,用于跨域故障診斷。文獻[7]使用無標簽的目標域數據對源域數據進行歸一化,以弱化變工況對故障診斷的影響。隨著深度學習技術的發展,基于深度學習的遷移方法也被應用于變工況故障診斷。文獻[8]首先對源域數據進行快速傅里葉變換(fast Fourier transform,FFT),無需其他特征提取而直接輸入進行模型訓練;然后利用少量有標簽的目標域數據,對訓練完成的模型進行微調以適應不同工況。該方法適用于目標域數據和標簽信息可獲得的場景。文獻[9]無需人工特征工程等工作,直接利用軸承振動信號作為模型輸入,通過在歸一化層添加統計特征(adaptive batch normalization,AdaBN),將源域和目標域的分布調整至近似一致,在變負載的故障診斷中取得不錯的效果。由此可見,深度遷移學習具有特征提取簡單、模型遷移性能好的優點,在變工況故障診斷中應用有巨大潛力。
本文基于深度遷移學習,提出一種基于域對抗遷移機制的變工況滾動軸承故障診斷模型。模型以滾動軸承的一維振動工況數據為輸入,使用有標簽的源域工況數據和無標簽的目標域工況數據進行訓練,完成對目標域工況數據的分類,進而實現變工況的滾動軸承故障診斷。
Yarolav等[10]率先提出了基于域遷移對抗機制的深度遷移神經網絡(domain adversarial neural networks,DANN)。DANN結構如圖1所示。

圖1 DANN結構圖
DANN的結構包含了特征提取器Gf、標簽預測器Gy和領域分類器Gd。Gf通常由多層卷積層組成,用于提取信號的特征。Gy由全連接層和Softmax分類器組成,用于預測信號的狀態標簽。Gd包含梯度翻轉層(gradient reverse layer,GRL)、全連接層和Softmax分類器,用于預測信號的領域標簽。
以Gf(x;θf)為特征提取器,x為網絡的輸入,θf為網絡層的權重矩陣。Gf提取的特征經Gy(x;θy)得到預測的標簽輸出,則標簽預測器的損失為:
(1)
式中:θy為Gy的權重矩陣;xi為第i個樣本;yi為樣本的實際標簽。
DANN通過添加梯度翻轉層和數個標準層來構建領域分類器,實現領域自適應工作。Gf提取的特征經領域分類器Gd(x;θd),可得預測的領域輸出,則領域分類器的損失為:
(2)
DANN的優化目標要求Gf盡可能提取可用于區分源域和目標域的特征,同時要使領域分類器Gd無法區分不同領域的差異。根據圖(1)的網絡結構,DANN的損失由標簽預測器損失Ly和領域分類器損失Ld兩部分組成。
L=Ly(Ds,ys)+λLd(Ds,Dt)
(3)
式中:Ds為源域數據集,是有標簽的數據集;ys為Ds的標簽;Dt為目標域數據集,是無標簽的數據集;λ為領域判別損失的對抗系數。
對于實際有n個樣本的訓練集,DANN的總損失可表示為:
(4)
式中:n為源域的樣本數;n′為目標域的樣本數;N為總樣本數。
DANN的優化目標是尋找一組最優參數(θf,θy,θd),使得Gy最小化標簽分類損失為:
(5)
同時,Gd最大化領域分類損失為:
(6)
在網絡訓練時,最小化標簽預測器損失和最大化領域分類器損失的對抗,即為模型的對抗遷移過程。在此過程中,模型自動提取出適于不同領域間遷移的特征。
DANN的訓練過程中,根據圖(1)的網絡結構及鏈式求導法則,可求得各參數的梯度更新公式。
(7)
(8)
(9)
基于滾動軸承的一維振動信號進行變工況下故障診斷,屬于單一源域和目標域的情形。對比定工況下的故障診斷,兩個領域分類任務相同、標簽空間相同,但振動數據分布發生改變,適宜采用域對抗方法進行解決不同工況下的領域自適應問題。
因此,本文提出一種基于域對抗遷移機制的變工況滾動軸承故障診斷模型。變工況故障診斷模型結構如圖2所示。

圖2 變工況故障診斷模型結構圖
從各結構的功能出發,模型可以大致分為三部分:特征提取器、故障分類器和領域分類器。特征提取器由卷積層、殘差單元[11]和雙向長短記憶(bi-directional long short-term meomory,Bi_LSTM)單元[12]組成。其中:卷積層(Conv 1D)由一維寬卷積核構成,用于提取信號的短時特征;殘差單元由帶有一維小卷積核殘差單元塊組成,用于提取信號的高維特征;雙向LSTM單元用于實現信號特征的時序表達。故障分類器和領域分類器的兩個輸出單元均由Dense全連接層和Softmax分類器組成,故障分類器輸出振動信號的狀態標簽,領域分類器輸出振動信號的領域標簽。模型通過在故障分類器和領域分類器間添加梯度翻轉層GRL,實現領域對抗遷移網絡的構建;借助在標記數據充足的源域(定工況),實現對目標域(變工況)運行條件下的滾動軸承故障診斷。
一維的振動時序信號作為輸入進到特征提取器,經過殘差網絡完成特征提取,得到振動信號的一組高維特征表達;而后該組特征經過雙向LSTM單元得到特征在時序上的表達;得到的特征表達輸入到模型的兩個輸出單元。模型訓練測試流程如圖3所示。

圖3 模型訓練測試流程圖
試驗以凱西西儲大學軸承數據庫為基礎構建多工況數據集。選取0~3 hp負載的軸承振動數據,每種工況振動數據包含了4種軸承狀態,即正常(N)、外圈故障(OR)、內圈故障(IR)和滾動體故障(RB),每種故障狀態對應有0.007、0.014、0.021(inch)3種損傷尺寸,共10種軸承標簽。軸承狀態標簽如表1所示。

表1 軸承狀態標簽
根據負載狀態進行軸承工況條件劃分,工況條件如表2所示。

表2 工況條件
本文所提出模型主要使用有狀態標簽信息的源域數據對無標簽信息的目標域數據進行診斷,有標簽數據僅作源域數據時使用。因此,根據表2的工況條件劃分,試驗主要進行如表3所示的變工況診斷任務。

表3 變工況診斷任務
表3以任務A為例,將以工況1為源域數據集,分別對以工況2、3、4為目標域的待診斷數據集進行試驗。
試驗在TensorFlow框架下搭建實現,采用小批量和Adam梯度優化相結合的方法進行訓練。批大小設置為128,模型迭代訓練100次。對比試驗方面,首先比較模型進行遷移前后的效果提升及差異,即比較本文模型與不含域分類器的基礎模型變工況診斷的性能差異。其次,將模型與支持向量機(support vector machine,SVM)、反向傳播(back propagation,BP)神經網絡、隨機森林(random forest,RF)等直接進行跨域的診斷方法進行對比。SVM模型基于時域、頻域特征進行故障分類。BP采用小波能量熵和經驗模式分解(empirical mode delopmposition,EMD)能量熵進行診斷。RF則采用多種組合特征進行診斷分類。此外,還設置了基于CNN和LSTM的深度學習模型的對比試驗。
3.3.1 對抗遷移診斷結果對比
未添加對抗遷移網絡的跨域診斷結果如表4所示。

表4 未添加對抗遷移網絡的跨域診斷結果
試驗使用不含領域分類器的模型(后文稱為“基礎模型”),即利用在一種負載條件下訓練完成的模型,直接對不同負載條件下的軸承進行故障診斷,未涉及領域自適應工作。由表4可知,診斷任務在遷移前的跨域診斷準確率平均值均小于90%,最高的任務D也僅為87.66%,模型的跨域診斷能力有限。以任務A為例,該任務利用工況1的數據進行訓練,對工況2、3、4進行跨域診斷測試。模型對工況1的診斷準確率可達99.92%,表明模型對定工況下的故障診斷準確率高。但模型對其他工況條件的故障診斷準確率較低,均在85%以下。這表明模型的領域自適應能力弱,跨域診斷能力有限。
添加了對抗遷移網絡后的跨域診斷結果如表5所示。

表5 添加對抗遷移網絡的跨域診斷結果
由表5可見,域對抗遷移機制顯著地提升了變工況故障診斷的效果,各診斷任務的平均診斷準確率均在95%以上,模型的領域自適應能力得到增強。其中,任務B的提升效果最優,由80.96%的平均診斷率提升到了99%的識別率。同樣,以診斷任務A為例,遷移模型對于源域數據集保持了98.85%高診斷率,對其他工況的診斷準確率分別提高了約16%、14%和11%。這表明模型的跨域診斷能力得到增強,能夠適應多變的工況條件。
3.3.2 故障類別診斷結果
以任務A為例,選取工況1為源域、工況3為目標域進行試驗。圖4為任務A遷移前后具體故障類別的診斷結果混淆矩陣。

圖4 診斷結果混淆矩陣
由圖4可知,當模型未進行領域自適應,直接進行跨域診斷時,診斷識別性能不佳。雖能準確識別某些狀態的故障(如標簽8和9對應的軸承狀態,診斷識別率可達100%),但特定標簽(如標簽2和4)的軸承狀態診斷準確率低,標簽2只有24個樣本被分類正確,標簽4的樣本無法識別。
對比圖4(a)、圖4(b)可知,遷移后的模型在故障類別上的診斷表現得到顯著提升。其中,標簽4的狀態信息原本無法識別,現可以完全識別;標簽2狀態仍表現不佳,但也有一半的樣本被正確分類。
對比如表6所示的各故障類型診斷效果提升情況,標簽4的狀態信息由無法識別變為可完全識別;標簽2狀態雖仍表現不佳,但已有一半的樣本被正確分類;目標域綜合診斷準確率由89.52%提升至94.28%。由此可見,添加遷移機制之后的模型在具體故障類別上的診斷表現得到顯著提升。

表6 各故障類型診斷結果提升情況
本文所提出模型與其他跨域診斷模型的診斷效果對比,如表7所示。

表7 各診斷模型診斷效果對比
由表7可知以下結果。①任務C中基于LSTM的模型跨域診斷準確率低于基于隨機森林和BP網絡的方法;任務D中LSTM則比SVM低了5%左右。由此可見,在無領域自適應工作的情況下,LSTM方法與基于特征工程的方法相比,并不占優勢。②CNN、基礎模型等基于深度學習的診斷方法跨域診斷準確率高于基于特征工程的方法,說明基于特征工程的方法難以勝任變工況下的故障診斷。③基礎模型在診斷任務A、B中診斷準確率優于其他深度模型,但除任務B之外其他診斷準確率均在90%以下,跨域診斷表現一般。④基于域對抗遷移的模型診斷將診斷任務B的準確率提升到了99%左右,在各診斷任務中均為最高;而且其他模型表現不佳的診斷任務A也達到了95%的診斷準確率。這說明模型的跨域診斷能力好,能夠適應復雜工況下的故障診斷。
3.3.3 可視化分析
選取任務A,以工況1為源域、工況3為目標域進行診斷試驗,利用t-SNE算法對提取的特征進行可視化,直觀理解模型的遷移分類過程。特征t-SNE可視化對比如圖5所示。圖5中:“o”為源域數據的特征輸出;“*”為目標域特征輸出;右側彩條表示不同故障標簽對應的顏色。

圖5 特征t-SNE可視化對比圖
圖5(a)是未添加對抗遷移網絡的特征輸出。對于源域工況1,特征提取器提取的特征已可區分來自源域的故障類型,目標域工況3提取的特征之間區分性也很大。但此時模型訓練基于有標簽的源域數據完成,模型學習擬合的是源域工況1的數據分布。目標域數據與源域數據分布的不一致,會導致故障分類器錯分故障類型。圖5(b)為添加了對抗遷移網絡的特征輸出,提取到的工況1和工況3的特征基本重合,表明在對抗遷移機制的作用下,模型提取了在工況1和工況3均適用的可遷移特征。由此可以說明,盡管源域和目標域的數據分布不一致,但對抗網絡能夠利用有標簽的源域數據和無標簽目標域數據,提取的可遷移表征的分布基本一致,有效地提高了模型跨域診斷能力。
本文提出了一種基于域對抗遷移的變工況故障診斷模型。該模型以滾動軸承的一維振動信號作為輸入,通過殘差網絡和雙向LSTM完成特征提取,在故障分類器和領域分類器之間添加梯度翻轉層實現領域對抗,最終實現變工況的滾動軸承故障診斷。
通過對比添加域對抗機制前后的診斷表現,驗證了該方法能夠有效提升變工況診斷任務的表現;通過與其他直接跨域診斷模型的對比,驗證了模型在變工況故障診斷中具備準確率高的優勢;通過提取特征的可視化分析,驗證了模型提取的特征能夠適用于不同工況下的診斷任務。