陳纖 鄒龍慶 李明磊 唐友福 繆皓 韓吉程
(1.東北石油大學機械科學與工程學院 2.中國石油天然氣集團有限公司工程和物裝管理部 3.大慶鉆探工程公司)
滾動軸承作為旋轉機械中的重要承載部件,通常工作在高速、重載、高溫、腐蝕的復雜惡劣工況下,容易產生磨損、剝落、斷裂等故障,輕則導致設備加工偏離有效指標,造成噪音污染、影響生產進度及產品質量,重則導致設備損壞,造成重大的經濟損失。因此,開展有效的滾動軸承狀態監測與故障診斷研究具有重要意義[1-2]。
目前廣泛應用的深度學習算法在大數據分類和預測上具有明顯優勢。但是由于長期積累的滾動軸承現場監測信號往往是以未標記的正常樣本為主的大數據,故障樣本較少而且受噪聲及監測誤差的影響,有用故障信息容易淹沒在正常樣本數據中,特別在變工況和不同場景下,數據集服從不同分布,難以訓練出魯棒性好的診斷模型。因此,有必要研究一種基于少量標簽樣本建立的可靠診斷模型,對目標域數據進行分類識別。據此引入遷移學習的概念,它是一種半監督的學習算法,能夠實現不同領域或任務之間的知識轉化。但遷移學習對數據的特征表達能力不如深度學習,所建模型無法有效反映滾動軸承故障狀態的現實情況。為此,如何將深度學習和遷移學習進行有機融合,建立互補的診斷模型是目前國內外學者廣泛深入研究的熱點。YANG B.等[3]提出一種基于特征的遷移神經網絡,借助多層域自適應和偽標簽學習減小源域與目標域之間的特征差異,能用海量未標注數據有效診斷滾動軸承故障。LI X.等[4]提出利用多核最大均值差異法構造一種多層域自適應卷積網絡,將源域中學習到的表示適配到目標域中應用,并準確預測不同電機負載下的滾動軸承故障等級。陳祝云等[5]提出一種增強遷移卷積神經網絡來改進機械設備在變工況下的診斷精度和泛化能力。孫燦飛等[6]提出了結合域對抗與深度編碼網絡的自適應域對抗深度遷移故障診斷方法,解決軸承故障診斷在變負載以及強噪聲下的診斷難題。WU Z.H.等[7-8]提出一種利用長短期記憶網絡進行軸承故障診斷的遷移學習方法,通過聯合分布自適應來減小源域數據集和目標域數據集之間的概率分布差異,該方法對噪聲具有很強的魯棒性,并且在不同的噪聲水平下具有出色的性能。WANG X.等[9]通過優化殘差網絡構建多尺度特征學習器,縮短2個域之間的條件分布距離,該模型可以從2個域中提取判別性和強大的特征,避免信息的丟失。ZHAO Z.B.等[10]提出一種聯合分布領域對抗網絡模型,并應用于凱斯西儲大學滾動軸承故障的診斷。LIU J.等[11]提出一種自注意力小樣本遷移學習模型,以較小的訓練樣本實現更高的準確性,該方法不能實現端到端訓練。LI Q.F.等[12]結合知識圖譜,提出了一種基于對抗網絡的軸承故障診斷遷移學習方法,結果表明所提方法證明了理想的泛化能力,但其分類識別準確率有待提高。CHEN P.等[13]提出一種聯合切片Wasserstein距離的無監督域自適應,以提供端到端訓練和更高的精度。
以上方法雖然取得一定的診斷效果,但是由于未能同時考慮減少不同數據邊緣分布距離和條件分布距離,模型可遷移、泛化能力以及識別的準確率未能達到理想效果。為此,筆者提出一種深度遷移學習算法——聯合對抗深度遷移方法,并將其應用于滾動軸承的故障診斷。該方法能夠有效實現現場滾動軸承大數據小樣本的診斷識別,自適應和泛化能力較強,可為設備的預知性智能維護與健康管理提供有力支持。
假設在實驗室設備中獲得的數據或真實場景上帶有標簽的數據被記作有標記的源域(data obtained in laboratory equipment,DLE),而由其他實驗室設備或真實場景測量的未標記數據被用作目標域(data in the real-case scenarios,DRS),顯然2個域具有不同的特征分布。受對抗網絡的啟發,提出一種聯合對抗深度遷移模型,其總體框架如圖1所示,主要包括特征生成器、聯合特征、領域判別器和分類器。其中,特征生成器由具有批量歸一化層的卷積神經網絡來實現,以提取域不變特征,加速訓練過程和提高網絡泛化性能,并更好地保留每個域的不同特征分布。聯合特征結構是利用前K個相關標簽生成DRS的標簽,以此計算數據條件分布,提高標簽的預測精度,動態域對齊用于平衡邊緣分布和條件分布,以提高模型的可遷移能力,再利用聯合廣義切片Wasserstein距離準則計算聯合分布,以減少計算量和提高模型的訓練速度。域判別器用于區分不同的域以進行更全面的域適應,這形成了對抗性的域損失函數。分類器用于預測最終標簽。
(1)特征生成。特征生成器由一個4層卷積網絡組成,輸入大小為1×1 024的一維振動信號,經過第一層卷積核大小為15×1的卷積層,輸出的信號大小為16×1 010。第二、三、四層的卷積核大小都設置為3×1,最終全連接層的輸出大小為256。卷積神經網絡的層數及大小設置如表1所示。

表1 卷積網絡參數

(1)

假設有5個有著相似特征的樣本,經分類器預測后有的標簽值ypred存在錯誤,為降低發生錯誤的概率將這5個樣本按相似性從大到小排列。若K=3,即選擇前3個最相似樣本對應的預測,最后選擇出現頻率最高的標簽值作為最終待測樣本標簽值,記作M(yK)。該方法可以明顯降低對目標域標簽值預測的錯誤率并且能準確計算特征條件分布。目標域標簽損失可以寫成:
(2)

為實現特征條件分布更精準的度量,本文提出廣義切片Wasserstein距離,該距離基于原始Wasserstein距離演變而來。傳統Wasserstein距離存在難以測量高維分布的瓶頸,目前研究學者提出許多方法來改善Wasserstein距離的計算,例如切片Wasserstein距離[14],其通過線性分片與拉東變換相關的概率分布來計算。雖然切片Wasserstein距離需要較少的計算復雜度,但是隨機選擇的線性投影的數量非常大,并且不能保證所選擇的線性投影將提供特征分布距離的有效評估。受廣義拉東變換的啟發,通過將概率測度的線性切片擴展到非線性切片,提出一種新的測度距離——廣義切片Wasserstein距離。
廣義拉東變換由經典拉東變換發展而來。經典拉東變換是將超平面上的積分推廣到流形超曲面上的積分,其定義如下:
(3)
式中:RPS/T表示在超平面Rd上將高維分布投影到低維分布上的無窮積分集;PS/T表示源域和目標域的概率分布函數。Sd-1表示超平面Rd-1中的單位球面,?w∈Sd-1,?t∈R,δ()表示一維狄拉克函數。廣義拉東變換可表示為:
(4)
當g(x,w)=〈x,w〉時,經典拉東變換是廣義拉東變換的特例。進一步地,廣義切片Wasserstein距離表達式可定義為:
GSW(PS,PT)=
(5)
式中:PS、PT(PS/T)分別表示源域和目標域的概率分布函數。
利用該廣義切片Wasserstein距離度量訓練樣本和測試樣本特征概率分布距離,首先計算源域和目標域之間的聯合分布差異。聯合分布由邊際分布和條件分布組成,2個域之間的邊緣分布差異Dmar表達式為:
Dmar=GSW(PS,PT)
(6)
本文采用前K個相關標簽來標記目標域數據,2個域之間的條件分布差異Dcon表達式為:
(7)

因此,上述的聯合分布可以定義為:
Dj=Dmar+Dcon=GSW(PS,PT)+
(8)
以往的許多方法只分別考慮了邊緣分布對齊和條件分布對齊,或者將邊緣分布和條件分布以一種比重相同的方式對齊,沒有考慮到這2種方式在實際應用中的重要性可能不同,從而產生了2個不同領域之間的傳遞遷移能力下降的問題。針對上述問題,本文通過一個平衡因子的計算動態對齊邊際分布和條件分布,該平衡因子μ∈[0,1]。動態域對齊的表達式為:
(9)
為了評估所提出的方法在機械故障診斷領域中的可遷移能力,將其應用于不同數據集進行試驗驗證,2個標準數據集具體見表2和表3。現場軸承數據是從現場實際工作的往復壓縮機上采集得到,其負載和運行條件不斷發生變化,故障類別通常為疲勞、點蝕、塑性變形等,具體可見表4。

表2 凱斯西儲大學軸承數據(CWRU)

表3 西安交通大學軸承數據(XJTU-SY)

表4 現場實際軸承數據
表2中:IF為滾動軸承內圈故障;RF為滾動軸承滾動體故障;OF為滾動軸承外圈故障。
表3中:CF為滾動軸承保持架故障。
Lc(Fc(Fg(xs)),ys)=
(10)
域判別器學習函數Fd對輸入數據進行域分類,域判別器的損失函數可表示為:
Ld[Fg(xs),Fg(xt)]=
(11)
最后,應用上文提出的動態分布域對齊來平衡特征邊緣分布和條件分布,以提高模型的泛化能力,域對齊損失表示如下:
+λ[μDmar+(1-μ)Dcon]
(12)


圖2 計算流程圖
文中提出模型的整體目標函數表示如下:
L=Lc+LK+Ld+LDA
(13)
選擇凱斯西儲大學數據集和西安交通大學數據集作為DLE,不同工況下的遷移任務和從DLE到DRS的遷移任務如表5、表6和表7所示。將本文提出方法與原始卷積(S-only)、多核最大平均差異度量[15](multikernel maximum mean discrepancy,MK-MMD)、領域對抗神經網絡[16](domain adversarial neural network,DANN)、特征對齊[17](correlation alignment,CORAL)和聯合最大平均差異[18](joint maximum mean discrepancy,JMMD)等進行比較。

表5 基于凱斯西儲大學軸承數據遷移任務

表6 基于西安交通大學軸承數據遷移任務

表7 DLE到DRS的遷移任務
不同工作條件遷移結果如圖3~圖5所示。顯然,本文提出的JGSWD方法在6個任務上優于其他比較方法。其中S-only的準確率最低,JGSWD作為域自適應對抗方法,取得了比DANN更好的性能。隨機選擇B→C和E→F遷移學習任務作為t-SNE可視化的對象,它們的特征可視化結果如圖6和圖7所示。在圖6和圖7中,10種顏色代表10個類別,圓形點代表源域,相反,叉點代表目標域。對比其他方法,JGSWD方法的可視化結果圖能夠較好將圓形和十字形點聚集在一起,使源域和目標域的特征分布更加一致,且10種顏色分類更加清晰明朗,該方法實現了更好的聚類。

圖3 凱斯西儲大學軸承數據A→B遷移分類預測準確率

圖4 西安交通大學軸承數據D→E遷移分類預測準確率

圖5 軸承分類預測準確率雷達圖

圖6 B→C遷移任務的可視化

圖7 E→F遷移任務的可視化
DLE到DRS的遷移結果表明:該試驗的挑戰在于故障軸承數據是在不同的機械設備中獲得的,并且目標域是未標記的數據,導致DLE和DRS的分布差異更大。試驗中本文所提出的方法分類性能如圖8~圖10所示,分類準確率高達97%,具有很好的特征可視化性能,并且預測測試樣本故障類型的時間大大減少。

圖8 CWRU→DRS的遷移任務分類預測準確率

圖9 XJTU-SY→DRS的遷移任務分類預測準確率

圖10 DLE到DRS遷移任務的可視化
為了更好地證明每一項創新點在分類準確性上的有效性,對其進行消融試驗。G:廣義切片Wasserstein距離;K:前K個相關標簽;DA:動態域對齊。“JGSWD-G/DA/K”表示沒有廣義切片Wasserstein距離、前K個相關標簽和動態域對齊的故障診斷模型。消融試驗如圖11所示。很明顯,本文所提出的JGSWD方法每一個創新點都有效地提高了模型遷移泛化性能和分類預測的準確性。

圖11 消融試驗
本文提出了一種基于領域自適應的滾動軸承故障診斷聯合對抗深度遷移學習方法,主要解決DRS和DLE聯合特征分布不同的問題,并通過動態平衡邊緣分布和條件分布來最小化2個領域之間的聯合差異,采用廣義切片Wasserstein距離,極大減少了復雜計算量,提高了故障診斷的速度。此外,采用前K個相關偽標簽計算目標域標簽值提高了條件分布計算準確率和模型遷移泛化能力。JGSWD模型的有效性通過CWRU軸承數據集、XJTU-SY軸承數據集和往復壓縮機軸承數據集得到了驗證。在CWRU軸承數據集和XJTU-SY軸承數據集上的試驗結果表明,JGSWD方法的平均分類準確率約為99%。從DLE到DRS的遷移試驗結果表明,JGSWD方法的平均分類準確率約為97.56%,JMMD約為93.13%,DANN、MK-MMD和CORAL約為91%,S-only僅約為83%。JGSWD方法比其他方法具有更高的分類精度和更好的遷移性能,可為滾動軸承故障診斷提供一種新的有效方法。