陳鈞钖 袁逸萍 陳彩鳳
(新疆大學機械工程學院,新疆 烏魯木齊 830046)
隨著工業互聯網、物聯網技術的迅速發展,機械設備能夠提取的監測數據不斷增加,相應的數據采集量也與日俱增,為設備狀態監測提供了堅實的數據基礎。旋轉機械作為工業設備的關鍵設備,其中軸承是旋轉機械的關鍵組成部件,其一旦發生故障則會嚴重造成企業的經濟損失甚至人員傷害[1]。因此對軸承進行狀態監測與故障識別對保證設備安全穩定運行具有重要意義。
在實際情況下,診斷任務難以獲取滿足診斷模型訓練的數據樣本。針對缺乏充足故障樣本數據的問題,文獻[2]采用兩個同結構、參數共享的卷積網絡以及雙向門控循環單元構成孿生網絡進行故障分類,取得良好的診斷結果;文獻[3]在生成對抗網絡中引入條件梯度懲罰機制的軸承故障診斷方法,其能夠生成與真實樣本高度相似的生成樣本,有效地提高了故障診斷的準確率。文獻[4]采用有限元方法得到不同工況下軸承故障樣本并且利用冗余屬性投影并結合支持向量機進行軸承故障診斷。雖然數據增強以及仿真的方法在一定程度上解決了數據樣本缺乏的問題,但數據間的差異性會導致診斷方法的精度下降。針對數據之間存在差異問題,遷移學習中領域自適應解決了數據特征之間存在差異的問題。文獻[5]在故障診斷過程中引入最小化最大均值差異(max mean discrepancy,MMD),進而減小不同域之間的分布距離。文獻[6]通過對不同域特征的多層域適配,以及利用偽標簽學習方法,使不同域之間的條件分布差異進一步減小,進一步提升了故障診斷精度。
上述文獻所提方法在一定程度上解決了數據樣本不足的問題。建立故障仿真模型得到相應仿真數據可在一定程度上得到設備故障樣本數據,但仿真數據和實際數據的依舊存在一定差異性。因此利用數值仿真得到故障數據并采用遷移學習領域自適應方法降低仿真數據與真實數據的差異性,能夠為缺少故障數據的診斷任務提供一種解決思路,有望在一定程度上解決故障診斷的實際問題。
本文根據軸承幾何參數建立滾動軸承故障動力學仿真模型,進而得到充足的軸承故障仿真數據構建遷移學習源域,然后利用遷移學習中領域自適應方法在實現不同域特征全局分布對齊的基礎上,對目標域樣本引入最大最小化分類器差異的對抗訓練方法,使不同域的特征實現更精確的子領域對齊,進一步提高了模型的泛化能力和對目標域的故障診斷精度。
軸承動力學模型建立參考文獻[7]方法。其依據軸承的幾何參數建立軸承動力學模型,然后引入軸承故障參數,通過解析軸承動力學方程獲得的振動數據。通過驗證仿真數據與凱斯西儲大學(CWRU)軸承實驗數據集數據在時頻域的差異對仿真模型的合理性進行驗證。
滾動軸承運動系統可視為四自由度運動系統,在軸承運動過程中僅考慮軸承內外圈在水平方向和豎直方向的位移,根據其動力學模型如圖1 所示,并對軸承的運動系統進行以下的簡化:(1) 在建立動力學模型時,忽略由于非線性因素導致的軸承非線性接觸力以及彈性流體潤滑的剛度和阻尼。(2) 軸承只在單一平面內運動,內圈與以定角速度ω轉動與軸一起繞z軸轉動,外圈固定。(3) 假定滾動體與內外滾道之間的接觸為Hertz接觸。(4) 不考慮滾動體以及保持架的質量以及轉動慣量。

圖1 軸承動力學簡化模型
考慮制造和安裝時誤差所導致的離心力對軸承動力學建模,得到動力學系統的動力學方程為
式(1)~式(4)中:min與mout分別為內外圈與其相連接部分質量之和,kg;cin與cout分別為內外圈等效阻尼,N·s/m;kin與kout分別為內外圈與其相連接部分的等效剛度,N/m;FX與FY為滾動體彈性力在x和y方向的分量,N;e為偏心距,m;ω為軸承內圈旋轉的角頻率,rad/s;g為重力加速度,m/s2;t為運動時間,s。
圖2 所示為滾動軸承的故障示意圖,其中滾動體故障包含滾動體分別與內外圈接觸,只列出內圈接觸情況,外圈接觸情況相似。

圖2 滾動軸承的故障示意圖
以內圈故障為例,滾動體在進入故障區域到離開故障區域時,滾動體與滾道之間的接觸相應會由突然消失到恢復[8]。接觸的變化也會造成接觸變形δi的變化。當引入故障后,滾動體i處的 δi為
利用游隙的瞬時變化來表征故障。如當內圈故障時:
式中: θin為內圈故障的角位置; ?di為內圈故障缺陷角。
當滾動體進入故障區域時,其產生的接觸變形H0實際是內圈與滾動體圓心的距離變化。
式中:rb為滾動體半徑;L為故障寬度;Dt內圈直徑;h為故障深度。由式(5)~式(7)可以求出軸承徑向變形 δi。由Hertz 接觸理論可知,第i個滾動體變形引起的彈性恢復力為
利用動力學方程求解出來的加速度信號與標準數據集的振動加速度信號進行對比,分別從時域和頻域信號進行對比。
利用Matlab 對動力學仿真模型進行建模,并利用ode45 方法對動力學方程進行求解,進而得到滾動軸承各種狀態下振動響應。如圖3 所示,為了更好地觀察時域數據的沖擊特性,對仿真與實際數據取100 ms 數據進行時頻域對比。在進行對比時,僅需定性分析時域數據的沖擊特性和頻域特性,所以將數據歸一化至[-1,1]。以內圈故障為例,由圖3a與圖3c 可知,實際與仿真的時域信號中單個故障周期為6.27 ms 和6.25 ms,相對偏差為0.32%,二者比較接近;當滾動體經過故障區域并且滾動體承受較大載荷時,沖擊較大,其周期分別為31.19 ms和31.17 ms,相對偏差為0.64%,二者比較接近。由圖3b 與圖3d 可知,在頻域中仿真數據與實際數據均包含轉頻(29.60 Hz、29.50 Hz)及轉頻的二倍頻、故障頻率(160.10 Hz、160.30 Hz)以及其二倍頻和兩側邊頻,二者關鍵特征頻率均較為接近。

圖3 仿真數據時域圖及包絡譜圖
圖4 為仿真數據中內圈故障與實際數據進行正態分布擬合,擬合參數均值和標準差分別為實際數據為0.003 9 和0.165 3、仿真數據為-0.122 4 和0.165 2,標準差較為接近但均值相差較大,其主要原因可能是:① 在建立動力學仿真模型時進行了較多簡化,如忽略了保持架和滾動體的影響,仿真時僅考慮較大的影響因素并不能與實際設備完全一致;② 在滾動體經過缺陷區域時,相應地載荷會有所變化;③ 實際環境中的不確定因素如噪聲的影響并不能在準確在仿真數據體現。實際數據與仿真數據的特征分布存在一定的差異,因此采用遷移學習進行故障診斷十分有必要。

圖4 仿真數據和實際數據正態分布擬合圖
無監督領域自適應是遷移學習的一種方法,通過學習源域和目標域共享的特征并且在源域和目標域之間進行知識遷移,進而改善診斷模型在目標域上的學習能力。分布不同的數據樣本,源域樣本為和目標域樣本可以分別表示為與Yt=其中xi為第i個源域樣本,yi為其對應的標簽,ns為源域樣本個數,xk為第k個目標域樣本,yk為對應的標簽,nt為目標域樣本個數[9]。
特征提取網絡的卷積塊中,在開始使用較大卷積核的尺寸來捕捉提取信號的全局特征;隨著網絡的加深,逐漸減小卷積核的尺寸以捕捉細粒度的局部特征。表1 為特征提取網絡的參數。

表1 特征提取網絡參數
由于本身誤差、運行條件以及噪聲等因素影響,源域仿真數據與目標域實驗數據之間分布存在著較大的差異源域仿真數據與目標域實驗數據之間分布存在著較大的差異。為了減小源域和目標域的數據特征差異,可考慮從數據邊緣概率分布自適應和條件概率分布自適應入手。
邊緣分布自適應通過減小源域和目標域之間的邊緣概率分布差異實現不同域之間分布差異。最大均值差異被廣泛用于度量遷移學習中源域和目標域的分布差異[10]。其直接從數據本身出發的特點,可以不考慮類別標簽,進而實現不同域特征的全局分布對齊。源域和目標域數據在特征提取網絡輸出層的邊緣概率分布分別為p(xs)和p(xt)的MMD 被定義為
式中: H為可再生核希爾伯特空間;?(·)為其相應的映射函數,這里取映射函數為高斯核函數。
條件分布自適應通過減小源域和目標域之間的條件概率分布差異實現不同域之間分布差異。雖然可以采用輸出偽標簽的方法來減小不同域特征的條件分布差異,但當不同域的數據分布差異過大時,偽標簽的準確率會下降,進而對模型的監督訓練產生影響[11]。本文最大最小化分類器差異的對抗學習策略,不直接去衡量不同域之間的條件概率分布,而是利用不同的分類器對目標任務的分類決策邊界進而實現源域和目標域的條件分布差異的減小。
本文提出建立特征提取模型并且將上述特征分布適配方法,整合到深度學習模型的訓練過程中,以減小仿真樣本與實驗樣本的特征分布差異。網絡模型如圖5 所示。

圖5 遷移學習網絡模型
對于2 個分類器,除了初始化參數不同外,其各自的全連接層采用不同的激活函數,使其輸出盡可能具有差異性。分類器網絡參數見表2。

表2 分類器參數
針對深度遷移學習模型主要分3 個階段進行訓練。具體流程如下所示:
首先,利用源域和目標域數據對特征提取器G和分類器C1、C2進行訓練。保證特征提取器和分類器對源域數據正確分類以及對目標域數據的邊緣分布適配。式(10)為該訓練過程所優化的目標函數,其中Lc為源域樣本上的交叉熵分類損失函數,可按式(11)計算。式(11)中:E()表示對所有源域樣本分類損失的期望;K為總類別數;Π[k=ys]表示類別的one-hot 索引值k和標簽ys一致時,值為1,否則為0;p(y|xs)為模型對第k個類別的預測概率;Lmmd為源域和目標域在特征層上的mmd 域適應損失。
然后,凍結特征提取器,訓練分類器。為了使分類器能夠更好地提取除目標域中分歧樣本,通過最大化未標記的目標樣本的預測差異來尋找源分布支持之外的目標樣本,同時最小化標記的源樣本的交叉熵來更新兩個分類器。此時模型訓練優化的目標函數表述為
式中:Ladv為目標域樣本在兩個分類器上的分類差異損失;其中E(.)表示對所有目標域樣本分類差異損失的期望;分類差異d()。
最后,凍結分類器,訓練特征提取器。將訓練好的分類器固定,訓練特征提取器以減小目標域樣本的分類差異,讓特征提取器在源域特征附近提取目標域樣本的相應特征,從而實現對源域與目標域數據的子領域對齊,此時訓練優化的目標函數為
使用滾動軸承仿真數據作為源域樣本,凱斯西儲大學軸承實驗數據作為目標域樣本,選取驅動端軸承,型號為SKF 6205-2RS 的實驗數據驗證上述方法有效性。實驗數據采用加速度信號,采樣頻率為12 kHz,每個樣本包含1 024 個采樣點。使用重疊采樣方法對樣本進行分割,每種狀態有500 個樣本。表3 為各數據樣本劃分情況以及標簽情況。在本方法做領域自適應遷移診斷時,訓練樣本(仿真數據)除了包括有標簽的源域數據樣本外,還需要無標簽(標準數據集數據)的目標域數據樣本參與訓練過程進行領域自適應。在訓練過程中,其中訓練集由不同域80 %的數據樣本組成,測試集為剩下20 %的目標域數據。

表3 數據樣本
將所提方法與無遷移學習模型以及其他主流的深度遷移學習模型進行結果對比分析,進而驗證所提方法的有效性。對比模型分別為:模型1 無遷移、模型2 DeepCoral[12]、模型3 深度自適應網絡(deep adaptation network,DAN)[13]、模型4 域對抗神經網絡(domain-adversarial training of neural networks,DANN)[14]、模型5 深度子領域自適應網絡(deep subdomain adaption network, DSAN)[15]。每個模型均進行10 次重復實驗取平均值,進而減小初始化模型的隨機誤差對診斷模型的影響。
采用深度學習框架Pytorch 構建診斷網絡,訓練時模型迭代輪數保持一致,設置訓練輪數為200輪,樣本個數batch 為32,采用Adam 梯度優化方法,學習率為0.005。
以模型在測試集上的平均診斷精度和某次結果混淆矩陣來比較各方法的診斷性能。見表4 和圖6 所示,在混淆矩陣中橫縱坐標分別為診斷模型預測的標簽信息和樣本真實的標簽,其中0、1、2、3 與表4 中標簽號對應。使用遷移學習的方法普遍高于無遷移學習模型。其中,DeepCoral、DAN、DANN 方法的平均診斷精度分別為56.42%、75.17%、72.67%,DSAN 方法的平均診斷精度為84.53%,高于前4 類方法,因為其將局部最大均值差異引入模型訓練,利用目標域偽標簽減小條件分布差異進而實現子領域自適應。本文所提方法的平均診斷精度為87.53%,且標準差相較于其他方法更低,模型穩定性較好,原因其在全局領域適配的基礎上,引入最大最小化分類器差異的對抗學習策略,進一步減小了源域和目標域特征的條件分布差異,更好地實現子領域的對齊。但各方法的準確率的標準差都較大,可能由于仿真數據相較于實驗數據的分布差異過大,導致模型訓練結果不穩定。

表4 不同方法平均診斷精度
采用t分布領域嵌入將降維過后的特征進行數據并實現特征可視化。圖7 中源域為S,目標域為T,NO、OF、IF、BF 分別代表正常、外圈故障、內圈故障、滾動體故障4 種故障狀態。上述對比方法的特征可視化結果可知,由于源域的訓練樣本帶有標簽,因此在采取遷移策略或不遷移時,源域數據不同故障類別的特征都可以得到有效區分。由圖7a 可知,在不使用遷移策略時,目標域的內外圈故障樣本大部分都混淆在一起,導致分類精度低。由圖7b~圖7d 可知,DeepCoral、DAN、DANN 這3 種方法可以將目標域類別的故障特征分得更加清晰,但仍存在混疊區域。由圖7e 可知,DSAN 考慮了目標域不同類別的子領域對齊,使特征類間距更小,不同類之間間距更大。由圖7f 可知,本文方法由于采用最大最小化分類器差異的域適配方法,能夠有效區分目標域不同類別之間的差異。但是也可以看出,源域目標域之間存在部分樣本的特征混疊和分類失敗結果,其主要原因是實際數據與仿真數據之間由于實際運行中不確定因素的影響導致分布差異過大。

圖7 各方法的特征可視化
本文針對實際工業生產中軸承故障樣本較少的問題,建立了滾動軸承動力學仿真模型,提出基于仿真數據和無監督領域自適應的軸承故障診斷方法。得到了以下結論:
(1) 采用動力學仿真的方法獲取源域數據實現對實際數據進行故障診斷,降低了對試驗臺的依賴,具有一定的實際意義。
(2) 通過無監督領域自適應方法,在實現不用域特征分布對齊基礎上,在目標域上引入最大最小分類器差異的對抗學習方法,進一步縮小了不同域特征的條件分布差異,增強了網絡模型的預適應能力。
(3) 通過在CWRU 軸承數據集上進行驗證并與不同的診斷方法進行對比,結果表明本文方法優于DAN、DANN、DSAN 等方法,但由于數據分布差異,模型診斷精度和穩定性依舊有可改進的空間。