邢如意,尹洪申
(1.江蘇聯合職業技術學院徐州財經分院,徐州 221008;2.中國礦業大學物聯網(感知礦山)研究中心,徐州 221008)
滾動軸承作為旋轉機械的重要組成部分,廣泛應用于工業生產的各個領域,而旋轉機械的健康運行取決于滾動軸承的健康狀況,雖然現有的滾動軸承制造技術已經取得了很大的進步,但是惡劣的運行條件仍然會給軸承帶來不同程度的損傷[1]。隨著損傷的不斷積累,可能會導致嚴重的事故,因此為了提高滾動軸承的可靠性,保證機械設備的安全運行,發展有效的故障診斷技術具有重要意義[2-3]。
深度學習作為一種有效的特征學習方法,已經廣泛應用于滾動軸承的故障診斷[4]。深度信念網絡(deep belief network,DBN)可以直接從低層信號中提取特征,形成更具代表性的高層表征,無需研究人員從數據中手動提取特征。謝佳琪等[5]利用改進的DBN處理原始軸承振動信號,實現了軸承故障的自動識別。卷積神經網絡(convolutional neural networks,CNN)由于其局部感受野和參數共享的特點可以大大降低故障數據的復雜性。在一維CNN的基礎上,康濤等[6]通過多路輸入最大化CNN的特征提取能力,有效地提高了模型的準確性和抗干擾能力。雖然深度學習網絡表現出良好的性能和穩定性,但這些網絡模型方法依賴于兩個前提條件:①訓練集和測試集的數據必須符合同一概率分布;②在訓練網絡的過程中需要足夠的數據。然而,在機械設備運行過程中,滾動軸承的健康狀態會隨著時間發生變化。導致故障數據特征在不同時間段的分布不同,這種現象使得訓練好的深度網絡無法長時間對同一任務保持良好的效果[7]。
為了解決上述問題,域自適應遷移網絡被引入到跨域軸承故障診斷任務中。CHEN等[8]提出了一個基于殘差聯合適應對抗網絡的無監督遷移學習框架,該方法在行星齒輪箱數據和滾動軸承數據兩個實驗中取得了良好的效果,但上述網絡只關注了類標簽信息和域標簽信息而忽略了連接源域與目標域之間的數據結構信息;WEN等[9]使用3層稀疏自動編碼器來提取原始數據的特征,并應用最大平均差異(maximum mean discrepancy,MMD)來最小化訓練數據和測試數據特征之間的差異懲罰,提升了變工況下軸承故障診斷準確率,但MMD是全局自適應的對齊兩域數據分布,沒有考慮類別之間特定域的決策邊界。
針對以上問題,本文提出了一種基于域對抗圖卷積注意力遷移學習的故障診斷方法。利用圖卷積網絡對實例圖進行建模,完善深度網絡提取的特征信息,同時利用LMMD度量不同領域的實例圖的結構差異,對齊子域和全局域之間的分布,實現變工況場景下的精準故障分類。
常見的SE和CBAM注意力模塊只能沿著信道或空間維度提取特征,生成1D或2D權重,限制了它們學習變化的信道和空間注意力權重的靈活性[10-11]。而SimAM注意力模塊直接生成三維權重注意模塊,利用通道和空間共存機制并共同促進信息數據的選擇。并且為了更好地評估每個神經元的重要性,SimAm模塊通過導出一個能量函數傳遞來找尋每個神經元的重要性[12]。
(1)


圖1 SimAM模塊結構圖
域特征分布對齊通過測量空間距離來確保源域和目標域的特征分布應該相似,而域對抗網絡(domain-adversarial training of neural networks,DANN)的思想來源于生成對抗網絡,通過對抗性訓練確保了神經網絡可以提取領域不敏感的特征信息[13-14]。DANN主要由特征提取器Gf、域鑒別器Gd和故障分類器Gy組成。DANN網絡流程如圖2所示,首先源域與目標域數據進入Gf后被映射到一個特征空間中并提取兩域特征信息;其次將提取后的源域數據送入Gy中區分正確的數據標簽;然后將提取的兩域數據經過梯度反轉層進入Gd中得到域分類標簽。DANN網絡的一方面希望Gy能夠精準的分類源域數據特征類型,保證故障分類器損失最小;另一方面希望Gd無法準確區分兩域數據特征類型,使得域鑒別損失越大,通過這種方式對齊兩域之間數據特征分布。

圖2 DANN網絡模型圖
在以往的跨領域故障診斷任務中,基于MMD準則來度量不同領域特征分布的相似性是一種非常有效的方法,然而MMD是全局域特征分布的排列,其忽略了源域和目標域之間的子域關系,考慮到同類樣本之間的相關性,本文引入LMMD來對齊同類相關子域之間的分布。
MMD總是通過全局數據來對齊子域之間的分布,容易造成子域類別匹配錯誤,從而導致域自適應模型性能下降。而LMMD通過深度特征自適應和特征學習來匹配源域和目標域之間的分布,減少了相關子域的差異分布,實現了子域級別細粒度的對比。LMMD的表達式為:
LMMD2(Ds,Dt)Ec
(2)

GCN是CNN的延伸拓展,是一種專門處理無規則數據結構的卷積網絡。假設一張圖G(A,X),其中A代表它的鄰接矩陣,X代表它的節點特征。它的對稱歸一化圖的拉普拉斯矩陣L=IN-D-1/2AD-1/2,其中D是A的對角度矩陣,IN是單位矩陣。圖譜濾波器gθ=diag(θ)對輸入信號x∈RN進行平滑處理后可以得到新的圖卷積定義,其表達式為:
gθ*x=UgθUTx
(3)
式中:θ代表可學習的參數,UTx代表節點x在圖中做的傅里葉變換,Ugθ代表將卷積核映射到頻域。
但是式(3)的圖卷積操作依賴于L的特征分解,因此運算十分復雜,為了解決這個問題,采用特征值對角矩陣的切比雪夫多項式逼近卷積核,得到新的卷積核表達式:
(4)
式中:k是切比雪夫多項式的階數,Λ是L的特征值對角矩陣。通過重新定義的GCN操作,對k鄰距離內的節點信息進行聚合,能夠實現圖平滑,提升計算速率。
標準的GCN只能在固定的感受野聚集信息,容易忽略中心節點與相鄰節點之間的漸變特征差異,從而造成網絡特征提取不足的問題。因此本文結合SimAM注意力模塊,提出了一種基于多感受野SimAM注意力圖卷積網絡。首先,將原始軸承信號送入Resnet18網絡提取故障特征;其次,在Resnet18網絡中加入SimAM注意力機制,提高網絡對關鍵信息特征的敏感度;然后,增加GCN的感受野聚合相鄰節點相對于中心節點的漸變特征,通過融合了它們之間的特征差異,提升網絡整體的故障特征提取能力,MRF-GCN網絡結構參數如圖3所示。

圖3 MRF-GCN網絡結構參數圖
為了解決因源域和目標域數據分布差異過大而導致的模型診斷能力不足的問題,將DANN和LMMD相結合,利用DANN網絡提升兩域數據深度特征的表達一致性,同時利用LMMD對兩者高維核空間的數據分布進行約束,減少模型在子域中的分類誤差,提升了網絡模型在變工況下的故障分類能力。本文提出的DAGRESL故障診斷模型如圖4所示。

圖4 變工況下DAGRESL故障診斷網絡模型圖
由圖4可知DAGRESL總的損失函數由3部分組成:標簽分類損失Lc;LMMD損失LLMMD;域判別損失Ld。DAGRESL損失表達式為:
LDAGRESL=Lc+LLMMD-λLd
(5)
首選,將兩域原始軸承數據輸入到Resnet18網絡中提取軸承故障特征;其次,利用SimAM注意力模塊的通道和空間并存機制共同促進關鍵特征信息數據的選擇,從而得到最終的故障特征;然后,將每個特征向量視為一個節點,其值作為節點特征,送入圖生成層自動生成圖形;同時將獲得的圖形輸入到MRF-GCN,將數據結構信息嵌入到節點特征中。最后,將獲得的節點特征用于故障分類和領域對抗訓練并完成最終的故障分類。
實驗數據通過CT1002LS加速度傳感器在8 kHz的采樣頻率采集了SQI-MFS實驗臺的軸承振動數據,SQI-MFS實驗臺如圖5所示。實驗軸承的型號為NSK的SER205-16,為了更好的驗證模型對不同軸承損傷類型的故障分類準確率,用激光分別在內圈、外圈、滾動體加工雕刻了0.05 mm、0.1 mm、0.3 mm的直徑缺陷。同時根據電機的轉速不同共計采集了900 r/min、1200 r/min、1800 r/min三種轉速下的正常軸承數據、內圈損傷數據、外圈損傷數據、滾動體損傷數據,分別記為數據集D1、D2、D3。3種軸承數據集詳情數據如表1所示。

表1 SQI-MFS實驗臺軸承數據

圖5 SQI-MFS實驗臺
為了測試DAGRESL故障診斷網絡在變工況下的軸承故障分類準確率,對D1、D2、D3三種數據集進行相互遷移,共計設置了6種工況遷移,并分別與已有的深度遷移學習方法進行比較:MK-MMD[15]、DANN[16]、DSAN[17]。4種方法的實驗結果圖6所示。
從圖6可知,本文提出的DAGRESL模型不僅在各個遷移工況中的故障分類準確率要高于其他3種模型,而且模型的穩定性更好。這是因為其他3種模型僅關注標簽分類信息和域標簽信息,而忽略了數據結構建模,導致深度網絡提取的特征信息并不完整,從而造成變工況故障分類性能下降。
為了證明本文加入的LMMD度量距離和SimAM注意力模塊對DAGRESL模型性能的提升,通過消融實驗進行了驗證。DAGRES與DAGRESL模型相比沒有加入LMMD度量距離;DAGREL與DAGRESL模型相比沒有加入SimAM注意力模塊。消融實驗結果如圖7所示。

圖7 SQI-MFS數據集變工況消融實驗結果
從圖7可知,在加入LMMD度量距離后,DAGRESL模型兼顧了目標域中不同類別的子領域距離,使特征類間距更小,從而統籌對齊了子域和全局域之間的分布,實現了變工況場景下的精準故障分類;在加入SimAM注意力模塊后,特征提取網絡利用通道和空間并存機制共同促進信息數據的選擇,聚焦更加具有判別力的關鍵特征信息,從而提高了DAGRESL模型在變工況場景下的故障分類準確率。
為了更加清晰的分析3種方法在各個標簽的分類結果,通過混淆矩陣對D2-D1的遷移工況任務進行詳細的分析。圖8為3種模型混淆矩陣消融實驗結果。

(a) DAGRESL (b) DAGRES
從圖8可以看出,DAGRESL在各個標簽的分類結果都要優于其他兩種模型,再次證明了DAGRESL模型設計的合理性。在加入LMMD距離后,DAGRESL模型通過對齊子域和全局域之間的分布,有效減少了兩域數據之間的分布差異;在加入SimAM注意模塊后,DAGRESL模型對全局關鍵信息特征賦予更高的權重從而豐富特征提取網絡,大大降低了標簽錯誤分類的概率,進一步驗證了DAGRESL模型具有較強的變工況故障分類能力。
針對滾動軸承在變工況環境中網絡特征提取能力不足的問題,本文提出了一種基于域對抗圖卷積注意力遷移學習的故障診斷方法,并在SQI-MFS軸承數據集上進行了驗證,通過實驗我們可以得出以下結論:
(1)提出的MRF-GCN能夠有效聚合相鄰節點相對于中心節點的漸變特征,融合它們之間的特征差異,提升網絡整體的故障特征提取能力。
(2)利用SimAM注意模塊的通道和空間并存機制共同促進特征信息數據的選擇,聚焦更加具有判別力的關鍵特征信息,豐富了故障特征提取網絡模型。
(3)將LMMD與域對抗網絡相結合能夠減少相關子域和全局域之間的結構差異,更好的判斷軸承數據所屬域。