














摘 要:針對實際工程中行星齒輪箱故障數據有限、診斷準確率不高的問題,提出一種基于自注意機制膠囊網絡的故障診斷方法。直接將采集到的行星齒輪箱振動信號作為輸入,用首層寬卷積層提取淺層特征,過濾輸入中的高頻噪聲;引入自注意機制關注信號關鍵特征;再次將所提特征輸入膠囊層,進一步提取特征并實現故障分類;采用行星齒輪箱實驗平臺數據對所提方法進行實驗驗證。實驗結果表明:在樣本數量有限的情況下,所提方法仍能取得不錯的診斷準確率。
關鍵詞:行星齒輪箱;故障診斷;膠囊網絡;自注意機制;小樣本
中圖分類號:TH132.425 文獻標志碼:B 文章編號:1671-5276(2024)04-0067-04
Fault Diagnosis of Planetary Gearboxes Based on Self-attentive Mechanism Capsule Network
NIE Songya, CHEN Zewang, YANG Lin, WANG Youren
(College of Automation Engineering, Nanjing University of Aeronautics and Astronautics, Nanjing 211106, China )
Abstract:A fault diagnosis method based on self-attentive mechanism capsule network is proposed to solve the problems of limited fault data and low diagnosis accuracy for planetary gearboxes in practical engineering. The acquired planetary gearbox vibration signal is directly used as the input to extract primary features through the first wide convolutional layer and filter the high-frequency noise in the input.The self-attentive mechanism is introduced to focus on the key features of the signal. The proposed features are input into the capsule layer to further extract features and achieve fault classification.The proposed method is verified by the data of planetary gearbox experimental platform. The results show that the proposed method can still achieve good diagnostic accuracy with limited samples.
Keywords:planetary gear box; fault diagnosis; capsule network; self-attention mechanism; small sample
0 引言
行星齒輪箱因其輕巧高效的特點,普遍應用于各類國計民生行業中[1]。在實際應用中,行星齒輪箱因為長期服役極易產生故障,因此,及時的故障診斷是至關重要的。由于齒輪箱內部結構復雜,受力多變,導致所采集振動信號傳遞路徑繁復[2],而傳統機器學習方法需疊加信號處理技術,依賴豐富專業知識,仍難以實現智能故障診斷。
深度學習近年來飛速發展,由于其特征學習能力強,特征提取自適應,降低了人為操作帶來的不確定性[3],因此廣泛應用于智能故障診斷。文獻[4]利用1D-CNN直接從原始振動信號中提取特征,實現電機故障智能診斷。文獻[5]為提高CNN在復雜多變環境下故障診斷能力,引入VMD算法,實現信號同步濾波和數據增強的功能。文獻[6]采用短時傅里葉變換處理時域信號,再將所得時頻圖輸入卷積神經網絡進行特征提取,實現故障診斷。但上述方法皆需大量數據,而由于齒輪箱定期檢修維護,無法獲取足夠多的故障數據。膠囊網絡采用膠囊神經元,不同于卷積神經網絡采用的標量神經元,捕獲信息更加豐富,可以識別輸入樣本中的微小改變,在所用數據集較小的情況下也能捕獲較多特征。因此,在小樣本故障診斷領域方面備受關注[7-8],但僅用單卷積層的膠囊網絡特征提取并不全面。
針對上述問題,本文提出了一種基于自注意機制膠囊網絡的故障診斷方法,以應對模型訓練過程中樣本不足的情況。該方法將一維振動信號直接輸入所提模型中,利用所提的自注意機制膠囊網絡自動提取行星齒輪箱振動信號特征。首先使用寬卷積層濾去一維振動信號中混雜的高頻噪聲;然后將所提特征輸入自注意機制層,削弱無關信息,關注重點特征;最后,利用膠囊網絡提取精細特征并給出最終分類結果,以實現小樣本下行星齒輪箱智能故障診斷。
1 相關網絡理論
1.1 膠囊網絡概述
卷積神經網絡因其優越的學習能力在故障診斷領域被廣泛使用。但由于其池化層的存在,限制了網絡的空間特性,會造成局部特征信息丟失。為解決上述問題,SABOUR等[9]于2017年提出了膠囊網絡(capsule network,CapsNet),進一步提升神經網絡的上限。區別于傳統神經網絡使用向量神經元,膠囊網絡使用膠囊神經元作為網絡的輸入與輸出,并且引入了動態路由機制將信息從低層膠囊傳遞到高層膠囊。
膠囊網絡核心在于動態路由機制,具體操作如圖1所示。該操作可以分為3個步驟:首先,每個輸入向量乘以權重得到預測向量,表達式如下:
uj|i=Wijui(1)
式中:uj|i為預測向量;Wij為權值矩陣;ui為第i個輸出的初級膠囊。
其次,由uj|i加權求和獲得輸出向量Sj,具體表達式如下:
式中:cij為耦合系數;bij為uj|i與Sj之間的對數先驗概率。
最后,引入向量壓縮函數squash函數來代替傳統神經網絡中的激活函數,使向量保持原始方向不變,且長度在(0,1)之間。具體表達式如下:
式中:vj為最終輸出數字膠囊;Sj表示獲得原向量的模長。
1.2 自注意機制
在利用卷積層進行淺層特征提取的時候,感受野具有局部性,無法獲取輸入信號中的全局特征。而為了更好地提取整個旋轉周期中的故障數據,全局特征至關重要。自注意力機制借鑒了生物觀察行為的過程,結合了內部經驗與外部感知,增強了局部精細程度觀察。它能夠讓模型更著眼于重要特征信息,提高任務處理的效率和準確性。其函數實質是一個查詢向量在一組鍵值對上的投影,計算步驟如下:
1)將輸入數據轉換為嵌入向量;
2)將嵌入向量分別乘上3個權重矩陣,得到查詢向量、鍵向量和值向量;
3)計算查詢向量和每個鍵向量的相似度,其結果作為每個輸入特征在自注意力機制中的權重;
4)使用softmax函數將這些權重和歸一化至0~1之間;
5)最后將計算出的權重和對應的值向量進行加權求和,即得到自注意力結果。
2 自注意機制膠囊網絡模型及故障診斷流程
2.1 自注意機制膠囊網絡模型
膠囊網絡由于其利用向量獲取特征,具有保留空間信息的特性,在旋轉機械故障診斷領域中被廣泛研究。但在故障樣本數量極小的情況下,現有的單卷積層膠囊網絡模型不足以提取足夠的故障敏感特征對行星齒輪箱故障進行診斷。因此,本文提出一種帶自注意機制的膠囊網絡模型,進一步挖掘膠囊網絡潛力,以更適用于實際應用中。本文所提模型由寬卷積層、卷積層、自注意機制層、初始膠囊層、數字膠囊層組成。網絡的輸入為一維振動信號。該網絡旨在進行故障診斷,網絡的具體結構如圖2所示。
2.2 行星齒輪箱故障診斷流程
帶自注意機制的膠囊網絡行星齒輪箱故障診斷方法流程如圖3所示。該流程的具體操作步驟闡述如下:
1)數據采集:通過傳感器獲取行星齒輪箱在各種健康狀態下的振動信號;
2)數據預處理與數據集劃分:將收集到的振動信號分割成不同樣本,使每個樣本都能包含齒輪轉動一圈的信息,并將分割好的樣本劃分為訓練集和測試集;
3)模型搭建:搭建帶自注意力機制的膠囊網絡模型,設置模型參數并選取恰當的激活函數;
4)模型訓練:將訓練集送入所提模型進行訓練,并采用Adam優化器優化訓練模型;
5)故障診斷:將測試數據輸入訓練好的模型中進行故障診斷并輸出最終結果。
3 實驗驗證與結果分析
3.1 實驗臺搭建及其數據采集
采用的行星齒輪箱故障模擬實驗平臺如圖4所示。該實驗平臺由變速驅動電機、平行齒輪箱、振動傳感器、行星齒輪箱和磁粉制動器組成。其中行星齒輪箱內包含1個太陽輪和3個行星輪,箱內各零部件詳細參數如表1所示。
為了模擬齒輪不同程度的損傷,太陽輪點蝕故障和行星輪裂紋故障的幾何參數分別設置如表2、表3所示的3種尺寸,其中裂紋深度為不同斜深度。具體故障位置如圖5、圖6所示。
為了實現轉速與負載的變化,借助控制臺調節驅動電機轉速與磁粉制動器電流以模擬行星齒輪箱在多種工況下運行。實驗采集了共195種工況下的數據:15種轉速600~2 000r/min,每次遞增100r/min;13種負載0~27Nm,每次遞增2.25Nm。使用的數據采集器型號為uT3604FRS-ICP,設置的采樣率為40 960Hz,采樣時間為25.6s。
實驗選取轉速為1 200r/min、載荷為9Nm工況下采集的振動信號作為實驗數據。用滑動窗口對時域信號截取樣本,設置窗口長度為2 048,步長為512,確保每個樣本包含足夠信息。最終截取各類狀態樣本分別為400個,具體信息如表4所示。
在本實驗中,分別從表4每類樣本中抽取3、6、9、12、18、30、60個組成訓練集,模擬故障樣本有限的情況,另取每種健康狀態樣本60個組成測試集。
3.2 故障診斷結果分析
為了驗證所提方法的優越性,將所提網絡分別與膠囊網絡、WDCNN+自注意機制、WDCNN進行對比。其中,對比網絡均與所提網絡中對應結構參數一致。所有算法優化均采用Adam優化器,其初始學習率設置為0.001,衰減速率設置為0.01,并采用Keras深度學習框架,計算機配置為Windows10系統、intel core i5處理器。各模型均訓練10次,取其平均值為最終診斷準確率,所得結果如圖7所示。
由圖7可知,4種方法診斷準確率均隨樣本數增加而提升,在樣本數達到210的情況下,各模型均能有效提取特征并獲得90%以上的準確率。但是在樣本數量較小(21、42、63)的情況下,使用膠囊網絡的模型所得結果明顯優于另外兩種模型。這主要是因為膠囊網絡有很強的細節特征提取能力。在訓練樣本數僅為21的情況下,膠囊網絡準確率為75.89%,而所提方法準確率高達83.66%,表明自注意機制能關注到對故障更加敏感的特征,提高了模型識別能力。綜上分析,所提方法集膠囊網絡與自注意機制的優勢于一體,能更好地處理有限樣本數據。
為了更直觀地看出各故障模式的分類準確率,圖8展示了訓練集樣本數為126時對所提方法隨機進行一次實驗其結果的混淆矩陣。其中,橫軸代表測試集預測標簽,縱軸代表測試集真實標簽,主對角線代表所提模型對各類別預測準確率。
該次所獲得的診斷準確率結果為99.29%,從圖8中可以看出,各類故障模式的識別準確率可達95%及以上,均取得了較高的結果,證明了所提模型的有效性與優越性。
由于深度學習“黑箱”的特征,其學習過程難以表述,為了直觀顯示特征提取結果,對膠囊網絡和所提方法最終的輸出進行可視化,如圖9所示。圖中0為正常,1—6為不同的故障類型(本刊黑白印刷,相關疑問咨詢作者)。可以看出,所提自注意機制膠囊網絡模型可以使同類樣本聚集更緊湊,各類之間空間分布差異更大,并且所提模型更易將故障1、故障2及故障5、故障6區分開來。這意味著所提模型能更好區分不同程度損傷故障。
4 結語
本文提出了一種基于自注意機制膠囊網絡故障診斷方法,由實驗所得結論如下:
1)在數據樣本不足的情況下,自注意機制膠囊網絡分類準確率明顯優于其他模型,證明所提方法故障診斷性能極佳;
2)t-SNE可視化結果表明,自注意機制膠囊網絡能更好地捕獲易于區分的故障特征,在特征學習方面更加高效智能。
參考文獻:
[1] 邱星輝,韓勤鍇,褚福磊. 風力機行星齒輪傳動系統動力學研究綜述[J].機械工程學報,2014,50(11):23-36.
[2] 陳雪峰,郭艷婕,許才彬,等. 風電裝備故障診斷與健康監測研究綜述[J]. 中國機械工程,2020,31(2):175-189.
[3] HAN T, LIU C, WU L, et al. An adaptive spatiotemporal feature learning approach for fault diagnosis in complex systems[J]. Mechanical Systems and Signal Processing, 2019, 117: 170-187.
[4] INCE T,KIRANYAZ S,EREN L,et al. Real-time motor fault detection by 1-D convolutional neural networks[J]. IEEE Transactions on Industrial Electronics,2016,63(11):7067-7075.
[5] XU Z, LI C, YANG Y. Fault diagnosis of rolling bearing of wind turbines based on the variational mode decomposition and deep convolutional neural networks[J]. Applied Soft Computing, 2020, 95: 106515.
[6] 余傳糧,梁睿君,冉文豐,等. 基于STFT和CNN的齒輪箱故障診斷[J]. 機械制造與自動化,2022,51(3):152-154,195.
[7] HAN T, MA R, ZHENG J. Combination bidirectional long short-term memory and capsule network for rotating machinery fault diagnosis[J]. Measurement, 2021, 176: 109208.
[8] LI D C, ZHANG M, KANG T B, et al. Fault diagnosis of rotating machinery based on dual convolutional-capsule network (DC-CN)[J]. Measurement, 2022, 187: 110258.
[9] SABOUR S,FROSST N,HINTON G E. Dynamic routing between capsules[EB/OL]. (2017-11-07)[2022-11-25]. https://arxiv. org/abs/1710.09829. pdf.
收稿日期:20221125