唐世鈺, 童靳于,2, 鄭近德, 潘海洋, 伍 毅
(1. 安徽工業大學 機械工程學院,安徽 馬鞍山 243032;2. 安徽省智能破拆裝備工程實驗室,安徽 馬鞍山 243032)
滾動軸承作為機械傳動系統的關鍵零部件,在復雜多變的工況下長期運行后,不可避免地會出現各種故障,可能影響整機的性能,導致嚴重的安全事故。因此,準確、自動地診斷滾動軸承中可能發生的不同故障具有重要意義[1-2]。
隨著計算技術的發展,支持向量機(support vector machine, SVM)[3]、K近鄰算法[4]等傳統的機器學習方法,已被應用于故障診斷領域。這些機器學習方法往往需要結合人工經驗選取特征,計算耗時且準確率不高。
2006年,Hinton等[5]首次提出了深度學習的概念。與傳統的機器學習不同,深度學習可以實現端到端的學習,在進行學習前不需要進行特征提取等操作,通過加深網絡結構即可實現從原始數據中自動提取特征的目的[6]。其中,自動編碼器(auto-encoder, AE)[7]、卷積神經網絡(convolutional neural network, CNN)[8]、深度信念網絡(deep belief network, DBN)[9]等已被廣泛應用于故障診斷中。例如,文獻[10]將卷積DBN應用于電力機車軸承的故障診斷。文獻[11]采用一維CNN從原始信號中學習特征,用于電機的故障診斷。文獻[12]設計了一種基于稀疏AE的故障診斷模型用于識別感應電動機的故障類別。
在深度學習中,一般通過增加網絡的層數來提高模型的性能[13]。然而,網絡層數的增加會阻礙梯度的流動,加大參數優化的難度,進而導致故障診斷準確率降低。He等[14]提出了深度殘差網絡(deep residual network, ResNet),其核心是使用快捷連接避免了梯度爆炸和消失,緩解了參數優化的困難。近年來,ResNet及其變體被應用到故障診斷領域。例如,Zhao等[15]使用ResNet融合多組小波包系數進行故障診斷。Zhang等[16]提出了一種基于混合注意力機制的ResNet方法,其在振動信號的時頻特征提取、頻帶信息增強和識別精度提高等方面具有優異的性能。ZHAO等[17]提出了一種深度殘差收縮網絡(deep residual shrinkage network, DRSN),DRSN將軟閾值作為收縮層引入ResNet的殘差單元(residual building unit, RBU)中,可以過濾掉信號中與噪聲相關的特征。
在DRSN方法中,由于軟閾值的局限性,使用軟閾值降噪的同時會過濾信號中與故障相關的特征,從而引起信號失真,導致故障診斷精度降低。為了解決上述問題,本文提出了一種改進的深度殘差收縮網絡(improved deep residual shrinkage network, IDRSN),并將其應用于滾動軸承故障診斷中。首先,引入了一種改進的半軟閾值函數(improved semi-soft threshold function, ISSTF),用于消除軟閾值函數在降噪過程中引起的信號失真。其次,設計了半軟閾值模塊(semi-soft threshold block, SSTB)和自適應斜率模塊(adaptive slope block, ASB)自適應地設置最優閾值,避免人工設定閾值的繁瑣和不合理。最后,將IDRSN應用于不同工況的滾動軸承故障診斷中。研究結果表明,與現有方法相比,所提方法不僅能夠有效診斷故障,而且診斷精度更高。
本文提出了一種改進的深度殘差收縮網絡IDRSN,并將其應用于滾動軸承的故障診斷中。
在信號處理領域,軟閾值處理經常被作為信號去噪的關鍵步驟[18]。一般情況下,傳統的去噪方法需要設計一個濾波器,將原始信號中有用的信息轉換為正或負的特征,將噪聲信息轉換為接近零的特征。但是,在這個過程中應該將哪些信息判定為有用信息,哪些信息判定為噪聲信息,這需要大量的專家經驗。DRSN首次將深度學習與軟閾值處理相結合,與ResNet的RBU層不同,DRSN中設計了殘差收縮單元(residual shrinkage building unit, RSBU)。RSBU層使用軟閾值化去除與噪聲相關的特征,將軟閾值作為一個非線性變換層插入到RBU層中,并利用注意力機制自適應地學習閾值。
軟閾值函數可以表示為
(1)
式中:x為輸入;y為輸出;τ為閾值。
從式(1)可以看出,經過軟閾值函數處理,數據仍具有良好的連續性,但當|x|≥τ時,y和x始終存在恒定偏差,這會造成一些有效信息的丟失,導致信號一定程度上的失真,進而降低診斷的準確性。
為了緩解DRSN中軟閾值函數的缺點,本文將一種半軟閾值函數ISSTF[19]引入DRSN中,ISSTF定義如下
(2)
軟閾值化和半軟閾值化過程如圖1所示。從式(2)和圖1可以看出,ISSTF首先保留了軟閾值函數的連續性,當|x|<τ時,ISSTF將近零的特征轉換為0,這與軟閾值函數相同。更重要的是,當|x|≥τ時,輸入和輸出呈現非線性關系,且隨著|x|增大,輸入和輸出的偏差逐漸減小,消除了軟閾值函數存在的恒定偏差問題,最大程度地保留了有效特征。

圖1 不同閾值函數對比圖Fig.1 Comparison chart of different threshold functions
本文提出了一種改進的深度殘差收縮網絡IDRSN。一方面,在降低信號中噪聲的同時更好地保留了有效信號;另一方面,實現了網絡自適應關注重要特征的目的。
1.2.1 網絡結構
IDRSN由輸入層、卷積層(convolutional layer, Conv)、多個改進的殘差收縮單元(improved residual shrinkage building unit, IRSBU)層和全連接層(fully connected layer, FC)組成,其網絡結構如圖2所示。

圖2 IDRSN的網絡結構Fig.2 Network structure of IDRSN
1.2.2 改進的深度殘差收縮單元(IRSBU)
在DRSN中,由于RSBU層的輸入和輸出存在恒定偏差,導致有效特征信息被過濾,進而造成故障診斷精度降低。本文針對DRSN中RSBU層的不足,設計了一種改進的殘差收縮單元IRSBU,如圖3所示。圖3中:C和W為特征圖的通道數和寬度。

圖3 IRSBU結構Fig.3 Structure of IRSBU
IRSBU單元使用改進的半軟閾值ISSTF代替RSBU單元中的軟閾值函數,將改進的半軟閾值作為一個非線性變換層插入到RBU中,去除與噪聲相關的特征,同時更好地保留有效信號。
此外,為了自適應設置最優閾值,避免人工設定閾值的繁瑣和不合理,IRSBU單元設計了半軟閾值模塊SSTB和自適應斜率模塊ASB。其中,SSTB模塊可以使閾值保持在一個合理的范圍內,ASB模塊可以更進一步修正半軟閾值。
SSTB與RSBU中所設計的閾值模塊結構基本相同。首先對特征x的絕對值使用GAP(global average pooling),得到一個一維向量;再將一維向量傳遞到兩層FC網絡中,得到一個尺度參數,其中第二層FC神經元個數等于輸入特征圖的通道數;然后在兩層FC網絡的末端應用一個Sigmoid函數,從而使尺度參數被縮放到(0,1)內。尺度參數可以表示為
(3)
式中:zc為第c層神經元的特征;σc為第c層的尺度參數。
那么,半軟閾值τc定義為
(4)
式中,i,j,c分別為特征圖X的寬度、高度和通道。學習到的半軟閾值τc為正,且保持在一個合理的范圍內。
ASB模塊利用注意力機制自動推斷出最合適的斜率。ASB模塊的輸出為
(5)
式中:a為自適應斜率因子;ac為第c層神經元的特征。
然后,利用ASB模塊的輸出進一步修正半軟閾值,表示如下
(6)
從上述過程可以看出,與RSBU相比,IRSBU能有效地去除與噪聲相關的特征,同時能更有效地保留有效信號,從而保留更多特征敏感信息。
基于IDRSN的故障診斷流程如圖4所示,具體步驟如下:

圖4 基于IDRSN的故障診斷流程圖Fig.4 Flow chart of fault diagnosis based on IDRSN
步驟1采集原始時域振動信號。
步驟2按照一定比例,將原始時域信號隨機劃分為訓練集和測試集。
步驟3使用訓練集訓練IDRSN,設置訓練參數,使用反向傳播算法對網絡參數進行微調,直到誤差收斂。
步驟4將測試集輸入到IDRSN模型中,獲得測試精度。
本章采用兩個不同試驗臺數據集驗證所提方法的可行性和優越性,分別為凱斯西儲大學(Case Western Reserve University, CWRU)滾動軸承數據集[20]和安徽工業大學自制數據集。其中,試驗一為恒定轉速數據集,試驗二為變轉速數據集。
2.1.1 試驗一
試驗一為CWRU的滾動軸承實驗,試驗臺如圖5所示。試驗的軸承型號為SKF6205-2RSJEM,通過電火花加工技術設置單點故障。選取負載為745.7 W,采樣頻率為12 kHz轉速為1 772 r/min工況下的滾動軸承振動信號,包含10種健康狀態:故障直徑為0.177 8 mm,0.355 6 m,0.533 4 mm的內圈故障(分別標記為IR1,IR2,IR3),故障直徑為0.177 8 mm,0.355 6 mm, 0.533 4 mm的外圈故障(分別標記為OR1,OR2,OR3),故障直徑為0.177 8mm,0.355 6 mm,0.533 4 mm的滾動體故障(分別標記為BA1,BA2,BA3)和正常狀態(標記為NO)。不同健康狀態下的軸承振動時域信號如圖6所示。

圖5 凱斯西儲大學軸承試驗平臺Fig.5 Bearing test platform of CWRU

圖6 試驗一滾動軸承振動時域信號Fig.6 Time domain signal of rolling bearing vibration of test 1
2.1.2 試驗二
試驗二采用自制滾動軸承故障模擬試驗臺,由變頻電機、加載裝置和待測滾動軸承等零部件組成,其結構如圖7所示。待測滾動軸承型號為SKF6205,采用線切割技術在內、外圈、滾動體和保持架上加工出不同程度的故障,故障類型如圖8所示。

圖7 軸承故障模擬試驗裝置Fig.7 Bearing failure simulation test device

圖8 不同健康狀態的滾動軸承Fig.8 Rolling bearings in different health conditions
采用振動加速度傳感器采集負載為1 kN,轉速從100 r/min經過20s加速至1 500 r/min工況下的滾動軸承振動信號,采樣頻率設置為10 kHz,包含10種健康狀態:故障深度為0.3 mm,0.5 mm的內圈故障(分別標記為IR1,IR2);故障深度為0.3 mm,0.5 mm的外圈故障(分別標記為OR1,OR2);滾動體點蝕(標記為BA);滾動體點蝕+外圈0.3 mm,內外圈0.3 mm和內外圈點蝕的3類復合故障(分別標記為C1,C2,C3);保持架斷裂(標記為BCJ)和正常狀態(標記為NO)。不同健康狀態下的軸承振動時域信號如圖9所示。

圖9 試驗二滾動軸承振動時域信號Fig.9 Time domain signal of rolling bearing vibration of test 2
分別選取試驗一和試驗二的滾動軸承振動信號,在同一故障類型下,每類故障隨機取100個樣本,每個樣本包含1 024個點[21],試驗一和試驗二各制作了1 000個樣本。從中隨機抽取80%樣本用于訓練,20%樣本用于測試。試驗一和試驗二的軸承數據集分別如表1和表2所示。

表1 試驗一軸承數據集

表2 試驗二軸承數據集
IDRSN模型包括1個Conv層、12個IRSBU層、1個GAP層和1個FC層,網絡參數如表3所示。在IDRSN訓練過程中,參數設置如下:L2正則化系數設置為1×10-4,批大小為16,采用Adam優化算法,迭代次數為100次。

表3 IDRSN的網絡參數
本節采用消融試驗驗證IDRSN中所提模塊的可行性。試驗設置了兩個控制模塊:ISSTF和ASB,共設置了4種模型,不同模型的控制模塊如表4所示。其中,模型A為IDRSN,模型B是在IDRSN的基礎上移除ASB,模型C是在DRSN的基礎上加上ASB,模型D是DRSN。

表4 不同模型的變量設置
2.4.1 消融試驗結果
為了減少隨機因素對試驗結果的影響,每個模型做10次試驗,取10次試驗的平均值和標準差作為評估標準。試驗一和試驗二的10次消融試驗結果分別如圖10和圖11所示,10次試驗的平均準確率和標準差如表5所示。

表5 對比模型的平均準確率和標準差

圖10 試驗一消融試驗結果Fig.10 Results of ablation tests of test 1

圖11 試驗二消融試驗結果Fig.11 Results of ablation tests of test 2
2.4.2 消融試驗結果分析
從圖10、圖11和表5中可以看出,相較于模型D,模型B在兩個試驗中的平均準確率分別提高了1.05%和1.10%,且標準差減小了35.20%和15.71%,說明在IDRSN中,ISSTF能夠提高模型的診斷效果且使模型更穩定。相較于模型D,模型C在兩個試驗中的平均準確率分別提高了0.60%和0.70%,且標準差減小了20.00%和10.71%,說明ASB也能夠在一定程度上提高模型的診斷效果。上述對比結果說明,ISSTF模塊和ASB模塊均能提高模型的診斷性能和穩定性。
本節采用對比試驗驗證所提方法的優越性。對比模型為IDRSN,DRSN,ResNet,CNN和SVM。為了公平對比,5種模型均使用原始數據作為輸入,且DRSN,ResNet,CNN與IDRSN模型的網絡結構參數相同(見表3),SVM的核函數采用RBF函數,懲罰因子設置為1,核函數參數設置為0.125。
2.5.1 對比試驗結果
為了減少隨機因素對試驗結果的影響,每個模型做10次試驗,取10次試驗的平均值和標準差作為評估標準。試驗一和試驗二的10次對比試驗結果分別如圖12和圖13所示,10次試驗的平均準確率和標準差如表6所示。

表6 對比模型的平均準確率和標準差

圖12 試驗一對比試驗結果Fig.12 Comparative test results of test 1

圖13 試驗二對比試驗結果Fig.13 Comparative test results of test 2
2.5.2 對比試驗結果分析
從圖12、圖13和表6可以看出,作為傳統的機器學習算法,SVM平均準確率遠低于深度學習方法,說明傳統機器學習方法無法充分提取故障敏感特征。在幾種深度學習方法中,傳統CNN模型表現最差,主要原因是其他幾種模型采用的快捷連接方式極大地促進了梯度流動,減輕了參數優化的難度,從而使診斷性能更加穩定。
在試驗一中,與DRSN和ResNet相比,IDRSN的平均準確率分別提高了1.65%和2.45%,且標準差減小了68.80%和67.50%;在試驗二中,與DRSN和ResNet相比,IDRSN的平均準確率分別提高了2.10%和2.87%,且標準差減小了67.86%和71.34%。由此說明,IDRSN模型最大程度地減少了信號的失真,保留了更多的有效信號,具有較高的分類準確率和良好的穩定性。
對比試驗一和試驗二的結果可以發現,5種模型的平均準確率和穩定性都有不同程度的下降。這是因為試驗二使用了變轉速數據集,轉速的變化導致振動信號的特征差異變大,從而影響故障診斷精度。但在所有模型中IDRSN平均準確率下降最少,體現了IDRSN較好的魯棒性。
為了更直觀地分析IDRSN的故障診斷效果,利用t-分布領域嵌入[22]算法可視化二維空間中原始信號和IDRSN中Softmax層的高級特征。試驗一和試驗二的特征散點圖如圖14和圖15所示。從圖14、圖15可以看出,兩個試驗10類原始信號隨機分散在二維平面上,相互重疊,難以區分。而IDRSN在Softmax層提取到的特征聚類效果很好,輕易就能分辨,證明了IDRSN在恒定轉速和變轉速工況下均具有較高的識別精度。

圖14 試驗一特征可視化Fig.14 Feature visualization of test 1

圖15 試驗二特征可視化Fig.15 Feature visualization of test 2
本文提出了一種改進的深度殘差收縮網絡,并將其應用于滾動軸承診斷中,主要結論如下:
(1)本文使用的ISSTF閾值函數效果優于DRSN中的軟閾值函數,能夠在去除噪聲的同時更有效地保留故障敏感特征,增強了DRSN的性能。
(2)本文設計的SSTB和ASB模塊,可以自適應地設置閾值,進一步提升了DRSN的性能。
(3)通過兩種不同類型的滾動軸承試驗驗證了IDRSN在診斷準確率和穩定性方面更具優勢,特別是針對變轉速工況下的故障診斷更為有效。
雖然所提方法提高了滾動軸承的故障診斷性能,但半軟閾值函數的結構會增加模型計算的時間。因此,下一步工作將致力于模型優化和降低模型的復雜性。