張洪亮, 余其源, 秦超群, 王 銳, 張宇騰
(1.安徽工業大學 管理科學與工程學院,安徽 馬鞍山 243032; 2.蘇州大學 軌道交通學院,江蘇 蘇州 215131)
軸承作為旋轉機械的關鍵部件,一旦發生故障直接影響設備性能,甚至會造成安全事故。因此,精確地診斷軸承健康狀態對設備平穩運行有著重要意義。
隨著信息化技術的廣泛應用,各種工業場景下收集的振動數據,被越來越多地應用到故障監測中,這使得基于數據驅動的故障診斷技術得到了快速發展,并在實際生產中得到廣泛應用。傳統的故障診斷方法主要包含振動信號的預處理、特征提取和故障狀態分類3個部分。信號的預處理包括對采集到的信號進行降噪、頻域或時頻域轉換、數據的重采樣等;特征提取則是從預處理完成的數據中,提取不同類別的特征信息;故障分類多采用人工神經網絡、支持向量機、決策樹、隨機森林等典型分類技術。傳統方法雖然對提升故障診斷效果有一定價值,但存在數據預處理需要大量先驗知識、特征提取不充分、不同場景下的泛化性能差等不足。
近些年,由于深度學習的廣泛應用,診斷網絡往往可以表示為復雜目標函數與變量關系的深層結構,這使軸承故障診斷研究得到進一步發展。利用深度學習理論,研究者開發出了多種深層網絡模型用于故障數據的自適應學習,實現數據間非線性關系的深度挖掘,從而擺脫對專家知識的依賴。故障診斷中采用的經典深度學習方法主要包括自動編碼器、卷積神經網絡(convolutional neural networks,CNN)、深度殘差網絡、循環神經網絡、深度置信網絡及長短時記憶網絡。在上述方法中,CNN作為一種典型的多級前饋式神經網絡[1],有著利于模型訓練的稀疏連接結構和權值共享特性,因此被學者們引入故障診斷領域并開展了深入研究。Wen等[2]提出基于LeNet-5的CNN故障診斷方法,將原始信號轉換成二維圖像,消除了手工提取特征的不足。Zhang等[3]針對深度學習方法不能提取有效特征的問題,提出了利用短時傅里葉變換將原始信號轉換成二維時頻域輸入的方法,并采用改進的CNN完成高效分類。Xue等[4]提出從一維和二維結合的CNN并行結構中提取深度特征,然后采用融合策略進行連接,獲得了更可靠的診斷效果。Zhang等[5]提出一種基于深度CNN的多模型集成深度學習方法,實現了高維樣本的故障識別。
由文獻分析可知,軸承故障診斷研究多采用基于CNN及其改進的方法。該類方法通過構建深層次的診斷模型增強特征提取能力,在一定程度上提高了分類準確率,但隨著網絡深度的增加,模型訓練變得困難,難以進一步提高分類效果。一方面,深度網絡在訓練時會發生梯度彌散,出現過擬合;另一方面,該類網絡模型僅學習來自一個傳感器收集的信號數據,而其中包含的故障特征信息有限,使得模型難以適應恒定狀態以外的負載或轉速改變下的工作條件,這些因素使CNN在故障診斷領域的深入發展受到了限制。針對上述問題,He等[6]提出的殘差網絡通過在正向傳播中添加快捷連接,對深層網絡反向傳播時的梯度消失問題進行改善,增強了模型對深層特征的提取能力。Yang等[7]在卷積自動編碼器中引入殘差學習,提出殘差寬核深度卷積自動編碼器,提升了模型的去噪和特征提取能力。袁彩艷等[8]針對深度CNN中的信息傳遞差異,設計出卷積注意力改進的殘差密集網絡,實現了提取特征的重要性區分。此外,基于一維或二維CNN的多傳感器信息融合策略也被逐漸應用于故障診斷領域,以解決故障信號中包含的特性信息不足。Bai等[9]利用短時傅里葉變換得到不同傳感器采集信號的時頻圖像,然后將其融合并作為模型的多通道輸入。Zhang等[10]把來自不同傳感器的信號按一定長度切分為子序列,再將對應位置的序列疊加,轉換成多傳感器數據的灰度圖像作為CNN的輸入。Peng等[11]利用融合嵌入層,將每個傳感器的高級特征變為低維特征,實現了傳感器信號在特征維度的信息融合。由此可知,傳感器信號可在輸入層與特征層進行信息融合,不同的信號融合方式,可以體現模型數據流特征信息的差異性。
基于上述文獻的啟發,本文提出了一種多傳感器信息融合與雙連接注意力殘差網絡(multi-sensor signal fusion and double-connected attention residual network,MSF-DARN)的故障診斷方法。首先,以不同位置的傳感器為信號源,采用數據信息融合策略將單傳感器對應時間收集的振動信號,融合成多通道輸入。然后,設計了雙連接注意力殘差模塊,實現網絡對特征信息的差異性劃分,使提取到的故障特征更具有鑒別力,并通過堆疊該模塊加深網絡,實現模型對融合信號中隱含故障特征的深度挖掘。最后,利用全局平均池化來減緩深層網絡所帶來的梯度消失問題。通過兩個數據集下的變工況試驗,驗證了所提方法的有效性。
CNN是一種多隱層的前饋神經網絡,擁有強大的表示學習和特征提取能力,其基本結構包含卷積層、池化層、全連接層和輸出層。其中,卷積層與池化層構成了網絡的特征提取器,擁有共享權值和稀疏連接的特性;全連接層與傳統的前饋式神經網絡類似,通過處理在輸入數據中提取到的高維特征,實現具體的分類任務。
卷積層是整個CNN的核心模塊,它將卷積核與特征圖覆蓋重合的區域進行加權求和,然后使用激活函數進行非線性變換,得到對應的輸出特征值,同時利用稀疏連接和權值共享機制,遍歷整個輸入特征圖。具體數學表示如下
xi+1=f(wi?xi+bi)
(1)
式中:f(·)為卷積操作中使用的激活函數;?為卷積運算;wi為卷積核的權重系數;bi為當前卷積操作中的偏置;xi為卷積層的輸入;xi+1為經卷積運算后得到的輸出。
全連接層中,輸入與輸出的神經元相互連接,最終的輸出節點個數等于分類任務的類別數。為了實現多分類任務,選用softmax作為激活函數
(2)
式中:n為類別數;x為最后一層的輸出。通過softmax的處理,使得最后的輸出滿足分類任務類別個數且概率分布和為1。
全局平均池化(global average pooling,GAP)是對網絡最后一層卷積得到的特征圖,按通道計算每個特征圖平均值的操作,最終輸出維度與最后一層的特征圖相同。相比于全連接層,GAP直接實現了降維,大大減少了網絡訓練參數的數量,可以減少過擬合的發生的概率。計算過程見參考文獻[12]。
故障模式的判別往往需要利用信號數據的深層特征,而單一化的網絡結構很難完成對融合信號的深度特征學習。因此,針對多傳感器融合的數據輸入,有必要構建一個利于特征學習的深層網絡。但隨著網絡層數的增加,訓練過程會因深層結構出現梯度彌散導致失敗,而構成殘差結構的跳躍連接緩解了梯度消失問題,加快了訓練速度。基于此,本文采用殘差模塊作為加深診斷網絡的基本結構。同時,針對殘差網絡提取的通道特征進行差異性劃分,從而區別出不同通道特征信息的重要性,進一步提升故障判別的效果。
融合多傳感器信息的輸入數據包含大量故障特征信息,為了能有效提取其中的故障特征,本文采用可以對信號數據進行逐級學習的深度網絡來實現特征學習,從而挖掘出更豐富的抽象特征。此外,通過簡單的堆疊特征提取操作來加深網絡結構,容易導致訓練過程出現過擬合。因此,本文基于跳躍連接的思想構建出一個帶有雙連接的殘差模塊,利用該模塊來加深診斷網絡的深度。
如圖1所示,不同于傳統殘差網絡僅把輸入添加到與其同維度的卷積結果中,雙連接殘差網絡利用跳躍連接1將原始輸入并聯至第一層卷積的輸出,再利用逐點卷積擴充輸入維度,最后采用跳躍連接2與第二層卷積輸出相融合。通過反復重用前次的信息,克服單向信息流動帶來的梯度彌散,以此實現對輸入信息的深層次挖掘。

圖1 雙連接殘差網絡
設該模塊的輸入為x,并聯后的輸出為y,整個網絡的輸出為Y,則
y=f1(w1*x+b1)∪x,
Y=f2(w2*y+b2)⊕f3(w3*x+b3)
(3)
式中:f1,f2,f3為卷積操作的激活函數;w1,w2,w3及b1,b2,b3分別為對應的權重系數和偏置項。
由雙連接殘差模塊構成的診斷網絡可以提取大量的故障特征信息,但并不是所有的信息都有利于故障判別,為了區別所提取特征的重要性,本文引入了SE(sequeeze-and-excitation networks)注意力機制模塊[13],以獲取不同通道特征的權重系數,進而使學習到的特征更有利于故障識別。
SE模塊的結構如圖2所示,主要包括壓縮、激勵和乘積3個步驟。對于輸入特征圖U,SE首先在每個通道上執行GAP,即壓縮操作Fsq(·),它使H×W×C的輸入特征沿通道方向變成1×1×C的特征圖,計算過程如下

圖2 通道注意力機制
(4)
式中:c為壓縮的通道序號;zc為第c個通道壓縮后的值;uc(i,j)是i×j維的二維矩陣,i=1,2,…,H,j=1,2,…,H。
然后,利用激活操作Fex(·,·)學習每個通道的特征權值。該步驟是SE模塊建立通道特征與訓練效果相互關系的關鍵一步,目的在于使學習到的權值能夠激勵重要的特征映射,抑制不重要的特征映射。具體操作是在壓縮之后使用了兩層全連接構成的門機制來學習不同通道的權值,門控單元計算方法為
sc=σ[W2δ(W1zc)]
(5)
式中:δ為Relu激活函數;σ為sigmoid激活函數;W1,W2分別為兩個全連接層的網絡參數;sc是激活操作后得到的門控單元。
最后,通過乘積操作Fscale(·,·)輸出門控單元與輸入特征圖子圖uc的向量積
(6)

通過在雙連接殘差網絡的輸出中加入SE注意力機制,構成雙連接注意力殘差模塊(double-connected attention residual module,DARM),使模塊獲得對不同通道特征的重要性區分,提高特征學習的效率。
由于滾動軸承的實際運行環境復雜,數據的采集通常會受到強噪聲等不利因素的影響,從而導致CNN在特征提取過程中具有一定局限性。為了充分利用采集的振動信號以及CNN強大的特征提取能力,本文提出了傳感器信息融合與雙連接注意力殘差網絡相結合的滾動軸承故障診斷方法。利用傳感器信息融合策略可以收集更多的故障特征信息,同時,經注意力機制改進的雙連接殘差模塊,能有效挖掘融合信號中更抽象的深層故障特征,并改善深層網絡的梯度彌散與退化問題,有效實現網絡在復雜工況環境下的故障分類。
數據處理是故障診斷中的關鍵一步,為了盡可能地消除該環節對專家知識的依賴,本文采用多傳感器信息融合策略來提高模型輸入中包含的特征信息量。
3.1.1 數據轉換
試驗采集的數據均為一維時序數據,而由于CNN特殊的網絡結構,其在處理二維數據時更具有優勢[14]。因此,本文采用按固定長度截取一維信號,并逐行填充到二維數據中的方法來實現數據轉換。
(1) 歸一化操作。將原始數據歸一化到無量綱的同一范圍,可以防止訓練過程中的梯度消失,加快網絡收斂速度。歸一化操作具體方式為
(7)

(2) 數據格式轉換。一維原始數據轉換成二維格式的過程,如圖3所示。將長度為1 024的原始信號,按照32個采樣點為一段的方式進行截取,得到32個等長的片段。然后將截取的信號依次進行堆疊,最終得到一個3232的二維重構信號。

圖3 數據重構示意圖
3.1.2 多傳感器數據融合
本文中的振動信號來自3個放置在不同位置的傳感器,每個傳感器收集到的信號按照上述轉換方式得到數據格式為[32,32,1]的二維重構信號,其中1表示單通道。為有效利用來自不同傳感器的信息,本文將同一時刻收集的信息轉換成二維數據后,再由并聯方式實現不同位置所收集信號的融合,形成多通道輸入,從而增加模型輸入包含的故障特征信息。融合后的輸入數據格式為[32,32,3],其中3表示三通道。
本文提出的傳感器信息融合與雙連接注意力殘差模塊相結合的軸承故障診斷模型結構,如圖4所示。該方法對原始數據的處理不依靠專家經驗和手工特征提取,只要將原始數據輸入診斷模型,網絡通過學習數據特征就能自動地輸出診斷結果,實現了“端到端”的故障診斷流程。在圖4中,經預處理后的多通道輸入,首先經過兩個寬核卷積神經網絡,以提取故障信號中的淺層特征;然后將提取的特征輸入由3個DARM堆疊組成的深層特征提取結構,利用注意力機制優化的雙連接殘差網絡,逐層提取多通道輸入的高級特征信息,并將得到的高級特征映射圖輸入GAP網絡層,以減少網絡訓練參數、防止過擬合;最后,利用softmax層完成故障類別輸出。

圖4 所提診斷模型結構
本文提出的基于傳感器信息融合及雙連接注意力殘差網絡的診斷方法的應用流程如圖5所示,主要分為訓練和測試兩個部分,具體如下:

圖5 診斷流程圖
(1) 利用多個傳感器收集不同位置的軸承振動信號,將其進行歸一化,并分為訓練集和測試集;
(2) 將訓練集中的數據融合成多通道輸入,然后利用搭建的診斷模型學習故障特征,并通過交叉熵損失函數計算模型訓練過程中的損失值;
(3) 根據得到的損失值,利用誤差反向傳播算法對整個網絡的權重參數進行更新,降低損失函數值,提高診斷精度,直至達到網絡設置的最大更新次數;
(4) 利用測試集測試訓練完成的診斷模型,輸出分類結果。
為了驗證所提方法有效性,本文以凱斯西儲大學(CWRU)與安徽工業大學自制試驗平臺采集的軸承數據集為試驗對象,分別進行試驗驗證。
所提方法模型在Inter i7-10750H處理器、8 GB運行內存、GTX 1650TI 顯卡的Windows10電腦環境下,使用Python語言在Pycharm平臺中編寫,利用pytorch深度學習框架實現。
本文所提方法利用兩層寬核卷積來提取大局域的淺層特征,但考慮到深層網絡模型更有利于特征學習以及由此帶來的梯度消失問題,因此在設計DARM時采用大小為33的卷積核,因為較小的卷積核在相同感受野下能提升網絡深度[15],同時小尺寸的卷積核會增加網絡內部非線性,使網絡更具鑒別力,從而改善模型效果。此外,網絡中每增加一個DARM,輸出的特征圖數目就會增加一倍,為了減輕網絡訓練的參數,在每個DARM后添加了一個池化層。最后,為避免訓練過程中出現過擬合,加入全局平均池化層以進一步減少網絡參數。所提方法具體參數如表1所示。

表1 所提模型結構參數
所提方法的模型輸入為多通道的融合信號,其中:32×32×3中的3表示通道數,32×32表示特征圖的大小;卷積層的參數5×5×32,表示在卷積過程中的核尺寸為5×5,數目為32個;步長中的零補表示在卷積過程中將參數padding的值設置為1,以保證卷積后的輸出尺寸與輸入相同。
本文提出的基于傳感器信息融合及雙連接注意力殘差網絡的故障診斷方法,增加了輸入信號中故障特征的數量,改善了模型的特征學習效果,從而提高了故障診斷精度。為了能從多方面對本文所提模型在復雜工況環境下的診斷效果進行評價,將其與寬核卷積神經網絡(deep convolutional neural networks with wide first-layer kernel,WDCNN)、普通殘差網絡(Resnet)、雙連接殘差網絡(double-connected residual network,DRN)以及采用本文所提診斷模型的單傳感器輸入方法(single sensor input and double-connected attention residual network,SSI-DARN)進行比較。所選對比模型的參數如表2所示。

表2 對比模型結構參數
CWRU的軸承數據集是利用電火花向測試軸承的內圈、滾動體和外圈引入單點故障,故障尺寸分別為0.177 8 mm,0.355 6 mm和0.533 4 mm。因此,軸承的故障狀態可分為9種,加上正常狀態就產生了10種不同的軸承運行狀態。對采集到的數據以1 024為一個樣本長度進行無重疊采樣,其中80%作為訓練集,20%作為測試集,得到的試驗數據描述如表3所示。

表3 CWRU數據描述
實驗中數據采集頻率為12 kHz,分別在負載為0,1 kW,2 kW,對應轉速為1 797 r/min,1 772 r/min,1750 r/min的狀態下,對風扇端、基座端和驅動端進行振動信號收集。由于故障軸承的振動信號在不同位置可以體現出同一故障類型的不同故障特征,因此當振動信號采集的位置不同時,能收集到的軸承故障特性也不相同,因此可以為故障診斷模型提供更豐富、全面的數據輸入。為了驗證所提方法在復雜工況條件下的有效性,創建了A,B,C,3個數據集,如表4所示。

表4 實驗數據集描述
為了使采集的數據盡可能接近實際工況環境下采集到的樣本,本文在測試數據中加入不同信噪比(signal noise radio, SNR)的高斯白噪聲,以模擬在實際工作環境中采集到的含有噪聲的樣本。計算SNR的方式如下
(8)
式中:RSN為噪聲強弱;Ps為信號功率;Pn為噪聲功率。
4.2.1 網絡主要參數選擇
網絡參數設置影響到模型對數據的學習效果以及最終的試驗結果,因此選擇合適的參數會對整個故障診斷流程有重要影響。研究中發現診斷網絡的深度以及訓練過程中采用的批處理數目,對故障判別的準確率有較大影響,因此本文通過試驗來確定兩者合理的參數。為減少隨機因素的影響,本文中的試驗采用恒定負載下的數據集C進行訓練和測試,測試過程中為了模擬實際環境下采集的信號,在測試集中添加了SNR=2的高斯白噪聲。
(1) 網絡深度
在CNN構成的診斷網絡中,不同的網絡深度對于診斷結果的精度以及訓練過程的難易程度有直接影響。為了選擇合適的診斷網絡結構,本文構建了4種不同深度的診斷模型,分別包含DARM的數目為1,2,3,4,以下簡稱DARM1,DARM2,DARM3、DARM4。上述4種模型均在相同條件下進行10次試驗,結果如圖6所示。

圖6 不同深度網絡診斷精度
由圖6可知,相比于更深層次的網絡,只包含一個DARM的網絡結構的故障識別準確率明顯較低,因此網絡結構的深度對于故障診斷結果有明顯影響。當網絡深度逐漸加深時,由圖6可知,DARM3的精度總體上好于DARM2,但DARM4相比于DARM3卻在結果上有較大波動,且總體結果并不優于DARM3,因此當網絡深度增加到一定程度時,若繼續加深網絡結構,診斷結果并不會繼續得到優化,反而出現了較大的波動。綜上,本文選擇DARM3作為診斷模型的網絡深度。
(2) 批處理數目
在深度學習的訓練過程中,采用小批量梯度下降算法可以加快模型的收斂速度,同時能避免訓練過程陷入局部最優。然而批量值過小會使模型參數更新緩慢,訓練時間過長;批量值過大則會使梯度更新朝全局最優方向更新緩慢。因此為模型確定合適的批處理數值對診斷結果有重要影響。在確定DARM3為所提方法的網絡深度基礎上,本文分別對批量大小為16,32,64,128的批處理數目進行試驗,相同條件下運行10次的結果如圖7所示。由圖7可知當批量大小為64時的診斷精度明顯高于其他對比試驗,且診斷結果的穩定性最好,因此本文選取64為模型訓練時的批量值。

圖7 不同批量處理數目診斷精度
4.2.2 變負載試驗分析
滾動軸承通常運行在變負載環境中,因此需要故障診斷方法具有良好的泛化能力,以解決負載變化時的故障判別。為了驗證所提方法在負載變化時的實際診斷效果,本文以某一恒定負載的數據集作為訓練集,不同負載的數據集作為測試集,以此模擬負載變化。例如,A-B表示在數據集A上進行訓練,采用數據集B來測試。每組試驗進行10次,取其平均值作為實驗結果。最終在負載變化條件下,得到不同方法的診斷結果,如圖8所示。

圖8 變負載診斷精度結果
由圖8可知,WDCNN在負載變化下的診斷精度最低,平均診斷精度僅為84.5%,本文所提方法在每種負載變化下的診斷精度均高于對比方法,平均診斷精度在94%以上。其次,對于Resnet與DRN,兩者保持了相似的網絡結構,主要區別在于殘差模塊的不同,但相比采用普通殘差模塊的雙連接殘差網絡,后者的平均診斷精度為90.2%,優于前者的87.9%,驗證了所設計的雙連接殘差網絡相比普通殘差結構更有利于挖掘隱層特征信息。同時,所提方法的識別準確率均高于DRN,表明經注意力機制改進的雙連接殘差網絡可以獲得不同通道特征重要性,挖掘出更具有鑒別性的故障特征。此外,對于以單傳感器信號作為模型輸入的SSI-DARN,雖然在診斷模型上采用了本文方法,但是在變負載條件下的平均診斷精度為89.7%,明顯低于多傳感器信息融合的方法,表明傳感器信息融合策略可以使輸入信號包含更多的特征信息。
4.2.3 抗噪性試驗分析
為了驗證所提方法在復雜工況條件的抗噪性能,在數據集B的測試集中加入0~8 dB的高斯白噪聲,用來測試不同方法抗噪能力。每組試驗進行5次,試驗結果的均值對比如圖9所示。

圖9 噪聲變化診斷精度結果
由圖9可知,當噪聲強度為0~8 dB時所提方法的診斷精度高于其他診斷模型,其平均識別準確率超過了98%。總體而言,不同診斷模型的識別準確率與噪聲強弱均成正向變化關系,且當SNR超過6 dB時,各模型的診斷精度趨于穩定,這是由于在噪聲較小情形下,識別精度主要取決于模型自身在特征提取上的設計。此外,當SNR從0~8 dB變化時,只有本文的診斷模型能始終保持在93%以上的診斷精度,說明所提方法在噪聲環境下仍具有較強的故障特征提取能力。
為了進一步驗證所提方法的有效性,本文選用如圖10所示的自制試驗平臺采集的數據[16]進行試驗。試驗軸承型號為SKF6206-2RS1,采用電火花分別對軸承的內圈、外圈和滾動體加工出不同的故障尺寸。通過放置在不同位置的加速度傳感器對轉速為900 r/min,1 200 r/min和1 500 r/min 3種工況,進行軸承振動信號的數據采集,采樣頻率為10.24 kHz,分別得到數據集A,B,C。對采集到的振動信號,按每個樣本長度1 024進行無重合切分,其中80%作為訓練集,20%作為測試集,每個數據集的構成如表5所示。

表5 安徽工業大學數據描述

圖10 安徽工業大學自制試驗平臺
4.3.1 噪聲環境下的變轉速試驗分析
考慮到軸承工作時的轉速變換以及噪聲環境的干擾,本文設計了帶有噪聲變化的變轉速試驗。該試驗具體過程為將診斷模型在一個轉速下收集的數據進行訓練,然后利用另一個轉速下采集的數據來測試訓練完成的模型。例如,A-B為在數據集A中進行訓練,訓練完成的模型在數據集B中進行測試。同時,為了測試診斷模型在變工況下的抗噪性能,在測試數據集中分別加入不同SNR的高斯白噪聲。試驗采用的診斷模型結構與表1相同,將在CWRU數據集中采用的SSI-DARN,DRN以及WDCNN作為對比方法。
為了避免試驗過程中的隨機性,對每一個噪聲環境下的工況變化重復進行5次試驗,然后取其平均值。試驗結果如圖11所示。圖11中0,2,4,6表示在測試集中加入高斯白噪聲的信噪比。由圖11可知,轉速變化相同條件下,本文所提方法在SNR為0~6 dB的噪聲環境中,故障類型識別的平均準確率均高于其他方法。同時在相同SNR的噪聲環境下,所提方法在轉速變化時的識別平均準確率也高于對比方法。特別在SNR=0的高噪聲環境下,相比于SSI-DARN和DRN,所提方法的識別準確率都高于90%,進一步說明了本文構建的診斷方法在不依賴人工提取特征情形下擁有較強的特征學習能力。此外,測試軸承在SNR為0~6 dB、轉速改變條件下,本文模型的平均準確率可達96.46%,表明所提方法在復雜工況條件下具有良好的故障識別準確率和抗干擾性能。

圖11 有噪聲變化的變轉速試驗診斷精度
4.3.2 所提方法診斷過程可視化
為了直觀地展示所提方法的診斷過程,本文采用t-SNE(t-distributed stochastic neighbor embedding)降維算法,分別將輸入的振動信號、雙層寬核卷積層的輸出、模型中3個DARM的輸出以及全連接網絡最后一層輸出中的高維特征降到二維,從而實現診斷方法的特征提取可視化。試驗中采用的訓練集為A,然后利用添加了噪聲強度SNR為0的測試集B來得出訓練完成的診斷模型在特征提取不同階段的可視化結果,如圖12所示。

圖12 診斷過程降維可視化
由圖12可知,診斷模型對于不同故障類型特征的可分性隨著網絡的加深逐漸增強。特別是,經過3個DARM模塊的學習后,模型對于故障類型的區分能力明顯增強,說明本文采用的DARM有良好的特征提取能力,能夠從振動信號中提取出能反映軸承運行狀態的故障特征。同時,由處于不同深度的DARM輸出的高維特征可視化結果可知,本文在診斷模型中所采用的3個DARM模塊堆疊而成的深層網絡,更有利于模型對不同類別故障的區分。此外,由整個診斷流程的可視化結果看出,通過數據集A訓練完成的模型,在SNR為0的噪聲環境中使用數據集B進行測試時,仍能清晰地得出不同類型故障之間的界限,進一步說明了所提方法在有噪聲干擾的變工況環境下有較好的識別性能。
考慮復雜工況條件下變負載、變轉速以及環境噪聲干擾等影響因素,本文提出了傳感器信息融合與雙連接注意力殘差網絡相結合的軸承故障診斷方法。該方法在兩個不同的數據集中表現良好,主要結論如下:
(1) 本文采用的傳感器信息融合策略,簡化了數據處理過程,提高了輸入數據中包含的故障特征信息。
(2) 由DARM堆疊而成的深層網絡,可以有效挖掘融合信號中包含的深層特征信息,且利用DARM的SE機制可以使模型學習到更具有判別性的故障特征,從而提升模型在復雜環境下的識別性能。
(3) 針對兩個不同的試驗數據集,所提方法在不同工況環境下均取得了較高的故障識別準確率。特別是在有噪聲變化的變轉速試驗中,所提方法的平均診斷精度可達96.46%,表明本文方法在變工況復雜運行條件下具有較好的診斷性能。