齊愛玲,馬森哲
(西安科技大學 計算機科學與技術學院,西安 710699)
滾動軸承作為旋轉機械的基本部件之一,應用范圍極其廣泛,而軸承部件的意外失效會帶來嚴重的經濟損失和安全問題[1]。因此,實現快速、準確的滾動軸承故障診斷具有重大意義。
近年來,已有大量針對滾動軸承故障診斷的研究[2-3],其中有效的軸承健康狀態識別是故障診斷的關鍵內容。在故障信號特征提取上,常用的方法有經驗模態分解(EMD)[4]、小波分析[5]和變分模態分解(VMD)[6]等。傳統信號處理方法雖然能取得較好效果,但是難以處理高度復雜的非線性信號,無法有效處理工業數據。而現有的基于機器學習(ML)[7]的故障診斷方法,如支持向量機(SVM)[8]、梯度提升決策樹(GBDT)[9]和K 近鄰(KNN)[10]等,往往需要依賴一些帶標注的訓練數據,且膚淺的機器學習不能準確捕捉特征數據與健康狀況之間的復雜對應關系。
隨著人工智能技術的發展,基于深度學習的故障診斷方法備受關注,尤其是基于數據驅動的方法,能夠快速有效地處理機械信號、獲得可靠的故障檢測結果,且不必依賴太多的先驗專家知識。深度學習模型中,卷積神經網絡(CNN)以其自適應特征提取的能力而得到較多應用研究。文獻[11]中利用重采樣技術將去噪后的時域信號轉換為角域信號,并通過Hilbert 變換得到角域信號的包絡譜,將3 種信號融合成紅綠藍圖像形式以增強樣本特征;然后將紅綠藍圖像作為改進的ShuffleNet V2的輸入樣本進行特征提取;最后在ShuffleNet V2的分支進行拼接操作之后放置擠壓塊和激勵塊以增強識別準確性,并將校正的線性單元激活函數替換為HardSwish 激活函數以避免壞死。該方法能夠有效提高故障識別準確率,并保證模型大小不顯著增加。劉昕宇等將去噪處理后的原始振動信號轉化為SDP 圖像,并作為樣本輸入到MobilenetV2 模型中自適應地提取故障特征和分類,完成了機械設備的故障診斷[12]。蔣富康等利用自適應噪聲完備集合經驗模態分解算法對原始振動信號進行預處理,再將預處理后的樣本輸入到CNN 內嵌長短期記憶(LSTM)神經網絡的滾動軸承故障診斷模型中[13]。該故障診斷方法具有更快的擬合速度和更高的準確率。文獻[14]中利用連續小波變換將原始的一維時間序列信號轉換為二維時頻圖像,得到適合于二維CNN 的輸入數據;并采用數據擴充技術對已標注的故障數據進行擴充;將生成的和原始的故障數據作為訓練樣本,訓練基于神經網絡的故障診斷模型,實現滾動軸承故障診斷。Liang 等采用小波變換對一維原始時域信號進行預處理,獲得相應的時頻圖,然后利用建立的CNN 模型完成旋轉機械的故障檢測,結果表明該方法在測試精度方面的穩定性相當出色[15]。雖然以上將原始信號預處理為二維圖像的方法的診斷識別結果相比于直接提取原始信號中故障特征的更加精確,但它們都是采用單域信號進行特征提取,只考慮了數據單域局部信息而忽略了其他更重要的信息特征。
針對傳統故障診斷方法通常依賴單域信息輸入,導致信號中的部分信息丟失或信息不完整使用的問題,本文提出一種基于通道注意特征融合的軸承故障診斷方法:首先,采用快速傅里葉變換(FFT)和連續小波變換(CWT)同時處理原始振動信號,得到頻域信號和時頻圖像,通過提取多域故障信息特征來提高模型的魯棒性;然后,將2 種不同域的信息作為雙流GM 神經網絡(DFGMNet)算法的樣本輸入,結合多有效通道注意力(MECA)進行通道加權,以增強關鍵特征提取能力,實現對故障信號的準確分類;最后,在美國的凱斯西儲大學、中國的江南大學和加拿大的渥太華大學的軸承故障數據集上驗證本文所提故障診斷方法的通用性和有效性。
在旋轉機械故障診斷中,信號處理技術不僅適用于傳統的故障診斷,而且適用于基于深度學習和數據驅動的故障診斷。FFT 和CWT 是目前廣泛用于旋轉機械故障診斷的信號處理方法。
FFT 是一種基于離散傅里葉變換(DFT)的、能夠將時域信號轉換為頻域信號的方法,具有較低的計算復雜度,因此其計算速度比DFT 快[16]。DFT函數的定義為
式中Xk是序列xn的DFT。考慮旋轉機械故障信號的特點,通常會將振動信號轉換為頻域信號進行進一步分析[17]。
CWT 是一種時頻分析方法。與FFT 不同,CWT可以將一維振動信號轉換為二維信號。CWT 時頻圖像是使用連續小波變換獲得的信號能量密度的時頻表達。因為Morlet 小波的形狀類似于在機械故障中出現的脈沖特征,所以連續小波變換將原始信號分解為時間尺度信號,由Morlet 小波作為母小波通過縮放和轉換操作表示[18]。
假設輸入信號為x(t),通過用Morlet 小波縮放x(t)來獲得CWT,即
式中:a為小波平移;b為小波尺度;x(t)為任意有限能量信號;ψ(t)為母小波函數。為了在有限的空間中提取更多的時頻信息,母小波被用于生成子小波,
通過對信號x(t)執行CWT,將原始的一維時間序列投影到二維時間尺度平面上,再根據尺度與頻率的對應關系得到反映信號頻率分量隨時間變化的時頻圖像。
Ghost Module(GM)[19]將傳統的卷積過程分為3 個步驟:首先獲得預期數量一半的特征圖;然后對所獲得的特征圖進一步提取與深度卷積;最后將提取的特征拼接起來作為GM 的輸出。與卷積相比,GM 通過使用更少的線性運算來獲得更豐富的特征信息,可以達到更好的效果。
根據診斷要求,對提取二維特征的GM 模型進行改進,用于一維數據的特征提取,即令
式中:f為卷積操作;b為偏置項;X∈Rh×w×c為輸入圖像,其中,c為輸入通道的數量,h和w分別為輸入特征圖的高度和寬度;Y∈Rh′×w′×n為輸出特征圖,其中,n為輸出通道的數量,h?和w?分別為輸出特征圖的高度和寬度。
然后對Y∈Rh′×w′×n進行線性變換。本文使用3×3 的通道卷積對特征圖進行線性運算,得到其余特征圖
式中:φi,j為3×3 卷積核的第j次線性運算最終生成的特征圖;Yi為Y∈Rh′×w′×n的第i個特征圖。
最后將固有特征圖和其余特征圖級聯以獲得輸出特征圖。GM 的實現過程如圖1 所示。

圖1 GM 的實現過程Fig.1 Realization process of GM
注意力機制[20]可以根據目標的重要性分配權重,以突出某些重要特征,有效捕捉上下文信息。在故障診斷領域,注意力機制的實質是計算注意力的概率分布。在關注關鍵分類信息的同時,必須整合其他信息,以消除非敏感信息的影響[21]。在計算機視覺領域,信道注意力機制被引入到卷積塊中,為網絡性能改善提供了潛力。胡潔等提出了基于擠壓和激勵思想的擠壓-激勵網絡(SE-Net),它由每個特征映射的全部信息的擠壓操作和衡量每個特征重要性的激勵操作組合而形成擠壓和激勵塊[22]。在應用SE-Net 時,避免降維對于訓練信道注意力尤為重要。相較于參數增加,該模型在提升性能的同時保持了模型的復雜度且計算負擔不會增加。文獻[23]中提出了一種高效的信道注意力網絡(ECA-Net),在提高現有基于自注意力的CNN 模型性能的同時,避免了模型復雜度過高的問題。ECA-Net 成功解決了性能和復雜度的平衡問題,且采用少量參數表現出明顯的性能改善效果。ECANet 通過有效的一維卷積進行局部跨通道交互而不降維的方法可分為3 個步驟:1)對特征圖進行全局平均池化,得到1×1×C特征向量,其中C為信道維度;2)利用卷積核為1×k的一維卷積計算得到特征向量的重要性預測;3)利用Sigmoid 函數對重要性預測進行0~1 范圍的正則化。ECA 模塊的實現過程如圖2 所示,其中:σ為Sigmoid 函數;k經由C的映射自適應地確定,

圖2 ECA 模塊的實現過程Fig.2 Realization process of ECA module
式中: |t|odd為距t最近的奇數;γ和b為常數,本文中分別設置為2 和1。
本文在ECA 模塊的基礎上提出多有效通道注意力(MECA)模塊。MECA 模塊通過最大池化過程從特征圖中提取紋理特征等細節信息,平均池化提取特征圖中與目標相關的背景特征。MECA 模塊的實現過程如圖3 所示:先對輸入的特征圖進行平均和最大池化處理,再對處理后的2 個通道的特征圖執行拼接操作,其計算過程表達式分別為:

圖3 MECA 模塊的實現過程Fig.3 Realization process of MECA module
式(7)~式(9)中:P為輸入的特征圖;P?為池化及拼接操作后的特征圖;AvgPool 和MaxPool 分別為平均池化和最大池化操作;cat 為拼接操作;ωc為可學習權重;ASK 為自適應選擇的k的一維卷積;P″為輸出特征圖; ?為特征圖按位相乘操作。
本文結合FFT、CWT、GM 和通道注意力機制提出雙流GM 神經網絡(DFGMNet)算法,其整體結構如圖4 所示。

圖4 DFGMNet 故障診斷算法Fig.4 Fault diagnosis algorithm of DFGMNet
由圖4 可以看到,DFGMNet 故障診斷算法包括基于FFT 頻譜的一維GM 結構和基于CWT 時頻圖像的二維GM 結構,一維和二維DFGMNet 結構均含有3 個GM、3 個池化層(Pool)、1 個MECA模塊和1 個全連接層(FC)。故障診斷時,采用一維和二維GM 結構并行進行特征提取,這樣可以充分利用樣本故障信息,實現故障信息相互補充;在DFGMNet 算法中加入多有效通道注意力(MECA)機制,可以從不同角度提取更具鑒別力的特征,即通過賦予不同通道或區域不同的權重,靈活地捕捉全局和局部的關系,對關鍵特征區域分配更多的注意力,減少對噪聲區域的注意力,從而實現關鍵特征的增強和噪聲干擾的降低,增強算法的魯棒性,提高算法的分類準確率。將2 個GM 結構的全連接層FC1和FC2提取的特征通過融合層F*進行拼接,最后在F*和FC1*之間引入Dropout[24]使部分神經元以一定的概率暫停工作,轉而學習更加具有魯棒性的信息,以提高算法的泛化能力,抑制過擬合。
故障診斷過程可分為4 步:
1)首先對原始采樣數據同時進行FFT 和CWT預處理,得到頻譜圖和時頻圖;
2)將頻譜圖和時頻圖輸入DFGMNet 故障診斷算法提取信號的頻域和時頻域特征,結合MECA機制進行通道加權,通過特征融合層得到組合故障特征;
3)將DFGMNet 算法用于組合故障特征的監督學習,并對算法中的權重和參數進行訓練和更新;
4)通過3 個故障數據集驗證DFGMNet 算法的故障分類性能。
3.1.1 數據集
采用凱斯西儲大學(CWRU)、江南大學(JNU)和渥太華大學(OTTAWA)的軸承故障數據集來驗證DFGMNet 故障診斷算法的性能。
對于CWRU 的數據集,本文選用12 kHz 的驅動端采集的故障數據,軸承轉速為1772 r/min。該數據集包括滾動體、內圈和外圈3 種故障狀態,以及1 種正常(無故障)軸承數據;每種故障狀態含3 種故障直徑(0.007、0.014 和0.021 inch),共9 種軸承故障數據(如表1 所示);每種故障狀態生成200 個樣本,并按8:2 劃分為訓練集和測試集。

表1 CWRU 實驗數據Table 1 CWRU experimental data
JNU 的數據集采樣頻率為50 kHz,故障狀態包括外圈、內圈和滾動體故障。本文使用轉速600 r/min的軸承數據作為實驗數據集,加上正常(無故障)工況共4 種狀態(如表2 所示)。

表2 JNU 實驗數據Table 2 JNU experimental data
OTTAWA 的數據集包含了滾動軸承不同故障類型的振動和轉速數據。本文使用減速工況下的故障數據,包括內圈、外圈、球和復合4 種故障狀態,以及1 種正常(無故障)軸承數據(如表3 所示)。

表3 OTTAWA 實驗數據Table 3 OTTAWA experimental data
3.1.2 實驗超參數設置
本文實驗在Pytorch 的框架下進行驗證,對原始振動數據采用長度為1024 的采樣方式進行隨機分割,使用Adam 優化器優化訓練DFGMNet 算法,應用交叉熵損失函數作為該算法的損失度量函數,實驗參數設置如下:學習率初始化為0.001;模型中的dropout 參數為0.2;訓練時期的總數為50;由于批量大小(Batch S)參數會對實驗結果產生一定的影響,所以將批量大小分別設置為16、32、64、128,由圖5 可知批量大小為16 時的故障診斷準確率最高。所有實驗均進行10 次,以降低測試過程中的偶然性,并將平均值作為最終分類結果進行分析。

圖5 CWRU 批量大小對診斷準確率的影響Fig.5 Effect of CWRU batch size on diagnostic accuracy
使用上述3 個軸承故障數據集驗證基于通道注意特征融合的軸承故障診斷方法的通用性和有效性。為驗證頻域和時頻域作為DFGMNet 算法的輸入數據的樣本特征提取效果,以本文DFGMNet框架為基礎,對不同的通道數和輸入數據進行對比實驗。構建5 種算法進行軸承故障診斷的對比實驗,其中:Model1、Model2 和Model3 為采用單通道的算法;Model4 和Model5 為采用雙通道的算法(Model5 為本文所提算法)。各算法的框架及輸入數據如表4 所示。

表4 5 種算法的框架及實驗輸入數據類型Table 4 The framework and the type of input data of five algorithms
本文實驗以準確率作為各算法的分類性能的評價指標,它是指正確預測類別樣本的數量占總樣本數量的百分比。表4 提到的5 種算法的實驗對比結果如表5 所示。

表5 5 種不同框架的算法的實驗結果對比Table 5 Experimental result comparison of five algorithms with different frameworks
結合表4 和表5 可以看出:1)Model1 的輸入數據為原始振動數據,在3 個測試集上的準確率分別為97.53%、90.19%和92.75%;2)Model2 的輸入數據為快速傅里葉變換數據,在3 個測試集上的準確率分別為98.68%、92.07%和94.65%,與Model1 的相比分別提高了1.15、1.88 和1.90 個百分點;3)Model3的輸入數據為連續小波變換時頻圖,在3 個測試集上的準確率分別為99.23%、94.38%和95.90%,與Model2 的相比分別提高了0.55、2.31 和1.25 個百分點;4)Model4 和Model5 均采用DFGMNet 故障診斷算法,Model4 的輸入數據分別為原始振動數據和連續小波變換時頻圖,在3 個測試集上的準確率分別為98.94%、96.03%和96.70%;Model5 的輸入數據分別為快速傅里葉變換頻域數據和連續小波變換時頻圖數據,在3 個測試集上的準確率分別為99.78%、98.50%和97.65%;Model5 與Model4相比,準確率分別提高了0.84、2.47 和0.95 個百分點。由此可知,本文提出的雙流GM 神經網絡故障診斷算法將頻域和時頻圖作為樣本輸入可達到最佳的特征提取效果。
首先,對CWRU 數據集每個類別隨機構造200 個樣本,構成一個包含2000 個樣本的樣本集;然后使用t-distributed 隨機鄰居嵌入(t-SNE)方法[25],將該數據集所有類別的數據在本文提出的DFGMNet 故障診斷算法中作為原始輸入信號,測試數據集在全連接層FC1、FC2和FC1*的學習過程中映射數據的二維特征。由圖6(a)可見,CWRU 原始數據特征相對分散并且難以區分。由圖6(b)和圖6(c)可見,與原始輸入數據相比,經GM 和池化操作后,每類樣本逐漸聚類,且在全連接層FC2中特征的聚類比在FC1中的更好。由圖6(d)可見,CWRU 數據集中同一類的特征非常集中;且與FC1和FC2中的特征映射結果相比,FC1*中不同類特征分布之間的距離最大。結果表明,采用本文所提雙流GM 神經網絡模型的分類器可輕松完成數據集各自樣本間的分類,得出較優的分類結果。

圖6 輸入數據以及全連接層FC1、FC2、FC1*的特征可視化Fig.6 Feature visualization of the input data and the fully connected layers of FC1, FC2 and FC1*
為進一步驗證本文所提故障診斷方法的分類精度,對比分析了本文所提DFGMNet 算法和目前主流的4 種算法在3 個數據集上取得的分類準確率,結果如表6 所示。可以看到,本文所提算法對CWRU、JNU 及OTTAWA 數據集的分類準確率分別達到99.78%、98.50%及97.65%,均略高于目前主流的4 種算法。這表明:本文算法能夠有效降低振動信號噪聲對故障診斷識別的干擾,提取更具魯棒性的特征,從而提高算法的分類性能;本文算法采用的超參數相對達到最優值,有效提高了滾動軸承的故障診斷準確率。

表6 不同算法的分類準確率對比Table 6 Classification accuracy comparison among different algorithms
針對現有的深度學習法通常依賴單域信息輸入而導致信號中部分信息丟失或信息的不完整使用的問題,本文提出一種基于通道注意特征融合的軸承故障診斷方法。該方法采用DFGMNet 算法,能夠自適應提取信號的頻域和時頻域特征,并通過引入通道注意力機制克服了傳統算法的局限;還在CWRU、JNU 和OTTAWA 軸承故障數據集上展現出更高的分類準確率,為故障診斷領域帶來了顯著的創新和性能提升。該方法有望在將來成為工業實踐中故障診斷的有力工具,為提高滾動軸承故障診斷的準確性和可靠性提供有力支持。