宋振軍,高丙朋,莊國航,劉前進,趙恒輝
(新疆大學電氣工程學院,新疆烏魯木齊 830047)
軸承作為最重要的機械部件之一,其健康狀況往往是影響大型設備安全服役的重要因素,因此對軸承的故障診斷一直是科學研究的重點和難點。
近年來,隨著人工智能領域的發展,故障診斷的方法由傳統的機器學習方法逐步向深度學習邁進。深度學習通過建立的深層次模型,實現端對端的故障診斷,克服了傳統機器學習在特征提取與模型訓練方面的缺陷。目前,國內外已有許多學者對基于深度學習的故障診斷進行了研究。JING等利用信號的頻譜作為1D-CNN的輸入,將它應用于齒輪箱的故障診斷。LI等將信號的圖像作為輸入,通過CNN進行遷移學習來進行故障診斷。唐波和陳慎慎利用短時傅里葉變換(STFT)將軸承時域信號轉換為二維時頻譜再輸入到CNN中進行故障診斷。以上研究對深度學習在故障診斷中的發展起到了推動作用,但是仍存在一些不足,例如大多使用單一深度學習模型進行故障診斷,未考慮深度學習在故障診斷中的泛化能力,以及對深度學習模型的使用大多局限于簡單的CNN模型。
針對以上問題,本文作者提出一種基于注意力機制下的深度學習模型(ECA-ResNet)。通過對信號進行建模來提取故障特征,并將完全噪聲輔助聚合經驗模態分解(Complete Ensemble Empirical Mode Decomposition with Adaptive Noise,CEEMDAN)提取的能量熵與傳統時域信號統計指標作為補充特征來提高深度學習模型的泛化能力;利用最新的麻雀搜索算法(SSA)對支持向量機(SVM)進行優化以進行故障診斷;對軸承多個部位不同損傷程度進行故障診斷,證明該方法的有效性。
為解決深度學習過程中容易出現的梯度消失或梯度爆炸問題,HE等于2015年提出了殘差網絡(ResNet),它使用一種叫作捷徑連接(Shortcut Connection)的全新的網絡連接方式。ResNet的結構如圖1所示。

圖1 ResNet結構
如圖1所示,ResNet對每層的輸入作一個學習,形成殘差函數。這種殘差函數更容易優化,能使網絡層數大大加深,其輸出可形式化為執行如下的數學計算:
=()
(1)
式中:表示非線性函數ReLU。然后通過一個捷徑連接,和第2個ReLU,獲得輸出:
=(,{})+
(2)
當輸入和輸出維數需要發生變化時(如降維處理),可以在捷徑連接時對作線性變換,如式(3)所示:
=(,{})+
(3)
ResNet的最大優點是在提高訓練精度的同時可減少訓練時間,且在一定程度上減少深度學習過程中的參數量。此外,ResNet可以有效避免深度學習過程中梯度消失或梯度爆炸問題。
注意力機制(Attention Mechanism)是一種通過模擬人腦注意力機制來優化深度學習模型的方法,主要思想是在重點區域投入更多注意力資源,以篩選出更多所需要關注的重點信息,同時對無用信息進行有效抑制。它通過一個組合函數來計算注意力的概率分布,進而突出某個關鍵輸入對輸出的影響。最近幾年注意力機制模型在深度學習被廣泛應用于各個領域,能夠優化深度學習模型,以處理不同類型的任務。
WANG等于2019年提出了輕量級注意模塊(ECA-Net),它只涉及極少參數,但大幅度提升網絡模型的性能。ECA-Net是一種無降維的局部跨通道交互策略,可以通過快速一維卷積有效實現,并且可以在現有的深度學習模型中得到有效整合。ECA-Net的結構如圖2所示。

圖2 ECA-Net結構
如圖2所示ECA-Net在未對數據進行降維處理的情況下,考慮了每個通道及其個鄰居,并且使用了適當的跨通道交互。其中,內核大小是一個關鍵參數,它決定了交互的覆蓋范圍。由于使用1D-CNN來捕獲局部的跨通道交互,不同的通道數和不同的CNN架構的卷積塊可能會有所不同。與通道維數有關,通道維數越大,長期交互作用越強,而通道維數越小,短期交互作用越強。即可能有某種映射存在于和之間。
=()
(4)
最優通常是未知的,但基于上述分析,與呈非線性比例,因此參數化指數函數是一個可行的選擇。同時,在經典的核技巧中,作為核函數的指數族函數被廣泛用于處理未知映射問題。因此,使用一個指數函數近似映射:
=()≈-
(5)
此外,線性函數的特征關系過于有限,且通道維數通常被設置為2,因此和之間的映射進一步表示為
=()=2-
(6)
給定通道維數,自適應地確定尺寸。

(7)
式中:||表示最近的奇數;=2;=1。
ECA-Net的優勢是其輕量級的結構及模型復雜度小,但可以明顯改進骨干網絡模型的性能。
TORRES等于2009年為克服EMD的模態混疊問題,提出了CEEMDAN算法,它不僅解決了傳統EMD的模態混疊問題,而且克服了EEMD算法由于參數選擇出現過多虛假分量的問題。


(8)


(9)
進行多次重復計算,每次計算都會添加一次噪聲,并對新信號()+[()]進行再次分解,直到得到首個IMF分量為止。再計算下一個IMF分量,公式為

(10)
算法終止時,得到個IMF分量,最終余量信號()為

(11)
則原始信號()被分解為

(12)
由式(12)可知,CEEMDAN可改善模態混疊現象且保證了信號的完備性。
在軸承故障診斷中,軸承的故障往往伴隨著特定的故障頻率,此時信號的能量也會隨著故障頻率的產生而發生變化。由于CEEMDAN分解出的IMF函數包含唯一的頻帶,由高頻到低頻分布,且根據信號內的不同故障頻率而分布不同。因此,可以計算軸承故障信號本身的能量以及CEEMDAN分解得到各階IMF函數的能量作為故障特征來進行軸承故障診斷。為描述信號的能量大小,用能量熵描述信號能量。
經過分解得到的IMF分量為,…,,每個分量的能量計算式為

(13)
其中:表示信號的點數。信號的總能量為

(14)
其中:表示IMF的數量。IMF分量能量熵為

(15)
其中
=
(16)
式中:為IMF分量的能量占總能量的百分比。
支持向量機(SVM)是一種基于統計學習理論的智能學習方法:它對于非線性以及高維模式的分類識別問題表現出良好的性能,在故障診斷系統的故障分類中得到了廣泛應用。SVM的分類性能取決于懲罰參數和核函數的選取,因此對這兩個參數進行尋優可以大大提高SVM的分類準確率。
XUE和SHEN于2020年提出的麻雀搜索算法(SSA)是一種新型群體智能優化算法。SSA主要是受麻雀的覓食行為和反捕食行為的啟發而提出的,具有實現簡單、尋優能力強、收斂速度快等優點。
麻雀覓食過程可抽象為發現者-加入者模型,并加入偵察預警機制。因此,在 SSA中,模擬麻雀覓食過程以獲得優化問題的解。假設在一個維搜索空間中,存在只麻雀,則第只麻雀在搜索空間中的位置為=[,1,…,,,…,,],其中=1,2,3,…,,,表示第只麻雀在維的位置。
發現者一般占種群的10%~20%,位置更新公式如下:

(17)
式中:表示迭代次數;表示最大迭代次數;表示(0,1]的隨機數;表示服從正態分布的隨機數;表示大小為1×、元素均為1的矩陣;表示預警值;表示安全值,當<時,種群安全,發現者可廣泛搜索,引導種群獲取更高的適應度;當≥時,偵查麻雀發現捕食者,并立即釋放危險信號,種群立刻做反捕食行為,調整搜索策略,迅速向安全區域靠攏。除了發現者,剩余的麻雀均作為加入者,并根據下式進行位置更新:


(18)

偵察預警的麻雀一般占到種群的 10%~20%,位置更新如下:

(19)
式中:表示步長控制參數;表示[-1,1]之間的一個隨機數,表示麻雀移動的方向;表示極小常數,以避免分母為 0 的情況出現;表示第只麻雀的適應度;表示最優適應度;表示最差適應度;當≠時,表明該麻雀正處于種群的邊緣,極易受到捕食者攻擊;當=時,表明該麻雀正處于種群中間,由于意識到捕食者的威脅,為避免被捕食者攻擊,及時靠近其他麻雀來調整搜索策略。
使用SSA優化SVM的過程是以測試集的預測正確率為適應度函數,尋找最優的SVM參數。
=max{accuracy[predict(test)]}
(20)
首先,對軸承信號劃分數據集,再使用傅里葉變換(FFT)得到軸承的頻域信號,通過ECA-ResNet得到軸承信號的頻域特征;然后,對軸承信號進行CEEMDAN分解,得到信號時頻域特征,再計算軸承信號的15個統計時域指標,經過核主元分析(KPCA)降維得到軸承信號的時域特征,將所有特征構建成故障特征矩陣,輸入到SSA-SVM中,實現故障分類識別。故障診斷流程如圖3所示,具體步驟如下:

圖3 基于ECA-ResNet與CEEMDAN能量熵的軸承故障診斷流程
步驟1,通過滑動窗選取的方式對多種軸承信號劃分數據集;
步驟2,對軸承信號數據集進行FFT,得到軸承頻域信號數據集;
步驟3,將頻域信號數據集轉化為×的矩陣作為ECA-ResNet的輸入;
步驟4,通過ECA-ResNet輸出得到軸承信號的頻域特征;
步驟5,對軸承信號數據集進行CEEMDAN分解,得到多個IMF分量;
步驟6,求取軸承信號數據集,并求得其IMF分量的能量熵作為軸承信號的頻域特征;
步驟7,計算軸承信號數據集的15個統計時域指標,經過KPCA降維得到軸承信號的時域特征;
步驟8,將步驟2—步驟7提取的軸承信號頻域、時頻域、時域特征共同構成軸承信號的分類特征矩陣;
步驟9,通過SSA-SVM對軸承信號特征矩陣進行故障分類識別。
仿真的實驗數據采用美國凱斯西儲大學的軸承故障數據,選擇0 W下,故障直徑為0.177 8、0.355 6、0.533 4 mm的軸承內圈、外圈、滾動體故障信號以及正常信號共計10個類別信號。每個類別100組數據,采用滑動窗方式將10個類別的軸承信號轉換成為10 000個信號樣本,其中7 000個樣本作為訓練集,3 000個樣本作為測試集。對所有樣本進行FFT變換,得到軸承信號的頻域數據,取每個樣本頻域的4 096個點,轉化為64×64的矩陣作為ECA-ResNet的輸入。網絡結構如圖4所示。

圖4 ECA-ResNet網絡結構
該網絡模型主要由9個殘差塊和4個ECA-ResNet注意力機制塊組成,由于篇幅限制,激活函數層ReLU層和歸一化層BatchNorm層省略。在訓練網絡時,通過改變第3個線性層Linear3輸出數目來獲得最佳的故障頻域特征數,ECA-ResNet提取不同特征訓練準確率如圖5所示,分別選取50~90間隔為10的特征個數進行實驗。

圖5 不同數量頻域特征準確率
由圖5可知:選擇80個頻域特征輸出的準確率為94.60%,高于其他數目的特征,且收斂速度也最快,在第6輪訓練時達到收斂。
為凸顯ECA-ResNet注意力機制對網絡模型的提升,與不采用注意力機制的ResNet和采用其他注意力機制的ResNet進行對比。文中選取SE-Net注意力機制和CBAM-Net進行對比,結果如表1所示。

表1 不同注意力機制訓練結果
由表1可知:ECA-ResNet相對于ResNet增加了較少參數且只增加了較短的訓練時間就獲得了更好的訓練效果;與其他2種注意力機制對比,ECA-ResNet的訓練精度略有提升,參數個數分別比SE-ResNet、CBMA-ResNet減少20 948、10 300個,且訓練時間較短。
獲得軸承信號的頻域特征后,提取軸承信號時頻域特征。對3 000組軸承信號進行CEEMDAN分解,由于篇幅限制只展示一組故障深度為0.177 8 mm的內圈故障信號的實驗結果,且由于分解層數過多,只展示前8層,如圖6所示。

圖6 內圈故障信號的CEEMDAN分解圖
對CEEMDAN分解得到的各分量及軸承信號求能量熵,由于第8個IMF的能量熵通常小于第1個IMF的1%,因此選擇前7個IMF能量熵和信號能量熵共計8個特征作為時頻域特征。
對信號的時域特征進行提取,計算3 000個樣本的15個統計時域指標。由于這些時域指標存在信息冗余或不相關信息,導致故障診斷時間長、精度低,需要進行故障特征指標優化降維。因此,采用核主成分分析(KPCA)進行數據降維,結果如圖7所示。

圖7 時域特征主元貢獻率
由圖7可知:前6個主元的累計貢獻率為95.01%,因此選擇前6個主元作為時域特征。
分析軸承的振動信號,并且基于3種不同方法提取共94個特征構成特征矩陣,利用特征矩陣對軸承故障進行分類。將提取完特征的樣本分為訓練集和測試集作為SSA-SVM的輸入,其中1 500個樣本為訓練集,1 500個樣本為測試集,SSA的優化參數為2個,麻雀數量為10,最大迭代次數為150,分類結果如圖8所示。

圖8 SSA-SVM測試集樣本分類結果
由圖8可知:SSA-SVM的分類準確率為98.7%,分類效果良好。
為體現混合特征矩陣的優越性,用SSA-SVM分別對15個傳統時域特征、6個降維后時域特征、8個CEEMDAN能量熵時頻域特征、80個ECA-ResNet提取的頻域特征與文中所選的94個混合特征進行比較,結果如表2所示。
由表2可知:文中所選擇的94個混合特征的分類精確度高于選擇其他幾種特征,證明了它在故障診斷中良好的泛化性能。

表2 不同特征選取方式分類準確率
為體現SSA-SVM分類方法的良好效果,選擇遺傳算法優化SVM(GA-SVM)、粒子群算法優化SVM(PSO-SVM)、布谷鳥算法優化SVM(CS-SVM)、1D-CNN進行對比,分類準確率和分類時間如表3所示。

表3 不同分類方法分類準確與分類時間
由表3可知:SSA-SVM在分類準確率、分類時間上的表現最好,尤其是分類時間上有較大提升。
(1)使用含有超輕量化注意力模塊的ECA-Net來優化深度學習模型并應用于故障診斷的特征提取,在增加較少參數的情況下提升了模型精度并縮短了模型訓練時間;
(2)將CEEMDAN能量熵作為時頻域特征與傳統統計時域特征一起作為ECA-ResNet提取特征的補充特征,仿真實驗表明該故障特征提取方法可以彌補深度學習模型在故障診斷中泛化能力不足的缺點,并進一步提高診斷效果;
(3)使用SSA-SVM對故障進行分類具有良好的效果,SSA能夠更好地對SVM的懲罰參數和核函數進行尋優;SSA-SVM的故障分類時間、故障分類準確度都明顯優于相比較的其他分類算法。