伍濟鋼, 文 港, 楊 康
(湖南科技大學 機械設備健康維護湖南省重點實驗室,湖南 湘潭 411201)
航空發動機是飛機的核心動力裝置[1],但是航空發動機的轉子系統長期處在高壓、高溫、高載的工作狀態,容易出現轉子不平衡、轉靜碰摩、軸承損傷等故障,最終可能造成巨大的經濟損失甚至是嚴重的人員傷亡事故,因此研究綜合性能高的故障診斷方法是十分必要的[2-3]。故障特征的提取是故障診斷的前提,然而,由于航空發動機轉子系統是一種結構高度復雜的動力裝備[4],各種零部件之間復雜的耦合運動以及強噪聲的干擾導致振動信號的關鍵特征信息十分隱蔽且難以提取。傳統的故障診斷方法如短時傅里葉變換、小波變換、經驗模態分解(empirical mode decomposition,EMD)和變分模態分解(variational mode decomposition,VMD)等變換方法或分解方法需要人工提取關鍵特征,對專家經驗過于依賴,特征提取的效率較低,難以滿足航空發動機故障診斷對高效率高精度的要求。
近些年,深度學習的方法逐漸應用于故障診斷領域并獲得了很好的結果,基于深度學習的航空發動機故障診斷方法已經進行了許多研究。為了提高航空發動機軸承故障的診斷準確率,王奉濤等[5]通過核函數和去噪自動編碼器的深度神經網絡方法取得了較高的中介軸承故障診斷的準確率。針對傳統故障診斷方法在樣本缺乏條件下容易出現過擬合并且強噪聲下航空發動機微弱故障特征難以提取的問題,王月等[6]提出了孿生減元注意力網絡的故障診斷方法,方法在實際應用上取得了有效的結果。考慮到航空發動機結構復雜、干擾因素多、葉片裂紋特征提取困難,黃鑫等[7]提出了一種改進深度置信網絡的特征提取和診斷方法,取得了較好的檢測精度。
以上方法都能取得一定的檢測效果,但是隨著深度學習的發展,卷積神經網絡(convolutional neural network,CNN)相較于以上方法有著更強的特征提取能力,更容易提取出航空發動機轉子系統故障的關鍵特征信息,能夠實現高精度高效率的故障診斷。王奉濤等[8]考慮到航空發動機中介軸承振動信號的非平穩性和非線性的特點,將原始信號進行灰度變換后導入CNN中進行故障診斷,該方法沒有對CNN進行進一步改進。針對當前基于深度學習的航空發動機滾動軸承故障診斷技術診斷任務單一的問題,康玉祥等[9]將振動加速度的時域信號轉變未頻譜圖后輸入殘差網絡進行多任務故障診斷,該方法并未加強網絡的特征提取能力。以航空發動機轉子軸承為對象,李宏宇等[10]將原始信號進行包絡解調預處理輸入雙向循環神經網絡中,該方法的重點在數據預處理,未對網絡進行進一步改進。考慮到航空發動機軸承實際工作下存在故障樣本遠遠小于健康樣本的情況,韓淞宇等[11]提出了提升神經網絡的航空發動機高速軸承的故障診斷方法,該方法針對的是樣本數據的問題,并未針對振動信號本身問題進行改進。以上CNN方法的應用對象皆是航空發動機轉子系統,但這些方法沒有考慮到航空發動機轉子系統長期處于強振動的工作環境,其故障振動信號噪聲干擾嚴重且關鍵特征隱蔽,并且忽略了航空發動機轉子系統故障振動信號作為時序信號存在時間多尺度特征[12]。現有的這些航空發動機轉子系統故障診斷方法對振動信號的關鍵特征提取能力不足。因此,本文提出了改進注意力機制的航空發動機轉子系統智能故障診斷方法,引入了注意力機制加強網絡的特征提取能力,但不同于田科位等[13-14]直接引注意力機制進行應用,本文充分考慮航空發動機轉子系統故障原始振動信號的復雜性對注意力機制進行調整和改進。
卷積神經網絡主要包括:輸入層,卷積層,池化層,全連接層,輸出層,其核心的操作為,對輸入的數據進行不同大小的卷積核進行卷積以獲取不同感受野下的局部信息,卷積操作的優勢在于參數共享和稀疏連接,能夠在保證提取有效特征信息的同時網絡結構擁有較少的參數量,網絡的前向傳播的簡易式如式(1)和式(2)所示
y′=φ(ω*x+b)
(1)
g=y-y′
(2)
式中:y′為卷積后的輸出值;x為輸入值;ω為權重參數;b為偏重參數;*為卷積操作;φ為非線性激活函數,一般為relu函數或者是sigmoid函數;y為x對應的實際標簽值;g為實際與卷積輸出的差,通過該函數的求導對權重參數和偏重參數進行大小調整。
由于卷積網絡的強大的非線性擬合能力,因此常常會出現過擬合的現象,因此一般卷積網絡中還會添加批歸一化(batch normalization,BN)層以及Dropout層防止網絡的過擬合。
注意力機制模擬人的目光,對于較為明顯的地方會給予更大的注意力[15]。目前,注意力機制主要包括空間注意力機制[16-17]和通道注意力機制[18-19]并且在圖像領域已經取得了不錯的效果,其基本結構為壓縮激勵模塊構成的SENet,在CVPR2018上通道注意力機制cSENet、空間注意力機制sSENet以及通道空間混合注意力機制csSENet三種SENet的變體模塊被陸續提出[20],文獻[21]提出了結合空間注意力機制和通道注意力機制的cbam。該機制相對csSENet的改進點在于引入了全局最大池化結合全局平均池化作為輸入的壓縮方法,能夠進一步提高對關鍵信息的提取能力,一維的最大池化和平均池化分別如式(3)和式(4)。
(3)
(4)

通道注意力機制模塊cSE模塊的結構如圖1所示,該模塊主要由壓縮、降維、激勵三部分組成。
以C×H×W的值為輸入,cSE是將輸入的值通過全局平均池化壓縮成C×1×1的值,通過全連接層進行降維,再通過sigmoid進行激勵變為評分值與輸入值進行相乘,獲得了不同分值的通道。
目前cSE模塊是通過Global Average Pooling進行空間壓縮,再通過sigmoid進行激勵獲得不同通道的評分實現不同通道給予不同的注意力。直接通過Global Average Pooling空間壓縮的通道評分機制設計之初是針對圖像檢測領域,直接應用于航空發動機轉子系統故障數據卻是不合適的。航空發動機轉子系統故障原始振動信號數據包括許多與局部最大值相關的特征,比如峰值、峰峰值等時域特征以及裕度因子和脈沖因子等波形特征[22],然而直接應用Global Average Pooling進行特征壓縮考慮不到這些局部特征。一些十分重要的局部特征會因為全局平均池化同大部分次要特征進行平均,使得該通道評分過低而導致關鍵特征提取不到位。針對上述問題,提出了改進通道注意力機制icSE,icSE模塊的結構圖如圖2所示。

圖2 改進通道注意力機制模塊icSE
考慮到振動信號的時域特征主要體現在幅值、周期、相位等特性上,如峰峰值、裕度因子等關鍵的時域特征需要一個周期內的最大幅值進行計算,為此將池化核設置為一個周期的長度,步長設置為一個周期長度的1/4,對時域特征進行針對性提取。本文轉子系統轉子轉速為1 000 r/min,而采樣頻率為4 096 Hz,通過計算可知246個采樣數據點為轉子的一個周期,因此圖2中Maxpooling和Average pooling兩個局部池化采用的都是池化核為246,步長為61。本文采用局部池化結合全局平均池化的方法,在全局平均池化前添加局部最大池化,考慮到噪聲的干擾可能導致局部最大值為異常值,采用局部平均池化的方法提取到局部平均值,將二者以通道數進行組合后進行全局平均池化壓縮,這樣既能提取到時域特征重要的最大值,又能避免異常值的存在導致錯誤的過高評分,并且還能提取到局部關鍵特征。以上是對航空發動機轉子系統故障時域特征和波形特征進行的針對性設定,從理論上分析icSE能夠更好的提取到航空發動機轉子系統故障的通道特征信息。
空間注意力機制模塊sSE模塊如圖3所示,該模塊主要由壓縮、激勵兩部分組成。以C×H×W的值為輸入,sSE是將輸入的值通過1×1的卷積方式壓縮成1×H×W的值,再通過sigmoid進行激勵變為評分值,最后與輸入值進行相乘獲得了不同分值的空間。目前空間注意力機制采用的都是單評分機制,以一維輸入數據為例,通過1×1的卷積核對輸入數值進行通道壓縮,本質上就是將W上的所有位置進行通道壓縮方向的總和。

圖3 空間注意力機制模塊sSE
sSE模塊是通過1×1卷積方式進行壓縮再通過sigmoid進行激勵獲得不同空間特征的評分實現不同空間特征給予不同的注意力,直接通過1×1卷積通道壓縮的空間特征評分方式設計之初是針對圖像檢測領域,直接應用于航空發動機轉子系統故障數據卻是不合適的,因為兩者是存在一定差異的。圖像檢測主要是對輸入數據的空間特征進行處理,數據之間的關聯性很弱,但是航空發動機轉子系統故障振動信號是時序信號,數據的前后關聯性較強,并且振動信號存在時間多尺度的特性,不同特征的重要性會體現在不同的空間區域,僅用1×1的卷積核難以確定一個空間特征的評分值。針對上述問題,本文參照多尺度模塊的思想[23],提出了多評分機制將sSE模塊改進為isSE,構建了如圖4的isSE模塊。

圖4 改進空間注意力機制模塊isSE
如圖4所示,多評分機制將卷積核的設置分為四個尺度,卷積核為1是為了保留原sSE模塊的功能,剩下三個尺度都是以輸入數據的長度W進行卷積核的設置,分別設置為W/4、W/8、W/16,不同卷積核的壓縮模塊能夠加強不同區域內數據之間的聯系,能夠抓取一個空間特征在不同區域的重要性,并且較大的感受野能夠更好的把握一個關鍵空間特征與其他空間特征的關聯性,從而根據某一特征在不同區域內的重要性賦予不同的評分值。以上改進是對航空發動機轉子系統故障數據關聯性強的特點和振動信號時間多尺度特性進行的針對性設定,從理論上分析isSE能夠更好地提取到航空發動機轉子系統故障的空間特征信息。
cSE和sSE有較好的互補性,csSE將二者結合能夠同時對不同通道上的不同空間上的數值進行評分,從而能夠更全面地提取關鍵特征信息,二者評分后的值進行疊加,獲得了不同通道下的不同空間的評分值,csSE模塊的組成方式如圖5所示,而本文提出的改進csSE模塊(icsSE)的組合方式則需要進一步的驗證,主要包括方式一:先isSE后icSE,方式二:先icSE后isSE,方式三:icSE與isSE同時完成后進行融合。

圖5 通道空間注意力機制模塊csSE
本文試驗平臺為航空渦軸發動機轉子系統模擬試驗平臺,該試驗平臺包括了軸流式壓氣機、離心式壓氣機和燃氣渦輪轉子等與實際航空發動機轉子系統相似的結構。該試驗平臺是基于臨界轉速和振型相似原則設計的,其前3階模態的臨界轉速與實際系統的臨界轉速值最大誤差為3.5%。因此,該模擬試驗平臺的試驗所得數據是可靠的,與實際航空發動機轉子系統的結構狀態比較接近。
本文針對航空發動機轉子系統的轉靜碰摩、轉子不平衡、碰摩-不平衡復合故障、正常工作狀態四種類型進行故障診斷,圖6為航空發動機轉子系統故障模擬試驗平臺。數據采集裝置為高精度的bk加速度振動傳感器和適配的數據采集卡,轉子的運行速度為1 000 r/min,對應實際航空發動機5 000 r/min的高速運動,略低于實際航空發動機轉子系統一階臨界轉速。采樣頻率為4 096 Hz,采樣時間為5 min,采集的數據經過數據增強以及數據分割后獲得的數據集如表1所示,數據長度為2 048。

表1 發動機轉子試驗數據集

圖6 航空發動機轉子故障試驗臺
數據的計算分析平臺為戴爾Precision5820系列服務器,操作系統:Ubuntu 18.04LTS,顯卡:RTX3060Ti*2,CPU:i9-10920X,顯存:16GB*2,深度學習框架搭建:Keras。
試驗一:icsSE模塊的組合方式需要進行確定,因此以航空發動機轉子系統故障試驗數據集為對象,對icsSE模塊的不同組合方式進行試驗對比分析。為了避免網絡層數對檢測結果帶來的干擾,僅選用一層卷積層網絡進行對比分析,注意力機制模塊的驗證通過在一層卷積層后面添加模塊進行對比試驗,該單一卷積層的網絡結構如圖7所示,最終檢測結果如表2所示。

表2 icsSE模塊不同組合方式檢測結果

圖7 注意力機制試驗網絡結構
分析試驗一結果表2,對比檢測準確率可知,icsSE組合方式三所構成的網絡比組合方式一和組合方式二分別高了3.09%和1.76%,從這一結果確定本文所icsSE模塊選擇方式三進行組合,所得icsSE模塊如圖8所示。

圖8 改進通道和空間注意力機制模塊icsSE
試驗二:為了證明注意力機制模塊改進的可行性,將改進后的模塊與改進前的模塊進行對比試驗分析,選取試驗一中的圖8卷積網絡結構作為框架,分別構建了cSENet,sSENet,csSENet,icSENet,isSENet,icsSENet,cbam-Net共8個網絡,最終的檢測結果如表3所示。

表3 網絡檢測結果
分析試驗二的檢測結果表3,對比檢測結果可知,icSENet相較于cSENet的檢測準確率和精確率平均高了4.21%和6.47%,試驗數據表明本文以局部池化改進的icSENet相比原本的cSENet能夠更好地提取通道特征信息。isSENet相較于sSENet的檢測準確率和精確率平均高了8.26%和6.07%,表明本文以多評分機制改進的isSENet相比原本的cSENet能夠更好的提取數據的空間特征信息。icsSENet相較于csSENet的檢測準確率和精確率平均高了11.1%和1.13%,并且icsSENet相較于cbam-Net的檢測準確率和精確率平均高了44.27%和8.97%。
綜上試驗,以多評分機制為改進的isSE能夠更好地幫助CNN對不同空間的特征進行提取,證明了多評分機制改進sSE的合理性。以局部池化為改進的icSE能夠更好的幫助CNN對不同通道中的特征進行提取,證明了通過局部池化改進cSE的合理性,以上兩者結合的icsSENet相較于csSENet和cbam-Net獲得了更好的檢測性能,證明了本文改進方法優越的檢測性能。
試驗三:本文采用的航空發動機轉子系統智能故障診斷方法的基本網絡為一維卷積神經網絡(1DCNN),搭建了四層的1DCNN網絡框架,為了得到具有更好檢測性能的1DCNN,對注意力機制的添加方式進行試驗對比,注意力機制的添加位置為總的四層卷積層中后三層卷積層輸出位置,添加方式的布置和檢測結果如表4所示,其中序號代表第幾層卷積層的輸出位置。

表4 注意力機制不同位置的檢測結果
試驗三的結果表4表明,第四種注意力機制的添加方式相較于其他三種注意力機制的添加方式最終獲得的檢測準確率分別高了1.17%、3.35%、1.58%,因此第四種插入位置方式構建本文的icsSE-1DCNN,其結構如圖9所示。

圖9 一維卷積神經網絡結構圖
為了檢測icsSE-1DCNN模型迭代過程中的性能,以航空發動機轉子系統故障試驗數據集為對象對其進行性能測試,該模型的各個性能檢測指標隨迭代次數的變化如圖10所示,圖中性能指標Accuracy,Precision,Recall在多次迭代后能夠穩定在96%至100%,證明了以航空發動機轉子系統故障為檢測對象時,icsSENet-1DCNN優秀的檢測性能。

圖10 測試得模型迭代結果
試驗四:為了證明icsSE-1DCNN相較于其他方法更加優秀的綜合性能,將icsSE-1DCNN同csSE-1DCNN、1DCNN、文獻[24]、文獻[25]方法進行對比分析,其檢測性能通過試驗檢測準確率分析,結果如表5所示。

表5 網絡檢測結果
由表5的準確率檢測準確率對比分析可知,icsSE-1DCNN比csSE-1DCNN和1DCNN分別高了2.84%和3.35%,結果進一步證明了本文改進方法的可靠性。同時icsSE-1DCNN相較于應用cbam方法的文獻[24]和文獻[25]準確率分別高了10.66%和7.51%,這證明了在對航空發動機轉子系統故障進行診斷時icsSE-1DCNN相較于其他網絡優越的檢測性能。
為了更直觀地證明icsSE-1DCNN相較于其他算法優越的分類能力,對icsSE-1DCNN、Paper[24]、Paper[25]網絡算法進行T-SNE可視化,結果如圖11所示。

圖11 T-SNE可視化結果
分析圖11可知,經過icsSE-1DCNN的特征提取后,航空發動機轉子系統不同的故障之間的分界線比較明顯,不同故障之間的數據混淆十分稀少,而文獻[24]和[25]算法特征提取后,各個故障之間的混淆依然十分的嚴重,這直觀地證明了icsSE-1DCNN對航空發動機轉子系統故障更優秀的分類能力。為了證明icsSE-1DCNN相較于其他算法優越的泛化性能,本文以近似泛化誤差[26]作為網絡模型泛化性評價指標,其結果如圖12所示。

圖12 網絡模型的泛化誤差迭代圖
由圖12可知,從圖中能夠明顯的看出icsSE-1DCNN模型的泛化誤差初始較高,但是隨著迭代次數的增強,其泛化誤差明顯減少,最后穩定收斂逼近0,而文獻[24]和文獻[25]到迭代結束時仍存在較高的泛化誤差,這一結果證明,在進行航空發動機轉子系統故障診斷時本文構建的icsSE-1DCNN模型比其他方法網絡模型有更強泛化性。
綜上,通過試驗四的算法對比分析,能夠充分的證明在對航空發動機轉子系統進行故障診斷時,本文icsSE-1DCNN相較于其他算法有更優秀的檢測性能、分類能力以及泛化性能,因此本文算法的綜合性能更強。
試驗五:為了證明icsSE的引入能夠一定程度上加強1DCNN的抗噪性能,往航空發動機轉子系統故障數據集中添加不同程度信噪比的隨機噪聲,并將icsSE-1DCNN同1DCNN進行對比分析,其檢測結果如表6所示。

表6 不同噪聲下的測試準確率
分析試驗五的結果表6,比較SNR0以及SNR2到SNR10的平均值Mean(SNR2~SNR10)可知1DCNN的檢測準確率下降了2.91%,但icsSE-1DCNN的檢測準確率僅下降了2.16%,這證明了本文改進方法能夠提高網絡的抗噪能力,并且添加了icsSE后的icsSE-1DCNN在不同程度的噪聲干擾下都能獲得較好的檢測結果,該試驗成功證明了本文改進的icsSE能有效提高1DCNN的抗噪性,并且在不同噪聲下都能取得較好的檢測結果。
試驗六:為了進一步驗證本文算法在轉子系統上優秀的性能,本試驗對轉子系統上滾動軸承的故障進行診斷,選用美國凱斯西楚大學CWRU的滾動軸承故障數據集[27]和印度圣朗格瓦爾工程技術學院SLIET的滾動軸承故障數據集[28]進行icsSE-1DCNN的試驗研究,其數據組成如表7所示。考慮到icSE池化核的設置,通過對采集到的數據集進行下采樣保證其一個周期包含246個采樣數據點。滾動軸承故障數據集的采樣參數如表8所示,滾動軸承各故障的特征頻率如表9所示。

表7 CWRU和SLIET數據集

表8 滾動軸承數據的采樣參數

表9 滾動軸承故障信號頻率
由表7可知,滾動軸承數據集包含四種故障類型,總共包含了十個故障標簽。由表8可知,考慮到本文對卷積核大小的設計,需要將一個周期包含的數據點控制在246,而原來一個周期對應的數據點分別為365和2 049,因此需要對其進行下采樣。下采樣的頻率由轉子工作的基頻和現采樣數據點進行計算,最后確定的采樣頻率分別為8 085 Hz和8 405 Hz。綜合表9對該采樣頻率大小進行可行性分析,由表9可知,各個故障特征頻率最大為316.3 Hz,當采樣頻率大于其工作頻率2倍即可很好的進行采集,現下采樣頻率達到了故障頻率的十幾倍,因此該下采樣頻率能很好地將軸承故障特征信號采樣進來。
試驗六中CWRU和SLIET的測試準確率分別為100%和99.73%,其訓練的迭代過程如圖13所示。

圖13 數據集的訓練過程圖
由試驗五的圖13可知,本文的icsSE-1DCNN在應用于轉子系統的滾動軸承故障診斷時同樣能夠實現快速的迭代收斂,在20次迭代之內準確率能夠迅速逼近100%并且達到一個穩定收斂的程度,而最終在不同數據集下獲得的100%以及99.73%的檢測準確率,進一步證明了icsSE-1DCNN優秀的檢測性能。
本文以航空發動機轉子系統的不平衡和碰摩等故障為對象基于1DCNN方法進行智能診斷,為了加強網絡的特征提取能力,針對航空發動機轉子故障振動信號特點引入并改進了注意力機制模塊,實現了準確的航空發動機故障分類,結論如下:
(1) 引入cSE模塊到CNN進行故障診斷時,采用的全局平均池化,缺乏對航空發動機轉子系統故障振動信號中與局部極值相關的時域特征和波形特征的考慮,導致模型對通道特征信息提取不足,最終檢測結果欠佳,本文研究證明了局部池化的引入能夠有效改善這一問題。
(2) 引入sSE模塊到CNN進行故障診斷時,采用的單一尺度壓縮模塊進行了單一尺度的評分,缺乏對航空發動機轉子系統故障振動信號作為時序信號存在時間多尺度特性的考慮,導致模型對空間特征信息的提取不足,最終檢測效果欠佳,本文研究證明了將單一尺度壓縮模塊改成多尺度壓縮模塊實現多評分機制能夠有效改善這一問題。
(3) 本文充分考慮了航空發動機轉子系統故障振動信號的特點,提出了icsSE模塊,研究了icSE模塊和isSE模塊最佳組合方式,最終構建了icsSE-1DCNN。
(4) 相比于現有算法,icsSE-1DCNN能夠取得更高的檢測準確率,并且在不同噪聲的環境下檢測性能更高,證明了其優秀的抗噪性能。通過泛化誤差和T-SNE可視化還充分證明了其優秀的泛化性能和分類能力,最后通過不同數據集的驗證進一步證明了icsSE-1DCNN優秀的綜合性能。
(5) 綜上,本文算法在進行航空發動機轉子系統故障進行診斷時能夠表現出更優秀的綜合性能原因在于:當需要加強1DCNN對航空發動機轉子系統故障關鍵特征的提取能力時,沒有將現有csSE模塊進行直接引入應用。而是充分地考慮航空發動機轉子系統故障振動信號本身特點,對csSE模塊進行改進和組合方式等研究,通過試驗證明了csSE模塊改進方法的合理性和可靠性。
本文方法考慮了航空發動機轉子系統振動信號本身的特點和復雜性,對注意力機制進行了引入、調整、改進三個步驟,構建了能夠準確對航空發動機轉子系統進行智能故障診斷的icsSE-1DCNN,并進行了嚴謹的試驗驗證,對于航空發動機的故障診斷有著充足的實際應用價值,對于智能故障診斷方法起著重要的推進作用。