





















摘要:針對(duì)卷積神經(jīng)網(wǎng)絡(luò)及其與信號(hào)降噪預(yù)處理集成方法面臨高噪聲環(huán)境和低質(zhì)量數(shù)據(jù)挑戰(zhàn)時(shí)難以有效地提取信號(hào)有用特征的問題,提出了一種融合Geronimo-Hardin-Massopust多小波分解的深度卷積神經(jīng)網(wǎng)絡(luò)模型(GHMMD-DCNN)。該模型思想是將多小波包分解與卷積神經(jīng)網(wǎng)絡(luò)深度融合,即設(shè)計(jì)多個(gè)一級(jí)多小波分解層以提取信號(hào)的低頻分量和高頻分量,再將多個(gè)一級(jí)多小波分解層與卷積層交替聯(lián)接,使模型能夠多尺度地提取并學(xué)習(xí)信號(hào)有用的時(shí)頻域信息,信號(hào)分解和特征學(xué)習(xí)交替執(zhí)行,進(jìn)而實(shí)現(xiàn)強(qiáng)噪聲魯棒特征提取。在不同工況下的航空高速軸承振動(dòng)數(shù)據(jù)上進(jìn)行測(cè)試,結(jié)果表明:所提模型訓(xùn)練時(shí)能夠快速達(dá)到穩(wěn)定收斂,并且識(shí)別準(zhǔn)確率均能達(dá)到99.9%以上;提出的方法在強(qiáng)噪聲干擾下的故障辨識(shí)準(zhǔn)確度和識(shí)別穩(wěn)定性均優(yōu)于對(duì)比方法,驗(yàn)證了其優(yōu)秀的抗噪聲干擾能力;在少訓(xùn)練樣本測(cè)試中,提出的方法在單類訓(xùn)練樣本數(shù)量為60時(shí)的平均診斷準(zhǔn)確率高達(dá)91.19%,相比于其他方法最低提升了13.19%,驗(yàn)證了GHMMD-DCNN模型具有更優(yōu)的低樣本泛化能力。
關(guān)鍵詞:多小波分解;卷積神經(jīng)網(wǎng)絡(luò);深度學(xué)習(xí);軸承故障診斷
中圖分類號(hào):TH17.文獻(xiàn)標(biāo)志碼:A
DOI:10.7652/xjtuxb202405004.文章編號(hào):0253-987X(2024)05-0031-11
Bearing Fault Diagnosis Method of Deep Convolutional Neural Network Based on Multiwavelet Decomposition
Abstract:To tackle the challenge of convolutional neural network and its integration methods with denoising preprocessing methods struggling to effectively extract useful signal features amidst high noise environments and low-quality data, a deep convolutional neural network model based on the Geronimo-Hardin-Massopust multiwavelet decomposition (GHMMD-DCNN) is proposed. The model’s concept revolves around deeply integrating the multiwavelet packet decomposition with the convolutional neural network. In other words, this involves the creation of multiple first-level multiwavelet decomposition layers to extract the low-frequency and high-frequency signal components, and these layers are lined alternately with the convolutional layer. This approach enables the model to extract and learn the useful time-frequency information of the signal on a multiscale basis. The signal decomposition and the feature learning are executed alternately, and robust feature extraction is realized even under strong noise conditions. Tests are carried out using aerospace high-speed bearing vibration data under different working conditions. The results show that the proposed model is able to reach stable convergence quickly and the recognition accuracy surpasses 99.9%. The proposed method showcases superior fault recognition accuracy and stability in the presence of significant noise interference compared to contrast methods, which demonstrates its excellent anti-noise ability. In the test of fewer training samples, the proposed method achieves an impressive average diagnosis accuracy of 91.19% with only 60 training samples per class. This represents a 13.19% enhancement over alternative methods, verifying the GHMMD-DCNN’s exceptional low-sample generalization ability.
Keywords:multiwavelet decomposition; convolutional neural network; deep learning; bearing fault diagnosis
2021年,國(guó)家工業(yè)和信息化部先后發(fā)布了《“十四五”大數(shù)據(jù)產(chǎn)業(yè)發(fā)展規(guī)劃》和《“十四五”智能制造發(fā)展規(guī)劃》,強(qiáng)化以數(shù)據(jù)驅(qū)動(dòng)發(fā)展新興產(chǎn)業(yè)并加快產(chǎn)業(yè)變革的戰(zhàn)略導(dǎo)向,力爭(zhēng)未來15年內(nèi)基本實(shí)現(xiàn)規(guī)模以上制造業(yè)企業(yè)全面普及數(shù)字化[1-2]。隨著數(shù)字化產(chǎn)業(yè)的推進(jìn),機(jī)械裝備逐漸朝著精密化、復(fù)雜化的方向發(fā)展,設(shè)備間的關(guān)聯(lián)性愈加緊密,機(jī)械故障診斷技術(shù)成為穩(wěn)步推進(jìn)制造業(yè)發(fā)展的重要保障[3-4]。滾動(dòng)軸承作為機(jī)械設(shè)備關(guān)鍵部件之一,廣泛應(yīng)用于兵器裝備、航空航天、風(fēng)力發(fā)電等領(lǐng)域[5]。統(tǒng)計(jì)表明,軸承故障約占達(dá)旋轉(zhuǎn)類機(jī)械總故障的30%~40%[6]。因此,對(duì)軸承進(jìn)行及時(shí)準(zhǔn)確地故障診斷能夠有效保障現(xiàn)代化機(jī)械設(shè)備的安全運(yùn)行。
目前,多數(shù)基于數(shù)據(jù)驅(qū)動(dòng)的軸承故障診斷方法建立于分析振動(dòng)信號(hào)的基礎(chǔ)上,傳統(tǒng)信號(hào)分析方法、淺層機(jī)器學(xué)習(xí)方法、深度學(xué)習(xí)方法是目前廣為應(yīng)用的故障診斷方法[7]。傳統(tǒng)信號(hào)分析方法基于時(shí)頻域分析等方法進(jìn)行特征提取,通過專家知識(shí)進(jìn)行特征頻率分析從而辨識(shí)故障,因此該方法依賴于操作人員的專業(yè)性。淺層機(jī)器學(xué)習(xí)方法通常采用核主成分分析[8]、K-L變換[9]等方法,對(duì)所提取的特征向量進(jìn)行特征選擇,再設(shè)計(jì)分類器進(jìn)行分類,如人工神經(jīng)網(wǎng)絡(luò)[10]、隱馬爾可夫模型[11]和支持向量機(jī)[12]等。淺層機(jī)器學(xué)習(xí)方法在故障特征選擇與辨識(shí)上減少了人工的參與,但仍然依賴人工經(jīng)驗(yàn)優(yōu)選特征向量。深度學(xué)習(xí)方法具有自動(dòng)提取故障特征的能力[13],避免了對(duì)專家知識(shí)的依賴,其強(qiáng)大的特征學(xué)習(xí)能力顯著提高了故障識(shí)別準(zhǔn)確率,是目前“大數(shù)據(jù)”時(shí)代國(guó)內(nèi)外各領(lǐng)域廣為關(guān)注的技術(shù)之一。
2012年,卷積神經(jīng)網(wǎng)絡(luò)(CNN)[14]在圖像識(shí)別展現(xiàn)出來的巨大優(yōu)勢(shì)迅速成為學(xué)術(shù)界研究的熱點(diǎn)。該網(wǎng)絡(luò)結(jié)構(gòu)主體一般由卷積層、激活層、池化層等組成,整個(gè)特征提取過程具有權(quán)值共享和空間不變性的特性[15]。近年來,CNN因其強(qiáng)大的自適應(yīng)特征提取能力在機(jī)械故障診斷領(lǐng)域中發(fā)揮出驚人的作用。Zhang等[16]提出了基于寬卷積核的深度卷積神經(jīng)網(wǎng)絡(luò)(WDCNN)模型,在第一個(gè)卷積層引入了大卷積核,有效捕捉了軸承振動(dòng)信號(hào)的中低頻特征??禎龋?7]將通道和時(shí)間注意力機(jī)制與多尺度CNN相融合,有力地提升了模型對(duì)軸承關(guān)鍵故障特征的提取能力。
滾動(dòng)軸承在實(shí)際運(yùn)行環(huán)境中常常受到機(jī)器系統(tǒng)和周圍環(huán)境的噪聲干擾,軸承發(fā)生故障時(shí)產(chǎn)生的瞬態(tài)故障脈沖成分通常淹沒在這些強(qiáng)背景噪聲中,導(dǎo)致CNN算法過度擬合無效特征而難以準(zhǔn)確識(shí)別故障。針對(duì)該問題的常見解決方案有兩種:①集成CNN模型與獨(dú)立的信號(hào)預(yù)處理步驟;②將傳統(tǒng)信號(hào)處理思想與CNN模型進(jìn)行融合。前者通常獨(dú)立進(jìn)行信號(hào)降噪預(yù)處理,再將處理過的信號(hào)輸送至CNN中進(jìn)行特征提取,實(shí)現(xiàn)難度低。但是,若信號(hào)降噪不足,模型仍將受到噪聲影響。反之,若信號(hào)降噪過度,有用信息也隨之減少,模型將過度擬合無效特征。因此,CNN與信號(hào)降噪預(yù)處理集成方法存在難以合理保留有用信息而導(dǎo)致有效特征提取不足的問題。后者能避免這一缺陷,并能充分發(fā)揮出傳統(tǒng)信號(hào)處理方法和CNN網(wǎng)絡(luò)各自的優(yōu)勢(shì)。例如,深度殘差收縮網(wǎng)絡(luò)(DRSN-CW)[18]融合了小波閾值去噪思想,添加了殘差模塊和自適應(yīng)閾值門限,使得學(xué)習(xí)到的高級(jí)特征可以變得更具鑒別性。Li等[19]將CNN第一層卷積核核函數(shù)更改為L(zhǎng)aplace小波核函數(shù),使CNN融合了連續(xù)小波變換的優(yōu)勢(shì)。Wang等[20]受小波包分解機(jī)制啟發(fā),提出了一種融合多層小波注意力機(jī)制的卷積神經(jīng)網(wǎng)絡(luò)(MWA-CNN)框架,其策略是將小波包分解與CNN深度融合,將多個(gè)單小波分解層嵌入CNN模型,使信號(hào)能夠逐層分解和特征學(xué)習(xí),有效地提升了CNN模型的抗噪聲能力。然而,目前將傳統(tǒng)信號(hào)處理方法和深度學(xué)習(xí)網(wǎng)絡(luò)深度融合的方式并不普遍,這是因?yàn)槎咴谔卣魈崛》矫婵赡艽嬖跊_突,模型的開發(fā)難度較高。因此,這種融合方法目前仍處于探索階段,但是該方法可以充分發(fā)揮兩者的優(yōu)勢(shì),對(duì)于提高信號(hào)處理和模式識(shí)別的性能仍具有很大的潛力。
受MWA-CNN啟發(fā),將有明確物理意義的傳統(tǒng)信號(hào)處理方法與CNN深度融合,是提升CNN特征提取性能的有效手段。相比于單小波,多小波兼具對(duì)稱性、正交性、短支撐性、高階消失矩的獨(dú)特優(yōu)勢(shì)[21],且多小波變換是一個(gè)多輸入-多輸出系統(tǒng),這為無額外數(shù)據(jù)增強(qiáng)條件下實(shí)現(xiàn)少標(biāo)簽樣本及強(qiáng)背景噪聲的軸承故障診斷提供了一種可能。
針對(duì)卷積神經(jīng)網(wǎng)絡(luò)易受噪聲干擾、識(shí)別性能嚴(yán)重依賴于大規(guī)模和高質(zhì)量數(shù)據(jù)的問題,以及CNN與信號(hào)降噪預(yù)處理集成方法存在難以合理地保留有用信息而導(dǎo)致有效特征提取不足的問題,本文基于機(jī)械故障診斷領(lǐng)域常用的Geronimo-Hardin-Massopust多小波,即GHM多小波,提出了一種融合GHM多小波分解的深度卷積神經(jīng)網(wǎng)絡(luò)(GHMMD-DCNN)軸承故障診斷模型。該模型將多個(gè)一級(jí)GHM多小波分解層與卷積層交替聯(lián)接,使模型能夠多尺度地學(xué)習(xí)信號(hào)有用的時(shí)頻域信息。模型將在航空發(fā)動(dòng)機(jī)高速軸承振動(dòng)信號(hào)數(shù)據(jù)上進(jìn)行實(shí)驗(yàn)測(cè)試,并與WDCNN、集成經(jīng)驗(yàn)?zāi)B(tài)分解方法的WDCNN(WDCNN-EMD)、DRSN-CW和以單小波為基礎(chǔ)的MWA-CNN進(jìn)行性能對(duì)比。
1.多小波變換理論
1.1.多小波理論
多小波理論的基本思想是,由多尺度函數(shù)生成多分辨率分析空間,在正交多分辨率分析空間中,其r重多尺度函數(shù)Φ(t)和r重多小波函數(shù)Ψ(t)滿足以下兩尺度關(guān)系[22]
式中:Hk與Gk為r×r的低通濾波器系數(shù)矩陣和高通濾波器系數(shù)矩陣;l為系數(shù)矩陣總數(shù)。
本文采用機(jī)械故障診斷領(lǐng)域中常用的GHM多小波[23],該小波為二重多小波,因此后文的分析均是在r=2的基礎(chǔ)上討論的,將不再重復(fù)說明。與單小波相比,GHM多小波在相同逼近階下具備更短的支撐,可以保證信號(hào)特征提取過程中能量分布更加集中;此外,GHM多小波具有兩個(gè)不同時(shí)頻性質(zhì)的基函數(shù),能夠多尺度地提取信號(hào)特征的不同部分[24]。GHM多小波兩尺度矩陣序列[25]分別為GHM多小波的多尺度函數(shù)1、2和多小波函數(shù)ψ1、ψ2如圖1所示??梢詮膱D中明確看出,1的支撐區(qū)間為[0,1],2、ψ1和ψ2的支撐區(qū)間為[0,2],GHM多小波的最大支撐區(qū)間為2,具有短支撐性。
1.2.離散多小波分解
離散多小波分解算法與單小波的Mallat塔形算法相似,不同之處在于多小波為r重矢量輸入。在進(jìn)行GHM多小波分解前,需要將一維信號(hào)轉(zhuǎn)為2維矢量輸入。重復(fù)預(yù)處理的前處理方式在信號(hào)降噪中已被證明效果較好[26],因此本文采用該處理方式對(duì)信號(hào)進(jìn)行預(yù)處理,即
式中:xk為一維信號(hào)輸入;c0,k為前處理后的二維矢量輸出;Q為重復(fù)預(yù)處理矩陣,具體為
離散GHM多小波分解過程如圖2所示,其中H和G分別為低通濾波器和高通濾波器的矩陣表示,2↓表示隔2抽樣,離散多小波分解算法表達(dá)式[27]如下
式中:cj-1,n為2維低頻分量;dj-1,n為2維高頻分量。
1.3.離散多小波包分解
離散多小波包分解同經(jīng)典小波包分解一樣,可以將細(xì)節(jié)分量進(jìn)行再分解,進(jìn)而提高細(xì)節(jié)分量的頻率分辨率[28]。軸承損傷所引發(fā)的振動(dòng)沖擊會(huì)激發(fā)系統(tǒng)固有振蕩,在高頻出現(xiàn)調(diào)制峰,因此對(duì)高頻部分進(jìn)行細(xì)分能夠更好地診斷故障,引入小波包分解是有必要的。多小波包分解過程如圖3所示,可以看出,多小波包分解對(duì)細(xì)節(jié)分量也按照樹結(jié)構(gòu)進(jìn)行了分解,每次分解也是矩陣運(yùn)算。
2.GHMMD-DCNN模型
本文結(jié)合GHM多小波包分解能夠多尺度提取出更豐富的頻率信息和CNN卷積采樣自動(dòng)提取局部特征的優(yōu)勢(shì),將多個(gè)GHM多小波分解層與卷積層深度集成,構(gòu)建了融合GHM多小波分解的深度卷積神經(jīng)網(wǎng)絡(luò)模型,整體架構(gòu)如圖4所示。整個(gè)網(wǎng)絡(luò)由1個(gè)重復(fù)預(yù)處理層、5個(gè)一級(jí)多小波分解模塊、6個(gè)卷積模塊、1個(gè)全局平均池化層和1個(gè)全連接層組成。
首先,將原始一維軸承振動(dòng)信號(hào)按照固定樣本長(zhǎng)度分割,得到足夠數(shù)量的一維樣本序列,將歸一化后的樣本序列輸送到預(yù)處理層中按式(5)和式(6)進(jìn)行重復(fù)預(yù)處理,轉(zhuǎn)換為二維矢量輸入,每一維向量長(zhǎng)度與初始長(zhǎng)度一致。然后,將二維矢量輸送到多小波分解模塊,按式(7)和式(8)進(jìn)行一級(jí)GHM多小波分解,得到低頻分量和高頻分量,將兩分量拼接組合后輸送到卷積模塊中進(jìn)行自動(dòng)特征提取。卷積模塊由卷積層、批歸一化層(BN)、ReLU激活層組成,卷積層提取時(shí)域和頻域的重要特征,BN層能夠提升網(wǎng)絡(luò)訓(xùn)練效率,ReLU層將所有的負(fù)值設(shè)置為0,網(wǎng)絡(luò)的稀疏性得以提高,能夠節(jié)省計(jì)算資源。由于多小波分解層中包含降采樣操作,因此本模型不采用最大池化層進(jìn)行特征降維。
卷積模塊從各頻段分量學(xué)習(xí)有用的故障特征信息,將所提取特征分量再輸送到多小波分解層,進(jìn)行一級(jí)GHM多小波分解,得到多個(gè)特征分量的多頻段信息,再次將這些分量組合拼接輸送至卷積模塊。一級(jí)多小波分解層與卷積層再循環(huán)3次交替執(zhí)行,該循環(huán)執(zhí)行完成后,使用卷積模塊進(jìn)行重復(fù)特征提取。信號(hào)的時(shí)域特征和頻率特征能夠被逐層分解和學(xué)習(xí),在深層信號(hào)分解和特征學(xué)習(xí)的過程中,模型能夠更加有效地區(qū)分出有效信號(hào)與噪聲信號(hào)的信息差異,從而學(xué)習(xí)到有價(jià)值的信息。
為了防止過擬合,在一級(jí)多小波分解層后引入隨機(jī)失活層,隨機(jī)失活率設(shè)為0.2。同樣地,為防止全連接輸出層中權(quán)重參數(shù)過多而導(dǎo)致網(wǎng)絡(luò)過擬合,將全局平均池化層置于最后一個(gè)卷積模塊后,用于計(jì)算特征分量每個(gè)通道平均值,最后利用全連接層和Softmax函數(shù)量衡出每個(gè)類別節(jié)點(diǎn)對(duì)應(yīng)的概率值。模型采用交叉熵?fù)p失函數(shù)衡量輸出類別與真實(shí)類別的差距,公式為
式中:J為軸承健康狀態(tài)總類別數(shù)量;q(xj)為樣本屬于第j類的預(yù)測(cè)概率;p(xj)為樣本屬于第j類的真實(shí)概率。
在模型結(jié)構(gòu)參數(shù)設(shè)置上,信號(hào)的輸入長(zhǎng)度為4 096。多小波分解層中對(duì)輸入信號(hào)進(jìn)行周期延拓以保證所分解得到的信號(hào)長(zhǎng)度為原始信號(hào)長(zhǎng)度的一半,其輸出通道為輸入通道的2倍。本文模型具體參數(shù)如表1所示,其中輸出維度“2×4 096”表示通道數(shù)為2,長(zhǎng)度為4 096,卷積核參數(shù)“4×16×3×2”為輸入通道×輸出通道×核大小×步長(zhǎng)。
模型的訓(xùn)練流程如圖5所示,采用具有自適應(yīng)學(xué)習(xí)率特性的Adam優(yōu)化器更新網(wǎng)絡(luò)參數(shù),初始學(xué)習(xí)率設(shè)定為0.001,最大輪次設(shè)置為100。為防止學(xué)習(xí)率過大導(dǎo)致模型無法穩(wěn)定地收斂到最優(yōu)解,采用固定步長(zhǎng)學(xué)習(xí)率衰減,在第40輪、第80輪學(xué)習(xí)率以0.1的衰減率進(jìn)行衰減。記錄并保存100輪內(nèi)驗(yàn)證效果最優(yōu)的網(wǎng)絡(luò)參數(shù),最后在測(cè)試集上進(jìn)行故障診斷測(cè)試,實(shí)現(xiàn)軸承故障辨識(shí)任務(wù)。
3.實(shí)驗(yàn)驗(yàn)證與分析
3.1.數(shù)據(jù)集準(zhǔn)備
本文使用的軸承振動(dòng)信號(hào)數(shù)據(jù)集來源于意大利都靈理工大學(xué)機(jī)械和航天工程系搭建的航空發(fā)動(dòng)機(jī)高速軸承實(shí)驗(yàn)臺(tái)[29],其全局構(gòu)造如圖6(a)所示,軸承與加速度傳感器安裝位置如圖6(b)所示。其中B1、B2和B3處分別安裝3個(gè)同軸連接的航空發(fā)動(dòng)機(jī)高速軸承,軸承如圖6(c)所示,軸承詳細(xì)信息可參見文獻(xiàn)[29],其中B1為被試軸承。圖6(b)中A1、A2處均采用加速度傳感器分別記錄x、y和z方向的輸出,輸出共計(jì)為6個(gè)通道的數(shù)據(jù)。6個(gè)通道的數(shù)據(jù)均在采樣頻率51 200 Hz下收集,采樣時(shí)長(zhǎng)為10 s。軸承存在無損傷、壓痕直徑為450、250、150 μm的內(nèi)圈損傷、壓痕直徑為450、250、150 μm的滾動(dòng)體損傷,共計(jì)7種狀態(tài),7種狀態(tài)依次記為0~6。
本文在3個(gè)工況下測(cè)試所提出模型的性能,為了簡(jiǎn)潔表達(dá),分別標(biāo)記為WC1、WC2和WC3,具體信息如表2所示。實(shí)驗(yàn)采用4 096個(gè)數(shù)據(jù)點(diǎn)作為一段信號(hào)輸入,并做最大最小值歸一化處理。每一工況下每一類軸承故障振動(dòng)信號(hào)有6×512 000個(gè)樣本點(diǎn),以相鄰兩段信號(hào)的重疊率為26%的方式進(jìn)行數(shù)據(jù)分割,可以準(zhǔn)備1 000個(gè)樣本。其中,訓(xùn)練、驗(yàn)證和測(cè)試樣本數(shù)量分別為500、200和300,即對(duì)于每一工況下的數(shù)據(jù)集,共計(jì)訓(xùn)練樣本3 500個(gè)、驗(yàn)證樣本1 400個(gè)和測(cè)試樣本2 100個(gè),測(cè)試、驗(yàn)證與訓(xùn)練樣本之間無樣本點(diǎn)重疊。
3.2.GHMMD-DCNN模型故障診斷結(jié)果分析
本文基于Pytorch框架搭建GHMMD-DCNN模型,計(jì)算機(jī)顯卡為NVIDIA GeForce RTX 2080 GPU。為降低深度網(wǎng)絡(luò)訓(xùn)練學(xué)習(xí)隨機(jī)性的影響,進(jìn)行5次重復(fù)實(shí)驗(yàn),3個(gè)工況WC1、WC2、WC3下的準(zhǔn)確率分別為(99.990 5±0.0261)%、100%、100%,可以發(fā)現(xiàn)模型的穩(wěn)定性很好,在不同工況下也能夠保證識(shí)別準(zhǔn)確率達(dá)到99.9%以上。為進(jìn)一步測(cè)試模型的訓(xùn)練性能,在工況WC2下觀測(cè)模型在訓(xùn)練集和驗(yàn)證集上的損失函數(shù)與識(shí)別準(zhǔn)確率隨訓(xùn)練輪次變化的曲線,分別如圖7和圖8所示??梢钥闯?,模型在訓(xùn)練集與驗(yàn)證集上的曲線變化高度一致,表明模型沒有發(fā)生過擬合現(xiàn)象,而且模型的收斂速度很快,訓(xùn)練集約在第11輪訓(xùn)練時(shí)識(shí)別準(zhǔn)確率達(dá)到99%,約在第41輪訓(xùn)練后訓(xùn)練集和驗(yàn)證集的識(shí)別準(zhǔn)確率均達(dá)到100%。模型保持穩(wěn)定收斂,表明所設(shè)計(jì)的GHMMD-DCNN模型是合理可行的。
3.3.不同方法診斷結(jié)果對(duì)比分析
為更全面地測(cè)試GHMMD-DCNN模型的性能,與WDCNN、WDCNN-EMD、DRSN-CW、MWA-CNN方法進(jìn)行對(duì)比測(cè)試。WDCNN為普通的卷積神經(jīng)網(wǎng)絡(luò),特別之處在于第一個(gè)卷積層選取大卷積核,此處卷積核大小設(shè)為64;WDCNN-EMD方法先將振動(dòng)信號(hào)進(jìn)行經(jīng)驗(yàn)?zāi)B(tài)分解和重構(gòu),再將處理后的信號(hào)輸送至WDCNN訓(xùn)練;DRSN-CW為殘差網(wǎng)絡(luò)的改進(jìn)模型,能逐層實(shí)現(xiàn)信號(hào)自適應(yīng)降噪;本文所提出GHMMD-DCNN模型是在MWA-CNN的基礎(chǔ)上改進(jìn)的,區(qū)別在于MWA-CNN使用的是單小波,此處選用文獻(xiàn)[20]中優(yōu)選的“db16”小波。
圖9為工況WC3下各方法的診斷結(jié)果,可明確看出,本文提出方法GHMMD-DCNN在識(shí)別準(zhǔn)確性及診斷穩(wěn)定性均表現(xiàn)為最優(yōu);MWA-CNN和DRSN-CW的識(shí)別性能次之,準(zhǔn)確率分別為(99.895 2±0.118 6)%和(99.666 7±0.134 7)%,診斷穩(wěn)定性較高;WDCNN-EMD方法的識(shí)別準(zhǔn)確率最低,為(94.238 1±1.105)%,實(shí)驗(yàn)結(jié)果波動(dòng)較大,表明該方法的性能易受數(shù)據(jù)擾動(dòng)。與WDCNN方法相比,WDCNN-EMD的平均準(zhǔn)確率降低了2.038 1%,表明卷積神經(jīng)網(wǎng)絡(luò)對(duì)經(jīng)過EMD分解重構(gòu)預(yù)處理后的信號(hào)特征提取效果并不如直接對(duì)原始信號(hào)進(jìn)行特征提取,說明信號(hào)在預(yù)處理過程中雖去除了部分噪聲信息,但也去除了部分關(guān)鍵故障信息,CNN存在有效特征提取不足的情況。
為進(jìn)一步驗(yàn)證所提出方法在特征提取能力方面的優(yōu)越性,使用t分布隨機(jī)近鄰嵌入(t-SNE)方法對(duì)各模型輸出的特征降維,可視化結(jié)果如圖10所示。在圖10(a)和10(b)中可發(fā)現(xiàn),各類特征類內(nèi)聚合程度較好,但標(biāo)簽為2、3、5的三類故障特征在降維空間中存在重疊現(xiàn)象,分類邊界混淆,即WDCNN和WDCNN-EMD難以完全區(qū)分壓痕直徑為250、150 μm的內(nèi)圈損傷和壓痕直徑為250 μm的滾動(dòng)體損傷。根據(jù)圖10(c),DRSN-CW能夠較好地區(qū)分出7種軸承健康狀態(tài),但分類邊界冗余復(fù)雜,部分類內(nèi)部存在多個(gè)聚類簇,類內(nèi)數(shù)據(jù)點(diǎn)聚合程度較差,表明模型沒有學(xué)習(xí)到足夠泛化的特征;MWA-CNN的特征降維結(jié)果仍存在同樣的問題,從圖10(d)可以看出,標(biāo)簽為0、2、3、4的故障特征類內(nèi)聚合程度較差,即無損傷、壓痕直徑為250、150 μm的內(nèi)圈損傷和壓痕直徑為450 μm的滾動(dòng)體損傷的類內(nèi)特征差異被過度學(xué)習(xí),存在過擬合現(xiàn)象。根據(jù)圖10(e),GHMMD-DCNN的t-SNE結(jié)果最優(yōu),各類的分類邊界清晰分明,不同類別的數(shù)據(jù)點(diǎn)距離較大,類內(nèi)數(shù)據(jù)點(diǎn)聚合程度高,表明模型的具有更優(yōu)的數(shù)據(jù)聚類和分離能力。對(duì)MWA-CNN和DRSN-CW的特征表征效果不佳問題進(jìn)行分析,可能的原因是數(shù)據(jù)多樣性不足或數(shù)據(jù)量不足,模型過度適應(yīng)訓(xùn)練數(shù)據(jù)的細(xì)節(jié)特點(diǎn),導(dǎo)致泛化性能較差。這表明所提出模型GHMMD-DCNN能夠在少量帶標(biāo)簽訓(xùn)練樣本上訓(xùn)練出泛化性能較強(qiáng)的模型,從而高效率且高準(zhǔn)確率地實(shí)現(xiàn)軸承故障診斷。
為了進(jìn)行噪聲魯棒性故障診斷測(cè)試,對(duì)原始振動(dòng)數(shù)據(jù)添加不同強(qiáng)弱的高斯白噪聲,采用信噪比(R)來評(píng)價(jià)噪聲強(qiáng)弱,公式為
式中:Ps和Pn分別表示原始振動(dòng)信號(hào)與額外添加高斯白噪聲信號(hào)的能量。
本次實(shí)驗(yàn)將在信噪比分別為-4、-2、0、2、4 dB的5種噪聲條件下進(jìn)行故障識(shí)別測(cè)試,每次測(cè)試仍然進(jìn)行5次重復(fù)實(shí)驗(yàn)。圖11和圖12分別為工況WC1、WC2下的準(zhǔn)確率結(jié)果,可以看出,WDCNN和WDCNN-EMD的性能嚴(yán)重受噪聲干擾,經(jīng)過經(jīng)驗(yàn)?zāi)B(tài)分解預(yù)處理的信號(hào)并沒有起到提高模型性能的作用,甚至降低了模型的分類準(zhǔn)確度;而GHMMD-DCNN在兩個(gè)工況的不同噪聲條件下的診斷結(jié)果均表現(xiàn)出色。
在WC1下,WDCNN、WDCNN-EMD、DRSN-CW、MWA-CNN和GHMMD-DCNN方法在R=4 dB下的準(zhǔn)確率分別為(87.581±1.136 1)%、(84.762±1.407 8)%、(97.619±0.436 4)%、(98.352 4±0.524 5)%、(99.21±0.114 7)%。在R=-4 dB下,5種方法的準(zhǔn)確率分別為(50.305±2.873)%、(50.152 4±1.374)%、(80.552 4±1.661 4)%、(86.409 5±1.464 1)%、(89.276 2±0.311 2)%,平均識(shí)別準(zhǔn)確率相比于R=4 dB下的診斷結(jié)果分別下降了37.276%、34.609 5%、17.066 7%、11.942 9%和9.933 3%。所提出GHMMD-DCNN模型的識(shí)別準(zhǔn)確率顯著高于WDCNN、WDCNN-EMD和DRSN-CW,比WDCNN的準(zhǔn)確率提升了38.971 2%,而相比于MWA-CNN方法,GHMMD-DCNN的準(zhǔn)確率約提升2.866 7%。對(duì)比該工況下WDCNN、WDCNN-EMD結(jié)果可發(fā)現(xiàn),在這5種不同強(qiáng)弱的噪聲環(huán)境中,WDCNN-EMD的識(shí)別準(zhǔn)確率均不如WDCNN,表明在強(qiáng)噪聲背景下使用信號(hào)降噪預(yù)處理方法容易去除有用的故障信息。
相比于WC1,WC2為負(fù)載高轉(zhuǎn)速較低的工作環(huán)境,因此故障特征更加微弱隱蔽,對(duì)比圖11和圖12,可以發(fā)現(xiàn)各方法的識(shí)別準(zhǔn)確率均有下降。兩個(gè)普通的CNN方法的平均分類準(zhǔn)確率在R=-4 dB時(shí)僅為29.666 7%和28.4%,嚴(yán)重受噪聲干擾,顯然模型過擬合噪聲細(xì)節(jié),很難提取出有用的故障信息。根據(jù)圖12可知,GHMMD-DCNN模型的識(shí)別準(zhǔn)確性和識(shí)別穩(wěn)定性顯著優(yōu)于WDCNN、WDCNN-EMD和DRSN-CW;與MWA-CNN相比,GHMMD-DCNN模型在信噪比為-4、-2、0、2、4 dB情況下的平均準(zhǔn)確率分別提升了4.485 7%、3.4%、2.552 4%、1.876 2%和1.333 3%,且GHMMD-DCNN的穩(wěn)定性仍優(yōu)于MWA-CNN,表明模型具有較優(yōu)的噪聲魯棒性。
為進(jìn)一步考察GHMMD-DCNN模型的泛化能力,在工況WC1下對(duì)每類帶標(biāo)簽訓(xùn)練樣本數(shù)量分別為30、60、90、120的數(shù)據(jù)進(jìn)行測(cè)試,每類測(cè)試集樣
本數(shù)量為300,對(duì)比方法仍然為前文所述的4種方法,實(shí)驗(yàn)結(jié)果如表3所示。可以看出,GHMMD-DCNN模型的識(shí)別準(zhǔn)確率顯著高于其他4類方法,在單類訓(xùn)練樣本數(shù)量為30時(shí)平均診斷準(zhǔn)確率比WDCNN、WDCNN-EMD、DRSN-CW、MWA-CNN分別提升了29.31%、29.44%、17.2%、8.57%;所提方法在單類訓(xùn)練樣本數(shù)量為60時(shí)的平均識(shí)別準(zhǔn)確率達(dá)91.19%,比其他4類方法分別提升了28.84%、30.74%、14.84%、13.19%。GHMMD-DCNN模型為MWA-CNN的改進(jìn)模型,相比于MWA-CNN,本文模型在單類訓(xùn)練樣本數(shù)量為90和120條件下的識(shí)別準(zhǔn)確率仍然有所提升,分別提升了7.96%和7.86%。以上結(jié)果表明,本文模型具有更優(yōu)的低樣本泛化能力。
4.結(jié).論
本文從信號(hào)處理方法與卷積神經(jīng)網(wǎng)絡(luò)深度融合的角度出發(fā),提出了一種能夠多尺度地提取并學(xué)習(xí)信號(hào)有用信息的GHMMD-DCNN模型,在航空發(fā)動(dòng)機(jī)高速軸承上進(jìn)行了故障診斷測(cè)試,得到了以下結(jié)論。
(1)所提出模型GHMMD-DCNN交替執(zhí)行信號(hào)分解和特征學(xué)習(xí)兩過程,深層次并多尺度地從多個(gè)頻帶分量中學(xué)習(xí)故障特征信息與噪聲細(xì)節(jié)的差別,進(jìn)而提高模型的抗噪聲能力。實(shí)驗(yàn)結(jié)果表明,提出的模型能夠快速收斂達(dá)到穩(wěn)定,在無額外噪聲添加的情況下識(shí)別準(zhǔn)確率均能達(dá)到99.9%,所提取特征的t-SNE結(jié)果中,類間邊界分明、類內(nèi)數(shù)據(jù)點(diǎn)聚合程度高,表明所提出模型具有良好的泛化能力。
(2)抗噪性能測(cè)試結(jié)果表明,GHMMD-DCNN模型的識(shí)別準(zhǔn)確性和識(shí)別穩(wěn)定性均顯著優(yōu)于普通CNN方法和集成經(jīng)驗(yàn)?zāi)B(tài)分解信號(hào)預(yù)處理的CNN方法,且該模型在各個(gè)噪聲條件下的診斷結(jié)果均優(yōu)于MWA-CNN,表明將多小波分解方法與卷積神經(jīng)網(wǎng)絡(luò)深度融合的GHMMD-DCNN模型對(duì)于抗噪聲干擾是有效的。
(3)低訓(xùn)練樣本測(cè)試結(jié)果表明,所提出方法顯著優(yōu)于其他對(duì)比方法。與原基礎(chǔ)模型MWA-CNN相比,所提出的模型在單類訓(xùn)練樣本數(shù)量為30、60、90和120的平均識(shí)別準(zhǔn)確率分別提升了8.57%、13.19%、7.96%和7.86%,表明該模型在訓(xùn)練樣本量少的條件下仍能學(xué)習(xí)到數(shù)據(jù)的真實(shí)分布和特征,模型存在更優(yōu)的低樣本泛化能力。
參考文獻(xiàn):
[1]趙碧. “十四五”大數(shù)據(jù)產(chǎn)業(yè)發(fā)展規(guī)劃發(fā)布 [J]. 中國(guó)產(chǎn)經(jīng)新聞, 2021-12-02(2).
[2]董凱. “十四五”智能制造發(fā)展規(guī)劃解讀及趨勢(shì)研判 [J]. 中國(guó)工業(yè)和信息化, 2022(1): 24-29.
DONG Kai. Interpretation and trend analysis of the 14th Five Year Plan for the development of intelligent manufacturing China industry and information technology [J]. China Industry amp; Information Technology, 2022(1): 24-29.
[3]陳雪峰, 訾艷陽. 智能運(yùn)維與健康管理 [M]. 北京: 機(jī)械工業(yè)出版社, 2018.
[4]雷亞國(guó), 賈峰, 孔德同, 等. 大數(shù)據(jù)下機(jī)械智能故障診斷的機(jī)遇與挑戰(zhàn) [J]. 機(jī)械工程學(xué)報(bào), 2018, 54(5): 94-104.
LEI Yaguo, JIA Feng, KONG Detong, et al. Opportunities and challenges of machinery intelligent fault diagnosis in big data era [J]. Journal of Mechanical Engineering, 2018, 54(5): 94-104.
[5]何正嘉, 陳進(jìn), 王太勇, 等. 機(jī)械故障診斷理論及應(yīng)用 [M]. 北京: 高等教育出版社, 2010.
[6]時(shí)獻(xiàn)江, 王桂榮, 司俊山. 機(jī)械故障診斷及典型案例解析 [M]. 北京: 化學(xué)工業(yè)出版社, 2013.
[7]LEI Yaguo, YANG Bin, JIANG Xinwei, et al. Applications of machine learning to machine fault diagnosis: a review and roadmap [J]. Mechanical Systems and Signal Processing, 2020, 138: 106587.
[8]LIU Xiaozhi, XIE Jie, LUO Yanhong, et al. A novel power transformer fault diagnosis method based on data augmentation for KPCA and deep residual network [J]. Energy Reports, 2023, 9(8): 620-627.
[9]徐統(tǒng), 王紅軍, 宋智勇, 等. 基于K-L散度的VMD瞬時(shí)能量與PNN的滾動(dòng)軸承故障診斷 [J]. 電子測(cè)量與儀器學(xué)報(bào), 2019, 33(8): 117-123.
XU Tong, WANG Hongjun, SONG Zhiyong, et al. Rolling bearing fault diagnosis using VMD energy feature and PNN based on Kullback-Leibler divergence [J]. Journal of Electronic Measurement and Instrumentation, 2019, 33(8): 117-123.
[10]UNAL M, ONAT M, DEMETGUL M, et al. Fault diagnosis of rolling bearings using a genetic algorithm optimized neural network [J]. Measurement, 2014, 58: 187-196.
[11]LPEZ C, NARANJO , LU Siliang, et al. Hidden Markov model based stochastic resonance and its application to bearing fault diagnosis [J]. Journal of Sound and Vibration, 2022, 528: 116890.
[12]張?chǎng)危?趙建民, 李海平, 等. 基于NIC-DWT-WOASVM的齒輪箱混合故障診斷 [J]. 振動(dòng)與沖擊, 2020, 39(11): 146-151, 164.
ZHANG Xin, ZHAO Jianmin, LI Haiping, et al. Compound fault diagnosis for gearbox based on NIC-DWT-WOASVM [J]. Journal of Vibration and Shock, 2020, 39(11): 146-151, 164.
[13]HINTON G E, SALAKHUTDINOV R R. Reducing the dimensionality of data with neural networks [J]. Science, 2006, 313(5786): 504-507.
[14]KRIZHEVSKY A, SUTSKEVER I, HINTON G E. ImageNet classification with deep convolutional neural networks [J]. Communications of the ACM, 2017, 60(6): 84-90.
[15]MCAULEY J J, RAMISA A, CAETANO T S. Optimization of robust loss functions for weakly-labeled image taxonomies [J]. International Journal of Computer Vision, 2013, 104(3): 343-361.
[16]ZHANG Wei, PENG Gaoliang, LI Chuanhao, et al. A new deep learning model for fault diagnosis with good anti-noise and domain adaptation ability on raw vibration signals [J]. Sensors, 2017, 17(2): 425.
[17]康濤, 段蓉凱, 楊磊, 等. 融合多注意力機(jī)制的卷積神經(jīng)網(wǎng)絡(luò)軸承故障診斷方法 [J]. 西安交通大學(xué)學(xué)報(bào), 2022, 56(12): 68-77.
KANG Tao, DUAN Rongkai, YANG Lei, et al. Bearing fault diagnosis using convolutional neural network based on a multi-attention mechanism [J]. Journal of Xi’an Jiaotong University, 2022, 56(12): 68-77.
[18]ZHAO Minghang, ZHONG Shisheng, FU Xuyun, et al. Deep residual shrinkage networks for fault diagnosis [J]. IEEE Transactions on Industrial Informatics, 2020, 16(7): 4681-4690.
[19]LI Tianfu, ZHAO Zhibin, SUN Chuang, et al. Wavelet KernelNet: an interpretable deep neural network for industrial intelligent diagnosis [J]. IEEE Transactions on Systems, Man, and Cybernetics: Systems, 2022, 52(4): 2302-2312.
[20]WANG Huan, LIU Zhiliang, PENG Dandan, et al. Interpretable convolutional neural network with multilayer wavelet for noise-robust machinery fault diagnosis [J]. Mechanical Systems and Signal Processing, 2023, 195: 110314.
[21]劉志剛, 錢清泉. 自適應(yīng)閾值多小波故障暫態(tài)信號(hào)去噪方法 [J]. 系統(tǒng)工程與電子技術(shù), 2004, 26(7): 878-880.
LIU Zhigang, QIAN Qingquan. Adaptive shrinkage value de-noising method of fault transient signals with multiwavelets [J]. Systems Engineering and Electronics, 2004, 26(7): 878-880.
[22]袁靜, 何正嘉, 王曉東, 等. 平移不變多小波相鄰系數(shù)降噪方法及其在監(jiān)測(cè)診斷中的應(yīng)用 [J]. 機(jī)械工程學(xué)報(bào), 2009, 45(4): 155-160.
YUAN Jing, HE Zhengjia, WANG Xiaodong, et al. Translation-invariant multiwavelets denoising using neighboring coefficients and its application to monitoring and diagnosis [J]. Journal of Mechanical Engineering, 2009, 45(4): 155-160.
[23]洪連環(huán). 面向航空發(fā)動(dòng)機(jī)轉(zhuǎn)子系統(tǒng)故障識(shí)別的多小波方法研究 [D]. 南京: 南京航空航天大學(xué), 2020.
[24]陳景龍. 自適應(yīng)多小波的時(shí)頻域優(yōu)化構(gòu)造與機(jī)械故障特征提取方法 [D]. 西安: 西安交通大學(xué), 2014.
[25]GERONIMO J S, HARDIN D P, MASSOPUST P R. Fractal functions and wavelet expansions based on several scaling functions [J]. Journal of Approximation Theory, 1994, 78(3): 373-401.
[26][JP+4]BUI T D, CHEN Guangyi. [JP+5]Translation-invariant denoising using multiwavelets [J]. IEEE Transactions on Signal Processing, 1998, 46(12): 3414-3420.
[27]SUN Hailiang, HE Zhengjia, ZI Yanyang, et al. Multiwavelet transform and its applications in mechanical fault diagnosis: a review [J]. Mechanical Systems and Signal Processing, 2014, 43(1/2): 1-24.
[28]李東敏. 基于多小波包和人工神經(jīng)網(wǎng)絡(luò)的電力系統(tǒng)故障類型識(shí)別研究 [D]. 成都: 西南交通大學(xué), 2008.
[29]DAGA A P, FASANA A, MARCHESIELLO S, et al. The Politecnico di Torino rolling bearing test rig: description and analysis of open access data [J]. Mechanical Systems and Signal Processing, 2019, 120: 252-273.