余傳糧,梁睿君,冉文豐,王志強
(南京航空航天大學 機電學院,江蘇 南京 210016)
齒輪箱主要由齒輪、軸承、旋轉(zhuǎn)軸等旋轉(zhuǎn)部件組成,具有傳動轉(zhuǎn)矩大、承載能力強等優(yōu)點,廣泛應用在風力發(fā)電、航空、船舶、冶金、石化、礦山等機械傳動系統(tǒng)[1]。齒輪箱通常工作在高速、重載等環(huán)境下,因此齒輪箱部件易出現(xiàn)各種故障,導致整個傳動系統(tǒng)失效,造成經(jīng)濟財產(chǎn)損失甚至人員傷亡[2]。為確保其安全可靠運行,對齒輪與軸承等關鍵部件進行故障診斷具有重要意義。
針對故障診斷的重要性,許多國內(nèi)外學者開展了關于軸承或齒輪的故障診斷研究。例如,代士超等[3]提出了一種基于同步平均和倒頻譜編輯的齒輪箱滾動軸承故障分離診斷方法,提高了齒輪箱滾動軸承故障診斷的準確性。付勝等[4]針對大型設備的齒輪運行環(huán)境噪聲干擾大和缺少故障樣本的特點,提出了基于奇異值分解和支持向量機相結合的齒輪故障診斷方法,實現(xiàn)了對齒輪進行快速、準確地故障診斷。JAWADEKAR A等[5]利用CWT 系數(shù)的最小值和反向傳播(BP)神經(jīng)網(wǎng)絡,實現(xiàn)了感應電動機的智能故障診斷。上述方法有兩個主要問題:
1)這種人為干預的特征提取需要很多有關信號處理技術和診斷專業(yè)知識的先驗知識,既費時又費力;
2)對特征的提取和分類都對故障診斷性能有著重要的影響,然而傳統(tǒng)的故障診斷方法中,這兩個階段是分開設計和執(zhí)行的,所以沒辦法同時對兩者進行優(yōu)化進而提高診斷性能。
因此,更為有效的故障診斷方式應該能夠?qū)⑻卣魈崛『吞卣鞣诸惤y(tǒng)一在一個框架之下。目前,已有部分學者提出了基于深度學習的端到端的故障診斷方法,這種方法能直接從原始信號中提取有用的特征并對故障進行識別。
卷積神經(jīng)網(wǎng)絡(convolutional neural network,CNN)具有能夠自動提取信號局部空間特征和整合各局部特征的能力,而且深度學習理論的發(fā)展使其能夠隨著網(wǎng)絡層數(shù)的增加而提升其特征表達能力和泛化能力,所以在計算機視覺[6-7]及自然語言處理領域[8-9]已有非常良好和廣泛的應用。一些學者也在故障診斷領域應用了該網(wǎng)絡模型。例如JANSSENS O等[10]采用帶有一個卷積層和一個全連接層的卷積神經(jīng)網(wǎng)絡來診斷軸承的健康狀況。
針對上述問題,本文提出了一種基于STFT和CNN的齒輪箱智能故障診斷方法,即對齒輪箱的振動信號通過STFT生成時頻圖,再將其輸入CNN中給出結果,以實現(xiàn)齒輪箱齒輪故障的智能診斷。
短時傅里葉變換是一種時頻分析方法,主要用于分析時變、非平穩(wěn)信號。該變換能將一維的振動信號變換為CNN易于處理的二維矩陣,這種矩陣是包含時頻域信息的特征譜。短時傅里葉變換是從傅里葉變換的基礎上發(fā)展而來,其基本思想先把一個函數(shù)和窗函數(shù)進行相乘,然后再進行一維的傅里葉變換,并通過窗函數(shù)的滑動得到一系列的頻譜函數(shù),將這些結果依次拼接得到一個二維的時頻圖。基本運算公式如下:

(1)
式中:x(t)為時域信號;h(t-ω)為窗函數(shù)。
對于STFT,窗函數(shù)類型和窗的寬度的選取是影響其變換效果的兩個重要因素。好的窗函數(shù)在變換過程中能有效減少頻譜泄露和譜間干擾,而窗的寬度則影響著時域和頻域的相對分辨率:窗寬則頻率分辨率高,窗窄則時間分辨率高。
a)網(wǎng)絡結構
CNN是一類包含卷積計算且具有深度結構的前饋神經(jīng)網(wǎng)絡,近年來在圖像處理、目標檢測方面有著出色的表現(xiàn)。它能很好地應對神經(jīng)網(wǎng)絡訓練中常出現(xiàn)的過擬合問題,使大規(guī)模的深度學習得以實現(xiàn)。CNN一般由卷積層、池化層和全連接層構成,典型的卷積神經(jīng)網(wǎng)絡結構如圖1所示。卷積層的作用是提取一個局部區(qū)域的特征;池化層的作用是進行特征選擇,降低特征數(shù)量,并從而減少參數(shù)數(shù)量;卷積神經(jīng)網(wǎng)絡一般由多個卷積層和池化層交替構成。全連接層用于對提取的特征進行分類以輸出結果。
本文所用CNN 的結構如圖1所示。輸入特征圖的大小為65×65;中間層由3層卷積層和3層采樣層交替組成,卷積層的卷積核個數(shù)分別為6、8、10,卷積核的大小取3×3,激活函數(shù)選擇ReLU函數(shù);池化層選擇最大池化,分類器選擇Softmax分類器。

圖1 CNN結構
b)訓練過程
基于STFT和CNN的智能故障診斷方法模型的訓練方式如下:
1)在齒輪箱故障試驗臺上通過加速度傳感器采集齒輪在不同狀態(tài)下的振動信號,并通過數(shù)據(jù)分割構造數(shù)據(jù)樣本;
2)對樣本集中的振動信號進行短時傅里葉變換,生成時頻圖,構造特征圖樣本集;將特征樣本集隨機打亂按照一定比例分為訓練樣本集、驗證樣本集和測試樣本集;
3)構建CNN 模型,初始化模型參數(shù);
4)使用訓練樣本集對CNN進行訓練,當所有批樣本訓練完后用驗證集對模型進行初步評估,并開始下一輪次訓練,重復該過程直至所有輪次迭代完畢;
5)訓練完成,使用測試集評估模型最終訓練效果。
在如圖2所示的齒輪箱動力學模擬實驗臺上采集不同齒輪故障狀態(tài)下的振動信號。實驗使用NI 9234采集卡和型號為356A16的三向傳感器采集加速度信號。采樣頻率設置為12kHz,電機轉(zhuǎn)速設置為1 800 r/min, 負載分別設置為(0、4.5、9.0、13.6、18.1)N·m((0、40、80、120、160)lb·in)。

圖2 齒輪箱動力學試驗臺
齒輪箱的故障形式主要是齒輪故障,故障模式共有5種:缺損、缺齒、齒面磨損、齒根磨損和偏心。具體的故障類型描述見表1。

表1 故障類型描述
圖3為轉(zhuǎn)速為1 800 r/min、負載為9.0 N·m(80 1b·in)、不同故障狀態(tài)下的振動信號波形圖。從圖中可以看到,不同狀態(tài)的時域波形存在一定的區(qū)別,但非專業(yè)人員無法完全識別信號所屬狀態(tài)。此外僅僅使用時域信號,無法同時捕獲到時域和頻域的特征。因此,單獨依靠信號的時域波形進行狀態(tài)識別是不可靠的。由于短時傅里葉變換具有強大的特征表達能力,因此本文在對信號預處理時采用短時傅里葉變換以獲得良好的信號表示。

圖3 不同故障狀態(tài)下齒輪振動信號的時域圖
為了能從振動信號中得到時頻特征,從時序信號中選取2 048個數(shù)據(jù)點形成一個樣本。短時傅里葉變換的窗函數(shù)為漢明窗,窗寬和窗口重疊寬度分別為128和64,這樣將每個樣本轉(zhuǎn)換為分辨率為65×65的時頻圖。各個類型齒輪的振動信號經(jīng)過短時傅里葉變換得到的時頻圖如圖4所示。

圖4 不同類型齒輪振動信號經(jīng)短時傅里葉變換時頻圖
每種負載情況、每種故障下的樣本都選擇300個,最后共得到樣本9 000個。如表2所示,按照8∶1∶1的比例將樣本分為訓練集、驗證和測試集。

表2 齒輪箱數(shù)據(jù)集
CNN的基本結構與圖1一致,其中每層卷積操作之后均進行批量歸一化處理(batch normalization,BN)。由于有6種不同故障類型的齒輪,因此根據(jù)樣本標簽的設置,網(wǎng)絡的輸出層節(jié)點個數(shù)取6。
網(wǎng)絡結構確定之后,采用訓練樣本對網(wǎng)絡進行訓練。實驗平臺的配置如下: Windows10的64 位操作系統(tǒng),CPU 為i5-8500@ 3.0GHz,GPU為Nvidia GeForce RTX 2060;程序運行基于PyTorch深度學習框架。
為驗證基于STFT和CNN的齒輪箱智能故障診斷的優(yōu)勢與有效性,與傳統(tǒng)機器學習方法支持向量機(SVM)、多層感知機(MLP)和決策樹(DT)進行對比。每種方法各測試10次后取其平均值,結果如表3所示。

表3 不同模型結果對比 單位:%
從表3中可發(fā)現(xiàn),相比于其他模型本文所提方法表現(xiàn)最好,診斷準確率達到了100%,而SVM、MLP、DT等傳統(tǒng)機器學習方法的平均診斷準確率只能達到80.1%、76.5%和74.7%,且很不穩(wěn)定。原因在于淺層機器學習算法特征提取能力有限,無法準確表征數(shù)據(jù)之間的映射關系。綜上所述,本文所提方法相比于其他方法更具有優(yōu)越性。
本文基于STFT和CNN進行了齒輪箱智能故障診斷的實驗研究,得出以下結論:基于STFT和CNN 的齒輪箱智能故障診斷方法是可行且有效的。利用短時傅里葉變換生成的時頻圖能有效地反映信號的時頻特征,準確地表征齒輪的運行狀態(tài);利用CNN能夠使時頻圖的特征得到充分的學習和表達,以實現(xiàn)對齒輪箱故障的智能診斷,避免了人為提取特征表達的不足及識別準確率低的問題。