杜文遼,高軍杰,楊凌凱,鞏曉赟,王宏超,紀蓮清
(鄭州輕工業大學機電工程學院,河南鄭州 450002)
旋轉機械是應用最為廣泛的機械設備,被稱為現代工業體系的基石。在實際工作環境中,機械設備常處于高溫、高沖擊的復雜環境,齒輪、軸承是旋轉機械的關鍵零部件,一旦發生故障,輕則導致生產損失,重則危及人員生命安全[1]。因此,對滾動軸承和齒輪的故障進行診斷具有重要意義。
目前基于數據驅動的旋轉機械故障診斷主要包括信號獲取、特征提取、故障識別與預測3個步驟[2]。傳統的研究過程是經過時域、頻域和時頻域分析來獲取信號特征,由于振動信號往往具有非線性、非平穩的特征,傳統的傅里葉變換等信號處理方法無法得到滿意的結果。為了解決這一問題,多尺度分析方法,如小波變換[3]、短時傅里葉變換[4]、奇異值分解[5]等得到廣泛應用。其中,由HUANG等[6]提出的經驗模式分解(EMD)方法可以自適應地將任意信號分解為固有模態函數(IMF),但該方法會產生模式混疊[7]。WU、HUANG[8]提出集合經驗模式分解方法(EEMD),該方法有效抑制了混疊現象,但是分解不徹底,影響故障診斷結果的準確率。LIU等[9]利用補充的集合經驗模態分解(CEEMD)方法,通過向原始信號中添加成對正負白噪聲,然后進行EMD分解,減小了EEMD中殘余白噪聲對信號的影響。
近年來,深度學習在故障診斷領域獲得廣泛使用[10]。李恒等人[11]利用短時傅里葉變換將一維振動信號轉換成二維矩陣輸入到卷積神經網絡(CNN),能夠自動提取故障特征并實現對軸承的故障診斷。陳仁祥等[12]利用離散小波變換將原始信號構造成時頻矩陣,結合卷積神經網絡實現了滾動軸承的故障辨識。HOANG、KANG[13]利用振動信號振幅歸一化與像素之間的關系將一維信號轉換為二維灰度圖,結合CNN實現了對滾動軸承的準確診斷。上述學者利用二維CNN對振動信號進行處理,但是二維形式會破壞一維振動信號數據點之間的關聯性,導致相關故障信息缺失,同時,一維信號轉換為二維圖像計算量大、耗時長[14]。周奇才等[15]利用一維深度卷積神經網絡(1DCNN)對軸承和齒輪箱進行故障診斷研究,結果表明1DCNN具有很好的特征提取能力。WU等[16]利用一維卷積神經網絡對行星變速齒輪箱問題進行了研究,結果表明具有很好的診斷效果。然而振動信號具有非線性、非平穩的特點以及存在噪聲干擾,同一特征信息在不同尺度出現,上述方法對信號直接處理,沒有考慮信號多個尺度包含的信息。李思琦、蔣志堅[17]提出利用EEMD對信號進行多尺度分解重構,輸入到1DCNN中進行故障診斷。徐先峰等[18]利用EMD對信號進行分解,對信號進行重構,構建出突出更多局部特征的一維特征向量輸入到1DCNN中完成了對軸承的故障診斷。但是上述學者根據相關系數選取相關性較大的分量作為重構分量,忽略了各個信號對信號特征的貢獻度。
針對以上分析,本文作者提出一種基于多尺度加權的互補集合經驗模態分解的卷積神經網路的故障診斷方法,利用互補集合經驗模態分解(CEEMD)對原始信號進行多尺度分解,然后對分解的信號進行加權重構,構建有利于學習的故障特征。經電機軸承實驗和齒輪箱實驗驗證,該方法具有良好的魯棒性和穩定性。
互補集合經驗模態分解(CEEMD)是一種基于經驗模態分解(EMD)和(EEMD)提出的改進算法,CEEMD在EMD的基礎上加入成對的正負白噪聲使信號更加均勻,用來抑制EMD分解存在的模態混疊現象,將EMD分解的IMF分量進行集合平均得到最終的IMF分量。CEEMD計算步驟如下:
(1)在原始信號x(t)中加入成對互為相反數形式的白噪聲n+(t)、n-(t)得到:
x+(t)=x(t)+n+(t)
x-(t)=x(t)+n-(t)
(1)
式中:n+(t)、n-(t)分別為正負白噪聲;x+(t)、x-(t)為加入正負白噪聲之后的信號序列。
(2)對加入噪聲后的每個信號序列利用EMD分解,分解成一系列IMF分量,第i個信號的第j個分量表示為aij;
(3)對多個分量求集合平均,得到CEEMD信號處理結果。表達式為
(2)
其中:m為對白噪聲的處理次數;aj表示分解到的第j個IMF分量。
峭度是用來反映振動信號分布特性的量綱一化指標,對沖擊信號敏感,常用來衡量機械信號故障的程度,評價齒輪、軸承信號的沖擊特征的強弱。表達式如下;
(3)
其中:K為信號x的峭度指標;n為信號x的長度;μ為信號x的均值。
求取每組IMF分量的峭度值,用峭度值的大小衡量每個分量的重要性,峭度值的大小用Kj表示,p表示IMF分量個數,每個分量占的權重表示為ωj。記為
(4)
得到每個分量占的權重后,對數據進行加權重構得到一維重構信號。記為
(5)
一維卷積神經網絡主要由卷積層、批標準化層、激活層、池化層、Dropout層、全連接層等組成,在網絡訓練過程中根據梯度下降法完成權值的更新,分為前向傳播和反向傳播,利用預測值與真實值之間的誤差計算而來。
1.3.1 前向傳播過程
(1)卷積層
由多個卷積核組成,CNN利用卷積核對輸入信號進行卷積運算,卷積層利用權值共享的特點避免了參數過擬合。
一維卷積運算公式為
(6)
其中:k表示卷積核;j表示卷積核的個數;N為卷積計算區域;i表示第i個數據;xl-1為第l層卷積輸入;xl為卷積輸出;Conv1D為一維卷積計算;bl為偏置;f()為激活函數。文中選取ReLU函數,表達式如下:
f(a)=max{0,a}
(7)
其中:a為卷積層激活值。
(2)批標準化層
指對一小批數據做均值和方差標準化處理。在訓練過程中,防止梯度消失或爆炸、加快訓練速度。
(3)池化層
池化的作用是降低特征數量,能保持原有數據特征不變。常用的池化有平均池化和最大池化,一維卷積通常用最大池化。
(8)

(4)全連接層
全連接層是將多層卷積和池化層之后提取的特征拉直為一維向量輸入,經激活函數計算得到輸出。計算公式如下:
yi=f(wix+bi)
(9)
式中:yi為第i個輸出;f()為激活函數;wi、bi分別為第i個神經元的權值和閾值。
(5)Dropout層
Dropout層的作用是防止過擬合現象,將一部分神經元按照一定概率從神經網絡中暫時舍棄,減少網絡中的參數,提高泛乏能力和魯棒性。
(6)輸出層
輸出層主要實現多分類,一般選擇Softmax分類器。
(10)
式中:zi為樣本的分類值;yi為第i個神經元的節點值;M為分類總數。
1.3.2 反向傳播過程
(11)
(12)
(13)
所提基于多尺度加權的CEEMD和一維卷積神經網絡診斷方法,充分利用CEEMD自適應處理信號的特點,結合峭度加權構造沖擊特征明顯的一維特征向量,最后輸入到卷積神經網絡中。模型故障診斷流程如圖1所示。

圖1 模型故障診斷流程
具體步驟如下:
(1)在電機軸承和齒輪箱實驗臺上根據預設的采樣頻率通過振動傳感器采集滾動軸承、齒輪不同故障狀態下的原始振動信號;
(2)對采集的原始振動信號進行CEEMD分解,設置8個IMF分量個數,得到IMF分量;
(3)利用峭度計算公式(3)對各個IMF分量求取峭度值,然后根據公式(4)計算各分量峭度所占權重;
(4)根據公式(5)利用各分量峭度權重對其進行加權融合得到重構信號,按滑動窗口對數據進行截取,每類故障得到2 000個樣本,10種故障共20 000個樣本,將樣本按7∶2∶1的比例劃分為訓練集、驗證集、測試集;
(5)將訓練集批量輸入到網絡模型中進行訓練,并利用驗證集對網絡模型進行驗證,得到最優診斷模型;
(6)將測試集輸入到最優診斷模型中得到故障分類,輸出診斷結果。
3.1.1 數據集描述
實驗數據來自凱斯西儲大學軸承數據中心的軸承數據集,采用載荷0.75 kW、轉速為1 772 r/min、采樣頻率為12 kHz的電機驅動端軸承數據,型號是6205-2RS JEM SKF 深溝球軸承,軸承的損傷是用電火花加工的單點損傷;故障直徑分別為0.177 8、0.355 6、0.533 4 mm,故障深度為0.279 4 mm,轉動頻率為30 Hz,共有4種狀態,分別為正常、內圈故障、外圈故障、滾珠故障。如表1所示,每種故障有3種不同故障程度,分別為輕度故障、中度故障、深度故障,共有10種數據集,每種狀態2 000個樣本,訓練集、驗證集、測試集的樣本比例為7∶2∶1。

表1 實驗采集故障樣本數據集描述(實驗一)
3.1.2 基于CEEMD的一維信號重構
以軸承內圈故障信號為例進行說明,對其信號進行CEEMD處理,取數據長度為4 096,其原始振動信號如圖2所示。根據YEH等對CEEMD添加參數的研究,盡量減小添加白噪聲次數與幅值,最終選擇白噪聲次數為50次,添加白噪聲幅值為0.2[19]。經CEEMD分解成8個IMF分量,如圖3所示。求取各分量峭度值并計算各分量權重進而重構一維信號,如圖4所示,為故障分類做準備。

圖2 原始振動信號波形

圖3 原始信號經CEEMD處理結果

圖4 重構信號
3.1.3 網絡結構及參數設置
此次實驗使用的編程語言為Python3.7,解釋器為 PyCharm,神經網絡框架為 Keras。經過多次調整參數,一維CNN網絡參數如表2所示,由4個卷積層,4個BN層,4個池化層,2個全連接層,2個Dropout層組成,網絡各層參數描述如表2所示。
3.1.4 實驗結果分析
圖5所示為訓練集和驗證集損失率與正確率的變化情況,總計迭代50次,網絡權值隨著每次迭代進行更新,使目標函數值趨于最小。圖5(a)表明隨著迭代次數的增加,訓練集和驗證集準確率逐漸增加并趨于穩定,可以達到100%;圖5(b)表明隨著迭代次數的增加,訓練集和驗證集損失率逐漸減小并穩定。說明此網絡有很好的診斷性能與穩定性。
總共進行10次實驗,得出平均正確率為99.98%,驗證了文中所提出的故障診斷模型具有很好的狀態識別能力。
將原始數據和利用CEEMD-1DCNN診斷模型的輸出分類結果分別用t分布隨機鄰嵌入(t-SNE)可視化表示。圖6展示出測試集在不同階段的映射圖,圖6(a)表示原始數據映射結果,分布比較雜亂,圖6(b)表示經CEEMD-1DCNN輸出的映射結果,可以看出每種故障類型均可實現故障分類,不同顏色代表不同故障,每種故障都能集中在不同的區域內。
3.1.5 方法對比
為了進一步驗證CEEMD-1DCNN有著很好的診斷性能,與EMD-CNN、DWT-CNN、EMD-SVM、CNN方法[18]進行對比,進行10次實驗,結果如圖7所示。可以清晰地看出:文中所提方法有最高的準確率,比上述其他方法高,且文中所提方法的實驗數據波動程度最小,說明文中方法不僅診斷準確率高,而且穩定性更好,具有很好的魯棒性。

圖7 不同方法準確率
3.2.1 實驗數據表述
為進一步驗證所提模型的適用性,將所提方法應用在齒輪數據集。此實驗數據來自齒輪故障試驗臺,通過QPZZ-II旋轉機械振動分析及故障診斷試驗平臺系統采集減速器齒輪的真實振動信號。圖8是該試驗平臺,主要由驅動電機、軸系總成、齒輪箱、制動器、底座及電柜組成。軸承型號為6206-2Z(SKF),電機轉速1 500 r/min,利用數據采集處理與分析uTekSs系統完成原始信號采集、存儲。采樣頻率12 800 Hz,采樣時間10 s,數據長度128 000。減速箱大齒輪齒數75,小齒輪齒數55。使用電火花線切割工藝制作故障,分為點蝕故障和裂紋故障,故障類型如圖9所示。

圖8 齒輪故障試驗臺

圖9 九種人工加工的齒輪故障類型
故障類型分別為:單齒裂紋(寬0.2 mm×深0.5 mm),單齒裂紋(寬0.2 mm×深2 mm),雙齒裂紋(寬0.2 mm×深0.5 mm),雙齒裂紋(寬0.2 mm×深1 mm),單齒點蝕(直徑0.4 mm×深1 mm,3點、6點、9點),雙齒點蝕(直徑0.4 mm×深1 mm,3點、6點)。每種故障2 000個樣本,一共10種樣本,將數據按照7∶2∶1的比例分為訓練集、驗證集和測試集,如表3所示。

表3 實驗采集故障樣本數據集描述(實驗二)
3.2.2 實驗結果
選用文中提出的CEEMD-1DCNN診斷模型,由圖10可以看出:隨著迭代次數的增加,到第6次訓練時,訓練集和驗證集已經取得了很高的精度,接近100%??傆嬤M行10次實驗,每次實驗的結果如圖11所示,CEEMD-1DCNN模型10次診斷的準確率在99.5%~99.95%之間,而且逐漸趨于平穩。從診斷結果分析,此方法具有良好的穩定性和魯棒性。

圖10 準確率(a)和損失率(b)隨迭代次數的 變化情況(實驗二)

圖11 不同方法10次實驗的準確率比較
將原始數據和經過文中模型診斷輸出的分類結果分別用t-SNE可視化表示,如圖12所示。每種顏色代表1種故障,共10種故障,每種故障都能聚集到一起,證明此模型具有良好的診斷性能。

圖12 t-SNE可視化(實驗二)
3.2.3 方法對比
為突出文中所提方法的優越性,進行一組未經過CEEMD多尺度分解加權重構的對比試驗,總共進行10次實驗。結果顯示:直接CNN進行診斷的平均準確率為96.7%,方差為1.714;經文中模型進行實驗驗證的平均準確率為99.73%,且方差為0.145 7。準確率更好,方差值更小,表明文中所提模型具有很好的穩定性和適用性。
針對傳統方法依賴人工經驗提取特征耗時耗力問題,提出一種基于多尺度加權互補集合經驗模態分解和卷積神經網絡的故障診斷方法:
(1)利用多尺度加權對CEEMD分解的IMF分量進行加權重構,有效提取了故障信息,增強了信號的沖擊特征;
(2)利用一維卷積神經網絡對重構信號訓練分類,避免了對先驗知識的依賴,并通過t-SNE可視化分析,表明CEEMD-1DCNN模型良好的特征學習能力;
(3)文中所提方法與傳統方法以及其他先進方法相比有更高的準確率,通過電機軸承數據集和齒輪箱數據集驗證了CEEMD-1DCNN模型的魯棒性與適用性。