夏晗鐸, 郝如江, 程 旺
(石家莊鐵道大學機械工程學院,河北 石家莊 050043)
齒輪箱作為旋轉機械中必不可少的結構,其在航空航天、交通運輸、工業生產等領域被廣泛應用。由于齒輪箱在復雜環境中長時間帶負荷工作,不可避免地會出現一些運行故障,如果不能及時發現這些異常,將會造成不可估量的后果。因此,對齒輪箱早期工作狀態進行監測和診斷能夠降低各種風險,具有重要的意義。
近年來,深度學習方法研究火熱,其中卷積神經網絡(Convolutional Neural Network, CNN)作為典型的深度學習方法,具有強大的特征提取和表達能力,很多學者已將該方法應用到故障診斷領域中。王海龍[1]提出了一種基于經驗模態分解和CNN的滾動軸承故障診斷方法,將振動信號分解后的分量與原始輸入信號構成二維特征圖,輸入到CNN中進行學習訓練,進而實現故障診斷;Chen等[2]利用小波分析處理振動信號,然后輸入到CNN中進行故障診斷的研究。然而在上述研究中,全部采用的是單通道的振動數據作為網絡輸入,無法充分挖掘振動信號的全方面特征,也沒有完全發揮CNN強大的特征提取能力。
為了更加充分的提取齒輪箱運轉過程中的全方位狀態,本文結合深度神經網絡,提出了一種多傳感器多通道信號采集和多傳感器數據融合分析的齒輪箱故障診斷方法。
連續小波變換(Continue Wavelet Transform, CWT)作為一種時間與尺度的信號變換方式,其無論是時域信號還是頻域信息,小波變換均能夠在不同的尺度上較完美的表現出信號的局部特征[3]。對于任意的函數f(t)∈L2(R)的連續小波變換為:
a,b∈R,a≠0
(1)

CNN是一種典型的前饋神經網絡,具有挖掘深層次特征的能力。CNN通常由卷積層、激活層和池化層交替連接構成特征提取模塊,由全連接層和Softmax函數構成分類器[4]。
卷積層負責挖掘特征,其運算公式:

(2)

池化層在保留特征信息的同時,進行壓縮降維。其平均池化運算原理公式為:

(3)
式中:al(i,t)為第l層的第t個神經元激活值;W為池化區域的寬度;Pl(t,j)為池化后的特征[6]。
本文設計的是基于多傳感器數據融合的故障診斷流程:輸入的信息為多傳感器多通道振動信號經CWT變換后的二維時頻圖,網絡模型結構采取多通道的輸入方式。將工作過程可以分為三個部分:特征數據集構建、特征融合提取和故障分類診斷[7]。多傳感器數據融合網絡架構如圖1所示。

圖1 多傳感器數據融合網絡架構
多通道特征數據集的構造大體可分為兩個步驟:一是從采集到的原始振動信號獲得并加以處理,將n個通道的信號分別按照長度ls進行截取操作,預處理后構建m×(ls×n)的信號樣本數據集,其中m為樣本個數;二是將截取后的各段信號分別進行CWT分析,構成二維的輸入數據樣本集。
特征融合提取:將接受來自n個通道的數據集,主要依靠卷積池化的堆疊操作實現。卷積層將對輸入的n維特征圖進行融合,維度提升實現特征的提取,池化層由局部最大值的方式進行抽樣實現數據的降維,同時提高了非線性特征的魯棒性。
故障分類部分:由兩個全連接層和一個分類層組成,其中第一個全連接層是將特征融合提取層末端的二維特征集合面進行“展平”,即將二維像素點值轉換為首尾相連的一維時間序列;第二個全連接層是實現數據的過度操作,避免數據信息過大造成分類誤差;最后分類層利用Softmax分類器實現多分類故障的輸出。
卷積操作時均采用3×3的小卷積核設計,減少網絡參數有利于加深網絡維度,實現深層次的特征提取同時可以在一定程度上可以減少過擬合。每進行兩次卷積操作后進行局部最大池化。模型訓練的效果除了網絡模型結構的選取之外,還受到訓練參數的影響。訓練批次為64,學習率為0.003。模型的具體參數如表1所示。

表1 多數據融合診斷模型網絡參數
基于多傳感器數據融合的齒輪箱故障診斷方法,通過布置在齒輪箱箱壁不同監測點不同通道的傳感器采集振動信號,利用獲取的信號對設計的診斷流程進行有監督的訓練,將訓練好的模型經測試集進行性能評估。診斷流程方法的具體步驟如下:
(1)齒輪箱箱壁采集多通道的振動信號,作為數據集,并劃分訓練集與測試集。
(2)將每一個通道的振動信號進行預處理,并通過CWT進行時頻分析,生成二維特征圖。
(3)搭建用來進行故障特征融合提取的網絡模型架構,決定網絡結構、初始化網絡的參數和偏置。
(4)將訓練樣本集輸入到網絡模型中,通過正向傳播進行訓練,反向傳播求得訓練誤差,進而使得參數更新,直到網絡收斂。
(5)將測試樣本集輸入到參數已經優化好的網絡模型中,判斷測試集樣本的準確程度。確定網絡整體的輸出。
即步驟1、步驟2為多通道數據集構造,步驟3、步驟4為多數據融合特征提取過程。
本節以動力傳動綜合故障實驗臺為依托,針對多通道信息數據融合的特征提取方法,采取了多個傳感器一起布置的方式,見圖2。圖中共放置了三個加速度傳感器,箱蓋上傳感器為軸向、徑向和垂向三通道采集,軸承端蓋頂端處傳感器采用軸向和徑向兩個通道,端蓋側方傳感器是軸向通道采集。采取多傳感器放置在齒輪箱的不同位置和不同方向,確保齒輪箱運轉一次就可以獲得包含多種信息的振動信號。研究所使用的數據是由布置在箱頂上傳感器的三個通道和端蓋上傳感器的軸向通道采集獲得的。將采集到的共四個通道數據,按一定比例隨機選取分成訓練集與測試集,最終得到的數據集為:訓練集9 000,測試集900,信號長度1 024。類別標簽見表2。

圖2 多通道傳感器采集信號

表2 齒輪箱狀態描述
針對CNN擅長對圖像進行處理的特點,將預處理后的數據進行CWT生成二維特征圖。為有效的分析數據,確定使用復Morlet小波,尺度因子為256。圖3展示了4個通道下針對內圈和裂紋復合信號經CWT變換后的時頻圖,為方便其輸入進行了維度壓縮,壓縮后的大小為64*64。

圖3 4個通道信號的二維時頻
訓練集4個通道的數據輸入到設計的網絡模型中進行多次迭代訓練,通過正向訓練和反向傳播算法,對網絡模型參數進行尋優。為了進一步防止網絡訓練發生過擬合現象,減少訓練時間,提高訓練效率。本文設置了不同組迭代次數,表3為每組迭代次數后的分類準確率和損失率。

表3 迭代過程準確率與損失值變化
可以發現本種方法在經過15次迭代次數后,就有了很好的效果,測試集的準確率能夠達到90%;再后續的迭代過程中,訓練集準確率基本上都接近或達到100%,測試集準確率也在99%及以上。由此可以分析出,該種方法沒有進行太多次迭代就能看到效果,有著較強的融合多通道信息的特征提取能力。
為了進一步分析網絡的正向訓練和反向傳播的性能,將訓練過程前30次迭代情況的損失和準確率細節進行展示,發展趨勢見圖4。

圖4 訓練過程損失值和準確率變化趨勢
通過圖中可以看出,該網絡遵循正常的訓練策略,準確率隨著迭代次數的增加總體呈現上升的趨勢。為了更加清晰地展現各工況的分類效果,通過混淆矩陣對訓練結果進行詳細的分析,如圖5所示??梢园l現只有類別3中0.01概率的部分被預測分類到類別四中,其他類別都完美的進行了分類。

圖5 混淆矩陣結果
為驗證多傳感器數據融合診斷方法能夠更全面、更完整地分析信號特征,表征設備的運行狀態,設計了單傳感器單通道振動數據的故障診斷實驗。針對不同測點的四通道數據,共進行4組實驗與本文所提的方法進行對比。網絡的輸入更新為單通道一維信號,之后特征提取部分均與多通道網絡融合的參數設置一致。每種方法重復進行實驗,計算每種狀態分類準確率的平均值,結果如表4所示。

表4 單通道網絡性能對比
通過表4發現,單傳感器單通道的信號輸入到相同的網絡模型中,測試后的平均準確率為97.59%,雖然表現出了較好的特征提取能力,但總體仍低于本章所提出的診斷方法。因此,基于多通道數據融合的特征提取網絡模型能夠較全面的對齒輪箱的運行狀態進行分析,具有很好的效果。
為了全面分析齒輪箱的工作狀態,融合多方位的振動信息,提出了一種借用多通道傳感器進行信號采集,并利用CNN進行特征提取的診斷流程。實驗結果表明,該種方法有效的利用了多傳感器多通道信號輸入的優勢,診斷能力明顯高于單通道信號輸入;CNN能夠更好的融合多傳感器多通道的信息進行特征提取,提出的方法具有很高的診斷準確率。