王昱,尹愛軍
(重慶大學 機械工程學院 機械傳動國家重點實驗室,重慶 400044)
齒輪箱是現代機械設備的重要部件,也是失效頻率高發部件。齒輪箱的失效往往致使整個機械系統進入癱瘓或運行失控,造成不必要的財產損失甚至人員傷亡[1]。因此,對齒輪箱失效故障的準確有效診斷是維護設備穩定、安全運行的重要保障。
目前用于齒輪箱故障診斷的方法數量眾多,包括噪聲分析法、振動分析法、油液分析法、聲學分析法、溫度分析法等[2],而基于振動信號的故障診斷方法應用最廣。武哲等[7]利用多元經驗模態分解對多通道振動信號進行自適應分解,并依據峭度準則和相關系數對此進行特征提取。黨建等[8]將排列熵算法用于水輪發電機組非平穩振動信號的故障診斷中,取得了較好的效果。Wang等[9]提出利用振動信號的局部均值分解對低速螺旋齒輪箱進行診斷的方法。張亢等[10]將局部均值分解(LMD)與階次跟蹤相結合,提出一種變轉速工況下的滾動軸承故障診斷方法。Ali等[11]將振動信號的經驗模態分解與深度神經網絡結合,以實現軸承故障的自動診斷。
在以上及現有的故障診斷方法中,均存在一些共有的不足點:一是需要對特定振動信號作針對性的特征提取,造成參數設置復雜且通用性不足;二是需要振動信號符合某些特定的假設,而對于信號和假設間的真實相關性,往往既缺乏理論依據,也缺乏最佳實踐;三是一些結合現代深度學習模型的方法數據依賴量大,而實際工況下的數據收集往往較困難。
針對以上問題,文中提出一種基于條件變分自編碼器的故障診斷方法。該方法可避免復雜的人工特征提取,采用振動信號頻域幅值譜作為故障診斷特征向量,通過學習幅值譜到各個故障下的條件概率分布,實現故障分類器的概率模型建立。區別于其余應用于機械故障診斷的自編碼器模型[12],該模型側重于從理論角度對頻譜分布進行概率建模,而非僅從工程角度構建復雜、缺乏可解釋性且較難訓練的特征提取網絡,其表現更加具有可控和可追溯性。實驗表明,基于條件變分自編碼器的故障診斷方法在齒輪箱故障分類任務上取得了很高的精度,并具有較少的數據依賴和較高的通用性,能有效對齒輪箱各失效故障進行準確識別診斷,具有較高的工程實用價值。
條件變分自編碼器(CVAE)是變分自編碼器(VAE)[15]的改進和擴展。首先闡述變分自編碼器的基本思想。

由于 x維度往往很高,難以直接建立符合式(1)的優化模型。變分自編碼器設定x由某一低維隱變量z生成,即:

受z的維度限制,式(2)中的積分計算較為困難。為此VAE引入后驗分布 p (z|x),使得在 p (z|x)上通過蒙特卡洛采樣算法得以實現對式(2)的有效估算。由于后驗分布 p (z|x)是隱式存在的,并不能為此提供顯式的優化途徑。VAE實際使用可優化的推斷后驗分布作為真實后驗分布的近似,并使用變分推斷方法優化φ使得逼近 p (z|x)。由于 qφ(z|x)往往被指定為高斯分布,考慮易優化性,VAE使用KL散度作為變分推斷的具體實現形式:

對式(3)運用貝葉斯定理變形得:


在對 ELBO的實際計算上,VAE提出了一種隨機梯度變分貝葉斯(SGVB)評估器作為對ELBO的高效估算:

通過優化L~VAE(x;θ,φ),VAE得以獲得對單一數據X的概率密度分布p(X)的極大似然優化。而在具有標簽數據Y條件下,條件變分自編碼器在此基礎上實現了對條件概率分布 p (X |Y)的估計[22]。但此類條件變分自編碼器主要用于輔助 VAE生成更加特定化的數據,并不能勝任對數據性質的判別任務。沿用p(X|Y)條件變分自編碼器思想,文中導出能勝任于分類任務的另類條件變分自編碼器p(Y|X)。
在同時具有觀測數據X及標簽Y條件下,容易將式(4) lgp(x)擴展為lgp(y|x)形式:

式(8)、(9)導出了條件概率分布 (|)pyx的對數概率密度下界。和 VAE的隨機梯度變分貝葉斯評估器同理,CVAE的優化評估器可表示為:

同樣,z(l)通過重參數化函數重采樣,以避免梯度消失。
在實際訓練中,選擇對角協方差標準正態分布作為先驗分部p(z),對角協方差高斯分布作為后驗分布

為盡可能在不損失原始振動信號信息量的前提下,獲取較為通用穩定的信號特征,文中對原始信號x(t)做定長窗口傅里葉變換,并取變換后的頻域幅值譜x(f)線性歸一化至[0,1]區間作為特征向量,將其導入CVAE模型進行訓練。在分類預測階段,若標簽類別共有n類,則將待預測原始信號x(t)分別和每一類標簽yi組合并通過 CAVE計算其隨機梯度變分貝葉斯評估器得到n個下界評估值,最后將n個下界評估值送入softmax層輸出對應每一個類別的置信概率,并根據置信概率實現對振動信號各故障類型的診斷識別。模型結構如圖1所示。
圖1中MLP為多層神經網絡,分別代表CVAE編碼器及解碼器,均輸出高斯分布。菱形區域表示可優化項,即隨機梯度變分貝葉斯評估器組成部分,通過菱形區域項可使用Adam等隨機梯度優化算法對模型進行訓練優化。由于優化算法使用了 (|)pyx的下界,而對真實 (|)pyx的估計較為麻煩,且在模型經過充分訓練后,有理由相信變分證據下界能夠足夠逼近真實分布的 (|)pyx,因此在分類預測階段仍使用下界作為對真實分類概率分布 (|)pyx的估計,并將下界的評估值送入softmax層以輸出每一類別的置信概率。另外,訓練和預測過程可同時進行,也可分別進行。

圖1 基于CVAE的振動信號故障分類模型結構Fig.1 Structure of vibration signal fault classification model based on CVAE
模型在訓練階段的具體流程見表1。算法的輸入接口為原始振動信號x(t),最后返回神經網絡參數θ及φ。在分類預測階段,只需恢復神經網絡參數,即可實現對信號故障類別x(t)的快速識別診斷。

表1 振動信號分類器訓練流程Tab.1 Training process of vibration signal classifier

圖2 實驗配置Fig.2 Experimental configuration:a) experimental system; b) gearbox interior
文中通過齒輪箱故障診斷實驗驗證模型對振動信號的分類性能。實驗系統整體配置如圖 2a所示。電機(SIEMENS, 3~, 2.0 HP)通過聯軸器驅動齒輪箱運轉,同時電機通過變頻器(DANFOSS VLT 1.5 kW)進行調速。齒輪箱輸出軸通過傳動皮帶聯接一個電磁扭矩負載(ROSATI, maximum 8.83 kW)。電磁扭矩負載受控于一扭矩控制器(TDK-Lambda, GEN 100-15-IS510),使得其負載扭矩可被動態調節。加速度傳感器(PCB ICP 353C03)和聲傳感器(PANAMETRICS V109)可分別收集齒輪箱運轉過程中的振動和聲音信號。數據采集盒(DAQ, NI cDAQ-9234)將加速度傳感器和聲傳感器的輸出數據送入計算機(HP Pavilion g4-2055la)進行存儲。齒輪箱的內部布置如圖2b所示。二級減速器通過三根傳動軸及 4個傳動齒輪組成。輸入斜齒輪1(Z1=30,模數=2.25,壓力角=20°,螺旋角=20°)安裝在輸入軸 1上,軸 2上安裝有兩級傳動斜齒輪(Z2=Z3=45),通過末級齒輪 4(Z4=80)將功率傳遞至軸 3。除此之外,齒輪箱失效部件還包括軸承1及軸承座1。齒輪箱不同工況下的失效模式見表2。

表2 齒輪箱失效模式及工況Tab.2 Failure modes and working conditions of gearbox
在表2中,實驗在3種輸入轉速、3種負載轉矩下共有11種失效模式,其中A為齒輪箱正常狀態模式。對于每種失效類型、轉速及扭矩,加速度傳感器和聲傳感器均重復進行5次數據采集。每次數據采集包括24個采樣周期,每個采樣周期歷時0.4096 s。加速度傳感器和聲傳感器的采樣頻率分別被設置為10 kHZ和 50 kHZ。通過上述方式,實驗系統在 11種模式下總共采集到11 880段聲音信號和11 880段振動信號。
為不失一般性,本實驗僅以振動信號作為齒輪箱數據采集樣本。對于齒輪箱所有振動信號,以50 000次連續采樣點對原始數據進行切分,并對切分后的每段振動信號變換到頻域空間取幅值譜。每段幅值譜均線性歸一化到0~1區間。對于每一種失效模式,隨機打亂不同工況下的頻譜信號,并等量均分后分別作為訓練集和測試集。經過上述處理,在總共11種失效模式下,訓練集和測試集均具有2035個樣本數據,每個樣本數據具有25 001維。在所有訓練集均具有全部失效模式標簽的情況下,對CVAE模型進行故障診斷分類性能測試。測試結果如圖3所示。

圖3 CVAE模型測試集分類準確率Fig.3 Classification accuracy of CVAE model test set
從圖3可見,CVAE模型取得了優異的分類性能,在測試數據集上綜合平均分類正確率達到 98.88%,且部分故障類別模式下的分類正確率達到 100%。表明模型擁有很高的故障分類精度。
為了和傳統基于特征提取的故障診斷方法進行對比,文中分別選取具有代表性的四種模型進行故障分類實驗:基于策略的統計學習模型K近鄰(KNN);基于時間序列建模的長短期記憶網絡模型(LSTM);經典非線性分類器支持向量機(SVM);現代數據驅動模型深度神經網絡(DNN)。在原始振動信號特征提取方面,選取時域11個特征量、頻域13個特征量以及14個小波包能量特征,共計38個工程信號特征組成38維向量作為上述模型的單個訓練樣本。KNN、LSTM、SVM、DNN、CVAE模型的分類準確率分別為83.93%、94.05%、65.48%、69.64%、98.88%。由此可見,CVAE模型在故障診斷分類準確率上大大領先于其余模型,表明其能夠有效對齒輪箱振動信號頻譜空間概率分布進行建模,不僅具有更好的通用性,也取得了更好的效果。
文中提出了一種基于條件變分自編碼器的齒輪箱振動信號故障診斷模型。以原始信號幅值譜作為特征向量,并從理論上闡述了CVAE模型在故障分類任務上的有效性。最后通過實驗進一步證明了CVAE模型在齒輪箱振動信號故障分類任務上具有優異的性能,故障分類準確度比其余模型更為優越,且無需復雜的特征提取,具有更少的數據依賴性及更強的通用性。對比其余模型,表現出了其在齒輪箱故障分類診斷任務上的優越性。