趙 川,馮志鵬2,張穎琳,王 坤
(1.北華航天工業學院 機電工程學院,河北 廊坊 065000;2.北京科技大學 機械工程學院,北京 100083;3.北京航空航天大學 機械工程及自動化學院,北京 100191;4.哈爾濱工業大學 航天學院,哈爾濱 150001)
行星齒輪箱具有結構緊湊、傳動比大、承載能力強等優點,被廣泛應用于工業與航空等領域。但工作環境不良或承受交變重載,其零部件如太陽輪、行星輪、齒圈等容易發生損傷或失效,嚴重時會造成重大損失。因此,對行星齒輪箱進行故障診斷研究具有重要意義。
近年來,研究人員分別采用動力學分析與信號分析等方法對行星齒輪箱的故障診斷問題進行了研究[1-2]。但上述研究一般基于平穩工況假設,特征頻率不隨時間發生變化。在實際應用中,行星齒輪箱的速度和載荷通常是時變的,運動情況更為復雜,導致信號具有非平穩性,對時變工況下的行星齒輪箱進行故障診斷具有更高的難度。
對于非平穩信號,可以通過時頻分析揭示特征頻率隨時間變化的規律。但研究表明,應用時頻分析法對時變工況下行星齒輪箱信號進行分析時,存在時頻分辨率低與虛假成分干擾等問題,給故障特征的提取與識別造成困難。針對該問題,相關學者進行了進一步的研究[3-9],基于廣義解調與同步壓縮變換、相角的熵特征、階次譜分析、自適應線性調頻模式分解等理論,提出多種方案,提高了時頻分辨率,弱化了虛假成分干擾。然而對結果的分析判斷涉及較多專家知識,并需要人工識別故障特征頻率,主觀因素可能會影響故障診斷的準確性。
為避免主觀因素的影響,研究人員開展了智能故障診斷的研究。在近期具有代表性的研究中,Li 等[10]用改進的多尺度排列熵方法提取了齒輪信號的故障特征,并通過二叉樹支持向量機對故障特征進行了識別。Liu 等[11]采用集成經驗模態分解法 (ensemble empirical mode decomposition,EEMD)將信號分解為本征模式函數 (intrinsic mode function,IMF),探究各函數與原始信號的關系,并據此形成度量指標,構建特征向量,最終通過多分類支持向量機對齒輪故障進行了識別。Zhang 等[12]結合半監督學習與深度學習的優點,提出半監督多關聯層網絡模型,解決了在標記樣本較少的情況下行星齒輪箱的故障識別問題。Li 等[13]提出深度平衡鄰域自適應智能故障診斷模型,通過增加平衡環節,改善了遷移學習過程中對應的概率分布匹配的精度,提高了行星齒輪箱故障識別準確率。但上述研究主要對穩定工況下單個域內的信號進行了分析與特征提取,方法對于時變工況下信號分析與特征提取的適應性有待進一步研究。此外,上述方法提取的特征服從的概率分布未知,缺少顯式的表達,給深入認識特征造成一定的難度;如何強化不同類別特征間的差異也值得深入研究。
近來,對抗自編碼 (adversarially auto-encoder,AAE)由于能夠自適應提取特征同時對特征施加專屬的分布約束而受到了廣泛的關注[14]。它同時利用了對抗生成網絡 (adversarial generative network,GAN)與自編碼器 (auto-encoder,AE)的優勢,通過對抗機制,使AE提取的特征服從預先給定的分布,從而賦予特征顯式的意義。在已有的研究中,GAN及其變體被廣泛地應用于機器學習領域,用于從隱變量空間生成盡量與真實數據相同的數據[15]。Wang 等[16]將GAN與堆疊降噪自編碼結合,生成新的樣本,擴展了訓練樣本集,解決了行星齒輪箱故障診斷中訓練樣本不足的問題。Mao 等[17]以信號頻譜為輸入,通過GAN生成新的樣本,解決了滾動軸承故障診斷中數據不平衡問題。此外,Wen 等[18]建立了一個新的深度遷移學習模型,通過三層稀疏自編碼來提取特征,以最大均值差異項為指標最小化源域與目標域間的差異,有效提取了原始數據特征,準確診斷了滾動軸承故障。上述方法在故障診斷領域的成功應用對時變工況下行星齒輪箱的故障診斷具有重要的借鑒意義,但對于重構信號與原始信號是否服從相同的概率分布沒有進行分析,因此有必要對相關問題繼續進行深入研究。
為了能夠自適應提取時變工況下行星齒輪箱的信號特征,賦予特征顯示意義,同時強化不同類別特征間的差異,并確保重構信號服從與原始信號相同的概率分布,本文改進了AAE模型,并引入高斯混合分布,構建了基于雙對抗編碼 (bilateral adversarial encoder,BAE)的智能故障診斷模型。
首先獲取樣本時頻圖,從而揭示信號的頻率組成以及隨時間變化的規律;構建與類別信息相關的高斯混合分布,將其作為先驗分布,并根據編碼器輸入樣本的類別信息從高斯混合分布進行采樣;通過編碼器提取輸入樣本特征,解碼器根據樣本特征重構信號,在雙對抗中,判別器 1 用于使重構信號盡量與原始信號相同,并且服從原始信號的分布,判別器 2 用于使提取的特征服從給定的先驗分布,并強化不同類別特征間的差異;最后利用強化后的特征對分類器進行訓練,通過測試數據驗證其性能。整體實現流程如圖 1 所示。

圖1 故障診斷過程Fig.1 Fault diagnosis process
Makhzani等于2016年提出AAE模型,其本質上是一種概率自動編碼器,通過對抗生成網絡對自動編碼器的隱變量施加任意的先驗分布,使得從先驗空間的任意部分生成的樣本都是有意義的,最終訓練解碼器學習一個深度生成模型,將服從給定先驗分布的樣本映射到數據空間。圖 2 給出了一個對抗自編碼的網絡結構。

圖2 對抗自編碼結構Fig.2 Architecture of an AAE
其中頂行為一個標準的自動編碼器,編碼器對輸入進行編碼,得到潛在編碼向量,解碼器對潛在編碼向量進行解碼,重構輸入信號;底行訓練了一個對抗網絡的判別器,用于判斷樣本是來自于自動編碼器的潛在編碼向量,還是來自預先給定的先驗分布。
具體地,設編碼器的輸入為x,潛在變量為z,給定對潛在變量進行約束的先驗分布為p(z),編碼分布與解碼分布分別為q(z|x)、p(x|z),數據分布為pd(x),則潛在變量服從的聚合后驗分布可通過式 (1)進行計算。
(1)
為了使q(z)能夠匹配p(z),以AE的編碼器作為對抗網絡的生成器 (generator,G),此時編碼器輸出的隱變量被看作生成樣本,而從先驗分布p(z)采集的樣本被看作真實樣本,判別器(discriminator,D)則用來判斷輸入的數據為生成樣本或真實樣本。在訓練階段,AE與GAN通過隨機梯度下降(stochastic gradient descent,SGD)進行兩個階段的聯合訓練:AE更新編碼器和解碼器,并最小化重構誤差;對抗網絡首先更新判別器,以區分真實樣本和生成樣本,再更新生成器以試圖使判別器做出錯誤判斷。對抗網絡目標函數如式(2)所示。
(2)
式中:E表示期望;pd(x)與p(z)分別表示x與z服從的概率分布情況;D(x)是判別器的輸出結果,用于判斷判別器輸入為x的概率。當輸入真實數據時,目標函數旨在使判別器輸出最大概率值,同時希望找到最優的生成函數G(z),使目標函數值最小,直到達到納什平衡。完成訓練后,AE的解碼器可以作為一個生成模型,將從先驗分布采集的樣本映射到數據空間。
AAE 充分利用了 AE 與 GAN 的優勢,通過對抗機制使編碼器提取的隱變量服從給定的先驗分布,賦予了隱變量顯式的意義。但在實際的故障診斷應用中,通常需要對不同故障狀態的數據提取有效特征,并根據不同類別特征間的差異性診斷故障狀態。對于多類別輸入,如果 AAE 中給定的先驗分布為單一分布,則編碼器提取的不同類別的特征服從的是相同的分布,雖然使特征分布由未知變為已知,進一步規范了特征,但不同類別特征間的差異性卻并沒有得到明顯強化,方法對特征模式識別性能的改善比較有限。此外,AAE 中 AE 的重構誤差以重構信號與原始信號間對應元素差值的平方和作為度量,通過最小化該度量指標,解碼器可以近似重構原始輸入,但重構信號的分布可能與原始輸入信號分布不同。
高斯混合分布 (gaussian mixed distribution,GMD)本質為多個高斯分布的線性組合,其中每個高斯分布可以同為一維高斯分布或相同維度的多維高斯分布。設有隨機變量x=[x1,x2,…,xd],其中d為高斯分布的維度,則高斯混合分布模型如式 (3)所示。
(3)
式中:N(x|μk,Hk)為混合分布中第k個分量;K為分量總個數;μk表示d維均值向量;H為協方差矩陣,用于描述各高斯分布分量中各維向量之間的相關度,πk表示各個高斯分布分量在混合分布中所占的比重,并且滿足式 (4)。
(4)
為了能夠使不同類別的特征可視化,并服從專屬的分布,從而強化特征間的差異性,改善模式識別性能,本文構建了包含K個分量的二維高斯混合分布,則第k個分量的聯合概率密度函數可表示為(5),式中d=2。

(5)
設樣本的類別數為K=4,為了生成能用于約束K類特征的高斯混合分布,令μ1=[u,0],μ2=[0,u],μ3=[-u,0],μ4=[0,-u],H1=H2=H3=H4=[h11,h12;h21,h22]=[0.5,0;0,0.1]。當從第k個分量采集樣本點時,給定πk=1。不妨令u=1.6,從混合分布中的每個分布采集 200個樣本點,則點的分布結果如圖3所示。

圖3 高斯混合分布(u=1.6)Fig.3 Gaussian mixture (u=1.6)
在自編碼模型中,通過訓練,編碼器提取的隱變量包含了原始信號的特征信息,能夠在低維度對原始輸入信號進行有效地表示,但缺乏對重構信號分布的相關約束。為確保重構信號服從與原始信號相同的概率分布,從而使隱變量能夠包含更準確、豐富的輸入信號信息,同時強化不同類別特征間的差異,本文構建了雙對抗編碼模型,其結構如圖 4 所示,目標函數如式(6)。

圖4 雙對抗編碼網絡(K=4)Fig.4 Architecture of a bilateral adversarial encoder (K=4)

(6)

針對時變工況下行星齒輪箱故障信號,具體的處理過程如下:
(1)生成信號樣本。采集時變工況下行星齒輪箱振動信號,分為訓練集與測試集,每個樣本集包含四類樣本:基準 (狀態1),太陽輪損傷 (狀態2),行星輪損傷 (狀態3),和齒圈損傷(狀態4)。
(2)信號分析與變換。采用韋格納維拉分布(wigner viller distribution,WVD)對信號樣本進行分析獲取樣本時頻圖,并根據式(7)將圖形轉換為灰度圖,然后采用最大類間方差法對灰度圖進行二值化處理,從而簡化模型輸入結構,便于特征提取。
Ave=0.298 9R+0.587 0G+0.114 0B
(7)

(4)Softmax分類器訓練。用提取的訓練樣本的特征訓練分類器,提取所有測試樣本特征,測試分類器性能,最終識別行星齒輪箱故障。
如圖5所示,驅動電機驅動行星齒輪箱轉動,齒輪箱輸出軸通過編碼器、速度傳感器與電磁制動器連接,振動傳感器用于采集齒輪箱不同位置的振動信號。表1給出了齒輪箱的配置參數。

圖5 實驗系統平臺Fig.5 An experimental system rig

表1 行星齒輪箱齒輪參數Tab.1 gear parameters of planetary gearbox
分別對太陽輪、某一行星輪、齒圈等的單個輪齒進行人工處理,形成剝落損傷。在實際工況中,損傷形狀通常不規則,尺寸具有隨機性,損傷程度有一定的差異,因此對輪齒進行一般性人工處理,形成無規則損傷,從而模擬輪齒故障,實物如圖6所示。

圖6 故障齒輪Fig.6 Gears with defect
驅動電機轉速根據分段函數式(8)進行設定,其中fmax=19 r/s,即每秒鐘旋轉19周,轉速曲線如圖7。

圖7 速度曲線圖Fig.7 Speed curve
(8)
時變工況下的四種運行狀態分別為:①基準——狀態1;②太陽輪損傷——狀態2;③行星輪損傷——狀態3;④齒圈損傷——狀態4。對每種運行狀態進行2次獨立實驗,設置采樣頻率為102 400 Hz,每次實驗采樣時間40 s。采集位于齒圈上方齒輪箱箱體頂部傳感器的振動信號。將第一次實驗的數據作為訓練數據,第二次的作為測試數據。為方便計算,對信號進行重采樣,采樣頻率5 120 Hz,則對應每種運行狀態可獲得兩組數據,每組包含204 800個樣本點。此外,嚙合頻率、旋轉頻率與故障特征頻率間的關系如表2所示[19],其中為確保行星架單位時間內至少旋轉兩周,研究中要求太陽輪輸入轉速最低為 9 r/s,即每秒9轉。因此需分析從第4 s到第40 s的數據值,具體每組數據包含184 320個數據點。采用時移的方法,將每組數據劃分為150個樣本,每個樣本包含5 120個點,則四種狀態對應訓練樣本總數為600,測試樣本總數為600。圖 8 給出了齒輪箱不同狀態下訓練信號的時域波形。

圖8 信號波形圖Fig.8 Signal waves

表2 各頻率值Tab.2 the frequencies
根據 2.2 節中模式識別過程對信號進行處理。對于每個輸入模型的樣本(包含5 120個點),通過雙對抗編碼模型中編碼器與解碼器的對抗,提取潛在變量;通過潛在變量與從高斯混合分布中采集的樣本的對抗,使潛在變量服從給定的先驗分布。最后用從訓練集與測試集提取的特征對Softmax 進行訓練與測試。不妨選定第10 s 對應的樣本為示例樣本,采用維格納維拉 (wigner viller distribution,WVD)進行分析,圖9 所示為樣本時頻圖,對應頻譜如圖10。

圖9 樣本時頻圖Fig.9 Time-frequency of samples

圖10 樣本頻譜圖Fig.10 Spectrums of samples
研究中高斯混合分布的參數根據 2.1節確定,并按表 3 對模型參數進行初始化。涉及到的其他主要參數為批量樣本數,每層神經元數量與迭代次數。以分類器的故障識別準確率為指標,通過單因素分析法評估參數變化對指標的影響,從而選擇合適參數。
首先,給定迭代次數為 2 000,每層神經元個數為 250,批量樣本數分別設定為 25、50、75、100、125,隨機從測試樣本集中選擇400個樣本進行測試??紤]到樣本選擇的隨機性,對應每個批量樣本數重復計算 5 次,則每個工況對應 5 個準確率數值,選擇其中最小的數值作為該工況對應的準確率,由此可得批量樣本數變化對結果的影響如圖 11 所示。

圖11 批量樣本數選擇Fig.11 Selection of batch size
由圖 11 可知,當批量樣本數取不同參數值時,各工況對應的準確率均在96%以上,這是因為模型利用給定的高斯混合分布對不同類別的特征進行了專屬約束,強化了特征間的差異性,從而優化了特征的聚類效果,提高了模式識別的準確率。但不同的批量樣本數對各工況對應的準確率的影響并未表現出一致的規律性,其中,行星輪與齒圈對應工況保持了較高的診斷準確率,而基準與太陽輪對應工況的診斷準確率出現了波動。這是因為不同類別信號中存在近似頻率成分,如嚙合頻率,各部件旋轉頻率以及倍頻成分等,不同樣本中的近似成分對樣本識別容易造成干擾,但由于樣本選擇的隨機性以及參數的影響,干擾出現的概率存在差異;此外,輪齒的剝落損傷為人工處理,處理過程中的一些非確定性因素也容易對信號產生一定的影響。當參數值為75與100時,對應整體識別率相對較高,但增加批量樣本數會導致計算時間增加,因此,可選擇批量樣本數為75。
接下來,給定迭代次數為2 000,批量樣本數為75,每層神經元數量設定為250、500、750、1 000,由此可得每層神經元數量對結果的影響如圖12 所示。根據圖12可知,當神經元數量從250 增加到1 000 時,各工況對應的準確率均在94%以上,且神經元數量為1 000時,整體準確率相對較高,因而選擇神經元數量為1 000。

圖12 每層神經元個數選擇Fig.12 Selection of neurons
最后,給定批量樣本數為75,每層神經元個數為1 000,迭代次數設為2 000,3 000,4 000,5 000。由此可得迭代次數變化對結果的影響如圖13所示。

圖13 迭代次數選擇Fig.13 Selection of iterations
從圖13可知,當迭代次數為1 500~3 000時,模型故障診斷準確率均在94%以上。當迭代次數增加時,太陽輪工況對應的準確率明顯增加,齒圈工況對應的準確率出現波動,基準工況對應的準確率反而成下降趨勢,行星輪工況對應的準確率先保持不變,后下降。由此可知,模型對于不同類別特征的識別已達到較高的準確率,當迭代次數繼續增加時,該參數對于不同工況對應的準確率影響不同,除樣本選擇的隨機性外,由于迭代次數較多產生的過擬合現象也會對準確率產生一定的影響,導致準確率降低。因此,由圖13可選擇迭代次數為2 000。
綜上所述,相關參數的選擇根據實驗分析結果可確定為75(批量樣本數)、1 000(每層神經元數量)、2 000(迭代次數)。
在本節中,將 BAE 與 AAE、AE 和變分自編碼 (variational auto-encoder,VAE)等的分析結果進行比較。根據表 3 以及選定的參數建立 BAE 模型,AAE、AE 和 VAE 的結構參數與 BAE 對應部分的參數相同,訓練參數由實驗確定。在 Softmax 分類器部分,網絡結構設置為 2-250-4,標簽設置為 [1,0,0,0],[0,1,0,0],[0,0,1,0]和 [0,0,0,1],分別對應于狀態 1、2、3、4。圖 14 所示為可視化后的二維特征示例。

表3 模型初始化參數Tab.3 Initial parameters of the model

圖14 聚類結果Fig.14 Clustering results
從圖14可知,在圖14(a)與(b)中,除個別異常點外,同一類別特征點都位于各自專屬范圍內,不同類別的特征點間存在一定差距;而圖14(c)與(d)中,不同類別特征點間有較多重疊。為對不同方法提取的特征聚類性能進行量化評估,采用模糊C均值聚類算法[20]中的分類系數F和平均模糊熵H為指標來進行判斷。當F越接近1同時H越接近0時,表明整體聚類效果越好。圖 15 給出了不同方法提取的特征對應的F和H值。由圖15可知,BAE與AAE提取的特征整體聚類效果要明顯優于AE與VAE提取的特征。這是因為BAE與AAE引入了高斯混合分布,對不同類別的特征進行了專屬的分布約束,使得不同類別特征間的差異性得到了強化。

圖15 聚類評估Fig.15 Clustering evaluation
最后,用訓練樣本的特征對分類器進行訓練,然后用測試樣本進行測試。重復5次計算過程,選擇每個工況對應的 5 個準確率中的最小值作為最終診斷結果,如圖16。結果表明,提出的BAE模型與AAE都能夠以較高的準確率識別時變工況下的行星齒輪箱故障,相比于AE與VAE具有一定的優越性。其中,BAE以對抗機制在確保解碼器能夠重構信號的同時使得重構信號與原始信號服從相同的分布,解決了自編碼器中重構信號分布與原始信號分布可能不同的問題。

圖16 故障診斷準確率Fig.16 Accuracy of fault diagnosis
在我們的研究中,提出了一種基于雙對抗編碼(BAE)的智能故障診斷模型,用于對時變工況下行星齒輪箱故障進行識別。該方法以原始噪聲信號的時頻圖為輸入,通過引入高斯混合分布、標簽信息與雙對抗機制,改進了AAE模型。研究表明:
(1)該方法通過高斯混合分布對提取的特征進行約束,為進一步對提取的特征賦予顯式意義,并強化不同類別樣本特征間的差異性提供了一種解決方案,提高了特征的聚類性能。
(2)通過對抗對重構信號也進行了分布約束,使得重構信號與原始信號服從相同的分布,解決了自編碼模型中重構信號分布可能與原始信號分布不同的問題,從而豐富了特征包含的信息。
(3)模型訓練參數的選擇通常需要根據實驗進行確定,與同類方法相比,以更高的準確率識別了時變工況下行星齒輪箱故障,表現出一定的優越性。
最后,該方法有望被推廣用于處理時變工況下其他旋轉機械的智能故障診斷問題。