趙 川, 馮志鵬
(1. 北華航天工業學院 機電工程學院,河北 廊坊 065000; 2. 北京科技大學 機械工程學院,北京 100083)
行星齒輪箱在工業與航空等領域應用廣泛,但工作環境中存在多種因素容易對其零部件(齒輪、軸承等)造成不良影響導致發生損傷或失效,嚴重時會造成重大損失。文獻[1]指出由軸承缺陷引起的故障和平均停機時間占整個齒輪箱缺陷和總停機時間的 60% 以上。因此,對行星輪軸承故障診斷的研究具有重要意義。
在實際應用中,行星輪軸承運動比定軸軸承更為復雜,一般的定軸軸承故障診斷方法很難適用[2];加之行星齒輪箱轉速與載荷通常具有時變性,信號中的故障特征頻率也隨時間發生變化,使得發掘信號中的故障信息變得更為困難[3]。對于時變信號,通常采用時頻分析法來研究信號中的特征頻率成分以及頻率隨時間變化的規律。但在應用時頻分析方法對時變工況下行星齒輪箱信號進行分析時,發現存在時頻分辨率低與虛假成分干擾等問題,給故障特征的提取與識別造成困難。為解決該問題,相關學者進行了進一步的研究[4-9],基于廣義解調與同步壓縮變換、相角的熵特征、階次譜分析、自適應線性調頻模式分解等理論,提出多種時變工況下行星齒輪箱故障診斷方法。以上研究有助于在非平穩條件下對行星輪軸承進行故障診斷,但是大多數工作涉及專家知識,并依靠數據分析人員來人工識別故障特征頻率,主觀因素可能會影響故障診斷的準確性。
針對上述局限性,研究人員開展了相關的智能故障診斷研究。在近期的研究中,Zhang等[10]提出抗干擾深度卷積神經網絡模型,用于處理強噪音與不同負載環境下軸承的故障診斷問題。Shao等[11]基于壓縮傳感,改進了卷積深度置信網絡模型,并用滾動軸承故障數據進行了驗證,研究表明提出的模型提高了數據分析效率,增強了壓縮數據的特征學習能力,與傳統方法相比具有一定的優越性。Jia等[12]將特征提取與故障識別融合到一個模型中,用歸一化的稀疏自編碼器學習特征,后經特征層處理獲取移不變特征,最后在輸出層進行模式識別。經齒輪與軸承數據驗證表明,該模型提取的特征具有獨立的意義,增強了特征模式識別性能,具有一定的優越性。Ding等[13]利用局部多項式擬合和基于稀疏性的算法以及階次跟蹤技術來提取時域瞬態特征,并將非平穩瞬態特征轉換為角域中的平穩特征以進行故障診斷。但是,大多數智能診斷方法主要用于處理穩定工況下的故障診斷問題,且是對一維信號進行分析,提取特征;提取的特征通常為原始信號在低維度的抽象,沒有顯式的表達,缺乏可解釋性與可控性。而賦予特征顯式的表達與意義,能夠更具體地描述特征,并且通過對其顯式的表達進行變換或控制更容易實現對特征的優化,從而提高特征的聚類性能與模式識別準確率。因此,如何采用相關方法提取時變特征,同時賦予特征顯式意義,強化不同類別特征間的差異性需要進一步研究。
近來,生成模型因為能夠自適應提取特征,通過已知的分布對隱變量(即特征)進行擬合從而賦予特征顯式的表達而受到越來越多的關注[14-17],并開始應用到故障診斷領域[18-19]。Wang等[18]將生成對抗網絡(generative adversarial network, GAN) 和堆疊式降噪自動編碼器組合在一起以生成新樣本來擴展樣本集,解決了故障診斷中的小樣本問題。Zhao等[19]將變分自動編碼器 (variational auto-encoder, VAE) 引入故障診斷框架,使用來自高斯分布的隱變量生成人工振動信號,與真實信號混合,增強樣本集,然后結合卷積神經網絡提出了一種增強的故障診斷方法,解決了故障診斷中小樣本與樣本不平衡問題。但上述研究主要針對故障診斷中的小樣本問題,模型對于非平穩信號的適應性以及在特征分布擬合方面的應用還有待進一步研究。因此,在非平穩狀態下行星齒輪箱的智能故障診斷仍然是一個具有挑戰性的問題。
為了能夠自適應提取時變工況下行星輪軸承的信號特征,進行行星輪軸承智能故障診斷,本文構建了基于對抗變分自編碼的智能故障診斷模型。首先,獲取樣本時頻圖,為簡化模型輸入結構,對時頻圖進行二值化處理;構建多維獨立高斯分布,并進行采樣,根據類別信息,對樣本進行變換使其服從新的分布;利用變分自編碼模型提取的特征與變換后的對應類別的采樣樣本對判別器進行訓練,從而實現利用已知的先驗分布擬合未知的特征分布,賦予特征顯式的意義,并通過控制分布強化不同類別特征間的差異;最后利用優化后的特征對分類器進行訓練,通過測試數據驗證其性能。整體實現流程如圖1所示。

圖1 故障診斷過程
變分自編碼器是對自編碼器 (auto-encoder, AE)的改進與升級。AE本質是以一種無監督的方式自適應地提取非線性特征。圖2展示了多層自動編碼器的深層網絡結構。其中,編碼器部分旨在從輸入數據生成隱變量表示,而解碼器部分用于根據隱變量重構輸出,使其盡可能接近原始輸入[20]。如圖2所示,該結構具有輸入層,2r-1個隱藏層以及輸出層。輸入數據表示為向量x=[x1,x2,…,xm]T,輸出向量表示為u=[u1,u2,…,um]T,其中m為輸入與輸出層神經元個數。

圖2 自編碼網絡結構
第k個隱含層的向量為zk=[zk,1,zk,2,…,zk,s_k]T,其中s_k為第k層的神經元個數為s。每一層的激活計算可按式 (1) 進行。
(1)
與AE不同,GAN的本質是以一種簡單的方式從潛在空間生成與真實數據近似的樣本,并使生成樣本服從與真實樣本相同的分布。在GAN模型中,生成器G從潛在空間生成新樣本,而判別器D則將生成樣本與訓練樣本區分開。具體地,生成器利用函數G(z) 欺騙判別器D(x),使判別器認為生成的樣本來自訓練集,而判別器則嘗試正確識別生成樣本。經過訓練,生成器生成的樣本與訓練數據近似。圖3給出了一個GAN的結構。

圖3 對抗生成網絡結構
對抗過程損失函數可通過目標函數式 (2) 進行計算。
(2)
式中:E為期望;pdata(x) 與p(z) 分別為x與z服從的概率分布情況;D(x) 為判別器的輸出結果,用于判斷判別器輸入為x的概率。目標函數一方面希望當把真實數據放入判別器后,輸出的概率值與目標函數值最大,另一方面希望找到最優的生成函數G(z),使得目標函數值最小,因而二者進行對抗。最后,使用交替隨機梯度下降法來進行訓練,直到收斂。
Kingma等[22]提出變分自編碼思想,揭示了輸入數據與隱變量間分布的映射關系,改善了AE由于單值映射而造成的過擬合問題。變分自編碼器 (variational auto-encoder,VAE) 結構如圖4所示。

圖4 變分自編碼網絡結構
在AE中,當訓練得到解碼器后,我們希望輸入一個編碼,通過解碼器生成一張圖片,但實際上僅僅通過自編碼器得到的結果并不好。研究表明,變分自編碼器能夠提升編碼器對圖片的重構效果。在VAE中,編碼器與解碼器過程不變,編碼器輸出兩個向量,不妨設定編碼維數為3,則兩個向量分別為(m1,m2,m3)與(σ1,σ2,σ3),此外再從高斯分布中采樣 (e1,e2,e3),通過式(3)計算隱變量(z1,z2,z3),通過解碼器獲取輸出,使重構誤差更小。
zi=exp(σi)×ei+mi
(3)
在自編碼模型中,如果編碼器產生的隱變量服從高斯分布,即z~N(μ,σ),則可實現分布的映射。從N(μ,σ)采樣輸入解碼器,可以重構原始數據。但采樣操作對μ和σ不可導,導致通過誤差反向傳播的梯度下降訓練法無法使用。因此,VAE給定了一個標準正態分布N(0,1),并從該分布采樣e,使得z=exp(σ)×e+m,從而實現z~N(μ,σ)。此時,從編碼器輸出到z,只涉及線性操作,而且e對于神經網絡而言只是常數,因此,可以正常使用梯度下降訓練法進行優化。
但對于多類別輸入,變分自編碼中的標準正態分布只是使得編碼器輸出的隱變量服從正態分布N(μ,σ),特征分布由未知變為已知,進一步規范了特征,而不同類別特征間的差異性卻并沒有得到明顯強化。因此,該方法對特征模式識別性能的改善比較有限。
針對該問題,本文構建了多維獨立高斯分布,以使提取的每個隱變量 (即特征向量的每個元素) 都有自己的專屬分布,從而實現用已知分布擬合特征的未知分布,賦予特征顯式意義,也為通過控制已知分布來強化不同類別特征間的差異性提供可能。設p維的隨機向量為O=[o1,o2,…,op]T,且有密度函數如式(4)所示。
(4)
式中:μ為p維向量;H為p階正定對角矩陣;detH為H的行列式,則稱O服從p維獨立高斯分布,記為O~Np(μ,H)。
這里以二維獨立高斯分布(p=2)為例,不妨給定參數μ=[0, 0]T,H=[0.5,0; 0,0.1],然后從該分布采集b個樣本,樣本點記為(o1k,o2k),k=1,2,…,b,則o1與o2分別服從一維高斯分布N(0,0.5)和N(0,0.1)。為了能夠使采集的b個樣本約束n類特征,通過式(5)、式(6)將其分成與類別信息相關的n組
(5)
(6)


圖5 從分布Np(A μ, AHAT) 采集的樣本(n=4,b=4 000)
為了便于理解模型,將特征可視化。引入二維獨立高斯分布 (p=2),通過對抗學習,用已知的二維高斯分布擬合未知的特征分布,使得不同類別的特征具有專屬分布,計算過程如圖 6 所示。

圖6 對抗變分自編碼模型
在圖 6 中:x表示輸入向量,假定服從分布p(x);z為隱變量向量,如果將編碼器分布表示為q(z|x),則可以根據式(7)計算后驗分布q(z)。
(7)
由于p(x) 未知,因而無法對q(z) 進行顯式的表達。對抗變分自編碼旨在用已知的分布p(z) 擬合分布q(z),同時最小化VAE的重構誤差。判別器用于確定樣本來自哪個分布。如果樣本來自p(z),則判別器將認為它是真實樣本,并且輸出為 1,否則輸出為零。同時,作為對抗網絡的生成器,VAE不斷更新并試圖欺騙判別器以給出錯誤的結果。
具體地,將信號的時頻圖數據輸入編碼器,并通過標準正態分布給隱變量增加噪聲。將隱變量、二維獨立高斯分布的采樣樣本分別與相應的標簽信息融合,形成復合向量。與常規對抗網絡輸入不同,這里以高斯分布的復合向量為真,隱變量復合向量為假,對判別器進行訓練,從而使得隱變量受到專屬分布的約束。之后,提取訓練集的特征來訓練分類器。在訓練多維獨立高斯分布對抗變分自編碼器和分類器之后,將使用測試樣本來測試整個框架及其性能。
針對時變工況下行星輪軸承故障信號,模式識別具體處理過程如下:
步驟1樣本分類。將時變工況下行星輪軸承信號樣本分為訓練集與測試集,每個樣本集包含四類樣本,分別對應正常(狀態1)、外圈損傷(狀態2)、滾動體損傷(狀態3)與內圈損傷(狀態4)等狀態。
步驟2信號處理。采用短時傅里葉變換 (short time fourier transformation, STFT) 法獲取樣本時頻圖,并根據最大類間方差法[23]進行二值化處理,從而簡化模型輸入結構,便于特征提取。

步驟4softmax分類器訓練。用提取的訓練樣本的特征訓練分類器,提取所有測試樣本特征,測試分類器性能,最終識別行星輪軸承故障。
行星齒輪箱實驗臺基本組成如圖 7 所示,驅動電機與齒輪箱之間通過速度傳感器連接,負載由電磁制動器提供 (實驗中為零負載),數據采集系統用于檢測齒輪箱運行狀態,對信號進行測量與保存。相關齒輪箱參數如表1所示。

圖7 實驗系統平臺

表1 行星齒輪箱齒輪參數
為模擬行星輪軸承故障,分別對外圈、某一滾動體、內圈進行人工處理,形成剝落損傷,損傷尺寸如表2所示,實物如圖8所示。由此可形成時變工況下的四種運行狀態:①基準——狀態1,所有零件無損傷;②外圈損傷——狀態2,只一個行星輪軸承外圈有損傷;③滾動體損傷——狀態3,只有一個行星輪軸承的單個滾動體有損傷;④內圈損傷——狀態4,只有一個行星輪軸承內圈有損傷。

表2 軸承損傷尺寸

圖8 軸承損傷
驅動電機轉速根據分段函數式(8)進行設定,其中fmax=19 Hz。轉速曲線如圖9所示。分別對每種運行狀態進行兩次實驗,采集位于齒圈上方齒輪箱箱體頂部傳感器的振動信號。設置采樣頻率為102 400 Hz,每次實驗采樣時間60 s。將第一次實驗的數據作為訓練數據,第二次的作為測試數據。

圖9 轉速曲線圖
(8)
分析對應轉速曲線5~45 s內的數據。為方便計算,對信號進行重采樣,采樣頻率5 120 Hz,對應每種運行狀態可獲得兩組數據,每組包含209 920個數據點。圖10給出了軸承不同狀態訓練信號的時域波形。

圖10 信號波形
采用時移的方法,將每組數據劃分為150個樣本,每個樣本包含5 120個點,則四種狀態對應訓練樣本總數為600,測試樣本總數為600。
根據2.3節中模式識別的基本步驟對信號進行處理與分析。不妨選對應轉速曲線第15 s內的不同狀態的樣本為例,樣本時頻圖如圖11所示。

圖11 樣本時頻圖
在研究中,所涉及的參數主要是批量大小,隱含層神經元數量和迭代次數。首先根據表 3 建立模型,再通過單因素分析法分析和選擇適當的參數。觀察當其他參數確定,只有一個參數發生變化時,該參數對模型故障診斷準確率的影響。
首先,給定批處理的大小和隱含層中神經元的數量分別為100和1 000,迭代次數預設為100,200,300,400,500。考慮到訓練過程中樣本選擇的隨機性,針對每個迭代次數,重復計算5次,選擇每個狀態對應的5個準確率中的最小值作為最終結果,則由迭代次數變化引起的影響結果如圖12所示。

圖12 迭代次數選擇
根據圖 12 可知,迭代次數為100和500時,模型的故障診斷準確率偏低。通過200~400次迭代,模型能夠以較高準確率診斷四種狀態。其中,當迭代次數為300時,模型整體的診斷準確率更高。因此,可以選擇迭代次數為300。
接下來,給定神經元數量為100,迭代次數為300,預設批量大小為25,50,75,100,125。圖13顯示了對應不同批量大小樣本數的故障診斷結果。由圖13可知,當批量樣本數為25和125時,模型的故障診斷準確率偏低;批量大小為50時,整體上能夠以較高的準確率識別四種狀態。因此,可以選擇批量大小為50。

圖13 批量樣本數選擇
最后,給定迭代次數為300,批量大小為50,將神經元數設置為250,500,750,1 000,1 250。圖 14給出了不同神經元數量對診斷準確率的影響。根據圖14,神經元數從500~1 250,能夠以較高準確率診斷四種狀態。但是隨著神經元數量的增加,結果并沒有變得更好。因此,為了保證計算效率,可以選擇神經元數量為750。

圖14 神經元數量選擇
根據上面的分析不難發現,模型迭代次數與批量樣本數對模型故障診斷準確率有一定的影響。當參數值較小時,模型訓練不充分,導致故障診斷準確率偏低;參數值較大時,模型訓練產生過擬合現象,使得模型的泛化能力下降,也會導致模型故障診斷準確率降低。對于每層神經元數量而言,當參數值取較小值時,模型權值需要來回調整,不易穩定,導致診斷準確率相對偏低,而隨著神經元數量的增加,權值訓練則更容易快速趨于穩定,但該參數值的變化對于模型診斷準確率的影響較小。為保證計算效率與網絡性能,一般在滿足精度要求的前提下選擇較少的神經元個數。綜上所述,相關參數通常需要根據經驗和實驗分析確定。這里選擇的參數是300(迭代次數),50(批量大小) 和750(神經元數量)。
在本節中,將AVAE與其他兩種廣泛使用的方法AE和VAE進行比較。根據表3以及在3.2節中選定的參數建立AVAE模型。AE和VAE模型的網絡結構參數 (包括網絡層數與每層神經元個數) 與AVAE的對應部分相同,訓練參數如迭代次數、批量樣本數等通過單因素分析法確定。AE對應的訓練參數值為300,50;VAE對應的訓練參數值為700,50。在分類器部分,網絡結構設置為2-250-4,標簽設置為[1, 0, 0, 0],[0, 1, 0, 0],[0, 0, 1, 0]和[0, 0, 0, 1],分別對應于狀態1,2,3,4。為了觀察提取的特征,將特征可視化,如圖15所示。

表3 模型構建參數

圖15 聚類結果
此外,使用模糊C均值聚類算法[24],以分類系數F和平均模糊熵H為指標來評估聚類性能。當F越接近1同時H越接近0時,聚類效果越好。表4列出了不同方法提取的特征對應的F和H值,從中可以看出AVAE提取出的特征聚類性能最好,這是因為AVAE提取的特征受到了多維獨立高斯分布的專屬約束,強化了不同類別特征間的差異。此外,從圖15中也可以看出,AVAE提取的特征比AE和VAE提取的特征具有更好的聚類性能,這與上面的定量分析保持了一致。最后,用訓練樣本的特征對分類器進行訓練,然后通過測試樣本進行測試。考慮到模型訓練過程中樣本選擇的隨機性,重復5次計算過程,選擇每個狀態對應的5個準確率中的最小值作為最終結果,如表5所示。這表明所提出的模型能夠以較高準確率識別時變工況下的行星輪軸承故障,具有一定的優越性。其中,滾動體損傷的故障診斷準確率相對較低,這是因為行星輪軸承中滾動體的運動最為復雜,除了繞自身軸線旋轉外,還會圍繞行星輪軸轉動,同時隨著行星架的運動而運動。此外,滾動體損傷與內圈或外圈接觸時都會引發沖擊振動。因而滾動體損傷引起的振動信號包含更多復雜的成分,受到的干擾更多,識別難度也最大。

表4 聚類效果評估

表5 診斷準確率
在研究中,我們將多維獨立高斯分布引入對抗變分自編碼模型,提出了一種新的智能故障診斷方案,用于對時變工況下行星輪軸承進行故障診斷。該方法用變分自編碼模型來提取原始信號的時頻圖特征,同時通過對抗機制,用已知的多維獨立高斯分布來擬合未知的特征分布,賦予了特征顯式的意義,同時強化了不同狀態樣本時頻圖特征間的差異性。方法經實驗數據進行了驗證,結果表明:
(1)模型迭代次數與批量樣本數對故障識別準確率有一定的影響。參數值較小時,由于訓練不充分導致模型準確率不高,參數值較大時,則容易產生過擬合現象,導致模型泛化能力下降,降低模型準確率。
(2)模型每層神經元數量取較小值時,模型權值需要來回調整,不易穩定。為保證計算效率與網絡性能,一般在滿足精度要求的前提下選擇較少的神經元個數。
(3)與AE、VAE相比,AVAE提取的特征具有更好的聚合性能,特征能夠被顯式的表達,且不同類別特征間的差異更為明顯。AVAE能夠以較高的準確率診斷時變工況下行星輪軸承故障,表現出一定的優越性。