柴志豪






摘要:針對軸承工作過程中早期故障樣本少、故障類型不平衡的問題,提出一種基于生成式對抗網絡(GAN)的數據增強方法。該方法應用快速傅里葉變換(FFT)對軸承信號進行預處理,然后將頻譜作為GAN的輸入,生成故障樣本數據。最后,將生成的數據與原始數據結合構成新的數據集,并利用支持向量機(SVM)實現故障分類識別。通過軸承實驗和統計學特性驗證,表明該方法可以生成有效故障樣本,同時采用擴充后的新數據集與原始數據集相比診斷準確率更高。
關鍵詞:滾動軸承;故障診斷;生成式對抗網絡;支持向量機
0 ?引言
滾動軸承是旋轉機械中最重要的零件之一,因其復雜的工況和結構極易發生故障,從而造成重大經濟損失。實際應用中,旋轉機械設備多數情況在正常狀態下工作,因此可以收集到的故障數據較少,且存在著故障類型不平衡的問題[1-2]。
目前很多學者針對軸承早期故障診斷展開了大量研究。蘇文勝等提出一種基于EMD和譜峭度法的故障診斷方法,應用EMD對信號進行預處理從而提高診斷率[3];劉晨斐等提出將改進采樣方法和SVM結合,使得樣本達到均衡,從而提高變壓器故障診斷率[4];張思敏應用等角度重采樣提取故障特征,實現齒輪箱故障識別[5];侯文擎等提出一種基于SDAE的方法,得到故障狀態的特征表示,應用Soft-max進行故障分類識別[6]。本文提出一種基于生成式對抗網絡的數據集增強方法,該方法利用GAN強大的特征提取和數據生成能力,解決了非平衡、小樣本條件下軸承故障特征難以提取的問題,通過實驗驗證了其有效性。
1 ?生成式對抗網絡
生成式對抗網絡(generative adversarial networks,GAN)是近年來廣受好評的深度學習模型,基于統計學和博弈論來生成數據樣本,已迅速成為人工智能研究和應用領域中一種非常重要的模型和工具[7-8]。生成式對抗網絡有生成器(G)和判別器(D)兩部分組成,將隨機噪聲z輸入到生成器中,生成器通過學習真實樣本的概率分布pd,利用隨機噪聲z生成逼真的偽樣本,通過不斷訓練生成器以達到以假亂真的目的。判別器則用來區分真實樣本和生成器生成的樣本,二者構成一個動態的博弈過程。理想狀況下生成器生成足以“以假亂真”的樣本,而判別器難以分辨生成的樣本是否真實,此時D(G(z))=0.5,生成式對抗網絡的目標函數loss為[9]:
2 ?基于GAN的故障診斷方法
利用GAN處理原始信號,利用生成信號擴充數據集,并對該包含更多故障信息的數據集應用SVM進行分類,算法流程如圖2所示。
方法步驟如下:
①將原始數據集劃分為訓練集和測試集;
②對信號進行快速傅里葉變換,將得到的頻譜作為GAN的輸入;
③訓練GAN網絡,得到生成樣本并擴充數據集;
④利用SVM對擴充后的數據集進行分類;
⑤根據實驗結果驗證方法有效性。
3 ?實驗驗證分析
3.1 實驗數據采集
本實驗在軸承故障模擬試驗臺(MFS)上進行實驗數據采集。軸承型號為MBER-10K ,振動信號由安裝在軸承殼體上的加速度計在2100rpm(35 Hz)的驅動速度下采集,采樣頻率設置為10240Hz。本實驗模擬軸承的四種運動狀態:正常狀態、滾動子故障狀態、內圈故障狀態和外圈故障狀態。圖3為四種狀態的時域圖。
3.2 統計學特性分析
首先對生成信號和原始信號進行統計學特性分析,依次計算二者的歐氏距離、皮爾遜相關系數和KL散度。歐式距離可體現二者之間的距離并評估其相關性,皮爾遜相關系數為兩變量之間相關性的度量,KL散度評估二者之間的差異。進行三十次實驗,并將結果取平均值。
由表1可知,生成信號與真實信號之間歐氏距離較小,表明其相關度較高;皮爾遜系數為0.7840,表明二者線性相關;KL散度為0.1431表明生成信號與原始信號之間概率分布較小。以上結果表明生成信號與真實信號的概率分布較為接近,滿足故障診斷所需樣本的要求。
3.3 故障診斷結果
四類故障分為四組并分別采集60組振動數據,從每組的數據中隨機中選出40組作為訓練樣本集,其余20組數據作為測試樣本集。將GAN訓練生成的數據按照1:1的比例添加到原始數據集中,應用SVM對擴充后的數據集進行故障分類識別。
將擴充后的數據集與原始數據的分類結果進行對比,基于擴充數據集的平均故障診斷率高達97.3%,基于原始數據集的平均故障診斷率為88.5%。圖4為兩種數據集的分類結果。
圖4中,對原始數據集進行分類,雖然可以實現部分故障的分離,但是滾動子故障與外圈故障混疊嚴重,無法有效分離;圖5利用GAN擴充后的數據集分類后各類型故障聚類更緊密,基本達到完全分離,效果更好。
上述實驗表明,所提出的基于GAN的軸承故障診斷方法有較好的故障分類效果。實驗結果證明,利用GAN算法可以生成有效的仿真信號,從而解決數據不平衡問題,顯著提高了平均故障診斷率。
4 ?結論
綜上所述,為了解決軸承早期故障診斷中振動信號樣本不足、樣本不平衡等問題,本文提出一種基于GAN的軸承故障診斷方法。該方法利用GAN算法的特征提取和樣本生成能力生成有效的仿真信號,實現了小樣本、不平衡下的信號數據集增強,提高了故障診斷模型的識別能力。
參考文獻:
[1]張雪英,欒忠權,劉秀麗.基于深度學習的滾動軸承故障診斷研究綜述[J].設備管理與維修,2017(18):130-133.
[2]沙美妤,劉利國.基于振動信號的軸承故障診斷技術綜述[J].軸承,2015(09):59-63.
[3]蘇文勝,王奉濤,張志新,郭正剛,李宏坤.EMD降噪和譜峭度法在滾動軸承早期故障診斷中的應用[J].振動與沖擊,2010,29(03):18-21,201.
[4]劉晨斐,崔昊楊,李鑫,束江,李亞.不對稱樣本下基于支持向量機的變壓器故障診斷[J].高壓電器,2019,55(07):216-220.
[5]張思敏.基于啟動電流的轉子系統齒輪箱故障診斷方法研究[D].太原理工大學,2019.
[6]侯文擎,葉鳴,李巍華.基于改進堆疊降噪自編碼的滾動軸承故障分類[J].機械工程學報,2018,54(07):87-96.
[7]S. Shao, S. McAleer, R. Yan, P. Baldi, Highly-accurate machine fault diagnosis using deep transfer learning, IEEE Trans. Industr. Inform. 2018.
[8]M. Arjovsky, S. Chintala, L. Bottou, Wasserstein gan, arXiv preprint arXiv:1701.07875, 2017.
[9]I. Goodfellow, J. Pouget-Abadie, M. Mirza, B. Xu, D. Warde-Farley, S. Ozair, Y. Bengio, Generative adversarial nets, Adv. Neural Inf. Process. Syst. 2672-2680, 2014.