楊淑潔,周楊
(浙江海洋大學 海洋工程裝備學院,浙江 舟山 316022)
軸承是旋轉機械的重要組成部分之一[1],它的性能好壞直接能影響到與之相連接的機器設備的運行狀況。一旦軸承發生故障,輕則導致機器停機,重則導致人員傷亡,這勢必會給企業的安全生產和經濟收入帶來影響。所以,軸承故障的診斷成為了國內外研究的熱點領域之一。
滾動軸承是一種標準件,其基本結構由內圈、外圈、滾動體、保持架4個部分組成,這4個部分是易發生故障的地方。當滾動軸承出現故障時,會產生異常的振動信號。因此,可以將振動信號作為軸承故障診斷的特征信號[2]。
軸承故障診斷主要圍繞著故障特征提取和分類的問題進行研究。文獻[3]提出了經驗模式分解(Empirical Mode Decomposition, EMD),這是一種新型自適應信號的時頻處理方法,特別適用于非線性非平穩信號的分析處理。文獻[4]針對EMD方法存在模態混疊的問題,采用噪聲輔助分析,提出了集合經驗模態分解(Ensemble Empirical Mode Decomposition, EEMD),能夠有效抑制模態混疊的問題。
傳統滾動軸承故障診斷通過時域或頻域分析進行故障分類是比較困難的[5],近幾年隨著機器學習和人工智能的發展,越來越多的學者將機器學習當中的算法引入到機械的故障診斷當中。文獻[6]提出了一種改進的卷積神經網絡(Convolutional Neural Network, CNN)與支持向量機(Support Vector Machine, SVM)相結合的方法,實驗結果表明該方法在針對電動機軸承微小故障的智能識別具有很高的準確性。文獻[7]提出了一種基于長短時記憶網絡(Long Short-Term Memory Networks, LSTM)與遷移學習(Transfer Learning, TL)相結合的方法,實現了基于聲發射技術對滾動軸承的智能分類。文獻[8]提出了一種基于隨機搜索與長短時記憶神經網絡的滾動軸承故障狀態識別算法,通過LSTM模型實現了從原始數據出發對軸承的故障數據信號進行特征提取和學習,無需人工干預,進而可以對軸承故障的分類。文獻[9]提出了一種基于BP(Back Propagation, BP)神經網絡滾動軸承故障診斷的多尺度局部特征學習方法,相對于傳統的人為選擇故障特征而言,此智能故障診斷技術能夠更好地利用原始數據,自適應地從原始數據中學習故障特征,從而提高了故障診斷的準確性。
針對滾動軸承在發生故障時,目標振動信號的不穩定性和非線性導致故障特征難以提取,并且軸承的故障振動信號是屬于時間序列數據且包含多種故障情況,為了提高故障分類問題的準確性,本文提出了一種基于EEMD與LSTM神經網絡相結合的滾動軸承故障識別的方法。將軸承的振動信號經EEMD處理,得到了若干個本征模態函數(Intrinsic Mode Function, IMF)分量。為了剔除IMF分量當中的虛假分量,選出其中最能反映振動信號特征的分量,利用主成分分析法(Principal Component Analysis, PCA)對IMF分量進行降維。然后在計算降維后的分量占各自總能量的比例,把能量比所組成的特征向量作為LSTM神經網絡的輸入參數進行故障識別,將識別結果與EMD-BP、EEMD-KNN不同的故障分類模型所得的結果進行對比,結果表明,本文所用的方法對軸承故障識別的準確率更高。
EEMD是基于EMD改進而來,在原有信號基礎之上加入白噪聲,利用白噪聲頻譜均勻分布的特點有效解決了EMD所出現的模態混疊現象。EEMD算法分解目標振動信號的步驟如下[10]:
1)確定EEMD的運算次數r和高斯白噪聲的標準差σ。
2)在原始信息x(t)的基礎之上,加入白噪聲hi(t),得到了新的信息xi(t),其中i=1,2,3…,r,代表第i次分解:

目標振動信號經EEMD分解之后得到若干個IMF分量,在這些分量中,會存在一些虛假分量,它們的存在會影響后續LSTM神經網絡分類的準確性。因此,為了去除這些虛假分量,選出其中最能反映目標振動信號特征的分量,需要對各分量進行降維。
PCA是一種無監督學習,屬于數據降維的一種重要方法。通過PCA算法可以將原始數據從一個高維空間映射到低維度空間,其本質就是把原有的多個指標轉化成幾個代表性好的綜合指標,這幾個指標能夠反映原來指標大部分的信息,并且各個指標之間保持獨立。
利用PCA算法對EEMD分解后得到的j個IMF分量進行降維的過程如下[11]:
1)假設每組IMF分量中有j個IMF分量,每個分量有p個變量,則樣本矩陣X如下:

4)計算標準化后的矩陣的相關系數矩陣和特征值λk,將其特征值從大到小排序。
5)根據主成分的累計貢獻率φ大于85%的原則,計算前q(q<j)個主成分累計貢獻率φ,從而起到了降維的作用。

不同故障狀態下,軸承振動信號的能量分布是不同的,因此,利用這一特點計算IMF主成分分量的能量占總能量的比例,將其作為LSTM神經網絡故障識別的輸入參數。提取能量特征的步驟如下[12]:
1)目標振動信號經EEMD分解和PCA降維之后,得到了q個IMF主成分分量,計算各分量的能量

LSTM是在循環神經網絡(Recurrent Neural Network,RNN)的基礎之上改進而來,是一種RNN特殊的類型。通過增加遺忘門、輸入門及輸出門的結構來選擇性地決定信息的保留和遺忘[13],從而解決了RNN在較長時間序列訓練過程中產生的梯度爆炸和梯度消失的問題。其中,遺忘門主要決定從細胞狀態中遺忘什么信息,輸入門決定向細胞狀態更新信息,輸出門決定向細胞狀態中更新信息[14]。LSTM的單元結構示意圖如圖1所示,計算過程的公式如下:

圖1 LSTM單元結構示意圖



針對滾動軸承在發生故障時,故障振動信號的不穩定性和非線性導致故障特征難以提取并且軸承的故障振動信號是屬于時間序列數據且包含多種情況,為了提高故障分類問題的準確性的這一情況,提取了一種基于EEMD-PCA與LSTM 神經網絡的滾動軸承故障識別的流程如圖2所示,此方法的步驟如下:

圖2 故障識別的流程圖
1)分別采集不同工況狀態下的滾動軸承的振動信號,利用EEMD算法對滾動軸承的振動信號進行分解,得到了若干個本征模態函數分量IMF。
2)在這些經分解后的若干個IMF分量中,會存在一些虛假分量,它們的存在會影響后續LSTM神經網絡分類的準確性。為了去除虛假分量,提高LSTM神經網絡的識別率,可以利用主成分分析法對這若干個IMF分量進行降維,選出其中最能反映目標振動信號的特征分量。
3)計算IMF主成分分量占各自總能量的比例,再將能量比作為LSTM神經網絡的輸入參數。
4)將數據集劃分成訓練集和測試集,用于LSTM神經網絡模型的訓練和測試。
5)將訓練集作為LSTM神經網絡的輸入參數進行訓練,最終得到了軸承的故障識別模型。然后再將測試集輸入到已經訓練好了的模型當中去,將其輸出的結果與實際結果進行對比來判斷模型的識別率。
為了驗證本文所提出的EEMD-PCA與LSTM神經網絡的有效性,本文利用軸承的故障數據對該算法進行了仿真驗證。仿真采用的實驗數據來自美國凱斯西儲大學(Case Western Reserve University,CWRU)軸承數據中心[15],該數據集被廣泛用于軸承的故障診斷領域,所以,該數據被本領域所公認有效。如圖3從左至右所示,實驗器材有電動機、轉矩傳感器、編碼器、測力計、測功器。被測軸承為6250-2RS JEM KSF,深溝球軸承,軸承直徑為0.1778 mm。采樣頻率為12 kHz,主軸轉速為1772 r/min。使用的是驅動端(DE)軸承故障數據,采用電火花技術進行加工以模擬其故障,故障直徑為0.1778 mm。包括內圈、外圈、滾動體故障,其中外圈故障采用的是以負荷區6點鐘方向為中心的3點鐘方向的數據。每種故障共有12組數,每組取4100個數,8組訓練組,4組測試組。

圖3 實驗器材圖
圖4所示分別為軸承在滾動體故障、內圈故障、外圈故障、正常4種情況下振動信號的時域圖和頻域圖。

圖4 軸承在不同情況下振動信號的時域和頻域圖
根據Huang等[3]推薦的標準可知,本文的高斯白噪聲標準差選為0.2,平均運算次數選為100,利用EEMD算法對軸承外圈故障的振動信號進行處理,得到了如圖5所示的IMF分量。

圖5 軸承外圈故障信號EEMD分解圖
從EEMD分解圖可以看出,軸承外圈故障信號可以分解為13組IMF分量。在這些分量中存在一些虛假分量,它們的存在會影響后續LSTM神經網絡分類的準確性。為了去除虛假分量,提高LSTM神經網絡的識別率,可以利用主成分分析法對這若干個IMF分量進行降維,選出其中最能反映目標振動信號特征的分量。表1是軸承外圈故障信號的所有IMF分量的貢獻率。

表1 軸承外圈故障信號的IMF分量的貢獻率
根據PCA的選取原則可知,選取表1的前8個主成分。同理可得,分別對軸承在正常情況下、內圈故障、滾動體故障進行處理,各分量的累計貢獻率如表2所示。

表2 軸承在不同工況下各主成分的貢獻率
由表2可知,軸承在正常情況下、內圈故障下、滾動體故障下的IMF分量在經過主成分分析法處理后,前8組主成分的累計貢獻率分別是90.660%、88.912%、89.704%,其值均大于85%。
利用式(8)和式(9)可以分別計算出軸承外圈的IFM主成分分量的能量比,如表3所示。

表3 軸承外圈IMF主成分分量的能量比
同理,可分別計算出軸承在正常情況下、內圈故障下、滾動體故障下IMF主成分分量的能量比,由于篇幅有限,此處僅給出3種情況下的4組樣本的IMF主成分分量能量比,如表4所示。

表4 軸承在不同工況下IMF主成分分量的能量比
再將訓練集的IMF主成分分量的能量比作為特征向量輸入到LSTM神經網絡當中去進行訓練。從軸承的每種工況下隨機抽取8組作為訓練樣本,4組作為測試樣本。為了更好地進行LSTM神經網絡訓練,需要對軸承在不同工況下的IMF主成分分量的能量比進行標簽分類處理,處理結果如表5所示。

表5 軸承故障數據標簽分類處理
LSTM神經網絡測試的結果如表6所示,任取其中的一次訓練過程如圖6所示。

圖6 LSTM神經網絡訓練進度圖

表6 LSTM神經網絡測試的結果
為了驗證EEMD-PCA 與LSTM神經網絡方法的有效性,在相同的數據下與EMDBP神經網絡[16]、EEMD-KNN[17]進行對比,取其中的一次誤差迭代曲線如圖7所示。

圖7 誤差迭代曲線
對比表7可知,在識別軸承故障狀態時,本文的故障診斷模型分類正確率分別高于EMD-BP、EEMD-KNN故障診斷模型的分類正確率,由此可知,本文所采用的方法可以有效地進行軸承的故障識別。

表7 不同模型下的分類正確率 %
本文提出了一種基于EEMD-PCA與LSTM神經網絡相結合的滾動軸承故障識別的方法,首先對軸承不同狀態下的目標振動信號進行EEMD分解,得到了若干個IMF分量。在這些IMF分量中,會存在一些虛假分量,它們的存在會影響后續LSTM神經網絡分類的準確性。為了去除這些虛假分量,選出其中最能反映目標振動信號特征的分量,可以利用PCA算法對各分量進行降維。然后再計算IMF主成分分量的能量占各自總能量的比例,將能量比所組成的特征向量作為LSTM神經網絡故障識別的輸入參數。最后將識別結果與EMD-BP、EEMD-KNN所得的結果進行對比,對比結果表明,本文所提出的方法在進行軸承的故障診斷上更具有優勢,從而驗證了該方法的有效性。