何群, 余志紅, 陳志剛, 王衍學, 幸貞雄
(1.北京建筑大學機電與車輛工程學院, 北京 100044; 2.中國勞動關系學院安全工程學院, 北京 100048; 3.貴州省勞動保護科學技術研究院, 貴州 563000)
滾動軸承在機械運作的過程中由于其在載荷作用下需要承受負載和減小機構間的摩擦,故軸承的內圈、外圈及滾動體很容易出現故障,進而威脅到機械設備和操作人員的安全。因此,研究準確有效的故障診斷方法,對減少事故的發生具有重要意義[1]。
通常情況下,對于滾動軸承進行機械故障診斷的關鍵步驟包括特征提取和模式識別。在當今數據爆炸的時代,傳統的時域和頻域的分析方法雖然應用廣泛,但是由于采集到的信號經常會受到多個振源的擾動、耦合,再加上環境存在噪聲,以至于得到線性和平穩性較差的信號[2]。基于上述原因,傳統的軸承故障診斷方法已經越來越不能滿足診斷要求[3]。
隨著計算機硬件技術的發展,診斷方法也飛速進步。文獻[4]提出的經驗模態分解(empirical mode decomposition,EMD)雖然能用自適應基函數處理線性和平穩性較差的信號,得到具有較高信噪比的結果[5],但是在現實中軸承信號往往是非線性非平穩的。而且該方法會出現模態混疊,導致信號分解之后的精度出現問題。而集合經驗模態分解(ensemble empirical mode decomposition,EEMD)對模態混疊的問題能實現有效抑制[6]。變模態分解(variational mode decomposition,VMD)作為一種新型自適應信號處理方法[7],將信號分解過程轉變為求解變分問題的過程,通過搜尋變分模型的最優解來實現信號的自適應分離,能對非遞歸、變分模態分解的模式對信號進行分解,克服了模態混疊和端點效應[8]。單純的信號處理并不能對故障進行自適應診斷,因此越來越多的學者開始研究自適應的故障分類方法。Kiranyaz等[9]總結了一維卷積神經網絡(one-dimensional convolutional neural network, 1D-CNN)可以直接應用于原始信號,而不需要任何預處理或后處理,如特征提取、選擇、降維、去噪等。Zhou等[10]提出了一種基于長短時記憶網絡(long short-term memory networks,LSTM)與遷移學習(transfer learning,TL)相結合的方法,對滾動軸承的4種不同工作狀態進行分類識別。但是時域、頻域信號的數據過長,即使經過特征提取之后輸入LSTM神經網絡中進行訓練的數據量依舊十分龐大,導致網絡的收斂性差,訓練時間長。由于信息熵(information entropy)主要依賴于概率分布,有效地反應數據所帶的信息量,因此選擇以信息熵為特征[11]。
對于滾動軸承故障出現時的振動信號,由于其不穩定、非線性,單純的EEMD和VMD難以實現特征提取和故障分類;1D-CNN直接從原始時域信號學習的時間成本太高;LSTM存在處理長數據存在天然劣勢。因此,在前人研究基礎上提出一種基于改進信息熵的LSTM網絡作為滾動軸承故障信號分類的模型,通過用EEMD和VMD分別求取原始信號的本征模式函數(intrinsic mode function,IMF),通過改進信息熵(improved information entropy,IIE)構建特征向量,將特征向量輸入LSTM網絡中得到訓練后的網絡模型,用于分類診斷,得出實驗結果。結果表明,所提出的方法能夠對多種軸承故障進行分類,并與傳統方法相比有較高準確度。
信息熵是衡量系統有序化程度的一個度量,可以理解成某種特定信息離散隨機事件出現的概率。系統越有序,熵值越低;反之系統越混亂,熵值越高。信息熵具體求解方式如下。
對于任意變量X,信息熵H(X)的表達式為
(1)
式(1)中:pi為第i個IMF分量的能量占總能量的比值,IMF分量由EEMD和VMD得到。
pi的計算公式為
(2)
(3)
式(3)中:x(t)為輸入關于時間t的信號序列;xi為第i個信號。
如果將信息熵用于描述軸承運動,在軸承出現故障時,軸承運動就會出現周期性的沖擊,它的表現就會更有序。因此,通過對原始信息分析后得出的IMF如果含有軸承的故障信號,則它的脈沖就會更秩序,也就會使得它的信息熵的值更小。但是,在軸承早期故障時,故障特征不夠明顯,從而導致識別率較低。為避免信息熵在一些特征不明顯的故障分量中存在被識別率低的問題,需要對信息熵進行改進,較明顯方法是將各個IMF特征放大。而峭度指標則通常作為描述波形峰態的重要參考,是評估故障沖擊式的重要指標。要使模型對沖擊信息較靈敏可以通過峭度對信息熵值加以改進,定義為
(4)
式(4)中:Qi為第i個IMF分量的改進信息熵;Hi和Ki分別為第i個IMF分量的信息熵和峭度指標。
因為信息熵只表示對應的IMF信息量,而由于環境噪聲等原因故障信息在熵值上表現不明顯,由于每一段特定信號分解出來的IMF數量一定,因此IMF的改進信息熵會有一個上限值為
(5)
式(5)中:n為分解得到的IMF數量;Q為信息熵。
單一組原始信號的平均改進信息熵為
(6)

LSTM是對傳統神經網絡的改進[12],對于循環神經網絡存在的兩個問題:梯度爆炸和消失,該方法能進行有效處理。LSTM單元結構如圖1所示。

Ct、Ct-1分別為t時刻和t-1時刻存儲單元信息;it為輸入門;ft為遺忘門;ot為輸出門;xt為t時刻輸入向量;σ為sigmoid函數;ht、ht-1分別為t時刻和t-1時刻隱藏層輸出信息;tanh為激活函數
LSTM由門限和記憶細胞構成。通過圖1可知:當輸入數據為xt時,LSTM單元的記憶細胞輸出分別為
(7)
式(7)中:Whf、Whi、Who分別為遺忘門、輸入門、輸出門與上一隱藏層之間的權重矩陣;Wxf、Wxi、Wxo分別為遺忘門、輸入門、輸出門之間的循環權重矩陣;bi、bo、bc、bf為偏置向量;σ為sigmoid函數。
EEMD是基于EMD改進而來,在原有信號基礎之上加入白噪聲,將信號篩分成若干僅含單一變量的IMF[13],利用白噪聲頻譜均勻分布的特點有效解決了EMD分解得到的IMF信息模糊的問題[14]。EEMD算法分解目標振動信號的步驟如下。
步驟1確定EEMD的運算次數r和高斯白噪聲的標準差δ。
步驟2在原始數據x(t)的基礎上,加入白噪聲hi(t),得到新的信號xi(t),其中i為分解次數,i=1,2,…,r。
xi(t)=x(t)+hi(t)
(8)
步驟3對新構成的信號xi(t)進行EEMD分解,得到IMF分量cij(t),其中cij(t)為第i次分解后得到的第j個IMF分量。
步驟4重復步驟2和步驟3r次,得到r組IMF分量構成的序列{cij(t)}和r組余量{Resij}。
VMD能通過設定分解層數K,將復雜信號進行分解成若干個IMF,以此在不受人工干預的情況下得到K個有限帶寬的分量。
VMD算法可表示為[15]
(9)
(10)
式中:uk={u1,u2,…,uk}為各個IMF分量;ωk={ω1,ω2,…,ωk}為每個分量中心的頻率;X(t)為初始輸入信號,?t為對t求偏導;δ(t)為沖擊函數。
最優解通過二次懲罰因子α,拉格朗日數乘法的乘子λ(t),構造增廣拉格朗日函數而得到。
VMD的分解步驟如下。

步驟2利用迭代更新參數uk和ωk。
步驟3更新拉格朗日乘子λ,其中ω為中心頻率。
步驟4設置判斷精度e>0,如果和停止條件不相符,則返回步驟2,反之則停止迭代,式(12)為判斷條件。
(11)
(12)
通過上述步驟進行VMD分解后得到IMF,取包含大部分有效信息的5個分量作為研究對象。
綜上所述,方法結構框架如圖2所示,通過對原始數據進行EEMD和VMD分解處理,得到一系列的IMF分量;求IMF的改進信息熵,組合成特征向量,分成訓練集和測試集,訓練LSTM網絡。

圖2 基于改進信息熵LSTM的診斷流程圖Fig.2 Diagnostic flowchart based on improved information entropy LSTM
為驗證本文設計故障診斷方法的可行性,將使用該方法對西儲大學的軸承數據中心種子故障測試數據進行分析。該數據包含多種不同故障類型和不同故障程度的軸承工作狀況。數據采集自驅動端,選取4種軸承工況下的正常工作數據,105組12 000的故障數據包含故障直徑各不相同的內圈故障、滾動體故障、加載于06:00方向的外圈故障,故障點由電火花技術進行精確加工。數據的采樣頻率為12 kHz。軸承故障的嚴重性用故障尺寸的大小來模擬,不同的轉速對應的是模擬不同的負載。
為減少噪聲干擾,將軸承原始數據信號進行歸一化處理,在[0,1]這個區間內最終得到各個工況的樣本數據。
首先對輸入的一組原始信號做EEMD,設定分解的集合數NE=50;噪聲標準差與輸入信號標準差之比Nstd=0.01。畫出EEMD分解得到的前5個包含主要信息的IMF如圖3所示。

圖3 EEMD分解圖Fig.3 Exploded view of EEMD
同時,對輸入的信號進行VMD分解,設定約束數據保真度的平衡參數α′=525;雙重上升的時間步長τ=0,表示噪聲松弛;要恢復的模式數K=4;選取init=1,表示所有的ω開始時都是均勻分布的(ω為預計模態的中心頻率);收斂準則的公差tol=1×10-7。VMD分解得到的圖像如圖4所示。

圖4 VMD分解圖Fig.4 Exploded view of VMD
然后,對生成的各個IMF求取其改進信息熵。改進信息熵的求取是將輸入的各個IMF按照時間序列,通過尋找各個IMF信號的各個分段的能量譜中能量最大的點,以分段數和最大能量差值的絕對值為約束求取分段間隔,再以出現概率不為零的每一段和得到各個IMF的信息熵Hi,再將Hi和對應的IMF峭度相乘得到改進信息熵Qi。通過EEMD和VMD得到的分量求得改進信息熵Hi后,以改進信息熵為信號特征得到對應特征向量并劃分訓練集和測試集。設置每種故障形式樣本數n=1 500,LSTM網絡為兩層,每層網絡包含的單元數為64;激活門函數為S型sigmoid函數,從S型函數的特性及結果滿意度考慮初始權值為(-1,1)中的任何數;全連接層兩層,每層包含的神經元個數也為64;后接Softmax分類器,作為輸出層。結構如圖5所示。

圖5 LSTM網絡結構Fig.5 LSTM network structure
軸承的內圈故障、滾動體故障、外圈故障和正常軸承數據分別為標簽1,2,3,4。獲得標簽數據集之后,劃分成70%訓練集、20%驗證集與10%測試集。分出測試集是為了客觀地判斷訓練所得參數對新數據的符合程度,交叉驗證的思想用于對模型參數測試,可避免模型被過度訓練。當驗證集的性能開始下降時,訓練結束。LSTM的學習效率設置為0.001,訓練集設置每輪迭代次數為30次,迭代輪數為100輪,最大迭代次數在2 400~3 000次進行微調;驗證集設置每輪迭代頻數為50次,最大迭代100輪,將驗證容忍度設置為驗證集的損失不再降低時停止訓練。訓練過程的準確度和損失函數圖像如圖6和圖7所示。

藍色實線為經過平滑處理的訓練數據;黑色點劃線為 驗證集的準確度

橙色實線為平滑處理后的損失函數;黑色點劃線為驗證集的損失函數
從圖6、圖7可以看出,驗證集在進行約2 700次迭代之后函數圖像收斂。此時損失函數達到平穩值,不再繼續降低,驗證集精度最終為98.73%。
為了證明本文方法可行且穩定,進行多次實驗得到了該方法測試數據平均診斷正確率,結果如表1所示。

表1 多次實驗準確率Table 1 Accuracy of multiple experiments
10次驗證集精度測試數據的平均準確率為98.705%,標準差為0.002 1。為證明本文方法相較于其他經典方法的優越性,選用VMD-LSTM、EEMD-LSTM、人工神經網絡(artificial neural network,ANN)、支持向量機(support vector machine,SVM)進行比較分析。VMD-LSTM用每個輸入數據VMD分解得到的分量構成數據集進行訓練,VMD分解的相關參數與本文方法設置一致,LSTM的學習率為0.001,兩層LSTM,兩層全連接層,采用sigmoid激活函數,迭代次數為2 000次;EEMD-LSTM采用EEMD求取每個輸入原始數據的IMF后組成相應數據集進行訓練,同樣采取兩層LSTM及sigmoid激活函數,學習率設置為0.001,迭代次數設置為3 000次;ANN的結構參數由反復調試確定,結構為24-50-7,學習率為0.1,迭代次數為400;SVM采RBF用核函數,結構參數由10折交叉驗證法確定該核函數的懲罰因子為30,半徑為0.31。不同方法的5次測試結果如圖8所示。5種方法的平均測試準確率如表2所示。

表2 不同方法的測試準確率Table 2 Accuracy of different methods

圖8 多種方法多次實驗準確率對比Fig.8 Comparison of multiple methods
提出一種基于改進信息熵和LSTM的滾動軸承故障診斷方法,對軸承故障識別有較高的準確度,和其他經典方法相比,具有更大的優勢。得出如下主要結論。
(1)對IMF的特性以及改進信息熵這一特征進行充分應用,將EEMD和VMD能對信號進行自適應分解的特性和改進信息熵結合,既避免了復雜的人工提取特征的過程,又能大量減少輸入到網絡中的數據量。
(2)提出了改進信息熵,通過和峭度指標的改進放大了包含故障的分量熵值,使得到的特征向量同時包含信息量大的分量和本來故障信息小的分量,既避免了丟失特征項,增強了魯棒性LSTM網絡的性能,在故障識別準確率上要優于一些經典模型。但對于復合故障分類精度會有所下降。今后將對該難點更深入地進行研究。