李俊卿, 胡曉東, 耿繼亞, 張承志, 王羅, 何玉靈
(1.華北電力大學 電氣與電子工程學院,河北 保定 071000; 2.中國長江三峽集團有限公司,北京100038; 3.華北電力大學 機械工程系,河北 保定 071000)
軸承是電機的關鍵部件之一,它直接關系到電機的安全穩定運行[1]。由于軸承與電機其他部位聯系緊密,若軸承的故障未被及時發現并清除,可能會導致整個電機異常,造成巨大經濟損失。對滾動軸承的早期故障進行及時、準確的診斷,可以有效地解決設備的潛在故障,提高設備的運行經濟性和利用率[2]。然而實際中軸承運行工況復雜多變,軸承振動信號不僅受到多種噪聲影響,而且受到轉速變化的干擾;另外,軸承故障實驗成本較大,實際中往往只有很少的故障樣本。因此,如何在不同工況下和小樣本條件下實現軸承的精確故障診斷成為當前的研究熱點之一。
在軸承的故障診斷方向上,對軸承的振動信號進行處理是很有必要的[3]。近年來,針對非平穩和非線性的振動信號,出現了各種有效的信號分解方法,并已經應用于軸承的故障診斷中[4]。文獻[5]采用小波變換對振動數據進行降噪處理,然后結合Hilbert變換實現軸承的故障診斷,雖然小波變換具有構造簡單的特點,但是欠缺自適應能力,不適用于對復雜信號的分析;文獻[6]采用經驗模式分解對振動信號進行預處理,得到固有模態函數后采用隨機森林算法進行故障分類,取得了較好的分類效果,但是經驗模式分解存在較嚴重的模態混疊和端點效應問題;文獻[7]采用集合經驗模式分解對軸承振動信號分解,并采用峭度準則選取分解后的信號分量,也取得了不錯的效果,但集合經驗模式分解受殘余噪聲的影響較大;為了解決以上這些算法存在的問題,近年興起的奇異譜分解算法在故障診斷領域得到了廣泛應用,文獻[8]將采集的信號構建成信號矩陣,然后采用奇異譜分解得到奇異譜分量;文獻[9]結合了改進奇異譜分解和奇異值分解對齒輪故障特征進行提取,根據峭度值最大準則篩選出最佳奇異譜分量并進行奇異值分解處理,利用奇異值能量標準譜自適應確定重構信號階數實現信號還原和信號降噪。以上算法大多應用于單一傳感器信號的分解處理中,忽略了信號間的耦合關系,造成信息丟失,對故障的描述失去整體性。動態模態分解(dynamic mode decomposition,DMD)最早興起于流體動力學領域[10],是一種基于奇異值分解(singular value decomposition,SVD)的分解方法,是一種數據驅動方法,且不依賴于其他因素[11],不僅可以解決以上算法存在的問題,而且可以融合多個傳感器的數據信息。DMD算法可以將提取的模態與時間矩陣進行內積,從而得到與原始信號高度相似的重構信號。DMD算法為復雜的多個傳感器信號下的故障診斷提供了一種新的研究思路和手段。
如果僅依靠以上信號分解方法對振動信號進行處理,往往達不到理想的診斷效果。隨著人工智能的發展,機器學習逐漸代替了人工進行特征提取,而且眾多實驗證明診斷效果比較理想。文獻[12]采用麻雀優化算法對支持向量機的參數進行優化,然后將其應用于滾動軸承的故障診斷,取得了較高的診斷正確率,但是機器學習網絡學習能力有限,難以將其應用于復雜工況下的軸承故障診斷。深度學習自2006年被提出后,已經廣泛應用于各個領域[13]。文獻[14] 采用卷積神經網絡(convolutional neural network,CNN)對滾動軸承進行故障診斷,并結合了注意力機制,達到了良好的分類效果和較高的診斷準確率;文獻[15]利用連續小波變換將振動數據轉為時頻圖,然后搭建了含批量歸一化和隨機失活的卷積神經網絡中進行故障診斷,在測試集上達到了較高的準確率;文獻[16]針對實際工程中傳感器的結構,提出了多傳感器卷積神經網絡,結果表明該方法診斷效果良好并且具備較高的穩定性。雖然CNN具有超強的學習能力,但未考慮特征之間的關聯,另外,最大池化層只保留最活躍的神經元,這無疑會在一定程度上造成信息丟失。2017年,Sabour等人提出了膠囊網絡模型(capsule network,CN)[17],CN模型突破常規,將傳統的標量的神經元轉換為向量,可以在極大程度上挖掘數據信息的空間特征。目前,國內外少有研究人員將膠囊網絡應用于軸承的故障診斷中。
本文提出一種基于DMD和改進膠囊網絡(improved capsule network,ICN)的軸承故障診斷方法,用于診斷不同工況下的軸承發生的多種故障。首先獲取多傳感器采集的不同工況下各種運行狀態的軸承振動信號以構建樣本集;然后采用DMD對振動信號進行分解,計算DMD模態,并將各個模態按照能量大小進行排序,選取能量最大的模態對信號進行重構;進而采用連續小波變換將重構后的信號轉換為有利于膠囊網絡訓練的彩色時頻圖;最后,將時頻圖輸入改進后的膠囊網絡進行訓練,優化模型參數,實現軸承故障的精確診斷。
假設有N個信號采集系統,且每個信號采集系統采集的信號共有m個,采集時間間隔為Δt。則將這些信號排列為一個矩陣,表示為
(1)
將X分解為如下2個矩陣:
(2)
對于一個線性系統,顯然有
ψ1=Aψ0。
(3)
式中A包含豐富的非線性動力學信息,但當數據量很大時,高維矩陣使得計算量巨大,DMD算法首先要基于SVD求得A的最佳投影矩陣ADMD,然后針對ADMD進行相關計算,最后對原信號進行重構。具體過程如下:
1)對ψ0進行奇異值分解可得
ψ0=USVT。
(4)
式中:U∈Rm×r,S∈Rr×r,V∈Rr×(N-1),U×UT=I,V×VT=I,且r=rank(S)。
2)結合式(3)和式(4)可得
ADMD=UTAU=UTψ1VS-1。
(5)
式中經過變換后得到的ADMD和A在動力學特性上是近似的[18]。
3)求ADMD的特征值與特征向量,并將ADMD表示為
ADMD=YΛY-1。
(6)
式中:Y=[y1,y2,…,yr]為ADMD的特征向量;Λ是主對角線為ADMD的特征值的矩陣[λ1,λ2,…,λr]。
4)求A的第i階模態
Φ=ψ1VS-1Y。
(7)
式中Φ=[φ1,φ2,…,φr]為A的模態。
5)令yi=ln(λr)/Δt,則原信號X可以近似重構為:
(8)
式中:Ω為主對角線為[λ1,λ2,…,λr]的對角矩陣;b為包含每個模態的幅值的向量;Γ為Moore-Penrose偽逆。
小波變換克服了傅里葉變換窗口大小不隨頻率變化的缺點,從而具備了更高的分辨率[19]。與離散小波變換相比,連續小波變換最大的特點就是生成的小波系數可以更加直觀表達信號的全局特征,有利于更好地分析、辨別信號。對于一個信號f(t),其連續小波變換為
(9)
式中:a為尺度因子;b為平移因子;ψa,b(t)為小波基函數;ψ*為ψ的共軛復數。本文選取cmor作為小波基。
在傳統的神經網絡中,各神經元均為標量,因此無法存儲數據的空間信息。膠囊網絡提出了以矢量作為輸入和輸出的概念,將各神經元轉換為具備空間信息的矢量,并封裝為膠囊的形式進行特征信息的傳遞[20],如圖1所示。不同膠囊層之間通過動態路由機制進行信息傳輸,具體過程如下:

圖1 膠囊網絡結構
1)輸入向量ui與仿射變換矩陣W中的元素wij相乘得到預測向量uj|i,即
uj|i=wijui。
(10)
2)將步驟1)中得到的預測向量uj|i與耦合系數cij進行加權求和,得到深層輸入向量sj如下:
(11)
式中cij通過更新中間變量bij得到,即
(12)
3)利用suqash函數對sj進行壓縮,該函數僅改變向量的大小,將sj壓縮至0~1之間,但不改變sj的方向,得到輸出向量vj。
4)采用動態路由算法不斷迭代更新中間變量bij和耦合系數cij。首先將uj|i和vj進行內積計算,結果越大,則表明兩者相關度越高,進而增大bij的值,反之則減小bij的值[21],如下:
bij←bij+uj|ivj。
(13)
然后按照式(12)更新cij的值,經過r次迭代,最終得到最優的輸出向量vj。
考慮到實際工業中用于采集信號的傳感器并不是單一的,而且各個傳感器在空間上有一定的聯系,所以本文采用DMD算法將多傳感器信號同時進行分解。得到原信號的各個模態后,首先剔除奇異值約等于0的模態,防止出現計算發散,然后采用能量值最大的模態對原信號進行重構,具體過程如下:
1)按下式計算模態的初值c:
c=Φ-1Ψ0。
(14)
2)對于不同模態和不同時間,采用下面范德蒙矩陣存儲特征值變化:
(15)
3)按式(16)求各模態隨時間的變化,然后將各模態的E中各元素的平方和作為其能量,并且按結果的大小將各模態排序,最終取能量最高的模態按公式(8)用于重構信號。
(16)
式中m為第m個模態。
為了使膠囊網絡在樣本較少和變工況的條件下能有更好的表現,本文在原有膠囊網絡的基礎上,加入了轉置卷積。膠囊網絡采用的網絡層一般為卷積網絡,卷積網絡是一種下采樣方式,這樣的操作會使得特征圖不變或縮小,圖像的分辨率也由高變低,從而造成某些數據信息丟失,為了解決這一問題,本文在膠囊網絡中引入轉置卷積。轉置卷積也稱為反卷積,是一種上采樣方式,得到的效果與卷積操作相反,將圖像由低分辨率變為高分辨率。在膠囊網絡中引入轉置卷積也能起到數據增強的作用,從而使模型在變工況和小樣本條件下能夠有更好的診斷效果。本文的改進膠囊網絡模型主要結構如表1所示。

表1 模型主要結構
卷積層1的作用為初步提取特征,降低噪聲影響;預膠囊層中包含卷積層和轉置卷積層,通過下采樣和上采樣相結合的方式提取數據特征,并通過卷積層3進行整合,然后封裝為膠囊,以向量的形式作為數字膠囊層的輸入;數字膠囊層主要采用動態路由算法計算膠囊層間的相關度,更新耦合系數;輸出層通過對向量的二范數求解,最終得到各個故障類型的概率分布。
1)損失函數。
在膠囊網絡的訓練中,仿射變換矩陣的元素通過損失函數的反向傳播進行更新,間隔損失函數使膠囊網絡的輸出為一個長向量或幾個短向量,向量的長度表示膠囊存在的概率,表達式為
Lk=Tkmax(0,0.9-‖vk‖)2+
λ(1-Tk)max(0,‖vk‖-0.1)2。
(17)
式中:k為第k類故障;Tk為表示分類結果(分類正確為1,反之取0);‖vk‖代表識別為k類故障的概率;λ為比例系數,取0.5。
2)評價指標。
本文采用準確率作為模型診斷結果的評價指標,正確分類的樣本數用T表示,分類錯誤的樣本數用F表示,則準確率表達式為
(18)
本文結合DMD和改進膠囊網絡構建了一種可用于滾動軸承故障診斷的模型,其診斷流程如圖2所示。

圖2 本文方法流程圖
具體步驟為:1)獲取多傳感器下的軸承振動數據;2)將獲取的數據進行DMD分解,并使用能量值最大的模態對原信號進行重構;3)將數據進行零均值歸一化,然后使用連續小波變換將信號轉換為二維時頻圖;4)將數據劃分為訓練集和測試集;5)設計模型并初始化模型參數;6)用訓練集訓練模型,優化參數;7)使用測試集驗證模型診斷效果。
為了說明重構信號不會改變原信號的頻率特性,本文在Ansys平臺搭建了滾動軸承外圈故障模型,模擬的是外圈內表面出現磨損的情況,如圖3所示。所仿真模型內圈內半徑為12.5 mm,內圈外半徑為15.875 mm,外圈內半徑為22.635 mm,外圈外半徑為26 mm,滾動體半徑為3.375 mm,滾動體個數為12個,軸承轉速為1 300 r/min。在軸承外圈外表面的3點鐘、6點鐘和12點鐘方向取3組振動加速度數據,分別稱為傳感器A、B和C信號。

圖3 外圈故障仿真模型
將傳感器A、B和C信號進行DMD分解并重構,得到的信號如圖4所示。

圖4 仿真信號及重構信號
為了說明重構后的信號仍保持著原來的頻率特性,傳統的信號分析方法對重構后的信號也同樣適用。本文采用希爾伯特變換對4個信號進行譜分析,結果如圖5所示,可以看出,從4個信號中均能明顯得到所仿真軸承的故障特征頻率為108 Hz,且與理論值接近。

圖5 各信號希爾伯特包絡譜
CWRU軸承數據集的試驗臺如圖6所示,本文采用的數據采樣頻率為12 kHz,負載為0、1、3馬力,轉速為1 797、1 772、1 730 r/min,運行狀態分為正常狀態、內圈故障、外圈故障和滾動體故障,故障程度為0.1 778 mm。

圖6 CWRU數據采集實驗臺
用于采集信號的傳感器包括驅動端傳感器1、風扇端傳感器2和基座傳感器3。本文將各種運行狀態的多傳感器信號進行DMD分解并重構,然后將重構信號進行連續小波變換,得到784×784的二維時頻圖,作為一個樣本。最終得到不同工況下,各種運行狀態的訓練樣本100個,測試樣本40個。
為了對比不同數量樣本對模型診斷效果的影響,本文從各種故障的100個訓練樣本中隨機選出20、60個構造了3種訓練集;為了驗證模型在不同運行工況下的泛化能力,本文按照與訓練樣本工況差異大小構造了3種測試集,其轉速分別為1 797、1 772、1 730 r/min,負載分別為0、1、3馬力。具體劃分如表2所示。

表2 實驗數據集
以內圈故障為例,本文采用的各傳感器信號及DMD分解重構后的信號如圖7所示。

圖7 內圈故障下,不同傳感器信號及重構信號
為了說明使用DMD處理多傳感器信號的優勢,本文選取各種故障狀態下的某一個傳感器信號進行連續小波變換,得到單一傳感器下的軸承振動數據樣本。采用單一傳感器數據與采用多個傳感器數據兩種情況下的訓練集中各種故障樣本均為100個,共400個樣本,對應工況如表2所示,為0馬力、1 797 r/min。為了比較單一傳感器信號用于故障診斷的效果與采用DMD將多個傳感器信號分解重構后用于故障診斷的效果,分別使用兩種情況下的樣本對改進的膠囊網絡進行訓練,采用如表2所示的3種工況下的測試集a、b和c對訓練好的模型進行測試,實驗結果如表3所示。

表3 多傳感器與單傳感器數據對模型診斷效果的影響
由表3可以看出,在與訓練集運行工況相同的測試集a上,兩者的診斷正確率均達到了100%,但是在不同運行工況下,單傳感器數據使得模型的診斷正確率大大降低,而多傳感器數據訓練的模型診斷精度下降不多,這是因為DMD分解重構后的信號包含了更多的特征信息。因此,多傳感器數據經過DMD分解重構后,能夠更好地應對軸承運行工況的變化,達到較理想的診斷效果。
為了進一步驗證ICN的優勢,本文選取未改進的CN和CNN網絡作為對比,分別采用表2所示的3種數量的訓練集A、B和C對各模型進行訓練,并采用如表2所示的3種工況下的測試集a、b和c對訓練好的模型進行測試。所用數據均為多個傳感器信號經DMD分解重構后的數據。
4.3.1 相同工況下各模型診斷正確率對比
以訓練集C為例,各個模型在訓練過程中的損失函數和正確率變化情況如圖8所示。

圖8 各模型的損失值與正確率變化情況
由圖可見,ICN收斂的速度明顯快于CN和CNN,說明改進后的膠囊網絡具備更強的學習能力。
在不同訓練集下,各模型在相同工況下(測試集a)的診斷正確率如表4所示。

表4 不同模型在測試集a上的準確率
由表可以看出,訓練集樣本的數量會影響模型診斷效果,但當模型學習能力足夠強時,即使在小樣本數據上,模型也能取得不錯的效果。
4.3.2 不同工況下各模型診斷正確率對比
在實際工業中,軸承的運行工況往往會發生改變,從而造成訓練數據和測試數據的分布不一致,為了驗證改進膠囊網絡在不同工況下的泛化能力,使用表2中的測試集b和測試集c對各模型的診斷效果進行驗證,實驗結果如圖9所示。其中“Ab”代表模型在訓練集A上訓練,在測試集b上進行測試,其他表示與此類似,故不再贅述。

圖9 各種模型在不同測試集上的診斷正確率
由圖9可以看出,在訓練集A下,CNN模型在測試集b和測試集c上的正確率最高也未超過80%,CN模型在測試集b上效果較好,但在工況變化較大的測試集c上診斷正確率就大打折扣了,而ICN模型在測試集b和測試集c上的診斷正確率均保持在96%以上,說明ICN模型可以解決小樣本條件下軸承變工況運行的故障診斷問題;在訓練集B和訓練集C下,CNN和CN在工況與訓練數據接近的測試集b上能保持較高的準確率,但在工況變化較大的測試集c上,準確率出現了明顯降低;而ICN模型在測試集b和測試集c上的診斷正確率均保持在較高水平。縱觀CNN和CN模型在各數據集上的表現,不難看出CNN模型的診斷正確率較低,CN模型診斷正確率波動較大,所以不適合用于運行工況復雜的軸承故障診斷中,而本文提出的ICN模型很好地解決了CN模型存在的問題。綜上所述,相較于CNN和CN,本文所提的ICN模型在小樣本和變工況條件下,具備更強的故障診斷能力。
為了觀察3種模型對4類運行狀態的診斷分類結果,本文以訓練集A和測試集c為例,繪制3種模型故障分類結果的混淆矩陣,如圖10所示。

圖10 不同模型診斷結果的混淆矩陣
由圖10可見,3種模型均出現了錯分的情況,其中CNN模型很好的辨別了正常狀態和外圈故障,但對內圈故障和滾動體故障卻喪失了辨別能力;相比CNN模型,CN模型對內圈故障和滾動體故障的辨別能力有所提高,但仍不理想;而ICN模型在160個測試樣本中,僅將滾動體故障的5個樣本錯分為正常狀態,相比前兩個模型,診斷效果是較為理想的。
1)本文針對變工況下軸承的故障診斷,提出了一種結合動態模態分解和改進膠囊網絡的智能故障診斷方法,實現了利用多傳感器數據進行不同運行工況的軸承故障診斷。
2)經DMD分解重構后的信號在融合了3個信號的基礎上,并沒有改變其原有的頻率特性,對于簡單的故障診斷,傳統的信號分解方法在重構信號上依然適用。
3)ICN模型結合了卷積神經網絡的下采樣和轉置卷積網絡的上采樣,增強了模型對于故障特征的提取能力,膠囊網絡將神經元矢量化,彌補了卷積網絡在提取空間信息上的缺陷。
4)實驗結果表明,相比于傳統的CNN和CN網絡,ICN模型對變工況下軸承的故障診斷具有更高的診斷正確率,另外,ICN模型同樣可以在小樣本條件下實現高效的軸承故障診斷。