陳志剛,杜小磊,王衍學
(1.北京建筑大學機電與車輛工程學院,北京 100044;2.北京市建筑安全監測工程技術研究中心,北京 100044;3.電子科技大學機械與電氣工程學院,四川成都 611731;4.城市軌道交通車輛服役性能保障北京市重點實驗室,北京 100044)
滾動軸承是電機的重要部件,較容易受到損傷而出現故障,進而影響整個電機的性能[1]。目前,基于振動信號的電機軸承工況識別研究最為廣泛,一方面,由于電機軸承振動信號傳遞路徑較復雜,信號呈現出明顯的非線性和非平穩性;另一方面,振動信號易受環境噪聲干擾,信噪比較低。
深層自編碼器(Deep Auto?Encoder,DAE)[2]能自動從信號中學習有價值的特征,克服了“人工特征提取?特征選擇?工況識別”方法的缺陷[3],在電機軸承工況識別領域取得了一定突破。Shao 等[4]結合多種DAE,對電機軸承多種工況進行了有效識別;Shao 等[5]提出集成DAE,采用多種不同的激活函數,使電機軸承工況識別結果更穩定。雖然上述基于DAE 的電機軸承工況識別研究取得了一定成果,但仍存在如下缺陷:(1)DAE 訓練過程中結構固定不變,僅更新網絡權值,難以有效處理非線性和非平穩性振動信號[6];(2)DAE 為全連接網絡,訓練參數眾多,訓練時間較長[7];(3)眾多研究[8?10]表明,若直接將含噪信號輸入DAE,噪聲的存在不僅會降低工況識別準確率,還會降低DAE 的收斂速度。在信號降噪方法中,小波降噪缺乏自適應性;經驗模態分解及其變體[11?13]等降噪方法存在模態混疊現象;變分模態分解[14]和經驗小波變換[15]的分解模態個數難以確定;辛幾何模態分解(Symplectic Geometry Mode Decomposition,SGMD)[16]能有效保持時間序列的本質特征,適合電機軸承振動信號的分析。程正陽等[17]將SGMD 應用于齒輪工況識別分析;鄭直等[18]利用SGMD 分解液壓泵振動信號,并利用廣義形態分形維數對泵的工況進行識別。盡管SGMD 取得一定成效,但辛幾何分量選取困難。
本文在SGMD 基礎上采用改進凝聚聚類算法對初始辛幾何模態分量進行有效重組,并提出新的綜合評價指標篩選有效的模態分量進行重構,最后結合SOAECN 進行電機軸承工況識別,試驗驗證了ESGMD?SOAECN 方法的可行性和有效性。
設信號x=x1,x2,…,xn,根據Takens 嵌入定理[19],將x投影到軌跡矩陣X,如下式所示:

式中d為嵌入維度;m=n-(d-1);τ為延遲時間,τ的確定采用C?C 算法[20]。對X進行自相關分析,得協方差對稱矩陣A:

然后構造哈密頓矩陣M:

則N=M2也為哈密頓矩陣,進而構造辛正交矩陣Q:

式中R為矩陣變換后的子矩陣;B為上三角矩陣,其特征值分別為λ1,λ2,λ3,…,λd,則A的特征值為:

式中σi的分布為A的辛幾何譜,Qi(i=1,2,…,d)為σi的特征向量,則各分量矩陣的重構步驟如下:
首先,計算變換系數矩陣:

然后,對Si進行變換,得到單分量成分Zi:

式中i=1,2,…,d。則初始單分量軌跡矩陣Z如下式所示:

式中Z∈Rm×d。定義Zi中元素為zij,1≤i≤d,1≤j≤m,且d*=min(m,d),m*=max(m,d),n=m+(d-1)τ,令:

則對角平均轉換矩陣可由下式得到:

通過對角平均可將矩陣Z變換為d×n維的矩陣Y,從而將信號x分解為d個具有不同趨勢項和不同頻帶的初始辛幾何模態分量(Initial Symplectic Geometric Mode Components,ISGMCs):

在聚類算法中,層次聚類和凝聚聚類會增加算法的復雜度,因此本文利用改進凝聚聚類算法減小計算量。用改進凝聚聚類對Y1,Y2,…,Yd進行分析與重組,將每個Yi視作元素ti=(Yi),記T=(t1,t2,…,td),則集合T中ti和tj的綜合距離計算如下:

其中,dk可通過最短距離法、最長距離法或平均距離法計算得到。則ti和tj的綜合相似度s計算如下:

本文采用結構體數組記錄數據的初始位置及相似度s,相似度閾值根據文獻[21]和經反復實驗取為0.85,改進凝聚聚類算法步驟如下:
(1)計算T中任意2 個元素ti和tj的相似度s(ti,tj),存儲在數組S中。
(2)對數組S從大到小進行排序。
(3)判斷數組S中的2 個元素是否合并為一類,若否,則合為一類;若1 個元素已被合并到某一類,則另一元素也合并到此類;若2 個元素被合并到兩個不同的類,則兩類合并為一類。
(4)取S中下一個元素,重復步驟(3),直到S中所有元素處理完畢。最終得到:

式中q為聚類組數;Y?i為聚類辛幾何模態分量(Clustering Symplectic Geometric Modal Compo?nent,CSGMC)。
峭度對沖擊信號敏感,但忽略了軸承振動信號的循環平穩性。為更有效地保留信號的故障沖擊信息,提出一種綜合評價指標Q用于CSGMCs 有效分量的選取,Q的表達式如下:

式中 0<η1,η2<1 為比例系數,η1+η2=1。Kw為加權峭度,綜合考慮峭度和相關系數兩個指標,定義如下:


式中分別為相應的x,y的平均值;K為信號x的峭度;N為信號x的長度;C為信號x和y之間的相關系數,在本文中指各CSGMCs 與原始信號之間的相關系數。
Kc為合成峭度,綜合考慮峭度和包絡譜的優勢,定義如下:

式中 右邊第1 項為包絡幅值峭度;se為信號包絡譜;p表示包絡譜采樣點數。η1和η2的確定采用粒子群優化算法[22],并根據文獻[16,23],選擇Q值最大的前4 個分量進行重構。
為驗證ESGMD 的分解效果,進行仿真信號分析,設仿真信號f(t)由3個分量疊加而成,如下式所示:

式中f1(t)為余弦信號;f2(t)為調頻信號;f3(t)為高斯白噪聲函數;SNR為信噪比,本節取10 dB。分別采用ESGMD 和SGMD 對f(t)進行分解,如圖1~2所示。根據綜合評價指標大小,選取圖1中的CSGMC1 和CSGMC2 和圖2中的SGMC1~SGMC 4 分量進行重構分析,其重構后的時頻譜與原信號的HHT 時頻譜如圖3~5 所示。

圖1 ESGMD 分解結果Fig.1 The decomposition results of ESGMD

圖2 SGMD 分解結果Fig.2 The decomposition results of SGMD

圖3 原信號HHT 時頻譜Fig.3 HHT time-frequency spectrum of raw signal

圖4 SGMD 時頻譜Fig.4 SGMD time-frequency spectrum
由圖1和2 可知,ESGMD 的分解模態數明顯少于SGMD 方法。由圖3~5 可知,HHT 產生了嚴重的模態混疊現象,ESGMD 方法分解出的ESGMD1 和ESGMD2分量分別對應于f1(t)和f2(t),沒有出現模態混疊現象,仿真結果表明ESGMD 相比于SGMD 能較為準確地分解仿真信號,對噪聲魯棒性較強。

圖5 ESGMD 時頻譜Fig.5 ESGMD time-frequency spectrum
小波自編碼器(wavelet auto?encoder,WAE)[3]既具有無監督特征學習能力,又具備小波函數時頻聚焦特性,但其為全連接網絡,訓練速度慢;而CNN[24]具有稀疏連接性質,可有效減少網絡間的連接。因此本文將WAE 和CNN 結合,構造自編碼卷積網絡(Auto?Encoder Convolution Network,AECN),如圖6所示。

圖6 AECN 結構Fig.6 The structure of AECN
設輸入x,則AECN 隱層第k個節點輸出如下:

式中ψ為高斯小波;Wk為卷積核權重;ak和ck分別為隱層小波節點的尺度向量和平移向量;*為卷積符號;./為按元素相除符號。重構信號如下:

式中L為隱層節點個數;為反卷積核權重矩陣轉置;b為偏置。
首先,將AECN 的隱層節點激活值作為節點“貢獻度”,并根據“貢獻度”大小對節點進行增加或刪減;其次,在微調階段,當損失函數梯度下降率首次出現遞減時刪掉一個隱層,否則增加一個隱層,激活強度計算如下:

式中α>0 為常數;oi.l為第l個隱層的第i個節點的輸出;Nl為第l個隱層節點個數;si.l為第l個隱層的第i個節點的輸入權值之和,如下式所示:

式中ni為神經元的個數;rij為第i個節點的第j個輸入;wij為第j個節點和第i個節點的連接權重。自組織策略流程如圖7所示。

圖7 自組織策略Fig.7 The self-organizing strategy
AECN 的均方損失函數如下:

式中xi為輸入樣本;yi為重構樣本;N為樣本數目。
為提高AECN 的特征提取性能,在式(28)的基礎上加入一階和二階收縮懲罰項。一階和二階收縮懲罰項的計算分別如下:

均方損失函數使AECN 的重構誤差盡量小,一階和二階收縮懲罰項使AECN 對輸入的擾動具有一定的不變性。同時,為使AECN 學習的隱層特征對輸入信號的結構變化具有可分辨性,增加可分辨懲罰項,計算如下:

式中hn為AECN 的隱層特征;Nk為工況Ck的樣本數,L為工況類別數;Tr()為取矩陣的跡操作。綜上,AECN 的損失函數如下:

式中β,η和λ分別為一階收縮懲罰項系數、二階收縮懲罰項系數和可分辨懲罰項系數。采用文獻[25]的小批量隨機梯度下降算法,AECN 各參數更新公式如下式所示:

式中ik∈{1,2,…,n},Bk和ηk分別為第k次參數更新過程中的序號、樣本數量和學習率。綜上,提出方法流程如圖8所示,詳細步驟如下:

圖8 ESGMD-SOAECN 算法流程Fig.8 The algorithm flow of ESGMD-SOAECN
(1)采集電機軸承振動信號樣本,并劃分為訓練樣本和測試樣本;
(2)對樣本進行ESGMD 分解,利用綜合評價指標Q選擇特征信息明顯的4 個分量并重構;
(3)將重構后的訓練樣本輸入SOAECN 進行無監督預訓練和有監督微調訓練;
(4)使用測試樣本對訓練好的網絡進行測試。
為驗證ESGMD?SOAECN 的有效性,采用如圖9所示的實驗臺進行驗證。

圖9 電機軸承實驗臺Fig.9 The test bench of motor bearing
實驗臺由感應電機、電機速度控制器、加載系統等組成,加速度計位于被測軸承外殼上,采樣頻率為25.6 kHz。使用電火花技術在軸承內圈、外圈和滾動體上加工尺寸為0.15 和0.32 mm 的環槽損傷。參考文獻[26?28]的工況設置方法,選取11 種工況進行研究,如表1所示。每種工況8000 個樣本,每個樣本1024 個采樣點。相應的時域波形圖、頻譜圖及包絡譜圖分別如圖10~12 所示。由圖可知,信號受噪聲干擾嚴重,直接從時域圖、頻譜圖及包絡譜圖中完全區分電機軸承運行工況類別及故障工況程度較難。

表1 電機軸承11 種工況Tab.1 Eleven working conditions of motor bearings

圖10 電機軸承振動信號時域波形Fig.10 Time-domain waveform of vibration signals of motor bearing

圖11 電機軸承振動信號頻譜圖Fig.11 Spectrum of vibration signals of motor bearing

圖12 電機軸承振動信號包絡譜圖Fig.12 Envelope spectrum of vibration signals of motor bearing
以表1中工況c 信號為例,其時頻譜圖如圖13所示。
由圖13 可知,原始信號時頻譜模態混疊嚴重,時頻譜雜亂,然后分別采用ESGMD 和SGMD 對其進行分解,如圖14 和15 所示。

圖13 原始信號時頻譜Fig.13 Time-frequency spectrum of raw signals
由圖14 和15 可知,ESGMD 分解模態數少于SGMD。并根據綜合評價指標Q選擇較大的4 個分量進行重構,對重構后的信號進行相應的時頻變換,分別如圖16 和17 所示。

圖14 ESGMD 分解結果Fig.14 The decomposition results of ESGMD
由下式求得軸承外圈故障特征頻率約107.89 Hz。

式中d為滾子直徑;D為節圓直徑;α為接觸角;Z為滾子數;fr=35 Hz 為轉頻。
圖17 中SGMD 時頻譜,時頻譜線仍然雜亂,故障特征頻率難以分辨;圖16 中ESGMD 時頻譜脊線較明顯,故障特征頻率及倍頻較清晰,驗證了ESGMD 的優越性。

圖15 SGMD 分解結果Fig.15 The decomposition results of SGMD

圖16 ESGMD 時頻譜Fig.16 Time-frequency spectrum of ESGMD

圖17 SGMD 時頻譜Fig.17 Time-frequency spectrum of SGMD
首先驗證SOAECN 的效果,采用AE,WAE 和AECN(無自組織策略)進行對比分析。其中,方法1:ESGMD?SOAECN;方法2:ESGMD?AE;方法3:ESGMD?WAE;方法4:ESGMD?AECN。SOAECN的初始結構為1024?512?256?128?64?11;AE,WAE和AECN 的結構均為1024?512?256?128?64?11。表2列出了不同方法10 次實驗的平均工況識別率和訓練用時。
由表2可知,本文方法具有更高的工況識別準確率(98.76%)和更小的標準差(0.19);AE 由于均方損失函數易受噪聲干擾的缺陷導致識別率較低;WAE 小波函數的時頻聚焦特性一定程度上提高了識別準確率;AECN 在WAE 基礎上使用了卷積機制,減少了網絡所需調整參數,識別準確率優于WAE,且收斂時間短于WAE;而SOAECN 在AECN 基礎上改進了網絡損失函數,加入了自組織策略,改進的損失函數提升了網絡的工況識別率,但自組織策略一定程度增加了網絡的訓練時間。

表2 不同方法的識別結果Tab.2 Identification results of different methods
其次驗證ESGMD 的效果,采用不同的信號分解方法進行對比分析。方法1:ESGMD?SOAECN;方法 2 :CEEWD?SOAECN ;方法 3 :SGMD?SOAECN;方法4:VMD?SOAECN;方法5:Raw?SOAECN(原始信號直接輸入SOAECN);方法6:FFT?SOAECN(頻譜輸入SOAECN);方法7:En?velope?SOAECN(包絡譜輸入SOAECN)。各信號分解方法選擇Q值最大的前4 個分量進行重構,表3列出了不同方法10 次實驗的工況識別率。

表3 不同信號輸入方法的工況識別結果Tab.3 Working conditions identification results of differ?ent signal input methods
由表3可知,CEEMD 由于模態混疊嚴重導致工況識別率較低;VMD 改進了CEEMD 模態混疊的缺陷,識別效果略優于CEEMD;SGMD 能有效保持時間序列的本質特征,模態混疊現象進一步降低,效果優于VMD;而ESGMD 采用改進凝聚聚類算法對ISGMCs 進行自適應重組,進一步增強了信號的特征表達,效果優于SGMD;若直接將原始信號輸入SOAECN,噪聲的存在使得網絡的工況識別率僅93.19%,驗證了信號降噪前處理的必要性;若直接將頻譜或包絡譜信號輸入SOAECN,識別效果低于ESGMD 方法。
實際工程中正常工況樣本所占比例通常較高,因此本文設計4 種數據集,比較不同方法的工況識別性能。設置正常工況與故障工況的樣本比例分別為8000:8000,8000:6400,8000:4800 和8000:4000,實驗共進行10 次,本文定量計算3 種方法基于不平衡數據集的精確率F1值,如下式所示:

式中P為精確率;R為召回率。F1值在[0,1]之間,0 代表最差,1 代表最好。以組3 為例,表4列出了相應的F1值。

表4 組3 中不同方法的F1值Tab.4 F1 of different methods in group 3
由表4可知,組3 中ESGMD?SOAECN 的F1指標值較高,進一步驗證了ESGMD?SOAECN 在面對不平衡數據集的優勢。
本節討論幾種不同激活函數對SOAECN 識別準確率的影響,結果如表5所示。由表5可知,Gaussian 小波、Morlet 小波和Mexican hat 小波的工況識別效果優于其他激活函數,Gaussian 小波在時域、頻域均有良好的分辨率,取得了更好的識別結果。

表5 不同激活函數對SOAECN 識別準確率的影響Tab.5 Influence of different activation functions on SOAECN identification accuracy
實際工程中電機通常在變工況下運行,本節驗證了提出方法在跨工況下的泛化能力,使用帶標簽的源域信號樣本對無標簽的目標域信號樣本進行識別,帶標簽樣本僅作源域數據使用,以工況b~k 為例,結果如表6所示。 由表6可知,ESGMD?SOAECN 的跨工況識別結果的平均識別準確率在92%以上,這表明所提方法有一定的跨工況識別能力,后續將進行進一步研究,提升模型的跨工況識別準確率。

表6 跨工況識別結果Tab.6 Identification results of across the working condition
本文提出一種ESGMD?SOAECN 的電機軸承工況識別方法,主要結論如下:
(1)ESGMD 信號分解方法采用改進凝聚聚類算法緩解了SGMD 的模態混疊現象;提出一種綜合評價指標能較好地篩選出較能反映電機軸承振動信號特征的聚類辛幾何模態分量并重構,為后續SOAECN 自動工況識別提供優秀的訓練樣本。
(2)SOAECN 引入自組織策略,在訓練過程中自適應動態變化,更適用于非線性和非平穩性電機軸承振動信號;在均方損失函數的基礎上加入一階收縮懲罰項、二階收縮懲罰項和可分辨懲罰項,提升了網絡對輸入信號微小變化的魯棒性和信號結構變化的可分辨性。
(3)引入的自組織策略耗時多,部署到工業環境中實時性不夠,這也是今后需要改進的方面。