虞滸,繆小冬,顧寅驥,荀志文,隋天舉
(1.南京工業大學 a.機械與動力工程學院;b.計算機科學與技術學院,南京 211800;2.大連理工大學 工業裝備智能控制與優化教育部重點實驗室,遼寧 大連 116024)
滾動軸承是旋轉機械設備的關鍵部件,其主要功能是傳遞前后部件產生的力和扭矩,同時減少旋轉體之間摩擦產生的能量損失[1]。然而,軸承是容易損傷的部件之一,一旦失效可能導致整個機械系統崩潰[2?3],因此,對滾動軸承進行及時的故障診斷和在線監測至關重要。傳統的滾動軸承故障診斷大多依賴人工對軸承原始故障數據進行特征提取,分析不同特征分量之間的內在邏輯關系進而確定軸承的破壞形式,而對于復雜工況下的軸承,往往面臨診斷效果不佳和泛化能力不強的問題,因此,研究具有快速自適應特征提取和泛化性能強的智能診斷方法具有重要意義。
深度學習方法在故障診斷領域得到了深入研究,如深度置信網絡(Deep Belief Network, DBN)[4]、堆疊降噪自編碼器 (Stacked AutoEncoders,SAE)[5]、卷積神經網絡(Convolutional Neural Network,CNN)[6]和遞歸神經網絡(Recurrent Neural Network,RNN)[7]。深度神經網絡彌補了淺層學習機在特征提取上的短板,能夠自適應識別深層的隱藏特征,降低了故障診斷算法對于數據預處理的依賴。CNN 作為深度學習的典型代表,對于一維數據和多通道的二維數據均有不錯的表現,并產生了眾多具有特長的變體,如Visual Geometry Group(VGG)[8],GoogLeNet[9]以及Residual Network(ResNet)[10]等:文獻[11]提出了基于改進ResNet的故障診斷算法,將傳統信號處理中常見的軟閾值去噪構建為收縮模塊嵌入ResNet,在不同信噪比下進行試驗并與傳統CNN和ResNet對比,發現在強噪聲干擾環境下所提方法性能良好;文獻[12]在不改動CNN 模塊的前提下,引入INCEPTION模塊實現網絡的跳躍連接,較大程度增強了故障特征信息的提取能力,試驗結果表明該方法在多種強噪聲工況下的診斷準確率保持在90%以上。
為更加有效地適應具有卷積操作功能的神經網絡,有學者嘗試采用特征信息聯合處理的方式對原始數據特征二次加工,然后再使網絡模型參與工作:文獻[13]提出基于多層降噪技術結合改進CNN的滾動軸承故障診斷方法,采用奇異值分解(Singu?lar Value Decomposition, SVD)處理訓練樣本,經驗模態分解(Empirical Mode Decomposition, EMD)獲得本征模態函數(Intrinsic Mode Function, IMF),IMF疊加原始信號得到最終信號,再交由改進CNN進行故障診斷驗證其有效性;文獻[14]提出雙小波去噪方法,可以保留原始信號更多細節,對比試驗表明雙小波去噪在原始故障特征細節獲取中性能更加優越。由此可見,少量特征工程提高了網絡訓練效果,使具有傳統結構或簡單結構的網絡模型的診斷效果接近更先進的網絡結構。
格拉姆角場(Gramian Angular Field,GAF)具有存儲信號時序,保證緊鄰信號特征之間時間相關性的優點;DarkNet 是圖像識別Yolo 算法中用于提取特征的重要骨干,其主要功能依然是卷積,但各個版本中的DarkNet 都引入了殘差結構,以增強對圖像特征提取的性能。因此,本文提出一種基于 GAF 和 DarkNet?53 網絡(GAF?DarkNet)的軸承故障診斷方法,利用GAF 編碼方式將原始滾動軸承振動信號轉化為具有時間相關性的二維特征圖像,將特征圖像作為DarkNet?53 網絡模型的輸入進行自適應特征提取和故障診斷。選取凱斯西儲大學(CWRU)滾動軸承數據集驗證模型的有效性,并進一步通過變載荷工況和實際轉盤軸承數據集驗證模型的泛化性能,同時與幾種最新的數據維度重構診斷方法進行性能對比。
格拉姆角場可以將原始一維振動信號轉化為二維時間序列圖像,該方法主要基于反余弦極坐標編碼和格拉姆矩陣內部余弦解碼對原始特征值進行重新排列。
滾動軸承故障特征信號在時域上呈現不規律波動,每個采樣點的值對應一個時間戳,可設一段故障信號為X=[x1,x2,…,xi],xi為對應時間戳i的幅值。然而,脫離時序的xi沒有任何物理意義,且機器學習的過程對數值的前后變化具有強依賴性,因此需要對每個幅值進行時序標簽。對于笛卡爾坐標系中的一維時序數據,通過極坐標編碼將時序映射為角度,為增強前后時序相關性并降低部分故障時序特征值突變現象的影響,采用分段聚合近似(Piecewise Aggregation Approximation,PAA)的方法進行編碼,隨后導入極坐標再次編碼,具體步驟如下:
1)取每k個采樣點的平均值來減小故障特征信息的序列值,得到新的序列Xk。
式中:xi,xo和xp為原始序列對應時序區間的特征幅值。令xkn為新序列對應時序kn的特征值,PAA編碼后的新序列可表示為Xk=[xk1,xk2,…,xkn]。
2)將時序值放縮到[0,1]區間進行歸一化處理,標準化特征重要程度,方便后期不同故障類型分類,考慮到幅值存在負值,歸一化方法為
通過以e 為底數的指數函數的倒數將時序值進行了歸一化,可令δkn= e?|xkn|,則歸一化后序列可表示為Xk=[δk1,δk2,…,δkn]。
3)極坐標化處理,將時序kn作為極坐標半徑和歸一化處理的對應時序值的反余弦值生成極坐標,如此便將時序值δkn與對應的時序kn聯系起來,即
在數據升維重構階段,將極坐標化處理后的序列Xk導入GAF獲得二維時序圖。根據角度和與角度差的不同,GAF 的編碼方式分為格拉姆角和場(Gramian Angular Summation Field,GASF)和格拉姆角差場(Gramian Angular Difference Field,GADF),本文采用GASF進行數據升維,即
(4)式從左上到右下分配時序,將時序中的每對值逐對求和并取余弦值匯總,得到的二維時序圖如圖1 所示,通過升維加灰度處理使故障特征信息像素化,并通過像素對比度量化了特征重要程度。

圖1 GASF二維時序圖Fig.1 Two?dimensional temporal diagram of GASF
基于tensorflow2.1 和DarkNet 框架搭建神經網絡,在一臺搭載Intel(R) Xeron(R) W?2223 CPU @3.6 GHz,NVIDIA Quadro P2200 GPU 的聯想工作站上進行試驗。
DarkNet?53 是具有卷積和殘差結構的深度神經網絡,其基本結構如圖2 所示。傳統的CNN 模型通常由卷積層、池化層、全連接層和Softmax 分類器組成,其原理是通過具有若干能夠提取數據特征的濾波器對輸入圖像進行卷積運算和池化降采樣,從而獲取具有顯著特征的圖像,然后經過全連接層進行參數優化和誤差計算,最后通過Soft?max分類器進行分類。DarkNet網絡引入了殘差結構使其具有更深的層數,無池化層使其比傳統CNN 更加輕量化。DarkNet?53 是Yolo v3 算法中用于提取特征的重要骨干,相較于Yolo v2 中的DarkNet?19 引入了更多的殘差連接,并且利用卷積核為3×3,映射步長為2 的二維卷積模塊代替了二維最大池化,在保證準確率的同時提升了網絡的運行速度。

圖2 DarkNet?53網絡基本結構Fig.2 Basic structure of DarkNet?53 network
所提GAF?DarkNet 滾動軸承故障診斷方法結合了GAF 編碼方式保留數據之間時序相關性的優勢和DarkNet 網絡強大的特征提取能力及參數計算能力,基本流程如圖3 所示。模型訓練階段,通過Softmax 分類函數結合Adam 優化器反向傳播更新網絡的權重和偏差,使誤差降到最小,完成模型的訓練;模型測試階段,將訓練好的模型在新的測試數據上進行特征提取計算,最后通過分類器進行故障分類并監視其診斷準確率。

圖3 基于GAF?DarkNet的滾動軸承故障診斷流程圖Fig.3 Flow chart of fault diagnosis for rolling bearing based on GAF?DarkNet
3.1.1 CWRU數據集
利用CWRU數據集驗證模型的有效性,以驅動端深溝球軸承6205?2RS JEM SKF 數據為例,采樣頻率為12 kHz,負載為1~3 hp(1 hp=745.7 W),故障位置分別位于內圈、外圈及鋼球,每種故障位置均分別包含0.178,0.356,0.534 mm 3種故障直徑。軸承狀態類型共計10種:健康狀態軸承記為F1;故障直徑為0.178 mm 的內圈、外圈及鋼球故障分別標記為F2,F3及F4;故障直徑為0.356 mm的內圈、外圈及鋼球故障分別記為F5,F6及F7;故障直徑為0.534 mm的內圈、外圈及鋼球故障分別記為F8,F9及F10。試驗中軸承的最高轉速為1772 r/min,可得一周期包含406個采樣點。為保證各時序片段故障數據的密度,設置每個重采樣片段的樣本長度為1024。采用間隔采樣和等長截取的方式增加樣本特征的稀疏性,采樣間隔步長為256(約為半個采樣周期),以方便驗證各網絡模型的泛化性能。根據負載工況將數據集分為D1,D2,D3,每個數據集包括10 種軸承狀態,每種軸承狀態包含500 個樣本,并按照4∶1的比例劃分訓練集和測試集,每個數據集共計5000個樣本,具體見表1。

表1 CWRU數據集樣本劃分Tab.1 Sample partitioning of dataset from CWRU
3.1.2 轉盤軸承數據集
利用南京工業大學江蘇省工業設備數字化制造與控制技術重點實驗室轉盤軸承試驗平臺的數據對所提方法的泛化性進行驗證。轉盤軸承試驗臺(圖4)通過液壓泵站驅動,采用NI9205 和NI9234 數據采集模塊將采集到的信號通過PCI 總線傳輸到PC 機中,PC 機通過Labview 軟件對轉盤軸承的實時信號進行監控。軸承型號為QNA?730?22,鋼球直徑為22 mm,鋼球個數為97,接觸角為45°。ULT2001 型低頻電容式加速度傳感器用于實時監測轉盤軸承的振動信號,采樣頻率為0.033 Hz,采樣時間為15000 min。本文僅采用振動信號進行模型測試,考慮到局部共振對振動信號采集的干擾,將加速度傳感器通過磁座固定,具體布置如圖5所示。

圖4 轉盤軸承試驗臺Fig.4 Slewing bearing test bench

圖5 加速度傳感器安裝位置Fig.5 Installation position of acceleration sensor
滿載(扭矩峰值為240 kN · m,轉速峰值為4 r/min,軸向力峰值為96 kN)運行7 天后,轉盤軸承4 個測點的振動信號如圖6 所示。轉盤軸承故障存在耦合現象,經滿載運行后出現卡滯停機,出現的3 種故障形式如圖7 所示,保持架故障記為F11,鋼球故障記為F12,溝道故障記為F13。與處理CWRU 數據集一樣的方式對轉盤故障振動信號進行處理,數據集片段見表2。

表2 轉盤軸承數據集樣本劃分Tab.2 Sample partitioning of dataset from slewing bearing

圖6 轉盤軸承不同測點的振動信號Fig.6 Vibration signals of different measuring points on slewing bearing

圖7 轉盤軸承故障類型Fig.7 Fault types of slewing bearing
3.2.1 時序數據稀疏化
現有智能故障診斷方法在故障特征連續且均勻的理想條件下的計算準確性較高,然而,工業生產過程中不能及時獲取時序信號且時序丟失的情況時有發生。本文在保證樣本規模足夠的情況下,采用間隔采樣的方法對時序數據進行稀疏化處理,如圖8所示,采樣間隔約為半個采樣周期,降低了特征在時序上的關聯性,模擬了時序丟失導致特征不連續的工況。

圖8 數據稀疏化采樣示意圖Fig.8 Diagram of data sparse sampling
3.2.2 GAF特征圖像
GAF 編碼方式通過等長間隔截取長度相等的時序信號片段并生成特征圖像,此工序后所有一維數據片段全部轉換為二維GAF 特征圖像,以1 hp 工況下的10 種CWRU 軸承故障和3 種轉盤軸承故障為例給出二維GAF 特征圖如圖9 所示。

圖9 10種CWRU軸承故障和3種轉盤軸承故障的GAF特征圖Fig.9 GAF characteristic diagram of ten types of CWRU bearing fault and three types of slewing bearing fault
3.3.1 模型超參數設置
采用人工選取參數結合遺傳算法超參數自搜索優化的方法對模型進行超參數設置,參數優化流程如圖10 所示。參數優化后Batch Size 為20,Kernel Size 為3,迭代次數為70,卷積層的激活函數為LeakyReLU,學習率為0.001,Dropout 設置為0.4。

圖10 模型超參數優化流程圖Fig.10 Flow chart for hyperparameter optimization of model
3.3.2 模型訓練和測試結果分析
選取數據集D1 進行測試,模型經過50 次迭代,訓練和測試結果如圖11 所示:迭代到第30 步時,模型的精度和損失開始趨于穩定,模型穩定后在訓練集上的平均精度達到99.89%,在測試集上達到99.81%,模型損失值降到0.153趨于平穩,初步驗證了GAF?DarkNet 模型在滾動軸承故障診斷中具有較好的診斷效果。

圖11 GAF?DarkNet 模型在數據集D1 上的訓練和測試結果Fig.11 Training and testing results of GAF?DarkNet model on dataset D1
模型在數據集D1 上的故障診斷分類效果混淆矩陣如圖12所示,故障分類效果較好。

圖12 模型在數據集D1上的故障診斷分類效果混淆矩陣Fig.12 Confusion matrix of fault diagnosis classification effect of model on dataset D1
3.3.3 可視化分析
為進一步理解GAF?DarkNet 提取特征的過程,選取數據集D1 中0.178 mm 鋼球故障信號輸入GAF?DarkNet 中并對模型進行分層展示,由于DarkNet?53 模型的殘差結構使網絡深度遠超傳統CNN,因此僅選取具有顯著狀態變化的圖像進行展示,結果如圖13 所示:第1 層卷積層呈現該故障類型的GAF 特征圖形態,隨著網絡層數的逐漸加深,特征圖像越來越抽象。這是因為淺層網絡對特征圖像的紋理和邊緣等細節特征進行提取,如第1 層卷積到其激活時的狀態變化依然呈現GAF圖的具象形態;進入深層結構,網絡提取到更具有分類意義上的抽象特征,呈現模糊的抽象形態,只有少部分關鍵特征被激活呈明黃色。

圖13 故障直徑為0.178 mm 的鋼球故障信號的網絡分層可視化Fig.13 Network layered visualization of fault signals for steel balls with a fault diameter of 0.178 mm
為探索上述網絡層的狀態信息對于模型分類準確率的影響,進一步通過主成分分析(PCA)結合t分布隨機近鄰嵌入(t?SNE)技術將各層提取的特征進行降維可視化,50 維以上的高維數據通過PCA 進行維數約減,50 維以下的數據通過t?SNE進行降維,因層數過多,僅選取輸入層、部分中間層以及分類輸出層進行展示,如圖14所示:從輸入層到分類層的分類特征逐漸鮮明,Softmax 分類層的分類特性突出,證明了模型分類的有效性。

圖14 PCA和t?SNE對部分網絡層的降維可視化Fig.14 PCA and t?SNE for dimensionality reduction visualization of partial network layers
3.4.1 基于CWRU數據集變載荷工況分析
為驗證GAF?DarkNet 模型在不同工況下的診斷效果,在D1,D2,D3 數據集下進行變工況測試,如D1→D2表示訓練集為D1,測試集為D2,并選取傳統智能診斷算法支持向量機(SVM),DBN,CNN及近3年較熱門的深度殘差收縮網絡(DRSN)與GAF?DarkNet 進行對比,各模型在不同工況下的診斷效果如圖15 所示:諸模型在單一工況下的診斷效果最佳,除GAF?DarkNet 和DRSN 外,其余模型在變工況下的診斷效果都出現較大程度下降;GAF?DarkNet 和DRSN 的平均診斷精度遠高于其他模型,且GAF?DarkNet 略高于DRSN。因此GAF?DarkNet 算法具有良好的診斷性能和泛化性能,且算法的魯棒性符合變載荷工況的診斷要求。

圖15 各模型在不同工況下的診斷效果對比Fig.15 Comparison of diagnostic effect of various models under different operating conditions
3.4.2 基于轉盤軸承數據集診斷結果分析
利用實際的轉盤軸承數據集對模型的泛化性進行驗證,選取3 種最新的二維重構診斷方法與GAF?DarkNet 進行對比,具體結果見表3,GAF?DarkNet在各方面的診斷性能均優于文獻中的方法。

表3 各方法在轉盤軸承數據集上的診斷性能對比Tab.3 Comparison of diagnostic performance of various methods on slewing bearing dataset
與文獻[10]中的連續堆棧卷積的殘差模塊聯合GAF 圖像重構方法(ResNet152?MSRF)相比,DarkNet 在轉盤軸承數據集上明顯獲得更高的訓練和測試精度,理論上連續堆棧小卷積核在特征提取層可以較完整地提取GAF主時序線上保留的特征信息,但對轉盤軸承這種大型旋轉支承部件的離散振動特征不敏感,經過參數尋優依然難以獲得高訓練精度;與文獻[15]中的時頻圖像聯合膠囊網絡(ARCN)模型相比,GAF?DarkNet 在召回率方面有明顯優勢,這是因為GAF 算法保留時序并不影響原始特征狀態,傳統小波基時頻變換依然存在時域分辨率和頻域分辨率難以同時兼顧的缺陷;文獻[16]中馬爾可夫變遷場(MTF)將時間節點與對應特征值擴展成相互依賴的條件概率函數,以一個分位數的形式對應每個時間節點,以此保證時序和原始特征完整共存的狀態,但對于不同的數據集,在數據分片段轉換的過程中,片段數據量對于馬爾可夫變遷場重構的影響非常大,在進行故障診斷任務轉移時,對不同數據集的分段要求無法統一標準,存在依賴專家經驗的行為。
在設備智能運維過程中,診斷算法的計算成本是一項重要指標,體量小的網絡模型可以節約硬件成本,縮短訓練時間。從模型參數量和計算時間上選取CNN 和DRSN 模型與本文模型進行對比,其中CNN 模型共5 層,包含2 層卷積和2 層池化,DRSN 中的殘差部分為50 層,包含8 個殘差模塊和收縮模塊,對比結果見表4:DRSN 和DarkNet的計算成本低于CNN 且網絡更深;相比DRSN,DarkNet計算參數更少,計算時間更短。

表4 各模型的參數量及計算時間Tab.4 Parameter quantity and calculation time of each model
針對滾動軸承在實際工作過程中載荷工況復雜多變,傳統的智能診斷方法難以獲得良好的診斷精度以及部分特征難以有效提取等問題,提出一種基于GAF?DarkNet 的滾動軸承故障診斷方法。采用GAF編碼將原始振動信號轉換為具有強時序特征的二維圖像,然后結合DarkNet?53 實現滾動軸承故障診斷。基于CWRU 數據集和轉盤軸承數據集并與其他智能診斷算法對比,驗證了本文模型在診斷精度和泛化性能上的優越性,且計算參數量更少,計算效率更高;但模型訓練過程可解釋性較弱,并且特征工程部分在數據規模較大的情況下會消耗更大的時間成本,因此下一步將針對模型可解釋性訓練模式和圖像壓縮處理2 個方面展開深入研究。