賈彥杰,溫 皓,王 靖,張 彬,周代軍,王 磊
(中國石油西南管道公司,成都610036)
振動傳感器所采集的機械設備運行過程中加速度信號可以在某種程度上反映設備運行狀態信息。傳統的做法是從振動信號中提取有效值、峰值和峰峰值等特征值,然后以這些特征值構建高維的特征空間,在特征空間中訓練SVM、BP 網絡等分類器,將不同狀態的特征空間分到不同的子空間中,以此實現故障診斷。但是在實際工作中采集的機泵振動信號會受到噪聲的影響,從帶噪信號中提取的特征值就不能準確反映設備的運行狀態,可能會導致漏報、誤報的情況。因此對于機泵振動信號,時頻分析如小波變換[1]、維格納分布[2]及自適應分解EEMD[3]等方法被用來提取特征,神經網絡[1]、支持向量機[4]、決策樹[5]、模糊邏輯[1,6]等方法被用于對機泵的運行狀態進行分類,但由于特征值是根據專家經驗進行提取的,對于不同的設備需要不同的專家經驗,這在一定程度上也制約了專家經驗的泛化能力。
深度學習已經在計算機視覺和自然語言處理等方面大放異彩,深度學習最主要的特點在于其可以自適應提取蘊含于數據中的模式。近年來,常見較為被認可的深度學習模型框架包括:卷積神經網絡(CNN)、遞歸神經網絡(RNN)、深度置信網絡(DBN)、堆疊自動編碼機(SAE)[7-8]。其中CNN更適于對圖像進行數據處理,應用CNN可自適應提取特征并進行分類識別[7-8]、處理并學習海量數據。應用CNN算法,進行故障診斷的文獻主要可分為兩類:一是將CNN 作為分類器[9-10];二是采用CNN 進行特征提取并識別[11-12]。本文結合CNN的算法特點,基于應用于設備故障診斷的數據進行特征提取和故障分類,在經典一維和二維卷積神經網絡的基礎上,提出兩種機械設備智能故障診斷方法,并通過凱斯西儲大學軸承數據中心發布的數據集比較兩種模型的性能。因此可運用深度學習智能故障診斷方法實現設備的狀態監測,實現智能特征提取與故障分析診斷。該方法可提高分類效率,具有較好的抗干擾能力。
深度學習是機器學習的一個分支,其各層級嵌套的結構可以靈活表達我們的世界,深度學習中的概念是由簡單的概念互相串聯而成的,這樣可以從不太抽象的概念中提取出更加抽象的概念。神經網絡是用于實現這類問題較常見的結構,它是一種高度非線性映射,可以將輸入網絡的數據映射到決策空間中。神經網絡最早受到了生物大腦結構的啟發,人們認為模擬大腦的活動機制可以讓機器具有和人類似的智能,但是歷史上早期的神經網絡實際上是一種簡單的線性組合,可以實現的能力極其有限。而后,更多的研究者提出了效率更高的神經網絡模型,時至今日,深度學習是實現人工智能的重要工具。
卷積神經網絡(Convolutional neural network,CNN)最早是由Le Cun應用于手寫數字識別中[13],但是早期由于受到計算機算力的限制和數據量的限制,CNN 架構并沒有引起過多的關注。Hinton 等于2006年正式提出了Deep Learning的概念[14],但是由于缺乏明確的理論基礎,深度學習也沒有獲得過多的關注。直到2012年,Hinton的學生Alex Krizhevsky 等提出的Alex Net[15]以巨大的優勢取得了ILSVRC 2012 比賽冠軍,深度學習才引起了廣泛關注,并且從2012年之后出現了眾多深度學習模型[16-17],在圖像處理和自然語言處理方面都取得了顯著的成果。
傳統的卷積神經網絡結構由以下5部分構成,分別是讀入數據的輸入層、進行特征提取的卷積層、池化層和全連接層以及輸出最后結果的輸出層。
卷積神經網絡的輸入層可以處理不同維度的數據。常見地,一維CNN的輸入層接收一維或二維數組,其中一維數組通常為振動信號時域圖或頻譜圖,二維數組包含多個通道的時間或頻譜采樣;二維CNN的輸入層接收二維或三維數組;三維CNN的輸入層接收四維數組[18]。
與其他神經網絡算法類似,由于使用梯度下降算法進行學習,卷積神經網絡的輸入特征需要進行標準化處理。具體地,學習數據需要在通道或時間/頻率維進行歸一化后,才能將其輸入卷積神經網絡,若輸入數據為像素,也可將原始像素值二值化。輸入特征的標準化可以提升其收斂速度和學習效果。
卷積層的功能是對輸入數據進行特征提取。卷積層中的每個神經元都連接到前一層中相鄰區域中的多個神經元。該區域的大小取決于卷積核的大小,被稱為“感受野”,類似于視覺皮層的感受野[19]。工作時,卷積核會依次掃過輸入特征,在感受野內對輸入特征做矩陣點乘并疊加偏差量。每個卷積的輸入(除第一層外)和輸出也被稱為特征圖。
以二維為例,卷積過程數學表達式為

式中:Xnj為第n層第j個元素;Mj為n-1層特征圖的第j個卷積區域;Xn-1i為其中的元素;ωnij為對應卷積核的權重矩陣;bnj為偏置項。f(·)為激活函數,通常使用ReLU函數。
由輸入層接收的數據經過卷積層提取特征后,將由特征矩陣進行進一步降維處理,實現特征篩選和信息過濾,這通過池化層實現,如最大池化、平均池化等。它的主要功能就是將特征向量中的點進行替換填充。
池化層的主要作用有兩個:一是減少特征維數,防止“特征災難”,較為簡便描述高維特征;二是控制過擬合,保證測試集準確度不過分偏離訓練集準確度。
全連接層一般位于卷積層和輸出層之間,將由卷階層提取到的特征轉換為一維向量,通過與其相鄰的全連接層之間的每一個節點相連反映學習樣本特征到目標之間的映射關系[19]。
卷積神經網絡中通常在全連接層之間加入線性整流函數(Rectified linear unit,ReLU)等[20]非線性元素增加其處理非線性問題的能力。
綜上所述,全連接層主要作用是將由卷積層和池化層提取的特征進行非線性組合,以完成特征到標記樣本空間的映射,即全連接層本身不被期望具有特征提取能力,而是試圖利用卷積層提取出的高階特征實現學習目標。
卷積神經網絡的結構和工作原理與傳統前饋神經網絡中的輸出層相同。對于分類問題,輸出層將全連接層的輸出轉化為分類標簽。
傳統的機械故障診斷方法可以分為4個層級,如圖1所示。
第1層次是原始加速度信號的采集,第2層次是進行原始信號去噪,并通過積分得到速度信號和位移信號,同時對加速度進行解調得到包絡信號,第3層次是從加速度、速度、位移以及包絡中提取特征,第4層次是將提取的特征作為輸入,使用分類、聚類和回歸等手段分析設備是否存在故障。
其中特征提取至關重要,常見的特征提取包括時域特征提取和頻域特征提取,時域特征包括方差、峰值、偏度和峭度等,頻域特征包括頻帶能量、頻域相位、時頻圖等,具體說明如表1所示。

圖1 傳統機械故障診斷4個層次
這些特征是在長期的研究實踐中根據專家經驗總結出來的,建立兩種基于深度神經網絡模型,分別使用一維和二維數據,實現自動特征提取,并成功應用于機械故障診斷。
基于一維卷積神經網絡的智能診斷模型如圖2所示,具體網絡參數如表2所示。

表1 常見時域特征和頻域特征

圖2 特征自動提取和智能診斷模型

表2 一維卷積神經網絡參數
如圖2所示,前5個卷積層的作用是從加速度信號中提取特征,用加速度信號作為輸入數據是因為速度、位移以及包絡可以通過對加速度信號做某種變換得到,因此只要網絡的擬合能力足夠強大,就可以從加速度信號中提取出足夠用于故障診斷的特征。時域上的卷積在頻域上對應著相乘,因此通過卷積層的操作,實際上可以得到短時的頻域特征。
智能診斷部分由全連接層、BN層和Softmax層組成,BN層可以防止網絡在訓練數據上過擬合,提高網絡的泛化性能。
在一個批次里有m個樣本,記為x_1、x_2、…、x_m,那么對于每一個樣本學習兩個參數γ和β,具體計算方法如下所示:

式中:μB為數據均值;σ2B為數據方差;式(3)是對數據進行標準化;式(4)包含兩個過程,分別是:訓練參數γ、β和輸出y通過γ與β的線性變換得到新的值。最后的Softmax層可以實現多種故障類別的區分。
二維卷積神經網絡參數如表3所示,結構如圖3所示。
由二維卷積神經網絡處理的數據往往是二維乃至三維的數據,因此振動傳感器采集的一維時域振動信號需要先通過時頻方法轉換為二維的時頻圖,之后才能送入模型進行訓練。

表3 二維卷積神經網絡參數

圖3 二維卷積神經網絡
常見的時頻方法有4種,分別為:STFT、小波變換、WVD 和Hilbert-Huang 變換,文中所用時頻方法為小波變換。基于二維CNN的智能診斷模型如圖4所示。

圖4 基于二維卷積神經網絡的智能診斷模型
上述兩種模型原理相同,輸入數據包含的信息相同,但在輸入數據類型以及網絡參數方面略有不同,因此,比較后選擇最優的模型作為所用智能診斷模型。
2.4.1 數據集
選取凱斯西儲大學軸承數據中心的滾動軸承測試數據作為數據集。使用2馬力電動機進行實驗,并且在靠近和遠離電動機軸承的位置處測量加速度數據。試驗中通過電火花加工(EDM)為電機軸承提供故障。在內滾道、滾動體(即滾珠)和外滾道上分別引入直徑為0.007英寸至0.040英寸的故障。
2.4.2 模型比較
兩種CNN智能故障診斷模型的診斷結果如表4所示。

表4 兩種診斷模型的診斷結果
比較而言,基于2DCNN的智能診斷模型的診斷正確率稍低,但兩者診斷精度都高達98%,且正確率相差不到0.5%,兩種模型正確率差別不大。
然而,基于2DCNN的智能診斷模型需要將時域振動信號變換為時頻圖,需要花費額外的時間成本和計算成本,而且由于測不準原理,在旋轉設備轉速變化較大時,不能夠同時獲得較高的頻率分辨率和時間分辨率,因此在時頻變換的過程中容易丟失部分信息,導致診斷結果出現偏差。
因此,選擇基于1DCNN的智能診斷模型作為最終使用的智能診斷模型。
將智能診斷系統應用于某石化廠的機泵設備,設備結構如圖5所示。這些設備用于輸送高危介質,一旦出現故障,輕則導致生產停止,重則發生火災、爆炸等災難性事件。該設備常見故障包括軸承松動、軸承損傷、潤滑不良、葉片故障等。

圖5 某石化企業機泵設備
在機泵上安裝加速度傳感器,采集機泵的加速度振動信號,收集歷史數據,并將歷史數據打上故障標簽。將這些數據作為模型的輸入,訓練智能診斷模型,模型超參數如表5所示。Loss 曲線如圖6所示。

表5 模型超參數
從圖6中可以看到,模型的Loss 收斂到了較小的值。
為了研究模型的特征提取效果,將權值參數可視化,如圖7、圖8所示。從圖中卷積核的頻域曲線可以看出,卷積層實際上就是一種特定頻響的濾波器,將多個卷積層疊加在一起就可以將信號中對于決策重要的頻帶提取出來。

圖6 模型訓練Loss曲線
將訓練好的模型部署在云平臺上,將該設備實時上傳的振動數據作為輸入,由診斷結果得到混淆矩陣如表6所示。根據混淆矩陣計算得出Macro_F1值為91.61 %,Micro_F1值為91.64 %,總準確率為91.64%,由此可見所建立的特征自動提取和智能診斷模型具有較好的應用效果。

表6 診斷結論混淆矩陣

圖7 卷積核權值示意圖(一)

圖8 卷積核權值示意圖(二)
本文提出了兩種基于卷積神經網絡的智能診斷模型,即基于1DCNN的智能診斷模型和基于2DCNN與小波變換的智能診斷模型。通過兩種模型的比較可知,由于振動信號的一維性,基于1DCNN的故障診斷模型相較于二維卷積神經網絡,具有準確率高、時間成本低、不受測不準原理限制等優點,并且該模型將特征提取和智能診斷兩個階段合并到一個模型中,實現“端到端”的故障診斷,提高了設備監測的效率。