郭明軍, 李偉光, 楊期江, 趙學智
(1.華南理工大學 機械與汽車工程學院,廣州 510640;2.廣州航海學院 輪機工程學院,廣州 510725)
轉子系統是風機、汽輪機、軋機、壓縮機等旋轉機械中用于傳遞運動與動力的關鍵部件,其工作性能通常對旋轉機械的穩定性和可靠性起決定性作用[1]。旋轉機械高速重載的工作環境經常會使得轉子系統產生振動,而劇烈的振動必須加以控制,否則將會使得機械零部件受損、引發機器故障,甚至造成嚴重的安全事故[2]。因此,研究轉子系統狀態監測與故障診斷方法對保持旋轉機械的運行性能及使用壽命具有重要意義。
軸心軌跡是旋轉機械振動信號的一種重要表現形式,包含了設備運行狀態的豐富信息,它的特征提取與識別是旋轉機械智能診斷的重要手段,本質上是二維圖形的模式識別問題[3]。軸心軌跡的主要特征包括傅里葉描述子、幾何參數特征及矩特征等,將這些特征與故障類型相對應,通過學習訓練后,利用模糊聚類、灰色關聯分析、支持向量機與人工神經網絡等分類器實現故障的分類識別。李輝等[4]利用模糊C-均值聚類方法對軸心軌跡的多重分形譜特征進行了分類識別,取得了良好的效果。李友平等[5]以不變矩作為特征向量,采用關聯度分析方法實現軸心軌跡的自動識別。萬鵬等[6]提出了一種集成非線性流形學習和支持向量機相結合的故障診斷模型,應用于試驗臺轉子系統故障識別,取得了較高的精度。郭鵬程等[7]采用邊緣矩和粒子群來尋找關鍵故障特征,解決了輪廓的完整性和輪廓提取算法的穩定性問題,然后應用加權神經網絡實現了4種典型軸心軌跡的識別。
上述傳統智能識別方法雖然已在多個領域取得了成功,但它們將人工特征提取與分類識別兩個緊密聯系的過程分割為相互獨立的兩部分,步驟繁瑣且無法適應復雜多變的實際環境。而近年來,Hinton等[8]科學家提出的深度學習因其具有較深的結構而具有強大的自適應特征學習能力,是解決上述問題的重要方法。在機械故障診斷領域,堆棧去噪自編碼機(Stacked Denoising Auto-encoder, SDAE)、深度置信網絡(Deep Belief Network, DBN)、卷積神經網絡(CNN)等都取得了不錯的效果。李松柏等[9]提出了一種集成多傳感器信息及SDAE的齒輪故障診斷模型,具有比傳統故障診斷方法更高的抗噪性及魯棒性。李巍華等[10]利用DBN對軸承的原始振動信號進行自適應特征提取,增強了識別過程的智能性。劉星辰等[11]采用隨機破壞輸入和全局平均化策略對經典卷積神經網絡模型LeNet-5進行改進,提出一種具有實時抗噪性能的一維卷積神經網絡模型,實現了對原始軸承及齒輪箱振動信號的自適應特征學習與故障診斷。盡管深度學習已經在旋轉機械故障診斷上取得成功,但在軸心軌跡的識別上的應用尚不多見。
本文針對軸心軌跡的識別問題,借鑒CNN在門牌識別、車牌識別及花卉識別等領域的成功應用,利用CNN所特有的卷積與池化結構,并結合樣本數據的特點,提出一種深度卷積神經網絡故障診斷模型DCNN-FDM用于軸心軌跡識別,并通過全連接層的主成分分析驗證所提方法在特征學習方面的有效性。與傳統方法(BP神經網絡、Hu矩+BP神經網絡以及Hu矩+SVM)相比,本文所提模型的識別效果更好,可實現轉子故障的精確診斷。
CNN是廣泛應用的深度學習模型之一,具有與傳統人工神經網絡類似的層級結構,通常由輸入層、卷積層、池化層及輸出層等部分組成。其核心模塊是卷積層和池化層,正是通過交替的卷積與池化操作,達到對輸入數據特征的逐層剝離以期挖掘數據潛藏的更加抽象的特征。輸出層通常采用softmax分類器,它是logistic回歸模型在多分類問題上的推廣,可用于輸入數據的多分類任務當中。本節將重點介紹卷積、池化及softmax分類器的基本原理。
卷積層的作用是對輸入數據的特征進行自適應提取,而這是通過每一個神經元固定的卷積核矩陣與上一層的輸出特征矢量進行卷積運算來實現的。卷積的結果代表所提取的特征,每一個卷積核通過權值共享機制學習到輸入的一類特征,即特征圖(Feature Map,FM)。卷積過程可由下式描述:
(1)
式中:l為卷積核序號,Cl為CNN的第l層FM,a為卷積層輸入,b為卷積核的偏置項,x、y、z分別為輸入數據的不同維度。
為了能夠提取到復雜的非線性特征,在卷積操作之后通常會引入激活函數來增加模型的非線性。ReLu激活函數因其特有的單邊抑制特性,能夠對深度學習模型進行稀疏后更好地挖掘相關特征,且收斂速度優于sigmoid和tanh函數,而被廣泛應用。其原理為:
Hl=f(Cl)=max{0,Cl},l=1,2,…,q
(2)
式中:Hl為Cl的激活值。
卷積層之后是池化層(也稱下采樣層),其作用是壓縮數據及參數量,從而減小過擬合風險[12]。常用的池化策略有L2范數池化、平均池化和最大值池化,其中最大值池化應用最廣,其表達式為:
Gl=downsamp(Hl)=maxHl(v1,v2)
(3)
式中:(v1,v2)為對上一層進行池化的元素尺度。
通過交替的卷積層與池化層之后,需要通過全連接層將最后一個池化層的特征整合為一維的列向量xl,與輸出最層的標簽連接,最后由softmax完成分類任務。對于m類的多分類問題,softmax的輸出可表示為[13]:
(4)
式中:θi(1≤i≤m)為模型的參數,f(θix)為模型的輸出。
CNN已經在手寫字體識別、門牌識別等多個領域得到應用,鑒于本文研究的軸心軌跡識別與手寫字體識別具有頗多相似之處,故可針對其特征來調整CNN的網絡參數以實現軸心軌跡的自動識別。
本節采用的深度卷積神經網絡故障診斷模型DCNN-FDM如圖1所示,由圖可知,該模型包括三部分:輸入模塊、特征提取模塊和分類模塊。

圖1 DCNN-FDM模型
輸入模塊:輸入圖像通常為包含紅黃藍3原色的3通道圖像且其尺寸大小不一致,為處理方便,需將其進行預處理為統一的尺寸大小,而這是由輸入模塊來完成的。圖像預處理過程包括讀取圖像、二值化處理和最近鄰插值三個步驟:首先,調用計算機視覺庫(Open Source Computer Vision Library,OPENCV)中的cv2.imread()函數來讀取原始圖像;然后,調用cv2.threshold()函數將圖像處理為灰度圖;最后,調用cv2.resize()函數,采用最近鄰插值算法,將圖像尺寸統一縮放為32×32。
特征提取模塊:該模塊由兩組交替的卷積層和池化層組成。卷積層通過多個卷積核可以提取到圖像不同的局部特征,然后通過Relu激活函數對所得特征進行非線性映射,起到特征增強的作用。而池化層采用最大值池化,可以對輸入數據進一步壓縮及減少參數量,起到減少計算量和防止過擬合的作用。特征提取模塊正是通過交替的卷積和池化層來實現軸心軌跡特征的自適應提取功能。
輸出模塊:輸出模塊由全連接層和softmax分類器組成。其中全連接層負責將特征提取模塊中提取到的特征進行扁平化處理為一維的張量,然后再輸入softmax分類器中得到各類輸入的概率值。
經過反復試驗,確定的網絡參數如下:卷積核大小為5×5,移動步長為1;采用最大值池化,尺寸為2×2,步長為2;圖1中64@28×28代表特征圖大小為28×28,深度為64;全連接層神經元個數為1 024。
CNN的訓練屬于有監督訓練,每個樣本對應的輸出與實際標簽之間的差值定義為誤差,模型訓練的目的就是使得誤差盡可能小。因此,模型訓練最終可歸結為一個優化問題。本文以交叉熵為損失函數,表達式為:
(5)
式中:x為輸入特征,y為模型的實際標簽,y_為模型的輸出結果,即softmax的分類結果。
模型訓練分為前向迭代求解和誤差反向傳播兩個階段。前向傳播過程如下式:
(6)

反向傳播過程采用梯度下降方法更新參數,輸出層t的殘差δt定義為
(7)
式中:°表示逐點卷積。此時,容易得到權值W和偏置項b的梯度如下
(8)
對于最大值池化層,要從壓縮過的輸出層誤差δt還原成池化前的大小,需要進行上采樣,將第l-1層中最大值所對應的位置用第l層中的殘差替代,而其余位置進行補零操作。即有:
δl-1=upsample(δl)°f′(zl-1)
(9)
式中:upsample(.)表示上采樣操作。
對于卷積層,則有:
δl-1=δl*rot 180(Wl)⊙f′(zl-1)
(10)
式中:*表示卷積,⊙表示向量內積,rot180表示對卷積核旋轉180°。
通過上述方法,利用鏈式法則,可以求出各層的梯度,進而實現權重與偏置等網絡參數的更新。
試驗裝置為課題組自主研發的大型滑動軸承試驗臺,如圖2所示,主要由大小減振平臺、伺服電機、卸荷座、聯軸器、轉子及其左右兩端的支承滑動軸承(寬徑比0.75、間隙比0.002)和推力裝置組成。試驗中涉及的基本參數,如表1所示。

圖2 滑動軸承試驗臺

表1 試驗基本參數
本文監測的對象為圖2中的轉子,所用的傳感器型號為KamanKD2306-1S、分辨率為0.01%FS、量程為0~2.5 mm。通過轉子軸心軌跡的不同形狀可以識別其對應的故障類型,兩者的對應關系如表2所示。軸心軌跡的識別流程,如圖3所示。

表2 軸心軌跡數據集

圖3 軸心軌跡識別流程圖
轉子的軸心軌跡可利用在轉子同一軸截面兩側互相垂直的位置布置的兩個位移傳感器測得的信號D1和D2來合成,結果如圖4所示。

圖4 原始軸心軌跡
由圖4可知,軸心軌跡混成一團而無法識別其本來面貌。這是由于設備結構及其運行環境的復雜性,引起實測的振動信號受到諸多干擾因素的影響,從而使得軸心軌跡雜亂無章。故在進行軸心軌跡識別試驗之前,需要對測試的軸心軌跡進行降噪提純。本文采用奇異值分解(Singular Value Decomposition, SVD)及其差分譜理論[14-15],進行軸心軌跡提純。圖5為2 250 r/min轉速工況下測得的位移信號的提純過程。圖5(a)、(b)為轉子的原始振動信號,由圖可知,信號受到了嚴重的噪聲干擾。經SVD處理之后得到的奇異值曲線及其差分譜如圖5(c)、(d)所示,由圖可知,振動信號的奇異值差分譜的最大值都出現在序號4的位置。根據差分譜理論,選擇前4個奇異分量進行信號重構,結果如圖5(e)、(f)所示,據圖可知,經SVD處理后的信號波形十分清晰,干擾成分幾乎完全被消除。

(a)D1的波形圖
由圖5中的提純信號合成的軸心軌跡如圖6所示。由圖6可知,軸心軌跡為“花瓣形”,說明轉子存在碰磨故障。

圖6 提純軸心軌跡
更換不同參數的試驗軸承,采集不同轉速工況下的振動信號,獲得大量的試驗數據。按照3.1節的方法獲得橢圓形、香蕉型、外8字形和花瓣形4類不同軸心軌跡圖各200張,按20%的比例隨機選取測試集,其余為訓練集。樣本標簽及數據集劃分結果詳見表2。部分提純軸心軌跡,如圖所示7所示。
DCNN-FDM模型是基于tensorflow-gpu深度學習框架所搭建的,編程環境采用pycharm+python,處理器為intel(R)core(TM)i7-7700,顯卡采用NVIDIA Geforce GTX 1050。該模型的設計包括訓練和預測兩個部分。模型訓練時所用的網絡結構如圖1所示,其中輸入層神經元個數等于輸入軸心軌跡的樣本個數,而輸出層神經元個數與軸心軌跡的類別數一致。

(a)橢圓
在模型開始訓練之前需要提前設置好超參數,本模型的基本參數設置如下:初始學習率lr設為0.001,以0.99的衰減率按指數衰減;訓練周期150,采用小批量訓練法,每次從訓練集中隨機輸入16個樣本;采用截斷的標準正態分布函數進行初始化卷積層的權值參數,標準差設為0.1;卷積層后使用ReLu激活函數進行非線性映射;全連接層采用dropout技術來防止過擬。模型參數設置完成后,開始正式對網絡進行訓練。當模型訓練次數達到預設值后保存模型參數并結束訓練。然后進入測試階段:將訓練集輸入到已訓練好的模型當中,對比預測結果與真實標簽,從而得到模型的準確率用于評價模型的性能。
采用訓練集樣本對DCNN-FDM模型進行訓練,結果如圖8所示。

(a)損失值變化曲線
圖8(a)為損失值變化曲線,由圖可知,隨著訓練次數的增加,損失值不斷降低,最終穩定在0.12左右。圖8(b)為準確率變化曲線,由圖可知,隨著訓練次數的增加,準確率不斷交替上升且其波動幅度較大;當訓練次數達到120次以后,準確率保持100%不變。然后,利用訓練好的 DCNN-FDM模型對測試集進行預測。經過10次反復試驗的結果如圖9所示,由圖9可知,軸心軌跡的識別率在96%~99%之間波動,平均識別率為97.09%。實驗結果表明,DCNN-FDM模型對實測軸心軌跡的識別取得了良好的效果。

圖9 DCNN-FDM模型的訓練過程
經過分析發現,在4類軸心軌跡中,標簽為“1”即香蕉形的軸心軌跡最容易被識別錯誤,其結果如圖10所示。由圖10可知,平均每次會有兩張香蕉形軸心軌跡被識別錯誤,其原因將在后續小節給出。

圖10 橢圓形軸心軌跡識錯情況
為了驗證所提模型對于實測軸心軌跡的自適應特征提取能力,在全連接層利用主成分分析提取這些特征中的前兩個主成分,結果如圖11所示,圖中數字代表對應的樣本標簽,其具體含義見表1。圖11(a)為第一輪訓練的結果,由圖可知,各類樣本的特征混合在一起,由此推斷模型的原始輸入分類效果極差。圖11(b)為第50輪訓練的結果,由圖可知,經過50次訓練之后“不平衡”和“碰磨”故障已經明顯可分,而“弱不對中”和“強不對中”故障仍然有部分特征混在一起。圖11(c)、(d)分別為經過100次和150次訓練的結果,此時各類特征已經明顯分開,僅有少數幾個“香蕉形”軸心軌跡對應的“弱不對中”故障特征落在了“外8形”軸心軌跡對應的“強不對中”故障特征區域內,這正是香蕉形軌跡最容易被誤判的原因。由此可見,DCNN-FDM模型能夠從實際數據集中學習到有效的特征并能實現轉子故障的精確診斷。

(a)第1輪訓練
為了說明本文方法的優勢,分別使用不同的傳統方法(BP神經網絡、hu矩+BP神經網絡以及Hu矩+SVM)對相同的數據集進行測試,實驗結果如表2及圖12所示。結果表明,本文方法在各次實驗中的準確率均比其他三種模型的要高,且其平均準確率為97.09%也是最高的;而Hu+BP及Hu+SVM的準確率較為接近,平均準確率分別為93.75%和94.23%;BP神經網絡的識別效果最差,其準確率在75%~91%之間波動,平均準確率也僅為81.40%。產生上述結果的原因是:本文提出的DCNN-FDM模型是一種深度學習模型,具有強大的非線性擬合及特征學習能力;而其他三者皆為淺層的學習模型,學習能力有限,故診斷效果相對較差。

表2 不同模型對比結果

圖12 不同模型診斷結果
本文基于深度學習的強大學習能力,借鑒卷積神經網絡在門牌識別、手寫字體識別等領域的成功應用,結合旋轉機械不同形狀軸心軌跡的特征,提出了將深度卷積神經網絡用于在旋轉機械的軸心軌跡識別,并通過對全連接層的前兩個主成分進行可視化分析,以驗證模型的自適應特征提取能力。試驗結果表明,本文所用的DCNN-FDM模型較BP神經網絡、hu矩+BP神經網絡以及Hu矩+SVM的傳統方法的識別效果好,前者可實現轉子故障的精確診斷,識別率達到97.09%。DCNN-FDM模型的全連接層的主成分分析結果表明,所提模型確實具備自適應特征學習能力。