楊洪柏,聶 昂 ,張江安,張宏利,劉樹林
(1.上海開放大學理工學院,上海 200433) (2.上海大學機械工程與自動化學院,上海 200072) (3.上海工程技術大學高職學院,上海 200437)
智能故障診斷一般包括特征提取和模式識別兩個步驟。常用的特征提取技術包括時域統計分析、小波變換、經驗模態分解(EMD)和傅立葉頻譜分析等。常用的模式識別分類器包括k-最近鄰分類器(KNN)、人工神經網絡(ANN)或稱多層感知器(MLP)、支持向量機(SVM)。對于往復壓縮機的智能故障診斷,不少學者在上述技術基礎上做了許多探索研究[1-4]。但由于往復壓縮機結構復雜,沖擊激勵源較多,振動信號表現出復雜的隨機特性和非線性,有效的特征提取相對困難,故障診斷效果還不夠理想,在線故障診斷也很難實施。
深度網絡和深度學習的概念被正式提出后,迅速成為研究的熱點,依靠強大的學習性能,其在語音識別、圖像識別和人工智能等方面取得重要進展[5]。一些研究者嘗試使用卷積神經網絡(convolutional neural network, CNN)來診斷機械零件的故障[6-12]。CNN最早應用于圖像識別并取得較大的成功,它非常適合于輸入是2D(二維)數據的計算機視覺應用。在故障診斷問題中,CNN的輸入有2D信號(例如頻譜圖像),也有1D(一維)信號(例如時間序列信號或頻譜系數)。Abdeljaber等[6]提出的模型使用1D振動信號作為輸入,它可以執行實時損壞檢測。Guo等[7]提出一個分層自適應深度CNN模型,該模型具有兩個分層排列的組件:故障確定層和故障大小評估層。Janssens等[8]提出了用于旋轉機械狀態識別的CNN模型,其輸入是所采集信號的快速傅立葉變換(FFT)圖譜。Zhang等[9]提出了一個采用原始數據作為輸入的CNN模型,用于軸承故障診斷。文獻[10]使用短時傅立葉變換將信號轉換為時頻圖,然后用CNN模型進行故障診斷。文獻[11]提出了具有兩個softmax分類器的CNN網絡結構,用一個網絡解決兩個非獨立分類問題。Ince等[12]提出了用于電機故障檢測的CNN模型,其輸入為1D原始時間序列數據。
上述研究在各自應用領域中都取得了不錯的成績,然而目前還未有用于往復壓縮機故障診斷的CNN模型。從上述研究可以看出,應用原始信號輸入有其獨特的優勢:1)直接應用原始振動信號可以避開耗時的特征提取過程;2)對于復雜系統的信號處理,選擇合適的特征函數需要大量的機械專業知識和豐富的數學知識,相對很難提取出有效的特征。CNN深度學習模型能夠直接從原始信號中提取特征并進行數據分類,而不需要特征提取或手動選擇。往復壓縮機由于其結構復雜,沖擊激勵源較多,難以提取有效的特征,故障診斷效果還不夠理想,本文擬構造基于原始振動信號的CNN模型(convolutional neural network with raw vibration signal,RVCNN)對往復壓縮機進行故障診斷。
CNN是典型的深度學習模型框架之一。它是一個典型的前饋神經網絡, 其實質是構建多個能夠提取輸入數據特征的濾波器,通過這些濾波器對輸入數據進行逐層卷積及池化,逐級提取隱藏在數據之中的拓撲結構特征,隨著網絡結構層層深入,提取的特征也逐漸變得抽象,最終獲得輸入數據的平移、旋轉及縮放不變的特征表示。
CNN的典型拓撲結構如圖1所示。網絡輸入為2D的特征圖,通過卷積核(神經元的權值矩陣)卷積運算映射到隱層,隱層主要由多組的卷積層(C層)與池化層(P層)組成,C層與P層交替重復,本層的輸出作為下一層的輸入,如此往復循環[11]。

圖1 CNN的典型拓撲結構
CNN的卷積層用來提取輸入神經元數據的局部特征。每個卷積層均由多個特征矩陣組成,每個特征矩陣為一個平面,同一平面上對應的卷積核相同,具有旋轉、位移不變和權值共享的特性,可以并行學習特征,極大減少了自由參數的數目[5,12]。不同平面所對應的卷積核不同,多卷積核使得特征提取更為充分。卷積操作的數學模型可表達為:
(1)

池化層(P層)也被稱為下采樣層,其作用是對上一層數據圖進行縮放映射,以達到減少數據維度的目的。P層提取的特征具有縮放不變性,同時還可以防止過擬合。P層神經元的計算方法如下:
(2)

CNN 的輸出層采用上一層級特征圖進行線性全連接,一般采用softmax分類器,可以解決多分類問題。
目前CNN多為一種有監督的深度模型架構,網絡的訓練類似于傳統的人工神經網絡訓練方法,采用反向傳播算法(BP)將誤差逐層反向傳遞,使用梯度下降法調整各層之間的參數。
CNN的主要特征是結合稀疏連接、權重共享、空間或時間上的降采樣共同實現數據的分類處理。稀疏連接通過拓撲結構建立層與層之間非全連接空間關系來降低訓練參數的數目;權值共享能夠有效地避免算法過擬合;下采樣充分利用數據本身包含的局部性等特征,減少數據維度,優化網絡結構,且能保證在一定程度上的位移不變性。CNN非常適合海量數據的處理和學習,通過逐層抽取特征,可有效實現故障診斷與識別[5,11]。
針對往復壓縮機故障診斷,提出如圖2所示的RVCNN模型,該模型利用1D原始振動信號作為輸入,不需要先提取特征,利用CNN自身所具有的學習能力對往復壓縮機振動信號進行特征提取和故障診斷。

圖2 基于1D原始振動信號的RVCNN模型
經過多次試驗調整,基于原始振動往復壓縮機的CNN故障診斷模型采用如表1所示的網絡模型結構。Dropout概念是Hintion于2012年提出的[9],在每個訓練批次中,通過忽略一定比例的特征檢測器(讓相應隱層節點值為0),從而大大減少過擬合現象,這種方式可以減少特征檢測器間的相互作用。第一個全連接層采用ReLU激活函數,它能克服梯度消失問題,大大加快訓練速度。第二個全連接層采用softmax分類器進行分類。

表1 RVCNN網絡模型結構
為了探討RVCNN模型對往復壓縮機故障診斷的效果,設計了兩個實驗:一是應用構造的RVCNN模型對1D原始振動信號進行特征提取和故障診斷,并與常用的功率譜能量(BP)模型和小波包能量(BP)模型進行對比;二是研究RVCNN模型對噪聲的魯棒性,采用不加噪的原始數據對RVCNN模型進行訓練,用不同信噪比的數據進行診斷測試,并與小波包能量(BP)模型進行對比。
往復壓縮機振動實驗數據從大慶天然氣公司南區壓氣站1號工作機組上采集而來。為得到不同狀態下的往復壓縮機振動試驗數據樣本,在南區壓氣站1號工作機組的二級氣缸上依次安裝了正常、閥片斷裂、彈簧損壞及閥片有缺口4種狀態的氣閥進行故障模擬試驗,二級氣體出口壓力1 040kPa,進口壓力310kPa,出口溫度104℃,進口溫度32℃,氣體流量3 611m3/h,加速度傳感器布置在氣閥的閥蓋上,采集系統選用INV306U-6660 智能數據采集處理分析儀與北京東方振動和噪聲技術研究所的 INV-1021程控多功能信號調理器,采樣頻率為 20kHz,正常狀態采集了120 000個點,其他3種氣閥狀態各采集了80 000個點。
為了獲得大量的訓練和測試樣本,數據采集采用部分重疊切取方式,如圖3所示。從仿真實驗可知,訓練數據的多少也會影響訓練的正確率,訓練樣本越多,準確率越高,本文選取每隔10個數據采集1個樣本,每個樣本長1 024個數據點,共采集5 382個樣本,隨機抽取其中的70%作為訓練樣本,30%作為測試樣本。

圖3 RVCNN樣本采集方式
對于功率譜能量(BP)和小波包能量(BP)模型,分別取閥片正常、閥片斷裂、彈簧損壞及閥片有缺口4種狀態的工作樣本各78個,每個樣本長度為1 024個數據點。任意選取原始數據下每種狀態的40個樣本構成故障訓練樣本(共160個),其余的樣本構成模型的測試樣本(共152個)。
為了測試不同噪聲情況下的模型識別率,在測試樣本添加不同信噪比高斯噪聲,然后進行測試以獲得相應的識別率。
在未添加噪聲的情況下,分別用功率譜能量(BP)模型、小波包能量(BP)模型與RVCNN模型對往復壓縮機氣閥故障進行診斷對比,功率譜能量(BP)模型識別率只能達到60%,小波包能量(BP)模型識別率達到93.75%,而RVCNN模型識別率可達100%,可以有效地對往復壓縮機氣閥故障進行識別診斷。
表2是RVCNN模型和三層小波包能量(BP)模型在不同信噪比測試樣本下的識別率對比結果,由表可知, RVCNN模型對加不同信噪比噪聲的故障信號具有相當高的識別率,無噪聲、信噪比分別為50dB和20dB的情況下仍能得到100%的故障識別率,只有在信噪比為10dB的情況下有所下降,但也有90.20%的識別率。而相對的,小波包能量(BP)模型在無噪聲情況下的測試識別率也能達到 93.75%,在噪聲含量較少的情況下(信噪比為50dB)識別率下降較少,能達到 87.50%,但是信噪比達到 20dB 后,識別率大為降低,無法進行有效識別。

表2 不同噪聲強度下故障識別率對比
本文直接應用未加工的1D振動信號作為輸入,構造RVCNN模型進行往復壓縮機故障診斷。使用從試驗臺獲得的壓縮機氣閥故障數據樣本進行實驗,并與小波包能量(BP)模型方法進行比較。用不同信噪比的加噪故障信號進行測試,結果表明,在不同信噪比情況下RVCNN模型識別率均具有較大的優勢。這說明RVCNN模型不僅具有較高的識別效果,而且具有一定的抗噪性能。
目前本文只是用1D數據進行嘗試,構造模型的層數及各個參數都是基于實驗進行調整,未來期望通過進一步研究找出其中的固有規律以供模型優化。