謝星怡,張正江,閆正兵,李欣燦,陶莫凡,章 純
(溫州大學 電氣數字化設計技術國家地方聯合工程研究中心,浙江 溫州 325035)
軸承是機械設備的關節,是支撐支柱的重要結構之一,是提高工業效率的重要環節,在電力設備中有著重要作用。其運行狀態對整個設備的工作機能與工作效率有直接影響。軸承被稱為“工業的關節”,被廣泛應用在國防軍事、航空航天等關系到民生和安全的重大領域。滾動軸承在設備運行過程中,可能因過載、磨損、磨蝕與疲勞等原因,而可能會發生局部損傷。而滾動軸承在高強度的條件下工作,不易避免出現故障。一旦出現故障,就也可能導致重大事故。根據電氣與電子工程師工業應用協會(ISA,industry applications society)和其他相關組織的一些調查,軸承約占機器故障原因的40%[1-2]。對滾動軸承故障的快速高效診斷和預知維修將大大提高設備的運行可靠性,但傳統的故障檢測方法難以滿足現在的故障診斷要求。因此,在機械故障診斷中,軸承的故障診斷始終是重要發展的內容之一。
滾動軸承故障診斷方法依據測量信號的性質,可以劃分成溫度法、油樣法和振動法等。對于軸承出現初期磨損的細小故障,溫度法只能在故障到達一定的嚴重程度才可有效果,否則幾乎毫無響應。油樣法僅適合油潤滑軸承。振動法適用在各種類別與工作狀況的軸承,具備診斷初期小故障效果佳、信號采集與處理簡便以及診斷結果清晰無誤等特色,使其在實際中得到了廣泛的運用[2]。
根據現有故障診斷方法的成果,研究方法可以分為三類——基于機理的研究方法、基于信號處理的研究方法與基于數據驅動的研究方法。基于機理的方法需要集成大量不同領域的專家經驗,不具備學習能力,極大地增加了維護成本,不再適用于現代大型機械系統。信號處理方法適用范圍廣泛,常用于對采集到的機械運行時數據進行故障特征提取,可以直接觀察信號處理的結果,判斷設備的運行狀態。基于數據驅動的故障診斷技術可以有效地從海量數據中挖掘出隱含的故障診斷信息,建立診斷模型,就可以獲得良好的故障診斷結果[4]。
近些年,許多學者在軸承故障診斷方向上有著不乏的研究成果。在基于信號處理的研究方向如下:張中民等[5]提出了基于正交小波變換診斷滾動軸承故障的一種新方法,既可以判斷出故障的存在,其形式也可被判別無誤;萬書亭等[6]提出了基于時域參數趨勢分析診斷滾動軸承故障方法,簡單實用,效果明顯;袁云龍等[7]提出基于峭度與小波包分析的滾動軸承故障診斷方法,可以準確地把多種干擾信號濾除,提供了一種快速有效的軸承故障診斷方法。
在基于數據驅動的研究方向如下:于婷婷等[3]提出了基于BP神經網絡的滾動軸承故障診斷方法,能根據實際數據準確判別滾動軸承故障類別,具有不錯的診斷效果;王敬濤等[8]提出了基于概率神經網絡診斷滾動軸承故障方法,準確性較高,且對制止局部極小與節省訓練時間方向上有著良好的實際使用價值;高坤等[9]提出了基于深度殘差神經網絡的軋機滾動軸承故障診斷方法,提高模型訓練穩定性,提升故障診斷準確率,并減輕對專家經驗的仰賴,適用于實際工程應用。
在基于信號處理與數據驅動相結合的研究方向如下:劉鑠等[10]提出了一種基于圖像形態學紋理分析與CS-SNN算法相結合的退磁故障診斷方法,可以準確地判斷DPPMSLM退磁故障位置和嚴重程度,并擁有不錯的魯棒性。肖茂華等[11]提出了基于參數優化變分模態分解、多尺度排列熵和粒子群-布谷鳥搜索融合算法優化Elman神經網絡診斷故障方法,可以自適應地分解信號,提取出有效的故障特征,還能完成故障的精準分類,提高識別率。賈晗等[12]提出了基于快速譜峭度與卷積神經網絡(FSK-CNN)診斷故障方法,制止了訓練陷于局部最優問題,在收斂速率與識別準確率方面都有著不同程度的提升,但診斷時間也有不同程度的增加。周翔宇等[13]提出了基于頻域降采樣與CNN診斷軸承故障方法,并完成對故障軸承識別分類,降采樣后模型抗噪能力有著顯著提升,且具備較好的判別準確率。
對以上方法進行對比,可得到:相比于基于信號處理的研究方法和基于數據驅動的研究方法,基于信號處理與數據驅動的研究方法能更加準確地實現對故障的分類,提高故障識別率。因此,本文把基于信號處理與數據驅動的研究方法相結合,提出了基于信號特征提取與卷積神經網絡診斷軸承故障的方法。該方法可以較快速、精確和穩定地分類不同的軸承故障,綜合性能較佳。
卷積神經神經網絡(CNN)屬于前饋神經網絡,包含卷積運算與深度結構,近些年來在目標檢測等方面展現出眾,可以很好的處理過擬合問題,使更大規模的深度學習足以落實。在LeNet-5被Lecun等人提出后,以卷積層、池化層與全連接層為主要構成的CNN基礎結構被明確下來[14]。
卷積神經網絡的模型如圖1所示。首先,卷積層對輸入層中數據的特征進行提取。接著,所提取的特征經過池化層進行抽樣,既可以有效地減少訓練參數,過擬合程度也能明顯降低。一個卷積層加一個池化層為一個特征提取過程。全連接層負責聯接經過多輪卷積層與池化層提取后的特征圖。最終,Softmax層獲得最終歸類結果。
對原始數據進行歸一化處理并轉換成CNN的輸入數據形式——4-D形式,將處理過的數據輸入到卷積神經網絡模型中。

(1)
任意給定卷積層的輸出大小,可依據卷積層輸出大小的計算(2)求得。其中N是卷積層的輸出大小,M是卷積層的輸入大小,K是卷積核大小,P是填充的像素數,S是步長。
(2)
激活層是對線性模型表達力的一種彌補。卷積層的操作是線性的,只能解決線性問題,而使用激活函數可以把非線性因素加入到卷積層輸出結果中,這樣就能解決非線性問題。本文使用ReLU函數作為CNN的激活函數,能夠快速收斂,梯度計算簡單快捷。

(3)
池化層(pooling layer)壓縮卷積層經過非線性激活后的特征圖,從而縮小特征圖,降低特征數據維度,提高計算速率,以及提取主要特征,基本上制止了過擬合現象的發生。

(4)
(5)
全連接層連接通過多輪卷積層與池化層提取后的特征,與傳統神經元聯結方式一樣。
全連接層把權重矩陣乘輸入向量,并加上偏置值作為輸出值送入Softmax層。全連接層輸出值的計算公式為公式(6)。其中Z是全連接層的輸出值,X為全連接層的輸入值,W是權重,b是偏置值。
Z=WTX+b
(6)
Softmax層根據全連接層的輸出值,得到每個類型對應幾率,完成不同類型幾率分布問題。用Softmax函數,即公式(7),可以計算出各個類的概率。其中P(x=k)是第k個類別的概率(1≤k≤C),C是類別數,ezk是全連接層最終輸出的第k個值。
(7)
特征提取(feature extractor)可以減少數據維度且提取數據特征,以方便后續使用。信號中的某些特征信息與設備故障有很強的依賴關系,要提取這些有用的信號就需要信號處理。信號特征提取可以去偽存真以及減少甚至去除噪聲的干擾,提取反映設備狀態有用的信息。
時域特征直觀,結果便于通曉,包含的信息量廣,可以初步判斷一些故障信號。依據有無量綱,將時域特征分成有量綱參數與無量綱參數這兩類。在有量綱參數中,均方根值有著不錯的穩定性,不過對初期故障信號不夠敏感。而在無量綱參數中,峭度指標對脈沖類故障頗為敏感,且對初期故障敏感性良好,然而穩定性卻不佳。因此故障監測可以用峭度指標與均方根值同時實行,這樣敏感性與穩定性都可以兩全。有數據統計顯示,滾動軸承的振動狀況通過利用峭度系數與有效值協同來監測,故障判斷準確率超過95%[7]。
頻域特征可以通過傅里葉變換把繁雜時序波形分化成若干個簡單諧波分量,從而獲得信號的頻率結構和各個諧波的幅值、相位信息,以進行探究。頻域特征按頻率分析信號,用頻域表示更加簡潔,頻域特征使得信號分析更加深刻和便捷,識別信號變化或模式的可行性更高。
本文根據滾動軸承振動加速度信號的關聯性與后續分類的計算需求,分別選取最大值、最小值、均值、均方根值、方差、歪度、峭度和自相關為所需提取的時域特征,零次諧波(或者直流分量),一次諧波(或者基波)至十次諧波為所需提取的頻域特征。
設定N是信號數據的長度,H(i)表示信號數據中第i個時刻的值,各個特征的計算方法表示為:
1)最大值:
MAX=max(H(i))
(8)
2)最小值:
MIN=min(H(i))
(9)
3)均值:
(10)
4)均方根值:反映信號能量的大小。
(11)
5)方差:反映信號的分散程度。
(12)
6)歪度:反映振動信號的非對稱性。
(13)
7)峭度:能夠很好地描述變量的分布。
(14)
8)自相關:能在繁雜信號中提取周期成份。
(15)

(16)
(17)
依據信號特征提取具有提取分類待征的能力和卷積神經網絡沒有記憶功能的問題,本文提出了一種基于信號特征提取和卷積神經網絡診斷軸承故障方法,對CNN參數進行了尋優計算,選擇了最佳的CNN參數,從而得到最優的CNN網絡。本文所提出的模型結構如圖2所示。

圖2 卷積神經網絡的結構
該方法的基本流程是對原始數據進行提取時域和頻域特征的處理,把處理好的數據輸入卷積神經網絡中進行訓練,得到故障分類。其流程如圖3所示。

圖3 基于信號特征提取和卷積神經網絡的軸承故障診斷方法流程圖
具體步驟如下:
1)數據初始化并采樣。讀取滾動軸承的振動加速度信號數據,并對每個類別的信號數據用400個采樣點為一個樣本,取300個樣本。
2)特征提取與數據集劃分。提取每個數據樣本時域與頻域特征,特征參數的個數是25個,并分別把特征參數的實部和虛部提取出來,使得每個數據樣本有25×2個數據。將樣本集按7∶3劃分成訓練集和測試集。
3)數據形式轉換。將數據進行平鋪,轉換成CNN的輸入數據形式,即4-D形式的。
4)構建CNN網絡結構。建立3個卷積層,其大小都是3×2,步長都為1,為防止遺失邊緣信息,填充0的方式補全邊界信息;建立3個卷積層,其大小都是2×1,步長都為2。CNN具體結構參數如表1所示。

表1 卷積神經網絡的結構參數
5)網絡參數設置。使用Adam梯度下降算法,設置最大訓練次數、初始學習率、學習率下降因子等參數。
6)得到故障分類結果。訓練CNN網絡,分別預測訓練集與測試集,然后反歸一化,從而獲取故障分類結果。
本文所使用滾動軸承的數據集是出自美國凱斯西儲大學(CWRU)軸承中心。本文所引用的參考文獻[11-13]使用了該數據集,表明該數據集真實可靠。
實驗平臺由一個1.5 kW的電動機、一個扭矩傳感器/譯碼器、一個功率測試計和電子控制器(圖中沒顯示)組成的,如圖4所示。

圖4 軸承實驗平臺
CWRU數據集中待測試的軸承支撐著電動機的轉軸,驅動端軸承為SKF6205,采樣頻率為12 kHz 和48 kHz;風扇端軸承為SKF6203,采樣頻率為12 kHz。單點損傷是選用電火花加工形式引入的,以模擬在測試軸承內圈、外圈、滾動體上出現的3種故障。在SKF軸承加工直徑為0.177 8、0.355 6、0.533 4 mm的損傷,在NTN軸承加工直徑則是0.711 2、1.016 mm的損傷。
振動數據是利用安裝在軸承座上的加速度傳感器進行采集,利用16通道記錄儀進行記錄。
在平臺中裝入加工過的故障軸承,記錄不同工況下工作的振動加速度信號數據。使用該實驗臺,可以得到8個正常樣本,53個外圈損傷樣本,23個內圈損傷樣本和11個滾動體損傷樣本。
本文選取的數據集是把驅動端軸承作為診斷對象,使用SKF6205深溝球軸承,它的規格如下:內圈直徑為25 mm,外圈直徑為52 mm,厚度為15 mm,滾動體直徑為7.94 mm,節徑為39.04 mm。采樣頻率為12 kHz,電機轉速為1 772 r/min,電機載荷為1馬力,故障直徑分別設置為0.177 8 mm、0.355 6 mm與0.533 4 mm。
本文將電機驅動端正常狀態、內圈故障、滾動體故障與外圈故障的軸承振動信號作為研究對象。篩選CWRU數據集,以獲得驅動端數據。所用的數據集包含10種不同的數據,可分為10種不同故障的類別,具體類別如表2所示。每類數據以400個采樣點為一個樣本,取300個樣本(每類故障約有12萬個采樣點),對每個樣本進行時域特征和頻域特征提取。將樣本集按7∶3劃分,即每類數據取210個樣本當作訓練集,90個樣本當作測試集。共3 000個樣本,2 100個訓練集,90個測試集。

表2 類別標簽設置
特征提取的參數如圖5所示,每個類別標簽都有著不同的特征參數。由于特征提取之后的數據存在虛數,故將數據的實部和虛部分別提取出來,再把訓練集和測試集進行數據平鋪分別變形為[25,2,1,2 100]、[25,2,1,900],數據形式轉換成了CNN的輸入數據形式,即4-D形式,這樣放進卷積神經網絡就可以訓練了。

圖5 十類軸承狀態對應的特征參數圖
本文將原始卷積神經網絡與用特征提取后進行卷積神經網絡的分類效果進行對比。
兩種方法的卷積神經網絡具體參數設置如表3所示。原始卷積神經網絡的參數設置:最大訓練次數為15,初始學習率為0.01,學習速率下降時的訓練次數為8,學習率下降因子為0.01。而優化后的卷積神經網絡的參數設置:最大訓練次數為40,初始學習率為0.01,學習速率下降時的訓練次數為30,學習率下降因子為0.1。

表3 卷積神經網絡參數表
原始卷積神經網絡的訓練集數據大小和測試集大小分別是[400,1,1,2 100]與[400,1,1,900],而優化后的卷積神經網絡的訓練集數據大小和測試集大小分別是[25,2,1,2 100]與[25,2,1,900]。
原始和優化后的卷積神經網絡訓練圖如圖6和7所示。訓練圖顯示了小批量損失值曲線與準確度曲線——實線為準確度曲線,點劃線為損失值曲線。損失值是交叉熵損失值,準確度是網絡準確歸類的百分比。原始卷積神經網絡訓練集在訓練次數超過100次之后準確率就達到了99%,而優化后的神經網絡訓練集準確率達到99%,需要訓練次數超過500次。因此,相比優化后的神經網絡,原始卷積神經網絡用更少的訓練次數達到99%的準確率。

圖7 優化后卷積神經網絡訓練圖
本文用測試集的預測結果對比圖和混淆矩陣的形式來表示分類效果,如圖8~11所示,軸承故障優化后的分類效果可以得到更好的展現。預測結果對比圖橫軸為預測樣本,豎軸為預測結果,星號為真實值,空心圓點為預測值。混淆矩陣可以得到具體的故障分類精度,可以用來衡量模型分類的準確程度。混淆矩陣圖的橫坐標是預測的標簽,為測試集的分類結果,橫坐標上方是對應類別的精確率;而縱坐標是真實的標簽,為測試集的原始結果,縱坐標下方是對應類別的靈敏度,即召回率。對角線上的數值為歸類無誤個數,而不是對角線上的數值則為歸類有誤個數。

圖8 原始卷積神經網絡測試集預測結果對比圖

圖9 原始卷積神經網絡測試集混淆矩陣

圖11 優化后卷積神經網絡測試集混淆矩陣
原始神經網絡對標簽類別1、2、4、6的精確率較高,對標簽類別1、2、7、10的靈敏度較好,但是對標簽類別3、8、9的準確率很差。而優化后的神經網絡對標簽類別1、2、4、7、8、10的精確率較高,對標簽類別1、2、4、8、10的靈敏度較好,但是對標簽類別3、9的準確率很差。通過對圖5的十類軸承狀態對應的特征參數圖進行對比,可見標簽類別3、9的特征比較相像,因此神經網絡對于標簽類別3、9的準確度不是很高。而標簽類別1、2的特征比較明顯,神經網絡對于標簽類別1、2的準確度較高。通過對比預測標簽和真實標簽,可以看出總體上優化后的卷積神經網絡比原始卷積神經網絡的準確率高。
原始方法比優化方法的訓練次數少。但是,在相同的網絡結構下,優化后的卷積神經網絡對于軸承故障分類結果準確度平均約為74.37%,準確度的方差平均約為1×10-4,識別時間平均約為20.3 s,;而原始卷積神經網絡對于軸承故障分類結果準確度平均約為65.57%,準確度的方差平均約為1.9×10-3,識別時間約平均為55.5 s。
綜上所述,雖然原始方法的迭代次數少,但優化方法的準確率更高,所用時間更短,分類結果更加穩定,綜合性能更好。
本文引入信號特征提取,以優化卷積神經網絡,從而對軸承實行故障判別。測驗結果表明:在相同的網絡結構下,優化方法對于軸承故障分類結果準確度平均約為74.37%,準確度的方差平均約為1×10-4,識別時間平均約為20.3 s,;而原始CNN對于軸承故障分類結果準確度平均約為65.57%,準確度的方差平均約為1.9×10-3,識別時間平均約為55.5 s。研究結果證明,相比于原始卷積神經網絡,基于信號特征提取和卷積神經網絡的軸承故障診斷,可以更加快速、精確和穩定地分類不同的軸承故障,綜合性能更佳。