雷高偉,張清華,蘇乃權,邵龍秋
(廣東石油化工學院,廣東省石化裝備故障診斷重點實驗室,廣東茂名 525000)
旋轉機械廣泛應用于石化、冶金、鋼鐵以及軌道交通等領域,滾動軸承是旋轉機械的關鍵部件之一,并且旋轉機械45%~55%故障是由滾動軸承引起的,因此對滾動軸承進行狀態監測和故障診斷有著重要的實際意義。
針對滾動軸承故障診斷,基于振動信號的故障監測也存在一定的缺陷,尤其對于大型復雜的設備,軸承的振動信號相對于設備其他部件如轉軸、設備外殼等振動信號強度一般較弱,很容易被淹沒,特別是在軸承早期輕微故障時,振動信號上并沒有反應,利用聽診棒,卻能聽到軸承運行聲音信號發生異常。另外,振動監測技術需要把振動傳感器放到特定的位置才能得到較為準確有意義的數據,并且振動數據分布會隨著傳感器的位置不同而改變,而聲傳感器可以放在被監測器械外圍方便的地方,且聲學監測對故障信號比振動傳感器更敏感。因此,與基于振動信號的監測方法相比,基于聲學的監測方法具有一定的優勢。聽診已被設備維護工程師使用多年,并被證明是用于檢測軸承和機器運行狀況變化的簡單、有效的方法,幾乎已普及至各工業領域。傳統的聽診方法包括使用改錐、聽棒(銅棒)等?,F在,電子聽診器已成為企業設備巡檢員/點檢員、維護工程師使用的常見的基本檢測儀器。聽診器探針傳聲質量高,與麥克風采集的聲音信號相比,不容易被環境噪聲污染,可以獲得更高的信噪比。在實際中,設備管理檢修人員對軸承進行巡檢時,常常通過聽軸承的運行聲音是否有異來判斷軸承狀態的好壞以及故障類型,該方法簡單易行,而且非常有效。但是該做法對人員要求高,而且不能實現自動化診斷。利用深度卷積神經網絡進行滾動軸承故障診斷,具有“一體化”的特點,即將信號濾波、特征提取、特征分類以及故障識別所有過程集成化處理。因此,本文作者提出一種電子聽診器與深度學習相結合的故障診斷方法。
目前,深度學習被廣泛應用于故障診斷領域,并且取得了顯著的診斷效果。文成林、呂菲亞全面總結了深度學習在故障診斷研究中所使用的算法模型,并提出了“集成創新”、“數據+知識”和“多技術融合”等故障診斷思想。陳保家等利用DBN網絡強大的自動提取特征能力獲取故障信號的特征,然后對故障信號進行傅里葉變換,再利用DBNs進行故障診斷,獲得高達99.7%的正確率。GAN等利用一種基于CNN的兩層分層檢測網絡,檢測軸承的故障類型和故障程度。曲建嶺等提出一種“端到端”具有自適應能力的一維卷積神經網絡故障診斷算法,所搭建的模型在美國凱斯西儲大學(CWRU)滾動軸承數據庫上能夠達到99%以上的正確率,并具有良好的泛化能力識別未知故障情況,具有一定的實用性。HOANG、KANG利用基于二維的卷積神經網絡在CWRU軸承數據集上識別振動圖像,進行故障的檢測和分類。孫文珺等提出一種將去噪自編碼與稀疏自動編碼器相結合的深度神經網絡方法,并在訓練過程中運用“dropout”函數防止過擬合,最終模型的故障診斷能力高于傳統的BP神經網絡。王崇宇等針對汽輪機轉子不平衡與不對中故障,提出一種卷積神經網絡的診斷方法,實現了故障類別、位置以及程度的診斷。EREN提出一種利用一維卷積神經網絡(1D-CNNs)實現軸承故障快速準確檢測的方法。在計算復雜度方面,1D-CNNs的實現使得系統更加高效,在不影響故障檢測精度的前提下,降低了計算復雜度。將深度學習強大的特征提取能力與機械故障大數據的特點相結合,雷亞國等提出了一種新的機械裝備健康監測方法,實現了變工況下不同故障位置不同故障類型的故障診斷問題。為了解決深度學習模型訓練數據不平衡的問題,JIA等提出了一種深度歸一化卷積神經網絡,并在滾動軸承故障診斷中達到較高的準確率。李濤等人提出了一種基于粒子群優化(PSO)算法的自適應 CNN 故障診斷方法,解決了卷積神經網絡(CNN)模型構建缺乏自適應性等問題。
深度卷積神經網絡起源于圖像處理,具有強大的圖像處理能力,是一種二維卷積神經網絡模型。由于聲音信號屬于一維信號,并不適用于直接處理,因此構建一維卷積神經網絡模型,包括三部分,輸入層、特征提取層以及輸出層,其中特征提取層包括卷積層、池化層和全連接層。完整的一維卷積神經網絡如圖1所示。

圖1 一維深度卷積神經網絡模型
卷積層主要用來提取高維特征,對每個卷積中輸出的logits值運用激活函數進行非線性變換。激活函數的作用是將原本線性不可分割的多維特征映射到另一個空間中,從而增強特征的線性可分性。采用ReLU函數作為激活函數,當輸入變量大于零時,其導數恒為1,解決了梯度彌散問題。卷積運算及輸出數學表達式為

(1)
其中:為卷積層輸出;為卷積層輸入;為權值;為偏置;為卷積核大小。
池化層采用降采樣操作,用于提取主要特征和降低維度,可以防止過擬合以及降低計算量。

(2)

全連接層的每一個結點都與上一層的所有結點相連,用來把前邊卷積層提取到的局部特征綜合起來。其數學表達式如式(3):

(3)

Softmax激活函數又稱歸一化指數函數,它能將全連接層網絡輸出的最后一層神經元的每一個數值映射到0~1的一個實數空間,并且使得所有神經元的數值加起來為1,其數學表達式如式(4)所示:

(4)
其中:表示輸出層第個神經元的值;為類別的個數。
文中的數據是利用瑞典斯凱孚公司的TMST3電子聽診器進行聲音信號采集,軸承型號為6309深溝球軸承,運行在同樣轉速2 000 r/min、負載2×10N條件下的運行數據。一共包括5種狀態,分別為正常狀態、內圈損傷、外圈損傷、滾動體受損以及煙灰污染狀態,畫出它們的時域波形,如圖2所示。

圖2 5種不同狀態的軸承聲音信號波形
針對軸承5種不同的狀態,在其穩定運行狀態下,利用電子聽診器采集音頻數據,每種狀態音頻時長為12 s,采樣頻率為32 kHz,把12 s音頻數據以3∶1的比例分成兩段,9 s作為訓練數據,3 s作為模型測試數據,故障樣本數據集見表1。其中訓練數據集采用重疊采樣的數據集增強方法進行處理,每個樣本的長度按照軸承旋轉周期進行截取,長度為960個數據點,重疊長度為480個數據點。測試數據集不采用重疊采樣。重疊采樣過程如圖3所示。

表1 滾動軸承故障樣本數據集

圖3 重疊采樣過程
為了構建具有最佳性能的1D-CNN故障診斷模型,針對模型優化器類型、學習率、卷積層數目、卷積核大小以及每批次處理樣本的數目等參數,通過反復試驗的方法進行參數選擇。
優化器是提高訓練速度的一個重要因素。目前常用的最佳優化器為Adam,并且與B N聯合使用在一定程度上防止過擬合作用。若選擇的學習率過高,會導致損失函數振蕩,難收斂到最優值;相反學習率過低,則訓練效率低,達到收斂所需要的時間較長。在實驗過程中設置Adam的學習率為0.1、0.01、0.001、0.001 2、0.000 1,在相同數據集下保持其他參數不變,進行200次迭代,得到的結果記錄見表2。

表2 不同學習率下訓練記錄
從表2可以看出:學習率為0.1、0.01較高時,訓練的正確率偏低,而且訓練過程顯示損失函數處于較高值,且反復振蕩,200次迭代都沒有收斂的趨勢;而當學習率為0.000 1時,訓練平均正確率能達到98.3%的高值,但是在訓練過程中其正確率提升的速度較慢,并且可能會陷入局部最優的情況,因此綜合考慮選擇學習率為0.001 2。雖然0.001和0.001 2的正確率相差不遠,速度也差不多,但是訓練過程中發現0.001 2的訓練正確率更穩定出現98.9%附近的數值,損失函數值的震蕩更小。
嚴格來說卷積層數不屬于超參數,但是對模型有著重要的影響,所以放在這里和超參數一起討論。卷積層數決定了網絡模型的深度,一定程度上模型深度越深越能充分地提取高維非線性特征,但是層數過多會導致參數過多影響訓練的速度,同時增加過擬合的風險。另外,針對不同的對象及任務,卷積層數也不同,因此需要選擇合適的卷積層數。卷積核的作用主要用來提取特征,一般來說核的數量越多,特征提取越充分,并且隨著模型深度的增加,卷積核的數量倍增。而卷積核的大小則選擇比較常用的兩種3×1和5×1進行實驗,實驗結果見表3。

表3 不同卷積層數、卷積核個數實驗記錄
綜合考慮此數據集訓練得到的卷積層數、卷積核尺寸、準確率以及訓練時間,最終的模型卷積層層數為4層,每層卷積核個數分別為16、32、64、128,卷積核尺寸為5×1。
Batch_Size的值太小,會造成模型訓練時間長,收斂速度慢甚至無法收斂;若Batch_Size的值過大,首先顯存可能無法支撐,其次會造成迭代次數變少而使得參數修正變得緩慢。通過設計不同大小的Batch_Size量來訓練模型,并將結果記錄在表4。

表4 批量處理量對模型判準率的影響
從表4可以看出:Batch_Size的值為16時,雖然正確率高,但訓練模型所需要花費的時間太長;Batch_Size的值為512時,雖然訓練時間短,但正確率低。綜合訓練時間效率以及性能方面考慮,確定1D-CNN故障診斷模型批量處理量為128。
經過前面的實驗,最終確定1D-CNN的模型參數如表5所示。

表5 1D-CNN故障診斷模型參數
確定最后模型之后,利用表1中的數據集進行模型測試,得到的準確率曲線如圖4所示。

圖4 1D-CNN模型訓練正確率曲線
深度學習一直被說成是一個黑匣子。為了更直觀地理解模型的工作過程,利用可視化工具t-SNE對分類過程進行可視化。t-SNE是在SNE(Stochastic Neighbor Embedding)的基礎上發展而來,由Geoffrey HINTON等于2008年提出,是目前最理想的一種降維機器學習算法,可將高維數據降到2維或3維進行可視化,為實現可視化帶來了極大的方便。分類過程可視化結果如圖5所示。
從圖5可以直觀地看到:原始數據全部混和聚集在一起無法分開,隨著不同類別的數據隨著模型深度的增加,從不同卷積層輸出的結果逐漸被分開,到全連接層輸出的結果幾乎完全分開,這說明了模型的有效性以及網絡深度的必要性。

圖5 1D-CNN分類過程可視化
針對滾動軸承的故障診斷,提出一種基于電子聽診器與深度學習的故障診斷方法,利用深度卷積神經網絡進行滾動軸承故障診斷,可以直接作用于時域信號,實現“端到端”的學習,具有“一體化”的特點,即將信號濾波、特征提取、特征分類以及故障識別所有過程集成化處理;和傳統采集聲音信號利用麥克風不同,采用的是電子聽診器,利用電子聽診器采集的聲音信號不容易被周圍噪聲污染,得到的信號信噪比更高,不需要去噪處理。