尹文哲,夏虹,彭彬森,朱少民,王志超
1.哈爾濱工程大學 核安全與先進核能技術工信部重點實驗室,黑龍江 哈爾濱 150001 2.哈爾濱工程大學 核安全與仿真技術國防重點學科實驗室,黑龍江 哈爾濱 150001
在核電廠中存在諸多旋轉設備,如電機、泵、風機、汽輪機等,它們在核動力系統中扮演著重要的角色,而滾動軸承是旋轉設備中最常用的部件之一,其對旋轉設備完成預定功能起著至關重要的作用。但由于設計、制造、安裝、工況等多方面因素,滾動軸承也是最常出現故障的部件之一。為確保核動力系統安全穩定運行,對滾動軸承進行有效的故障診斷十分必要。
目前最常用的滾動軸承故障診斷方法是振動分析法,即利用滾動軸承的振動信號進行故障診斷。針對該方法的研究主要集中在特征提取和模式識別2 個方面:首先利用信號處理方法,如小波變換[1]、希爾伯特-黃變換[2]、局部均值分解[3]、變分模態分解[4]等,提取原始振動數據的相關特征,并構建特征向量;然后利用機器學習算法,如貝葉斯分類器[5]、支持向量機[6]、神經網絡[7]等,對特征向量進行模式識別。雖然傳統的滾動軸承故障診斷方法已取得一定的效果,但其診斷模型表達能力有限,且較依賴于信號處理技術和專家經驗。
近年來,深度學習已成為學術研究熱點,為了增強故障診斷模型的表達能力,擺脫對專家經驗的過度依賴,學者們開始研究將深度學習模型應用到滾動軸承故障診斷中,以追求更加良好的診斷效果。其中,研究最多的深度學習模型是卷積神經網絡。卷積神經網絡是一種監督學習算法,廣泛應用于模式識別領域。目前,一般是將原始振動信號處理變換成時域圖像、頻域圖像或時頻圖像,然后用卷積神經網絡對這些圖像進行診斷識別故障類型。HAN 等[8]將滾動軸承振動信號轉換成時域圖像,對圖像進行相關處理后將其作為卷積神經網絡的輸入,以實現對軸承故障類別的判定。李恒等[9]對原始振動信號進行短時傅里葉變換,構造時頻圖樣本,并將其作為卷積神經網絡的輸入,完成故障識別。袁建虎等[10]對軸承振動信號進行連續小波變換,得到相關時頻圖,作為卷積神經網絡的輸入。許理等[11]對采集的軸承信號進行小波包時頻分析,得到各類信號的時頻圖,然后與卷積神經網絡相結合進行故障診斷。然而,以時域圖像或頻域圖像作為輸入的卷積神經網絡診斷效果有限,采用時頻圖像作為輸入,診斷效果雖然得到一定的提升,但一般需要對相關預定義參數,如基函數、窗函數、窗口大小等參數進行合適地選擇才能得到較好的效果,對專家經驗具有一定的依賴性。
針對上述問題,本文提出一種基于快速傅里葉變換(FFT)和卷積神經網絡(CNN)的滾動軸承故障診斷方法。該方法在信號處理過程中不需要設定相關預定義參數,對原始振動信號進行快速傅里葉變換后,將得到一維數據轉換為二維的特征圖作為ResNet-18 網絡的輸入,對不同故障類型和故障程度的滾動軸承進行診斷識別。
快速傅里葉變換是快速計算序列的離散傅里葉 變換(discrete Fourier transform, DFT)或其逆變換的方法。傅里葉分析能夠將信號從原始域(通常是時間或空間)轉換到頻域中進行表示,對于序列x(n)={x0,x1,···,xN-1},0 ≤n<N的離散傅里葉變換表達式為

式中:e為自然對數的底數;i為虛數單位;k=0,1,···,N-1。
FFT 通過將DFT 矩陣分解為稀疏因子之積來快速計算此類變換,因此它能夠計算DFT 的復雜度,將用DFT 定義計算需要的O(n2)降低到O(nlogn)。
卷積神經網絡是深度學習的代表算法之一,它是一類包含卷積計算的前饋深度神經網絡。CNN 在如文本識別、語音識別、故障診斷等識別領域有著廣泛的應用。典型的卷積神經網絡主要由輸入層、卷積層、池化層、全連接層以及輸出層構成。其中,卷積層以及池化層屬于濾波級,用于對輸入信號進行深度特征提取;全連接層屬于分類級,用于對得到的特征向量進行分類判斷。

在卷積神經網絡中,卷積層可以有效地對圖像進行特征提取,它具有權值共享、局部連接的特點,即使用若干個卷積核對原始輸入數據按照一定的步長進行局部滑動卷積計算,從而實現對輸入數據的特征提取,因而可以利用較低的計算成本得到較好的提取效果。卷積操作過程的數學表示如下:池化層也稱下采樣層,主要是通過采樣的方法來減小特征的空間尺寸。目前比較常用的2 種池化方法是平均池化和最大池化,兩者分別是用一定寬度的窗口以一定的步長在得到的特征圖上滑動,求取該窗口內特征值的均值或最大值。本文選用的池化方法是最大池化法,可降低參數數目,提高特征的魯棒性。
在經過前面一系列的卷積操作和采樣操作后,會連接一個或多個全連接層,用于整合通過卷積層和采樣層提取出的局部信息,然后將這些局部信息輸入到Softmax 分類器中進行故障分類。Softmax 分類器實質上是邏輯回歸二分類器的演化,它在多分類場景中應用較為廣泛,通過將多分類問題映射為概率分布以實現分類決策。
由于卷積層、池化層和全連接層都是線性計算,為彌補線性模型表達能力的不足,通常會引入激活函數進行非線性操作,使得整個網絡的非線性表達能力增強,挖掘出信號背后的潛藏特征,提升網絡在非線性場景下的分類能力。常用的激活函數有Sigmoid 函數、tanh 函數以及Relu函數。本文使用的激活函數是Relu 函數,它能夠避免神經網絡出現梯度消失的問題,并且收斂速度快。
本文的故障診斷流程如圖1 所示,首先對原始振動信號進行信號處理,再將處理后的信號按一定比例隨機分為訓練集和測試集;然后采用交叉熵函數作為損失函數,并使用Adam 方法對卷積神經網絡模型進行訓練;最后使用測試集對訓練好的模型進行測試,驗證模型的泛化性能。

圖1 故障診斷流程
在信號處理過程中,首先將原始振動信號等分成若干個數據段,假設每段序列表示為y(N)={y1,y2,···,yk,···,ym×n},其中m、n為正整數,1 ≤N≤m×n;接著,對y(N)進行快速傅里葉變換,并求其模值,即可得到變換后的數據序列Y(N)={Y1,Y2,···,Yk,···,Ym×n};最后,將序列Y(N)按如圖2 所示方式轉換成m×n的二維矩陣,構成特征圖,作為卷積神經網絡的輸入。

圖2 轉換方式
這種數據預處理方法直接有效,且處理速度快。更重要的是,相比于一些時頻分析方法,如小波變換(wavelet transform, WT)需要選擇合適的基函數、短時傅里葉變換(short time Fourier transform,STFT)需要選擇合適的窗函數以及窗口大小等,該方法不需要設定相關預定義參數,直接進行計算,擺脫了對專家經驗的過度依賴。在本文中,分割1 024 個數據點作為一個數據段,對每一數據段采用上述信號處理方法,將其構成大小為32 ×32 的特征圖。
本文所采用卷積神經網絡是ResNet-18 網絡,它是經典卷積神經網絡之一。ResNet 網絡的特點是其存在著大量殘差模塊,這些殘差模塊包含著恒等映射層,其能使網絡隨著深度的增加而不會產生權重衰減和梯度衰減或消失等問題。ResNet-18 網絡結構如圖3 所示,包含一系列卷積層、恒等映射、Relu 激活函數、批量標準化、全局均值池化、全連接層等。

圖3 ResNet-18 網絡結構
圖3 中“Conv 3× 3”指的是長為3、寬為3 的卷積核;64、128、256、512 表示的是卷積核的個數;“/2”指的是卷積核的步長設置為2,可實現特征圖的長寬減半;Relu 是激活函數;BN 是批量標準化;GAP 是全局均值化;Max Pool 是最大值池化,其窗口大小為2 ×2;FC 是全連接層。
實驗所采用的數據來自美國凱斯西儲大學的公開軸承實驗數據,其實驗臺架如圖4 所示。本文采用的數據包含正常運行狀態數據、3 種外圈故障數據、3 種內圈故障數據以及3 種滾動體故障數據,共10 種狀態運行數據,實驗樣本信息如表1 所示,采樣頻率為12 kHz。每種數據的樣本數目為100,每個樣本有1 024 個數據點,共計1 000個樣本。將全部樣本經過如前所述的處理變換后,從中隨機抽取700 個樣本作為訓練集,另外300 個樣本作為測試集。

圖4 軸承實驗臺架

表1 故障樣本信息
在本實驗中,需要進行設定的卷積神經網絡超參數為批量大小m、學習速率α以及迭代次數N。為保證網絡具有較好的分類效果,本文通過對m、α以及N進行組合對比試驗,以得到良好的超參數組合。選擇常用的m值以及α值作為可選值(m可選值為32、64、128,α可選值為0.01、0.001、0.000 1),得到9 種組合,每種組合迭代次數為10 次。用已準備好的訓練集對不同超參數設置的神經網絡模型分別進行訓練,訓練完成后,用測試集進行測試。為避免實驗的偶然性,對每種組合進行10 次訓練和測試,將得到的10 次測試準確率結果去除最大、最小值后取均值,即為平均測試準確率,實驗結果如圖5 所示。

圖5 超參數設置結果
當學習速率α=0.01 時,由于學習速率過大,出現了梯度彌散現象;當學習速率α=0.001 時,平均測試準確率最大值為100%,此時批量大小m=32;當學習速率α=0.000 1 時,平均測試準確率最大值為100%,此時批量大小m=32 或m=64。而在平均測試準確率為100%的3 種超參數組合中,α=0.000 1、m=32 組合收斂速度最快。綜上,本文采用學習速率α為0.000 1、批量大小m為32、迭代次數N為10 的超參數組合進行正式的訓練和測試。
用已準備好的訓練集數據對ResNet-18 模型進行訓練,訓練完成后用測試集數據對模型進行測試。在迭代過程中的平均測試準確率結果如圖6 所示。

圖6 本文方法結果
可以看出,本文所提出的故障診斷方法對于多種滾動軸承故障具有極好的分類效果,平均測試準確率可達100%,診斷效果優良,證明了本文所提出的滾動軸承故障診斷方法的可行性與有效性。
為凸顯本文診斷方法的優越性,將原始振動信號分別處理成時域圖像、頻域圖像、經過STFT 變換的時頻圖像以及經過WT 變換的時頻圖像,且圖像均先經過灰度化處理,再對每個像素點值進行歸一化,然后作為ResNet-18 網絡的輸入,進行對比分析,其結果如圖7 和表2 所示。

圖7 不同方法平均測試準確率變化趨勢

表2 平均測試準確率結果
通過對比實驗可知:輸入形式為本文特征圖的卷積神經網絡分類效果最佳,其平均測試準確率達到100%;其次是2 種時頻圖像以及頻域圖像,平均測試準確率分別為99.34%、97.34%、96.86%;最差的是時域圖像,平均測試準確率為63.78%。相對于其他幾種輸入形式,本文的特征圖能夠更好地表現出信號的特征,當其作為卷積神經網絡的輸入時,更有利于卷積神經網絡進行識別分類。此外,相對于2 種時頻圖像,本文方法不僅測試準確率更高、收斂速度更快,而且不需要設定相關預定義參數,如基函數、窗函數、窗口大小等,擺脫了對專家經驗的過度依賴。
本文提出了一種基于快速傅里葉變換和卷積神經網絡的滾動軸承故障診斷方法。對原始振動信號進行相關處理得到特征圖,將其作為CNN 的輸入進行學習訓練,并通過超參數尋優使得模型具有較好的診斷效果。實驗結果表明,提出的診斷方法對于多類滾動軸承故障的識別準確率高,診斷效果良好;通過與不同的輸入形式進行對比分析,本文方法的診斷準確率更高,收斂速度更快,并且在本文方法的信號處理過程中不需要設定相關預定義參數,可直接進行計算。