趙志宏, 李春秀, 竇廣鑒, 楊紹普
(1. 石家莊鐵道大學 信息科學與技術學院,石家莊 050043; 2. 石家莊鐵道大學 省部共建交通工程結構力學行為與系統安全國家重點實驗室,石家莊 050043)
智能生產的發展加強了對早期故障診斷的需要,在機械設備中滾動軸承的運行狀態往往直接影響機器能否正常工作。因此,精確的檢測和診斷軸承的狀態對于機械設備安全運行占有重要地位[1]。
一直以來,研究者提出多種故障診斷算法對軸承故障進行分類。Cai等[2]提出了能夠進行診斷的面向對象貝葉斯網絡復雜系統。Dong等[3]使用k-最近鄰方法來完成軸承的故障診斷。Konar等[4]通過小波去噪對原始信號進行處理并提取特征,然后采用支持向量機進行軸承故障診斷。張鈺等[5]從軸承振動信號中提取時域統計指標作為特征向量,然后利用隨機森林進行診斷。這些方法不能直接從原始信號中提取特征,因此,研究直接從軸承振動信號中提取特征并自動識別軸承健康狀態的診斷方法具有重要的研究價值。
近年來,深度學習(deep learning,DL)方法受到研究者的關注,DL方法克服了無法從大量數據中自動提取故障特征的難題,許多DL模型已被應用于故障診斷并取得良好的效果。曲建嶺等[6]提出基于端到端的自適應一維卷積神經網絡(convolutional neural network,CNN)模型來實現軸承故障診斷。趙敬嬌等[7]提出一種基于雙向長短期記憶網絡(BiLSTM)的診斷模型,通過BiLSTM自動提取軸承原始振動信號特征,從而實現軸承故障診斷。張西寧等[8]提出一種具有復雜特征提取能力的深度卷積自編碼器,以原信號和重構信號差值最小為目標,通過對卷積核優化和樣本微調達到良好的故障診斷效果。
一維CNN在檢測信號局部相關性存在不足,Wu等[9]通過卷積神經網絡中一維信號輸入與二維信號輸入的分類性能進行對比,得到二維信號有更高的分類精度和魯棒性。因此,將一維振動信號轉換為二維圖像進行軸承故障診斷得到研究者的重視。Wen等[10]提出將振動信號轉換為二維灰度矩陣然后進行故障診斷。李恒等[11]將振動信號進行短時傅里葉變換得到時頻譜,然后輸入卷積神經網絡進行故障診斷。袁建虎等[12]利用復Morlet小波將軸承振動信號轉換為二維時頻圖像后進行故障診斷。上述方法忽略了振動信號不同時間間隔內信息的相關性,不能很好地體現信號之間的長期依賴關系。
馬爾可夫變遷場(Markov transition field,MTF)利用馬爾可夫轉移概率來保留時域之間的信息關系[13]。首先,通過對振動信號的值域進行劃分,并計算劃分后值域之間的轉移概率;然后,按照振動信號采樣點的順序,通過當前采樣點所在值域和下一采樣點所在值域之間的轉移概率得到MTF矩陣,從而保留了振動信號的時間依賴關系和頻率特征。基于此,本文提出一種基于MTF-CNN的軸承故障診斷方法,利用MTF對軸承振動信號進行編碼生成二維圖像,之后將其輸入到CNN實現故障特征的提取,進而實現故障診斷,通過與其他幾種關于振動信號編碼方式的對比,本文模型可以更有效的提取軸承故障特征,得到更好的故障診斷效果。
MTF可將振動信號轉換成二維圖像,主要通過構造MTF矩陣來保留信號時域中的信息。其編碼過程如下:
步驟1將軸承振動信號以N個采樣點為一組進行劃分;
步驟2對劃分的采樣點進行序列標注,序列記為Xi(0
步驟3根據馬爾可夫鏈原理[14]計算振動點所在的值域qj之間的轉移概率,以此構造一個Q×Q加權鄰接矩陣W,其元素Wij的值由值域qi中的所有振動點轉移到值域qj中的概率給出
(1)
步驟4為了很好地顯示時間序列特征,按照振動點的順序來構建一個N×N的MTF矩陣,MTF中的mij表示xi所在的值域qi到xj所在的值域qj的轉移概率。
(2)
為了使MTF編碼圖像更好地突出信息特征,采用像素平均法來改變圖像的大小。將長度為64的軸承振動信號編碼為不同圖像大小的過程,如圖1所示。由圖1可知,采用像素平均法對圖像進行壓縮可以略去微小的信息差異,更好地突出數據之間的規律性。

圖1 MTF編碼圖Fig.1 MTF coding diagram
卷積神經網絡是DL的一個重要分支,CNN由具有可學習的權重和偏置常量的神經元組成,是一種前饋神經網絡,它主要由卷積層、池化層和全連接層組成。Zhao等[15]提出了由一個卷積層和一個池化層組成局部特征學習塊來收集輸入數據的局部相關性。通過卷積層和池化層的疊加來提取輸入數據特征并減少網絡參數,提高網絡性能。其中:卷積層通過卷積核按照指定的步長對輸入的數據進行局部特征的提取;通過池化層對輸入數據進行降維,減少網絡參數量并降低復雜度,減少冗余特征[16]。
為了更好地比較MTF的性能 ,本文采用基本的CNN模型結構。具體的模型結構如圖2所示,圖2由Conv1、Pool1、Conv2、Pool2、FC1、FC2組成,利用全連接層進行分類,輸入圖像的大小為32×32,通道數為3,激活函數使用softmax函數[17],并使用交叉熵損失函數計算故障預測概率分布和真實故障概率分布之間的距離,具體的網絡參數如表1所示。

圖2 模型結構圖Fig.2 Model structure diagram

表1 網絡參數Tab.1 Network parameters
基于MTF編碼方式和CNN網絡的軸承故障診斷模型可直接從原始振動信號中提取特征。首先,進行振動信號MTF編碼生成二維圖像;然后,建立CNN模型,通過輸入圖像進行訓練。基于MTF-CNN的軸承故障診斷方法的具體步驟為:
步驟1按照一定的數據長度對軸承振動信號進行劃分,并劃分訓練數據集和測試數據集;
步驟2將劃分好的數據按照MTF編碼方式編碼為二維圖像;
步驟3將轉換的圖像作為特征圖輸入構建好的卷積網絡模型中并對參數調優,使其能夠提取故障特征信息;
步驟4通過Softmax分類器將其與故障類型建立映射關系實現故障診斷。
試驗采用凱斯西儲大學軸承數據集[18]對MTF-CNN模型進行驗證,選取6205-2RS JEM SKF型號的DE驅動端軸承數據,采樣頻率是12 kHz,故障直徑為0.177 8 mm,故障類型包括內圈故障、滾動體故障以及外圈故障,試驗數據樣本構造如表2所示,其中數據集A是轉速為1 797 r/min的4類軸承數據,數據集B是轉速為1 772 r/min的4類軸承數據,數據集C是轉速為1 750 r/min的4類軸承數據。

表2 軸承數據集Tab.2 Bearing dataset
對數據進行MTF編碼前需要將振動信號按一定的長度進行劃分,MTF編碼圖的矩陣行數和列數的選擇依據是:一方面可以充分提取振動信號中的特征信息;另一方面便于后續處理,MTF編碼過程中使用步長為2的像素平均法,因此行數和列數選取2的冪次大小。綜合考慮之后,本文矩陣行數和列數的大小設置為512。在試驗中,每一類故障構造300個樣本,按照8∶2的比例進行訓練集和測試集劃分,劃分后分別為不同軸承故障類型標簽進行One-hot 編碼[19]。
根據MTF編碼原理可知,數據長度的選取對編碼圖像有一定的影響,這里研究不同數據長度對故障識別率的影響。試驗數據采用表2的數據集A,按照128,256,512和1 024不同的長度對軸承信號進行MTF編碼,然后采用CNN進行故障診斷。設置學習率為0.001,試驗結果如圖3所示。由圖3可知:當數據長度為128時,故障診斷準確率較低,這是因為振動信號采樣點太少,不能很好地反映故障特征;隨著數據長度的增加,模型的診斷準確率上升,當數據長度為512時,故障診斷準確率最高,達到99.11%;當數據長度增加到1 024時,模型的準確率又有所降低,這是因為MTF編碼是以振動信號數值劃分的值域之間的轉移概率來進行編碼。所以當數據長度過大時,轉移概率值的相似度會越來越高,降低了不同特征數據之間的區分性。試驗結果表明,在不采用像素平均法改變MTF矩陣大小的前提下,數據長度為512的MTF編碼效果最好。

圖3 不同數據長度對故障識別率的影響Fig.3 Influence of different data length on fault recognition rate
當數據長度為512時,生成的MTF圖像大小為512×512,使用像素平均法將圖像縮小為256×256,2種不同大小的圖像如圖4所示,以故障直徑為0.177 8 mm的3種故障類型和正常信號為例,圖4(a)所示圖像大小為512×512,圖4(b)所示圖像大小為256×256,從
圖4中可知,兩組圖像的4種特征都比較明顯,但是圖4(b)中4種類型之間的差異性更大,更容易進行軸承類別區分。對比圖4(a)與圖4(b)可以看出,經過像素平均值改變圖像大小后,其故障特征規律性更明顯。

圖4 數據長度512的MTF軸承編碼圖Fig.4 MTF bearing coding diagram with data length 512
對圖像大小為256×256的數據集進行故障診斷試驗,得到的分類混淆矩陣如圖5所示。圖5中:0~3分別表示軸承的4種類別;對角線上深色區域數值是每類故障的準確率;其余部分的數值為誤分類率。從圖5可知,每一類故障識別準確率都達到100%。

圖5 分類混淆矩陣Fig.5 Classification confusion matrix
進一步分析卷積神經網絡對MTF編碼圖的特征提取與故障識別能力,模型訓練過程中的準確率和損失率曲線,如圖6所示。從圖6中可知,收斂速度很快,30代之后便趨于穩定狀態。訓練集和測試集的準確率都達到100%,損失率呈下降趨勢直至趨于0,模型學習效果比較好。

圖6 數據長度為512模型準確率及損失率曲線Fig.6 Accuracy and loss rate curve with data length of 512
進一步研究圖像大小對模型準確率的影響,對128,256,512和1 024等4種不同的數據長度進行試驗研究,試驗結果如表3所示。由表3可知,采用像素平均法壓縮圖像的大小后,模型的診斷準確率均得到提升。當數據長度為1 024時,生成的MTF圖像大小為1 024×1 024,模型的準確率為97.76%;采用像素平均后,圖像大小為512×512,模型的準確率提高到99.1%;再次采用像素平均進行圖像壓縮,圖像大小為256×256,模型準確率得到99.55%;進一步像素平均后,圖像大小為128×128,此時模型的診斷準確率為100%。試驗結果表明,MTF編碼圖經過像素平均壓縮圖像大小后可以得到更好的故障診斷效果。其中數據長度為512,圖像大小為256×256和數據長度為1 024,圖像大小為128×128得到的故障診斷正確率最好。

表3 不同圖像大小的模型準確率Tab.3 Model accuracy of different image sizes 單位:%
為了進一步驗證軸承振動信號MTF編碼的模型診斷效果,與其他振動信號圖像編碼方式進行比較試驗。軸承振動信號編碼為二維圖像的方式主要有格拉姆角場(GAF)和遞歸圖,其中格拉姆角場包括格拉姆角和場(GASF)和格拉姆角差場(GADF)2種。文獻[20]的研究結果表明,數據長度為300的GADF編碼效果最好。為了便于比較,同樣設置長度為300對軸承數據進行劃分,之后將不同方式編碼后的圖像作為特征圖輸入卷積神經網絡進行特征提取與分類,得到的試驗結果如圖7所示。由圖7可知,MTF編碼的故障識別效果最好,GADF編碼方式也得到較高的故障診斷率,遞歸圖效果相對較差。試驗結果表明,與其他編碼方式相比MTF具有更好的軸承故障特征提取能力。

圖7 不同圖像編碼方式對比Fig.7 Comparison of different image coding methods
為了驗證該模型在不同載荷條件下的診斷效果,將表1中不同的數據集分別作訓練集和測試集來對模型的泛化能力進行驗證,試驗A→B代表在A數據集上進行訓練,B數據集上進行測試。分別對數據長度1 024圖像大小為128和數據長度512圖像大小為256這兩組圖像數據進行泛化試驗,試驗結果如圖8所示。由圖8可知,兩組試驗都取得了較高的準確率,診斷識別率都達到了98%以上,表明本文模型有較好的泛化能力。

圖8 載荷改變時故障識別率Fig.8 Fault recognition accuracy when the load changes
本文提出一種基于MTF-CNN的軸承故障診斷方法并進行了試驗研究,從中可以得到以下結論:
(1) 正常軸承、內圈故障、外圈故障、滾動體故障的MTF編碼有明顯不同,從軸承振動信號的MTF編碼圖像中可以有效提取故障特征信息。
(2) MTF編碼圖的數據長度和圖像大小對軸承故障診斷效果影響比較大,需要根據應用的不同場合確定合適的數據長度和圖像大小。
(3) 通過與其他編碼方式進行比較試驗,結果表明,MTF編碼方式在軸承故障診斷中的準確率高于GAF和遞歸圖編碼方式。
(4) 為了驗證模型的泛化性能,選用不同載荷的數據作為訓練集和測試集進行試驗。結果表明,該模型在載荷發生改變時,依舊取得了較高的試驗準確率,具有較好的泛化能力。