








摘" 要: 針對自動扶梯滾動軸承故障診斷模型診斷識別率不高的問題,提出一種CNN與Transformer相結合的滾動軸承故障診斷方法。該方法采用CNN注意力和Transformer時域注意力融合機制,從信號的通道和時域兩個維度提取最有利于識別的特征信息,降低信道和噪聲等影響。根據特征信息的重要程度進行權重分配,以提升故障識別率。基于滾動軸承數據集,將所提算法模型和CNN、RNN、SVM算法進行對比。結果表明,該方法識別軸承故障的準確度更高,實現了對軸承故障的準確分類。
關鍵詞: CNN?Transformer; 自動扶梯; 滾動軸承故障診斷; 特征信息提取; 卷積神經網絡; 混淆矩陣
中圖分類號: TN911.23?34; TP277; TH133.33" " " " " " "文獻標識碼: A" " " " " 文章編號: 1004?373X(2024)16?0001?06
Research on escalator bearing fault diagnosis method based on CNN?Transformer model
DUAN Yibo1, HUANG Min1, WANG Shuai2, LIU Yue1
(1. School of Mechanical Electrical Engineering, Beijing Information Science amp; Technology University, Beijing 100192, China;
2. Beijing Dynaflow Lab Solutions Co., Ltd., Beijing 100160, China)
Abstract: In allusion to the problem of low diagnostic recognition rate of escalator rolling bearing fault diagnosis model, a" method of rolling bearing fault diagnosis combining CNN and Transformer is proposed. In the method, the fusion mechanism of CNN attention and Transformer time?domain attention is used to extract the feature information most conducive to recognition from both channel and time?domain dimensions of the signal, reduce the influences of channel and noise, etc. The weights are assigned according to the importance of the feature information to improve the fault recognition rate. Based on the rolling bearing dataset, the proposed algorithm model is compared with CNN, RNN, and SVM algorithms, and the results show that the method can identify bearing faults with higher accuracy, realizing the accurate classification of bearing faults.
Keywords: CNN?Transformer; escalator; fault diagnosis of rolling bearing; feature information extraction; convolutional neural network; confusion matrix
0" 引" 言
隨著城市化進程的推進,現代生活中自動扶梯的數量逐年增加。與此同時,老舊扶梯的故障和安全問題也日益引起人們的關注。這些老舊扶梯經過多年的使用,機械部件可能出現磨損、老化等問題,導致運行不穩定、噪聲增大甚至發生故障。此外,由于一些老舊扶梯的維護保養不及時或不規范,安全隱患也逐漸顯現。然而,例行的定期檢查和監管往往難以發現其內部存在的潛在問題,例如電氣系統故障、機械部件的磨損和松動、控制系統硬件損壞、曳引鏈條或鋼絲繩斷裂等[1]。這些故障如若發現不及時,勢必會對自動扶梯乘坐人員的安全造成威脅,同時也會增加扶梯的維護成本并縮短其使用壽命。為及時發現上述故障并減少隱患,通常需要進行定期檢查和維護保養。然而,這種方法存在諸多問題,例如目的性不強、效率低下、成本高昂以及自動化程度不高等[2]。
隨著機器學習技術的飛速發展,研究者們開始探索并應用多種機器學習方法,如支持向量機(SVM)、人工神經網絡(ANN)等來深度挖掘軸承故障數據中的隱藏信息。相較于傳統的數據處理和分析方法,這些機器學習方法顯著降低了構建預測模型的難度,使得模型更加簡潔高效,預測精度也得到了顯著提升,為故障預警和預測提供了更為準確的依據。然而,這些模型無法捕獲和理解故障信號數據之間的內在關聯性,仍存在一定的局限性。
軸承信號數據本質上是一種時間序列,研究人員們嘗試使用卷積神經網絡(Convolutional Neural Network, CNN)來進行故障信號預測,提高深度神經網絡的檢測精度。梁敏健等引入卷積核的一維卷積神經網絡,構建了自動扶梯機械故障的自動分類模型,實現對自動扶梯的機械故障的快速自動診斷[3]。段潔利等提出了一種一維端對端輕量化CNN檢測方法,即1D?MRL?CNN,直接對采集到的一維振動信號進行檢測,實現了對滾動軸承的快速診斷[4]。Wen L等將信號轉換為二維圖像,運用CNN處理二維圖像,有助于消除手工特征的干擾[5]。在多個數據集上,這種方法表現出較好的性能。
針對傳統CNN訓練過程中需要大量數據樣本和泛化能力不高的問題,研究人員采用長短期記憶(LSTM)網絡對這些問題進行了優化,從而在長時間序列預測中實現了比以往更高的預測精度。魏永合等提出基于CNN?LSTM?Attention的模型診斷滾動軸承信號,相較于傳統的CNN,該模型提高了故障診斷的準確率[6]。然而,LSTM的并行運算能力較弱,在處理大規模數據時會面臨計算效率低下的問題;同時,它很難準確地分配權重給重要的信息,導致模型無法充分捕捉到關鍵特征,影響預測精度。ResNet是作為一種殘差結構被提出的,它可以緩解由網絡深化引起的梯度消失和梯度爆炸狀態[7],并且使卷積神經網絡能夠通過加深網絡層的數量來獲得更好的性能。以前的研究選擇構建更深的卷積神經網絡,以提高模型的魯棒性,但相應的模型參數數量急劇增加。此外,訓練需要大規模的數據集,模型的訓練難度和訓練時間也大幅增加。
以上模型的故障診斷在強噪聲環境下,通常會表現出較差的泛化能力,而在不平衡數據集下容易發生過擬合現象,限制模型診斷性能的提升[8]。為了解決該問題,本文基于一個統一的輕量級分類框架,設計一種基于CNN和Transformer的滾動軸承故障診斷方法。本文根據特征的重要程度進行權重分配,在滾動軸承數據集上進行測試,并將該方法與其他方法進行比較,驗證所提方法的有效性。
1" 算法模型
本文提出的網絡結構模型主要包含CNN網絡模型和Transformer網絡模型兩部分。該整合模型能夠通過獲取特征數據的局部信息和全局特征,對軸承故障信號進行準確區分和判別[9]。
1.1" 卷積神經網絡模型
卷積神經網絡(CNN)由Yann LeCun提出,是多層感知機(MLP)的變形,它是一種前饋型神經網絡,受生物自然視覺認知機制啟發而來的[10]。CNN減少了網絡模型的復雜度和權值的數量。卷積神經網絡包含卷積層、池化層和全連接層三種主要結構,這些層可以進行疊加,形成一個完整的CNN模型。
1.1.1" 卷積層
卷積層是CNN的核心,它對輸入層進行卷積操作,提取圖像特征。卷積層由一個個的卷積核組成,每個卷積核都可以看作是一個小型神經網絡,具有一組可學習的參數。在卷積過程中,每個卷積核按照一定的步長(Stride)在輸入數據上滑動,并對每個滑動位置進行卷積運算,輸出一個二維的激活圖(Feature Map)。卷積層的作用是通過卷積運算對輸入數據進行特征提取,以便后續的層能夠更好地處理這些特征信息。卷積層l的第j單元的輸出值[alj]可以通過公式(1)計算得出。
[alj=fblj+i∈Mlj al-1i·klij] (1)
式中:[Mlj]表示選擇的輸入特征圖的集合;[klij]表示可學習的卷積核[11]。
1.1.2" 池化層
池化層用于減小輸入數據的空間尺寸,同時保留重要的特征信息。池化層通常跟在卷積層之后,可以有效地減少網絡參數和計算量,提高模型的計算效率和泛化能力。池化層的主要作用是對輸入的特征圖進行壓縮,一方面使特征圖變小,簡化網絡計算復雜度;另一方面進行特征壓縮,提取主要特征[12]。
1.1.3" 全連接層
在經過卷積和池化后,全連接層會選擇ReLU(Rectified Linear Unit)作為激活函數。ReLU函數的優點是計算簡單且具有非線性特性,能夠更好地捕捉輸入數據的非線性關系。在多分類任務中,全連接層通常會結合Softmax函數完成最終的分類。Softmax函數可以將神經網絡的輸出轉化為概率分布,使得每個類別的預測概率相加等于1。通過與上一層的神經元相連接,并結合適當的激活函數,能夠整合特征信息并實現多任務分類[13]。
1.2" Transformer模型
1.2.1" 注意力機制
Transformer模型采用了自注意力機制,可以并行計算序列中所有元素之間的關系。這使得Transformer模型在計算效率和長距離依賴捕捉能力方面具有明顯優勢。自注意力(Self?Attention)機制是一種計算序列中元素之間關系的方法。對于每個元素,自注意力機制計算其與其他元素的相關性,并根據這些相關性對元素進行加權求和,使得模型能夠捕捉序列中的長距離依賴關系[14]。
在自注意力機制中,輸入序列中的每個位置都會計算權重,該權重表示該位置與其他位置之間的依賴關系。每個位置的注意力權重由三部分計算得來:查詢(Query)、鍵(Key)和值(Value)的線性映射。通過對所有位置進行注意力加權平均,就可以獲得每個位置的表示。在前饋神經網絡中,每個位置的表示會經過一個全連接的前饋網絡,它會對位置的特征向量進行非線性轉換,從而捕捉更高級的特征。
1.2.2" Transformer結構
Transformer模型是一種創新的自然語言處理(NLP)架構,是一種基于注意力機制的序列到序列(Sequence?to?Sequence)模型,最初由Google在2017年提出并廣泛應用于機器翻譯任務。相較于傳統的循環神經網絡(RNN)和長短期記憶(LSTM)網絡,Transformer模型具有更強的并行計算能力和長距離依賴捕捉能力[15]。
Transformer結構由編碼器(Encoder)和解碼器(Decoder)兩部分組成,它們分別用于處理輸入序列和生成輸出序列。編碼組件是神經網絡模型中的關鍵部分,由多頭自注意力機制和前饋神經網絡構成。這些組件通過自注意力機制捕捉輸入序列中元素之間的關系,并利用前饋神經網絡進行特征提取和表示學習。解碼組件主要由掩碼自注意力機制、多頭自注意力機制和前饋神經網絡組成。通過合理地設計和優化這些組件,能夠獲得更好的模型性能和更準確的輸出結果。
為了更有效地捕捉序列中各個位置之間的依賴關系,Transformer模型采用了自注意力機制來處理序列數據,取代了傳統的遞歸和卷積操作。這種新的方法可以顯著降低模型的復雜度,提高序列信息的捕捉效率。這使得Transformer在處理長距離依賴和并行計算方面具有較大優勢,并在機器翻譯、文本摘要、語言模型等任務上取得了非常好的效果。
1.3" CNN?Transformer模型
在傳統的CNN中,通過卷積操作可以有效地捕獲局部特征和空間關系,但缺乏對全局上下文的建模能力。而Transformer模型則通過自注意力機制實現了全局上下文的建模,但在處理任務中,由于數據的高維性和空間結構,直接應用Transformer會導致計算和存儲資源的巨大開銷。Transformer模型主要是從時間角度來獲取軸承信號的相關信息,但對于不同檢測部位的空間信息知之甚少。由于CNN在空間特征提取方面表現出色,因此通過將CNN與Transformer模型相結合,可以實現對故障信號數據中信息的多維提取[9]。CNN?Transformer模型網絡結構如圖1所示。
該組合模型的工作流程大致分為以下3個步驟。
1) 利用卷積網絡來接收輸入特征序列并進行卷積操作,提取特征信息。
2) 運用Transformer模型,它由以下幾個部分組成。通過卷積網絡對輸入特征序列進行處理,得到卷積特征(encinputs)。使用Encoder對卷積特征進行編碼處理,得到編碼輸出(encoutputs)。編碼過程包括多個EncoderLayer,每個EncoderLayer包括多頭自注意力機制和前饋神經網絡。將編碼輸出并進行展平操作,得到展平后的特征表示。使用一個線性投影層(projection)將特征表示映射到一個大小為100的向量。經過softmax激活函數處理(act)后,再通過一個線性投影層(projection1)得到最終的預測結果(declogits)。
3) 最終的輸出是預測結果(declogits)和編碼輸出(encoutputs)。總之,該CNN?Transformer模型通過卷積網絡提取特征,并通過Transformer進行編碼和解碼,最終將編碼輸出映射到預測結果。
本文參考MobileViT的思想,考慮到故障信號識別任務對速度和性能的要求,采用CNN和Transformer相結合的方法構建了一個輕量級的網絡模型[16]。該模型中運用的特征處理模塊為3個卷積層和3個池化層,其中,第3個池化層選擇自適應最大池化,統一輸出數據的維度。在全連接層采用softmax激活函數對故障模式進行分類[17]。
綜上所述,CNN?Transformer模型通過卷積網絡提取振動信號的特征,然后通過Transformer進行編碼處理,并最終將特征映射到故障類型的預測結果,這樣模型就可以提高軸承故障的檢測和預測能力[18]。
2" 算法驗證
2.1" 測試平臺
本文測試平臺為自主配置計算機,64位Windows 10操作系統,處理器為Intel[?] CoreTM i5?12500H CPU,8 GB?RTX2050 GPU,16 GB內存,神經網絡的構建采用PyTorch框架。
2.2" 數據來源及參數設置
本文所用實驗數據選自于凱斯西儲大學電氣實驗室(CWRU)公開的滾動軸承數據集。西儲大學滾動軸承故障實驗平臺由一個電機、一個振動加速度傳感器、功率測試計和電子控制器組成[19]。驅動端的軸承型號為6205?2RSSKF,風扇端的軸承型號為6203?2RSJEMSKF,均為深溝球軸承。故障類型包括4種狀態,分別為內圈故障、外圈故障、滾動體故障和正常數據。電機近似轉速為1 797 r/min,采樣頻率為12 kHz,故障損傷直徑分為小尺寸(0.017 8 cm)、中尺寸(0.035 56 cm)和大尺寸(0.053 54 cm),共計10種狀態,如表1所示。工況分類如表2所示。
對10種不同狀態的數據進行裁剪,得到120個樣本,每個樣本包含1 000個數據點,將數據集按照4∶1的比例分為訓練集和測試集。在訓練過程中,訓練批次(batch size)為256,最大迭代次數(epoch)為50,優化器選擇Adam,最小學習率(min learning rate)設定為0.001。
2.3" 模型訓練
根據上述網絡模型參數的設置進行訓練,由于故障信號處理的特殊方式,需要在自動扶梯實際運行時對網絡模型進行實時更新。
根據2.2節中模型參數的設置,經訓練后得到訓練的損失值及準確率曲線,如圖2所示。
由圖2可知,訓練的損失值在迭代了25次之后就能夠達到收斂,趨于擬合,且訓練、驗證損失值較小。經過50輪訓練后,準確率也達到了97%以上,同時訓練、驗證損失值較小。這也更深一步證明了CNN?Transformer模型能夠有效地提升識別訓練的效率。
2.4" 結果分析
滾動軸承故障診斷的主要任務是通過對滾動軸承振動加速度數據的分析和處理,對信號進行診斷分類,從而確定故障的具體類型。為了評估所提出的神經網絡模型的故障診斷性能,需要先對模型進行評估,常用的分類問題性能評價指標為查準率P(Precision)、召回率R(Recall)、準確率(Accuracy)、F1值(F1 Score)和混淆矩陣(Confusion Matrix)等[20]。
本文所使用的性能評價指標是混淆矩陣的準確率,即將測試數據集輸入分類模型中,用所有正確預測的樣本數除以總的樣本數來衡量模型算法的性能[21]。混淆矩陣是一個二維表格,在混淆矩陣中,每一列代表預測值,每一行代表真實值。混淆矩陣中的每一個元素表示一個樣本被預測為某一類別的次數。混淆矩陣構成如表3所示。為驗證上述模型的可靠性和有效性,本文選取混淆矩陣的精確度作為模型的評價指標,即模型預測正確的樣本數與總樣本數之比。精確度越高,模型預測分類效果就越好,計算公式如下:
模型預測混淆矩陣如圖3所示。圖3中縱坐標表示真實標簽,橫坐標代表預測標簽。縱坐標的每一行表示該種故障被錯誤分類為其他類型故障的比例;而橫坐標的每一列則顯示10種樣本中被判為此類故障的比例。混淆矩陣主對角線上的數字代表模型對每一類別正確識別的樣本數量。主對角線上的數值越大,說明模型對相應類別的識別能力越強。從圖3中可以看出,模型對除標簽6外的其他故障分類效果較好,只有少量樣本被分錯。至于標簽6的識別率低、效果較差,從嚴格意義上來說是由于標簽6的數據樣本較少,導致訓練效果較差。
表4總結了基于相同數據集,本文算法模型和CNN、RNN、SVM等算法的實驗結果對比。由表4可知,不帶Transformer的模型結構較為簡單,用CNN只能提取信號的部分特征信息,提取故障特征的能力相對較弱;Transformer模型具有更加復雜的網絡結構,提取故障特征的能力相對較強。添加Transformer網絡后,CNN?Transformer模型的準確率更高,故障識別率達到97.8%,提高了4.9%;同時相較于其他模型,該模型故障診斷性能明顯較優越。
3" 結" 論
針對自動扶梯滾動軸承在噪聲環境中故障診斷準確率低的問題,本文提出了一種將Transformer與CNN相結合的滾動軸承故障診斷方法。在處理故障信號時,CNN和Transformer模型各具特長,CNN能夠有效地捕捉時域信號數據在空間上的關聯性,從而揭示出數據之間的內在聯系;而Transformer模型則通過自注意力機制更好地處理長序列數據,捕捉不同數據之間的依賴關系,從而提取出時間信息上的特征,避免了傳統循環神經網絡中梯度消失和梯度爆炸的問題。該組合模型結合了CNN和Transformer各自的優勢,能夠提取時域和頻域特征,豐富了故障信息并有效識別出故障狀態,從而更全面地分析和處理故障信號數據,為故障診斷和預測提供更準確、可靠的支持。通過將該算法模型和CNN、RNN、SVM等算法進行實驗對比,結果證明該方法相比傳統CNN網絡,識別軸承故障的準確度更高,并且可以減少對人工特征提取的依賴,實現了對故障的準確分類。未來,將繼續收集自動扶梯其他部位軸承故障的數據,以提高模型的準確性;同時,還將研究基于移動終端的自動扶梯機械故障智能診斷系統,以增強模型的實用性,從而有效地提高系統信息化水平。
參考文獻
[1] 楊向蘭,孫士保,王國強,等.基于ECA?ResNet的軸承故障診斷方法[J].軸承,2023,9(7):1?8.
[2] 陳露萌,李一鳴,黃民.一種抗噪聲軸承故障診斷方法[J].北京信息科技大學學報(自然科學版),2023,38(2):23?31.
[3] 梁敏健,彭曉軍,劉德陽.基于一維卷積神經網絡的自動扶梯機械故障分類研究[J].測控技術,2022,41(7):87?92.
[4] 段潔利,于世偉,解明坤,等.基于一維輕量化CNN的山地索道軸承故障診斷[J].農業工程學報,2023,39(14):70?79.
[5] WEN L, LI X Y, GAO L, et al. A new convolutional neural network?based data?driven fault diagnosis method [J]. IEEE transactions on industrial electronics, 2018, 65(7): 5990?5998.
[6] 魏永合,宮俊宇.基于CNN?LSTM?Attention的滾動軸承故障診斷[J].沈陽理工大學學報,2022,41(4):73?77.
[7] 朱浩,寧芊,雷印杰,等.基于注意力機制Inception?CNN模型的滾動軸承故障分類[J].振動與沖擊,2020,39(19):84?93.
[8] 李恒,張氫,秦仙蓉,等.基于短時傅里葉變換和卷積神經網絡的軸承故障診斷方法[J].振動與沖擊,2018,37(19):124?131.
[9] 楊靜雅,齊彥麗,周一青,等.CNN?Transformer輕量級智能調制識別算法[J].西安電子科技大學學報,2023,50(3):40?49.
[10] 馮鵬宇,金韜,沈一選,等.基于CNN?Transformer的城區地下水位預測[J].計算機仿真,2023,40(4):492?498.
[11] 唐宇姣.深度卷積網絡在皮膚鏡圖像皮損區域分割中的應用研究[D].廣州:南方醫科大學,2021.
[12] 雷春麗,史佳碩,馬淑珍,等.強噪聲環境下基于MSDCNN的滾動軸承故障診斷方法[J].北京航空航天大學學報,2023,9(7):1?13.
[13] 譚博韜,黃民,劉躍,等.基于CNN?LSTM故障診斷的自動扶梯監測軟件設計[J].電子測量技術,2023,46(12):1?7.
[14] 朱奇先,梁浩鵬,趙小強,等.基于殘差神經網絡的滾動軸承故障診斷方法[J].蘭州理工大學學報,2022,48(3):86?93.
[15] 劉茜,易詩,李立,等.基于輕量級CNN?Transformer混合網絡的梯田圖像語義分割[J].農業工程學報,2023,39(13):171?181.
[16] 武林,江麗.基于CNN和集成SVM的滾動軸承故障診斷[J].數字制造科學,2023,21(2):131?135.
[17] MUHAMMAD Maaz, ABDELRAHMAN Shaker, HISHAM Cholakkal, et al. EdgeNeXt: efficiently amalgamated CNN?Transformer architecture for mobile vision applications [C]// Computer Vision?ECCV 2022 Workshops. Heidelberg: ACM, 2022: 3?20.
[18] MA J, LIU F. Bearing fault diagnosis with variable speed based on fractional hierarchical range entropy and hunter?prey optimization algorithm?optimizedrandom forest [J]. Machines, 2022, 10: 763.
[19] WANG Xinyu, MA Jie. Weak fault feature extraction of rolling bearing based on SVMD and improved MOMEDA [J]. Mathematical problems in engineering, 2021, 2021: 1?11.
[20] MA J, WANG X, Lü Y, et al. Fault prediction of non‐linear multi‐mode industrial process based on MKPCA model [J]. The Canadian journal of chemical engineering, 2023, 5: 2556?2565.
[21] LUO X D, WANG G T, LIAO W J, et al. Semi?supervised medical image segmentation via uncertainty rectified pyramid consistency [J]. Medical image analysis, 2020, 80: 102517.