摘 要:作為列車運行的重要部件,軸承的健康狀態是決定列車安全運行的重要因素。軸承的故障診斷一直是行業研究熱點。本文針對傳統模型提取特征不足、特征信息丟失嚴重、模型準確率低以及分析識別時間長等問題,結合膠囊神經網絡的特征結構,提出了基于深度學習的列車軸承故障診斷研究方法。模型以凱斯西儲大學的軸承故障數據為數據集。改進后的神經網絡模型在識別準確率、識別速度方面均有提升,本文算法具有一定的先進性。
關鍵詞:人工智能;膠囊神經網絡;軸承故障診斷
中圖分類號:TP 207" " " 文獻標志碼:A
我國軌道交通行業取得了飛速發展,列車的穩定運行是保障行車安全的重要一環,也是目前國內、外行業內的研究熱點,但目前應用于列車軸承故障診斷的模型在識別準確率、識別速度方面還有待提升。如何在列車高速運行下保障行車安全成為軌道交通行業的難題,因此有必要對列車軸承故障診斷進行研究。
目前國內許多專家學者已就軸承診斷問題進行了研究。鐵科院研發的“JSC-206機車車輛軸承診斷儀”[1]儀器可以對檢修解體后的軸承進行檢測,但系統的抗干擾能力較弱,無法滿足列車實際運行中的故障診斷需求[2];刁寧昆、馬懷祥基于MPE和PSO-SVM建立了軸承故障診斷模型[3];王貴勇、劉韜通過聯合MOMEDA進行故障特征提取;周志恒、賀德強基于GA-BP神經網絡并針對軸承狀態建立了預防模型。但國內目前研究結果還不能應用到軸承故障預測中,如果能夠實時感知軸承狀態、跟蹤潛在故障并進行針對性維修,將會有效降低列車發生故障的概率。
綜上所述,本文將針對數據集不均衡、應用場景復雜多變的問題進行研究,以搭建并優化列車軸承故障診斷模型。
1 膠囊神經網絡
卷積神經網路衍變歷程漫長且坎坷。作為深度學習的代表算法,其在特征提取方向上具有良好的表象能力。與常規特征提取模型相比,卷積神經網絡的池化層可有效降低數據特征維度,泛化能力更突出。但是卷積神經網絡需要龐大的數據集訓練模型,不能很好地應對模糊性,池化層也會丟失大量信息,使空間分辨率降低。膠囊神經網絡的提出解決了卷積神經網絡的這一難題。
2017年10月,深度學習之父“Hinton”提出了膠囊神經網絡。膠囊神經網絡摒棄了傳統神經網絡復雜的特征提取方式,提出膠囊的概念,利用膠囊表示一個事物整體的一個局部特征,并進行高緯度分類。具體核心思路如下:第一,與傳統神經網絡不同,膠囊神經網絡的基本單元是膠囊(Capsule),其中包括多個神經元。膠囊的輸入、輸出均為向量,向量的長度代表傳統神經元中的概率,向量方向則用來表示其他信息(位置、顏色等信息)。第二,膠囊神經網絡的動態路由機制替代了傳統卷積神經網絡的最大池化方法。
2 膠囊神經結構
膠囊神經網絡結構分為編碼結構和解碼結構。
2.1 編碼結構
以手寫體數字識別為例,如圖1所示。編碼結構共包括三層網絡,第一層為卷積層(Conv1層),數據傳入膠囊神經網絡先進行卷積計算,初步提取特征,手寫體數字識別模型中,卷積核的大小為9×9,包括256個通道,輸出為259個20×20的特征。此卷積層的激活函數為ReLU,卷積層初步提取特征后傳遞到下一層基礎膠囊層中。
與卷積神經網絡的采樣層功能類似,編碼結構中卷積層后面為基礎膠囊層(Primary Caps)和數字膠囊層(Digit Caps)。基礎膠囊層可看作特殊的卷積層。利用多個卷積核來獲得數據中多維實體特征,將這些特征整合為矢量(8×1)并輸入數字膠囊層中。數字膠囊層與全連接層相似,接受來自基礎膠囊層的輸出矢量,其耦合系數決定每個輸入特征的接受程度。由于該模型用于識別數字手寫體,因此最終輸出10個膠囊,膠囊維度為16,每個膠囊的長度代表其數字識別的概率,長度越大,即該數字的可能性越大。模型的最終結果輸出為概率最大的數字。動態路由機制僅在基礎膠囊層和數字膠囊層之間進行。
2.2 解碼結構
膠囊神經網絡的解碼結構共包括3個全連接層,如圖2所示。
先將原始數據輸入編碼結構中,經過數字膠囊層得到每種結果的預測概率。概率最高的被送入解碼結構進行重建,獲得重建損失。
2.3 訓練過程
作為膠囊神經網絡的激活函數,Squashing函數將輸出向量長度歸一化。如公式(1)所示。
(1)
式中:Vj為j個膠囊的總輸出向量;Sj為j個膠囊的總輸入向量。
傳統網絡通過加權求和的方式獲得網絡的輸出,膠囊神經網絡在傳統加權求和的基礎上增加了耦合系數cij,如公式(2)、公式(3)所示。
Sj=∑iCijj|i (2)
j|i=Wijui (3)
式中:ui表示第l層的第i個膠囊,為儲存局部信息;Wij代表第l層的第i個膠囊和第l+1層的第j個膠囊的權重矩陣;代表l+1層的第j個膠囊在第l層的第i個膠囊下的整體信息預測結果;Cij為每個底層膠囊與之相對應的高層膠囊之間的權重。
通過仿射變換,將ui儲存的局部信息映射為整體信息。Cij由采用的動態路由算法中的softmax函數決定,如公式(4)所示。
(4)
式中:bij為膠囊i與膠囊j相互耦合的先驗概率,bij只依賴于2個膠囊的位置與類型。
動態路由算法的具體計算過程如圖3所示。
2.4 膠囊神經網絡損失函數
膠囊神經網絡的損失函數為SVM中的Margin Loss函數,如公式(5)所示。
Lk=Tkmax(0,m+-||vk||)2+λ(1-Tk)max(0,||vk||-m-)2 (5)
式中:Tk為分類指示函數(k類存在即為1,不存在為0);vk為網絡輸出數據;m+為上界,懲罰假陽性,本文選取經驗值m+=0.9;m-為下界,懲罰假陰性,m-=0.1;λ為比例系數,調整兩者比重,默認初始值為0.5。
3 試驗與分析
3.1 試驗環境
基于膠囊神經網絡的軸承故障診斷模型結構復雜,為保證模型準確率,需要龐大的數據集支撐,因此試驗所用服務器CPU型號為i912900KF,顯卡采用RTX3090Ti,內存32GB,操作系統為Windows10 64位。模型由Python語言編寫,采用tensorflow框架搭建。
3.2 數據集
本試驗模型訓練采用的數據集為美國凱斯西儲大學(Case Western Reserve University,CWRU)的滾動軸承數據集。該數據集是目前軸承故障診斷領域里公認的最權威的用于研究測試的數據集,頂級期刊《Mechanical Systems and Signal Processing》中有超過41篇文章是基于該數據集做的研究。凱斯西儲大學軸承數據主要由電動機、功率測試計、電子控制器及扭矩傳感器組成。數據集共包括8個正常樣本,53個外圈故障樣本,23個內圈故障樣本及11個滾子故障樣本。
3.3 數據集預處理
本試驗選取4種數據集用于訓練模型,每種狀態共包括10萬條數據。具體故障類型及編號見表1。
為消除試驗數據中不同量綱帶來的影響,加快網絡模型的訓練速度,本試驗采用Max(Min-Max Normalization)標準化方式對每種數據個傳感器數據進行歸一化處理。計算方法如公式(6)所示。
(6)
將處理后的數據集按4∶1的比例劃分為訓練集和驗證集,即每組數據訓練集包括8萬條數據,驗證集包括2萬條數據。
3.4 網絡結構
訓練神經網絡需喲啊設置好超參數,包括學習率、迭代次數、隱含層數、神經元數量、訓練批次以及激活函數等。神經網絡的超參數對其訓練過程和得到的網絡模型適用能力具有重要影響。
通常增加神經網絡的網絡層數能提升訓練模型的準確率,擬合效果也會更好。但網絡層數過多時,模型也會存在過擬合風險,因此試驗選取合適的網絡層數,在避免過擬合的同時盡可能提升模型準確率。膠囊神經網絡中卷積核大小和步長對模型的特征提取具有十分重要的影響。卷積核決定模型的感受野,卷積核越大,可提取的特征越多,但同時也增加了模型的計算量,不利于模型的深度擴充。而更小的卷積核可以捕捉到更細節的特征,通過多個小卷積核的堆疊來代替大卷積核,可減少模型參數計算并提升效率。但卷積核過小,則會導致數據集容量較少時,不能有效提取特征信息。因此選取合適的卷積核及其他超參數對模型的適用質量十分重要,需要不斷進行測試。
為提取原始數據中更豐富的時域特征信息,增強模型的特征識別能力,本試驗在原有的膠囊網絡中增加了注意力機制。注意力機制將3個本征模函數重構、融合為三通道信號,對原始信號降噪,再輸入卷積層中進行特征提取。經過2個卷積層、2個膠囊層后,輸出判定結果。與原始的CapsNet相比,模型網絡結構更深,提高了分類精度。具體網絡結構如圖4、表2所示。基礎膠囊層與數字膠囊層之間為全連接,所有權重由動態路由算法確定。
3.5 試驗結果與分析
訓練效果如圖5所示。本文構建的模型經過5h的訓練,迭代次數為6000次,模型訓練集準確率達95.37%,驗證集準確率高達93.58%。由此可見,該模型對列車軸承故障的診斷能力較高且泛化能力良好。
本文模型與其他軸承故障診斷算法的識別準確率比較見表3。可以看出,同在CWRU數據樣本下,本文構建的軸承故障診斷模型識別率明顯高于其他算法。
4 結語
本文通過試驗驗證了基于膠囊神經網絡的軸承故障診斷模型比其他方法更適合列車軸承故障診斷,該模型結構簡易,識別速度快。膠囊網絡模型特有的空間結構更大限度地挖掘出了振動信號特征,提升了模型的識別準確度。目前,深度學習仍處于起步階段,今后還需要在和已經成熟的模型相結合方面繼續探索,進一步改進其應用場景。
參考文獻
[1]吳春復.JSC—206機車軸承診斷儀的應用與體會[J].鐵道機車車輛,1998(3):53-57.
[2]張生玉,馮庚斌.JL—601機車走行部檢測系統[J].鐵道機車車輛,2000(5):18-20.
[3]刁寧昆,馬懷祥,王金師,等.基于MPE與PSO-SVM的滾動軸承故障診斷[J].電子測量技術,2021,44(21):44-48.
[4]孫祺淳,李媛媛.DE算法優化CNN的滾動軸承故障診斷研究[J].噪聲與振動控制,2022,42(4):165-171,176.
通信作者:郭占廣(1996-),碩士,主要研究方向為人工智能、故障診斷等。
電子信箱:812996561@qq.com。