徐濟(jì)宣,馬 輝,馮小凱
(1.江西交通職業(yè)技術(shù)學(xué)院汽車(chē)工程系,江西 南昌330013;2.吉林農(nóng)業(yè)科技學(xué)院,吉林 吉林132101;3.湖南大學(xué),湖南 長(zhǎng)沙410082)
滾動(dòng)軸承是大型自動(dòng)化設(shè)備中最容易損壞的機(jī)械部件之一,軸承故障會(huì)引發(fā)巨大的經(jīng)濟(jì)損失,甚至造成人員傷亡。因此對(duì)軸承進(jìn)行實(shí)時(shí)、準(zhǔn)確地監(jiān)測(cè)和診斷顯得極為重要[1]。對(duì)同一設(shè)備故障狀態(tài)監(jiān)測(cè)的多個(gè)傳感器具有互補(bǔ)性,可以彌補(bǔ)單個(gè)信息源數(shù)據(jù)不完整的缺陷。因此,研究多源異構(gòu)數(shù)據(jù)的融合與故障診斷問(wèn)題具有重要的理論意義和工程價(jià)值。
設(shè)計(jì)多源異構(gòu)數(shù)據(jù)的融合方法,實(shí)現(xiàn)多源數(shù)據(jù)的關(guān)聯(lián)、交叉和互補(bǔ),是多源異構(gòu)數(shù)據(jù)融合的根本問(wèn)題。多源異構(gòu)數(shù)據(jù)的融合,按照融合級(jí)別,可以分為數(shù)據(jù)級(jí)融合、特征級(jí)融合和決策級(jí)融合。數(shù)據(jù)級(jí)融合即為原始采集數(shù)據(jù)的融合,包括加權(quán)平均法、金字塔算法等,文獻(xiàn)[2]使用加權(quán)平均法對(duì)傳感器位置進(jìn)行融合,此方法簡(jiǎn)單易懂、易于實(shí)現(xiàn),但是融合信息的對(duì)比度低。特征級(jí)融合是提取每個(gè)異構(gòu)數(shù)據(jù)的特征,而后進(jìn)行特征組合,得到多源異構(gòu)數(shù)據(jù)的聯(lián)合特征。文獻(xiàn)[3]將故障數(shù)據(jù)分為靜態(tài)開(kāi)關(guān)量、動(dòng)態(tài)電氣量和暫態(tài)電氣量,分別提取故障特征組成聯(lián)合特征,實(shí)現(xiàn)了特征級(jí)融合,得到了精確的故障類(lèi)型和故障位置。這種融合方法過(guò)于粗糙,各自孤立的提取各自信息的故障特征,而后組合成特征向量,忽略了異構(gòu)數(shù)據(jù)之間的關(guān)聯(lián)性和互補(bǔ)性。決策級(jí)融合是指對(duì)多源數(shù)據(jù)建立各自的深度學(xué)習(xí)網(wǎng)絡(luò),決策時(shí)對(duì)分類(lèi)結(jié)果進(jìn)行融合,包括投票法、D-S證據(jù)理論等。文獻(xiàn)[4]在煤礦安全預(yù)警中提出了基于D-S理論的決策級(jí)融合方法,建立的安全預(yù)警模型對(duì)井下安全具有指導(dǎo)意義,但是D-S理論的理論基礎(chǔ)存在爭(zhēng)議,同時(shí)DS理論存在指數(shù)爆炸問(wèn)題。
本文研究了軸承多源異構(gòu)故障數(shù)據(jù)的特征融合問(wèn)題,使用深度神經(jīng)網(wǎng)絡(luò)將多源數(shù)據(jù)特征進(jìn)行有效融合,提取更加能夠表征故障特性的融合特征,達(dá)到提高軸承故障診斷精度的目的。
顧名思義,堆疊自編碼器是由編碼器堆疊而成,因此首先介紹自編碼器。自編碼器(Automotive Encoder,AE)分為編碼和解碼兩個(gè)過(guò)程,其中編碼可視為特征提取的過(guò)程,解碼可視為數(shù)據(jù)還原的過(guò)程[5],其模型結(jié)構(gòu)如圖1所示。

圖1 自動(dòng)編碼器模型結(jié)構(gòu)Fig.1 Automotive Encoder Model Structure
編碼器輸入記為X,則編碼過(guò)程(即隱藏層輸出)為:

式中:σ1—編碼過(guò)程激活函數(shù);W—輸入層向隱藏層的傳遞權(quán)值矩陣;b—隱藏層的偏置向量;h—隱藏層激活值,也可以理解為提取的隱藏特征。解碼過(guò)程為:

式中:σ2—編碼過(guò)程激活函數(shù);W′—隱藏層向輸出層的傳遞權(quán)值矩陣;b′—輸出層的偏置向量;Y—輸入的重構(gòu)值。自動(dòng)編碼器的重構(gòu)誤差及參數(shù)更新過(guò)程[6]為:

式中:J(X,Y)—重構(gòu)誤差,α—學(xué)習(xí)率。
本節(jié)構(gòu)造的深度神經(jīng)網(wǎng)絡(luò)(Deep Neural Network,DNN)由多個(gè)自編碼器堆疊而成,以前一個(gè)自編碼器的隱藏層激活值作為下一個(gè)自編碼器的輸入,網(wǎng)絡(luò)結(jié)構(gòu)如圖2所示。
對(duì)于圖2所示的堆疊自編碼器,輸入無(wú)標(biāo)簽數(shù)據(jù)X,使用式(1)、式(2)和式(3)進(jìn)行訓(xùn)練,得到AE1的隱藏層特征h1和網(wǎng)絡(luò)參數(shù)θ1={ }W1,b1,W1′,b1′。而后以h1作為AE2的輸入,按照式(3)訓(xùn)練方法,得到AE2的隱藏層特征h2和網(wǎng)絡(luò)參數(shù)θ2={W2,b2,W2′,b2′}。重復(fù)以上過(guò)程直至得到自編碼器AEn的隱藏層特征hn和網(wǎng)絡(luò)參數(shù)θn={Wn,bn,Wn′,bn′}。

圖2 自編碼器堆疊而成的深度神經(jīng)網(wǎng)絡(luò)Fig.2 Deep Neutral Network Stacked by Automotive Encoder
最后一層自編碼器得到的隱藏層特征hn即為深度神經(jīng)網(wǎng)絡(luò)獲取的輸入數(shù)據(jù)隱藏特征。將隱藏特征hn輸入到Softmax分類(lèi)器中,使用有標(biāo)簽的數(shù)據(jù)對(duì)Softmax分類(lèi)器進(jìn)行訓(xùn)練。對(duì)于K分類(lèi)問(wèn)題,將第m個(gè)觀測(cè)樣本x(m)=[x1(m),x2(m),…xk(m)]輸入到堆疊自編碼器中得到隱藏特征hn,將hn輸入到Softmax分類(lèi)器中,得分類(lèi)結(jié)果[7]為:

式中:label(m)—分類(lèi)結(jié)果;θ=[θ1,θ2,…,θK]—Softmax分類(lèi)器參數(shù)。
為了保證分類(lèi)的準(zhǔn)確性,通過(guò)最小化分類(lèi)代價(jià)函數(shù)實(shí)現(xiàn)參數(shù)的優(yōu)化與更新,代價(jià)函數(shù)及參數(shù)更新方法為:

式中:M—樣本數(shù)量,K—分類(lèi)數(shù),θ—Softmax分類(lèi)器網(wǎng)絡(luò)參數(shù),E(θ)—重構(gòu)誤差。
卷積神經(jīng)網(wǎng)絡(luò)更加適用于二維輸入數(shù)據(jù),比如圖像輸入。卷積神經(jīng)網(wǎng)絡(luò)由輸入層、卷積層、池化層、全連接層和輸出層組成[8]。
(1)卷積層。卷積層將輸入數(shù)據(jù)與卷積核進(jìn)行卷積運(yùn)算生成特征映射,供池化層提取與降維。對(duì)于輸入數(shù)據(jù)X,卷積核從輸入數(shù)據(jù)中學(xué)習(xí)到的特征為:

式中:hCNN,i—第i層卷積層的特征輸出,?—卷積,WCNN,i—第i層卷積核權(quán)值,bCNN,i—第i層卷積核偏置,g()—線(xiàn)性整流ReLU激活函數(shù)。
(2)池化層。池化層是為了提取重要的特征信息,達(dá)到降低特征維度的目的。最大池化方式可以獲得與位置無(wú)關(guān)的特征,對(duì)于軸承周期性振動(dòng)信號(hào)極為適用,因此本文使用最大池化方式最大池化是指對(duì)卷積層輸出的特征量hCNN,i,每連續(xù)ψ個(gè)hCNN,i選擇一個(gè)最大值進(jìn)行保留。數(shù)學(xué)描述為:

式中:hCNN,j—第j個(gè)池化層輸出,維度為s,g—池化長(zhǎng)度。
(3)全連接層。將最后一級(jí)池化層的輸出平鋪,作為全連接層輸入。對(duì)輸入數(shù)據(jù)使用ReLU激勵(lì)函數(shù)進(jìn)行激活,得到卷積神經(jīng)網(wǎng)絡(luò)的最終特征參數(shù)hCNN。
卷積神經(jīng)網(wǎng)絡(luò)的參數(shù)使用基于Adam算法的優(yōu)化方法,具體可參考文獻(xiàn)[9]。
當(dāng)前的多源異構(gòu)數(shù)據(jù)特征級(jí)融合,大都獨(dú)立地提取各數(shù)據(jù)源的特征,而后拼接成聯(lián)合特征向量,這種粗糙的融合方法忽略了數(shù)據(jù)的互補(bǔ)性和關(guān)聯(lián)性。為了解決這一問(wèn)題,本文提出了基于深度學(xué)習(xí)的交替優(yōu)化方法。
第一步:使用堆疊自編碼器構(gòu)造的深度神經(jīng)網(wǎng)絡(luò)(DNN)提取1維振動(dòng)信號(hào)的故障特征FDNN。深度神經(jīng)網(wǎng)絡(luò)構(gòu)造為:

式中:NetDNN—訓(xùn)練完畢的深度神經(jīng)網(wǎng)絡(luò);TrDNN—訓(xùn)練完畢的網(wǎng)絡(luò)參數(shù);Feedforward—多隱藏層神經(jīng)網(wǎng)絡(luò)生成函數(shù);θDNN={WDNN,bDNN}—神經(jīng)網(wǎng)絡(luò)參數(shù);MD—隱藏層數(shù);h1~hMD—各隱藏層神經(jīng)元數(shù)量;X1D—輸入的1維振動(dòng)數(shù)據(jù)。
使用訓(xùn)練得到的深度神經(jīng)網(wǎng)絡(luò)NetDNN,得到1維振動(dòng)數(shù)據(jù)的特征為:

式中:FDNN—1維數(shù)據(jù)隱藏特征;GDNN—深度神經(jīng)網(wǎng)絡(luò)輸出函數(shù)。
第二步:使用卷積神經(jīng)網(wǎng)絡(luò)(CNN)提取2維圖像數(shù)據(jù)的1維故障特征FCNN。卷積神經(jīng)網(wǎng)絡(luò)構(gòu)造為:

式中:NetCNN—訓(xùn)練完畢的卷積神經(jīng)網(wǎng)絡(luò);TrCNN—訓(xùn)練完畢的網(wǎng)絡(luò)參數(shù);Feedforward—多隱藏層神經(jīng)網(wǎng)絡(luò)生成函數(shù);θCNN={WCNN,bCNN}—網(wǎng)絡(luò)參數(shù);MCL、Mpool—卷積層數(shù)和池化層數(shù);SizeCL、Sizepool—卷積核大小和池化核大小;X2D—輸入的2維圖像數(shù)據(jù)。
使用訓(xùn)練得到的卷積神經(jīng)網(wǎng)絡(luò)NetCNN,得到2維圖像數(shù)據(jù)的特征為:

式中:FCNN—2維圖像數(shù)據(jù)得到的1維隱藏特征;GCNN—卷積神經(jīng)網(wǎng)絡(luò)輸出函數(shù)。
第三步:使用堆疊自編碼器構(gòu)造融合網(wǎng)絡(luò)Netfu,用于多源特征的交替優(yōu)化融合,最終獲得多源融合特征Ffu。使用多隱藏層神經(jīng)網(wǎng)絡(luò)生成函數(shù)Feedforward得到融合網(wǎng)絡(luò)Netfu,為:

式中:Netfu—訓(xùn)練完畢的融合網(wǎng)絡(luò);Trfu—訓(xùn)練完畢的網(wǎng)絡(luò)參數(shù);θf(wàn)u={Wfu,bfu}—神經(jīng)網(wǎng)絡(luò)參數(shù);Mf—隱藏層數(shù);h1~hMf—各隱藏層神經(jīng)元數(shù)量;FDNN、FCNN—輸入數(shù)據(jù)。
將1維振動(dòng)數(shù)據(jù)隱藏特征FDNN、2維圖像數(shù)據(jù)的隱藏特征FCNN同時(shí)輸入到融合網(wǎng)絡(luò)Netfu中,進(jìn)行交替優(yōu)化,優(yōu)化方法示意圖,如圖3所示。

圖3 交替優(yōu)化示意圖Fig.3 Alternative Optimization Diagram
首先將隱藏特征FDNN輸入到融合網(wǎng)絡(luò)Netfu11中,網(wǎng)絡(luò)參數(shù)初始化方法為:

式中:Q—輸入層神經(jīng)云數(shù)量,hfu1、hfu2、hfu3—隱藏層1、隱藏層2、隱藏層3的神經(jīng)云數(shù)量,Wfu1—輸入層到隱藏層1的權(quán)值,bfu1—隱藏層1的偏置值,Wfu2—隱藏層1到隱藏層2的權(quán)值,bfu2—隱藏層2的偏置值,Wfu3—隱藏層2到隱藏層3的權(quán)值,bfu3—隱藏層3的偏置值;函數(shù)rand(a,b)是指產(chǎn)生a×b矩陣,矩陣值為(0,1)間隨機(jī)數(shù);zeros(a,b)是指產(chǎn)生要素為0的a×b矩陣。
將FDNN輸入到融合網(wǎng)絡(luò)Netfu11中,按照式(1)、式(2)和式(3)進(jìn)行訓(xùn)練,得到訓(xùn)練完畢的參數(shù)Trfu1,1D,利用訓(xùn)練完畢的網(wǎng)絡(luò)提取1維數(shù)據(jù)的融合特征為:

式中:Ffu1,1D—1維數(shù)據(jù)提取的融合特征,Gfu1—融合網(wǎng)絡(luò)Netfu11輸出函數(shù)。
而后以Trfu1,!D作為融合網(wǎng)絡(luò)Netfu12參數(shù)初值,將隱藏特征FCNN輸入到融合網(wǎng)絡(luò)Netfu12中,網(wǎng)絡(luò)參數(shù)的初始化方法和訓(xùn)練方法同融合網(wǎng)絡(luò)Netfu11一致,至此完成了隱藏特征FDNN和FCNN的第一輪交替優(yōu)化。融合網(wǎng)絡(luò)Netfu11對(duì)輸入數(shù)據(jù)FDNN的重構(gòu)誤差為:

式中:Rcfu11—融合網(wǎng)絡(luò)Netfu11對(duì)FDNN的重構(gòu)值,W′、b′的含義與式(2)一致,為解碼過(guò)程參數(shù),φ—激活函數(shù),n—隱藏特征FDNN的數(shù)據(jù)長(zhǎng)度,Lfu11—融合網(wǎng)絡(luò)Netfu11對(duì)輸入數(shù)據(jù)FDNN的重構(gòu)誤差。以同樣方式計(jì)算融合網(wǎng)絡(luò)Netfu12對(duì)輸入數(shù)據(jù)FCNN的重構(gòu)誤差,記為L(zhǎng)fu12,由此得到第1輪交替優(yōu)化誤差L1為:

按照以上過(guò)程,重復(fù)地將FDNN與FCNN輸入到融合網(wǎng)絡(luò)中進(jìn)行交替優(yōu)化,直至優(yōu)化誤差L小于設(shè)定值ε。此時(shí)得到訓(xùn)練完畢的融合網(wǎng)絡(luò)Netfu和網(wǎng)絡(luò)參數(shù)Trfu。根據(jù)訓(xùn)練完畢的融合網(wǎng)絡(luò)Netfu,得到多源異構(gòu)數(shù)據(jù)的融合特征Ffu為:

式中:Gfu—融合網(wǎng)絡(luò)的輸出函數(shù)。
使用Softmax分類(lèi)器進(jìn)行故障類(lèi)型診斷。將融合特征Ffu作為Softmax分類(lèi)器輸入,生成Softmax分類(lèi)器為:

式中:Netsoft—Softmax分類(lèi)器網(wǎng)絡(luò);θsoft—Softmax網(wǎng)絡(luò)參數(shù);hout—Softmax分類(lèi)器神經(jīng)元數(shù)量;Ffu—Softmax分類(lèi)器輸入的融合特征。
基于融合特征的Softmax分類(lèi)器診斷結(jié)果為:

式中:result—分類(lèi)結(jié)果;θ=[θ1,θ2,…,θK]—Softmax分類(lèi)器參數(shù);K-分類(lèi)種數(shù);p(yi=i|Ffu;θ)—參數(shù)為θ、輸入為Ffu時(shí)分類(lèi)為k的概率。
對(duì)包括Softmax分類(lèi)器在內(nèi)的融合網(wǎng)絡(luò)進(jìn)行參數(shù)反向調(diào)整時(shí),為了防止模型過(guò)擬合和過(guò)學(xué)習(xí),將L2正則化懲罰項(xiàng)加入到損失函數(shù)中,為:

式中:JC—損失函數(shù),n—樣本數(shù)量,y—原始標(biāo)簽,y′—識(shí)別結(jié)果,α—正則化超參數(shù),w—權(quán)值矩陣列向量。依據(jù)此損失函數(shù),使用梯度下降法對(duì)融合網(wǎng)絡(luò)進(jìn)行參數(shù)的反向優(yōu)化。
根據(jù)以上多源異構(gòu)數(shù)據(jù)的特征融合方法,制定基于融合特征的深度神經(jīng)網(wǎng)絡(luò)診斷流程,如圖4所示。

圖4 基于深度神經(jīng)網(wǎng)絡(luò)的診斷流程Fig.4 Diagnosis Flow of Deep Neural Network
基于融合特征的深度神經(jīng)網(wǎng)絡(luò)診斷方法分為離線(xiàn)建模部分和在線(xiàn)診斷部分,離線(xiàn)建模部分主要功能是深度神經(jīng)網(wǎng)絡(luò)建立與參數(shù)訓(xùn)練,在線(xiàn)診斷部分功能是使用訓(xùn)練完畢的深度神經(jīng)網(wǎng)絡(luò)模型,實(shí)時(shí)提取數(shù)據(jù)的融合特征并進(jìn)行故障類(lèi)型診斷。
本文以美國(guó)凱斯西儲(chǔ)大學(xué)提供的軸承試驗(yàn)數(shù)據(jù)為基礎(chǔ)設(shè)計(jì)實(shí)驗(yàn)[10],使用電火花技術(shù)在軸承上加工單點(diǎn)故障,軸承狀態(tài)分為內(nèi)圈故障、外圈故障、滾珠故障和正常狀態(tài)等四類(lèi),故障直徑包括0.007英寸、0.014英寸、0.021英寸、0.028英寸和0.04英寸等,數(shù)據(jù)采樣頻率分為12kHZ和48kHz兩種,電機(jī)負(fù)載分為0hp、1hp、2hp、3hp等。本文使用負(fù)載為0hp、采樣頻率為12kHZ、電機(jī)轉(zhuǎn)速為1797RPM狀態(tài)下的實(shí)驗(yàn)數(shù)據(jù),設(shè)計(jì)三組實(shí)驗(yàn)如下。
實(shí)驗(yàn)一:故障直徑均為0.014英寸的內(nèi)圈故障數(shù)據(jù)、外圈故障數(shù)據(jù)、滾珠故障數(shù)據(jù)和正常軸承數(shù)據(jù)。訓(xùn)練樣本規(guī)模為8000,測(cè)樣樣本規(guī)模為4000。一維數(shù)據(jù)為一維振動(dòng)數(shù)據(jù),二維數(shù)據(jù)為監(jiān)控中心監(jiān)視器截屏二維圖像數(shù)據(jù)。
實(shí)驗(yàn)二:故障直徑分別為0.007英寸、0.014英寸、0.021英寸的內(nèi)圈故障數(shù)據(jù)和正常軸承數(shù)據(jù)。訓(xùn)練樣本規(guī)模為8000,測(cè)樣樣本規(guī)模為4000。一維數(shù)據(jù)為一維振動(dòng)數(shù)據(jù),二維數(shù)據(jù)為監(jiān)控中心監(jiān)視器截屏二維圖像數(shù)據(jù)。
實(shí)驗(yàn)三:故障直徑分別為0.007英寸、0.014英寸、0.021英寸的外圈故障數(shù)據(jù)和正常軸承數(shù)據(jù)。訓(xùn)練樣本規(guī)模為8000,測(cè)樣樣本規(guī)模為4000。一維數(shù)據(jù)為一維振動(dòng)數(shù)據(jù),二維數(shù)據(jù)為監(jiān)控中心監(jiān)視器截屏二維圖像數(shù)據(jù)。
為了驗(yàn)證多源異構(gòu)數(shù)據(jù)融合特征的診斷效果,同時(shí)使用一維數(shù)據(jù)提取特征FDNN、二維數(shù)據(jù)提取特征FCNN、融合特征Ffu進(jìn)行故障診斷。用于特征融合的深度神經(jīng)網(wǎng)絡(luò)模型,如表1所示。

表1 融合網(wǎng)絡(luò)模型Tab.1 Fused Network Model
三組實(shí)驗(yàn)的實(shí)驗(yàn)結(jié)果較多,由于篇幅限制,在此僅以圖形的形式對(duì)實(shí)驗(yàn)一的診斷結(jié)果進(jìn)行展示,另外兩組實(shí)驗(yàn)的結(jié)果統(tǒng)計(jì)數(shù)據(jù)在后文中以表格形式給出。實(shí)驗(yàn)一的診斷結(jié)果如圖5所示,圖中狀態(tài)0、1、2、3分別表示正常狀態(tài)、滾珠故障、內(nèi)圈故障、外圈故障。

圖5 實(shí)驗(yàn)一的診斷結(jié)果Fig.5 Diagnosis Result of the First Experiment
圖5中,藍(lán)色“O”為測(cè)試數(shù)據(jù)的原始標(biāo)簽,紅色“*”為診斷結(jié)果,兩者重合表示診斷結(jié)果正確,兩者不重合表示診斷結(jié)果錯(cuò)誤。對(duì)比圖5中三幅圖可以看出,基于融合特征的診斷精度明顯高于兩外兩種方法。
統(tǒng)計(jì)實(shí)驗(yàn)一、實(shí)驗(yàn)二、實(shí)驗(yàn)三分別基于一維數(shù)據(jù)提取特征FDNN、二維數(shù)據(jù)提取特征FCNN、融合特征Ffu的診斷精度,結(jié)果,如表2和圖6所示。

表2 三組實(shí)驗(yàn)診斷結(jié)果Tab.2 Diagnosis Result of the Three Experiments

圖6 三組實(shí)驗(yàn)的診斷結(jié)果Fig.6 Diagnosis Result of the Three Experiments
結(jié)合表2中數(shù)據(jù)和圖6所示的柱狀圖可以看出,在三組實(shí)驗(yàn)中,基于FDNN的診斷精度最低,基于FCNN的診斷精度略高于基于FDNN的診斷精度,約高1~2個(gè)百分點(diǎn);基于融合特征Ffu的診斷精度最高,比另外兩種方法的診斷精度高10%以上。以上數(shù)據(jù)說(shuō)明了深度神經(jīng)網(wǎng)絡(luò)能夠?qū)DNN和FCNN有效融合,提取出更加能夠表征故障特性的深層次融合特征,從而得到了最高的故障診斷精度。
研究了軸承故障時(shí)的多源異構(gòu)數(shù)據(jù)特征融合問(wèn)題,提出了基于深度神經(jīng)網(wǎng)絡(luò)的多源特征融合方法,使用Softmax分類(lèi)器對(duì)融合特征進(jìn)行故障分類(lèi)。經(jīng)驗(yàn)證,得出了以下結(jié)論:(1)深層神經(jīng)網(wǎng)絡(luò)可以將多源異構(gòu)數(shù)據(jù)的特征進(jìn)行有效融合,提取深層次的融合特征;(2)基于融合特征Ffu的診斷精度比單獨(dú)使用FDNN和FCNN的診斷精度高10%以上,驗(yàn)證了本文故障診斷方法的有效性。