宋業(yè)棟,馬光偉,裴國(guó)斌,張俊紅,3
(1.濰柴動(dòng)力股份有限公司,山東 濰坊 261061;2.天津大學(xué) 內(nèi)燃機(jī)燃燒學(xué)國(guó)家重點(diǎn)實(shí)驗(yàn)室,天津 300072;3.天津仁愛(ài)學(xué)院 機(jī)械工程學(xué)院,天津 301636)
柴油機(jī)是工業(yè)、農(nóng)業(yè)、核電及其他領(lǐng)域的主要?jiǎng)恿υ?由于其內(nèi)部結(jié)構(gòu)復(fù)雜,工作環(huán)境惡劣,容易誘發(fā)故障。因此,對(duì)柴油機(jī)工作狀態(tài)的故障檢測(cè)和診斷具有極其重要的意義。傳統(tǒng)上,柴油機(jī)故障診斷方法主要包含信號(hào)處理、特征提取、模式識(shí)別3個(gè)過(guò)程。王鳳利等[1]提出了自適應(yīng)參數(shù)選取的改進(jìn)集合經(jīng)驗(yàn)?zāi)B(tài)分解的信號(hào)分解方法并進(jìn)行了柴油機(jī)氣缸磨損診斷。蔣佳煒等[2]研究了基于小波包能量譜的特征提取方法并采用模糊熵進(jìn)行特征選擇。Xu等[3]提出了基于人工神經(jīng)網(wǎng)絡(luò)、信念規(guī)則推理以及證據(jù)推理的集成模式識(shí)別算法。傳統(tǒng)故障診斷方法需要對(duì)振動(dòng)信號(hào)進(jìn)行大量前處理,且難以表征被測(cè)信號(hào)與故障之間的復(fù)雜映射關(guān)系,限制了診斷準(zhǔn)確率的提高。
深度學(xué)習(xí),作為機(jī)器學(xué)習(xí)領(lǐng)域最新的發(fā)展方向和研究趨勢(shì)之一,為柴油機(jī)的智能診斷帶來(lái)了革命性的進(jìn)步。通過(guò)獲取歷史故障數(shù)據(jù),可建立并訓(xùn)練對(duì)應(yīng)的診斷模型。在訓(xùn)練數(shù)據(jù)充分的前提下,通過(guò)改進(jìn)網(wǎng)絡(luò)結(jié)構(gòu)和增加網(wǎng)絡(luò)深度,構(gòu)建的深度神經(jīng)網(wǎng)絡(luò)能夠挖掘蘊(yùn)含在原始數(shù)據(jù)下的故障信息,減少對(duì)診斷知識(shí)的依賴[4-5]。張永祥等[6]研究了基于加窗與卷積神經(jīng)網(wǎng)絡(luò)(convolutional neural network,CNN)的柴油機(jī)拉缸故障診斷方法。Jiang等[7]提出了基于一維卷積長(zhǎng)短期記憶網(wǎng)絡(luò)的柴油機(jī)工況識(shí)別方法,識(shí)別精度達(dá)到了99.08%。張康等[8]針對(duì)柴油機(jī)失火故障提出了基于隨機(jī)丟棄與批標(biāo)準(zhǔn)化的深度卷積神經(jīng)網(wǎng)絡(luò),對(duì)比傳統(tǒng)方法取得了較高的準(zhǔn)確率。Tamilselvan等[9]從原始信號(hào)出發(fā),采用深度置信網(wǎng)絡(luò)對(duì)飛機(jī)機(jī)翼和飛機(jī)發(fā)動(dòng)機(jī)故障進(jìn)行診斷和預(yù)測(cè)。Sak等[10]所提出的基于循環(huán)神經(jīng)網(wǎng)絡(luò)(recurrent neural network,RNN)的健康指標(biāo)比基于自組織圖的方法具有更好的診斷性能。Ince等[11]提出了一個(gè)快速和準(zhǔn)確的電機(jī)狀態(tài)監(jiān)測(cè)和早期故障檢測(cè)系統(tǒng)使用一維卷積神經(jīng)網(wǎng)絡(luò)。Yu等[12]提出了一種風(fēng)電機(jī)組數(shù)據(jù)驅(qū)動(dòng)故障診斷模型,并利用DBN實(shí)現(xiàn)了該模型。Chung等[13]提出了一個(gè)基于長(zhǎng)短期記憶網(wǎng)絡(luò)(long short term memory,LSTM)的編碼-解碼結(jié)構(gòu),利用重建誤差計(jì)算健康指數(shù)實(shí)現(xiàn)對(duì)剩余有效壽命的估計(jì)。雷亞國(guó)等[14]結(jié)合機(jī)械大數(shù)據(jù)的特點(diǎn)與深度學(xué)習(xí)的優(yōu)勢(shì),提出了一種新的機(jī)械裝備健康監(jiān)測(cè)方法。侯文擎[15]引入粒子群算法來(lái)優(yōu)化構(gòu)建堆棧去噪自編碼器(stacked denoised autoencoder,SDAE),在軸承故障數(shù)據(jù)上改進(jìn)了原始SDAE的分類能力。Janssens等[16]研究深度學(xué)習(xí)是否以及如何應(yīng)用于紅外熱視頻自動(dòng)確定機(jī)器的狀態(tài)。Vincent等[17]總結(jié)了傳統(tǒng)的特征提取方法,并基于快速傅里葉變換后的頻域特征和小波包特征訓(xùn)練去噪自編碼網(wǎng)絡(luò),在試驗(yàn)中指出以頻域特征作為低層輸入獲取的深度特征更適用于以支持向量機(jī)作為分類器的診斷系統(tǒng)。Thirukovalluru等[18]指出棧式去噪自編碼網(wǎng)絡(luò)提取的特征是魯棒的,并評(píng)估了輸入的大小、結(jié)構(gòu)的深度以及稀疏性、去噪等約束參數(shù)對(duì)診斷性能的影響。鑒于傳統(tǒng)自編碼網(wǎng)絡(luò)對(duì)原始輸入信號(hào)局部特征和移變特征處理的不足,Lu等[19]提出了基于正則化稀疏自編碼的局部連接網(wǎng)絡(luò)。雖然堆棧自編碼器網(wǎng)絡(luò)屬于特征自學(xué)習(xí),但現(xiàn)有方法無(wú)法同時(shí)結(jié)合L1和L2正則化優(yōu)點(diǎn),Jia等[20]通過(guò)數(shù)據(jù)點(diǎn)的重復(fù)利用增加了輸入的隨機(jī)性,結(jié)合彈性網(wǎng)激勵(lì)修改損失函數(shù)中的正則化項(xiàng),使其可以更有效地處理高度相關(guān)的變量。當(dāng)訓(xùn)練數(shù)據(jù)有限時(shí),Meng等[21]在自編碼網(wǎng)絡(luò)的隱層上引入“丟棄”技術(shù)防止數(shù)據(jù)過(guò)擬合。Sun等[22]通過(guò)在潛空間上施加先驗(yàn)分布構(gòu)建分類對(duì)抗自編碼網(wǎng)絡(luò),再結(jié)合樣本與預(yù)測(cè)類別分布之間的互信息進(jìn)行無(wú)監(jiān)督聚類,驗(yàn)證了提取特征在嘈雜環(huán)境的魯棒性和跨模態(tài)負(fù)荷下的域自適應(yīng)性。對(duì)于多模態(tài)感知信號(hào),如振動(dòng)信號(hào)和聲信號(hào),Liu等[23]通過(guò)耦合兩個(gè)單模態(tài)自編碼網(wǎng)絡(luò)的隱層表示,提出了基于深度耦合自編碼網(wǎng)絡(luò)的故障診斷模型。
綜上所述,該類方法采用多隱層網(wǎng)絡(luò)以逐層學(xué)習(xí)的方式從輸入數(shù)據(jù)中提取信息,其深層架構(gòu)允許它通過(guò)多級(jí)抽象來(lái)形成高層表示、屬性或類別,挖掘原始數(shù)據(jù)中包含的高維特征,可以減少對(duì)專家知識(shí)的依賴,縮短模型訓(xùn)練時(shí)間,增強(qiáng)模型泛化能力。但在實(shí)際的柴油機(jī)工程場(chǎng)景中,采集到的實(shí)時(shí)數(shù)據(jù)有兩個(gè)特點(diǎn):①不平衡性,柴油機(jī)不可能伴隨故障長(zhǎng)時(shí)間運(yùn)行,大部分時(shí)間工作狀態(tài)良好,很少發(fā)生故障,因此,采集的數(shù)據(jù)嚴(yán)重不平衡,故障數(shù)據(jù)大多不足;②沒(méi)有標(biāo)簽,通過(guò)停止柴油機(jī)運(yùn)行來(lái)監(jiān)測(cè)柴油機(jī)的詳細(xì)健康狀況,但經(jīng)常中斷柴油機(jī)的運(yùn)行是不現(xiàn)實(shí)的,因此這只會(huì)留下故障數(shù)據(jù),而丟失故障類型標(biāo)簽。此外,雖然在發(fā)動(dòng)機(jī)臺(tái)架上模擬故障是快速獲取故障數(shù)據(jù)的一種方式,但不同工況下人為故障的成本極其昂貴,長(zhǎng)期故障工況下運(yùn)行的風(fēng)險(xiǎn)很大。特別是發(fā)動(dòng)機(jī)臺(tái)架試驗(yàn)與實(shí)際運(yùn)行之間的環(huán)境差異不可忽視。當(dāng)標(biāo)簽樣本稀缺時(shí),深度神經(jīng)網(wǎng)絡(luò)容易出現(xiàn)過(guò)擬合,泛化性能較差,導(dǎo)致診斷精度降低。因此,在實(shí)際的診斷任務(wù)中,一個(gè)關(guān)鍵問(wèn)題是如何利用不同設(shè)備不同工況的歷史數(shù)據(jù)和有效挖掘和關(guān)聯(lián)不同的設(shè)備,實(shí)現(xiàn)知識(shí)的遷移和復(fù)用,從而提高設(shè)備在故障樣本稀缺下的分類和泛化能力。
針對(duì)小樣本問(wèn)題,本文提出一種基于深度遷移學(xué)習(xí)的智能故障診斷方法。為探索深度神經(jīng)網(wǎng)絡(luò)的強(qiáng)大特征學(xué)習(xí)能力,首先構(gòu)建一種寬卷積核卷積長(zhǎng)短期記憶神經(jīng)網(wǎng)絡(luò)(wide kernel convolutional long short-term memory,WKCL)。然后,以歸納式遷移學(xué)習(xí)中的模型遷移技術(shù)為基礎(chǔ),提出了一種基于可遷移深度神經(jīng)網(wǎng)絡(luò)的小樣本故障分類方法,致力于解決以下問(wèn)題:①抗噪能力,構(gòu)建改進(jìn)的深度神經(jīng)網(wǎng)絡(luò)診斷模型對(duì)柴油機(jī)振動(dòng)信號(hào)進(jìn)行自動(dòng)特征學(xué)習(xí)和診斷,發(fā)揮寬卷積核和LSTM處理低信噪比數(shù)據(jù)的優(yōu)勢(shì),提高診斷的抗噪性;②小樣本學(xué)習(xí)能力,針對(duì)標(biāo)簽故障樣本稀缺的問(wèn)題,引入模型遷移的方法,在大量源域樣本上訓(xùn)練一個(gè)有效的深度神經(jīng)網(wǎng)絡(luò)診斷模型,然后,采用凍結(jié)特定層和調(diào)優(yōu)的方法,將大型源域數(shù)據(jù)獲取的診斷知識(shí)遷移到目標(biāo)域網(wǎng)絡(luò)上,改進(jìn)網(wǎng)絡(luò)在目標(biāo)域任務(wù)小樣本條件下的訓(xùn)練效率和故障識(shí)別能力。
1.1.1 CNN
CNN是一種多層深度神經(jīng)網(wǎng)絡(luò),可組合低層特征形成更加抽象的高層表示。CNN具有4個(gè)基本特性,即局部特征提取、非線性映射、權(quán)重共享和特征池化。相比全連接網(wǎng)絡(luò),CNN在不損失表達(dá)能力的情況下,可明顯減少可訓(xùn)練的參數(shù),促進(jìn)有效訓(xùn)練。典型的 CNN結(jié)構(gòu)通常包括卷積層、激活函數(shù)、池化層和全連接層,其中,卷積層和池化層是CNN的特有結(jié)構(gòu),也是實(shí)現(xiàn)上述4個(gè)基本特性的關(guān)鍵。本文僅以簡(jiǎn)便的形式展示卷積層和池化層的運(yùn)算過(guò)程,如式(1)所示
(1)
式中:l為層數(shù);σ為激活函數(shù);*為卷積;W為卷積核矩陣;b為偏置項(xiàng);pool為池化,一般為最大值或平均值。
1.1.2 LSTM
最常見(jiàn)的LSTM結(jié)構(gòu)如圖1(a)所示。從圖1(a)可以看出,在每個(gè)序列索引位置t時(shí)刻向前傳播的除了和RNN一樣的隱藏狀態(tài)h(t),還多了另一個(gè)隱藏狀態(tài),如圖1中上面的長(zhǎng)橫線。這個(gè)隱藏狀態(tài)我們一般稱為細(xì)胞狀態(tài),記為C(t)。

(a)
除了細(xì)胞狀態(tài),LSTM還有很多門(mén)控結(jié)構(gòu)。LSTM在每個(gè)序列索引位置t的門(mén)一般包括遺忘門(mén)、輸入門(mén)和輸出門(mén)3種。
(1) 遺忘門(mén)
遺忘門(mén),是控制是否遺忘的,在LSTM中即以一定的概率控制是否遺忘上一層的隱藏細(xì)胞狀態(tài)。遺忘門(mén)子結(jié)構(gòu)如圖1(b)所示。用數(shù)學(xué)表達(dá)式表示為
f(t)=σ(Wfh(t-1)+Ufx(t)+bf)
(2)
式中:Wf,Uf,bf為線性關(guān)系的系數(shù)和偏置,和RNN中的類似;σ為sigmoid激活函數(shù)。
(2) 輸入門(mén)
輸入門(mén)負(fù)責(zé)處理當(dāng)前序列位置的輸入,它的子結(jié)構(gòu)如圖1(c)所示。數(shù)學(xué)表達(dá)式表示為
i(t)=σ(Wih(t-1)+Uix(t)+bi)
(3)
a(t)=tanh(Wah(t-1)+Uax(t)+ba)
(4)
式中:Ua,ba為線性關(guān)系的系數(shù)和偏置;σ為sigmoid激活函數(shù)。
(3) 細(xì)胞狀態(tài)更新
前面的遺忘門(mén)和輸入門(mén)的結(jié)果都會(huì)作用于細(xì)胞狀態(tài)C(t),如圖1(d)所示。用數(shù)學(xué)表達(dá)式表示為
C(t)=C(t-1)⊙f(t)+i(t)⊙a(bǔ)(t)
(5)
式中,⊙為Hadamard積。
(4) 輸出門(mén)
輸出門(mén)的子結(jié)構(gòu)如圖1(e)所示,從圖1(e)可以看出,隱藏狀態(tài)h(t)的更新由兩部分組成,數(shù)學(xué)表達(dá)式為
o(t)=σ(Woh(t-1)+Uox(t)+bo)
(6)
h(t)=o(t)⊙tanh(C(t))
(7)
在經(jīng)典CNN[24]和LSTM[25]模型的啟發(fā)下,構(gòu)建了WCCL網(wǎng)絡(luò),該網(wǎng)絡(luò)的整體架構(gòu)與普通的1D-CNN類似,如圖2所示。WKCL網(wǎng)絡(luò)的輸入是一段原始的柴油機(jī)故障振動(dòng)時(shí)域信號(hào),模型的總體架構(gòu)與普通1D-CNN模型相同,共有4組卷積層和池化層,用以提取原始信號(hào)的局部特征。卷積核的數(shù)量逐漸增加,分別為16個(gè)、32個(gè)、64個(gè)和128個(gè),從而在網(wǎng)絡(luò)的較高層獲得更多的鑒別特征。每層卷積操作之后均進(jìn)行批量歸一化處理(batch Normalization,BN)[26],以減少網(wǎng)絡(luò)各層特征學(xué)習(xí)的差異。激活函數(shù)采用LeakyReLU[27],來(lái)彌補(bǔ)ReLU函數(shù)在負(fù)區(qū)間內(nèi)的學(xué)習(xí)能力。然后進(jìn)行 2×1 的最大值池化,將池化后的輸出特征大小減半,來(lái)降低網(wǎng)絡(luò)的復(fù)雜性。網(wǎng)絡(luò)輸出層為Softmax,用于獲取每個(gè)輸入樣本的類別概率輸出。最后,基于交叉熵?fù)p失函數(shù),通過(guò)反向傳播更新各層參數(shù)。WKCL網(wǎng)絡(luò)的優(yōu)勢(shì)在于:①第一層卷積層采用寬卷積核;②最后一層池化層后面增加LSTM網(wǎng)絡(luò)。具體結(jié)構(gòu)參數(shù)如表1所示。

表1 WKCL各層參數(shù)設(shè)置

圖2 WKCL網(wǎng)絡(luò)結(jié)構(gòu)
1.2.1 寬卷積核卷積層的降噪處理
卷積層利用卷積核對(duì)輸入信號(hào)(或特征)的局部區(qū)域進(jìn)行卷積運(yùn)算,生成相應(yīng)的特征。它的函數(shù)類似于短時(shí)傅里葉變換。柴油機(jī)振動(dòng)信號(hào)的信噪比較低,小的卷積核難以捕捉中低頻特性,易受高頻噪聲的影響。當(dāng)噪聲較大時(shí),選取較大的卷積核有利于提升模型的抗噪性能[28]。本文第一層卷積步長(zhǎng)設(shè)置為16,卷積核寬度為步長(zhǎng)的4倍,大小為64×1。而為了增強(qiáng) WKCL的學(xué)習(xí)能力,除第一層外,其余卷積層的卷積核大小均為3×1,此部分的小卷積核有利于加深網(wǎng)絡(luò),同時(shí)可以抑制過(guò)擬合。
1.2.2 LSTM層的降噪處理
RNN適用于處理時(shí)間序列,即需要考慮輸入先后順序的問(wèn)題。LSTM是一種改進(jìn)后的RNN,憑借巧妙的門(mén)控結(jié)構(gòu)和隱藏的細(xì)胞狀態(tài),解決了標(biāo)準(zhǔn)RNN存在的長(zhǎng)期依賴問(wèn)題。
本文采用原始時(shí)域信號(hào)作為輸入,具有明顯的時(shí)間相關(guān)性。在網(wǎng)絡(luò)的前部分,以特征學(xué)習(xí)為主,保證故障特征的全面性。而在網(wǎng)絡(luò)的后部分,額外考慮特征出現(xiàn)的先后順序,提升在惡劣噪聲環(huán)境下,對(duì)柴油機(jī)故障診斷的容錯(cuò)性。使用的LSTM基本參數(shù)設(shè)置為Input size=128,Hidden size=128,Num layers=2。
基于深度神經(jīng)網(wǎng)絡(luò)的模型遷移,屬于歸納式遷移學(xué)習(xí)的一種。擅長(zhǎng)處理的問(wèn)題具有以下要求:①大量的伴隨標(biāo)簽的源域數(shù)據(jù)集;②少量的伴隨標(biāo)簽的目標(biāo)域數(shù)據(jù)集;③源域數(shù)據(jù)和目標(biāo)域數(shù)據(jù)可以來(lái)源于相似但是不同的分布。模型遷移的目的在于將從源領(lǐng)域?qū)W到的知識(shí)遷移到數(shù)據(jù)量少的目標(biāo)域,提高目標(biāo)域任務(wù)的小樣本分類性能。
基于WKCL的模型遷移故障診斷流程如圖3所示。第一步,基于構(gòu)建的大型標(biāo)簽源域數(shù)據(jù)集,采用傳統(tǒng)的監(jiān)督式深度神經(jīng)網(wǎng)絡(luò)訓(xùn)練方法,對(duì)所提的 WKCL 進(jìn)行充分預(yù)訓(xùn)練,預(yù)訓(xùn)練好的模型其各層參數(shù)獲得了源域數(shù)據(jù)集的診斷知識(shí)。第二步,利用深度神經(jīng)網(wǎng)絡(luò)學(xué)習(xí)的特征在底層更通用,而在高層更加具體這一特點(diǎn),通過(guò)固定預(yù)訓(xùn)練網(wǎng)絡(luò)的底層參數(shù),同時(shí)利用少量目標(biāo)域訓(xùn)練樣本對(duì)高層參數(shù)進(jìn)行微調(diào)的方法,進(jìn)行模型遷移,獲得最終適用于目標(biāo)域的診斷模型。
2.1.1 A:柴油機(jī)故障數(shù)據(jù)集
試驗(yàn)數(shù)據(jù)來(lái)源于某六缸柴油機(jī),試驗(yàn)臺(tái)總體布局與主要技術(shù)參數(shù)如圖4和表2所示,詳細(xì)的傳感器布局、故障模擬方案以及信號(hào)采集過(guò)程詳見(jiàn)文獻(xiàn)[29]。

表2 柴油機(jī)主要技術(shù)參數(shù)

圖4 試驗(yàn)臺(tái)總體布局
試驗(yàn)采用PCB公司的ICP 356A26型三向壓電式加速度傳感器,采集怠速和空載狀態(tài)下的缸蓋信號(hào),采樣頻率為25 kHz,一個(gè)工作循環(huán)包含3 152個(gè)采樣點(diǎn)。基于以上設(shè)置,試驗(yàn)共模擬了柴油機(jī)燃油系統(tǒng)和配氣機(jī)構(gòu)11種常見(jiàn)故障,如表3所示。12種不同故障狀態(tài)單周期時(shí)域波形如圖5所示,記為正常,故障1~故障11。

表3 故障類型

(a) 正常
2.1.2 B:軸承故障數(shù)據(jù)集
軸承是柴油機(jī)動(dòng)力總成的關(guān)鍵部件,軸承故障也是影響柴油機(jī)正常運(yùn)轉(zhuǎn)的常見(jiàn)故障之一。為了驗(yàn)證提出的方法在不同數(shù)據(jù)集間的遷移效果,額外使用了凱斯西儲(chǔ)大學(xué)軸承故障數(shù)據(jù)集作為目標(biāo)域數(shù)據(jù)集[30]。電機(jī)驅(qū)動(dòng)機(jī)械系統(tǒng)如圖6所示。軸承故障有6種類型:正常故障、球圈故障、內(nèi)圈故障和3種不同位置的外圈故障。本文選擇了1 797 r/min和1 772 r/min兩種電機(jī)轉(zhuǎn)速下的數(shù)據(jù),共計(jì)12組。詳細(xì)數(shù)據(jù)說(shuō)明如表4所示。

表4 滾動(dòng)軸承故障數(shù)據(jù)集
試驗(yàn)使用的深度學(xué)習(xí)框架為Facebook公司的PyTorch,所用計(jì)算機(jī)的配置為 CPU i7 10700,16 GB內(nèi)存。利用Python在PyTorch環(huán)境下搭建本文提出的模型。本文提供了3個(gè)算例,第一個(gè)算例測(cè)試WKCL模型的抗噪性;第二個(gè)算例測(cè)試遷移模型在不同故障域診斷能力;第三個(gè)算例測(cè)試遷移模型在不同設(shè)備間的診斷能力。試驗(yàn)將目標(biāo)域樣本的分為訓(xùn)練集、驗(yàn)證集和測(cè)試集,比例為0.5∶0.25∶0.25。其中,驗(yàn)證集不參與模型訓(xùn)練,用于監(jiān)控模型是否發(fā)生過(guò)擬合來(lái)決定是否停止訓(xùn)練并調(diào)整超參數(shù)。所有算例測(cè)試結(jié)果中列出的是訓(xùn)練集的樣本數(shù)量和測(cè)試集的平均準(zhǔn)確率。
2.2.1 算例1:WKCL模型診斷精度與抗噪性
用數(shù)據(jù)集A測(cè)試所提的WKCL模型的準(zhǔn)確率,與傳統(tǒng)機(jī)器學(xué)習(xí)方法、MLP(multi-layer perceptron)、WDCNN(deep convolutional neural networks with wide first layer kernel)、LSTM進(jìn)行比較,結(jié)果如圖7所示。

圖7 WKCL與其他方法準(zhǔn)確率對(duì)比
由結(jié)果可知,與傳統(tǒng)機(jī)器學(xué)習(xí)相比,深度學(xué)習(xí)具有明顯優(yōu)勢(shì),WDCNN、LSTM、WKCL平均精度超過(guò)95%,MLP由于網(wǎng)絡(luò)結(jié)構(gòu)簡(jiǎn)單,略遜一籌,但仍然略強(qiáng)于TML(traditional machine learning)。在無(wú)噪聲環(huán)境,本文提出的方法優(yōu)勢(shì)并不明顯。為了進(jìn)一步驗(yàn)證這3個(gè)網(wǎng)絡(luò)的抗噪性,模擬柴油機(jī)工作環(huán)境的噪聲污染,在原始信號(hào)加入加性高斯白噪聲[31],如式(1)所示。Psignal和Pnoise分別表示信號(hào)與噪聲的能量,信號(hào)中所含噪聲越多,SNR(signal-noise ratio)值就越小。當(dāng)SNR值為0時(shí),信號(hào)與噪聲所含能量相等。
(8)

正常狀態(tài)的原始信號(hào)、噪聲信號(hào)以及帶噪聲信號(hào)如圖8所示。

(a) 原始信號(hào)
3種方法在不同信噪比條件下的診斷精度如圖9所示,可知,WKCL的抗噪性更強(qiáng),且信噪比越低即噪聲信號(hào)越大,優(yōu)勢(shì)越明顯。

圖9 不同信噪比條件下的診斷精度
提出的WKCL網(wǎng)絡(luò)能實(shí)現(xiàn)優(yōu)越的分類性能,得益于兩個(gè)條件:一是大量的帶標(biāo)簽的訓(xùn)練數(shù)據(jù);二是目標(biāo)域和源域數(shù)據(jù)滿足獨(dú)立同分布。然而,在實(shí)際工業(yè)應(yīng)用中,某些研究任務(wù)很難獲取大量的標(biāo)注數(shù)據(jù),并且測(cè)試數(shù)據(jù)與訓(xùn)練數(shù)據(jù)難以滿足獨(dú)立同分布的。如圖10所示,同等噪聲環(huán)境下(SNR=0),隨著目標(biāo)域任務(wù)的標(biāo)簽數(shù)據(jù)的減少,深度神經(jīng)網(wǎng)絡(luò)的診斷能力指數(shù)型下降。特別地,當(dāng)每種狀態(tài)的樣本數(shù)量下降到1 000時(shí),診斷精度將低于80%。

圖10 不同樣本數(shù)量下的診斷精度
為了解決上述實(shí)際問(wèn)題,后面兩個(gè)算例將會(huì)詳細(xì)討論基于遷移學(xué)習(xí)進(jìn)行跨域診斷在小樣本上的優(yōu)勢(shì)。
2.2.2 算例2:跨故障域遷移
為研究不同故障域的遷移效果,將數(shù)據(jù)集A分成兩部分,數(shù)據(jù)集A1:正常和故障1~5;數(shù)據(jù)集A2:故障6~故障11。本文假定數(shù)據(jù)集 A1代表實(shí)際情況中故障率大,容易獲取的數(shù)據(jù)集,數(shù)據(jù)集 A2代表故障率大,難獲取的數(shù)據(jù)集。為了解決目標(biāo)域數(shù)據(jù)集A2可能存在的樣本不足問(wèn)題,首先以數(shù)據(jù)集 A1作為源域數(shù)據(jù)進(jìn)行WKCL模型訓(xùn)練,然后利用數(shù)據(jù)集A2對(duì)遷移模型的優(yōu)化層進(jìn)行訓(xùn)練和測(cè)試,同時(shí)加入SNR=0的噪聲,結(jié)果如圖11所示。結(jié)果顯示,由于樣本不足,僅使用WKCL直接對(duì)A2數(shù)據(jù)進(jìn)行訓(xùn)練的效果很差,且精度隨著樣本數(shù)量減少持續(xù)下降。而深度遷移學(xué)習(xí)方法在精度上優(yōu)勢(shì)明顯,對(duì)樣本數(shù)量的依賴性也更小。需要解釋一點(diǎn),1 000樣本時(shí)僅對(duì)A2數(shù)據(jù)的診斷精度比2.2.1節(jié)高的原因是本節(jié)是6分類問(wèn)題,而2.2.1節(jié)是12分類問(wèn)題。

圖11 小樣本下跨故障域診斷結(jié)果
由結(jié)果可知,在提出的具備抗噪性的WKCL模型的基礎(chǔ)上,充足的源域樣本大大提高了預(yù)訓(xùn)練網(wǎng)絡(luò)的特征提取能力,并凍結(jié)了能夠發(fā)揮此能力的網(wǎng)絡(luò)層,使得網(wǎng)絡(luò)在處理目標(biāo)域同構(gòu)振動(dòng)信號(hào)時(shí),首先能有效放大不同故障之間的特征差異,其次僅需要少量的目標(biāo)域樣本微調(diào)分類層的網(wǎng)絡(luò)參數(shù)并賦予新的標(biāo)簽,從而實(shí)現(xiàn)目標(biāo)域新的故障診斷任務(wù)。
該算例說(shuō)明了,當(dāng)某種故障樣本受到限制時(shí),在提出的WKCL模型基礎(chǔ)上,同一設(shè)備的不同故障數(shù)據(jù),即源域目標(biāo)域來(lái)自于同一采集時(shí)間和空間,具備相同的采樣頻率的信噪比時(shí),利用同設(shè)備的其他故障數(shù)據(jù)進(jìn)行預(yù)訓(xùn)練,將學(xué)習(xí)到的知識(shí)遷移到目標(biāo)任務(wù),可有效提高診斷精度。
同設(shè)備遷移任務(wù)在此算例中得到驗(yàn)證,算例3進(jìn)一步分析了跨設(shè)備域診斷任務(wù)的可遷移性。
2.2.3 算例3:跨設(shè)備域遷移
本節(jié)以柴油機(jī)故障數(shù)據(jù)數(shù)據(jù)集A和軸承故障數(shù)據(jù)數(shù)據(jù)集B分別作為源域和目標(biāo)域,圖12示出了診斷結(jié)果。當(dāng)數(shù)據(jù)集B作為目標(biāo)域時(shí),與算例2相似,使用模型遷移之后表現(xiàn)更好;然而,當(dāng)數(shù)據(jù)集A作為目標(biāo)域時(shí),雖然模型遷移有一定作用,但整體效果均不理想。

圖12 小樣本下跨設(shè)備域診斷結(jié)果
結(jié)合數(shù)據(jù)集特點(diǎn)作進(jìn)一步分析。一方面,與柴油機(jī)故障數(shù)據(jù)相比,軸承故障數(shù)據(jù)差異性更強(qiáng)、一致性更高,因此數(shù)據(jù)集B作為目標(biāo)域時(shí),需求的樣本更少,而數(shù)據(jù)集A作為目標(biāo)域時(shí),受小樣本的影響,導(dǎo)致無(wú)論是否進(jìn)行模型遷移,精度都很差。另一方面,柴油機(jī)故障數(shù)據(jù)特征更復(fù)雜,信噪比也更高,所以數(shù)據(jù)集A作為源域數(shù)據(jù)可以讓模型獲取更豐富的特征與更強(qiáng)的特征區(qū)分能力,反之則不然。本算例說(shuō)明,提出的WKCL模型經(jīng)過(guò)預(yù)訓(xùn)練學(xué)習(xí)到的關(guān)于柴油機(jī)故障特征的知識(shí),可遷移到軸承的故障診斷任務(wù)中。
該方法的核心思想是將不同故障域和數(shù)據(jù)集的歷史數(shù)據(jù)訓(xùn)練深度神經(jīng)網(wǎng)絡(luò)獲得的診斷知識(shí)遷移到新的目標(biāo)域任務(wù)中,從而提高目標(biāo)診斷任務(wù)在樣本稀缺情況下的分類能力。所提方法一方面構(gòu)建多層深度神經(jīng)網(wǎng)絡(luò),自適應(yīng)的從原始振動(dòng)信號(hào)自動(dòng)提取特征,改進(jìn)了特征提取的抗噪性和有效性。另一方面,進(jìn)一步將模型遷移方案應(yīng)用到WKCL中,通過(guò)固定特定層參數(shù)和調(diào)優(yōu)其余層的方法,有效遷移大型源域數(shù)據(jù)的診斷知識(shí)到目標(biāo)域任務(wù)上,促進(jìn)了目標(biāo)診斷網(wǎng)絡(luò)的快速和有效訓(xùn)練,改善了目標(biāo)域任務(wù)診斷性能。
試驗(yàn)結(jié)果表明,相比其他深度神經(jīng)網(wǎng)絡(luò)方法,所提方法呈現(xiàn)更好的抗噪性能和計(jì)算精度。但隨著目標(biāo)域標(biāo)記數(shù)據(jù)的減少,深度神經(jīng)網(wǎng)絡(luò)的診斷能力仍然會(huì)大幅度降低。同時(shí),研究發(fā)現(xiàn),當(dāng)某一故障樣本有限時(shí),利用同一設(shè)備的其他故障數(shù)據(jù)將學(xué)習(xí)到的知識(shí)轉(zhuǎn)移到目標(biāo)任務(wù)中,可以有效地提高診斷精度。另外,所提出的WKCL模型通過(guò)預(yù)訓(xùn)練獲得的柴油機(jī)故障特征知識(shí)也可以轉(zhuǎn)移到軸承故障診斷任務(wù)中,反之效果很差。因此,模型遷移的性能與目標(biāo)域訓(xùn)練數(shù)據(jù)的大小、目標(biāo)域和源域的相似程度以及信噪比均有關(guān)。目標(biāo)域任務(wù)參與的訓(xùn)練數(shù)據(jù)越多,與源域任務(wù)更相似,則遷移性能越好,分類精度越高。因此,為提高模型遷移性能,除建立強(qiáng)大的深度神經(jīng)網(wǎng)絡(luò)診斷模型外,訓(xùn)練數(shù)據(jù)的數(shù)量和質(zhì)量仍然是兩個(gè)至關(guān)重要的因素。