單外平,曾雪瓊
(華南理工大學(xué) 機(jī)械與汽車工程學(xué)院,廣東 廣州 510640)
基于深度信念網(wǎng)絡(luò)的信號重構(gòu)與軸承故障識別
單外平,曾雪瓊
(華南理工大學(xué) 機(jī)械與汽車工程學(xué)院,廣東 廣州 510640)
針對傳統(tǒng)智能識別需要復(fù)雜的特征提取過程,增加了操作的難度和不確定性,采用深度信念網(wǎng)絡(luò)(Deep Belief Network,DBN)直接從原始數(shù)據(jù)對故障智能識別的方法。該方法避免了人工特征提取過程,增強了識別的智能性。將以原始數(shù)據(jù)為輸入的DBN應(yīng)用于軸承故障識別,接近100%正確識別率的實驗結(jié)果表明:DBN可以直接通過原始數(shù)據(jù)對軸承故障進(jìn)行高效識別。
特征提取;受限玻爾茲曼機(jī);DBN;深度學(xué)習(xí);故障識別
故障智能識別實質(zhì)上是通過機(jī)器學(xué)習(xí)對能刻畫故障的特征進(jìn)行故障識別,因此選定的特定特征是智能診斷的關(guān)鍵影響因素。應(yīng)用于機(jī)械故障智能診斷領(lǐng)域的特定特征可分為三類,即單變量特征,多變量特征和圖像特征。單變量特征是指只有一個變量特征,如峭度,特征頻率等,其相對簡單,易于理解與操作,但因只涉及到單一特征,忽略了其他有用信息,導(dǎo)致故障識別效果較差。多變量特征是組合多個單變量特征而成的綜合特征,它能更加全面的描述故障信息。但多變量特征的具體選取,直接受人為主觀因素影響。圖像特征,一般是先通過時頻分析把信號轉(zhuǎn)化為時頻圖像,再按圖像處理方式提取相應(yīng)故障特征。以上3類特征均易受到人為因素的影響,增加了分析的不確定性,也削弱了機(jī)器學(xué)習(xí)的智能性,實際上已偏離了人工智能與機(jī)器學(xué)習(xí)的最初宗旨。其次,為得到可觀的效果,基于上述研究方法的模型越趨復(fù)雜,模型的適用條件易于被忽視,導(dǎo)致操作困難。
深度信念網(wǎng)絡(luò)(Deep Belief Network,DBN)是一種深度學(xué)習(xí)(Deep Learning)網(wǎng)絡(luò),由Hinton等[1]在2006年提出。DBN可通過組合低層特征形成更加抽象的高層表示,以發(fā)現(xiàn)數(shù)據(jù)分布式特征表示;是一種可以直接從低層原始信號出發(fā),逐層貪婪學(xué)習(xí)得到高層特定特征的學(xué)習(xí)網(wǎng)絡(luò)。DBN無需人工特征提取過程,從而避免了傳統(tǒng)特征提取過程所帶來的復(fù)雜性和不確定性,增強識別過程的智能性。
文中通過對振動信號的低失真度重構(gòu),解釋深度學(xué)習(xí)網(wǎng)絡(luò)具有組合低層數(shù)據(jù)特征并挖掘其分布式特征的能力,再次直接從原始數(shù)據(jù)出發(fā),無需人為特征提取中間過程,對軸承故障類型和故障程度進(jìn)行診斷。減少了人為參與因素,增強了機(jī)器學(xué)習(xí)的智能性。
由多個受限玻爾茲曼機(jī) (Restricted Boltzmann Machine,RBM)堆疊可形成基于RBM的DBN模型,圖1是一個由3 個RBM堆疊而成的DBN模型。每個RBM由兩層網(wǎng)絡(luò)組成,即可視層(v)和隱藏層(h),層與層之間通過權(quán)重(w)連接。第一可視層v1為初始輸入數(shù)據(jù),和第一隱藏層h1組成第一個RBM(RBM1);第一隱藏層h1作為第二可視層v2,并和第二隱藏層h2組成第二個RBM(RBM2);第二隱藏層h2作為第三可視層v3,并和第三層隱藏層h3組成第三個RBM(RBM3)。各層內(nèi)部相互獨立,但數(shù)據(jù)可通過激活函數(shù)按RBM學(xué)習(xí)規(guī)則在層間相互轉(zhuǎn)換。輸入數(shù)據(jù)經(jīng)低層的RBM學(xué)習(xí)后輸出,并作為高一層RBM的輸入,依次逐層傳遞,在高層形成比低層更抽象和更具有表征能力的特征表達(dá),這是DBN中逐層貪婪學(xué)習(xí)主要思想[2],也是DBN可直接通過原始數(shù)據(jù)對軸承故障進(jìn)行識別的主要原因。

圖1 DBN結(jié)構(gòu)Fig.1 DBN structure
DBN學(xué)習(xí)過程包含兩部分:由低層到高層的前向堆疊RBM學(xué)習(xí)和由高層到低層的后向微調(diào)學(xué)習(xí)。
1.1 前向堆疊RBM學(xué)習(xí)
RBM源于能量模型,每層網(wǎng)絡(luò)中有若干神經(jīng)元,同一層神經(jīng)元之間相互獨立,且只有未激活與激活兩種狀態(tài),可用二進(jìn)制0與1表示,并根據(jù)概率統(tǒng)計法則決定取值。假設(shè)一個RBM中有n個可視單元和m個隱藏單元,用v和h分別表示可視層和隱藏層的狀態(tài),v=(v1,v2…,vn),h=(h1,h2…,hm),定義該RBM能量函數(shù)

其中θ={w,b,a},vi為第i個可視單元的狀態(tài),hj為第j個隱藏層單元的狀態(tài),ai為可視單元i的偏置,bj為隱藏單元j的偏置,wij為連接可視單元i和隱藏單元j的權(quán)重。
定義一個可視節(jié)點和隱藏節(jié)點的聯(lián)合概率


因隱藏層內(nèi)部和可視層內(nèi)部均不存在連接,式(3)和(4)可進(jìn)一步推導(dǎo)得激活函數(shù)

采用極大似然法最大化式(7),求取參數(shù)θ

使用隨機(jī)梯度上升法求取似然函數(shù)最大值,對參數(shù)θ求偏導(dǎo)得

為此,Hinton等[4]提出經(jīng)少數(shù)訓(xùn)練就可以得到P(v,h)較好估計的對比差異度CD(Contrastive Divergence)快速算法。該快速算法來源于Gibbs抽樣,先利用公式(5)計算所有隱藏層單元的條件概率,并用Gibbs抽樣確定隱藏單元狀態(tài),再根據(jù)公式(6)計算可視單元的條件概率,再次用Gibbs抽樣確定可視層狀態(tài),此時相當(dāng)于產(chǎn)生了對上一步可視層的一個重構(gòu)。因此,使用梯度上升法最大化似然函數(shù)(7),參數(shù)θ={w,b,a}的更新準(zhǔn)則為

式中,ε是學(xué)習(xí)率,<·>P(h|v)為偏導(dǎo)函數(shù)在P(h|v)分布下的期望,<·>recon為偏導(dǎo)函數(shù)在重構(gòu)模型分布下的期望。
1.2 后向微調(diào)學(xué)習(xí)
前向堆疊RBM學(xué)習(xí)屬于無監(jiān)督學(xué)習(xí),把無監(jiān)督學(xué)習(xí)到的模型參數(shù)當(dāng)作有監(jiān)督學(xué)習(xí)參數(shù)的初始化,相當(dāng)于為監(jiān)督學(xué)習(xí)提供了輸入數(shù)據(jù)的先驗知識,模型訓(xùn)練結(jié)果可得到進(jìn)一步優(yōu)化。此優(yōu)化過程是從DBN網(wǎng)絡(luò)最后一層出發(fā),利用已知標(biāo)簽逐步向低層微調(diào)模型參數(shù),稱為后向微調(diào)學(xué)習(xí)。網(wǎng)絡(luò)最后一層由Soft-max作為分類器模型,Soft-max模型實質(zhì)上是多分類的邏輯回歸模型。設(shè)DBN深度網(wǎng)絡(luò)一共由l個RBM堆疊而成,初始樣本x,最后一層輸出向量為ul(x)

第i個樣本經(jīng)前向l層堆疊RBM學(xué)習(xí)后,屬于類別yi,yi∈(1,2,…,c)的概率是

V為參數(shù)系數(shù),選取最大概率所對應(yīng)的類別即為Softmax模型判定類別。
第l層誤差函數(shù)表達(dá)式為

ρ為權(quán)重衰減率,λl={wl,bl,cl,Vl},1{yi=k}為邏輯指示函數(shù),當(dāng)yi=k時,值為1;當(dāng)yt≠k時,值為0。為求誤差最小值,使用梯度下降法,對參數(shù)求偏導(dǎo)

微調(diào)參數(shù)

α為學(xué)習(xí)率,依次類推,微調(diào)1到l層相關(guān)參數(shù)。
結(jié)合上面DBN理論所述,基于深度學(xué)習(xí)的故障識別主要步驟如下:
1)采集振動數(shù)據(jù),按照一定規(guī)則分組,設(shè)置訓(xùn)練組和測試組數(shù)據(jù);
2)將訓(xùn)練數(shù)據(jù)輸入第一層RBM,從第一層到高層逐層貪婪學(xué)習(xí)DBN中所有RBM;
3)根據(jù)訓(xùn)練組的標(biāo)簽數(shù)據(jù)和Soft-max分類規(guī)則,在2)的基礎(chǔ)上從最高層往最低層逐步后向微調(diào)參數(shù),完成DBN模型的整個訓(xùn)練過程;
4)將測試數(shù)據(jù)輸入3)中模型,并計算故障識別的正確識別率。
為解釋DBN可無需人工參與卻可自動學(xué)習(xí)得到特征的能力,進(jìn)一步對DBN的輸出值探討。但DBN中最后一層RBM輸出值為概率值P(h|v)和連接權(quán)值w,P(h|v)為節(jié)點被激活的概率,P(h|v)和w數(shù)值并不易量化和觀察。由公式(5)(6)可知,RBM層間均通過sigmoid函數(shù)連接的。實際上,DBN的前向堆疊RBM學(xué)習(xí)過程可看作是由堆疊RBM組成的sigmoid函數(shù)編碼過程,簡稱RBM-Encode。假如能通過解碼方式重構(gòu)輸入信號,且與原始信號存在較少差異,說明DBN可以低失真度的恢復(fù)原始信號,也就不難理解DBN具有組合低層數(shù)據(jù)特征并挖掘其分布式特征的能力,即不難理解DBN擁有自動學(xué)習(xí)特征的能力。為不重復(fù)上述推導(dǎo),且方便表達(dá),將前向堆疊RBM學(xué)習(xí)過程統(tǒng)一用編碼過程簡單描述。為設(shè)輸入數(shù)據(jù)x,編碼函數(shù)定義

對應(yīng)的解碼函數(shù)定義為

RBM-Encode是DBN的一部分,在基于DBN的故障識別步驟上,可得相應(yīng)的振動信號重構(gòu)步驟。
1)采集振動數(shù)據(jù),按實際選擇樣本數(shù)據(jù)點數(shù);
2)將原始信號數(shù)據(jù)輸入第一層RBM可視層v1,學(xué)習(xí)得隱藏層h1和連接權(quán)值w1;
3)將隱藏層h1作為第二層RBM可視層v2,學(xué)習(xí)得隱藏層w2和連接權(quán)值w2;
4)重復(fù)步驟2),直到所有RBM都學(xué)習(xí)完畢。此過程可稱編碼過程,最高層輸出的隱藏層稱編碼層。
5)將編碼層數(shù)據(jù)反向逐層解碼,可得到與原始信號對應(yīng)的重構(gòu)信號。
6)如果在步驟5)前增加與DBN對應(yīng)的后向微調(diào)步驟,再將編碼層數(shù)據(jù)反向逐層解碼,可以得到微調(diào)后的重構(gòu)信號。

圖2 振動信號的重構(gòu)Fig.2 Reconstruction of vibration signal
假設(shè)按實際需求選擇樣本數(shù)據(jù)點數(shù)為512,即截取原始信號長度中的512個數(shù)據(jù)點為輸入維數(shù)。DBN由隱藏層分別為1 000,800,400的3個RBM組成。編碼層為目標(biāo)層,相當(dāng)于故障識別模型中的故障種類,因與第三層隱藏層(400維)同樣按RBM規(guī)則編碼,可把這兩層組成第四層RBM(Top RBM4)。基于DBN振動信號重構(gòu)的步驟可形象表示如圖2。
通常情況下,復(fù)雜的振動信號都可以由多正弦信號疊加而成,為方便觀察振動信號經(jīng)DBN重構(gòu)的效果,以正弦信號為基礎(chǔ),分別仿真如表1幾種信號。

表1 仿真信號Tab.1 Simulated signal
采樣頻率10 240 Hz,采樣時間8 s,設(shè)置樣本長度為512個數(shù)據(jù)點,將160個樣本輸入到隱藏層分別為1000,800,400,目標(biāo)層為48的DBN重構(gòu)網(wǎng)絡(luò)中。經(jīng)編碼和解碼后,效果對比如圖3。
由圖4可知,簡易正信號、縮放平移信號和幅值0.8 mm信號的重構(gòu)信號與原始信號差異性較小,且微調(diào)重構(gòu)信號明顯優(yōu)于未微調(diào)信號,說明微調(diào)有利于DBN學(xué)習(xí)。簡易負(fù)信號的重構(gòu)信號均逼近0值,說明負(fù)信號不適應(yīng)該網(wǎng)絡(luò)。因網(wǎng)絡(luò)在編碼和解碼中均采用了sigmoid函數(shù),該函數(shù)值域范圍為[0-1],當(dāng)輸入值為負(fù)數(shù)時,經(jīng)sigmoid函數(shù)計算后均為趨近0的正值。簡易正弦信號也有一半為負(fù)值,其重構(gòu)信號與原始信號偏差很大。幅值1.6 mm信號的重構(gòu)信號在幅值大于1 mm時,出現(xiàn)平滑恒值,與原始信號相差較遠(yuǎn)。因為sigmoid函數(shù)值域范圍為[0-1],超過1的部分計算后恒趨于1。由上分析可知,DBN具有重構(gòu)原始信號的能力,但輸入數(shù)據(jù)的取值范圍應(yīng)該限定在[0-1]。

圖3 仿真信號重構(gòu)比較圖Fig.3 Reconstruction of simulated signal
為使輸入數(shù)據(jù)的取值范圍滿足[0-1],需對原始數(shù)據(jù)進(jìn)行簡單預(yù)處理,即歸一化。為保證原始數(shù)據(jù)結(jié)構(gòu)相對不變,采用平移線性歸一化,公式為

仿真較復(fù)雜的變振幅變頻率振動疊加信號:

式中Ai={2,4,6,8},fi={32,64,96,128}。
按照上述設(shè)置輸入到相同的DBN重構(gòu)網(wǎng)絡(luò)中,得到重構(gòu)效果如圖5,本圖中“原始信號”是指簡單預(yù)處理后信號。由圖4可見,經(jīng)歸一化簡單處理后,DBN能對振動信號較好的重構(gòu)。
為不失通用性,選用美國西儲大學(xué)軸承數(shù)據(jù)中心網(wǎng)站公開數(shù)據(jù)[5]。實驗?zāi)M了4種狀態(tài):正常,滾動體故障,內(nèi)圈故障和外圈故障;每種故障有0.018 mm,0.036 mm和0.053 mm 3種直徑尺寸,分別模擬輕度、中度和重度故障。試驗時為空載荷,轉(zhuǎn)軸轉(zhuǎn)速1 792 r/min,加速度傳感器采樣頻率48 kHz,持續(xù)采樣時間約5 s,詳細(xì)數(shù)據(jù)描述如表2。

圖4 仿真信號歸一化后重構(gòu)比較圖Fig.4 Reconstruction of simulated signal with normalization

表2 實驗工況描述Tab.2 Description of the experimental conditions
轉(zhuǎn)軸轉(zhuǎn)一圈,傳感器約采集1 600個數(shù)據(jù)點,為研究樣本長度在1圈內(nèi)對DBN算法的影響,以100數(shù)據(jù)點為步長,設(shè)置成16組(1 600/100=16)不同樣本長度的數(shù)據(jù)。為保證每種樣本長度數(shù)據(jù)均具有相同訓(xùn)練和測試樣本,試驗時均隨機(jī)選用75個訓(xùn)練樣本和75個測試樣本。整合表1中10類數(shù)據(jù)的訓(xùn)練樣本和測試樣本,最終一共可得到750個訓(xùn)練樣本和750個測試樣本。將數(shù)據(jù)簡單歸一化處理后輸入到隱含層分別是200,500,1 000的3層RBM深度網(wǎng)絡(luò)中,其他參數(shù)均選用文獻(xiàn)[1]的預(yù)設(shè)值。

表3 16組數(shù)據(jù)故障狀態(tài)識別Tab.3 Fault identification of the 16 types of data
表3為16組數(shù)據(jù)經(jīng)DBN計算后,所對應(yīng)的故障識別情況。由表可知,16組數(shù)據(jù)的正確識別率均較高,最低的有84.9%,最高的有99.6%,說明直接通過原始數(shù)據(jù)利用DBN對軸承故障狀態(tài)進(jìn)行高精度識別的可行性,進(jìn)一步說明DBN具有可以通過組合低層特征形成更加抽象高層表示的能力。從第2組到第16組,雖然識別率有一定的提升,但相差很小,說明當(dāng)樣本長度增加到一定程度時,樣本長度對正確識別影響不大。
在智能識別領(lǐng)域中,傳統(tǒng)分析和DBN深度學(xué)習(xí)分析過程比較如圖5。

圖5 分析過程比較Fig.5 Analysis process comparison diagram
參照圖5將數(shù)據(jù)按如下方法處理后,再輸入Soft-max分類模型。1)原始數(shù)據(jù)直接輸入;2)參照文獻(xiàn)[6]提取多變量特征,將所有14組特征作為輸入;3)選取2)中的5組特征作為輸入;4)經(jīng)小波變換時頻分析后繪制時頻圖,直接提取時頻圖像像素300×400作為輸入;5)將4)中時頻圖經(jīng)雙向主成分分析壓縮(Two Dimensional PCA,TD-PCA)[7]至像素10×10,再將壓縮后的像素作為輸入。將上述五種方法所得到的結(jié)果與DBN相比較,如圖6。

圖6 不同方法處理的故障識別率Fig.6 Fault identification with different methods
由圖比較可知,識別率最差的是直接原始數(shù)據(jù)輸入,故障識別率在20%左右,說明Soft-max分類模型本身無法直接從原始數(shù)據(jù)對故障進(jìn)行識別。以時頻圖像素作為模型輸入時,正確識別率有一定的提升,但可發(fā)現(xiàn),直接以300×400像素為輸入的識別效果也較差,識別率低于50%;而經(jīng)過TDPCA雙向壓縮后,識別效果得到較大程度提升。由此可見,為得到良好效果,以時頻圖為輸入特征時,需要額外增加輔助處理過程。這是因為傳感器采集的原始信號包含所有相關(guān)聯(lián)的振動信號,而有效的故障特征信號僅占用極少部分。原始信號經(jīng)時頻變換后,在相對應(yīng)的時頻圖中,有價值的故障信息嚴(yán)重受到其他信息干擾或掩蓋,導(dǎo)致難以正確分類。只有通過其他方式如TD-PCA把隱藏的故障信息凸顯出來,才可能達(dá)到故障識別要求。當(dāng)以14組多變量特征作為輸入時,識別率比較高;但當(dāng)以其中5個特征作為輸入時,識別效果大大降低。這是因為不同變量是從不同的角度刻畫振動信號,其包含的故障信息均有不同的偏重點,因此多變量特征的數(shù)量和種類直接影響故障識別效果。綜上所述,為達(dá)到良好的識別效果,時頻圖特征需要額外的處理過程,多變量特征需要甄選特征數(shù)量和種類,這些過程都離不開人工操作,削弱了機(jī)器學(xué)習(xí)的智能性。相比可見,除能減少特征提取過程提升智能性外,DBN可以達(dá)到比其他方式更佳的識別效果。
DBN是一種由多個RBM堆疊而成,直接從原始數(shù)據(jù)出發(fā),低失真度的重構(gòu)信號說明DBN具有組合低層特征形成更加抽象的高層表示,并以發(fā)現(xiàn)數(shù)據(jù)內(nèi)部特征的能力。將DBN應(yīng)用于軸承的故障識別,實驗案例中良好的識別率證明:DBN可以直接通過原始數(shù)據(jù)對軸承故障進(jìn)行高效識別。相比于傳統(tǒng)的機(jī)器學(xué)習(xí)方法,基于深度學(xué)習(xí)的故障識別存在如下突出優(yōu)勢
第一,不需復(fù)雜、專業(yè)的人工特征提取過程,可直接使用采集的原始時域信號對故障進(jìn)行識別,大大簡化了模型學(xué)習(xí)過程,增強了機(jī)器學(xué)習(xí)的智能性。
第二,不需要操作人員具備專業(yè)的先驗儲備知識,簡化了的操作模式,提升了可操作性,增強了機(jī)器學(xué)習(xí)的實用性。
[1]Hinton G,Osindero S,Teh Y W.A fast learning algorithm for deep belief nets[J].Neural Computation,2006,18(7):1527-1554.
[2]Bengio Y,Lamblin P,Popovici D,et al.Greedy layer-wise training of deep networks[J].Advances in Neural Information Processing Systems,2007,19:153.
[3]Salakhutdinov R,Murray I.On the quantitative analysis of deep belief networks [C]//Proceedings of the 25th international conference on Machine learning.ACM,2008: 872-879.
[4]Hinton G E.Training products of experts by minimizing contrastive divergence[J].Neural Computation,2002,14(8): 1771-1800.
[5]Bearing Data Center.Download a Data File[EB/OL].http://csegroups.case.edu/bearingdatacenter/pages/download-datafile.
[6]Chen Y,Lin Z,Zhao X,et al.Deep Learning-Based Classification of Hyperspectral Data[J].2014,7(6):2094-2107.
[7]Yang J,Zhang D,Yang J Y.Two-dimensional PCA:a new approach to appearance-based face representation and recognition[J].IEEE Transactions on Pattern Analysis and Machine Intelligence,2004,26(1):131-137.
Signal reconstruction and bearing fault identification based on deep belief network
SHAN Wai-ping,ZENG Xue-qiong
(Mechanical and Automotive Engineering,South China University of Technology,Guangzhou 510640,China)
Feature extraction is a crucial step affecting the performance of traditional intelligent identification with difficulty and uncertainty for manual operation.Starting directly from the raw data,the paper proposes a novel method for bearing fault identification based on deep belief network.The method can get the particular features and avoid manual operation for feature extraction,enhancing intelligence of diagnostic process.When DBN is applied to bearing fault identification with raw data,the experimental results with nearly 100%correct recognition rateshows that DBN can achieveefficiently fault identificationdirectly by the raw data.
feature extraction;restricted boltzmann machine;DBN;deep learning;fault identification
TP181;TH165+.3
A
1674-6236(2016)04-0067-05
2015-03-18 稿件編號:201503232
單外平(1987—),男,湖南衡陽人,碩士研究生。研究方向:復(fù)雜機(jī)械狀態(tài)監(jiān)測與智能診斷。