黃 鑫 陳仁祥② 黃 鈺
(①重慶交通大學(xué)機(jī)電與車(chē)輛工程學(xué)院,重慶400074;②重慶大學(xué)機(jī)械傳動(dòng)國(guó)家重點(diǎn)實(shí)驗(yàn)室,重慶400030;③西華大學(xué)汽車(chē)與交通工程學(xué)院,四川成都610039)
隨著計(jì)算機(jī)、傳感器以及通信技術(shù)的快速發(fā)展,現(xiàn)代機(jī)械設(shè)備正朝向機(jī)電一體化方向發(fā)展,其功能及結(jié)構(gòu)日益復(fù)雜化.為了保障設(shè)備高效、安全運(yùn)行,必須建立可靠的健康監(jiān)測(cè)系統(tǒng).由于監(jiān)測(cè)的裝備群規(guī)模大、所需測(cè)點(diǎn)多、單個(gè)測(cè)點(diǎn)采樣頻率高以及數(shù)據(jù)收集時(shí)間跨度長(zhǎng),因此監(jiān)測(cè)數(shù)據(jù)呈指數(shù)增長(zhǎng),致使機(jī)械設(shè)備健康監(jiān)測(cè)領(lǐng)域進(jìn)入“大數(shù)據(jù)”時(shí)代[1],呈現(xiàn)出體量大、模態(tài)繁多、生成快速、價(jià)值大但密度低等“大數(shù)據(jù)”特性.另外,機(jī)械設(shè)備信號(hào)普遍具有非線性、非平穩(wěn)性特點(diǎn)[2],而且各種故障信號(hào)之間存在強(qiáng)關(guān)聯(lián)耦合關(guān)系,這使得基于傳統(tǒng)數(shù)據(jù)驅(qū)動(dòng)以及信號(hào)處理的故障診斷方法無(wú)法滿足現(xiàn)代機(jī)械設(shè)備故障診斷需求,難以對(duì)其進(jìn)行行之有效的故障實(shí)時(shí)監(jiān)測(cè)與診斷.
自2006年HINTON等[3]開(kāi)創(chuàng)性的提出了深度學(xué)習(xí)理論以來(lái),其就在學(xué)術(shù)界和工業(yè)界引起了廣泛關(guān)注,為大數(shù)據(jù)利用開(kāi)辟了新途徑.其中卷積神經(jīng)網(wǎng)絡(luò)(convolution neural network,CNN)以其非凡的特征學(xué)習(xí)和模式識(shí)別能力成為深度學(xué)習(xí)領(lǐng)域的翹楚,其在語(yǔ)音識(shí)別、圖像處理、目標(biāo)檢測(cè)等領(lǐng)域取得一系列突破性研究成果[4].而故障診斷本質(zhì)上可以看成是故障模式識(shí)別過(guò)程,就傳統(tǒng)的模式識(shí)別方法而言,一般都需要依靠信號(hào)處理手段與豐富的診斷經(jīng)驗(yàn)提取故障特征,再利用模式識(shí)別算法進(jìn)行診斷,在實(shí)際運(yùn)用中這些方法都存在著各自的局限性[5],難以充分利用機(jī)械設(shè)備與日俱增的海量數(shù)據(jù).因此,CNN作為一種擁有強(qiáng)大特征學(xué)習(xí)以及模式識(shí)別能力的“利器”受到領(lǐng)域?qū)W者的廣泛關(guān)注,并將其引入機(jī)械設(shè)備故障診斷領(lǐng)域.
本文在分析和總結(jié)近年來(lái)國(guó)內(nèi)外基于CNN實(shí)現(xiàn)機(jī)械設(shè)備故障診斷研究的基礎(chǔ)上,從CNN在故障診斷領(lǐng)域的特征提取和模式識(shí)別的原理出發(fā),闡述了機(jī)械設(shè)備故障呈現(xiàn)出的新特點(diǎn)與難點(diǎn),并討論CNN在實(shí)現(xiàn)對(duì)現(xiàn)代機(jī)械裝備故障診斷方面所面臨的挑戰(zhàn),展望值得繼續(xù)研究的方向.
CNN作為深度學(xué)習(xí)最重要的模型之一,其提供了一種端到端的學(xué)習(xí)架構(gòu).經(jīng)過(guò)多年的發(fā)展,CNN已經(jīng)衍生出多個(gè)版本,其特征學(xué)習(xí)與模態(tài)識(shí)別能力也與日俱增[6].通常CNN先通過(guò)前饋運(yùn)算(卷積運(yùn)算、池化操作等)以有監(jiān)督學(xué)習(xí)的方式計(jì)算其預(yù)測(cè)誤差,后通過(guò)基于梯度的反向傳播算法更新參數(shù),其梯度從后往前逐層反饋,直到更新到網(wǎng)絡(luò)的第一層參數(shù).相較于傳統(tǒng)的神經(jīng)網(wǎng)絡(luò)架構(gòu),CNN特點(diǎn)在于引入了權(quán)值共享和感受野的概念,這使得其需要學(xué)習(xí)的參數(shù)量極大程度的減少,擁有更強(qiáng)的學(xué)習(xí)能力.
如圖1所示,為CNN典型模型以及用其實(shí)現(xiàn)故障診斷的思想方法,其中包括卷積層、非線性激活層、池化層、全連接層等,通過(guò)這些基本“組件”有機(jī)結(jié)合即可把原始特征空間映射到更具表征意義的特征域內(nèi),進(jìn)而實(shí)現(xiàn)對(duì)樣本的預(yù)測(cè).與傳統(tǒng)神經(jīng)網(wǎng)絡(luò)結(jié)構(gòu)的不同,CNN輸入一般為二維圖像(包括特征圖或原始數(shù)據(jù)圖),其無(wú)需將輸入數(shù)據(jù)矢量化,避免了空域關(guān)系的缺失,可獲得更加完備的特征組合.卷積層、池化層在CNN診斷模型中扮演著重要的角色,其直接關(guān)系到特征提取的優(yōu)劣.
卷積層:其通過(guò)若干卷積核(即特征濾波器)的作用逐層對(duì)二維圖像進(jìn)行卷積運(yùn)算,并通過(guò)非線性激活層獲取每層網(wǎng)絡(luò)的不同特征圖,每層網(wǎng)絡(luò)通過(guò)“組合”上一層卷積核輸出,進(jìn)而將隱藏在數(shù)據(jù)內(nèi)部的拓?fù)浣Y(jié)構(gòu)特征逐層提取出來(lái).其數(shù)學(xué)模型可表示為:

池化層:其實(shí)際上就是一種“降采樣”操作,一方面使得模型更關(guān)注某些特征本身而非特征具體的位置,使特征學(xué)習(xí)過(guò)程中包含某種自由度,容忍某些特征微小的位移;另一方面對(duì)卷積層學(xué)習(xí)到的特征做維度約減,使模型可以抽取更廣泛的特征,進(jìn)而減少CNN學(xué)習(xí)過(guò)程中的計(jì)算量和參數(shù)個(gè)數(shù).其數(shù)學(xué)模型可表示為:


CNN通過(guò)逐層的卷積、池化等操作,以最小損失為學(xué)習(xí)目標(biāo),通過(guò)提取輸入數(shù)據(jù)的平移、旋轉(zhuǎn)以及縮放不變的特征表示,借助頂層分類(lèi)器即可有效實(shí)現(xiàn)故障診斷與識(shí)別.
Zeng等[7]將信號(hào)S變換時(shí)頻圖作為CNN輸入用以提取相應(yīng)故障特征以識(shí)別齒輪箱故障.Ding等[8]利用卷積神經(jīng)網(wǎng)絡(luò)從二維小波包變換能量中提取學(xué)習(xí)故障特征并對(duì)軸承進(jìn)行了診斷.而文獻(xiàn)[9]則采用CNN從時(shí)域信號(hào)中學(xué)習(xí)軸承外圈滾道故障和潤(rùn)滑性能退化兩種故障特征并對(duì)其進(jìn)行了診斷.
近年來(lái),基于CNN算法的故障診斷的研究成果公開(kāi)發(fā)表的數(shù)量相對(duì)較少,其研究仍然處于初步探索階段.根據(jù)現(xiàn)已公開(kāi)發(fā)表的文獻(xiàn)來(lái)看,CNN在故障診斷方面的應(yīng)用主要有兩種思路,如圖2所示:(1)將CNN作為分類(lèi)器使用[10-13];(2)將CNN作為特征提取與模式識(shí)別的方法[14-15].
在故障診斷領(lǐng)域,由于從機(jī)械設(shè)備中獲取的信號(hào)變化多端,其中故障信號(hào)特征微弱且易被調(diào)制呈現(xiàn)出典型的非線性與非平穩(wěn)性特征,所以如何采用適合設(shè)備狀態(tài)的信號(hào)處理與特征提取方法就成了進(jìn)行有效故障診斷的前提[16].而傳統(tǒng)診斷方法需要依賴(lài)堅(jiān)實(shí)的專(zhuān)業(yè)知識(shí)以及豐富的實(shí)踐經(jīng)驗(yàn),一旦反映設(shè)備狀態(tài)的特征信息不能被準(zhǔn)確拾取和處理必將出現(xiàn)漏檢、誤檢的情況.而且這些方法所提取的特征與所應(yīng)用的模式識(shí)別方法間匹配程度難以評(píng)價(jià),影響診斷結(jié)果的可靠性.由于故障診斷核心在于尋找特定故障內(nèi)在模式,進(jìn)而實(shí)現(xiàn)對(duì)故障的識(shí)別和判斷,因而智能診斷成為了人們尋求解決方案的最佳途徑.

考慮到機(jī)械設(shè)備日益復(fù)雜化以及其呈現(xiàn)的“大數(shù)據(jù)”特性,基于傳統(tǒng)的數(shù)據(jù)驅(qū)動(dòng)方法難以再滿足實(shí)際診斷要求,而基于CNN的診斷方法非常擅長(zhǎng)于處理海量數(shù)據(jù),從中拾取特征[17-19],辨別不同數(shù)據(jù)中蘊(yùn)含的不同模式信息.另外,借助CNN獨(dú)特優(yōu)勢(shì),基于CNN診斷模型可將特征自適應(yīng)提取與模式識(shí)別有機(jī)融合為整體,克服了傳統(tǒng)特征提取方法提取的淺層特征對(duì)故障信號(hào)表征能力不足的問(wèn)題,同時(shí)避免了對(duì)專(zhuān)業(yè)知識(shí)和經(jīng)驗(yàn)的依賴(lài),有效減少了診斷過(guò)程的復(fù)雜性.使其在故障診斷方面也具有獨(dú)特優(yōu)勢(shì).因此,基于CNN的故障診斷技術(shù)是智能診斷發(fā)展的方向之一.
機(jī)械故障診斷技術(shù)的發(fā)展離不開(kāi)實(shí)際機(jī)械設(shè)備診斷的需求,在理論研究與實(shí)踐運(yùn)用中,逐漸形成了涉及故障機(jī)理、特征提取、模式識(shí)別以及智能診斷等方面較為完善的理論體系[20].然而,由于現(xiàn)代機(jī)械設(shè)備兼具復(fù)雜性與智能化特點(diǎn),對(duì)于獲取準(zhǔn)確、完備、有效的故障信息變得越來(lái)越困難[21].建立在人工特征提取基礎(chǔ)上的模式識(shí)別診斷方法已難以滿足現(xiàn)代機(jī)械設(shè)備的實(shí)際診斷需求[22-23],迫切需要集信號(hào)分析、建模與知識(shí)處理的智能診斷方法[24-25].
在某種意義上,如何獲取能表征故障狀態(tài)的特征分布已成為當(dāng)前機(jī)械故障診斷的研究重點(diǎn),其直接影響到故障監(jiān)測(cè)與診斷的有效性以及可靠性.而基于CNN的故障診斷方法,通過(guò)建立深層模型,利用其獨(dú)特優(yōu)勢(shì)可直接從大量的數(shù)據(jù)中自適應(yīng)地學(xué)習(xí)故障特征,實(shí)現(xiàn)“大數(shù)據(jù)”環(huán)境下故障特征自適應(yīng)提取與模式識(shí)別相統(tǒng)一的智能診斷.
由于現(xiàn)代科學(xué)以及制造技術(shù)的迅速發(fā)展,現(xiàn)代機(jī)械設(shè)備的結(jié)構(gòu)及其功能日益復(fù)雜,同一設(shè)備不同部件間相互關(guān)聯(lián)以及耦合程度不斷加深,不同設(shè)備間的依賴(lài)關(guān)系也逐漸加強(qiáng),使得在實(shí)際生產(chǎn)過(guò)程中,機(jī)械設(shè)備間成為相互依賴(lài)的整體,致使現(xiàn)代機(jī)械設(shè)備故障呈現(xiàn)出新特性[26-27].
(1)層次性:由于現(xiàn)代機(jī)械設(shè)備在結(jié)構(gòu)上可劃分為系統(tǒng)、子系統(tǒng)、部件、元件等各個(gè)層級(jí)[18],形成其不同功能層級(jí),因而故障的產(chǎn)生也對(duì)應(yīng)于不同功能層級(jí),表現(xiàn)出故障層級(jí)性.
(2)不確定性:由于現(xiàn)代機(jī)械設(shè)備運(yùn)行工況復(fù)雜,故障的產(chǎn)生與所處的條件與環(huán)境有密切聯(lián)系.在不同條件與環(huán)境下,故障表現(xiàn)形式以及對(duì)其的描述與劃分存在不一致性而且不同故障相互影響.因而,機(jī)械系統(tǒng)的故障和征兆存在隨機(jī)性、模糊性等特點(diǎn).
(3)復(fù)雜性:現(xiàn)代機(jī)械設(shè)備規(guī)模大、結(jié)構(gòu)復(fù)雜以及不同零部件相互影響,使得其在長(zhǎng)期的運(yùn)行過(guò)程中不可避免地出現(xiàn)輕微損傷,產(chǎn)生早期故障[21],微弱故障甚至出現(xiàn)多種故障并發(fā)的復(fù)合故障以及系統(tǒng)性故障.另外,由于傳輸路徑復(fù)雜、多因素耦合影響,未經(jīng)處理自行消失的間歇故障也會(huì)發(fā)生在機(jī)械設(shè)備中[28].
(4)大數(shù)據(jù)特性:由于監(jiān)測(cè)的機(jī)械設(shè)備群規(guī)模大、單臺(tái)設(shè)備測(cè)點(diǎn)多,單個(gè)測(cè)點(diǎn)的采樣頻率高以及數(shù)據(jù)收集時(shí)間跨度長(zhǎng),使得在時(shí)間尺度上不斷存儲(chǔ)積累監(jiān)測(cè)數(shù)據(jù),從而形成了海量數(shù)據(jù)集,表現(xiàn)出復(fù)雜的大數(shù)據(jù)特性.
基于CNN的故障診斷研究近年來(lái)已有所發(fā)展,其基本的思想為:通過(guò)歷史數(shù)據(jù)獲取機(jī)械設(shè)備全部可能發(fā)生的運(yùn)行狀態(tài)以構(gòu)成狀態(tài)空間,并利用CNN診斷模型拾取全部狀態(tài)的隱藏特征[29],通過(guò)分類(lèi)器利用監(jiān)督學(xué)習(xí)對(duì)特征空間進(jìn)行劃分,以將特征空間映射到狀態(tài)空間,從而實(shí)現(xiàn)機(jī)械設(shè)備的故障檢測(cè)、診斷與模式匹配等[30-33].
CNN網(wǎng)絡(luò)故障診斷策略主要是受到哺乳動(dòng)物大腦皮層多重機(jī)制的啟發(fā),通過(guò)構(gòu)建多層非線性網(wǎng)絡(luò)結(jié)構(gòu),組合低層次特征信息獲取抽象的高層表示,使得基于CNN的故障診斷系統(tǒng)能夠不依賴(lài)于人工特征提取及選擇,以靈活的診斷策略對(duì)機(jī)械設(shè)備的運(yùn)行狀態(tài)與故障做出智能判斷與決策[34-36].經(jīng)過(guò)近幾年的發(fā)展,基于CNN的故障診斷策略已有相關(guān)成果發(fā)表,但在應(yīng)用過(guò)程中仍然存在一些挑戰(zhàn)性問(wèn)題亟待進(jìn)一步探索.
(1)診斷模型的動(dòng)態(tài)優(yōu)化更新.雖然CNN模型能有效利用機(jī)械設(shè)備的海量數(shù)據(jù),但是設(shè)備運(yùn)行狀態(tài)信號(hào)對(duì)周?chē)h(huán)境或者硬件干擾引起的系統(tǒng)變化敏感,一旦設(shè)備出現(xiàn)始料未及的異常狀態(tài),而診斷模型無(wú)法及時(shí)調(diào)整以獲取異常狀態(tài)特征分布,診斷模型將無(wú)法做出準(zhǔn)確預(yù)測(cè)[37-38].因此如何解決模型動(dòng)態(tài)更新是其難以回避的問(wèn)題之一.
(2)診斷模型特征提取與識(shí)別.雖然診斷模型在實(shí)際應(yīng)用表現(xiàn)出非凡的性能,但相較于傳統(tǒng)人工設(shè)計(jì)特征具有明確的物理意義而言,CNN診斷模型特征學(xué)習(xí)過(guò)程具有“不可知”性,對(duì)其所學(xué)特征“有效性”的分析與解釋也更加地抽象和困難.而對(duì)于這方面的研究仍然很少,因此為了更好的應(yīng)用CNN進(jìn)行故障監(jiān)測(cè)與診斷,如何明確CNN診斷模型所學(xué)特征意義仍然是有待解決的問(wèn)題.
(3)典型故障樣本少.基于CNN的故障診斷通常需要大量的故障樣本對(duì)模型進(jìn)行訓(xùn)練以獲取該狀態(tài)特征分布,而機(jī)械設(shè)備通常擁有海量的正常數(shù)據(jù)而異常數(shù)據(jù)相對(duì)較少[39],呈現(xiàn)出“長(zhǎng)尾”分布.因而,如何保證小樣本下的CNN診斷模型對(duì)故障狀態(tài)仍具有良好的特征學(xué)習(xí)性能是一個(gè)值得研究的方向.
(4)故障診斷數(shù)據(jù)類(lèi)型多樣化且不統(tǒng)一.現(xiàn)代機(jī)械設(shè)備產(chǎn)生海量監(jiān)測(cè)數(shù)據(jù),其數(shù)據(jù)類(lèi)型多樣化且不統(tǒng)一,可從各方面反映機(jī)械設(shè)備狀態(tài)信息,比如振動(dòng)數(shù)據(jù)、溫度數(shù)據(jù)、噪聲數(shù)據(jù)等.如何將CNN診斷模型與多樣化數(shù)據(jù)進(jìn)行自適應(yīng)結(jié)合,充分利用機(jī)械設(shè)備多方面信息是一個(gè)值得研究的方向[35].
(5)故障診斷模型訓(xùn)練數(shù)據(jù)集與測(cè)試數(shù)據(jù)集分布不一致.由于現(xiàn)代機(jī)械設(shè)備產(chǎn)生的信號(hào)容易受到外界環(huán)境干擾呈現(xiàn)復(fù)雜多變性,很難保證模型使用的訓(xùn)練數(shù)據(jù)集與待測(cè)試數(shù)據(jù)集分布完全一致,因此如何解決CNN模型自適應(yīng)問(wèn)題也是一個(gè)值得研究的方向.
本文在分析總結(jié)近幾年國(guó)內(nèi)外運(yùn)用CNN實(shí)現(xiàn)機(jī)械故障診斷的研究思路和研究現(xiàn)狀的基礎(chǔ)上,論述了現(xiàn)代機(jī)械故障的新特點(diǎn)以及運(yùn)用CNN實(shí)現(xiàn)故障診斷將要面臨的挑戰(zhàn)以及值得繼續(xù)研究的方向.