王瑞涵 陳輝 管聰



摘要: 提出了一種深度學習網(wǎng)絡即結構?隨機卷積神經(jīng)網(wǎng)絡,用于實現(xiàn)內燃機的智能健康監(jiān)測。集成多個單一的卷積神經(jīng)網(wǎng)絡構成新的網(wǎng)絡構架,通過卷積計算和池化操作對振動信號進行自動特征提取。在隨機卷積神經(jīng)網(wǎng)絡結構中,應用Adabound優(yōu)化器使學習率自適應變化,從而加快模型的權值更新。同時通過Dropout技術使結構中神經(jīng)元隨機失活,防止對訓練數(shù)據(jù)進行復雜的協(xié)同響應,通過Dempster合成規(guī)則融合各個網(wǎng)絡模型的診斷結果。所提出的健康監(jiān)測方案用于對內燃機工作時的振動信號進行分析。實驗證明,該方法克服了傳統(tǒng)的數(shù)據(jù)驅動和卷積神經(jīng)網(wǎng)絡健康監(jiān)測方法的局限性,擺脫了對人工特征設計的依賴,并且有較好的診斷性能,能夠有效地對內燃機進行健康監(jiān)測。
關鍵詞: 健康監(jiān)測; 內燃機; 卷積神經(jīng)網(wǎng)絡; 集成學習
1 ?概 ?述
內燃機作為一種重要的動力機械,廣泛應用于各個領域,對其系統(tǒng)健康狀況的監(jiān)測不僅能夠保證設備平穩(wěn)高效的運行,而且能夠及時發(fā)現(xiàn)出現(xiàn)的故障狀況,有效防止重大事故的發(fā)生[1]。基于振動信號的分析是對內燃機健康狀態(tài)監(jiān)測的重要途徑。這是由于振動信號采集方便,并且采集的振動信號包含了往復運動、旋轉運動、機械沖擊和氣體的高速流動等豐富的信息。但是,內燃機系統(tǒng)的振動激勵源多,其振動信號具有強耦合、弱故障特征的特點[2],因此如何準確地提取振動信號中的有效特征是健康監(jiān)測中的難點所在。
傳統(tǒng)的振動信號分析方法是通過時頻分析和圖像識別方法來對故障特征進行提取和診斷[3]。其中時頻分析方法包括S變換[4],小波分析[5],經(jīng)驗模態(tài)分解[6],Winger分布[7]等,通過時頻分析將一維信號映射到二維的時頻分布圖中,再通過圖像識別方法對時頻圖進行分析。但是這種方法需要大量的專家知識,并且在診斷微小故障時,各個故障的時頻圖差異不明顯,診斷效果并不理想。然而,隨著機器學習的飛速發(fā)展,一種基于數(shù)據(jù)驅動的振動信號分析方法被提出,即“基于信號處理的特征提取+機器學習算法模型”的健康監(jiān)測方案[8?12],該方法分為人工設計特征、特征篩選和模型訓練等三個部分。該方法相對于傳統(tǒng)的振動信號分析法,不再需要對復雜的時頻圖進行圖像識別,而是通過多源特征量融合實現(xiàn)對微小故障的診斷[13],并且可以根據(jù)實時采集的數(shù)據(jù)對訓練模型進行更新。然而,由于振動信號在時域和頻域上有大量的統(tǒng)計指標,人工設計信號特征需要花費大量的時間和精力,并且不同的統(tǒng)計指標又會對最終診斷結果造成不同的影響,限制了該方法的性能。在大多數(shù)的情況下,設計合適的信號特征,并對多維特征進行合理降維難以實現(xiàn)。為了解決該方法的弊端,一種基于深度學習的健康監(jiān)測方案在機械健康領域被提出[14]。基于深度學習的機械健康監(jiān)測方案通過構建多層非線性變換的深度神經(jīng)網(wǎng)絡從原始信號中直接提取數(shù)據(jù)特征,實現(xiàn)故障特征的自適應提取與健康狀況的智能診斷[15]。
考慮到深度學習具有處理大規(guī)模數(shù)據(jù)的能力,通過多尺度和多層次的學習,對振動信號進行分析,因此深度學習可以成為機械健康監(jiān)測系統(tǒng)中強大有效的解決方案。雷亞國等[16]利用自動編碼器(Autoencoder)對頻域信號進行除噪,然后通過深度學習網(wǎng)絡挖掘信號中的故障特征;LIU等[17]提出了一種新型的錯位時間序列卷積神經(jīng)網(wǎng)絡(Dislocated Time Series Convolutional Neural Network)用于電機的故障診斷; SUN等[18]設計新型反饋神經(jīng)網(wǎng)絡來代替原卷積神經(jīng)網(wǎng)絡中的無監(jiān)督方法進行濾波器權重的學習,并且最終的輸出層用支持向量機來代替原Softmax函數(shù); Shao等[19]提出新型的深度信念網(wǎng)絡實現(xiàn)軸承故障的診斷,在新的網(wǎng)絡結構中用自編碼器壓縮原數(shù)據(jù)和指數(shù)加權移動提高模型性能;INCE等[20]提出一種1D卷積神經(jīng)網(wǎng)絡結構,將特征提取和分類融合到單個的學習個體中,能夠準確快速地實現(xiàn)對電機狀態(tài)的監(jiān)測;JANSSENS等[21]用卷積神經(jīng)網(wǎng)絡實現(xiàn)對信號特征的自動提取并有較高的準確率。相對于傳統(tǒng)的基于數(shù)據(jù)驅動的健康監(jiān)測方案,基于深度學習的健康監(jiān)測方案不再依賴于信號分析技術和人工設計信號特征,直接實現(xiàn)端到端的結構,所有模型參數(shù)根據(jù)原始數(shù)據(jù)進行自動更新。表1展示了傳統(tǒng)數(shù)據(jù)驅動和深度學習兩種健康監(jiān)測方案的不同點。同時,圖1展示了不同機械健康監(jiān)測方案的原理。
盡管深度學習模型已經(jīng)在機械健康監(jiān)測方面取得的了一系列的突破,但是隨著對深度學習模型的研究,仍出現(xiàn)了一些應用在機械健康監(jiān)測的弊端,比如單一的深度學習網(wǎng)絡結構造成了模型的泛化能力不足。同時,由于內燃機工況的復雜多變,數(shù)據(jù)量過多,造成深度學習模型訓練時間過長等問題。針對模型泛化能力不足的問題,集成學習方法,比如隨機森林和集成支持向量機被應用到機械健康監(jiān)測中[22?23],該方法融合多個分類器,提高模型的診斷穩(wěn)定性與泛化能力。針對模型訓練時間過長,多種改進的優(yōu)化器被應用于深度學習網(wǎng)絡結構中,比如Stochastic Gradient Descent(SGD)優(yōu)化器,Momentum優(yōu)化器,RMSprop優(yōu)化器,Adam優(yōu)化器,大大提高了深度學習模型擬合的速度。
在本文研究中,一種隨機卷積神經(jīng)網(wǎng)絡(Random Convolutional Neural Networks)被提出并應用于內燃機的健康監(jiān)測中,直接對采集的一維時域信號進行分析診斷。該種卷積神經(jīng)網(wǎng)絡結構利用集成學習思想,集成多個單一的卷積網(wǎng)絡神經(jīng)結構,并用Dempster合成規(guī)則對每個神經(jīng)網(wǎng)絡結構產(chǎn)生的診斷結果概率進行融合,改善以往的最大投票方案[24]對診斷結果進行判斷,使得診斷結果更加直觀,并且解決了不確定性的問題。同時,在RCNNs的網(wǎng)絡結構中采用Adabound優(yōu)化器和Dropout技術來加快模型擬合速度和減少模型訓練參數(shù)[25?26],最終提高模型的診斷性能。Adabound優(yōu)化器結合了SGD和Adam優(yōu)化器的優(yōu)點,利用學習率的動態(tài)邊界,在模型訓練的過程中,實現(xiàn)了自適應優(yōu)化器向SGD優(yōu)化器的過渡,不僅可以提高模型的收斂速度,而且避免了模型易陷入局部最小的問題。Dropout技術在RCNN網(wǎng)絡訓練過程中隨機省略網(wǎng)絡結構中的部分神經(jīng)元,從而簡化網(wǎng)絡結構,防止過擬合現(xiàn)象。所提出的健康監(jiān)測方案可分為三個部分:(1)將多個單一的神經(jīng)網(wǎng)絡結構集成到隨機卷積神經(jīng)網(wǎng)絡中,每次從訓練集中隨機抽取部分數(shù)據(jù),對單一的卷積神經(jīng)網(wǎng)絡進行訓練;(2)在模型訓練過程中,采用Adabound優(yōu)化器和Dropout技術,大大加快模型擬合速度;(3)設計一種診斷策略運用到診斷結果中,融合各個單一網(wǎng)絡的診斷結果,使得診斷結果更加可靠和精確。
2 傳統(tǒng)的卷積神經(jīng)網(wǎng)絡
深度學習來源于人工神經(jīng)網(wǎng)絡,是機器學習的一個分支。它具有多個非線性處理層,試圖用多個處理層來挖掘數(shù)據(jù)信息。而卷積神經(jīng)網(wǎng)絡是深度學習中的一項重要技術,并且在機械健康領域中已經(jīng)逐步開始應用。卷積神經(jīng)網(wǎng)絡是一種多層的監(jiān)督學習神經(jīng)網(wǎng)絡,對目標進行多層表示,以獲得更好的特征魯棒性。通過多層非線性變換,挖掘數(shù)據(jù)中的有用信息,使得網(wǎng)絡能夠自動進行特征提取,最終使用分類函數(shù)或者回歸函數(shù)達到數(shù)據(jù)分析的目的。卷積神經(jīng)網(wǎng)絡通過梯度下降法進行對損失函數(shù)的最小化,對各層參數(shù)進行反向調節(jié),最終通過多次迭代找到最優(yōu)參數(shù),從而提高網(wǎng)絡的精度[27]。同時,卷積神經(jīng)網(wǎng)絡通過局部連接,權值共享和池化來解決傳統(tǒng)神經(jīng)網(wǎng)絡中出現(xiàn)的容易過擬合、梯度消失,和難以訓練大量的數(shù)據(jù)集等問題。
卷積神經(jīng)網(wǎng)絡由輸入層,隱含層和輸出層構成。輸入層可以處理多維數(shù)據(jù),并且通過歸一化等操作對數(shù)據(jù)進行標準化處理;隱含層是卷積神經(jīng)網(wǎng)絡的核心部分,其中包括卷積層、池化層、全連接層。通過構造多層卷積?池化層對原始數(shù)據(jù)進行卷積處理,卷積層實現(xiàn)特征提取,池化層實現(xiàn)特征過濾,而全連接層將重組提取的特征信息,使特征信息失去原有的多維結構,并通過激勵函數(shù)傳遞到下一層。輸出層則可通過歸一化指數(shù)函數(shù)(Softmax function)實現(xiàn)對輸入數(shù)據(jù)的分類。
2.1 卷積層
卷積層通過濾波器(filters)對局部區(qū)域進行特征提取,并通過激活函數(shù)生成輸出特征。卷積層通過濾波器對輸入數(shù)據(jù)I進行掃描,這里的矩陣I為原始的振動信號。濾波器的大小為F,步幅為S,填充為P。經(jīng)過卷積計算,輸入的結果為特征映射。特征映射的尺寸大小O可表示為
2.2 池化層
在卷積層進行特征提取后,池化層將對提取的特征映射進行特性選擇和信息過濾,從而進一步減少模型參數(shù)的數(shù)量。池化層實際上是一種下采樣操作,減少數(shù)據(jù)處理量的同時保留有用信息。池化層的操作有兩種,最大池化和均值池化。本文采用的是最大池化。最大池化意味著每次池化操作選擇該池化區(qū)域的最大值用來代表原區(qū)域。設池化長度為f,則最大池化操作便是在原特征映射c中的連續(xù)f個值中取最大值,以表示原特征映射的部分區(qū)域。經(jīng)過池化層后,特征映射可表示為
經(jīng)過多次卷積?池化操作后,全連接層和Softmax層將作為網(wǎng)絡結構的最高層對輸入的振動信號進行診斷與分類。
3 基于隨機卷積神經(jīng)網(wǎng)絡(RCNNs)的健康監(jiān)測
本文中,一種隨機卷積神經(jīng)網(wǎng)絡被提出,并應用于內燃機的健康監(jiān)測中。這種隨機卷積神經(jīng)網(wǎng)絡采用了集成學習思想,集成多個單一卷積神經(jīng)網(wǎng)絡結構共同監(jiān)測內燃機的健康狀況。但是集成多個卷積神經(jīng)網(wǎng)絡結構必然需要更多的時間和計算機內存,這無疑增大了計算機的負擔。因此,RCNNs采用了一種優(yōu)化器即Adabound,在加快模型的擬合速度同時又保證模型不陷入局部擬合。同時,RCNNs的結構中,隨機抽樣層和Dropout操作被用于網(wǎng)絡結構中,減少模型參數(shù)訓練量從而防止模型陷入過擬合。在RCNNs的輸出層中,采用Dempster合成規(guī)則將每個卷積神經(jīng)網(wǎng)絡的診斷結果進行融合,得到更加可靠和準確的診斷結果。
3.1 隨機抽樣層
設原始數(shù)據(jù)的總量為N,一個周期的數(shù)據(jù)個數(shù)為m。將總數(shù)據(jù)以m個數(shù)據(jù)點為一個數(shù)據(jù)周期進行劃分,設共劃分了n組數(shù)據(jù),故N=n×m。從n組數(shù)據(jù)中,隨機抽取80%的數(shù)據(jù)對單個卷積神經(jīng)網(wǎng)絡進行訓練。設共有i個個體網(wǎng)絡結構,故總共抽取了i次數(shù)據(jù),分別對不同的網(wǎng)絡模型進行訓練。在對模型進行訓練之前,需對數(shù)據(jù)進行標準化處理,使得每個周期數(shù)據(jù)集的量級在同一范圍內。振動信號數(shù)據(jù)標準化的操作如下
3.2 Dropout技術
在傳統(tǒng)的卷積神經(jīng)網(wǎng)絡結構中,每一層的神經(jīng)元都會連接下一層的所有神經(jīng)元,這種全部連接的網(wǎng)絡結構會訓練大量的參數(shù),減慢了模型訓練的速度。若訓練數(shù)據(jù)量不夠,模型參數(shù)過多,極易造成模型過擬合。Dropout操作則能很好地解決過擬合的問題,同時可以加快模型的訓練速度。在訓練過程中,按一定概率p使每個神經(jīng)節(jié)點從其網(wǎng)絡結構中暫時失活,如圖2所示。Dropout操作可以看作對原始網(wǎng)絡中的神經(jīng)元進行隨機采樣,得到一個更“瘦”的網(wǎng)絡結構。但是在測試過程中,若還是隨機失活部分神經(jīng)元,將會導致輸出結果的不穩(wěn)定。因此,在測試階段將每個神經(jīng)元的輸出乘以概率p,這樣可以使在訓練階段和測試階段每個神經(jīng)元輸出的期望值是相同的。
在隨機卷積神經(jīng)網(wǎng)絡結構中使用Dropout技術,避免在訓練過程中訓練所有的神經(jīng)元,減少模型參數(shù)訓練量,可以在一定程度解決過擬合問題。同時,由于模型參數(shù)的減少,模型的擬合速度大大加快。具體的操作為:
3.3 Adabound優(yōu)化器
由于RCNNs結構中集成了多個單一的卷積神經(jīng)網(wǎng)絡,造成結構復雜,所以訓練網(wǎng)絡所需的時間較長。因此使用優(yōu)化器加快網(wǎng)絡訓練速度,在RCNNs結構中是必不可少的。傳統(tǒng)的優(yōu)化器有 SGD,Momentum,RMSprop,和Adam。SGD用固定的學習率,在模型擬合的過程中梯度下降的速度保持不變,模型達到擬合的速度較慢,并且模型在訓練過程中容易產(chǎn)生震蕩。而Adam優(yōu)化器學習率會隨著下降梯度的變化而變化,以最快的速度讓模型收斂。但是隨著迭代步數(shù)的不斷增加,學習率會出現(xiàn)極小值,使得模型不能夠收斂到最優(yōu)解,在訓練后期的擬合效果不如SGD優(yōu)化器。本文中采用的是Adabound優(yōu)化器[28]。Adabound優(yōu)化器在學習率的變化范圍中加了一個動態(tài)邊界。學習率隨著下降梯度的變化而變化,并且隨著時間的推移,學習率的上限和下限會越來越緊,限制學習率減少到一個極小值,因此模型在訓練過程中也會越來越穩(wěn)定。Adabound優(yōu)化器的原理為:
式中 ?Qi(w)表示在輸入樣本xi確定后,以參數(shù)w為未知數(shù),以求得參數(shù)w最優(yōu)解。gt表示對參數(shù)w求導的梯度公式,通過梯度隨著參數(shù)w的不斷變化,來改變mt和vt。mt為梯度的加權平均值,vt為梯度的加權方差值;為學習率,和為動力值;;表示被限定在[]范圍內;和隨著時間t的變化而變化,并不是一個恒定的上下限值。模型參數(shù)的更新可描述為
根據(jù)式(14)可知,學習率將會隨著時間的變化而變化,并且與的差也會逐漸變小。在這種設置下,Adabound優(yōu)化器兼具SGD和Adam優(yōu)化器的優(yōu)點。在訓練早期由于上下界對學習率的影響較小,Adabound優(yōu)化器更加接近于Adam;而隨著時間的增加,裁剪區(qū)間[]越來越緊,在訓練后期,使得Adabound優(yōu)化器更接近于SGD,保持一定的學習率;在模型擬合后期中,Adabound優(yōu)化器仍保持穩(wěn)定學習率去更新模型參數(shù)。
3.4 基于Dempster規(guī)則的信息融合
在RCNNs結構中,原始振動信號數(shù)據(jù)通過Softmax層可以得到每組數(shù)據(jù)屬于哪一類的概率yi。在傳統(tǒng)的集成學習中,最大投票法被用于集成每個分類器輸出的類別結果,如隨機森林。雖然最大投票法比較簡單且容易實施,但仍有一些弊端。在本文提出的RCNNs結構中,根據(jù)D?S證據(jù)理論[29],采用Dempster規(guī)則對每個網(wǎng)絡結構產(chǎn)生的類別概率進行融合,得到最終的分類概率。通過這種設置,使得到的分類概率更加直觀并且準確。
3.5 基于隨機卷積神經(jīng)網(wǎng)絡的船用柴油機健康監(jiān)測流程
在本文中,一種隨機卷積神經(jīng)網(wǎng)絡被設計并應用到內燃機的健康監(jiān)測中。通過隨機卷積神經(jīng)網(wǎng)絡對內燃機的健康狀況進行實時監(jiān)測。該深度學習模型結構如圖3所示,步驟如下:
(1)通過傳感器,收集內燃機在不同工況下的振動信號數(shù)據(jù)。
(2)對原始的時域信號數(shù)據(jù)進行標準化處理,然后將數(shù)據(jù)劃分為訓練集與測試集,將標準化后的數(shù)據(jù)直接輸入網(wǎng)絡結構中,不再依賴于人工的特征設計和特征篩選。
(3)采用集成學習思想和Dropout技術構造隨機卷積神經(jīng)網(wǎng)絡結構。同時,Adabound優(yōu)化器被用于這種新型的網(wǎng)絡結構中,加快模型參數(shù)的更新。
(4)隨機卷積神經(jīng)網(wǎng)絡由多個單一的網(wǎng)絡結構組成。在每個網(wǎng)絡結構中,從訓練數(shù)據(jù)集中隨機抽取部分數(shù)據(jù)集對網(wǎng)絡進行訓練。在本文中,隨機抽樣率為80%。
(5)用測試數(shù)據(jù)集對所提出的深度學習結構的性能進行測試。通過Dempster合成規(guī)則將各個網(wǎng)絡結構預測的概率進行融合,得到最終的分類結果。
4 實驗驗證
4.1 數(shù)據(jù)描述
本文以四沖程柴油機(型號:R6105AZLD)為研究對象,通過監(jiān)測診斷其健康狀況驗證所提出方法的有效性[30]。本文所用試驗臺如圖4所示。該試驗臺架模擬了柴油機五種不同的工況,其五種工況模擬方案如表2所示。每種工況在相同的柴油機轉速(1500 r/min)下采集振動信號數(shù)據(jù)。本實驗中,采集振動信號的傳感器為B&W14100型加速度傳感器,設置的采樣頻域為4 kHz。由于柴油機為四沖程,曲軸轉動720°為一個工作循環(huán)。本文中,以3200個數(shù)據(jù)點為一個采樣周期。各工況的振動信號均在柴油機設置的轉速下達到穩(wěn)定工作狀態(tài)后進行采集。由于模擬柴油機的故障工況對柴油機系統(tǒng)影響較大,柴油機不能在故障工況下進行長時間的運行。所以在每個工況下,采樣200組數(shù)據(jù),總共1000組。試驗中,隨機選取80%的樣本用于訓練,20%的樣本用于測試。反復進行多次訓練?測試,保證測試結果的準確性。
4.2 基于傳統(tǒng)數(shù)據(jù)驅動的柴油機健康監(jiān)測結果
將本文所提出的深度學習網(wǎng)絡結構監(jiān)測方案的性能與傳統(tǒng)的數(shù)據(jù)驅動與卷積神經(jīng)網(wǎng)絡監(jiān)測方案進行對比。基于數(shù)據(jù)驅動的健康監(jiān)測方案通過人工設計特征,特征篩選,以簡單分類器對數(shù)據(jù)進行分類。通過設計合理的信號特征,采用合理的數(shù)據(jù)降維方法對原始振動信號進行預處理,最終將處理后的振動信號輸入到各種簡單的分類器中對數(shù)據(jù)進行分類。而傳統(tǒng)的卷積神經(jīng)網(wǎng)絡監(jiān)測方案通過單一網(wǎng)絡結構從時域信號數(shù)據(jù)中直接進行特征提取,達到端到端操作的目的,最終根據(jù)從原始數(shù)據(jù)學習的信息實現(xiàn)目標分類。
本文所有的算法編程軟件為python3.6.1,操作環(huán)境是macOS。深度學習模型采用pytorch框架實現(xiàn),其他機器學習算法通過python語言編程實現(xiàn)。
4.2.1 傳統(tǒng)的數(shù)據(jù)驅動方法
人工設計信號特征是通過信號的時域與頻域分析將振動信號的幅值、能量分布等特征隨著時間變化的規(guī)律用統(tǒng)計學方法進行描述。時域分析通常包括相關分析、時域統(tǒng)計分析和包絡分析,一般情況下根據(jù)時域波形對機械設備的運行狀態(tài)進行粗略判斷;頻域分析是根據(jù)信號的頻域描述對信號的組成及特征量進行分析和估計。本文將所采集的時域信號通過離散傅里葉變換轉化為頻域信號。常用的時域、頻域統(tǒng)計參數(shù)如表3所示。
表3中前21個為時域特征值,后6個為頻域特征值。本文研究中,將時域、頻域特征統(tǒng)計參數(shù)組合起來構成的融合特征向量作為信號的初始特征,可有效彌補單一時域或者頻域特征的不足。用這27個特征來表示原始振動信號。
若直接將27個特征作為分類器的輸入對信號進行分類,則容易造成維數(shù)災難,導致分類器的分類效果較差,所以需要進行特征篩選。本文用流形學習對時、頻域統(tǒng)計參數(shù)特征進行自動篩選。流形學習是一種減少非線性數(shù)據(jù)維數(shù)的有效方法。通過流形學習,可以從高維空間生成低維流形結構,并得到相應的嵌入映射,最終達到數(shù)據(jù)降維和可視化的目的。在本文中,三種流形學習算法被用于特征自動篩選,分別為等距特征映射算法(ISOMAP),局部線性嵌入算法(LLE)和t?分布隨機鄰居陷入算法(TSNE)。數(shù)據(jù)經(jīng)過流形學習處理后被輸入最終的分類器中,實現(xiàn)對內燃機工況的診斷。
本文研究中,將時、頻域特征通過三種不同流形學習算法降維到3維,方便數(shù)據(jù)可視化。經(jīng)過流形學習處理后的數(shù)據(jù)如圖6所示。
由圖6可知,將27維特征降維至3維,3維特征為原27維特征的融合特征,每一個新的特征融合了原多個特征所隱含的信息,不再單一地表示某一個時域或頻域特征信息,以達到簡化數(shù)據(jù)維數(shù)的目的,其融合后的特征分別用特征一、特征二、特征三來表示。LLE算法特征篩選的效果比較差,G4和G5之間有很大的重疊,G1,G2和G3之間的間隔不大,同類之間的分布比較離散。出現(xiàn)這類現(xiàn)象的原因可能是由于LLE是基于局部鄰域刻畫流形結構的,即假設每個點可以被其鄰域點線性重構,當其鄰域不能夠很好地重構該點時就會出現(xiàn)比較大的偏差。ISOMAP算法在特征篩選中取得了比LLE算法更好的效果。G3的所有樣本點都和其他幾種樣本分散開來,G1和G2、G4和G5從三維可視化的角度有少量的混疊,五類不同工況下的數(shù)據(jù)點基本上都各自聚成一團,但還是有個別樣本點偏離了自身群體,這是因為ISOMAP算法過分依賴于原始數(shù)據(jù)拓撲空間的穩(wěn)定性,比較適合于大樣本情況下的計算。而TSNE算法在特征篩選中的效果最好,特征篩選后的數(shù)據(jù)分類清晰,每種工況聚類效果明顯,五種不同的工況分布在低維空間距離較遠,具有較強的可分性。
本文采用的分類器是支持向量機(SVM)、極限學習機(ELM)和隨機森林(Random Forest)。通過不同的分類結果的對比,得到最優(yōu)的流形學習算法和分類器。本文中,將數(shù)據(jù)集按80%和20%劃分訓練集和測試集,訓練?測試重復實驗30次,最終以平均準確率作為診斷方案性能的指標,以降低隨機性對分類模型的干擾。平均準確率如表4所示。
由表4分析,所有方法的準確率均超過了80%,這主要是由于本文采用了大量的時、頻域統(tǒng)計參數(shù)特征融合的方式來表示原振動信號。這種特征融合的方法能夠極大地反映原振動信號在不同工況下的變化。在所有的方法中,以TSNE作為特征提取的方法和Random Forest為分類器這種方案能夠得到最高的準確率,達到90.1%。其他的方案均未達到90%,也就是說有十分之一以上的可能性會將故障工況忽略。實際上這在嚴苛工業(yè)應用中是不可接受的,尤其在船舶行業(yè)。在船舶航行中,柴油機一旦發(fā)生故障而且并未被及時發(fā)現(xiàn),這將對全體船上工作人員的人身安全造成極大的威脅。同時由表4分析可得,SVM作為分類器在故障診斷上的效果不能令人滿意。主要是由于SVM本身是一個二值分類器,無法直接進行多分類,需要構造多個SVM分別對每個故障工況進行分類,造成負類樣本的數(shù)據(jù)遠遠大于正類樣本的數(shù)據(jù),出現(xiàn)了樣本的極端不對稱,影響了分類準確率。而Random Forest在診斷準確率上能夠取得比較令人滿意的效果。這是由于利用了集成學習思想,將多個決策樹組合起來,能夠直接對數(shù)據(jù)多分類,并且在參數(shù)訓練過程中每個決策樹孤立運行,最終能夠得到性能較好的強分類器。
4.2.2 傳統(tǒng)的卷積神經(jīng)網(wǎng)絡
在本文中,為了反映隨機卷積神經(jīng)網(wǎng)絡結構所使用的Adabound優(yōu)化器的優(yōu)勢,在單一的卷積神經(jīng)網(wǎng)絡模型中比較了Adabound優(yōu)化器與其他幾個優(yōu)化器的性能,其中包括SGD,Momentum,RMSprop和Adam。不同的優(yōu)化器的參數(shù)設置如表5所示。目前,還沒有系統(tǒng)的方法確定各種優(yōu)化器的最優(yōu)參數(shù)。在本文研究中,每個優(yōu)化器的參數(shù)都是由默認值和實驗確定[26]。
圖7顯示了不同優(yōu)化器在訓練集和測試集上的學習曲線。在訓練過程中,所有優(yōu)化器加速的卷積神經(jīng)網(wǎng)絡結構都能達到接近100%的準確率,自適應方法Adam,Adabound優(yōu)化器能夠較快地使模型擬合,但是SGD優(yōu)化器達到令人滿意的準確率速度較慢,大約需要迭代40步,并且擬合過程波動較大。在測試集方面Momentum,RMSprop,Adam優(yōu)化器能夠以最快的速度達到較高的精確度,SGD優(yōu)化器在迭代60步時使模型達到擬合,使用SGD優(yōu)化器的網(wǎng)絡模型在模型擬合之后的測試準確度高于Momentum,RMSprop,Adam優(yōu)化器,如圖7(b)所示。同時,可以發(fā)現(xiàn)Momentum和RMSprop優(yōu)化器模型擬合好之后,準確率仍出現(xiàn)了部分波動。而Adabound優(yōu)化器在訓練集和測試集中均能較快地達到較高的準確率,并且學習曲線波動變化小,能夠保持穩(wěn)定的準確率。與其他優(yōu)化器相比,所使用Adabound優(yōu)化器網(wǎng)絡模型的測試精度提高了約2%。
表6為模型達到擬合的時間,本文以測試集準確率穩(wěn)定且達到94%為模型達到擬合的標準。由表6分析可得,Adam和Adabound這種自適應的優(yōu)化器使網(wǎng)絡模型在最短的時間內達到擬合。雖然SGD優(yōu)化器在訓練后期能夠使模型得到較高的準確率,但是訓練時間遠遠高于其他優(yōu)化器。
4.3 隨機卷積神經(jīng)網(wǎng)絡
本文所提出的隨機卷積神經(jīng)網(wǎng)絡將多個單一的網(wǎng)絡結構集成起來對內燃機進行健康監(jiān)測。隨機卷積神經(jīng)網(wǎng)絡從已經(jīng)分好的訓練集中每次隨機抽取80%的數(shù)據(jù)對單一網(wǎng)絡模型進行訓練。隨機卷積神經(jīng)網(wǎng)絡中的每個網(wǎng)絡結構中都用了兩個卷積層,兩個池化層,和一個全連接層。池化層中的操作為最大池化,卷積層中的激活函數(shù)為ReLu,優(yōu)化器為Adabound。表7列出了本文所用網(wǎng)絡結構的相關參數(shù)設置。
本文所用不同機器學習方法的健康監(jiān)測方案的性能如圖8所示。箱線圖中間的橫線表示每個方案準確率的中位數(shù),箱子的長度表示不同方案診斷性能的穩(wěn)定性。對于傳統(tǒng)數(shù)據(jù)驅動的方法,SVM分類器在測試集效果上明顯弱于其他兩個分類器,而ELM和Random Forest的平均準確率相差不大,但是Random Forest在測試集穩(wěn)定性方面比ELM更具有優(yōu)勢。經(jīng)分析可知,傳統(tǒng)數(shù)據(jù)驅動方法監(jiān)測性能方面的主要差異是由特征篩選方法導致的。不同的流形學習算法對特征的學習能力不同,因此導致了最終分類性能的不同。因此可知,特征設計和特征篩選過程對診斷性能有較大的影響。而深度學習模型在這兩個過程方面有極大的優(yōu)勢,深度學習模型能夠從時域中的振動信號自適應地提取工況特征并且完成健康狀況的智能診斷。傳統(tǒng)的卷積神經(jīng)網(wǎng)絡在健康監(jiān)測診斷方面的性能明顯比其他方案好,測試準確率可達到94%左右。本文所提出的隨機卷積神經(jīng)網(wǎng)絡集成了卷積神經(jīng)網(wǎng)絡的優(yōu)點,能夠自動實現(xiàn)數(shù)據(jù)特征設計和特征篩選的過程。如圖9所示,基于隨機卷積神經(jīng)網(wǎng)絡的內燃機健康監(jiān)測方案顯示了較高的性能,診斷準確率可達98%以上,最高可達100%,每次診斷準確率均比CNN高。同時,隨機卷積神經(jīng)網(wǎng)絡的箱線圖長度最短,說明在測試集準確率方面波動最小,非常適用于在線監(jiān)測診斷內燃機健康狀況,可以提供高度可靠和穩(wěn)定的診斷率。并且隨機卷積神經(jīng)網(wǎng)絡集成了多個單一的網(wǎng)絡結構,從每個網(wǎng)絡結構的訓練數(shù)據(jù)集中隨機抽取80%用于訓練,使得每個網(wǎng)絡結構都不同,在減少數(shù)據(jù)輸入的同時使得網(wǎng)絡結構更加多樣化,提高了網(wǎng)絡結構在監(jiān)測診斷方面的泛化能力。
由于最終目標是實現(xiàn)在線監(jiān)測,因此除了診斷準確率以外,還需要監(jiān)測方案能夠在極短的時間內響應。在實際應用中,將診斷模型在線下訓練好后,再應用到機械健康的在線監(jiān)測中,所以測試時間比訓練時間更具有參考價值,它能夠顯示監(jiān)測系統(tǒng)對內燃機狀態(tài)變化的反應速度。從表8的測試時間可以看出,以SVM為分類器的監(jiān)測方案測試時間相比其他方案較長,在發(fā)生緊急事故的情況下,此種監(jiān)測方案不能夠在極短的時間內作出響應。同時,可以發(fā)現(xiàn)深度學習模型在診斷時間方面遠遠快于其他方案,尤其是單一的卷積神經(jīng)網(wǎng)絡能夠最快地響應系統(tǒng)狀態(tài)的變化。而本文所提出的隨機卷積神經(jīng)網(wǎng)絡診斷速度也很快,時間同樣小于1 s。這是由于RCNNs網(wǎng)絡結構采用了Adabound優(yōu)化器和Dropout技術,大大加快了模型參數(shù)的訓練速度,同時由于深度學習模型可以直接從原始振動信號數(shù)據(jù)中提取有效特征實施診斷,不需要浪費時間在設計特征和特征篩選過程中。從準確率和測試時間兩方面分析可知,本文所提出的隨機卷積神經(jīng)網(wǎng)絡能夠提供較高的準確率,穩(wěn)定的診斷力和較短的診斷時間,完全適用于所考慮的在線監(jiān)測任務。
5 分析與結論
本文的研究目的是通過振動信號實現(xiàn)對內燃機的健康監(jiān)測。為了實現(xiàn)研究目的,在試驗臺架上對一架四沖程內燃機進行模擬故障運行,得到五種不同工況下的振動信號用于分析所提出的健康監(jiān)測方案的性能。通過與傳統(tǒng)方案的比較與分析,可以得到以下結論:
(1)傳統(tǒng)的數(shù)據(jù)驅動方法很大程度上取決于特征設計與特征篩選的步驟。在特征設計方面,需要探索更有效的特征來表示原振動信號以進一步提高診斷結果,但這一過程需要大量的人力和專家知識。而在特征篩選方面,選用合適的流形學習算法是關鍵。
(2)與傳統(tǒng)的數(shù)據(jù)驅動方法相比,深度學習模型在機械健康監(jiān)測領域具有更好的性能。在模型超參數(shù)設定完成之后,深度學習模型可以從原始信號直接提取特征,無需人工干預。
(3)本文所提出的隨機卷積神經(jīng)網(wǎng)絡結構中采用的Adabound優(yōu)化器,可以提高船用柴油機健康監(jiān)測的穩(wěn)定性和性能,大大節(jié)省了模型訓練時間。
(4)利用集成學習思想,構造了隨機神經(jīng)網(wǎng)絡結構,解決了傳統(tǒng)單一神經(jīng)網(wǎng)絡診斷精度不穩(wěn)定的問題,大大提高了診斷模型的診斷準確率和泛化能力。
在本文研究中,所用的振動信號均在同一轉速下采集到,考慮到實際情況下,內燃機的工作并不是在同一轉速下,所以,以后的工作將進一步研究隨機卷積神經(jīng)網(wǎng)絡在不同轉速情況下的性能。
參考文獻:
[1] 尚前明,王瑞涵,陳 ?輝,等. 多信息融合技術在船舶柴油機故障診斷中的應用[J]. 中國航海, 2018, 41(3): 26-31.
SHANG Q M, WANG R H, CHEN H, et al. Application of multi-information fusion technology for fault diagnosis in marine diesel engine[J]. Navigation of China, 2018, 41(3): 26-31.
[2] 岳應娟,王 ?旭,蔡艷平. 內燃機變分模態(tài)Rihaczek譜紋理特征識別診斷[J]. 儀器儀表學報, 2017, 38(10): 2437-2445.
YUE Y J, WANG X, CAI Y P. Internal combustion engine fault diagnosis based on identification of variational modal Rihaczek spectrum texture characterization[J]. Chinese Journal of Scientific Instrument, 2017, 38(10): 2437-2445.
[3] YANG Y, MING A, ZHANG Y, et al. Discriminative non-negative matrix factorization (DNMF) and its application to the fault diagnosis of diesel engine[J]. Mechanical Systems and Signal Processing, 2017, 95: 158-171.
[4] 王成棟,張優(yōu)云,夏 ?勇. 基于S變換的柴油機氣閥機構故障診斷研究[J]. 內燃機學報, 2003,21(4): 271-275.
WANG C D, ZHANG Y Y, XIA Y. Fault diagnosis of diesel valve train based on S transform[J]. Transactions of CSICE, 2003,21(4): 271-275.
[5] 蔡艷平,李艾華,王 ?濤,等. 基于時頻譜圖與圖像分割的柴油機故障診斷[J]. 內燃機學報, 2011, 29(2): 181-186.
CAI Y P, LI A H, WANG T, et al. Diesel engine fault diagnosis based on time-frequency spectrum image and image segmentation[J]. Transactions of CSICE, 2011, 29(2): 181-186.
[6] 蔡艷平,李艾華,王 ?濤,等. 基于EMD-Wigner-Ville的內燃機振動時頻分析[J]. 振動工程學報, 2010, 23(4): 430-437.
CAI Y P, LI A H, WANG T, et al. I.C. engine vibration time-frequency analysis based on EMD-Winger-Vile[J]. Journal of Vibration Engineering, 2010, 23(4): 430-437.
[7] 劉 ?昱,張俊紅,畢鳳榮,等. 基于Wigner分布和分形維數(shù)的柴油機故障診斷[J]. 振動、測試與診斷, 2016, 36(2): 240-245.
LIU Y, ZHANG J H, BI F R, et al. Study on fault diagnosis of diesel valve trains based on Winger distribution and fractal dimension[J]. Journal of Vibration, Measurement &Diagnosis, 2016, 36(2): 240-245.
[8] 王 ?強,張培林,王懷光,等. 基于稀疏分解的振動信號數(shù)據(jù)壓縮算法[J]. 儀器儀表學報, 2016, 37(11): 2497-2505.
WANG Q, ZHANG P L, WANG H G, et al. Data compression algorithm of vibration signal based on sparse decomposition[J]. Chinese Journal of Scientific Instrument, 2016, 37(11): 2497-2505.
[9] 焦曉璇,景博,黃以鋒,等. 基于小波包BP_AdaBoost算法的機載燃油泵故障診斷研究[J]. 儀器儀表學報, 2016, 37(9): 1978-1988.
JIAO X X, JING B, HUANG Y F, et al. Research on fault diagnosis for airborne fuel pump based on wavelet package and BP_AdaBoost algorithm[J]. Chinese Journal of Scientific Instrument, 2016, 37(9): 1978-1988.
[10] 李學軍,李 ?平,蔣玲莉. 類均值核主元分析法及在故障診斷中的應用[J]. 機械工程學報, 2014, 50(3): 123-129.
LI X J, LI P, JIANG L L. Class mean kernel principal component analysis and its application in fault diagnosis [J]. Journal of Mechanical Engineering, 2014, 50(3): 123-129.
[11] 張立國,李 ?盼,李梅梅,等. 基于ITD模糊熵和GG聚類的滾動軸承故障診斷[J]. 儀器儀表學報, 2014, 35(11): 2624-2632.
ZHANG L G, LI P, LI M M, et al. Fault diagnosis of rolling bearing based on ITD fuzzy entropy and GG clustering[J]. Chinese Journal of Scientific Instrument, 2014, 35(11): 2624-2632.
[12] 李學軍,李 ?平,蔣玲莉,等. 基于異類信息特征融合的異步電機故障診斷[J]. 儀器儀表學報, 2013, 34(1): 227-233.
LI X J, LI P, JIANG L L, et al. Fault diagnosis method of asynchronous motor based on heterogeneous information feature fusion[J]. Chinese Journal of Scientific Instrument, 2013, 34(1): 227-233.
[13] 徐玉秀,趙曉清,楊文平,等. 多參數(shù)與多測點信息融合的行星輪故障診斷[J]. 儀器儀表學報, 2014, 35(8): 1789-1795.
XU Y X, ZHAO X Q, YANG W P, et al. Planetary gear fault diagnosis based on information fusion of multi-parameters and multi-points[J]. Chinese Journal of Scientific Instrument, 2014, 35(8): 1789-1795.
[14] ZHAO R, YAN R, CHEN Z, et al. Deep learning and its applications to machine health monitoring[J]. Mechanical Systems and Signal Processing, 2019, 115: 213-237.
[15] 文成林,呂菲亞,包哲靜,等. 基于數(shù)據(jù)驅動的微小故障診斷方法綜述[J]. 自動化學報, 2016, 42(9): 1285-1299.
WEN C L, L? F Y, BAO Z J, et al. A review of data driven-based incipient fault diagnosis[J]. Acta Automatica Sinica, 2016, 42(9): 1285-1299.
[16] 雷亞國,賈 ?峰,周 ?昕,等. 基于深度學習理論的機械裝備大數(shù)據(jù)健康監(jiān)測方法[J]. 機械工程學報, 2015, 51(21): 49-56.
LEI Y G, JIA F, ZHOU X, et al. A deep learning-based method for machinery health monitoring with big data[J]. Journal of Mechanical Engineering, 2015, 51(21): 49-56.
[17] LIU R, MENG G, YANG B, et al. Dislocated time series convolutional neural architecture: An intelligent fault diagnosis approach for electric machine[J]. IEEE Transactions on Industrial Informatics, 2017, 13(3): 1310-1320.
[18] SUN W, ZHAO R, YAN R, et al. Convolutional discriminative feature learning for induction motor fault diagnosis[J]. IEEE Transactions on Industrial Informatics, 2017, 13(3): 1350-1359.
[19] Shao H, Jiang H, Zhang H, et al. Electric locomotive bearing fault diagnosis using a novel convolutional deep belief network[J]. IEEE Transactions on Industrial Electronics, 2018, 65(3): 2727-2736.
[20] INCE T, KIRANYAZ S, EREN L, et al. Real-time motor fault detection by 1-D convolutional neural networks[J]. IEEE Transactions on Industrial Electronics, 2016, 63(11): 7067-7075.
[21] JANSSENS O, SLAVKOVIKJ V, VERVISCH B, et al. Convolutional neural network based fault detection for rotating machinery[J]. Journal of Sound and Vibration, 2016, 377: 331-345.
[22] SHAO H, JIANG H, LIN Y, et al. A novel method for intelligent fault diagnosis of rolling bearings using ensemble deep auto-encoders[J]. Mechanical Systems and Signal Processing, 2018, 102: 278-297.
[23] KOWALSKI J, KRAWCZYK B, WO?NIAK M. Fault diagnosis of marine 4-stroke diesel engines using a one-vs-one extreme learning ensemble[J]. Engineering Applications of Artificial Intelligence, 2017, 57: 134-141.
[24] ZHANG W, LI C, PENG G, et al. A deep convolutional neural network with new training methods for bearing fault diagnosis under noisy environment and different working load[J]. Mechanical Systems and Signal Processing, 2018, 100: 439-453.
[25] Murugan P, Durairaj S. Regularization and optimization strategies in deep convolutional neural network[J]. 2017: arXiv:1712.04711
[26] 周安眾,羅 可.一種卷積神經(jīng)網(wǎng)絡的稀疏性Dropout正則化方法[J].小型微型計算機系統(tǒng),2018,39(8):1674-1679.
ZHOU A Z, LUO K. Sparse Dropout regularization method for convolutional neural networks[J]. Journal of Chinese Computer Systems, 2018, 39(8): 1674-1679.
[27] 劉建偉,劉 ?媛,羅雄麟. 深度學習研究進展[J]. 計算機應用研究, 2014, 31(7): 1921-1930.
LIU J W, LIU Y, LUO X L. Research and development on deep learning[J]. Application Research of Computers, 2014, 31(7): 1921-1930.
[28] LUO L, XIONG Y, LIU Y, et al. Adaptive gradient methods with dynamic bound of learning rate[J]. 2019:arXiv:1902.09843
[29] 徐從富,耿衛(wèi)東. Dempster-Shafer證據(jù)推理方法理論與應用的綜述[J]. 模式識別與人工智能, 1999, 12(4): 424-430.
XU C F, GENG W D. Summary of Dempster-Shafer evidence reasoning theory and application[J]. Pattern Recognition and Artificial Intelligence, 1999, 12(4): 424-430.
[30] 王際同. 基于嵌入式的柴油機在線故障診斷系統(tǒng)設計[D]. 太原:中北大學,2016.