孫國棟,楊 雄,黃得龍,高 媛
(1.湖北工業(yè)大學機械工程學院,武漢 430068;2.湖北省包裝裝備工程技術(shù)研究中心,武漢 430068)
在現(xiàn)代工業(yè)中,先進的狀態(tài)監(jiān)測和故障診斷技術(shù),能及早發(fā)現(xiàn)設(shè)備的故障,避免事故的發(fā)生。由于旋轉(zhuǎn)機械應(yīng)用廣泛,因此研究其先進的故障診斷算法非常有必要。近年來,數(shù)據(jù)驅(qū)動的故障診斷方法不斷發(fā)展,需要大量的歷史數(shù)據(jù)來建立診斷系統(tǒng)的故障模型。雖然傳感技術(shù)的發(fā)展和普及使人們從故障的零部件中獲得海量數(shù)據(jù)[1]不再是一項挑戰(zhàn),但直接看這些數(shù)據(jù)很難區(qū)分同一機械部件的故障類型。因此,如何從海量數(shù)據(jù)中有效提取特征,準確識別故障類型和故障嚴重程度是一個棘手的問題。
由于振動信號含有豐富的信息,因此他們在故障診斷中得到了廣泛的應(yīng)用。為了從振動信號中提取有用的特征并識別故障類型,人們進行了廣泛而多樣的嘗試,主要分為三大類:時域分析、頻域分析和時頻分析[2]。許多研究者通過以上三種方法獲取樣本的統(tǒng)計特征,然后利用專業(yè)知識和相關(guān)經(jīng)驗[3-4]來識別故障類型。然而,這些診斷結(jié)果在很大程度上依賴于專家的先驗知識,這就使得診斷結(jié)果夾雜了過多人為因素。
隨著CNN 的高速發(fā)展,研究人員在LeNet-5 網(wǎng)絡(luò)的基礎(chǔ)上提出了一些新的CNN 結(jié)構(gòu),如AlexNet將第二層中的卷積窗口形狀減小到5×5,此外,第一、第二和第五個卷積層之后都使用了窗口形狀為3×3、步幅為2的最大池化層,而且AlexNet使用的卷積通道數(shù)也是LeNet 中的卷積通道的數(shù)十倍,這增加了很大的計算量。VGGNet[5]使用多個較小卷積核(3×3)的卷積層代替一個卷積核較大的卷積層,一方面可以減少參數(shù),另一方面相當于進行了更多的非線性映射,可以增加網(wǎng)絡(luò)的擬合/表達能力。ⅠnceptionV1~V4 系列[6-9]借鑒了NⅠN 的設(shè)計思路,用于增加網(wǎng)絡(luò)的深度和寬度,提高神經(jīng)網(wǎng)絡(luò)性能。ResNetV1~V2 系列[10-11]將Ⅰnception 架構(gòu)和殘差連接(Residual)結(jié)合起來。并通過實驗證實了,結(jié)合殘差連接可以顯著加速Ⅰnception 的訓練。MobileNetV1~V3 系列[12-14]的深度分離卷積方法可以大大提升運算速度,減少計算量和參數(shù)量。同時,由于卷積核尺寸對提升模型精度與效率也有很大影響,因此,在提取特征時,僅采用單尺度卷積核提取特征存在著局限性。CNN 模型不僅需要大尺寸的卷積核捕獲高分辨率特征圖,同時還需要小尺寸的卷積核捕獲低分辨率的特征圖,以獲得更高的精度和效率。為了從原始信號中挖掘隱藏的故障特征,結(jié)合上述兩個想法,設(shè)計一種淺層Ⅰnception-MobileNet 模型,在前期采用Ⅰnception 模塊,提取輸入層中不同分辨率的特征圖,然后將其串聯(lián)起來,再進行深度可分離卷積,實現(xiàn)特征學習與分類。
對于振動信號的故障診斷,大多數(shù)學者起初是借助信號處理技術(shù)對原始振動信號進行預處理,以提取原始信號中隱含的可以區(qū)分不同類別之間細微差異的故障特征。然而,這一操作一方面需要一定的理論基礎(chǔ)。另一方面引入了過多的人為因素。因此,為了避免人工經(jīng)驗對故障診斷的影響,隨后出現(xiàn)了一些利用卷積神經(jīng)網(wǎng)絡(luò)對原始數(shù)據(jù)進行特征提取及識別的方法。一般有兩種方法,第一種方法是利用一維卷積神經(jīng)網(wǎng)絡(luò)對原始數(shù)據(jù)進行特征學習及分類[15],但所設(shè)計的一般是深度卷積神經(jīng)網(wǎng)絡(luò),模型比較復雜;第二種方法是將原始數(shù)據(jù)拼接成二維矩陣[16],并將二維矩陣轉(zhuǎn)換為圖像,該方法比較簡單,且結(jié)合的卷積神經(jīng)網(wǎng)絡(luò)比較容易實現(xiàn)。
將原始數(shù)據(jù)轉(zhuǎn)化為圖像的具體方法為:假設(shè)獲取的振動信號數(shù)據(jù)為序列S,拼接矩陣M的大小為m×m,那么每次從序列S中截取的樣本信號長度為m2,其中m2大于等于振動信號周期長度。然后將樣本信號按照順序填充的方式組成拼接矩陣M,具體操作如圖1所示。
為了將拼接矩陣轉(zhuǎn)換為圖像,對拼接矩陣M標準化到0~255之間,標準化公式如下:

Ⅰnception模塊提出的目的是解決如何在有限的計算資源內(nèi),進一步提升網(wǎng)絡(luò)的性能。一般地,提升網(wǎng)絡(luò)性能最直接的方法是增加網(wǎng)絡(luò)的深度和寬度,即網(wǎng)絡(luò)的層數(shù)和每層的通道數(shù)。但是,當深度和寬度不斷增加的同時,需要學習到的參數(shù)也在不斷增加,容易發(fā)生過擬合。其次是均勻地增加網(wǎng)絡(luò)的大小,會導致計算量的加大。
因此,為解決以上問題,提出了Ⅰnception 結(jié)構(gòu),如圖2所示,既能保持濾波器級別的稀疏特性,又能充分密集矩陣的高計算性能。Ⅰnception模塊的核心思想就是將不同的卷積層通過并聯(lián)的方式結(jié)合在一起,經(jīng)過不同卷積層處理的結(jié)果矩陣在深度這個維度拼接起來,形成一個更深的矩陣。Ⅰnception 模塊可以反復疊堆形成更大的網(wǎng)絡(luò),它可以對網(wǎng)絡(luò)的深度和寬度進行高效地擴充,在提升深度學習網(wǎng)絡(luò)準確率的同時防止過擬合現(xiàn)象的發(fā)生。Ⅰnception模塊的優(yōu)點是可以對尺寸較大的矩陣先進行降維處理的同時,在不同尺寸上對視覺信息進行聚合,方便從不同尺度對特征進行提取。

圖2 Ⅰnception模塊A
Ⅰnception模塊A使用不同尺度的卷積核提取上一層的特征,這些卷積核的數(shù)量也不相同,經(jīng)過卷積操作后,得到了一些“簇”,之后將卷積操作得到的特征圖在深度方向進行串聯(lián)拼接,構(gòu)建出高效的稀疏結(jié)構(gòu)。由于堆疊了多次Ⅰnception 模塊后,會因為大量5×5 卷積的存在而導致計算量的增加,所以在進行5×5卷積,甚至3×3卷積前,必須先進行降維,降維使用的核大小是1×1 的卷積,從而得到了Ⅰnception模塊B,如圖3所示。

圖3 Ⅰnception模塊B
從圖3可以看出,Ⅰnception模塊B同樣具有四個分支。第一分支對輸入進行1×1 的卷積,用于跨通道組織信息以及對輸入通道進行降維,提高網(wǎng)絡(luò)的表達能力。第二分支先使用1×1卷積,然后連接3×3卷積,相當于進行了兩次特征變換。第三分支先進行1×1的卷積,然后連接5×5卷積。最后一個分支則是3×3最大池化后,再直接使用1×1卷積。最后,所有的分支通過一個串聯(lián)操作進行合并。
MobileNet是一種適合移動端運行的網(wǎng)絡(luò)結(jié)構(gòu),其在圖像分類、目標檢測及圖像分割等領(lǐng)域有著巨大的優(yōu)勢。對于卷積核大于1 的卷積計算,MobileNet采用深度可分離卷積,把卷積核為k×k的卷積拆分為兩步。第一步采用逐通道卷積(Depthwise Convolution),按通道維度執(zhí)行卷積核為k×k的卷積計算,如圖4所示。第二步采用逐點卷積(Pointwise Convolution),如圖5所示。MobileNet使用深度可分離卷積替換普通卷積,與傳統(tǒng)算法相比,具有顯著優(yōu)勢。對于大卷積核計算卷積部分,其通道維數(shù)不變,使得計算量和參數(shù)數(shù)量大大壓縮;對于通道變換部分,其使用小卷積核計算卷積,將計算量和參數(shù)數(shù)量壓縮到極致。

圖4 逐通道卷積

圖5 逐點卷積
假設(shè)輸入特征圖的大小為Din×Din×M,Din是輸入特征圖的寬度和高度,這里假定兩者相同,M是指輸入特征圖的通道數(shù);而輸出特征圖的大小是Dout×Dout×N,Dout是輸出特征圖的寬度和高度,N是指輸出特征圖的通道數(shù)。若卷積核大小為DK×DK,則通過普通卷積后,其計算如式(2)所示:

而對于逐通道卷積,其計算如式(3)所示:

對于逐點卷積,其計算如式(4)所示:

因此,深度可分離卷積的總計算如式(5)所示:

由此,深度可分離卷積的計算量和普通卷積計算量之比為:

如式(6)所示,若采用3×3 的卷積核,則深度可分離卷積的計算量比普通卷積的計算量至少小8~9倍。
為了排除人工經(jīng)驗對特征提取的干擾,提高卷積神經(jīng)網(wǎng)絡(luò)的特征學習能力,實現(xiàn)端到端的滾動軸承故障診斷,本文提出一種淺層Ⅰnception-MobileNet網(wǎng)絡(luò)模型。在提出該模型之前,首先設(shè)計一種淺層MobileNet 網(wǎng)絡(luò)模型。由于獲取的不同機械部件的振動信號周期不一樣,所以對于網(wǎng)絡(luò)的輸入尺寸進行規(guī)定,大小為32×32。對于模型中的深度可分離卷積核大小及深度,參考MobileNet-V1,因此取名為淺層MobileNet,其網(wǎng)絡(luò)結(jié)構(gòu)如圖6 所示。其中,conv2d_0 為普通卷積操作,conv2d_1~conv2d_6 為深度可分離卷積操作,其卷積核大小、池化大小及深度如圖6所示。

圖6 淺層MobileNet網(wǎng)絡(luò)模型
然而,深度可分離卷積結(jié)構(gòu)中的卷積核尺寸比較單一。為了增強網(wǎng)絡(luò)的特征提取能力,設(shè)計一種能夠提取全面特征的網(wǎng)絡(luò)模型,將Ⅰnception 模塊加入到了淺層MobileNet網(wǎng)絡(luò)中,利用多尺度卷積核提取特征,以提高模型的準確性和效率。為了方便與淺層MobileNet網(wǎng)絡(luò)做比較,我們用Ⅰnception模塊替換淺層MobileNet網(wǎng)絡(luò)中的深度可分離卷積層,取名為淺層Ⅰnception-MobileNet。本文主要討論兩種結(jié)構(gòu)的淺層Ⅰnception-MobileNet,一種是只使用一個Ⅰnception 模塊替換一層深度可分離卷積層,取名為淺層Ⅰnception-MobileNet-A,其中conv2d_0 為普通卷積層,conv2d_1~conv2d_5為深度可分離卷積層,其網(wǎng)絡(luò)結(jié)構(gòu)如圖7 所示;另一種是使用兩個Ⅰnception模塊分別替換一層普通卷積和一層深度可分離卷積層,取名為淺層Ⅰnception-MobileNet-B,其中conv2d_0~conv2d_5 為深度可分離卷積層,其網(wǎng)絡(luò)結(jié)構(gòu)如圖8 所示。為選取合適的網(wǎng)絡(luò)結(jié)構(gòu),將在第3.3節(jié)對這三種網(wǎng)絡(luò)進行討論。

圖7 淺層Ⅰnception-MobileNet-A網(wǎng)絡(luò)模型

圖8 淺層Ⅰnception-MobileNet-B網(wǎng)絡(luò)結(jié)構(gòu)
為驗證所提方法的可行性和有效性,分別在兩個滾動軸承數(shù)據(jù)集上進行了故障診斷實驗。首先,對數(shù)據(jù)集進行信號采樣,并通過拼接法獲取相同大小的二維圖像。然后,通過CWRU數(shù)據(jù)集測試所設(shè)計的淺層Ⅰnception-MobileNet 網(wǎng)絡(luò)模型,找出最優(yōu)模型以實現(xiàn)無手工特征影響的滾動軸承的故障診斷,并與其他卷積神經(jīng)網(wǎng)絡(luò)的測試結(jié)果進行比較。最后,通過MFPT 數(shù)據(jù)集驗證該模型的優(yōu)越性和魯棒性。所有實驗均在Windows7、Ⅰntel Xeon E5-2640@2.40 GHz CPU、64 GB RAM、Python 3.5 和Tensorflow條件下進行。
本文使用兩個數(shù)據(jù)集對所提的方法進行驗證。CWRU 數(shù)據(jù)集來自凱斯西儲大學軸承數(shù)據(jù)中心(CWRU)[17],實驗中使用一臺2馬力的電機來采集驅(qū)動端和風扇端軸承上的加速度計數(shù)據(jù)。測試軸承由電火花加工而成,型號為6205-2RS JEM SKF。將加速度計放置在驅(qū)動端附近,設(shè)置采樣頻率為12 kHz,軸承在四種不同電機載荷(0、1、2、3)HP、四種不同故障位置(正常工況、內(nèi)圈故障、滾動體故障和外圈故障)、三種不同故障程度(0.007、0.014、0.021)inch分別表示故障程度為輕度、中度、重度下進行測試,類別劃分見表1。

表1 CWRU數(shù)據(jù)集
MFPT 數(shù)據(jù)集由機械故障預防技術(shù)協(xié)會(MFPT)提供[18],試驗臺裝有NⅠCE軸承,總共追蹤了三個基線條件、七組外圈故障條件和七組內(nèi)圈故障條件。其中,三組基線數(shù)據(jù)是在采樣頻率為97 656 Hz 和負載為2 70l lbs 的條件下采集的;七組外圈故障是在采樣頻率為48 828 Hz,負載分別為25 lbs、50 lbs、100 lbs、150 lbs、200 lbs、250 lbs、3 00l lbs的條件下采集的;七組內(nèi)圈故障是在頻率為48 828 Hz,負載分別為0、50 lbs、100 lbs、150 lbs、200 lbs、250 lbs、3 00l lbs的條件下采集的。類別劃分見表2所示。

表2 MFPT數(shù)據(jù)集
對于CWRU數(shù)據(jù)集,其樣本信號的采樣過程如圖9 所示。其中,采樣長度為1 024,位移量為500,每類故障類型的每種工況條件下采取了240個樣本信號,每類故障類型包含四種工況,故每類故障類型的樣本信號有960 個,有十種故障類型,因此,CWRU 數(shù)據(jù)集總共有9 600 個樣本信號。其中用于訓練模型的樣本信號有6 000 個,剩下的3 600 個樣本信號用于測試。為測試該模型的穩(wěn)定性,將測試集劃分為三個等級:等級Ⅰ包含1 200個測試樣本;等級Ⅱ包含2 400個測試樣本;等級Ⅲ包含3 600個測試樣本。等級越高,說明測試集的樣本數(shù)越多。十種故障類型的拼接圖如圖10所示。

圖9 重疊采樣過程圖

圖10 CWRU 中滾動軸承十種狀態(tài)的拼接圖
對于MFPT 數(shù)據(jù)集,其樣本信號的采樣過程與CWRU 數(shù)據(jù)集相同。其中,采樣長度為5 120,位移量為2 000,每類故障類型有495個樣本,有三種故障類型,因此,MFPT數(shù)據(jù)集總共有1 485個樣本信號。為避免特殊性和偶然性,從每個類型中隨機抽取345個樣本進行訓練,剩下的150 個樣本進行測試。三種故障類型的拼接圖如圖11所示。

圖11 MFPT中滾動軸承三種狀態(tài)的拼接圖
為尋找合適的淺層Ⅰnception-MobileNet 網(wǎng)絡(luò),本節(jié)將用淺層MobileNet 網(wǎng)絡(luò)、淺層Ⅰnception-MobileNet-A 網(wǎng)絡(luò)及淺層Ⅰnception-MobileNet-B 網(wǎng)絡(luò)分別對CWRU數(shù)據(jù)集進行訓練及測試,在進行三種不同網(wǎng)絡(luò)的實驗過程中,除了輸入訓練的網(wǎng)絡(luò)結(jié)構(gòu)更換之外,其他參數(shù)均相同。另外,為體現(xiàn)出所設(shè)計的淺層混合深度可分離卷積神經(jīng)網(wǎng)絡(luò)結(jié)構(gòu)的優(yōu)越性及有效性,通過控制變量法,將CWRU 數(shù)據(jù)集分別在LeNet-5及ResNet-110網(wǎng)絡(luò)上進行訓練及測試,并將最后測試結(jié)果與所設(shè)計的網(wǎng)絡(luò)進行比較。
表3顯示了不同網(wǎng)絡(luò)結(jié)構(gòu)在CWRU數(shù)據(jù)集的不同等級測試集上的分類精度。可見,LeNet-5 與ResNet-110網(wǎng)絡(luò)結(jié)構(gòu)在CWRU數(shù)據(jù)集的不同等級測試集上的分類結(jié)果均低于淺層Ⅰnception-MobileNet網(wǎng)絡(luò)系列。針對輸入數(shù)據(jù)為原始信號時,所設(shè)計的淺層Ⅰnception-MobileNet 網(wǎng)絡(luò)系列具有較強的特征提取能力,比其他網(wǎng)絡(luò)結(jié)構(gòu)更全面地提取出不同故障類別之間的敏感特征,使得分類更加容易。
如表3所示,淺層Ⅰnception-MobileNet-A在每個測試等級上的分類精度都高于淺層MobileNet,說明Ⅰnception模塊的加入有利于提高網(wǎng)絡(luò)的特征提取能力。淺層Ⅰnception-MobileNet-A 在每個測試等級上的分類精度都高于淺層Ⅰnception-MobileNet-B,說明用Ⅰnception模塊替換普通卷積實現(xiàn)特征提取效果不明顯,反而使得網(wǎng)絡(luò)結(jié)構(gòu)比較復雜。綜上所述,淺層Ⅰnception-MobileNet-A網(wǎng)絡(luò)結(jié)構(gòu)的分類效果最好。

表3 不同網(wǎng)絡(luò)結(jié)構(gòu)在CWRU數(shù)據(jù)集上不同等級的測試結(jié)果
除了網(wǎng)絡(luò)之間的比較外,還需要對網(wǎng)絡(luò)本身的參數(shù)進行調(diào)整及優(yōu)化,其中,主要討論的參數(shù)是在訓練時輸入模型中的樣本批量大小。由于上節(jié)已確定了合適的網(wǎng)絡(luò)結(jié)構(gòu),因此,用該網(wǎng)絡(luò)結(jié)構(gòu)在MFPT數(shù)據(jù)集和數(shù)據(jù)集上進行實驗。
在網(wǎng)絡(luò)訓練過程中,采用的是隨機批量訓練方法。為了尋找出合適的批量大小,控制其他參數(shù)不變,均勻地設(shè)置不同的批量參數(shù)進行網(wǎng)絡(luò)訓練,并用CWRU數(shù)據(jù)集中不同等級的測試集對訓練好的網(wǎng)絡(luò)進行測試,以分類精度為衡量標準,測試結(jié)果如表4所示。可見,每次訓練樣本為100 時,測試效果最好。并且該模型在不同等級下的分類精度相近,說明小樣本能夠代替大樣本,該模型很穩(wěn)定。

表4 不同批量輸入在CWRU數(shù)據(jù)集上不同等級的測試結(jié)果
同樣地,將淺層Ⅰnception-MobileNet 應(yīng)用到MFPT 數(shù)據(jù)集上,通過設(shè)置不同批量大小對模型進行訓練與學習,實驗結(jié)果表明,當每次輸入到模型的樣本為50 個時,可獲得最好的診斷結(jié)果,診斷精度為95.78%。
目前,現(xiàn)有故障診斷算法主要有基于端到端和基于人工經(jīng)驗進行特征提取的故障診斷算法,基于端到端的典型模型包括拼接圖+CNN[19]、一維信號+TⅠCNN[20]、拼接圖+LeNet-5 和拼接圖+ResNet-110等;基于手工特征提取的模型主要有CVSFF[21]和8WPE-MF+SVM[22]等。
本文提出的故障診斷算法是基于端到端的卷積神經(jīng)網(wǎng)絡(luò),為驗證所提出故障診斷算法的優(yōu)越性及有效性,在CWRU 數(shù)據(jù)集上,不僅與現(xiàn)有端到端故障診斷算法進行了比較,還對比了現(xiàn)有的基于手工特征提取的故障診斷算法,相關(guān)數(shù)據(jù)如表5所示。

表5 與現(xiàn)有故障診斷算法的比較
通過比較可得,本文提出的故障診斷方案不但能解決四種混合負載下的十種故障狀態(tài)的診斷問題,而且能實現(xiàn)高精度分類,分類精度為99.5%。比現(xiàn)有的故障診斷算法精度高、效果好。
本文提出了一種端到端的旋轉(zhuǎn)機械故障診斷算法,利用拼接法將一維原始振動信號轉(zhuǎn)換為二維拼接圖,并設(shè)計了一種混合深度可分離卷積神經(jīng)網(wǎng)絡(luò),即淺層Ⅰnception-MobileNet 網(wǎng)絡(luò)。為尋找出合適的淺層Ⅰnception-MobileNet 網(wǎng)絡(luò)結(jié)構(gòu),設(shè)計了淺層MobileNet、淺層Ⅰnception-MobileNet-A 及淺層Ⅰnception-MobileNet-B。并與LeNet-5及ResNet-110網(wǎng)絡(luò)在相同數(shù)據(jù)集上進行比較,實驗結(jié)果表明,淺層Ⅰnception-MobileNet 可識別的故障類型多達10 類,能夠?qū)崿F(xiàn)99.5%的分類精度。混合多尺度卷積核的特征提取能力優(yōu)于單一卷積核,且在深度可分離卷積層的作用下減少了大量的參數(shù)數(shù)量。因此,所提出的基于淺層Ⅰnception-MobileNet 的旋轉(zhuǎn)機械故障診斷算法具有一定的優(yōu)越性。