廖玉波,俞 嘯,李偉生,劉文峰,曹西鶴,董 飛
(1.山東能源淄博礦業集團有限責任公司 裝備環保部,山東 淄博 255000;2.中國礦業大學 物聯網(感知礦山)研究中心,江蘇 徐州 221008;3.內蒙古黃陶勒蓋煤炭有限責任公司,內蒙古自治區 鄂爾多斯市 017312)
當前,旋轉機械正朝著高復雜度和集成化的方向發展[1]。由于旋轉機械通常在復雜惡劣的工況(如可變重載、高溫、強沖擊等)下運行,一旦其中部件發生故障,將造成巨大的經濟損失。因此,研究面向實際工業場景的智能故障診斷模型具有重要意義[2,3]。
近年來,基于人工智能的故障診斷方法逐漸成為研究熱點。通常,用于機械故障診斷的方法有基于傳統機器學習的方法、基于深度學習和基于遷移學習的方法[4]。然而,采用基于傳統機器學習方法和深度學習的方法,對旋轉機械進行故障診斷時,存在2個問題[5]1-2:(1)旋轉機械的變工況會導致實際運行過程中的信號樣本,與診斷模型的訓練樣本存在分布差異,造成不同工況下模型的診斷效果不理想;(2)缺少足量不同工況下的旋轉機械故障數據,即帶標簽的故障樣本。
基于上述原因,遷移學習方法近年來逐漸得到了研究人員的關注。遷移學習能夠利用已有源域的知識,解決不同目標域的問題[6]1-2。在進行機械故障診斷時,將已有工況下的帶標簽故障樣本數據作為源域,而其他工況下無標簽故障數據作為目標域,采用基于遷移學習的方法,能夠利用源域和目標域樣本訓練跨域故障診斷模型,對無標簽目標域數據的故障進行識別和分類。
由于深度學習方法具有強大的隱藏特征挖掘能力,近年來,許多研究人員對深度遷移學習方法開展了研究,并成功將其應用于旋轉機械跨域故障診斷。
張西寧等人[5]1-2提出了一種改進的卷積神經網絡(convolutional neural network, CNN),采用預訓練-微調的遷移學習方法,將由源域數據預訓練得到的深度網絡遷移至目標域,用以解決實際軸承故障診斷應用中缺少訓練樣本的問題。針對軸承在實際運行過程中的信號樣本與故障診斷模型的訓練樣本存在分布差異的問題,康守強等人[6]1-2構建了一種深度在線遷移模型,利用源域樣本預訓練CNN-ISVM模型,再將模型參數遷移至目標域模型,針對目標域新增數據,能實現快速分類識別;實驗結果表明,該深度在線遷移模型具有較好的穩定性和診斷精度。陳仁祥等人[7]基于深度置信網絡(DBN),提出了一種深度遷移方法,用于對不同工況下行星齒輪箱故障診斷。HE Zhi-yi等人[8]提出了一種深度遷移模型,用于對跨設備的軸承故障進行診斷;在該模型中,通過修改損失函數,來增強深度自解碼器(deep Auto-encoder, DAE)的重構性能,利用足量源域有標簽數據訓練DAE模型,將模型參數遷移至目標域,對跨設備的軸承故障進行了診斷。HE Zhi-yi等人[9]提出了一種新的DAE模型,即深度遷移多小波自編碼器;該模型通過從少量的訓練樣本中學習重要特征,來訓練深度遷移模型,對齒輪箱進行了跨域故障診斷。JANG G B等人[10]1-2基于有標簽源域數據和目標域中正常狀態數據,采用了具有注意力機制的深度CNN進行故障特征提取;并設計了一種域變換算法,對旋轉機械跨域故障進行了診斷。
雖然上述文獻均研究并完成了深度遷移學習方法在旋轉機械中的應用,但其主要關注的是深度模型的遷移,而未考慮特征的域不變性和判別性能對深度模型遷移后的故障分類影響。
對此,筆者提出一種新的旋轉機械故障診斷方法,即首先對基于最大重疊離散小波包變換(maximal overlap discrete wavelet packet transform, MODWPT)[11]的原始振動信號進行分析與特征提取,然后對面向遷移學習的特征進行選取,基于有標簽源域特征數據和目標域中正常狀態下的特征數據,對統計特征的故障類別判別性能和域不變性能進行量化評估,選取判別性能和域不變性能高的特征用于后續的遷移模型訓練;利用特征選取后的源域特征子集和目標域正常狀態下的特征子集,訓練遷移深度置信網絡模型;最后利用訓練好的遷移深度置信網絡對目標域無標簽特征數據進行分類,實現不同工況下的故障診斷。
Fisher Score(FS)是一種由Fisher判別分析[12]衍生出的有監督特征選取方法,它屬于過濾式選取方法[13]。FS是從特征數據的類間與類內散度兩方面對特征進行評價,以選取類內散度小,且類間散度大的特征,提高分類器的精度[14,15]。該算法的主要部分描述如下:

(1)

特征樣本的類內散度定義如下:
(2)

基于式(1,2),對于某一特征而言,其K類樣本的類間散度越大,類內散度越小,表示該特征對K類樣本的可分性越好[16]。
有Fisher Score的定義如下:
(3)
當FS(fm)的值越大時,則該特征越有利于分類。
最大均值差異(maximum mean discrepancy, MMD)[17]常被用于遷移學習過程。它是一種基于再生核Hilbert空間(reproducing kernel Hilbert space, RKHS)的,用于度量不同域數據集之間分布差異的指標。
給定源域特征集DS={x1,x2,…,xnS}和目標域特征集DT={y1,y2,…,ynT};nS和nT分別為源域和目標域的樣本數,2個數據集具有不同的概率分布,即PS(DS)≠PT(DT)。
這2個數據集間的最大均值差異如下:

(4)
式中:H—RKHS;φ—H中的非線性映射函數。
由于原始特征集維度高,存在干擾和冗余特征,影響故障診斷精度;同時,由于源域與目標域數據集之間存在分布差異,導致跨域故障診斷效果不佳。針對這兩個問題[18],筆者提出了一種面向遷移學習的特征選取方法,即基于FS與域間最大均值差異的特征選取(FSFM)方法。
該方法是從原始特征集中選取判別性能高,且域不變性能好的特征來構建特征子集,進而提高經遷移學習后模型的跨域故障診斷性能。
FSFM從兩個角度評價特征樣本:(1)FS值高的特征更有利于分類(利用FS評價特征的判別性能);(2)在源域和目標域之間,同一特征的MMD值越小,則認為其域不變性能越好(利用MMD度量源域和目標域中,正常狀態下特征樣本的分布差異)。
基于特征的FS值與MMD值,就可以構建新的特征選取指標RFM。
FSFM特征選取的詳細步驟如下:
(5)

根據式(3),分別計算各特征樣本的FS值,得到包含M個特征FS值的序列:
FS={fs(1),fs(2),…,fs(M)}
(6)
(2)基于MMD的特征域不變性度量。基于源域和目標域數據集中正常狀態特征樣本,利用式(4),計算各特征在源域和目標域間的MMD值,用于表征其域不變性能,得到M個特征的MMD值序列:
MMD={mmd(1),mmd(2),…,mmd(M)}
(7)
(3)構建特征選取指標RFM。為綜合考慮特征的判別性能和域不變性能,筆者提出一種特征評價指標RFM,其表達式如下:
(8)
由此,可得到包含M個特征的RFM值的序列,即:
RFM={rfm(1),rfm(2),…,rfm(M)}
(9)
特征的RFM值越大,其可選擇性越好,選擇RFM值大的特征構建特征子集,更有利于提高遷移學習效果和模型跨域診斷的性能。
最后,基于降序排列后的RFM值序列,選取對應的特征構建特征子集,訓練跨域故障診斷模型。
深度置信網絡(DBN)[19]是一種深度學習方法。它通過訓練多層神經元間權重值,根據概率最大值來生成訓練數據,是一種典型的生成模型。
DBN實質上是由多層的受限玻爾茲曼機(restricted Boltzmann machine, RBM)和一層反向傳播網絡堆疊而成的多隱含層神經網絡,常被用于模式識別與分類,以及數據的生成。DBN中的顯性神經元和隱性神經元分別用于接受輸入和提取特征。
采用3層RBM構建的DBN模型結構[10]3-4如圖1所示。

圖1 三層RBM的DBN結構
RBM的能量表達式為:
(10)
式中:vi—第i個可視層神經元狀態;bi—相應的偏置;hj—第j個隱含層神經元狀態;cj—相應的偏置;m—可視層神經元個數;n—隱含層神經元個數;Wij—連接這兩個層神經元的權重;θ—參數集,θ={W,b,c}。
DBN的學習過程包括正向預訓練和反向微調。其具體過程為:(1)基于無標簽輸入數據和網絡初始參數,進行逐層RBM訓練,每一層RBM的隱含層作為下一層RBM的可視層,多層RBM預訓練完成后,獲得網絡連接參數θ;(2)基于有標簽訓練數據,結合分類器采用反向誤差傳播法,對DBN進行參數微調,微調后的DBN網絡用于對無標簽測試樣本進行分類。
在深度置信網絡的基礎上,筆者構建了遷移深度置信網絡(transferred deep belief networks, TDBN),來此來對旋轉機械進行跨域故障診斷。給定工況1和2下的故障數據分為源域和目標域。
TDBN的構建過程如下:
(1)設置網絡初始參數、RBM數量、神經元數量、初始化權重等,選用激活函數sigmoid函數;
(2)首先利用無標簽源域數據預訓練DBN模型,根據RBM數量進行逐層訓練,各RBM的輸出(隱含層)作為下一個RBN的輸入(可視層);然后利用有標簽源域數據,對預訓練DBN模型進行微調,更新網絡參數;
(3)基于第2步獲得的DBN模型參數,將其遷移至目標域DBN模型(其分類層采用SoftMax分類器),將最后1層RBM的輸出作為SoftMax分類器的輸入;再利用目標域中少量有標簽特征數據,采用反向誤差傳播算法,對目標域DBN模型進行有監督的微調,微調后的DBN模型用于對無標簽目標域數據進行分類。
上述TDBN模型的構建流程如圖2所示。

圖2 TDBN模型的構建流程
針對實際工況下的旋轉機械故障診斷,基于故障振動信號,筆者提出了一種基于深度置信網絡的旋轉機械遷移故障診斷流程框架,即FSFM-TDBN。
該流程框架如圖3所示。

圖3 基于深度置信網絡的旋轉機械遷移故障診斷流程框架
該流程框架共分為4個步驟:
(1)基于MODWPT的原始振動信號分析與特征提取。即采集自工況1和2下的原始振動信號,分別設定為源域和目標域,先采用MODWPT對信號進行分解,然后結合統計參數,提取統計特征;
(2)面向遷移學習的特征選取。即基于有標簽源域特征數據和目標域中正常狀態下的特征數據,利用基于Fisher Score與域間最大均值差異的特征選取方法,評價統計特征故障類別的判別性能和域不變性能,獲得特征可選性指標RFM,再對各特征的RFM值進行降序排列,選取相應的統計特征構建特征子集,以用于遷移模型訓練;
(3)遷移深度置信網絡。即基于第2步中獲得的源域和目標域特征子集,根據圖2中的TDBN訓練步驟,先利用源域的特征子集訓練源域DBN模型,然后將源域DBN模型的網絡參數遷移至目標域DBN模型,再利用目標域中正常狀態下的特征集,對目標域DBN模型進行微調,以獲得TDBN模型;
(4)獲得遷移故障診斷結果。即利用獲得的TDBN模型,對目標域無標簽特征數據進行模式識別與分類,最后輸出遷移故障的診斷結果。
筆者基于SQI-MFS機械故障模擬試驗臺采集軸承和電機故障振動信號,驗證所提出的遷移故障診斷框架FSFM-TDBN的有效性與適應性。
SQI-MFS試驗臺如圖4所示。

圖4 SQI-MFS機械故障模擬實驗臺
4.1.1 實驗設置
為驗證FSFM-TDBN模型在不同工況下的軸承故障診斷性能,筆者采集轉速在1 200 r/min和1 600 r/min下的軸承故障振動信號。其中,設置的故障類型有內圈、外圈和滾珠故障,故障軸承型號為SER205。
352個特征的RFM值如圖5所示。

圖5 352個特征的RFM值
每種故障下設置0.05 mm, 0.1 mm和0.2 mm故障尺寸;再加上正常狀態下的軸承,因此筆者采集的軸承振動信號共包含10種狀態。每種狀態下的振動信號均采集90組信號樣本,各樣本包含5 000個連續采樣數據點,信號采樣頻率為16 kHz。
基于采集的信號樣本,筆者設置兩個跨域故障診斷任務:任務1中,1 200 r/min和1 600 r/min下的故障樣本分別作為源域和目標域;任務2中,1 600 r/min和1 200 r/min下的故障樣本分別作為源域和目標域。
軸承故障數據集的具體描述如表1所示(其中,各軸承狀態下的源域和目標域樣本分別為30和60,均是從90組信號樣本中隨機分配)。

表1 SQI-MFS軸承故障數據集
4.1.2 實驗結果分析
根據FSFM-TDBN的步驟,筆者首先將原始軸承故障振動信號經MODWPT進行4層分解(母小波選用“db5”);再將分解得到的16個小波包終端節點進行單支重構,基于這些重構信號及其相應的Hilbert包絡譜,計算11種統計參數[20,21](平均值、極差、峰度、標準差、能量、偏度、波峰因子、能量熵、形狀因子、脈沖因子和緯度因子)[22]60-61,共生成352個統計特征。
基于生成的352個統計特征,筆者構建原始特征集(original characteristic set, OCS),即利用FSFM特征選取方法,對352個特征進行判別性能和域不變性能的評估,獲得各特征的可選性指標RFM;以任務1的數據為例,源域的有標簽樣本和目標域的正常狀態樣本用于計算RFM值;根據這352個特征的RFM值的降序排列,選取前k個RFM值對應的統計特征用于后續的遷移診斷模型訓練;
經特征選取后,利用源域無標簽特征子集和目標域正常狀態下特征子集進行TDBN模型的訓練,TDBN的隱含層神經元個數設置為140,100和30,分類層為SoftMax分類器,故障類別為10,學習率為0.01;最后,將目標域無標簽特征數據輸入訓練得到的TDBN網絡,輸出故障診斷結果。
為凸顯該方法的優勢,筆者選用一些經典機器學習方法和常用遷移學習來進行對比,選用的方法有:支持向量機(SVM)、K最近鄰(KNN)、卷積神經網絡(CNN)、深度自編碼器(DAE)、隨機森林(RF)、遷移成分分析(TCA)和聯合分布適應(JDA)。
構建的對比模型如表2所示。

表2 對比故障診斷模型
軸承故障診斷結果對比如圖6所示(其中的故障診斷準確率為10種故障狀態的平均準確率)。

圖6 軸承故障診斷結果對比
由圖6可知:基于FSFM-TDBN模型的故障診斷性能優于其他模型,在任務1和任務2下的最大故障診斷準確率分別可達90.83%(特征選取數為170)和89.33%(特征選取數為150);
其他對比模型的最大故障診斷準確率分別為:OCS-SVM、OCS-KNN、OCS-CNN、OCS-RF、OCS-DAE、OCS-TCA和OCS-JDA模型,在任務1下的診斷準確率分別為:77.17%、65.17%、61.17%、71.67%、62.83%、69.50%和65.50%;在任務2下的診斷準確率分別為:72.33%、58.83%、56.33%、68.33%、58.33%、73.00%和78.33%。
面向遷移學習的特征選取方法FSFM與遷移學習方法TCA、JDA和TDBN相結合的模型故障診斷結果,如表3所示。

表3 軸承故障診斷結果
根據表3結果可知:當選取一定數量的特征時,模型的故障診斷準確率可以有明顯提高;OCS-FSFM-TCA模型在任務1下,選取150個特征時,故障診斷準確率可達81.67%,比未使用FSFM方法時提高了12.17%;OCS-FSFM-JDA模型在任務1下,選取170個特征時,故障診斷準確率可達84.83%,比未使用FSFM方法時提高了19.33%;FSFM-TDBN模型在任務1下,選取170個特征時,故障診斷準確率可達90.83%,比未使用FSFM方法時提高了8.83%;在任務2下,FSFM方法對故障診斷結果的提高作用也非常明顯。
綜合分析上述實驗結果可知:
(1)基于FSFM-TDBN模型的方法能夠有效實現不同工況下的故障診斷,最大的故障診斷準確率明顯高于其他對比模型;
(2)面向遷移學習的特征選取方法FSFM能夠有效提高基于遷移學習故障診斷模型的性能;當選取適當數量的特征構建子集,用于遷移學習故障診斷模型訓練,模型的故障診斷結果將明顯提升,表明FSFM方法能夠從原始特征集中選取判別性能和域不變性能高的特征,構建的特征子集更有利于遷移學習,增強模型的域適應能力,提高故障診斷準確率。
4.2.1 實驗設置
為進一步驗證FSFM-TDBN模型對跨域故障診斷的有效性與適應性,筆者采集轉速在1 200 r/min和1 600 r/min下的電機故障振動信號。電機的故障類型共有4種:轉子斷條故障、繞組故障、轉子彎曲故障、單相電壓不平衡故障。
此處采用和SQI-MFS試驗臺配套的故障電機,如圖7所示。

圖7 故障電機
電機相關參數如表4所示[22]70-72。

表4 電機的主要參數
加上正常狀態電機,筆者采集的電機振動信號共包含5種狀態。每種狀態下的振動信號均采集90組信號樣本,各樣本包含5 000個連續采樣數據點,信號采樣頻率為16 kHz。基于采集的信號樣本,設置2個跨域故障診斷任務:任務1中,1 200 r/min和1 600 r/min下的故障樣本分別作為源域和目標域;任務2中,1 600 r/min和1 200 r/min下的故障樣本分別作為源域和目標域。
電機故障數據集的具體描述如表5所示。

表5 SQI-MFS電機故障數據集
表5中,各電機狀態下的源域和目標域樣本分別為30和60,均為90組信號樣本中的隨機分配。
4.2.2 實驗結果分析
接下來,基于FSFM-TDBN框架,筆者開展不同工況下的電機故障診斷實驗分析(實驗步驟同上)。
首先,利用MODWPT對電機振動信號進行分解,結合11種統計參數,共提取出352個統計特征作為原始特征集;再利用FSFM特征選取方法對該352個特征評估,獲得對應的RFM值,如圖8所示。

圖8 352個特征的RFM值
經特征選取后,利用源域無標簽特征子集和目標域正常狀態下特征子集進行TDBN模型的訓練,TDBN的隱含層神經元個數設置為200,150和50,分類層為SoftMax分類器,故障類別為5,學習率為0.03。
表2中對比模型的故障診斷結果如圖9所示。

圖9 電機故障診斷結果對比
圖9中的對比結果與軸承故障診斷結果相似,FSFM-TDBN模型的故障診斷性能明顯優于其他模型,在任務1和任務2下的最大故障診斷準確率[23]分別可達86.83%(特征選取數為140)和81.33%(特征選取數為160);
其他對比模型的最大故障診斷準確率分別為:OCS-SVM、OCS-KNN、OCS-CNN、OCS-RF、OCS-DAE、OCS-TCA和OCS-JDA模型,在任務1下的診斷準確率分別為:54.00%、53.67%、69.67%、56.33%、46.33%、65.00%和71.83%;在任務2下的診斷準確率分別為:67.00%、44.33%、64.33%、64.67%、63.33%、61.67%和68.33%。OCS-FSFM-TCA和OCS-FSFM-JDA模型在任務1下的最大故障診斷準確率分別為71.67%和73.00%,在任務2下的最大故障診斷準確率分別為76.67%和77.17%。
上述實驗結果也表明,基于FSFM特征的選取方法能夠明顯提升遷移學習故障診斷[24]的性能。
綜上所述,基于FSFM-TDBN的模型在不同工況下故障診斷的有效性與適應性得到了驗證,在選取合適的特征數量時,其故障診斷的性能明顯優于其他對比模型。
筆者提出了一種基于深度置信網絡的旋轉機械遷移故障診斷方法FSFM-TDBN,首先利用時頻分析方法MODWPT對旋轉機械振動信號進行處理,提取統計特征;其次,用特征選取方法FSFM,對各統計特征的判別性能和域不變性進行量化評估,構建新的特征選取指標RFM;然后,選取RFM值高的特征構建子集用于訓練遷移深度置信網絡模型;最后,利用訓練好的遷移深度置信網絡,對不同工況下的無標簽特征樣本進行故障識別與分類。
筆者采用MFS-SQI機械故障模擬試驗臺的軸承和電機故障數據,開展了不同工況下的故障診斷實驗,結果表明:
(1)基于FSFM-TDBN的模型能夠有效地對不同工況下的故障進行診斷,最大的故障診斷準確率明顯高于其他對比模型;
(2)面向遷移學習的特征選取方法FSFM能夠有效提高基于遷移學習故障診斷模型的性能;當選取適當數量的特征構建子集用于遷移學習故障診斷模型訓練,模型的故障診斷結果將明顯提升,表明FSFM方法能夠從原始特征集中選取判別性能和域不變性能高的特征,構建的特征子集更有利于遷移學習,增強模型的域適應能力,提高故障診斷準確率。
綜合實驗驗證了基于FSFM-TDBN的方法在面向不同工況下旋轉機械故障診斷的有效性、適應性和優勢;證明該方法具有應用于實際工業場景下故障診斷的潛力。
在該研究內容的基礎上,后續筆者將基于遷移故障診斷模型開展進一步研究,主要內容包括:(1)進一步提高遷移學習模型的診斷準確率;(2)研究遷移學習故障診斷模型在更復雜的場景下的應用,比如跨多變工況和跨設備的故障診斷。