楊洪柏,張宏利,劉樹林
1.上海開放大學 理工學院,上海 200433; 2.上海大學 機電工程與自動化學院,上海 200072)(*通信作者電子郵箱948645047@qq.com)
基于可視化異類特征優(yōu)選融合的滾動軸承故障診斷
楊洪柏1,2*,張宏利2,劉樹林2
1.上海開放大學 理工學院,上海 200433; 2.上海大學 機電工程與自動化學院,上海 200072)(*通信作者電子郵箱948645047@qq.com)
針對故障診斷過程中基于簡單的多類故障特征聯(lián)合決策存在特征集維數(shù)多、數(shù)據(jù)冗余、故障識別率不高的缺點,提出了一種基于異類特征優(yōu)選融合的故障診斷方法。該方法根據(jù)多類特征數(shù)據(jù)的輪廓圖,分析各維特征數(shù)據(jù)的聚類特性,去除聚類性弱、對故障區(qū)分無益的冗余特征維度,僅保留聚類性強的特征維度用于故障識別。在軸承故障診斷實驗中,選用故障信號時域統(tǒng)計量和小波包能量兩類多維特征進行優(yōu)選融合,并采用反向傳播(BP)神經(jīng)網(wǎng)絡進行故障模式識別。故障識別率達到100%,顯著高于無特征優(yōu)選的故障診斷方法。實驗結果表明所提出的方法簡便易行,可以顯著提高故障識別率。
異類特征;特征融合;模式識別;故障診斷;滾動軸承
針對同一類故障,用不同傳感器采集的振動信號稱為不同源振動信號,同一傳感器采集的數(shù)據(jù)稱為同源振動信號,而采用不同提取方法得到的不同特征,則稱為異類特征。不論是異源同類特征還是同源異類特征,由于信號源不同或特征提取方法不同,使得特征具有不同的屬性,表征了故障的某一方面特性。單用一類特征進行故障診斷類似瞎子摸象,可能以偏概全,影響故障識別率。目前,為了對設備作出準確、全面的狀態(tài)評估,一些學者采用不同源數(shù)據(jù)特征或同源數(shù)據(jù)異類特征共同來進行故障診斷[1-8],其結果會造成特征集的維數(shù)增加、數(shù)據(jù)處理量加大、數(shù)據(jù)存在冗余、一些不敏感特征存在等,影響故障識別率。
為了降維,去除冗余特征及不敏感特征,實現(xiàn)特征的有效融合,許多學者進行了研究。Chen等[1]采用遺傳算法對時域特征進行優(yōu)選。也有許多學者采用非線性流形學習法對高維特征集的維數(shù)約簡[2]。楊宇等[3]用基于Wrapper模式的距離評價技術進行特征選擇;Peng等[4]用互信息理論用于特征選擇;Zhao[5]應用粗糙集理論進行特征選擇。目前比較主流的特征融合方法為主成分分析方法及其改進方法[6-8],其中古瑩奎等[6]應用主成分分析法對小波包能量單類特征提取累積貢獻率達到95%的特征主成分并輸入支持向量機(Support Vector Machine,SVM)分類器中進行識別,將滾動軸承故障特征從8維降低到5維,最終的故障診斷的準確率為97%。
針對前述問題,本文提出一種基于可視化技術的異類特征優(yōu)選融合方法。該方法利用特征的輪廓圖對特征直觀地去除冗余和不敏感特征,選擇出優(yōu)質特征。本文方法簡單易用,是異類特征有效融合的一種探索。具體實現(xiàn)時,可以先對各單一特征運用輪廓圖進行優(yōu)選,然后進行多類特征融合進一步優(yōu)選,使得識別率穩(wěn)定在一個比較高的水平。
可視化技術具有直觀、簡單有效的特點。可視化方法主要有散點圖、輪廓圖(平行坐標法)、多維徑向坐標法等方法[9]。輪廓圖將n維數(shù)據(jù)空間用n條等距離的平行軸映射到二維平面上。每條軸線對應于一個屬性維,也即橫坐標表示各個特征參數(shù),縱坐標表示各個特征值。每一個數(shù)據(jù)樣本都可以轉換成圖形形式,用一條折線表示在n條平行軸上[9]。用輪廓圖法把所有的故障樣本都用這樣的可視化方式顯現(xiàn)在一幅圖形中,具有相同屬性的特征向量會靠攏在一起,與其他類別具有可分性,否則說明特征參數(shù)對故障類別沒有可分性。
模式識別實質就是分類,聚類特性越明顯,其識別率越高。利用這一特點,通過可視化圖形觀察進行特征優(yōu)選。通過直觀的方式去除聚類特性不明顯的特征,篩選出聚類明顯的優(yōu)質特征。
圖1(a)是鳶尾(Iris)花數(shù)據(jù)集特征數(shù)據(jù)的輪廓圖。Iris有3種植物,分別是Setosa、Versicolor和Virginica,4個特征分別是萼片長度(SepalLength,SL)、萼片寬度(SepalWidth,SW)、花瓣長度(PetalLength,PL)和花瓣寬度(PetalWidth,PW)。每種植物有樣本40個,一共有120個植物樣本。從圖1(a)可以看出有3種聚類,圖中萼片長度SL和萼片寬度SW各個類別之間區(qū)分度不高,聚類特性不明顯,交織在一起,去掉這兩個“劣質”指標,保留2個“優(yōu)質”指標的輪廓圖如圖1(b)所示,圖中的類別區(qū)分度較圖1(a)明顯提高。

圖1 Iris數(shù)據(jù)特征輪廓圖
基于輪廓圖的可視化特征優(yōu)選方法的步驟可描述如下:
Step1 繪制各種故障特征樣本的輪廓圖。
Step2 分析某一特征數(shù)據(jù)聚類特性。
Step3 某一特征能較清楚地區(qū)分各故障類型,則保留該特征;否則,去除該特征。
Step4 若還有未分析特征,轉Step2;否則,特征優(yōu)選過程結束。
2.1BP神經(jīng)網(wǎng)絡診斷流程
智能診斷方法目前多以頻譜頻帶能量為特征,采用神經(jīng)網(wǎng)絡進行故障識別[9-13]。時域統(tǒng)計特征是最為簡單最早使用的特征,故而提取滾動軸承故障信號的時域統(tǒng)計特征和小波包能量兩種異類特征,應用可視化融合方法進行優(yōu)選,然后用應用最廣泛的模式識別方法——反向傳播(BackPropagation,BP)神經(jīng)網(wǎng)絡進行智能診斷。
滾動軸承的數(shù)據(jù)選用美國CaseWesternReserveUniversity軸承數(shù)據(jù)中心的實驗數(shù)據(jù),實驗軸承為6205-2RSJEMSKF深溝球軸承,故障刻痕深度為0.177 8mm,采樣頻率為12kHz, 轉速為1 730r/min。分別取滾動軸承正常工作、滾動體、內圈、外圈故障樣本數(shù)據(jù)各59個樣本,每個樣本長度為2 048個數(shù)據(jù),進行時域特征和小波包能量的提取。為了簡化融合后高維數(shù)據(jù)的融合困難,可首先對各類特征進行可視化初選,然后再合并起來進一步優(yōu)化融合。為了研究可視化優(yōu)選方法對診斷識別率提高效果,分別對單類特征優(yōu)選前后的診斷識別率進行對比研究。特征聯(lián)合后再用可視化方法進一步進行優(yōu)選,并進行優(yōu)選前后故障診斷識別率進行對比研究,來分析其效果。
BP網(wǎng)絡采用三層神經(jīng)網(wǎng)絡結構,第一層為輸入層,神經(jīng)元個數(shù)等同于輸入特征個數(shù);第二層為隱含層,選Sigmoid激活函數(shù)f(x)=1/(1-e-αx),根據(jù)選擇原則和測試結果選擇隱層神經(jīng)元個數(shù)為10個;第三層為線性輸出層,針對模式識別的神經(jīng)網(wǎng)絡,輸出層采用線性輸出。對應的期望輸出分別為:無故障(0,0,0,1)、滾動體故障(0,0,1,0)、內圈故障(0,1,0,0)和外圈故障(1,0,0,0)。
建立如圖2所示的滾動軸承故障診斷流程圖,具體步驟如下:1)選取訓練和測試用的滾動軸承振動信號;2)提取各類特征;3)應用可視化圖形優(yōu)選方法優(yōu)選特征;4)將各個優(yōu)選的特征作為神經(jīng)網(wǎng)絡的輸入,以內圈故障、滾動體故障、外圈故障和正常狀態(tài)四種模式作為網(wǎng)絡輸出,確定網(wǎng)絡結構,對網(wǎng)絡進行訓練;5)用訓練好的網(wǎng)絡對測試樣本進行分類識別。

圖2 滾動軸承故障診斷流程
Fig. 2Flowchartofrollingbearingfaultdiagnosis
另外,為了研究特征優(yōu)選對噪聲的魯棒性,采用原始信號訓練,用不同信噪比(Signal-to-NoiseRatio,SNR)的信號進行測試。任意選取原始數(shù)據(jù)每種狀態(tài)下的20個樣本構成故障訓練樣本(共80個),其余的樣本構成模型的測試樣本(共156個)。若是加噪信號,為了與不加噪測試樣本相同,每種樣本隨機取39個樣本也組成156個測試樣本。
2.2 時域統(tǒng)計特征的初步優(yōu)選
常用的時域特征參數(shù)包括4個有量綱指標和5個無量綱指標[13]。x(n)為時域信號序列(n=1,2,…,N),選用4個有量綱特征指標為絕對均值Xm、方差Xc、均方根Xrms和平均峰值Xp。其計算公式為:
(1)
(2)
(3)
(4)
其中:xp(j)(j=1,2,…,J0)是峰值,本文J0取10。
選用5個無量綱參數(shù)指標為峰值指標Cp、脈沖指標Cf、裕度指標Ce、峭度指標Cq和歪度指標Cw。其計算公式為:
Cp=Xp/Xrms
(5)
Cf=Xp/Xm
(6)
Ce=Xrms/Xm
(7)
Cq=E(x-μ)4/σ4
(8)
Cw=E(x-μ)3/σ3
(9)
其中:μ為均值;σ為標準差。
每個特征參數(shù)反映振動狀態(tài)的不同情況,不同故障信號所對應的敏感特征不同。針對要識別的故障,挑選出具有故障敏感性和聚類性的特征是提高故障識別率的關鍵。本文把對故障敏感并明顯表現(xiàn)出聚類特性的特征稱為優(yōu)質特征。

圖3 滾動軸承故障時域特征未歸一化輪廓圖
圖3是滾動軸承時域統(tǒng)計特征的輪廓圖。滾動軸承故障具有4種類型:正常(無故障)、滾動體故障,內圈故障和外圈故障。基于各特征幅值大小差別較大,不利于聚類特性的分辨,對特征數(shù)據(jù)進行歸一化處理,歸一化后的滾動軸承特征輪廓圖如圖4(a)所示,后文都用歸一化圖。圖4(a)中峰值指標Cp和歪度指標Cw均勻地分布整個特征域,聚類特性不明顯,甚至不同類別有部分交織,去掉這兩個“劣質”指標,保留7個“優(yōu)質”指標的輪廓圖如圖4(b)所示,圖中的類別區(qū)分度較圖3和圖4(a)明顯提高。用BP網(wǎng)絡進行識別,不同SNR下的實驗結果如表1所示,特征經(jīng)過優(yōu)選過的故障識別率都高于同樣條件下的未經(jīng)優(yōu)選的故障識別率。

圖4 滾動軸承故障時域特征歸一化輪廓圖
無噪信號未經(jīng)優(yōu)選時的識別率為69.231%,優(yōu)選過的識別率上升到98.077%(見表1)。從表1還可知,特征沒有進行優(yōu)選情況下,故障識別率隨著噪聲的加入逐步下降;而特征經(jīng)過優(yōu)選后的故障識別率保持比較高的故障識別率,體現(xiàn)出優(yōu)質特征對噪聲具有一定的魯棒性。

表1 時域特征下滾動軸承故障診斷識別率
2.3 小波包能量特征初步優(yōu)選
小波包能量特征也是常用的故障診斷特征。小波包分析法選取Daubechies-db16小波包,對滾動軸承信號進行小波包3層分解得到8個分解頻帶。同樣用無噪信號訓練BP模型,用不同SNR的信號進行測試。實驗結果顯現(xiàn)在無噪情況下和SNR=50 dB時診斷正確率都很高,可達到100%的識別率;當SNR=20 dB時識別率大幅下降,低至25%。對不同SNR下的測試數(shù)據(jù)繪制輪廓圖進行分析,無噪情況下4類特征的小波包能量歸一化后的訓練數(shù)據(jù)和測試數(shù)據(jù)輪廓圖如圖5所示。該圖中,四類故障聚類明顯,也可說明高識別率的原因。
當SNR=20 dB時,測試數(shù)據(jù)的輪廓圖如圖6所示。圖6(a)為未經(jīng)優(yōu)選的特征輪廓圖,第5和第6能量特征三個故障類別交織在一起難以區(qū)別,初步先去掉這兩個特征,剩下的6個特征輪廓圖如圖6(b)所示,四個故障模式分類較前分明了些。把相應的特征輸入到BP模型,SNR=20 dB的故障識別率可提升到75.641%,從而也驗證了輪廓圖中的聚類特性與識別率有強相關性。

圖5 無噪情況下軸承故障數(shù)據(jù)小波包能量特征輪廓圖
2.4 異類特征融合滾動軸承故障診斷
把初選過的時域統(tǒng)計特征和小波包能量特征融合一起,SNR=20 dB的故障識別率為96.154%,比單一小波包能量識別率高,但低于時域統(tǒng)計特征的識別率。對測試數(shù)據(jù)繪制出輪廓圖(見圖7)進行分析,發(fā)現(xiàn)Ce、Cq、小波第1頻帶三個特征,不同類別之間交叉較多,進一步優(yōu)化去除這三個特征,再進行模式識別,識別率可穩(wěn)定在100%。
由上述滾動軸承故障診斷過程可知,基于可視化技術的異類特征融合方法操作簡單,識別效果好。目前特征優(yōu)選過程是在人工參與的情況下進行的,在今后進一步的研究中將會把成熟的聚類算法(如K-means算法)應用于特征優(yōu)選過程,從而實現(xiàn)異類特征融合方法的完全自動化,以達到故障自動化診斷的目標。

圖7 時域統(tǒng)計特征和小波包能量特征融合輪廓圖(20 dB)
用輪廓圖來進行可視化特征優(yōu)選是一種簡單且直觀的方法,直觀地去除冗余和不敏感特征,選擇出優(yōu)質特征,對于異類特征的有效融合具有一定效果。為了簡化融合過程,先分別對單類特征進行初步優(yōu)選,然后合成優(yōu)選。以滾動軸承故障信號時域統(tǒng)計和小波包能量兩類特征融合為例,用不同信噪比的加噪故障信號進行故障識別率對比研究。實驗結果表明該方法能夠對提高故障識別率有效。下一步的工作將是把聚類算法引入特征優(yōu)選過程,以實現(xiàn)故障診斷過程的自動化。
References)
[1] CHEN P, TOYOTA T, HE Z. Automated function generation of symptom parameters and application to fault diagnosis of machinery under variable operating conditions[J]. IEEE Transactions on Systems, Man, and Cybernetics, Part A: Systems and Humans, 2001, 31(6):775-781.
[2] 蘇祖強, 湯寶平, 姚金寶. 基于敏感特征選擇與流行學習維數(shù)約簡的故障診斷[J]. 振動與沖擊, 2014, 33(3):70-75.(SU Z Q, TANG B P, YAO J B. Fault diagnosis method based on sensitive feature selection and manifold learning dimension reduction [J]. Journal of Vibration and Shock, 2014, 33(3):70-75.)
[3] 楊宇, 潘海洋, 程軍圣. 基于特征選擇和RRVPMCD的滾動軸承故障診斷[J]. 振動工程學報, 2014, 27(4):629-636.(YANG Y, PAN H Y, CHENG J S. The rolling bearing fault diagnosis method based on the feature selection and RRVPMCD[J]. Journal of Vibration Engineering, 2014, 27(4):629-636.
[4] PENG H, LONG F, DING C. Feature selection based on mutual information: Criteria of max-dependency, max-relevance, and min-redundancy[J]. IEEE Transactions on Pattern Analysis and Machine Intelligence, 2005, 27(8): 1226-1238.
[5] ZHAO X M. Data-driven fault detection, isolation and identification of rotating machinery: with applications to pumps and gearboxes[D]. Edmonton: University of Alberta, 2012.
[6] 古瑩奎, 承姿辛, 朱繁瀧. 基于主成分分析和支持向量機的滾動軸承故障特征融合分析[J]. 中國機械工程, 2015, 26(20):2778-2783.(GU Y K, CHENG Z X, ZHU F L. Rolling bearing fault feature fusion based on PCA and SVM[J]. China Mechanical Engineering, 2015, 26(20):2778-2783.)
[7] 巫茜, 蔡海尼, 黃麗豐. 基于主成分分析的多源特征融合故障診斷方法 [J]. 計算機科學, 2011, 38(1):268-270(WU Q, CAI H N, HUANG L F. Feature-level fusion fault diagnosis based on PCA[J]. Computer Science, 2011, 38(1):268-270.)
[8] 李學軍, 李平, 蔣玲莉, 等. 基于異類信息特征融合的異步電機故障診斷[J]. 儀器儀表學報, 2013, 34(1):227-233.(LI X J, LI P, JIANG L L, et al. Fault diagnosis method of asynchronous motor based on heterogeneous information feature fusion[J]. Chinese Journal of Scientific Instrument, 2013, 34(1):227-233.)
[9] 劉穎慧, 劉樹林, 唐友福, 等. 基于斜率關聯(lián)度的模式識別方法及滾動軸承故障診斷應用[J]. 機械科學與技術, 2012, 31(9):1500-1503.(LIU Y H, LIU S L, TANG Y F, et al. A method of pattern recognition with slope relational degree and its application to rolling bearing fault diagnosis [J]. Mechanical Science and Technology, 2012, 31(9):1500-1503.)
[10] 程軍圣, 史美麗, 楊宇.基于LMD與神經(jīng)網(wǎng)絡的滾動軸承故障診斷方法[J]. 振動與沖擊, 2010, 29(8):141-144.(CHENG J S, SHI M L, YANG Y. Roller bearing fault diagnosis method based on LMD and neural network[J]. Journal of Vibration and Shock, 2010, 29(8):141-144.)
[11] 楊宇, 于德介, 程軍圣.基于經(jīng)驗模態(tài)分解包絡譜的滾動軸承故障診斷方法[J]. 中國機械工程, 2004, 15(16):1469-1471.(YANG Y, YU D J, CHENG J S. A fault diagnosis approach for roller bearings based on EMD and envelop spectrum[J]. China Mechanical Engineering, 2004, 15(16): 1469-1471.)
[12] 胡耀斌, 厲善元, 胡良斌.基于神經(jīng)網(wǎng)絡的滾動軸承故障診斷方法的研究[J]. 機械設計與制造, 2012(2):187-189.(HU Y B, LI S Y, HU L B. Fault diagnosis of rolling bearing based on neural network[J]. Machinery Design & Manufacture, 2012(2): 187-189.)
[13] 張鍵. 機械故障診斷技術[M]. 北京:機械工業(yè)出版社, 2015:60-63.(ZHANG J. Mechanical Fault Diagnosis Technology [M]. Beijing: China Machine Press, 2015:60-63.)
This work is partially supported by the National Natural Science Foundation of China (51575331).
YANG Hongbai, born in 1972, Ph. D., associate professor. Her research interests include computer integrated manufacturing, fault diagnosis, signal processing.
ZHANG Hongli, born in 1985, Ph. D., lecturer. His research interests include intelligent fault diagnosis, pattern recognition.
LIU Shulin, born in 1963, Ph. D., professor. His research interests include complex equipment fault diagnosis.
Rolling bearing fault diagnosis based on visual heterogeneous feature fusion
YANG Hongbai1,2*, ZHANG Hongli2, LIU Shulin2
(1. School of Science and Technology, Shanghai Open University, Shanghai 200433,China;2. School of Mechatronic Engineering and Automation, Shanghai University,Shanghai 200072,China)
Aiming at the shortcomings of large feature set dimensionality, data redundancy and low fault recognition rate in existing fault diagnosis method based on simple combination of multi-classes features, a fault diagnosis method based on heterogeneous feature selection and fusion was proposed. The clustering characteristics of the feature data was analyzed according to the contours of the data of various class of features, and the redundant feature dimensions which are weakly clustered and not useful for fault classification were removed, only the feature dimensions with strong clustering characteristics were retained for the fault recognition. In the bearing fault diagnosis experiment, time-domain statistics and wavelet packet energy of fault signals were optimally selected and merged, and Back Propagation (BP) neural network was used for fault pattern recognition. The fault recognition rate reached 100%, which is significantly higher than that of the fault diagnosis method without feature selection and fusion. Experimental results show that the proposed method is easy to be implemented and can significantly improve the fault recognition rate.
heterogeneous feature; feature fusion; pattern recognition; fault diagnosis; rolling bearing
2016- 09- 19;
2016- 12- 22。 基金項目:國家自然科學基金資助項目(51575331)。
楊洪柏(1972—),女,江蘇沭陽人,副教授,博士,主要研究方向:計算機集成制造、故障診斷、信號處理; 張宏利(1985—),男,山東臨沂人,講師,博士,主要研究方向:智能故障診斷、模式識別; 劉樹林(1963—),男,河北保定人,教授,博士,主要研究方向:復雜設備故障診斷。
1001- 9081(2017)04- 1207- 05
10.11772/j.issn.1001- 9081.2017.04.1207
TP391.4
A