潘巍巍, 宋彥萍, 于達仁
(1.廈門理工學院 應用數學學院, 福建 廈門 361024; 2.哈爾濱工業大學 能源科學與工程學院, 哈爾濱 150001)
齒輪裂紋程度識別的有序分類算法
潘巍巍1,2, 宋彥萍2, 于達仁2
(1.廈門理工學院 應用數學學院, 福建 廈門 361024; 2.哈爾濱工業大學 能源科學與工程學院, 哈爾濱 150001)
摘要:為識別齒輪裂紋的嚴重程度信息,提出一種基于有序分類的故障嚴重程度識別方法. 將故障嚴重程度識別問題視為不同嚴重程度之間存在序結構,并且部分特征和故障嚴重程度之間存在單調依賴關系的有序分類問題,從有序分類出發,建立有序分類的故障嚴重程度識別模型. 研究故障嚴重程度識別中的特征評價和特征選擇問題, 利用排序互信息指標區分原始特征集中的單調特征和非單調特征,提出單調特征和非單調特征混合存在情況下的有序分類特征選擇算法. 齒輪裂紋程度識別實驗結果表明:提出的有序分類特征選擇算法可以降低特征空間維數,能選擇出分類能力強的故障特征子集,提高了故障嚴重程度識別的準確性.
關鍵詞:有序分類;特征選擇;故障診斷;嚴重程度;齒輪裂紋程度識別
近年來,故障診斷技術得到了廣泛深入地研究,對企業的關鍵機組實行狀態監測和故障診斷,保障這些設備的安全高效運行,避免災難性事故的發生,具有顯著的經濟效益和社會效益. 與傳統的故障診斷技術不同,故障嚴重程度識別并不關注故障的類型,而是考慮在同一故障類型下的故障嚴重性信息,識別故障的嚴重程度可以幫助用戶了解設備的運行狀態及發展趨勢,制定合理的維修計劃,提高設備的利用率. 相比于故障檢測和故障分類,故障嚴重程度識別更加困難,是故障診斷領域的一項特殊任務和新的挑戰.
在故障嚴重程度識別中,按照不同的嚴重程度, 可以將故障分為“輕微故障”,“中等故障”和“嚴重故障”. 不同嚴重程度之間存在序的關系,可以表示為:“嚴重故障”>“中等故障”>“輕微故障”,即“嚴重故障”表明設備的故障嚴重程度比“中等故障”和“輕微故障”高,“中等故障”比“輕微故障”的故障更嚴重. 進行故障嚴重程度識別時,要求工作人員人為地將故障劃分為幾個等級,例如可以將故障劃分為“輕微故障”和“嚴重故障”,當發現設備是“輕微故障”時,表明已出現異常,需要立刻查找原因安排維修;當發現是“嚴重故障”時,為避免惡性事故的發生,必須馬上停機. 這種按照故障的嚴重程度進行分類的問題可以理解為模式識別和機器學習中的有序分類問題(也稱為排序問題或有序回歸問題)[1-3]. 進行故障嚴重程度識別的關鍵問題是如何利用和表達數據中潛在的有序信息,而不是簡單的將其看作是一般分類問題進行分類學習.
目前,故障嚴重程度識別主要是建立分類學習模型,實現不同嚴重程度信息的自動識別. 2009年,曾慶虎等[4]采用核主成分分析(KPCA)方法進行多通道信息融合,建立基于隱半馬爾可夫模型(HSMM)的故障預測模型實現設備退化狀態識別. Lei等[5]人為地將齒輪破壞,并分成幾種不同程度的裂紋,在不同轉速和負載下收集振動數據,設計了基于加權歐式距離的K近鄰分類算法(WKNN)進行齒輪裂紋程度識別. Li等[6]利用流行學習算法提取故障的非線性特征,并應用經驗模態分解方法進行齒輪裂紋程度識別. Cheng等[7]利用統計方法進行特征選擇,提出了基于灰色關聯度分析的故障程度識別方法. Zhao等[8]提出了基于相關系數的有序分類特征選擇算法,并進行實驗分析,指出了分析故障嚴重程度識別問題時有序分類學習算法比一般分類算法更有效. Wu等[9]采用基尼系數度量不同故障的嚴重性,研究了基于故障注入技術的嚴重程度信息識別方法. Jiang等[10]提出了基于統計參數(均值)和殘差信號的故障嚴重性識別方法.
故障特征空間可能含有成百上千個特征,這些特征中只有很少一部分是與故障嚴重程度相關的,并且部分故障特征和嚴重程度之間存在單調變化趨勢:即隨著故障的嚴重程度的增加特征值增大或減小,這類特征被稱為是單調的故障特征. 對應的,與故障嚴重程度不存在單調依賴關系的特征則稱為非單調故障特征. 單調故障特征能夠反映出與不同嚴重程度之間的單調依賴關系,能夠直觀地區分故障的不同嚴重程度信息. 對于這種非單調特征和單調特征混合存在的情況,需要設計混合的有序分類特征選擇算法.
本文首先提出非單調特征和單調特征混合的有序分類特征選擇算法,然后將提出的特征選擇算法應用于齒輪裂紋程度識別,構建基于有序分類的故障嚴重程度識別模型.
1有序分類
定義1給定決策系統DT=〈U,A,D〉,其中U={x1,x2,…,xN}表示有限非空樣本集,A={a1,a2,…,aJ}是特征集,D={d1,d2,…,dK}是決策類別集. 如果不同的決策類別之間存在序的關系,可以假設d1 樣本xi∈U在特征a∈A和決策D上的取值分別記為v(xi,a)和v(xi,D), 特征與決策集上的序關系記為“≥”和“≤”. 令v(xi,a)≥v(xj,a)和v(xi,D)≥v(xj,D)分別表示在特征a和決策D上樣本xj不好于xi. 同理,xi不好于xj記作xi≤axj和xi≤Dxj. 定義2給定有序決策系統DT=〈U,A,D〉,對?xi∈U,a∈A,xi關于特征a的有序信息粒子定義為 相應的,對B?A,xi關于B和D的有序信息粒子分別定義為 式中:若?a∈B,都有xj≤axi,則稱xj≤Bxi. 定義3給定有序決策系統DT=〈U,A,D〉,單調約束條件指的是:對?xi,xj∈U,如果xi≤Bxj,有D(xi)≤BD(xj)(或者xi≥Bxj?D(xi)≥BD(xj)). 特征與決策之間的單調約束關系是指:假定樣本xi在特征集B上取值比樣本xj大,那么xi的決策也會比xj的決策好,否則就違反了單調一致性. 事實上,單調分類是一類特殊的有序分類問題,即它不僅強調決策類別之間存在序結構,而且假設全部特征與決策之間存在單調約束關系. 但單調約束關系是一個很強的限制條件,絕大多數現實的有序決策任務往往不能滿足全部特征都與決策之間具有單調依賴關系,可能只有部分特征為單調特征,大部分特征是非單調特征. 針對單調特征和非單調特征混合存在的情況,本文研究有序分類的特征選擇問題. 首先要解決的問題是對于給定的有序數據集,如何判斷哪些特征是單調特征,哪些特征是非單調特征. 2特征單調性評定方法 首先給出排序互信息的定義,具體信息可參考文獻[11]. 定義4給定有序決策系統DT=,B?A,C?A. B和C在U上的前向互信息定義為 后向互信息定義為 下面舉列說明排序互信息可以表征特征與決策之間的單調一致性程度. 圖1展示了8個特征(樣本數500)的散點圖,并計算了每個特征與決策之間的排序互信息值(這里只考慮前向排序互信息,后向排序互信息可以得到類似的結論). 圖1 各特征的散點圖分布及其與決策的排序互信息值 第1個特征與決策之間具有線性的單調一致關系,在第1個特征的基礎上加入了不同噪聲水平的噪聲得到了第2、3個特征. 相比特征1,特征2和3與決策之間的單調一致性程度降低,相應的排序互信息值也隨之減小,從1.43分別降為1.15和0.67. 第4個特征完全是雜亂的,與決策之間不存在單調性,此時得到的排序互信息值很小,幾乎接近于0. 第6個特征與決策之間滿足非線性的單調一致關系,特征值隨著決策值的增大單調增加. 雖然特征6隨著決策非線性單調變化, 但是特征6得到的排序互信息與特征1相同,表明排序互信息可以反映特征與決策之間的單調相關性,不管這種單調關系是線性的還是非線性的. 第5個特征是在第6特征的基礎上加入了噪聲,排序互信息值從1.43降為0.95. 第7、8 這兩個特征的值先是單調增加然后再減少,相應的排序互信息值低于其它特征(除了特征4). 通過以上的對比分析發現,特征與決策的單調一致性程度可通過排序互信息表達. 特征與決策之間的單調一致性程度越高,對應排序互信息的值越大;反之單調一致性程度就越小. 因此,可以采用排序互信息作為評價指標來區分原始特征集中哪些特征是單調特征,哪些是非單調特征. 在實際的有序學習任務中,需要假定一個閾值,將原始的特征集合分成兩個特征子集:非單調特征子集和單調特征子集. 如果某特征與決策的排序互信息>預設的閾值,將此特征判為單調特征,否則就是非單調特征. 在沒有任何先驗知識的情況下,本文將所有特征按照排序互信息值大小排序,將原始特征集合分為兩部分,單調特征和非單調特征的數量相同. 3基于混合單調特征的有序分類特征選擇算法 特征選擇算法包含兩個主要步驟:特征評價函數和最優子集搜索策略. 首先針對有序分類中非單調特征和單調特征混合存在的情況,定義有序分類的分類一致性假設條件,將其作為特征評價函數評價一個混合單調的特征子集與決策之間的相關性,然后采用遺傳算法(GA)作為搜索策略構造有序分類的特征選擇算法. 3.1非單調特征和單調特征混合的有序分類一致性 定義5給定有序決策系統DT=,若特征集合A中只有部分特征與決策之間滿足單調依賴關系,既包含與決策之間滿足單調依賴關系的單調特征,又包含非單調特征,則稱此有序決策系統為混合單調特征的有序決策系統. 定義6給定單調特征和非單調特征混合的有序決策系統DT=,?B?A,?xi,xj∈U,如果: 1)樣本xi和xj關于B中的非單調的符號特征滿足等價關系,且數值特征滿足相似關系; 對非單調特征和單調特征混合存在的有序分類任務,定義混合單調特征的有序分類的分類一致性假設. ?B?A,B的混合單調分類一致性越大,表征B對決策D的分類能力越強,可以將其作為特征評價函數度量特征子集的質量. 3.2遺傳算法 遺傳算法(genetic algorithm,簡稱GA)[12-13]的基本框架包括參數編碼、初始種群選取、適應度函數和遺傳操作等4部分. GA基于生物進化的適者生存理論,模擬遺傳學的生物遺產進化的過程,并以適應度函數評價種群中的個體優劣程度,即以適應度來表征種群中的個體對環境生存能力的強弱. 在實際應用中,適應度函數的設計需要根據所求解問題本身的要求而定. 設定了適應度函數后,遺傳操作通過模擬生物基因遺傳原理,根據個體對環境的適應度,進行選擇、交叉、變異等遺傳操作,從而實現優勝劣汰的進化過程. 經過多次迭代后,從最后一代種群中選出適應度函數值最大的個體,進而得到所求問題的最優解. 本文采用二進制編碼,對于任意的特征子集B?A,將B的混合單調分類一致性作為適應度函數,進而度量GA算法每次選擇出來的特征子集B的適應度,而算法最終輸出的最大的混合單調分類一致性(即適應度)對應的特征子集即為最終的最優子集. GA算法采用輪盤賭選擇算子以及單點交叉方式,交叉率設為0.8,變異率是0.01. 4基于有序分類的齒輪裂紋程度識別 4.1實驗描述和數據獲取 本文采用的實驗系統結構如圖2所示. 系統構成中包括1個齒輪箱,提供負載的磁力制動器和用以驅動齒輪箱旋轉的三相交流電機[5]. 圖2 實驗系統圖 在齒輪箱中,齒輪#1和齒輪#2嚙合,齒輪#3和齒輪#4嚙合,齒輪#3為測試齒輪. 在齒輪箱外殼上安裝兩個傳感器收集齒輪箱的x(水平)和y(垂直)兩個方向的振動數據. 人為地將測試齒輪破壞成不同的裂紋深度和寬度,得到不同故障嚴重程度的齒輪. 齒輪的裂紋程度信息見圖3,裂紋角度為α,a為弦齒厚度的一半,齒厚為b. 共采用了3個不同裂紋程度的齒輪,詳細信息見表1,其中F0表示正常完好的齒輪,F1和F2分別代表兩個不同裂紋程度的測試齒輪. 圖3 齒輪的裂紋程度信息 故障嚴重程度 寬度 深度 厚度 mmα/(°)F0000-F10.25a0.25b0.4045F20.50a0.50b0.4045 注: α為裂縫角度; 2a為分度圓弦齒厚; b為齒厚. 在3種負載(load0,load1,load2),4種轉速(1 200,1 400,1 600,1 800 r/min)以及3種不同裂紋程度(F0,F1,F2)情況下,共收集到36個故障樣本. 重復實驗3次,整理得到的齒輪裂紋程度識別數據集共含有108個樣本. 圖4是在不同的裂紋程度(F1和F2)下,測試齒輪在時域和頻域中的數據,由圖4可見,在不同的故障嚴重程度時,時域和頻域的信息差異很大,可從中抽取特征對其進行評判. 圖4 故障特征的時域和頻域 對振動數據提取特征,特征集中包括時域特征、頻域特征以及特別為齒輪故障識別設計的特征[5],具體的特征信息見表2. 構建的故障嚴重程度識別數據集有108個樣本,52個特征. 表2 特征編號和對應的特征說明[14] 4.2齒輪裂紋程度識別 為有效識別齒輪裂紋的程度,本文在故障嚴重程度識別數據集的原始特征空間中,采用前述的特征選擇算法,以去除無關和冗余的特征,得到與故障嚴重程度相關的最優特征子空間,并經實驗分析此特征子空間的有效性. 實驗處理中,首先計算特征與故障嚴重程度之間的排序互信息,如圖5所示. 由圖5可以看出,特征48和特征44的排序互信息相對較大,說明它們與決策之間的具有較強的單調相關性. 圖6為特征48與不同裂紋嚴重程度之間的關系,其中‘+’表示正常齒輪,‘*’表示25%裂紋程度的齒輪,‘o’表示50%裂紋程度的齒輪. 如圖6可知,特征48能夠清晰地將不同的故障嚴重程度信息區分開,并能有效地反映故障嚴重程度的單調變化趨勢. 故障特征值增大,可發現故障嚴重程度隨之增加(故障嚴重程度高). 由圖6可知,當特征48的特征值超過0.07時,表示齒輪發生了故障. 圖7為特征44與不同裂紋嚴重程度之間的關系. 在特征44上同樣可以看出故障程度的發展進程,當樣本在特征44上的值超過0.2時,表示齒輪發生了故障. 圖5 故障特征的排序互信息 圖6 特征48和裂紋程度之間的關系 圖7 特征44和裂紋程度之間的關系 應用提出的特征選擇算法進行特征選擇,得到最優特征子集共包含7個特征,特征編號分別為:2、13、15、17、28、44和48. 在此特征子集中,非單調特征包括2、13和15,單調特征為17、28、44和48等. 隨機取3組特征兩兩組合,圖8~10展示了二維特征空間的數據散點圖. 可以看出,不同嚴重程度(不同顏色)的故障樣本在這些特征的空間上重疊區域很小,即便用最簡單的基于直線的區間劃分方法也可將不同嚴重程度的樣本分開,可見這些特征可以清晰地將不同的故障程度信息區分開. 而且特征48和44也能夠反映出故障嚴重程度的單調變化趨勢. 圖9是特征2和特征15組合形成的特征子集在二維圖上的散點分布,這個包含2個特征的子集合對故障嚴重程度有良好的區分能力. 圖8 特征48和特征44的散點圖 圖9 特征2和特征15的散點圖 圖10 特征13和特征17的散點圖 表3 原始特征集和特征子集的分類錯誤率比較 % 表4 選中的特征子集和原始特征集的平均分類損失比較 % 從表3、4可以看出,相比原始數據,特征選擇后再進行分類得到的平均分類錯誤率由15.36%降低為5.25%, 平均分類損失從11.36%降低為4.41%. 實驗分析結果表明: 本文提出的特征選擇算法明顯地減少了特征空間的維數,降低了故障嚴重程度識別的錯誤率和平均分類損失. 5結論 1)本文設計了有序分類的特征選擇算法,并將其應用于齒輪裂紋程度識別中以提高故障嚴重程度識別的準確性. 2)針對非單調特征和單調特征混合存在的情況,定義了有序分類一致性假設條件,并將其作為特征評價函數. 與遺傳算法相結合得到原始特征集合中的最優的特征子集,并將提出的有序分類特征選擇算法應用到齒輪裂紋程度識別,構建了基于混合單調特征的有序分類故障嚴重程度識別模型. 3)實驗結果表明,提出的特征選擇算法既降低了特征空間的維數,又提高了故障嚴重程度識別的準確性. 參考文獻 [1] FRANK E, HALL M. A simple approach to ordinal classification[C]// Proc Europ Conf on Machine Learning. Beilin: Springer, 2001: 145-156.[2] KOTLOWSKI W, DEMBCZYNSKI K, GRECO S, et al. Stochastic dominance-based rough set model for ordinal classification[J]. Information Sciences, 2008, 178(21): 4019-4037. [3] BLASZCZYNSKI J, SLOWINSKI R, SZELAG M. Probabilistic rough set approaches to ordinal classification with monotonicity constraints[J]. Computational Intelligence for Knowledge-Based Systems Design, 2010, 6178: 99-108.[4]曾慶虎, 邱靜, 劉冠軍. 基于小波相關特征尺度熵的HSMM設備退化狀態識別與故障預測方法[J]. 儀器儀表學報, 2009, 29(12): 2559-2564. [5] LEI Yaguo, ZUO M J. Gear crack level identification based on weighted K nearest neighbor classification algorithm[J]. Mechanical Systems and Signal Processing, 2009, 23(5): 1535-1547. [6] LI Zhixiong, YAN Xinping, JIANG Yu, et al. A new data mining approach for gear crack level identification based on manifold learning[J]. Mechanics, 2012, 18(1): 29-34. [7] CHENG Zhe, HU Niaoqing, ZHANG Xiaofei. Crack level estimation approach for planetary gearbox based on simulation signal and GRA[J]. Journal of Sound and Vibration, 2012, 331(26): 5853-5863. [8] ZHAO Xiaomin, ZUO M J, LIU Zhiliang, et al. Diagnosis of artificially created surface damage levels of planet gear teeth using ordinal ranking[J]. Measurement, 2013, 45(1): 132-144. [9] WU Jianing, YAN Shaoze. Fault severity evaluation and improvement design for mechanical systems using the fault injection technique and gini concordance measure[J]. Mathematical Problems in Engineering, 2014, 2014(1):759-765. [10]JIANG Fan, LI Wei, WANG Zhongqiu, et al. Fault severity estimation of rotating machinery based on residual signals[J]. Advances in Mechanical Engineering, 2015, 15(11):1067-1077. [11]HU Qinghua, GUO Maozu, YU Daren, et al. Information entropy for ordinal classification[J]. Science China Information Sciences, 2010, 53(6): 1188-1200. [12]HOLLAND J H. Adaptation in natural and artificial systems[M]. Ann Arbor: University of Michigan Press, 1975.[13]YANG J, HONAVAR V. Feature subset selection using a genetic algorithm[J]. IEEE Trans Intelligent Systems and Their Applications, 1998, 13(2): 44-49. [14]潘巍巍. 故障嚴重程度識別的有序分類特征分析方法[D]. 哈爾濱: 哈爾濱工業大學, 2013. [15]XIA Fen, ZHANG Wensheng, LI Fuxin, et al. Ranking with decision tree[J]. Knowledge and Information Systems, 2008, 17(3): 381-395. [16]HU Qinghua, CHE Xunjian, ZANG Lei, et al. Rank entropy based decision trees for monotonic classification[J]. IEEE Transactions on Knowledge and Data Engineering, 2012, 24(11): 2052-2064.[17]BEN-DAVID A, STERLING L, TRAN T D. Adding monotonicity to learning algorithms may impair their accuracy[J]. Expert Systems with Applications,2009,36(3): 6627-6634. (編輯楊波) Gear crack level identification using ordinal classification PAN Weiwei1,2, SONG Yanping2, YU Daren2 (1.School of Applied Mathematics, Xiamen University of Technology, Xiamen 361024, Fujian, China;2. School of Energy Science and Engineering, Harbin Institute of Technology, Harbin 150001, China) Abstract:A fault severity level identification method based on ordinal classification is proposed to identify the gear crack levels. The fault level identification is regarded as ordinal classification in which there are ordinal structures between different severity levels and some features have monotonic relationship with the severity levels. The feature evaluation and feature selection for fault severity level identification based on ordinal classification are discussed. Ranking mutual information is utilized to distinguish monotonic features and non-monotonic features of the original feature set, and then a feature selection algorithm is designed for ordinal classification when monotonic features are mixed with non-monotonic features. The experimental results demonstrate that the designed algorithm can select the features with high classification ability for classifying the crack fault severity. A fault severity recognition model is constructed using ordinal classification. The proposed feature selection algorithm can reduce the dimension of feature space, select the features with strong classification ability and improve the accuracy of fault severity level identification. Keywords:ordinal classification; feature selection; fault diagnosis; severity level; gear crack level identification doi:10.11918/j.issn.0367-6234.2016.07.026 收稿日期:2015-10-13 基金項目:福建省自然科學基金(2015J01278) 作者簡介:潘巍巍(1983—), 女, 博士, 講師; 通信作者:于達仁, yudaren@hit.edu.cn 中圖分類號:O235;TH165 文獻標志碼:A 文章編號:0367-6234(2016)07-0156-07 宋彥萍(1971—), 女, 教授, 博士生導師; 于達仁(1966—), 男, 博士生導師,長江學者特聘教授















