玄兆燕,封紅梅
(河北聯合大學 機械工程學院,河北 唐山 063000)
礦井風機是礦下作業的重要機械之一,對正常生產有很重要的作用,但其振動問題一直給人們造成很大困擾。同一種征兆往往與多種故障相對應,故障通常是多種原因并發形成的復合故障[1],由于故障環境大都是不確定的,各種故障征兆值具有模糊性,因此在進行故障診斷時必須將檢測數據轉化為模糊數據,即模糊化。長期以來對于風機的振動故障診斷方法常采用基于振動頻譜特征來實現,但振動的頻譜特征只是反映了風機故障的部分信息,這就需要引入其它征兆進行判別,因此,如何既能充分利用振動的頻譜特征這一重要故障征兆作為故障診斷的重要證據,又能綜合利用反映故障不同方面信息的不同類型的故障征兆,從而可以更準確的進行故障識別,成為本文所要解決的問題,以此獲得一個更簡潔的診斷規則表,為專家診斷系統提供更有效的診斷規則庫。
模糊C均值聚類(FCM),是用隸屬度確定每個數據點屬于某個聚類的程度的一種聚類算法[2]。1973年,Bezdek提出了該算法,作為早期硬C均值聚類(HCM)方法的一種改進。
若對論域(研究的范圍)U中的任一元素x,都有一個數A(u)∈0,1與之對應,則稱A為U上的模糊集,A(u)稱為u對A的隸屬度。
μA(u)的大小反映了元素u對于模糊集A的隸屬程度,μA(u)的值越接近1,表示u隸屬于A的程度越高;μA(u)的值越接近0,表示u隸屬于A的程度越低。
FCM把n個向量xi(i=1,2,…,n)分為c個模糊組,并求每組的聚類中心,使得非相似性指標的價值函數達到最小。FCM使得每個給定數據點用值在0,1間的隸屬度來確定其屬于各個組的程度。不過,加上歸一化規定,一個數據集的隸屬度的和總等于1:

1982年,波蘭數學家Z.Pawlak首次提出了一種處理不確定性現象的數學理論——粗糙集理論。粗糙集理論與其他處理不確定和不精確問題理論顯著的區別是它無需提供問題所需處理的數據集合之外的任何先驗信息所以對問題的不確定性的描述或處理可以說是比較客觀的,由于這個理論未能包含處理不精確或不確定原始數據的機制,所以這個理論與概率論和模糊數學等其他處理不確定或不精確問題的理論有很強的互補性[3]。
設有一所需研究的對象組成的非空有限集合即論域U。給定一個論域U和U上的一簇等價關系S,稱二元組K=(U,S)是關于論域U的知識庫或近似空間。在該等價關系S當中,若P∈S,且P≠?,則U∩P仍然是論域U上的一個等價關系,稱為P上的不可分辨關系,記做IND(P)。其中,U/IND(P)為知識庫K中關于U的基本知識。
若S=(U,R)為一知識表達系統,若R可劃分為條件屬性集C和決策屬性集D,即C∪D=R,C∩D=?,則稱為CD決策表,其中IND(C)的等價類稱為條件類,IND(D)的等價類稱為決策類。
首先引入熵的概念:設知識(屬性集合)P是論域上的等價關系簇,根據不可分辨關系Xi∈U/IND(P)可以得到k類對象的組成,即{X1,X2,…Xk},根據概率公式可得到k類對象的概率則P的熵定義為:

其中:log取以n為底的對數,H(P)表示了信息源P的信息量。
在熵的概念上引入屬性熵的定義。在概率論當中聯合概率密度為,根據聯合概率密度公式,則此處知識(屬性集合)Q相對于知識(屬性集合)P的條件熵H(Q|P)定義為[4]:

其中:U/IND(P)={X1,X2,…,Xn}
U/IND(P)={Y1,Y2,…,Ym}
條件熵H(Q|P)是對所有P分類下不確定的等價類進行再劃分的熵,它體現了用P對論域劃分所形成的結果的不確定性。
步驟1:根據粗糙集的不可分辨關系將知識庫進行k類劃分。
步驟2:去除劃分結果當中的等價屬性,所謂等價屬性是指劃分結果相同的屬性。
步驟3:根據條件熵方法求得屬性的重要度,在數據龐大的情況下還需找出核心屬性,以便去除冗余屬性。
步驟4:根據核心屬性的重要度最大值對知識庫決策表進行化簡。
步驟5:以此類推,繼續根據次最大值進行化簡,直到得出最終結論。
步驟6:根據最小約簡表再進一步消除該表當中的冗余屬性得到最小規則表。
在故障診斷過程中,使用聚類分析法可以根據相似故障之間的某些共同之處對故障類型進行分類。常見的礦井風機故障常是基于故障發生的位置和零件的不同位置來進行分類的,本文根據故障征兆當中的特征頻率對故障進行分類,然后根據其它的故障征兆進行進一步分析,從而降低故障源的數量。對故障基于特征頻率進行模糊C均值聚類分析的劃分故障樹如圖1所示。

圖1 風機故障分類
最大隸屬原則:設給定的論域U為全體被識別對象構成的論域,A1,A2,…An是U的n個模糊子集,u∈U是一個識別對象,若μAt(u)=max{μA1(u),μA2(u),…μAn(u)},則認為u優先隸屬于At,即u優先屬于模式At所代表的那一類[5]。對于振動故障頻譜特征采用最大隸屬原則進行提取,這是因為頻譜特征參數之間存在著很強的相關性,使用該方法可以剔除變量之間的相關性以及冗余性,降低數據源的分析個數,然后再對縮小的數據進行決策表分析,這樣不但可以剔除干擾信息影響,而且可以降低聚類分析時輸入變量的維數,簡少決策表分析的計算量,根據圖1當中故障樹的分類以及各個故障特征頻率的定位,將通頻段分為了七個部分,表1為某次實現的基頻故障現象表。
根據表1可得,風機的某工作狀態下各個段的頻率的幅值的隸屬度,其中:基頻的隸屬度為:

表1 故障特征頻率幅值
128/(128+32)=0.8
2倍頻的隸屬度為:
32/(128+32)=0.2
其它幅值的隸屬度都為0,由最大隸屬原則可知,該風機的故障類型應屬于基頻故障。特征頻率為基頻的礦井風機故障可能有轉子不平衡(3類)、轉子彎曲(2類)以及支撐系松動這三種情況,根據這三種 情況可得到如圖2所示的基頻故障樹[6]。

圖2 基頻故障
在該系統當中,主要采用的風機故障征兆有特征頻率、常伴頻率、時域波形、振動穩定性、振動方向、相位特征和軸心軌跡七個參數,由故障常規分析子系統中的頻譜分析可知,特征頻率和常伴頻率總是同時知道的,也就是說當進行頻譜分析時,知道了特征頻率,那么常伴頻率也隨之知道了,因此在此同時去掉常伴頻率。各特征頻率為基頻的故障和故障征兆之間的關系如表2所示,其中前五列為條件屬性,最后一列為決策屬性。
將表2的內容進行數據的模糊離散化有助于對數據進行詳細的分析,表3為離散化后的數據表。

表2 故障征兆表

表3 離散數據表
將表3進行條件熵計算,首先根據不可分辨關系,按照條件屬性和決策屬性對6類對象進行分類:

在上述計算當中可以看到U/IND(a)=U/IND(e),也就是說a屬性和e屬性為重復等價屬性,在此略去e屬性即可,接著根據式(3)計算屬性熵:

由以上數據可知屬性重要度a>b>d>c,再根據粗糙集的屬性約簡規則對故障征兆表進行約簡,最終約簡規則效果見表4所示。

表4 最小規則表
根據表4可將所得的規則集描述為(部分):if時域波形為疊加波形then支撐系松動故障;if時域波形為正弦波and振動方向為徑向and相位特征突變后穩定then突發不平衡故障。
本文以基頻特征的故障現象為例,最終獲得了如表4所示的最小規則表,從表4中可以看到約簡了的故障征兆表可以為專家系統提供更加有效的診斷規則庫。
聚類分析是數據挖掘和模式識別中一種重要的分析方法,屬性約簡作為粗糙集理論的核心部分 是數據處理過程中的一個關鍵環節。本文提出了一種基于聚類分析法和條件熵分析法相結合的方式對多故障征兆進行分類并進行屬性的約簡,利用FCM算法構建故障樹來縮減搜索范圍,利用條件熵的屬性約簡形成故障診斷的規則庫并實現推理。該方法既充分利用了振動的頻譜特征這一重要故障征兆作為故障診斷的初步判斷依據,又綜合利用了反映故障不同方面信息的不同類型的故障征兆,從而做到更好的實現對大量數據的分類約簡,縮小故障源的種類,進而能夠更加準確地進行故障識別。
[1] 胡友林.基于粗糙集的風機故障診斷專家系統研究[D].武漢:武漢科技大學,2006.
[2] 徐 天,鄧廷權.基于FCM的相似關系粗糙集屬性約簡方法[J].計算機工程與應用,2012(32):132-135
[3] 李 菊.基于屬性重要性的啟發式屬性約簡算法[J].煤炭技術,2012,31(3):201-203.
[4] 馮晶晶,等.一種基于條件熵的決策表屬性約簡算法[J].計算機應用與軟件,2011(9):109-113.
[5] 孫 芳.基于模式識別的機械設備故障智能診斷方法研究[D].保定:華北電力大學,2007.
[6] 郭富源.故障樹理論在遠程診斷系統中的應用研究[D].大連:大連理工大學,2007.