岳生吉,王煥民,牛彩云
(1. 蘭州交通大學機電技術研究所,蘭州730070;2. 蘭州大學第一醫院信息中心,蘭州 730000 )
當前,我國的機車故障診斷技術相當程度上依賴于“計劃修”,而機車設計日趨復雜導致機車故障復雜多樣,從而加大了機車檢修的困難。為有效實現機車“狀態修”,需要對實時獲取的故障數據進行必要的數據挖掘[1]。對此,粗糙集是一種行之有效的方法,其主要思想就是在所提供的不確定、不精確、不完整的數據保持分類能力不變的前提下,進行知識約簡,獲得易于處理、魯棒性強的決策方案。依據粗糙集理論提出的大型復雜機車電器故障診斷維修方案,具有很好的應用前景。
粗糙集理論是由波蘭數學家Z.Pawlak于1982年首次提出的一種用于數據分析的理論[2],是研究不精確、不確定性知識的工具。近些年來,隨著研究工作的不斷深入,粗糙集理論得到了迅速的發展,已經廣泛應用于數據決策與分析、模式識別、機器學習、知識獲取和發現、故障診斷、專家系統等多個領域。
粗糙集理論引入了兩個重要的概念[3~4]:“約簡”(reduct)和“核”(core)。“約簡”即為不含多于屬性并保證分類正確的最小條件屬性集,一個決策表可能含有多個約簡;“核”為約簡的交集,是所有在條件屬性中對決策屬性起重要作用、不可省略的屬性組成的集合。
設R是一個等價關系族,r∈R,如果ind(R)=ind(R-{r}),則稱r為R中不必要的;否則稱r為R中必要的。如果任一r∈R都為R中必要的,則等價關系族R是獨立的;否則稱R為依賴的。如果P=R-{r}是獨立的,則P是R中的一個約簡。R中所有不可約去的關系組成的集合稱為R的核,記作core(R)。其中,core(R)=∩red(R),red(R)是R的所有約簡。設P和Q為U中的等價關系,Q的P正域為posP(Q),即。Q的P正域是U中所有根據分類U/P的信息可以準確地劃分到關系Q的等價類中去的對象集合。它們的依賴關系為:
γP(Q)=|posP(Q)|/|U|,其中0≤γP(Q)≤1。依據γP(Q)判定P和Q是否相容。當γP(Q)=1時,二者相容;否則不相容。
基于粗糙集的故障診斷(FDD)技術是一種基于知識的“軟診斷”技術,已經逐漸應用于機車檢修等領域[5~6]。本文提出的基于粗糙集的機車牽引變流器故障診斷方法,首先是對故障數據經過數據采集、數據管理、預處理(即連續屬性離散化)、知識約簡(屬性約簡和值約簡),得出故障診斷規則,接下來把規則入庫。當故障診斷模塊被調用時,利用故障診斷規則對新輸入數據進行診斷,如果新樣本符合規則,說明系統運行正常;否則進入故障定位,給出故障診斷報告。
具體診斷原理如圖1。

圖1 機車故障診斷原理框圖
機車牽引變流器是電力機車能量轉換過程中一個重要設備,也是機車上的關鍵設備之一[7]。當整個牽引系統出現故障時,在變流器上會突出的反映和表現出來,其特征參數的變化主要是輸出電壓和電流的波形畸變。對變流器進行MATLAB仿真,可以得到充足的故障數據。對主變流器輸出電壓通過小波變換提取波形的7個能量值作為故障特征,在決策表中,這7個故障特征作為條件屬性C={ca6,cd6,cd5,cd4,cd3,cd2,cd1},其中,ca6是低頻能量,cd6、cd5、cd4、cd3、cd2、cd1均是高頻能量,決策屬性D=faultNO,faultNO是故障號。原始數據見表1。

表1 原始數據表
(1)將數據編入Matlab軟件可識別的文件中,并對其調用相應的程序,對數據離散化處理[8],得到具有離散屬性的決策表如表2。需要說明的是,合理進行連續屬性值離散化,是體現故障診斷歸納過程合理性的關鍵。由于本文試驗中原始樣本數據單個屬性值變化波動不大,故離散化時選用等距離劃分算法[9]。此方法不考慮各斷點段中屬性值個數的多少,僅僅根據用戶給定的參數,把屬性值簡單地劃分為等距離的斷點段。若屬性的最大值、最小值分別為xmax、xmin,需要劃分的斷點段個數為k,則斷點間隔為δ=(xmax-xmin)/k,因而得到此屬性上的斷點為xmin+iδ,i=0,1,…,k。實際應用中,k值對應于不同屬性的狀態個數,這往往要依據研究對象的本身故障屬性或者具體工作人員的經驗來確定。如k值過大,則會使得最終的規則可信度相對較低;如值過小,則不易體現相應故障的特征。本實驗中,faultNO有4種,經過驗證,當k=5時分類更具有代表性。例如:令屬性ca6=a,amax=7.321 7,amin=6.189 2,斷點間隔為,δ=(7.321 7-6.189 2)/5=0.226 5,把屬性ca6分為5個區間:[6.189 2, 6.415 7] 、[6.415 7,6.642 2] 、[6.642 2, 6.868 7] 、[6.868 7, 7.095 2] 、[7.095 2, 7.321 7] 。這5個區間分別用0、l、2、3、4來表示,就得到了屬性的量化值。需要說明的是,采用等距離劃分算法時,斷點段的邊界值劃分在哪個區間,對最終故障分類的影響不大。

表2 決策表
(2)根據粗糙集理論進行處理提取決策屬性[10],先轉化為二進制分辨矩陣,然后再進行化簡。最終得到的屬性約簡如表3。
(3)由上述結果可知,核屬性為ca6,cd1約簡為{ca6, cd6, cd1}或者{ca6, cd4, cd1}。這里取約簡{ca6, cd6, cd1}產生的規則。故得表4。
(4)對此進行簡化處理,以表4的第1行為例,對(ca6)4(cd6)0(cd1)0→(faultNO)1:由于在表4中僅有(ca6)4(cd6)0→(faultNO)1,所以“(ca6)4(cd6)0→(faultNO)1”和“(ca6)4(cd6)0(cd1)0→(faultNO)1”相容。又有(ca6)4(cd1)0→(faultNO)1在表4中也是唯一的,所以“(ca6)4(cd1)0→(faultNO)1”和“(ca6)4(cd6)0(cd1)0→(faultNO)1”也相容。還有(ca6)0(cd1)0→(faultNO)1(第1行)和(ca6)0(cd1)0→(faultNO)2(第5行),所以“(ca6)0(cd1)0→(faultNO)1”和“(ca6)4(cd6)0(cd1)0→(faultNO)1”不相容。從而,cd6和cd1均可省,而cd6不可省。依次處理,最后得到決策規則核值表,見表5。

表3 最終得到的屬性約簡

表4 由約簡得到的規則

表5 決策規則核值表
(5)由表得5到如下規則:
(ca6)4∨(cd6)2→(faultNO)1
(ca6)1∨(ca6)0(cd6)0∨(cd1)1→(faultNO)2
(ca6)0(cd6)1(cd1)0→(faultNO)3
(ca6)1(cd6)2→(faultNO)4
通過以上操作,便可應用新建立的決策規則表處理故障檢測數據。在使用數據來提取新規則時,有時還需通過專家按其經驗對部分數據進行校驗修正。決策表是通過新規則的加入而不斷更新的。從實驗結果看出,在保持分類能力不變的前提下,大量的故障數據被約簡,從而挖掘出新的決策規則。由此看出,應用粗糙集的方法來約簡大量的故障數據是十分有效的。
本文將粗糙集理論應用于機車電器故障診斷,對一組機車牽引變流器的不完備故障數據進行處理,得出對故障診斷有價值的規則。粗糙集數據庫的建立及更新加強了機車故障診斷的能力,從而逐漸提高處理數據的效率和精度。基于粗糙集的機車故障檢測在應用方面有廣闊的前景。
[1] 王冬梅,王繼成.基于粗糙集的機車電線路故障診斷方法[J] . 長春工業大學學報(自然科學版),2008,29(5):541-545.
[2] 張文修,吳偉志,梁吉業,等. 粗糙集理論與方法[M] . 北京:科學出版社,2001:1-56.
[3] Tuan-Fang Fan, Duen-Ren Liu, Gwo-Hshiung Tzeng. Rough set-based logics for multicriteria decision analysis[J] . European Jouranl of Operational Research, 2007(182): 340-355.
[4] William Zhu. Generalized rough sets based on relations[J] .Information Sciences, 2007(37): 12-27.
[5] 王仲生.智能故障診斷與容錯控制[M] . 西安:西北工業大學出版社,2005:172-214.
[6] 張學毅.鐵路機車故障智能診斷的實現[J] .計算機測量與控制,2005,13(5):428-430.
[7] 崔光瑋. SS8機車變流裝置中硅遠元件損壞后的故障現象[J] .機車電傳動,2002(2):56-57.
[8] 石博強,滕貴法,李海鵬,等. MATLAB數學計算范例教程[M] . 北京:中國鐵道出版社,2004.
[9] 郭亞中,左洪福,王華偉.基于粗糙集的民航飛機故障診斷規則獲取方法[J] . 系統工程理論與實踐,2006(11).
[10] 馬躍峰,趙予.一種基于粗糙集理論的數據挖掘算法的研究[J] . 洛陽大學學報,2006,21(2):5-8.