山東省泰安市供電公司 馮蘭新 張召峰
改進的可辨識矩陣算法在配網故障診斷應用中的研究
山東省泰安市供電公司 馮蘭新 張召峰
由于配電網的網絡較為復雜,配電網發生故障后的情形較輸電網而言,故障信號更加豐富。針對配電網發生故障后,送入調度中心大量不確定以及不完整信息而導致難以得出準確結論的問題,本文對辨識矩陣算法進行改進,進一步基于該改進算法給出對決策表進行屬性約簡,得到最小約簡屬性。
粗糙集理論;屬性約簡;決策表;可辨識矩陣;電網故障診斷
1982年, 著名數學家、波蘭科學院院士Z.Pawlak發表了一篇經典論文 Rough Set, 從而宣告了粗糙集理論的誕生。該理論是一種能夠定量分析處理不一致、不精確、不完整信息以及知識的一種數學工具。當電網發生故障后,送入調度中心的故障信息量非常大,且并非所有的信息都存在價值,同時因為電網故障的復雜性,造成故障數據獲取的不完備或者檢測信息的缺失,使得它們在診斷應用、適用性和知識獲取方面還不盡人意。基于此,很多專家提出了許多處理解決的方法[1-6]。
本文提出了一種基于改進可辨識矩陣的屬性約簡算法,并結合一個實例,建立故障屬性決策表,同時對故障數據進行約簡。通過算例證明該約簡算法在配電網故障診斷中的有效性和實用性。
定義令S=(U, A)是一個信息系統,U為論域且U=(x1,x2,……xn),A=C∪D是屬性集合,子集C=(ai∣i=1,2……m)是條件屬性,D是決策屬性,ai(xj)是樣本xj在屬性ai上的值,D(x)是記錄xi在D上的取值,Cij表示可辨識矩陣第i行第j列的元素[7]。
可辨識矩陣(discernibility matrix)可定義為:

其中i,j=1,2,……,n。
可辨識矩陣將知識表中所有相關屬性區分的信息都濃縮到一個矩陣中:當兩個樣本之間條件屬性值不完全相同并且決策屬性值也不相同時,該元素為屬性值不相同的屬性集合;當兩個樣本決策屬性值相同時,該元素值為0,表明該屬性不能夠區分兩個樣本;當兩個樣本之間條件屬性值相同而決策屬性值不同時,說明這兩個樣本發生沖突,互不相容,該元素值為空值φ。
(1)析取范式,合取范式[8]
(2)布爾代數的基本性質
一個有補分配格稱為一個布爾代數(Boolean Algebra),如果是一個布爾代數,則B中每個元素都存在唯一補元。布爾運算B是一個具有兩個二元運算,一個一元運算(求補)的代數系統,通常將布爾代數記為。
M是決策表T的可辨識矩陣,A=(a1,a2,……an)為T中所有條件屬性的集合,S為M中所有條件屬性組合的集合,并且S中不包括重復項,S中共有s個條件屬性組合,并且每個屬性組合表示為Bi,即。B i中所含有的條件屬性個數為si,且其中每個條件屬性表示為。文獻中給出二進制可辨識矩陣屬性約簡算法如下[9]:
(1)構造二進制可辨識矩陣MT;
(2)消去MT中全為0的行,得到的p×q新二進制可辨識矩陣MT,置i→1;
(4)i+1→i,如果i≤p,則轉到(3),其他轉到(5);
(5)l→j;
(7)j+1→j,如果j≤p,則轉到(6),其他轉到(8);
(8)將得到的新的二進制可辨識矩陣賦給MT。
由可辨識矩陣定義可得,矩陣中條件屬性組合數為1 的元素項(Card(Bi) = 1)表明表明除該屬性外其余條件屬性無法將決策不同的兩條記錄區分出來,那么該屬性必須保留,與決策表中核屬性的概念是一致的。所以,矩陣中所有條件屬性組合為1的屬性均為決策表的核屬性(可能為空)。令C0是M中核屬性的集合,Ci0為其中元素,則有且Card(Ci0)=1。
本文將可辨識矩陣進行改進,同時構造一個不含核屬性的合取范式然再通過布爾代數的運算規律將合取范式轉化為析取范式,這樣析取范式的每一項由合取式表示的屬性組合連同核屬性一起就是最后的約簡組合。具體改進及步驟如下:將可辨識矩陣中包含核屬性的元素項用字母a來代替,將不包含核屬性的元素保持不變,這樣大大簡化了可辨識矩陣,因此達到更加直觀地處理問題。改進后的可辨識矩陣的非a、0項即為不包含核屬性的元素項,這些不包含核屬性的屬性組合當中必然至少有一個元素應當成為約簡后的一個條件屬性,否則決策表的某些記錄將無法識別。
具體步驟:(1)根據算例列出故障診斷表;(2)將決策表轉換為可辨識矩陣形式,并將矩陣中屬性組合為1(即Card(Bi) = 1)的屬性標為核屬性;(3)根據改進的可辨識矩陣的規則將可辨識矩陣中包含核屬性的元素用字母a代替,不包含核屬性的元素項被保留。(4)將改進的可辨識矩陣中非 a、0的元素項表示為合取范式的形式,即:(5)將 P轉換為析取范式的形式,并化簡;(6)析取范式中由合取范式表示的每一項屬性組合連同核屬性便是最簡組合。
圖1為一個簡單電力系統接線圖[10],該系統有三個區域 Sec1、Sec2和Sec3分別配有過流保護 CO1,CO2和CO3。Sec1配有距離保護RR1,為Sec2和Sec3提供后備保護,CB1,CB2和CB3是斷路器。 將過流保護CO1、CO2、CO3,距離保護RR1和斷路器CB1、CB2、CB3的動作作為條件屬性,分別將故障區域Sec1、Sec2、Sec3作為決策屬性,建立決策表,其中“1”表示斷路器由閉合變位為斷開或保護動作,“0”示斷路器未變位或保護未動作。“NO”表示無故障。如表1。

圖1 配網算例示意圖

表1 故障決策表

表2 改進的可辨識矩陣
根據上述故障決策表求出可辨識矩陣以及核屬性。然后按照改進的可辨識矩陣的規則將表 2 矩陣中含核屬性的組合用字母 a 代替,不含有核屬性組合的元素項被保留。得到如上表所示:
由表2 可知,非0、a項有三組,分別為{CO1,RR1}、{CB1,CO1}、{CB1,RR1},接著將它們表示成合取范式的形式,如下:,然后再將合取范式化成析取范式的形式,如,最后析取范式中的{CO1,RR1}、{CB1,CO1}、{CB1,RR1}三項與兩個核屬性{CO2,CO3}組成的三個屬性集合{CO1,RR1,CO2,CO3}、{CB1,CO1,CO2,CO3}、{CB1,RR1 ,CO2 ,CO3}即為該故障診斷決策表的三個屬性約簡。
本文在經典可辨識矩陣的基礎上,對算法進行改進,同時結合布爾代數理論,得到一種能夠對不一致決策表進行約簡的方法。適用于大量信息的樣本處理且具有一定的容錯能力,因此用于配電網的故障診斷是很適宜的,通過例子的分析表明,該算法能夠得到決策表的最小約簡。
[1]Pawlak Z. Rough Sets- Theoretical Aspects of Reasoning About Data [M]. Dordrcht: Kluwer Academic Publisher, 1991.
[2]張文修,吳偉業,梁吉業等. 粗糙集理論與方法[M]. 北京:科學出版社,2001.
[3]王國胤. Rough 集理論與知識獲取[M]. 西安: 西安交通大學出版社,2001.
[4]Skapura RM. Building neural networks [M]. New York: ACM Press,1996. 286.
[5]Klir G, Yuan B. Fuzzy sets and fuzzy logic. Theory and applications[M].Englewood Cliffs : Prentice2 Hall,1995.221- 224.
[6]束紅春,孫想飛,司大軍. 基于粗糙集理論的配電網故障診斷研究[J].中國電機工程學報,2001,21(10):73- 77.
[7]D. Dubois, Prade. Putting Rough Se ts and Fuzzy Sets Together [J]. Kluwer Academic Publishers,1992,45(3):23-232.
[8]曾志民,江戈. 粗糙集理論中析取范式生成算法[J].福建電腦,2008,30(2):70-71.
[9]Pawlak Z, Peters J F, Skowron A, et al. Rough measures: Theory and Application of Rough.
[10]栗然,黎靜華,蘇立軍. 基于粗糙集的改進約簡算法和決策樹的電網故障診斷模型[J].繼電器,2005,(18).