王小改,李巧艷,王 璐
(西安工程大學理學院,西安710048)
1982年波蘭數學家Z.Pawlak首次提出了粗糙集理論[1],這是一種處理不確定性和不精確性問題的新的數學工具,在數據挖掘、知識約簡等方面得到成功的應用.1983年Zakowski[2]從實際應用出發,提出了覆蓋粗糙集模型,并討論了相關的性質.2003年William Zhu和WANG Fei-yue[3]在覆蓋粗糙集的基礎上給出了約簡的概念和方法,證明了一個覆蓋通過約簡得到的最簡覆蓋是唯一的,并且證明了最簡覆蓋相同的兩個覆蓋產生相同的上、下近似.
定義1[4]設U是有限論域,集函數P∶2U→[0,1]成為概率側度,若
(1)P(U)=1,
(2)當A∩B=?,有P(A∪B)=p(A)+p(B),
若P是U上的概率測度,稱A,B?U且P(B) >0,稱

為在事件B發生的情況下事件A發生的條件概率.
定義2 (覆蓋、覆蓋近似空間)設U是一個論域,C是U的一個子集族.如果C中的所有子集都不空,且∪C=U,則稱C是U的一個覆蓋,稱有序對 <U,C>為覆蓋近似空間.
定義3[5](最小描述)設 <U,C > 為一個覆蓋近似空間,x∈U,則稱

為x的最小描述.
定義4 (覆蓋下近似、上近似)設C={K1,K2,…,Kn}是論域U上的一個覆蓋,P為定義在U的子集類構成的σ代數上的概率測度,記A=(U,C,P)為覆蓋概率近似空間,則對任意X?U,0≤β<α≤1,定義X的關于A=(U,C,P)依參數α,β的下近似和上近似分別為:

X 的關于 A=(U,C,P) 依參數 α,β,的覆蓋邊界域為 Bn(X,α,β)=
定理1 對于定義4下的覆蓋上、下近似有如下性質:

文獻[6]介紹給出了粗糙集的數字特征.本節我們在文獻[6]的基礎上討論定義4給出的覆蓋粗糙集的數字特征.
定義5 (集合的近似精度和粗糙度)設C是論域U上的一個覆蓋,對?X?U,稱集合X的α近似精度和ρ粗糙度分別為

對每一個X?U,有0≤α(X)≤1.當α(X)=1時,X的邊界域為空集,所以集合X是可定義的;當α(X)<1時,集合X有非空的邊界域,所以集合是不可定義的;當集合X為空集時,我們就定α(X)=α(?)=1.
X的α粗糙度與ρ近似精度恰恰相反,它反映了我們在覆蓋C對于集合X表達的范疇了解的不完全程度.
定義6 (近似分類精度和近似分類質量)設C是論域U上的一個覆蓋,以及論域U上的一個劃分π(U)={X1,X2,X3,…,Xn} ∈ Π(U),且這個劃分獨立于覆蓋 C.其中子集 Xi(i=1,2,…,n) 是劃分π(U)的等價類.首先定義π(U)的下近似和上近似分別為:


定義7 (知識庫中系統參數的重要度)設C是論域U上的一個覆蓋,C表示描述覆蓋近似空間 <U,C>的一組數或單個的系統參數.?X?U和獨立于系統參數C的論域U的一個劃分π(U)={X1,X2,…,Xn},定義集合X關于系統參數C的重要度和劃分π(U)關于系統參數C的重要度分別為

由定義,系統參數具有以下性質:
(1)?X?U,π(U)∈∏(U),0≤sigC(X)≤1;0≤sigC(π(U))≤1.
(2)當sigC(X)=1時,表明覆蓋C可精確描述出集合X.
(3)當sigC(X)=0時,表明覆蓋C無法判斷論域U中的任意元素是否屬于概念X.
(4)X系統參數C的重要度越大,表明用覆蓋C描述集合X的近似精度就越高.
(5)當sigC(π(U))=1時,表明覆蓋C可精確描述出劃分π(U),即劃分π(U)是比覆蓋C所表示的劃分更粗的劃分.
(6)當sigC(π(U))=0時,表明覆蓋C無法判斷論域U中的任意元素是否屬于劃分π(U)中的概念Xi(i=1,2,…,n).
(7)劃分π(U)系統參數C的重要度越大,表明用覆蓋C描述該劃分π(U)的似精度就越高.
(8)無論集合還是劃分,它的系統參數C的重要度越大,表明覆蓋C分類能力越強.
(9)無論集合還是劃分,它的系統參數C的重要度隨著C的細劃而單調遞增.
定義8 設C是論域U上的一個覆蓋,

定理3 (1)集合X為C-可定義,或C-粗糙可定義,或C-全不可定義,當且僅當 ~X為C-可定義的,或C-粗糙可定義,或C-全不可定義;
(2)X為C-外(或內)不可定義當且僅當 ~X為C-外(或內)不可定義.

所以X為C-粗糙可定義? ~X為C-粗糙可定義.
綜上所述,集合X為C-可定義,或C-粗糙可定義,或C-全不可定義,當且僅當 ~X為C-可定義的,或C-粗糙可定義,或C-全不可定義.
同理可證(2)成立.
本文提出了一種新的覆蓋粗糙集的上、下近似定義,并討論了其性質.同時,研究了其數字特征與拓撲特征,豐富了覆蓋粗糙集的研究.
[1]Pawlak Z.Rough sets[J].International Journal of Computer and Information Sciences,1982,11:341 -356.
[2]Zakowski W.Approximation in the space(U,∏)[J].Demonstration Mathematic,1983,16:761 -769.
[3]William Zhu,WANG Fei-yue.Reduction and axiomization of covering generalized rough set[J].Information Sciences,2003,152:217 -230.
[4]孫秉珍,鞏增泰.變精度概率粗糙集模型[J].西北師范大學學報(自然科學版),2005,41(4):23-26.
[5]Zhu W,Wang F Y.Reduction and axiomization of covering generalized rough sets[J].Information Sciences,2003,152:217 -230.
[6]苗奪謙,李道國.粗糙集理論、算法與應用[M].北京:清華大學出版社,2008.34-57.