車曉雅,李磊軍,2,米據生,2
(1.河北師范大學 數學與信息科學學院,河北 石家莊 050024; 2.河北省計算數學與應用重點實驗室,河北 石家莊 050024)
?
基于證據理論刻畫多粒度覆蓋粗糙集的數值屬性
車曉雅1,李磊軍1,2,米據生1,2
(1.河北師范大學 數學與信息科學學院,河北 石家莊 050024; 2.河北省計算數學與應用重點實驗室,河北 石家莊 050024)
在經典多粒度粗糙集模型的基礎上,基于論域中對象的極大描述和極小描述,定義了4種應用更為廣泛的悲觀多粒度覆蓋粗糙集模型。然后通過集合的交、并運算與關系劃分函數,構造了對象關于覆蓋族的單粒度的多元覆蓋及單粒度劃分。在此基礎上,基于證據理論,探討了4種悲觀多粒度覆蓋粗糙集的上、下近似與信任函數和似然函數之間關系,并描述了該模型所具備的相關數值屬性。對比分析表明悲觀多粒度覆蓋粗糙集模型既具備經典多粒度粗糙集模型能夠融合多源信息的優勢,又克服了其應用范圍狹窄的缺點。實例分析驗證了所提模型的有效性。
粗糙集理論;覆蓋;粒度;證據理論;近似;特性描述
中文引用格式:車曉雅,李磊軍,米據生. 基于證據理論刻畫多粒度覆蓋粗糙集的數值屬性[J]. 智能系統學報, 2016, 11(4): 481-486.
英文引用格式:CHE Xiaoya, LI Leijun, MI Jusheng. Evidence-theory-based numerical characterization of multi-granulation covering rough sets[J]. CAAI Transactions on Intelligent Systems, 2016, 11(4): 481-486.
粗糙集理論由Pawlak[1]于1982年提出,是一種有效處理模糊和不確定性知識的數學工具,其在機器學習、模式識別、決策分析和數據挖掘等領域得到廣泛應用[2-5]。經典粗糙集理論基于等價關系定義集合的上、下近似,然而隨著現實世界中的數據在結構和形式上日益復雜化和多樣化,經典粗糙集有時不再能滿足實際問題的處理需求。為此眾多學者從不同角度對經典粗糙集模型進行了擴展[5-8],提出了覆蓋粗糙集、多粒度粗糙集、變精度粗糙集、概率粗糙集、模糊粗糙集等。其中,覆蓋粗糙集是將經典粗糙集中的劃分推廣成更一般的覆蓋,增強了其處理數據的能力[7,9]。
從粒計算的角度來看,Pawlak粗糙集及推廣形式都是基于單一二元關系,均可被稱做單粒度粗糙集。然而,在許多實際應用中,需要由多個二元關系誘導出的多粒度結構對目標概念進行刻畫。為此,錢宇華等[8,10]提出了基于全域中多個等價關系的經典多粒度粗糙集模型。苗奪謙等[11]在覆蓋近似空間中提出4種樂觀多粒度覆蓋粗糙集模型,其中集合的第一、二型近似分別基于論域中對象極小描述的交和并,集合的第三、四型近似分別基于論域中對象極大描述的交和并。
另一方面,Dempster-Shafer(DS)證據理論產生自20世紀60年代。Dempster[12]提出了集值映射的概念,并定義了上、下概率。 隨后, Shafer[13]用信度函數對上、下概率重新進行詮釋, 創立“證據的數學理論”。 Dempster還定義了著名的Dempster證據組合規則,該理論中的基本概念是信度函數,包括信任函數和似然函數,并以此來度量知識的不確定性。與粗糙集理論相類似,證據理論也是一種處理不確定性的有力工具[14-16]。許多專家對粗糙集和證據理論之間的關系進行了研究和推廣。姚一豫[17]指出可以用信任函數和似然函數對粗糙集中的上、下近似算子進行解讀;吳偉志等[16]將信任結構與近似空間相結合,從證據理論的角度研究Pawlak粗糙集的知識約簡;陳德剛等[18]在統一框架下對若干覆蓋近似算子進行分類,基于粒和證據理論對這些覆蓋粗糙近似算子進行度量,并且用信任函數和似然函數對鄰域覆蓋粗糙集中上、下近似算子進行了度量,進而建立了上述函數與鄰域信息系統屬性約簡之間的關系[19]。
將證據理論與多粒度粗糙集模型相結合是目前的研究熱點之一[20-21],譚安輝[22]基于證據理論刻畫了不完備信息系統中多粒度粗糙集的數值屬性,指出只有悲觀多粒度粗糙集的數值屬性可以由信任結構刻畫,并構建了一種多粒度粗糙集的屬性約簡算法;林國平[14]結合證據理論和多粒度粗糙集,提出一種新的融合多源信息的方法。然而,上述研究都沒有考慮過如何構建多粒度覆蓋粗糙集的信任結構以及如何用證據理論刻畫多粒度覆蓋粗糙集的數值屬性?;谏鲜鰡l,本文首先在苗奪謙等[11]提出的4種樂觀多粒度覆蓋粗糙集模型的基礎上定義4種悲觀多粒度覆蓋粗糙集模型,然后基于證據理論給出多粒度覆蓋粗糙集的信任結構。通過集合的交運算和關系劃分函數建立多粒度覆蓋與單粒度劃分之間的關系,進而建立了多粒度覆蓋粗糙集和證據理論之間聯系。
1.1Pawlak 粗糙集相關概念

?B?C決定一個二元不可辨識關系[1]RB,定義為



1.2覆蓋粗糙集相關概念





1.3多粒度粗糙集相關概念
下面簡要給出多粒度粗糙集的兩種模型,即樂觀多粒度粗糙集和悲觀多粒度粗糙集。

式中~X=U-X。

式中~X=U-X。
2.4證據理論相關概念




信任函數滿足下列性質:



本節選取苗奪謙等[11]提出的4種樂觀多粒度覆蓋粗糙集模型。上述模型基于論域中極小描述或極大描述的交或并定義。
譚安輝等[22]指出,在信息系統中,集合的悲觀多粒度近似可以由信度函數刻畫,但是集合的樂觀多粒度近似一般不具備這種特性。因而本文首先基于苗奪謙等[11]提出的4種樂觀多粒度覆蓋粗糙集模型定義悲觀多粒度覆蓋粗糙集模型。
x的極大描述包含近似空間中所有與x相關的對象,當討論近似空間U,C中集合近似的問題時,極大描述可以提供一個詳細且綜合的對于x的概括。
顯然,如果C是U上的一族劃分,上述4種多粒度覆蓋粗糙集模型將退化為經典悲觀多粒度粗糙集模型。因此,上述4種模型是對經典多粒度粗糙集模型的推廣,并且也是粗糙集模型和覆蓋粗糙集模型的推廣。


?X?U,x∈U,X在上述4種悲觀多粒度覆蓋粗糙集模型中上、下近似的定義分別基于論域中x極小描述或極大描述的交或并所得x的相關元。因為X定義于多粒度環境中,所以無論x的極小描述還是x的極大描述均同時與覆蓋C1,C2,…,Cm相關。即 ?j∈{1,2,3,4}如果集合{(ij(x))i=1,2,…,m}中所有元均為X子集,則x屬于,如果至少存在一個與X相交不為空,則x屬于。鑒于此, ?x∈U,本文對集族取并集后得是論域U上一個單粒度覆蓋,從而悲觀多粒度覆蓋粗糙集轉化為單粒度覆蓋粗糙集。進一步,定理1借助關系劃分函數,將覆蓋與劃分建立聯系,將覆蓋粗糙集轉化為經典粗糙集,進而在定理2中得出證據理論與多粒度悲觀覆蓋粗糙集之間聯系。



證明?j=1,2,3,4






其中,j=1,2,3,4代表用相應信度函數分別刻畫4種多粒度覆蓋粗糙集的近似。
下面用例子進一步解釋其具體含義。

表1 一個關于房屋評價的信息系統
由屬性集A誘導出的一族覆蓋C={Ci,i=1,2,…,4}和等價關系R={Ri,i=1,2,…,4}及由決策集B誘導出覆蓋的C5,如下:C1={{x1,x2,x3},{x1,x2,x3,x4,x5,x6},{x6}}, C2={{x1,x3,x6},{x2,x3,x6},{x4,x5}},C3={{x1,x2,x6},{x2,x3,x5},{x2,x3,x4,x6}},C4={{x1,x2},{x2,x3},{x3,x4,x5,x6}},C5={{x1,x2,x6},{x1,x2,x3,x4},{x2,x3,x5,x6}},R1= {{x1,x2,x3},{x4,x5},{x6}},R2={{x1},{x2},{x3,x6},{x4,x5}},R3={{x1},{x2},{x3},{x4},{x5},{x6}},R4={{x1},{x2},{x3},{x4,x5,x6}}







是關于覆蓋族C的多粒度覆蓋。
顯然,本文所提出的模型相較于經典多粒度粗糙集模型,更具實際應用價值。
經過上述討論,本文得出以下結論:
1)通過對現有多粒度覆蓋粗糙集模型進行分析,構造了4種悲觀多粒度覆蓋粗糙集模型,以使其能夠與證據理論更好地結合;
2)基于集合的交、并運算和關系劃分函數,實現了悲觀多粒度覆蓋粗糙集到單粒度多元覆蓋粗糙集再到單粒度經典粗糙集的轉化,進而實現簡化上述4種模型的目的;
3)結合證據理論,刻畫了上述模型的近似及其不確定性。
在后續研究中,可以進一步給出基于信任函數和似然函數的多粒度覆蓋粗糙集屬性約簡算法。
[1]PALAWK Z. Rough set[J]. International journal of computer & information sciences, 1982, 11(5): 341-356.
[2]CHEN Degang, KWONG S, HE Qiang, et al. Geometrical interpretation and applications of membership functions with fuzzy rough sets[J]. Fuzzy sets and systems, 2012, 193: 122-135.
[3]LIANG Jiye, CHIN K S, Dang Chuangyin, et al. A new method for measuring uncertainty and fuzziness in rough set theory[J]. International journal of general systems, 2002, 31(4): 331-342.
[4]LIANG Jiye, WANG Feng, DANG Chaungyin, et al. A group incremental approach to feature selection applying rough set technique[J]. IEEE transactions on knowledge and data engineering, 2014, 26(2): 294-308.
[5]TAN Anhui, LI Jinjin, LIN Guoping. Extended results on the relationship between information systems[J]. Information sciences, 2015, 290: 156-173.
[6]BONIKOWSKI Z, BRYNIARSKI E, WYBRANIEC-SKARDOWSKA U. Extensions and intentions in the rough set theory[J]. Information sciences, 1998, 107(1/2/3/4): 149-167.
[7]FENG Tao, MI Jusheng, WU Weizhi. Covering-based generalized rough fuzzy sets[M]//WANG Guoying, PETERS J F, SKOWRON A, et al. Rough Sets and Knowledge Technology. Berlin Heidelberg: Springer, 2006: 208-215.
[8]QIAN Y H, LIANG J Y. Rough set method based on multi-granulations[C]//Proceedings of the 5th IEEE International Conference on Cognitive Informatics. Beijing: IEEE, 2006: 297-304.
[9]徐偉華, 劉士虎, 張文修. 一般二元關系下信息系統知識的粒度描述[J]. 計算機工程與應用, 2011, 47(18): 40-44.
XU Weihua, LIU Shihu, ZHANG Wenxiu. Granularity representation of knowledge in information system based on general binary-relation[J]. Computer engineering and applications, 2011, 47(18): 40-44.
[10]QIAN Yuhua, LIANG Jiye, YAO Yiyu, et al. MGRS: a multi-granulation rough set[J]. Information sciences, 2010, 180(6): 949-970.
[11]LIU Caihui, MIAO Duoqian, QIAN Jin. On multi-granulation covering rough sets[J]. International journal of approximate reasoning, 2014, 55(6): 1404-1418.
[12]DEMPSTER A P. Upper and lower probability inferences based on a sample from a finite univariate population[J]. Biometrika, 1967, 54(3/4): 515-528.
[13]SHAFER G. A mathematical theory of evidence[J]. Technometrics, 1978, 20(1): 242.
[14]LIN Guoping, LIANG Jiye, QIAN Yuhua. An information fusion approach by combining multigranulation rough sets and evidence theory[J]. Information sciences, 2015, 314: 184-199.
[15]林國平. 覆蓋廣義粗糙集與信任函數[J]. 漳州師范學院學報: 自然科學版, 2010(2): 1-4.
LIN Guoping. Connections between covering generization rough set and dempster-shafer theory of evidence[J]. Journal of Zhangzhou normal university: natural science, 2010(2): 1-4.
[16]WU Weizhi, MI Jushneg. Knowledge reduction in incomplete information systems based on dempster-shafer theory of evidence[M]//WANG Guoying, PETERS J F, SKOWRON A, et al. Rough Sets and Knowledge Technology. Berlin Heidelberg: Springer, 2006: 254-261.
[17]YAO Y Y, LINGRAS P J. Interpretations of belief functions in the theory of rough sets[J]. Information sciences, 1998, 104(1/2): 81-106.
[18]CHEN Degang, ZHANG Xiaoxia, LI Wanlu. On measurements of covering rough sets based on granules and evidence theory[J]. Information sciences, 2015, 317: 329-348.
[19]CHEN Degang, LI Wanlu, ZHANG Xiao, et al. Evidence-theory-based numerical algorithms of attribute reduction with neighborhood-covering rough sets[J]. International journal of approximate reasoning, 2014, 55(3): 908-923.
[20]WU Weizhi, LEUNG Y, ZHANG Wenxiu. Connections between rough set theory and Dempster-Shafer theory of evidence[J]. International journal of general systems, 2002, 31(4): 405-430.
[21] 吳偉志, 米據生, 李同軍. 無限論域中的粗糙近似空間與信任結構[J]. 計算機研究與發展, 2012, 49(2): 327-336.
WU Weizhi, MI Jusheng, LI Tongjun. Rough approximation spaces and belief structures in infinite universes of discourse[J]. Journal of computer research and development, 2012, 49(2): 327-336.
[22]TAN Anhui, WU Weizhi, LI Jinjin, et al. Evidence-theory-based numerical characterization of multi-granulation rough sets in incomplete information systems[J]. Fuzzy sets and systems, 2016, 294: 18-35.
[23]ZAKOWSKI B W. Approximations in the space (u, π)[J]. Demonstratio mathematica, 1983, 16(3): 761-769.

車曉雅,女, 1991年生, 碩士研究生, 主要研究方向為人工智能的數學基礎。

李磊軍,男,1985年生,講師,博士,主要研究方向為粗糙集,概念格,粒計算與集成學習等,已發表學術論文10余篇,其中被SCI檢索5篇。
Evidence-theory-based numerical characterization of multi-granulation covering rough sets
CHE Xiaoya1, LI Leijun1,2, MI Jusheng1,2
(1.College of Mathematics and Information Science, Hebei Normal University, Shijiazhuang 050024, China; 2. Hebei Key Laboratory of Computational Mathematics and Applications, Shijiazhuang 050024, China)
Considering classical multi-granulation rough sets and using the maximal and minimal descriptors of objects in a given universe, this paper proposes four pessimistic multi-granulation covering rough set models, suitable for extensive application. Based on set union and portion functions, the notion of multi-granularity covering connected to a number of coverings and a single granularity partition in the domain are defined. On this basis, belief and plausibility functions from evidence theory are employed to define the relationship between the upper and lower approximations, the belief function, and the likelihood function, and to characterize the set approximations in the four models. Compared with classical multi-granulation rough sets, the pessimistic multi-granulation covering rough set models not only have distinct advantages and combine multi-source information, but also avoid the shortcomings of a narrow application range. Finally, a real example is used to demonstrate the effectiveness of the presented models.
rough sets theory; covering; granulation; evidence theory; approximation; characterization
10.11992/tis.201606011
網絡出版地址:http://www.cnki.net/kcms/detail/23.1538.TP.20160808.0830.006.html
2016-06-03. 網絡出版日期:2016-08-08.
國家自然科學基金項目(61573127,61502144,61300121,6147 2463);河北省自然科學基金項目(A2014205157);河北省高校創新團隊領軍人才培育計劃項目(LJRC022);河北省高校自然科學基金項目(QN2016133);河北師范大學博士科學基金項目(L2015B01);河北省教育廳研究生創新項目(sj2015001).
車曉雅.E-mail:chexiaoya@163.com.
TP18
A
1673-4785(2016)04-0481-06