999精品在线视频,手机成人午夜在线视频,久久不卡国产精品无码,中日无码在线观看,成人av手机在线观看,日韩精品亚洲一区中文字幕,亚洲av无码人妻,四虎国产在线观看 ?

鄰域粗糙集中不確定性的熵度量方法*

2016-12-19 01:12:55陳玉明曾志強田翠華
計算機與生活 2016年12期
關鍵詞:理論系統

陳玉明,曾志強,田翠華

1.廈門理工學院 計算機與信息工程學院,福建 廈門 361024

2.江西師范大學 國家網絡化支撐軟件國際科技合作基地,南昌 330027

鄰域粗糙集中不確定性的熵度量方法*

陳玉明1,2+,曾志強1,田翠華1

1.廈門理工學院 計算機與信息工程學院,福建 廈門 361024

2.江西師范大學 國家網絡化支撐軟件國際科技合作基地,南昌 330027

CHEN Yuming,ZENG Zhiqiang,TIAN Cuihua.Uncertainty measures using entropy and neighborhood rough sets.Journal of Frontiers of Computer Science and Technology,2016,10(12):1793-1800.

針對傳統粗糙集理論中不確定度量方法難以適用于鄰域粗糙集模型的問題,引入信息熵的度量方法,提出了基于信息熵的鄰域粗糙集不確定性度量方法。該方法采用鄰域關系對連續型數據進行信息粒化,基于粒化后的數據定義鄰域系統中的近似精度、鄰域信息熵、加權鄰域信息熵等不確定性度量。進一步提出鄰域系統不確定性度量的公理化表示,證明鄰域系統的近似精度、鄰域信息熵、加權鄰域信息熵都是公理化度量;給出其最大最小值,證明其滿足單調性原理。理論分析與實驗表明鄰域系統中的信息熵度量優于近似精度度量。

鄰域粗糙集;鄰域信息熵;不確定性度量;信息系統;近似精度

1 引言

粗糙集理論由波蘭科學家Pawlak于1982年提出[1],是一種處理不精確、不確定與海量數據的理論與方法,近二十年來被廣泛應用于機器學習[2]、數據挖掘[3]、圖像處理[4]、離群點檢測[5]、特征選擇[6]、大數據分析與處理等領域[7]。粗糙集理論中度量方法的研究是機器學習領域關鍵的研究內容之一。良好的度量工具能有效評價信息系統與決策系統的不確定性,提高機器學習中聚類與分類的精度與效率。

粗糙集理論中的不確定性度量是評價系統分類能力及提高分類精度的重要工具,國內外眾多學者對此進行了研究。Pawlak[8]采用上下近似的比值構造的精度來度量等價類集合的不確定性,進一步用近似精度來度量決策系統的不確定性。精度與近似精度是隨屬性的增加而遞增的函數,Pawlak同時提出了粗糙度與近似粗糙度兩個單調性遞減的度量工具。然而,Pawlak的不確定性度量并不精細,存在精度或者粗糙度一樣而等價類集合卻不一樣的情況。因此,很多學者從不同角度進行了改進,提出了信息質量[9]、近似質量[10]、知識粒度[11]、信息粒度[12]等度量。苗奪謙、梁吉業等人將熵的概念引入粗糙集領域,提供了更加有效而精細的度量工具,主要包括信息熵[13]、條件熵[14]、互信息[13]與粗糙熵[15]等度量。

粗糙集理論中的這些度量工具與方法已經廣泛應用于機器學習與數據挖掘的研究。經典粗糙集主要適用于具有離散型數據的決策系統,而對于廣泛存在的連續型數據,需進行離散化預處理,但為此造成了分類信息丟失,分類精度降低等問題。胡清華等人提出了鄰域粗糙集模型[16],能夠處理具有連續型數據的知識分類系統,已經廣泛用于屬性約簡[17]、特征選擇與提取[18]、分類與聚類[19]、基因選擇[20]、圖像處理[21]等領域。然而,鄰域關系并不是嚴格的等價關系,經典的不確定性度量工具與方法并不適用于鄰域知識分類系統。

本文在深入研究經典粗糙集度量工具與方法的基礎上,針對連續型數據的特點,引入鄰域粗糙集模型與信息熵度量,提出基于鄰域信息熵的不確定性度量方法。首先,對信息系統進行鄰域粒化,構造鄰域類集合;其次,定義鄰域精度與鄰域粗糙度概念度量鄰域類集合的不確定性,采用鄰域近似精度與鄰域近似粗糙度概念度量鄰域決策系統的不確定性;進一步,提出鄰域信息熵、加權鄰域信息熵等概念,用于度量連續型知識分類系統的不確定性及分類能力,證明了鄰域精度、鄰域信息熵及加權鄰域信息熵度量的單調性原理;最后,通過理論分析與實驗表明鄰域系統中的鄰域信息熵度量及加權鄰域信息熵度量優于近似精度度量。

2 鄰域粗糙集模型及其度量

Pawlak粗糙集理論對離散型數據進行等價類劃分,形成等價類集合。而對于現實世界廣泛存在的連續型數據,需要進行離散化處理后構造合適的等價類,但是離散化過程容易造成分類信息的丟失。為此,針對Pawlak粗糙集理論的局限性,引入鄰域粗糙集模型,給出鄰域粗糙集的相關概念[16],并討論鄰域粗糙集的精度度量與粗糙度度量。

3 基于信息熵的鄰域系統不確定性度量

信息熵是一種有效而精細的不確定性度量工具。經典粗糙集中基于信息熵的度量并不適用于鄰域粗糙集模型,需要進行擴展與改進。因此,根據鄰域粗糙集模型的特點,引入信息熵理論,定義鄰域系統中鄰域信息熵的概念,證明該概念是一種公理化度量,給出其最大最小值,并證明其滿足單調性原理。進一步定義了基于鄰域信息熵與鄰域近似精度的加權度量,證明了相關性質。

Table 1 The first medicine decision system表1 醫療決策系統之一

從以上例子可知,鄰域近似精度、鄰域信息熵與加權鄰域信息熵度量都是隨特征子集的增加而遞增,不確定性增加,能夠度量鄰域系統的不確定性。然而,鄰域近似精度度量不夠精細。特征子集從{a}增加到{a,b},不確定性發生變化,鄰域近似精度的值卻沒有變化,鄰域信息熵和加權鄰域信息熵度量的值都增大,說明這兩個度量優于鄰域近似精度度量。

4 實驗分析

為驗證鄰域信息熵度量的有效性,分別采用表1和表2中的數據進行不確定性度量實驗。度量方法分別采用精度度量、鄰域信息熵度量、加權鄰域信息熵度量。實驗中鄰域粒化采用歐氏距離,表1中的鄰域參數為0.3,表2中的鄰域參數為0.45。實驗結果如圖1和圖2所示。

Table 2 The second medicine decision system表2 醫療決策系統之二

Fig.1 Measure result of Table 1圖1 表1數據的度量結果

Fig.2 Measure result of Table 2圖2 表2數據的度量結果

由圖1與圖2中的度量結果可知,近似精度、鄰域信息熵、加權鄰域信息熵的值隨特征個數的增加而單調遞增,不確定性增加,能夠度量數據的不確定性。進一步分析可知,圖1中,特征個數從1增加到2,近似精度沒有變化,而鄰域信息熵和加權鄰域信息熵遞增;圖2中,特征個數從2增加到3,近似精度沒有變化,而鄰域信息熵和加權鄰域信息熵遞增。這些結果表明近似精度度量不夠精細,有時并不能反映不確定性的變化,而鄰域信息熵與加權鄰域信息熵則具有更好的不確定性度量性能。

5 結論與展望

傳統Pawlak粗糙集模型主要處理離散型數據集,對于連續型數據集則需要離散化預處理過程。然而,離散化算法不可避免會造成重要信息的損失,甚至降低機器學習算法的分類精度。為此,針對連續型的數據集的特點,在決策系統中引入鄰域關系、信息熵理論,定義鄰域近似精度、鄰域信息熵與加權鄰域信息熵等概念度量連續型數據的不確定性,并證明了鄰域近似精度、鄰域信息熵與加權鄰域信息熵的單調性,為機器學習相關分類算法的研究提供了理論基礎。

鄰域系統中的近似精度、鄰域信息熵等能夠度量數據的不確定性,不僅適用于連續型數據集,而且也適用于離散型數據集。因此,這些度量能夠應用于現實世界大量存在的同時具備以上兩種類型的復雜數據集,進一步可以基于不確定性度量構造特征重要度,應用于屬性約簡、特征選擇等領域。

[1]Pawlak Z.Rough sets[J].International Journal of Information and Computer Sciences,1982,11(1):341-356.

[2]Duan Jie,Hu Qinghua,Zhang Lingjun,et al.Feature selection for multi-label classification based on neighborhood rough sets[J].Journal of Computer Research and Development, 2015,52(1):56-65.

[3]Tseng T L,Huang C C,Fraser K,et al.Rough set based rule induction in decision making using credible classification and preference from medical application perspective[J]. Computer Methods and Programs in Biomedicine,2016, 127(4):273-289.

[4]Yue Xiaodong,Miao Duoqian,Zhong Caiming.Roughness measure approach to color image segmentation[J].Acta Automatica Sinica,2010,36(6):807-816.

[5]Jiang Feng,Du Junwei,Ge Yan,et al.Sequence outlier detection based on rough set theory[J].Acta Electronica Sinica, 2011,39(2):345-350.

[6]Chen Yumin,Miao Duoqian,Wang Ruizhi.A rough set approach to feature selection based on ant colony optimization [J].Pattern Recognition Letters,2010,31(3):226-233.

[7]Qian Jin,Lv Ping,Yue Xiaodong,et al.Hierarchical attribute reduction algorithms for big data using MapReduce[J]. Knowledge-Based Systems,2015,73:18-31.

[8]Pawlak Z.Rough sets[M].Dordrecht:Kluwer Academic Publishers,1991:45-64.

[9]Liang Jiye,Li Ru,Qian Yuhua.Distance:a more comprehensible perspective for measures in rough set theory[J]. Knowledge-Based Systems,2012,27(11):126-136.

[10]Dai Jianhua,Xu Qing.Approximations and uncertainty measures in incomplete information systems[J].Information Sciences,2012,198:62-80.

[11]Miao Duoqian,Fan Shidong.The calculation of knowledge granulation and its application[J].Systems Engineering-Theory&Practice,2002,22(1):48-56.

[12]Zhang Wenxiu,Wu Weizhi,Liang Jieye,et al.Rough set theory and methods[M].Beijing:Science Press,2001.

[13]Miao Duoqian,Wang Jue.An information representation of the concepts and operations in rough set theory[J].Journal of Software,1999,10(2):113-116.

[14]Wang Guoyin,Zhang Qinghua.Uncertainty of rough sets in different knowledge granularities[J].Chinese Journal of Computers,2008,31(9):1588-1598.

[15]Liang Jiye,Shi Zhongzhi,Li Deyu.Information entropy, rough entropy and knowledge granulation in incomplete information systems[J].International Journal of General System,2006,35(6):641-654.

[16]Hu Qinghua,Yu Daren,Xie Zongxia.Neighborhood classifiers[J].Expert Systems with Applications,2008,34(2): 866-876.

[17]Liu Yong,Huang Wenliang,Jiang Yunliang,et al.Quick attribute reduct algorithm for neighborhood rough set model [J].Information Sciences,2014,271:65-81.

[18]Xie Juanying,Li Nan,Qiao Zirui.Feature subset selection algorithms for incomplete decision systems based on neighborhood rough sets[J].Journal of Nanjing University:Natural Sciences,2011,47(4):383-390.

[19]Yao Ping Y,Lu Yongheng.Neighborhood rough set and SVM based hybrid credit scoring classifier[J].Expert Systems withApplications,2011,38(9):11300-11304.

[20]Meng Jun,Zhang Jing,Luan Yushi.Gene selection integrated with biological knowledge for plant stress response using neighborhood system and rough set theory[J].IEEE/ACM Transactions on Computational Biology and Bioinformatics, 2015,12(2):433-444.

[21]Yu Ying,Pedrycz W,Miao Duoqian.Neighborhood rough sets based multi-label classification for automatic image annotation[J].International Journal of Approximate Reasoning, 2013,54(9):1373-1387.

[22]Chen Yumin,Wu Keshou,Chen Xuhui,et al.An entropybased uncertainty measurement approach in neighborhood systems[J].Information Sciences,2014,279:239-250.

附中文參考文獻:

[2]段潔,胡清華,張靈均,等.基于鄰域粗糙集的多標記分類特征選擇算法[J].計算機研究與發展,2015,52(1):56-65.

[4]岳曉冬,苗奪謙,鐘才明.基于粗糙性度量的彩色圖像分割方法[J].自動化學報,2010,36(6):807-816.

[5]江峰,杜軍威,葛艷,等.基于粗糙集理論的序列離群點檢測[J].電子學報,2011,39(2):345-350.

[11]苗奪謙,范世棟.知識的粒度計算及其應用[J].系統工程理論與實踐,2002,22(1):48-56.

[12]張文修,吳偉志,梁吉業,等.粗糙集理論與方法[M].北京:科學出版社,2001.

[13]苗奪謙,王玨.粗糙集理論中概念與運算的信息表示[J].軟件學報,1999,10(2):113-116.

[14]王國胤,張清華.不同知識粒度下粗糙集的不確定性研究[J].計算機學報,2008,31(9):1588-1598.

[18]謝娟英,李楠,喬子芮.基于鄰域粗糙集的不完整決策系統特征選擇算法[J].南京大學學報,2011,47(4):383-390.

CHEN Yuming was born in 1977.He received the Ph.D.degree from Tongji University in 2010.Now he is an associate professor at Xiamen University of Technology,and the member of CCF.His research interests include rough sets and feature selection,etc.

陳玉明(1977—),男,江西吉安人,2010年于同濟大學獲得博士學位,現為廈門理工學院副教授,CCF會員,主要研究領域為粗糙集,特征選擇等。

ZENG Zhiqiang was born in 1971.He received the Ph.D.degree from Zhejiang University in 2007.Now he is the vice dean at College of Computer and Information Engineering,Xiamen University of Technology.His research interests include artificial intelligence and pattern recognition,etc.

曾志強(1971—),男,福建廈門人,2007年于浙江大學獲得博士學位,現為廈門理工學院計算機與信息工程學院副院長,主要研究領域為人工智能,模式識別等。

TIAN Cuihua was born in 1970.She received the Ph.D.degree from Northeastern University in 2008.Now she is an associate professor at Xiamen University of Technology.Her research interests include data mining and big data,etc.

田翠華(1970—),女,遼寧沈陽人,2008年于東北大學獲得博士學位,現為廈門理工學院副教授,主要研究領域為數據挖掘,大數據等。

Uncertainty Measures Using Entropy and Neighborhood Rough Sets*

CHEN Yuming1,2+,ZENG Zhiqiang1,TIAN Cuihua1
1.College of Computer and Information Engineering,Xiamen University of Technology,Xiamen,Fujian 361024,China
2.State International S&T Cooperation Base of Networked Supporting Software,Jiangxi Normal University,Nanchang 330027,China
+Corresponding author:E-mail:cym0620@163.com

In view of the fact that the uncertainty measures of classical rough set theory are difficult to be suitable for neighborhood rough set model,this paper proposes an uncertainty measurement method based on information entropy and neighborhood rough sets.By the definitions of neighborhood relation,each object in the universe is assigned with a neighborhood subset,called neighborhood granule.Some uncertainty measures of neighborhood granule are defined,including approximate accuracy,information entropy and weighted information entropy in the neighborhood system.Furthermore,this paper presents the axiomatic concept of measure,and proves that the three measures are axiomatic uncertainty measures.This paper also gives the maximum and minimum of these measures and proves their monotonicities.Theoretical analysis and experiments show that the information entropy measure in the neighborhood system is better than the approximate accuracy measure.

10.3778/j.issn.1673-9418.1605037

A

TP18

*The National Natural Science Foundation of China under Grant No.61573297(國家自然科學基金);the Natural Science Foundation of Fujian Province under Grant Nos.2015J01277,2016J01324(福建省自然科學基金);the Project of Department of Education of Fujian Province under Gant Nos.JA09217,JB13152(福建省教育廳項目);the Program for New Century Excellent Talents in Fujian Province(福建省高校新世紀優秀人才支持計劃).

Received 2016-04,Accepted 2016-06.

CNKI網絡優先出版:2016-06-27,http://www.cnki.net/kcms/detail/11.5602.TP.20160627.0929.002.html

Key words:neighborhood rough sets;neighborhood information entropy;uncertainty measure;information system; approximation accuracy

猜你喜歡
理論系統
Smartflower POP 一體式光伏系統
工業設計(2022年8期)2022-09-09 07:43:20
堅持理論創新
當代陜西(2022年5期)2022-04-19 12:10:18
神秘的混沌理論
理論創新 引領百年
WJ-700無人機系統
ZC系列無人機遙感系統
北京測繪(2020年12期)2020-12-29 01:33:58
相關于撓理論的Baer模
基于PowerPC+FPGA顯示系統
半沸制皂系統(下)
連通與提升系統的最后一塊拼圖 Audiolab 傲立 M-DAC mini
主站蜘蛛池模板: 国产第三区| 国产夜色视频| 制服丝袜国产精品| 国产精女同一区二区三区久| 亚洲欧美成人| 欧美成人午夜在线全部免费| 国产Av无码精品色午夜| 国模极品一区二区三区| 亚洲浓毛av| 57pao国产成视频免费播放| 久久国语对白| 黄网站欧美内射| 香蕉伊思人视频| 一区二区三区成人| 国产高清在线丝袜精品一区| 婷婷六月综合| 亚洲国产精品日韩欧美一区| 在线国产毛片手机小视频| 19国产精品麻豆免费观看| 欧洲高清无码在线| 在线观看国产一区二区三区99| 亚洲乱强伦| 中文纯内无码H| 久久永久视频| 久久综合结合久久狠狠狠97色| 国产99视频精品免费视频7| 福利视频一区| 精品一区国产精品| 日韩精品无码免费专网站| 性网站在线观看| 在线无码九区| 色网站在线免费观看| 3p叠罗汉国产精品久久| 亚洲V日韩V无码一区二区| 波多野结衣一区二区三区88| 国产自在线拍| 中文字幕66页| 国产高潮流白浆视频| 天天躁狠狠躁| www.av男人.com| 国产一级α片| 亚洲日本在线免费观看| 综合五月天网| 丰满人妻被猛烈进入无码| 国产91蝌蚪窝| 久久免费视频播放| 尤物精品视频一区二区三区| 一本综合久久| 日本精品一在线观看视频| 久久婷婷五月综合色一区二区| 国产三区二区| 蜜臀AV在线播放| 国产精品成| 国产在线日本| 久久综合九色综合97婷婷| 欧美yw精品日本国产精品| 成人久久精品一区二区三区 | 免费在线视频a| 国产在线精彩视频二区| 亚洲国产天堂久久九九九| 欧美成人区| 青青青国产免费线在| 国产视频一二三区| 五月婷婷导航| 亚洲浓毛av| 久久久久亚洲精品无码网站| Jizz国产色系免费| 国产精品思思热在线| 欧美另类第一页| 69精品在线观看| 重口调教一区二区视频| 2020亚洲精品无码| 二级特黄绝大片免费视频大片| 亚洲首页在线观看| 在线观看国产黄色| 国产在线拍偷自揄观看视频网站| 国产人碰人摸人爱免费视频| 国产日韩欧美精品区性色| 国产激情无码一区二区免费| 欧美在线导航| 国产在线精品99一区不卡| 天天做天天爱夜夜爽毛片毛片|