999精品在线视频,手机成人午夜在线视频,久久不卡国产精品无码,中日无码在线观看,成人av手机在线观看,日韩精品亚洲一区中文字幕,亚洲av无码人妻,四虎国产在线观看 ?

基于集合枚舉樹的最小屬性約簡算法

2013-08-04 02:23:46成都信息工程學院軟件工程學院成都610225
計算機工程與應用 2013年11期
關鍵詞:定義

成都信息工程學院 軟件工程學院,成都 610225

JIANG Yu

成都信息工程學院 軟件工程學院,成都 610225

College of Software Engineering,Chengdu University of Information Technology,Chengdu 610225,China

粗糙集理論是由波蘭學者Pawlak于1982年提出的[1-2],是一種刻劃具有不完整性和不確定性信息的全新數學工具。其主要思想是在保證知識庫的分類能力不變的前提下,通過知識約簡導出問題的決策或分類規則。知識約簡問題是粗糙集理論的一個核心問題[3-4]。所謂知識約簡,就是在保證知識庫分類能力不變的條件下刪除其中不相關或不重要的冗余知識。

一般來講,一個決策表的屬性約簡不是唯一的,通常人們往往希望能夠找到一個冗余度最小的屬性約簡,該屬性約簡被稱為最小屬性約簡。對任一給定決策表,若屬性約簡算法能確保找到其最小屬性約簡,則該算法稱為最小屬性約簡完備算法。然而,S.K.M Wong和W.Ziarko已經證明了找一個決策表的最小約簡是NP-hard問題[3]。導致NP-hard問題的主要原因是屬性的組合爆炸問題。目前已存在一些屬性約簡算法能夠找到決策表的最小屬性約簡[4-12],但它們要么不是完備的最小屬性約簡算法,要么通過窮舉求出問題的所有約簡或所有最小約簡。

本文重新定義了屬性重要度,給出了條件屬性集上的序關系,基于該序關系構建集合枚舉樹,提出了一種基于集合枚舉樹的最小屬性約簡算法。該算法采用至頂向下、層優先搜索策略遍歷集合枚舉樹從而找到最小屬性約簡。為了減少搜索空間,提高算法效率,該算法采用了兩種剪枝策略剪去集合枚舉樹中冗余節點。一種剪枝方法是父集剪枝,如果一個集合的父集不是屬性約簡,則該集合一定也不是屬性約簡,該策略是通過提前停止集合枚舉樹的構造而對樹剪枝。另一種剪枝方法是屬性核剪枝,因為所有的屬性約簡都包含核屬性,從而可以剪去集合枚舉樹中不含核屬性的節點。最后,優化計算確保同一集合的正域只求解一次。

1 粗糙集的相關概念

對于決策表 S=(U,C,D,V,f),U 是論域,C是條件屬性的集合,D是決策屬性集合,V是屬性值的集合,f:U× (C∪D)→V是信息函數,U、C、D和V都是非空有限集且C ∩ D=。表1為某一決策表,且C={a,b,c,d},D={e}。

圖1 集合{c,a,b,d}所對應的集合枚舉樹

表1 某一決策表

定義1 在決策表 S=(U,C,D,V,f)中,?R?C,決策屬性 D的 R正域 POSR(D)定義為 POSR(D)=∪{Y∈U/R: Y∈U/D}。

定義2 設 S=(U,C,D,V,f)是一個決策表,P∈C,如果 POSC-{a}(D)=POSC(D),則稱a是C中不必要的(多余的)屬性;否則,稱a是C中必要的屬性。

定義3設S=(U,C,D,V,f)是一個決策表,條件屬性集C中所有必要的屬性組成的集合,稱為屬性集C的核,記作Core(C)。

定義4 設 S=(U,C,D,V,f)是一個決策表,B?C是一個屬性子集,如果滿足

則稱B是C的一個約簡。

2 屬性集上的序關系

屬性重要度標示了屬性在決策表中的重要性,粗糙集傳統的屬性重要度定義只區分屬性對正域變換的影響,而沒有考慮屬性對于知識粒大小的影響,因此,結合這兩方面考慮重新定義了屬性重要度。

定義5 設 S=(U,C,D,V,f)是一個決策表,B?C是一個屬性子集,屬性集B的重要度為:

定理1 ?a∈C,如果Sig({a})>1,那么a∈Core(C)。

證明根 據 定 義5可 知 ,Sig({a})=(|POSC(D)|-由于0<|U/{a}|/||U ≤1,那么|POSC(D)|-|POSC-{a}(D)|>0,也即是說 POSC(D)≠POSC-{a}(D)。所以,屬性a是必要屬性。

定義 6 設 S=(U,C,D,V,f)是一個決策表,n=|C|。基于屬性重要度定義條件屬性集C上的序關系“?”,從而可獲得條件屬性集C上的一個序列:a1?a2?…?an,表示為Ordered(C)={a1,a2,…,an}, 則有 Sig({a1})≥ Sig({a2})≥… ≥Sig({an})。

3 集合枚舉樹

用圖1所示的集合枚舉樹[15]來描述條件屬性子集,通過枚舉出所有的條件屬性組合,使得求解最小屬性約簡的過程變成集合枚舉樹的搜索過程。圖1表示了表1條件屬性的集合枚舉樹,C={a,b,c,d}。樹的每個節點由兩部分組成,第一部分稱為首(head),記做h(node),由枚舉樹中當前節點的枚舉屬性集組成;第二部分稱為尾(tail),記做t(node),由當前節點的子節點的所有屬性除去當前節點后所包含的屬性排序而成。當前節點n的子節點nc生成方法為:h(nc)=h(n)∪{i},i∈ t(n);t(nc)={j|j∈t(n),i? j}。例如:對于節點 <{c},{a,b,d}>而言,有三個子節點 <{c,a},{b,d}>,<{c,b},g0gggggg> 和 <{c,d},? > 。

4 最小屬性約簡算法

為了找到決策表最小屬性約簡,采用簡單的至上而下、層次優先搜索算法搜索集合枚舉樹,其搜索空間近似為條件屬性冪集。為了減少搜索空間,提高算法效率,必須采用一定的剪枝策略。

4.1 屬性核剪枝

因為所有的決策表屬性約簡必須包含屬性核,所以可以剪去集合枚舉樹中不包含屬性核的節點,如圖1中的節點 <{a},{b,d}>等,因為它沒有包含屬性核{c}。根據屬性核剪枝方法,可使集合枚舉樹的初始root節點為<Core(C),C-Core(C)>,從而圖1所示集合枚舉樹可剪枝為圖2所示的集合枚舉樹。

圖2 圖1剪去不含核屬性{c}后的集合枚舉樹

4.2 父集剪枝

眾所周知,若集合B(B?C)不是決策表的屬性約簡,則其任意子集都不是決策表屬性約簡。在集合枚舉樹中,若非葉子節點的h(node)∪t(node)不是決策表的一個屬性約簡,則可從集合枚舉樹中剪去以<h(node),t(node)>為根節點的子樹。

4.3 優化計算

根據集合枚舉樹的定義可知,非葉子節點和其最左邊子樹根節點的h∪t(節點首并節點尾)是相同集合,如<{c,a},{b,d}> 和其最左邊子樹根節點 <{c,a,b},g0gggggg>,那么在父剪枝策略中,存在對同一個集合多次計算其正域是否等于POSC(D)。優化計算就是確保同一集合的正域只計算一次,從而提供算法效率。

5 算法描述及其偽代碼

算法描述:函數 getSubNodes(Candidate Group g,Set of Candidate Group G)的功能是,若g是一葉子節點且其首h(g)的正域等于 POSC(D),則節點g的首h(g)是決策表一最小約簡;否則返回節點g的所有子節點。

6 實驗結果

表2展現了核剪枝和父集剪枝減少算法搜索空間,同時也展示了優化計算提高算法的求解效率。該實驗是基于Microsoft Visual C++6.0開發平臺,操作系統Windows XP,CPU:Pentium III 1.73 MHz,內存768 MB仿真實現。

7 結束語

表2 基于UCI數據庫仿真結果

本文提出了一種基于集合枚舉樹的最小屬性約簡完備算法,該算法把屬性約簡的計算問題轉化為對集合枚舉樹的搜索式問題,以直觀形象的方法展現了屬性約簡的過程,為屬性約簡問題的求解提供了一條新的途徑。該算法提出了核和父集剪枝策略有效地減少了算法搜索空間;同時,基于優化計算提高了算法的運行效率。

[1]Pawlak Z.Rough sets[J].InternationalJournalofComputer and Information Science,1982,11(5):341-356.

[2]SlowinskiR.Intelligentdecision support——handbook of applications and advances of the rough sets thorey[M].London:Kluwer Academic Publishers,1992.

[3]Wong S K M,Ziarko W.On optional decision rules in decision tables[J].Bulletin of Polish Academy of Sciences,1985,33(11/12):693-696.

[4]Jelonek J.Rough set reduction of attributes and their domains forneuralnetworks[J].ComputationalIntelligence,1995,11(2):339-347.

[5]Wang Jue,Miao Duoqian.Analysison attributereduction strategiesofrough set[J].JofComputSci& Technol,1998,13(2):189-193.

[6]苗奪謙,胡桂榮.知識約簡的一種啟發式算法[J].計算機研究與發展,1999,36(6):681-684.

[7]楊明,倪魏偉,孫志揮.一種新穎的最小屬性約簡模型[J].東南大學學報:自然科學版,2004,34(5):604-608.

[8]劉文軍,王加銀,馮艷賓,等.一種求粗糙集中最小屬性約簡的新算法[J].北京師范大學學報:自然科學版,2004,40(1):8-12.

[9]廖建坤,葉東毅.基于免疫粒子群優化的最小屬性約簡算法[J].計算機應用,2007,27(3):550-552.

[10]Krysziewicz M,Lasek P.Fast discovery of minimal sets of attributes functionally determining a decision attribute[C]// InternationalConference on Rough Sets and Intelligent Systems Paradigms,2007:320-331.

[11]蔣瑜,王燮,葉振.基于差別矩陣的Rough集屬性約簡算法[J].系統仿真學報,2008,20(14):3717-3720.

[12]Song Xiaoyu,Chang Chunguang,Liu Feng.Rough set theory based reduction algorithm fordecision table[C]//Proceedingsofthe 2009 InternationalConference on Machine Learning and Cybernetics,2009:2318-2323.

[13]Pawlak Z.Rough set-theoretical aspects of reasoning about data[M].Boston:Kluwer Academic Publishers,1991.

[14]張文修,吳偉志,梁吉業,等.粗糙集理論與方法[M].北京:科學出版社,2001.

[15]Rymon R.Search through systematic set enumeration[C]// Proc of 3rd Int’l Conf on Principles of Knowledge Representation and Reasoning,1992:539-550.

基于集合枚舉樹的最小屬性約簡算法

蔣 瑜

The purpose of this paper is to present an effective approach to achieve minimal attribute reduction.To achieve this goal,in this paper,it introduces a set-enumeration search tree by using total sequence over condition attribute set,and proposes a minimal attribute reduction algorithm,which uses the top-down level-first traversal to search set-enumeration search tree and guarantee that reduction discovered by it is a minimal reduction.To realize performance gains,this algorithm uses core and superset pruning to reduce search space,and uses optimal computing to guarantee that positive region of the same set only computes one time for reducing computing time.The experimental results with UCI data show that the proposed algorithm is effective.

rough set;minimal reduction;set enumeration search tree;attribute significance;pruning

為了尋找一種有效的最小屬性約簡方法,給出了條件屬性集上的屬性重要度序關系,基于此序關系構建了屬性集上的集合枚舉樹,提出了一種快速的最小屬性約簡算法,該算法采用至上而下、層次優先策略搜索集合枚舉樹尋找屬性最小約簡。為了提高算法性能,該算法采用核和父集剪枝策略減少搜索空間,采用優化計算來確保同一集合的正域只計算一次。基于UCI數據的實驗結果表明,該算法是有效的。

粗糙集;最小約簡;集合枚舉樹;屬性重要度;剪枝

A

TP311

10.3778/j.issn.1002-8331.1111-0416

JIANG Yu.Minimal attribute reduction for rough set based on set enumeration search tree.Computer Engineering and Applications,2013,49(11):101-104.

蔣瑜(1980—),男,講師,主要研究方向為粗糙集理論與數據挖掘。E-mail:jiangyu@cuit.edu.cn

2011-11-23

2012-01-10

1002-8331(2013)11-0101-04

CNKI出版日期:2012-04-25 http://www.cnki.net/kcms/detail/11.2127.TP.20120425.1719.034.html

猜你喜歡
定義
以愛之名,定義成長
活用定義巧解統計概率解答題
例談橢圓的定義及其應用
題在書外 根在書中——圓錐曲線第三定義在教材和高考中的滲透
永遠不要用“起點”定義自己
海峽姐妹(2020年9期)2021-01-04 01:35:44
嚴昊:不定義終點 一直在路上
華人時刊(2020年13期)2020-09-25 08:21:32
定義“風格”
成功的定義
山東青年(2016年1期)2016-02-28 14:25:25
有壹手——重新定義快修連鎖
修辭學的重大定義
當代修辭學(2014年3期)2014-01-21 02:30:44
主站蜘蛛池模板: 99人妻碰碰碰久久久久禁片| 国产一区二区三区日韩精品 | 亚洲伦理一区二区| 在线欧美国产| 日韩一区二区在线电影| 天天做天天爱天天爽综合区| 国产三级国产精品国产普男人| 国产精品久久国产精麻豆99网站| 无码网站免费观看| 亚洲av日韩av制服丝袜| 老司国产精品视频91| 国产精品夜夜嗨视频免费视频| 国产区免费| 国产一区三区二区中文在线| 色天天综合| 欧美成人免费一区在线播放| 免费国产无遮挡又黄又爽| 亚洲综合精品第一页| 原味小视频在线www国产| 无码专区国产精品一区| 日韩在线播放欧美字幕| 亚洲国产精品日韩专区AV| AV不卡无码免费一区二区三区| 四虎成人免费毛片| 国产97色在线| 久青草免费在线视频| AⅤ色综合久久天堂AV色综合 | 亚洲成人在线网| 亚洲免费黄色网| 亚洲国产天堂久久九九九| 国产精品成人免费视频99| 国产视频久久久久| 国产精品男人的天堂| 99成人在线观看| 毛片在线看网站| 国产91全国探花系列在线播放| 色悠久久久久久久综合网伊人| 天天摸夜夜操| 国产精品亚洲天堂| 重口调教一区二区视频| 天天综合天天综合| 巨熟乳波霸若妻中文观看免费 | 超薄丝袜足j国产在线视频| 中文字幕欧美日韩| 婷五月综合| 无码福利视频| 亚洲AV无码久久精品色欲| 亚洲成人精品| 国产成人欧美| 午夜a视频| 亚洲无码视频一区二区三区| 国产乱子伦手机在线| 午夜精品一区二区蜜桃| 一级片免费网站| 波多野结衣中文字幕一区| 最新国产麻豆aⅴ精品无| 91精品国产91久无码网站| 老司机精品99在线播放| 亚洲国产成人自拍| 色精品视频| 思思热精品在线8| 大乳丰满人妻中文字幕日本| 欧美亚洲一区二区三区导航| 日韩午夜片| 无码AV动漫| 日本欧美精品| 国产麻豆精品久久一二三| 99久久99视频| 在线观看亚洲精品福利片| 重口调教一区二区视频| 天堂成人av| 国产靠逼视频| 国产精品福利导航| 国产99在线| 久久96热在精品国产高清| 国产一区二区三区日韩精品 | 亚洲欧美在线综合一区二区三区 | 午夜电影在线观看国产1区| 91麻豆国产在线| 婷婷丁香在线观看| 青青青草国产| 少妇露出福利视频|