999精品在线视频,手机成人午夜在线视频,久久不卡国产精品无码,中日无码在线观看,成人av手机在线观看,日韩精品亚洲一区中文字幕,亚洲av无码人妻,四虎国产在线观看 ?

基于rough sets的不完備數據分析研究

2011-01-31 15:38:54趙東陽
科學之友 2011年12期
關鍵詞:數據挖掘規則分類

趙東陽

(魯東大學信息科學與工程學院,山東 煙臺 264025)

1982年,波蘭數學家Pawlak等人首次提出了粗糙集理論,粗糙集理論的主要思想是在保持知識庫分類能力不變的前提下,導出問題的決策和分類規則。粗糙集理論自身的特點和優勢使其在數據挖掘方面獲得了巨大的成功,在數據挖掘和數據庫知識發現等研究領域正在扮演越來越重要的角色,逐漸成為該領域研究的重要分支。

1 不完備信息系統RS處理方法

Pawlak所提出的RS理論是面向完備信息系統的,在面對某些不完備系統時,必須對 RS理論的基本概念進行必要的擴充,以使其能夠對這些系統進行直接處理。擴充法是一種直接處理方法,也是研究不完備信息系統的最有效的方法。

1.1 容差關系

在“遺漏”語義下處理不完備信息系統而定義的一種二元關系即容差關系。每個個體對象都具有潛在的完備信息,而當前只是遺漏了這些值,于是由于這些不精確的知識迫使人們去處理只有部分信息的不完備信息表。

1.2 非對稱相似關系

由Stefanow ski 等人提出的面向不完備信息系統的相似關系則是基于對“缺失值”語義的如下理解:一個屬性的缺失值不僅可能由于現有知識的不精確,還可能因為它根本就不能用現有的屬性值來描述。因此相似關系中不允許比較缺失值,不完備信息系統S=(U,A)上的相似關系定義S為:

顯然,相似關系S是不對稱的,實質上是一種包含關系的表示,因為只要滿足“x的描述”包含于“y的描述”就可以認為“x相似于y”。

1.3 限制容差關系

王國胤教授將容差關系和相似關系看作是對不可分辨關系擴充的兩個極端,因為容差關系的條件太寬松,易于將根本沒有相同已知屬性信息的實例誤分到同一個容差類;而相似關系卻可能將具有很多相同關系一直屬性信息的實例分到不同的相似類。因此,王國胤教授提出了一種介于這兩種極端擴充之間的限制容差關系——限制容差關系的粗糙集模型。該模型是基于容差關系與基于非對稱相似關系粗糙集模型的改進。

1.4 量化容差關系

為了進一步刻畫容差關系和相似關系中兩個實例之間的“相似”程度,Stefanow ski等人提出了基于量化容差關系的擴充 RS理論模型。通過應用不同的比較規則可以得到不同類型的量化容差關系。給定一個量化容差關系,對論域U中的每個實例,Stefanow ski定義了“容差類”的概念,它是一個用關于參考元素的“容差度”作為成員函數的模糊集。量化容差關系著重于對存在容差關系或相似關系的實例之間的“容差(或相似)程度”進行進一步的細化,其研究思路是自然、正確的。

2 屬性約簡

數據挖掘要處理的初始信息系統中經常包含大量的無關或冗余屬性,這些屬性的存在不僅會阻礙挖掘進程,而且會降低最終挖掘知識的正確性和精簡度。RS理論中將刪除信息系統中的無關或冗余屬性的過程稱作屬性約簡。通過屬性約簡最終得到的屬性集成為信息系統的一個約簡(Reduct),它是保持原始決策表中條件屬性和決策屬性的依賴關系不發生變化的最小屬性集合。由于求取一個決策表的所有約簡是一個 NP問題,通常在實際應用中很難實現。因此 Liang等人提出了一種不完備信息系統中求取屬性約簡的啟發性算法。對數據進行屬性約簡的意義,主要從以下幾個方面考慮:①從機器學習的角度來看,屬性約簡對于去除噪聲非常有意義;②對一些學習算法而言,訓練或分類時間隨著數據維數的增加而增加,經過屬性約簡可以降低計算復雜度,減少計算時間;③假如不進行屬性約簡,噪聲或不相關屬性和期望屬性對分類的作用一樣,就會對最終結果產生負面影響;④當用較多的特征來描述數據時,數據均值將表現得更加相似,難以區分。

3 規則抽取

使用 RS理論進行數據挖掘,其最終獲得的知識是以規則的形式給出的。規則抽取是數據挖掘中最重要和最關鍵的一步,它是指從經過處理的決策表中抽取出以規則形式表示的知識。目前用于分類問題的方法主要分為兩類:符號方法和連接主義方法。符號方法是基于決策樹、粗集理論等技術,得到的分類知識以分類規則的形式出現;而連接主義方法則以神經網絡為代表,其知識蘊含在結構中不易為人所理解,因此一度被人們認為不適合進行數據挖掘。然而由于神經網絡在分類問題中具有分類精度高、魯棒性好等優點,很多研究者都致力于從神經網絡中抽取分類規則。神經網絡的基本思路是基于搜索的算法,對于任一給定的隱結點或輸出結點,先提取符號規則,然后對生成的規則按網絡的傳導途徑進行連接和整理。有的文獻提出了一種從訓練后的三層前饋網絡中抽取分類規則的方法。該方法首先對每個隱層結點的輸出值進行離散化;然后分別導出隱層結點與輸出層結點之間的規則(規則集 1)和輸入層結點與隱層結點之間的規則(規則集2);最后將兩部分規則進行合并得到最終的分類規則。總之,從神經網絡中抽取規則是一個復雜的過程,這其中隱結點的離散化過程不僅繁瑣,而且易丟失信息。另外,當數據量增多、網絡規模變大時,網絡訓練和規則抽取的時間代價將會非常大。

1 陳珂、宣仲良.一種基于粗糙集理論的 ROUSTIDA改進算法[J].電腦與信息技術,2008(3):32~33.

2 朱小飛、卓麗霞.一種基于量化容差關系的不完備數據分析方法[J].重慶工學院學報,2005(5):23~24.

猜你喜歡
數據挖掘規則分類
撐竿跳規則的制定
數獨的規則和演變
分類算一算
探討人工智能與數據挖掘發展趨勢
分類討論求坐標
數據分析中的分類討論
讓規則不規則
Coco薇(2017年11期)2018-01-03 20:59:57
教你一招:數的分類
基于并行計算的大數據挖掘在電網中的應用
電力與能源(2017年6期)2017-05-14 06:19:37
TPP反腐敗規則對我國的啟示
主站蜘蛛池模板: 99久视频| 亚洲欧洲一区二区三区| 亚洲精品不卡午夜精品| 大香网伊人久久综合网2020| 白浆免费视频国产精品视频| 中文字幕永久在线观看| 免费看美女自慰的网站| 久久精品无码一区二区日韩免费| 亚洲日韩第九十九页| 日本黄色不卡视频| 日韩欧美国产三级| 制服丝袜 91视频| 国产女人在线| 亚洲中文字幕在线一区播放| 亚洲欧美另类久久久精品播放的| 亚洲欧美人成人让影院| 中文字幕资源站| 久久久久久久蜜桃| 在线免费不卡视频| 国产成人凹凸视频在线| 亚洲天堂2014| 91精品免费高清在线| 日本爱爱精品一区二区| 91香蕉国产亚洲一二三区| 日本欧美一二三区色视频| 国产91麻豆免费观看| 欧美一级一级做性视频| 久热精品免费| 久久9966精品国产免费| 精品无码人妻一区二区| 成人福利在线视频免费观看| 亚洲欧美另类日本| 免费Aⅴ片在线观看蜜芽Tⅴ | 美女一级毛片无遮挡内谢| 国产成人精品视频一区二区电影| 亚洲乱码视频| 成人免费视频一区| 国内精品91| 日日摸夜夜爽无码| 国产污视频在线观看| 国产精品午夜福利麻豆| 老司机午夜精品网站在线观看| 国产美女一级毛片| 久久这里只有精品23| 人妻精品久久无码区| 国产成人一区| 国产一区在线视频观看| 国产成人精品日本亚洲| 最新午夜男女福利片视频| 日韩国产 在线| 国产三级韩国三级理| 欧美日本在线一区二区三区| 亚洲 欧美 中文 AⅤ在线视频| 亚洲精品国偷自产在线91正片| 国产成人精品男人的天堂| 国产欧美性爱网| 国产激情无码一区二区免费| 高清无码一本到东京热| 亚洲人免费视频| 亚洲精品午夜天堂网页| 国产欧美精品午夜在线播放| 性网站在线观看| 亚洲综合片| 欧洲极品无码一区二区三区| 亚洲性视频网站| 国产精品免费露脸视频| 在线观看网站国产| 日韩美毛片| 国产精品男人的天堂| 91国内在线视频| 国产亚洲欧美日韩在线观看一区二区| 四虎永久在线| 国产精品毛片一区| 亚洲,国产,日韩,综合一区| 88av在线看| 久久免费观看视频| www精品久久| 欧美不卡在线视频| 欧美日本在线观看| 国产在线自在拍91精品黑人| 午夜少妇精品视频小电影| 国产主播喷水|