摘要:粗糙集理論和D-S證據理論都是重要的不確定性推理方法,兩者各有優缺點。現實生活中,不完備信息系統廣泛存在。研究了將兩種理論結合用于不完備信息系統以進行規則提取,并用實例進行了驗證。
關鍵詞:不完備信息系統; 決策表; 粗糙集; 證據理論
中圖分類號:TP18文獻標志碼:A
文章編號:1001-3695(2007)07-0067-02
作為數據挖掘的一種方法,粗糙集理論近年來得到了計算機研究領域的廣泛關注和青睞。該理論20世紀80年代初由波蘭數學家Z.Pawlak[1]首先提出,是一個分析數據的數學理論。其主要思想是:在保持信息系統分類能力不變的前提下,通過知識約簡導出問題的分類或決策規則。
證據理論是研究認識不確定性問題的另一種理論,該理論于1976年由Shafer正式創立。另一位為證據理論作出重大貢獻的是A.P.Dempster,他給出了上、下概率的概念,第一次明確給出了不滿足可加性的概率。
粗糙集理論和其他處理不確定性問題理論的顯著區別是,它無須提供問題所需處理的數據集合之外的任何先驗信息;而且,該理論和其他處理不確定性問題的理論有很強的互補性。D-S證據推理方法不需要先驗信息,而且在不確定問題的求解中有很大優勢;但它也存在許多缺點,如需要對基本概率分配進行假設,證據組合引起的焦元爆炸、證據基本概率指派確定的主觀性等,限制了它的使用范圍。因此,可以考慮將兩種理論結合使用以互相取長補短。
1不完備信息系統
6結束語
在現實生活中,不完備信息系統廣泛存在,因此對于不完備信息系統中的知識發現和規則提取具有很強的現實意義。本文嘗試用兩種處理不確定性問題的理論對不完備信息系統下的規則提取進行研究,并用實例驗證了該方法提取的規則都是最優決策規則。
參考文獻:
[1]PAWLAK Z. Rough sets: theoretical aspects of reasoning about data[M]. Dordrecht: Kluwer Academic Publishers, 1991:89-95.
[2]張文修,吳偉志,梁吉業,等.粗糙集理論與方法[M].北京:科學出版社,2001.
[3]張睿,梁吉業.不完備決策表的一種知識約簡算法[J].計算機應用研究,2004,21(10):22-23.
[4]張睿,梁吉業.證據理論在不完備信息系統中的應用[J].電腦應用與開發,2004,17(4):2-4.
[5]ANAND S S, BELL D A, HUGHES J G. EDM: a general framework for data mining based on evidence theory[J]. Data Knowledge Engineering, 1996,18(3):189-223.
[6]黃鯤,陳森發,周振國,等.基于粗集理論和證據理論的多源信息融合方法[J].信息與控制,2004,33(4):422-425.
[7]LIANG Jiye, XU Zongben. The algorithm on knowledge reduction in incomplete information systems[J]. International Journal of Uncertainty, Fuzziness and Knowledge-based Systems, 2002,10(1):952-1103.
[8]DEMPSTER A P. Upper and lower probability inferences based on a sample from a finite univariate population[J].Biometrika, 1967,54(3):515-528.
[9]SHAFER G. A mathematical theory of evidence[M].[S.l.]: Princeton University Press, 1976.
注:“本文中所涉及到的圖表、注解、公式等內容請以PDF格式閱讀原文”