摘要:粗糙集理論中要求離散化保持原有決策系統的不可分辨關系,但以往的一些算法在離散過程中會使近似精度控制在可以接受的范圍,即允許一定的錯分。針對此不足,在保證決策屬性絕對不改變的情況下,提出一種新的區間拆分方法,更合理有效地對連續屬性進行離散化。實驗通過C4.5和支持向量機分別對離散化后的數據進行識別與分類預測,實驗結果證明了算法的有效性。
關鍵詞:連續屬性離散化;粗糙集;決策表;離散區間;數據挖掘
中圖分類號:TP18文獻標志碼:A
文章編號:1001-3695(2010)01-0077-02
doi:10.3969/j.issn.10013695.2010.01.022