摘要:闡明了變精度粗糙集模型中,經典粗糙集模型分類質量、相對正域、決策類下近似不再具有非單調遞減特征,在約簡過程中分類質量和相對正域會出現跳躍現象,約簡過程具有不穩定性;但決策類下近似不會出現跳躍現象,可以得到穩定的約簡過程;并且三者之間打破了在經典粗糙集模型中的等價性,需要針對三者分別建立模型,使屬性約簡變得多樣化。
關鍵詞:變精度粗糙集; 非單調遞減; 跳躍現象
中圖分類號:TP301文獻標志碼:A
文章編號:1001-3695(2007)07-0010-03
0引言
自波蘭數學家Pawlak提出粗糙集(RS)理論[1]以來,它已被廣泛應用于模式識別、機器學習、知識獲取、人工智能、經濟預測等領域[2,3]。實踐應用及開發粗糙集挖掘軟件表明,經典粗糙集理論存在一些局限[4,5] 。對此,研究者結合其他軟計算理論方法對經典粗糙集理論模型進行了不同的擴展[3,6,7]。Ziarko教授于1993年提出的變精度粗糙集(VPRS)模型[4]是其中一個重要分支。
RS模型約簡過程中,隨著屬性數目減少、條件等價類粒度的增大,分類質量、相對正域和每個決策類下近似都呈非單調遞減變化,且三者變化保持一致。這種非單調特征在屬性約簡過程中發揮著重要作用,通過約去屬性前后分類質量是否發生變化就可以判定屬性是否可約。VPRS理論中,包含度β的引入使得分類質量、相對正域和每個決策類下近似不再呈非單調遞減變化,其變化過程異常復雜,屬性約簡變得多樣化。
1VPRS基本知識
2分類質量
分類質量反映了給定條件屬性集對決策表分類能力的大小。約簡的本質就是保持約簡前后分類能力不發生變化,不增加對象間新的不一致性。RS理論中,分類質量隨著條件數目的減少呈非單調下降變化,約簡過程具有穩定性,即一旦分類質量減小,則分類能力發生變化,不能與原決策表分類能力再保持一致[1,2]。VPRS理論中分類質量變化不再是非單調下降變化,約簡過程中會出現跳躍(或稱為反復)現象。
3相對正域
在RS理論中,相對正域的變化隨著屬性數目的減少呈非單調遞減變化,即約簡屬性后的相對正域包含于約簡前相對正域中,且其變化與分類質量變化保持一致,分類質量不變等價于相對正域保持不變。
同時,從表2與4的分析對比可以發現,表2中當約去屬性{a5,a4,a3}后,雖然分類質量保持不變,但是β相對正域已經發生了改變。說明保持分類質量不變與保持β相對正域不變不再等價,分類質量保持不變時可能意味著β相對正域已經發生了改變。
4決策類下近似
RS理論中,隨著條件屬性數目減少,等價類粒度增大,對任意決策類,其約簡后的下近似包含于約簡前的下近似中,即每個決策類的下近似同樣具有非單調遞減特征。并且保持分類質量不變與保持相對正域不變、決策類下近似分布DP不變三者之間互相等價,即有約去屬性前后:
定理1說明,VPRS理論中約去屬性后,保持每個決策類下近似不變時,β相對正域和分類質量都將不發生變化。反之,由表2、4分析,如果保持約簡前后分類質量不變,對于β相對正域、決策類下近似分布DP可能已經發生改變,RS理論中的等價性不再成立,三者之間只具有向上兼容,而不具有向下兼容,有
決策類下近似分布DP不變β相對正域不變分類質量γ不變
5屬性約簡
如果一個屬性不可約,它在整個約簡過程中都是不可約的,與約去屬性之間的次序無關,即不受其他屬性的影響,約簡過程具有穩定性。而在VPRS模型中,分類質量γ、 β相對正域和決策類下近似分布DP三者變化不再等價。因此屬性可約的定義不能建立統一的模型,需要針對三者分別建立模型,屬性可約性的判定變得多樣化。
由于非單調遞減特征的打破,跳躍現象的出現,通過約簡前后分類質量或者β相對正域變化不能判定一個屬性是否可約,約簡過程具有不穩定性,一個屬性是否可約受其他屬性的影響。如對表2的分析中,約去屬性a4后,分類質量發生了改變,不能就此斷定a4不可約。因為繼續約去屬性a3后,分類質量又保持與原表相同,屬性a4又可以約去。表4分析中,屬性a4出現了類似的情況。通過分類質量和β相對正域判定屬性可約性檢驗約去該屬性后剩余屬性集的所有非空子集情況。
雖然決策類下近似分布DP隨著條件屬性數目的減少打破了非單調遞減特征,但定理2保證了其在約簡過程中不會出現跳躍現象,可以得到穩定的約簡過程,即一個屬性是否可約不受其他屬性的影響。這與經典粗糙集模型相同。
6結束語
RS模型中,分類質量γ、相對正域、決策類下近似分布DP隨著屬性數目的減少,都呈非單調遞減變化,且三者的變化均互相等價,這使得可以建立統一的屬性約簡模型。VPRS模型,由于包含度β的引入,使得模型變得比RS復雜。隨著屬性數目的減少,分類質量γ和β相對正域不再具有非單調遞減的特征,在變化過程中會出現跳躍現象,依照兩者不能得到穩定的約簡過程。雖然決策類下近似分布DP同樣打破了非單調遞減的特征,但是約簡過程中不會出現跳躍現象,可以得到穩定的約簡過程,這與RS模型一致。VPRS模型分類質量γ、β相對正域、決策類下近似分布DP三者只具有向上兼容,而不具有向下兼容,三者變化不再等價,故針對三者可分別建立合理的模型。這需要作進一步的研究與探討。
參考文獻:
[1]PAWLAK Z. Rough sets[J].International Journal of information and Computer Science,1982,11(5):314-356.
[2]PAWLAK Z. Why rough sets: proc.of the 5th IEEE International Conference on Fuzzy Systems[C]. New Orleans:IEEE,1996:738-743.
[3]胡可云,陸玉昌,石純一.粗糙集理論及其應用進展[J].清華大學學報:自然科學版,2001,41(1):64-68.
[4]ZIARKO W. Variable precision rough sets model[J]. Journal of Computer and System Sciences, 1993,46(1):39-59.
[5]BEYNON M. Reducts within the variable precision rough sets model: a further investigation[J]. European Journal of Operational Research, 2001,134(3):592-605.
[6]張文修,吳偉志.粗糙集理論介紹和研究綜述[J].模糊系統與數學,2000,14(4):1-12.
[7]米據生,吳偉志,張文修.基于變精度粗糙集理論的知識約簡方法[J].系統工程理論與實踐,2004,24(1):76-81.
注:“本文中所涉及到的圖表、注解、公式等內容請以PDF格式閱讀原文”