知識庫中的知識(屬性)并不是同等重要的,其中某些知識是冗余的,這不利于有效地作出正確簡潔的決策。所謂屬性約簡,就是在保持知識庫分類能力不變的條件下,刪除其中不相關或不重要的屬性。人們總期望找到最小的屬性約簡,但這已經被證明是一個NP-hard問題。現有的信息系統的約簡算法,主要有基于屬性重要度的屬性約簡算法、基于差別矩陣的屬性約簡算法、基于信息熵的屬性約簡算法。但隨著計算機和數據采集技術的進步,數據的積累無論是在數據對象個數上還是在數據維度上都在以無法估算的速度迅速增長,由于這些算法的非并行性,它們會隨著數據規模的增大越來越復雜。