在海量信息系統中,其屬性和實例數量非常巨大,人們經常關心的只是蘊涵在數據當中的潛在知識,以及如何從海量的數據中獲取有用的信息。因此,在保持信息系統分類和決策能力不變的前提下,對信息系統進行數據約簡就變得非常必要。通過數據約簡,獲得精簡的規則庫以幫助人們作出正確且簡潔的決策。數據約簡是粗糙集理論(rough set theory)研究的核心內容之一,約簡包括屬性約簡和值約簡。屬性約簡是在不影響信息系統分類和決策的情況下,刪除冗余的條件屬性。對于屬性約簡后的決策信息系統,并不是表達每條記錄的所有條件屬性值都是必需的,因此有必要對其進行值約簡,刪除決策信息系統中所有不影響規則表達的冗余的條件屬性值,最終獲得精簡的規則庫。