出于研究和統計分析等目的,大量組織和機構往往需要發布一些個人數據,如醫療信息表、人口普查信息等。伴隨數據庫、網絡和計算技術的快速發展,使得大量個人數據能夠被收集和分析。大量數據信息的存在導致了數據挖掘工具的廣泛使用,同時也使得個人對隱私保護有了極大的關注。在美國,…項研究表明,通過準標志屬性的集合,如出生地、性別和住址等和一些公開可用的數據庫如選民數據庫、民意調查數據庫等進行鏈接,87%的公民可以被唯一地識別。顯然,傳統的數據隱私保護方法根本不能阻止攻擊者通過準標志屬性推測目標個體的隱私信息。如何在發布個人數據的同時保證個人的隱私信息不被泄露已經成為眾多學者關注的問題。其中k-匿名模型思想直觀簡單,能夠在數據質量和隱私保護之間進行折中,成為解決隱私保護的重要模型。