近年來,數據挖掘已經成為在數據中提取有用信息的普遍方法。然而對于財政交易、健康卡幾率、電話通信等工業應用,很多個人細節和敏感信息都包含在這些數據中。從這些數據中提取知識會無意揭露個人的敏感信息,所以隱私保護在數據挖掘的領域里就變得越來越重要??紤]表1中的醫院數據集,如果李明知道有一個人年齡為32歲,并且知道這個人是遼寧省工作的程序員,那么即使不透露姓名。李明也可以從表1中推斷出這個人是張強且知道他得了高血壓。工作,省份,年齡,這些可以推斷病人信息的屬性叫準標志符,而屬性疾病被稱為敏感信息。被全部修改的數據集如表2所示。