王 紅,葛麗娜,王蘇青,王麗穎,張翼鵬,梁竣程
(1.廣西民族大學 信息科學與工程學院,南寧 530006; 2.廣西民族大學 東盟研究中心(廣西科學實驗中心),南寧 530006; 3.深圳市億威爾信息技術股份有限公司,廣東 深圳 518000; 4.廣西廣播電視信息網絡股份有限公司,南寧 530006)(*通信作者電子郵箱66436539@qq.com)
隨著網絡技術的發展,信息量呈現爆炸式的增長,如何收集、管理、分析和發布數據成為信息技術研究的重點。目前,以機器學習和數據挖掘為基礎的高級數據分析處理技術,使得在分析、使用數據上更加方便,但對于數據發布者來說,不經過任何處理隨意將有關用戶的敏感信息進行發布,將給用戶帶來不可預測的后果。近年來的信息安全事件頻繁發生,從QQ號碼被盜取、手機下載帶有病毒性的APP到電子銀行錢財的丟失,不少不法分子利用安全漏洞以及用戶敏感信息的泄露,給用戶造成了很大的困擾和損失,這就要求信息安全領域加強隱私信息保護的力度,給公眾用戶一個安全的網絡平臺。而最早的匿名隱私保護技術需要特殊的背景攻擊假設,一旦攻擊者掌握足夠相關信息,便容易出現鏈接攻擊和背景攻擊。Dwork[1]定義了及其嚴格的ε-差分隱私保護模型:即使攻擊者已經知道除一條記錄外的所有記錄的敏感屬性,仍然無法推斷出有關這條記錄的任何敏感屬性,通過添加隨機噪聲便能夠對用戶的敏感信息進行保護,同時保持添加過噪聲后的數據的統計性和屬性不變。……