楊文娟
摘 要:網絡社交中數據傳輸便捷性、共享性,增加了隱私信息保護的困難性,差分隱私技術因能夠低于攻擊者全部背景知識,而備受關注。為此,文章針對非交互式的場景下,基于隱私保護及數據可用性的雙重需求,針對數據的屬性分類,分別引入Laplace機制及指數機制,通過噪聲添加實現差分隱私保護;并基于數據可用性,利用改進的LWSPA查詢結構序列的分割,降低向量溫度,控制發布數據集的誤差,以優化數據可用性,以此建構的差分隱私保護機制,能夠實現隱私保護與數據可用的均衡發展。
關鍵詞:差分隱私;Laplace機制;隱私保護;數據效用
0 引言
目前,大數據時代驅動下微博、微信等各類網絡社交平臺層出不窮,這些平臺集成和存儲了海量的數據信息,為人們信息交互、共享提供了多元化的網絡空間。但網絡虛擬性、高效傳播性,讓諸多發布出來的個人信息暴露出來,使得隱私泄密問題日漸嚴峻。因此如何在保有網絡社交便捷性同時,保護隱私是關注的焦點。就目前隱私保護技術的發展而言,可大致歸為基于聚類、基于網絡結構修改等2類。其中,前者是以既定的規則將節點分為不同的組,而后,將所有組的節點組成的子圖,以匿名方式構造一個超級節點用以隱藏其內部的用戶隱私信息。后者則是通過邊的刪除、添加、交換等方式,來干擾社會網絡結構,促使其與原始社會網絡結構產生既定差異,由此實現對用戶隱私數據的保護目的。但聚類方法因為將子圖內個體屬性及關聯信息均予以隱藏,故而隱私保護后,數據缺損嚴重,嚴重影響了其可用性。網絡結構修改方法則可有效彌補這一缺點,尤其差分隱私保護機制作為主流的一種隱私保護方法,其將噪聲添加至原始數據或統計結果之中,以混淆攻擊者對于數據集中個人隱私記錄的判斷。在不影響數據輸出結果的前提下,該方法能有效抵御了潛在攻擊者的任何背景知識,實現數據應用與隱私保護的雙重功能,在網絡社交隱私保護中具有較明顯的應用優勢。但在實踐中,非交互式場景下數據集中屬性過多,利用差分隱私添加過量的噪聲,會影響數據集的可用性。因此在該種應用場景下,如何基于差分隱私保護機制的優化設計,實現數據隱私保護及可用性的均衡發展視為研究的重點。
1 網絡社交差分隱私保護的基本定位
1.1 差分隱私保護的需求分析
網絡社交平臺的出現為信息交互、共享及利用提供了廣闊的空間,而基于數據應用性需求,需將個體大量的數據信息公布于眾,這其中會暴露個人隱私,為此,在網絡社交數據發布之前,需進行隱私保護處理,以在確保個人隱私保密的同時,實現數據高可用性,據此,網絡社交隱私保護需滿足如下要求:
要求1:隱私保護,也即能夠保障網絡社交數據中個人隱私不被泄露。差分隱私保護旨在通過添加噪聲干擾,來構建網絡社交的隱私保護機制,以隱藏個人私密的信息,且該隱藏記錄是否出現在原有數據集匯總,不會對發布的數據結果產生顯著影響。
要求2:數據可用性,也即在經過隱私保護處理后,所發布的數據仍然保留高度的準確性及實用性。為確保數據可用性,通常網絡社交的隱私保護需隱藏數據記錄中敏感屬性,但攻擊者利用公布的海量信息通過其中非敏感屬性的組合關系,亦能夠獲取數據信息中的敏感屬性,進而實現隱私保護數據的破解差分隱私機制應用的關鍵是通過添加噪聲來轉換原始數據,并控制轉換數據與原始數據的差異,以實現隱私保護的同時,確保網絡社交數據的高度準確性及可用性。
1.2 差分隱私保護的定義





據此,通過實驗分析可得與以往的差分隱私技術相比,本文改進的差分隱私技術在對網絡社交數據進行隱私保護過程中,會更好的控制輸出數據集與原始數據集的誤差,數據準確性更優;且保持了輸出數據集90%以上最短路徑不變,達到了數據高度可用性的要求,具有一定的應用可行性。
4 結語
網絡社交深化應用與發展下,各類用戶信息云集,推進了海量信息的集成與共享,但公布的數據中涵蓋諸多隱私信息,亟待進行保護處理。基于網絡社交數據交互共享性特質,隱私保護的內涵及外延得以拓展,不再局限于單一隱私性的保護研究,也開始關注數據效用性,而目前差分隱私技術多集中在基于攻擊者背景知識抵御的隱私保護上,忽略了數據可用性。為此上述研究針對隱私保護及數據效用的均衡發展需求,提出了一種基于差分隱私保護機制,其通過添加噪聲進行查詢敏感設計,并透過發布數據集與原始數據集的誤差控制,來提升發布數據的準確性及可用性,實現了一舉多得的設計。
[參考文獻]
[1]付鈺,俞藝涵,吳曉平.大數據環境下差分隱私保護技術及應用[J].通信學報,2019(10):157-168.
[2]何明,常盟盟,吳小飛.一種基于差分隱私保護的協同過濾推薦方法[J].計算機研究與發展,2017(7):1439-1451.
[3]李強.軌跡隱私保護及在基于位置的社交網絡服務中應用研究[D].蘭州:蘭州交通大學,2016.
[4]蘭麗輝,鞠時光.基于差分隱私的權重社會網絡隱私保護[J].通信學報,2015(9):145-159.
[5]黃茜茜,蔣千越,蔣琳,等.基于差分隱私的社交網絡隱私保護[J].信息技術與網絡安全,2018(6):36-40.
(編輯 姚 鑫)
Privacy protection in social networking based on differential privacy
Yang Wenjuan
(Shanghai Zhongqiao Vocational And Technical University, Shanghai 201514, China)
Abstract:Data transmission convenience and sharing increase the difficulty of privacy information protection. The differential privacy technology attracts much attention because it is lower than the full background knowledge of the attacker. Therefore, based on the dual demand of privacy protection and data availability, we introduce Laplace mechanism and index mechanism, realize differential privacy protection through noise addition, and use the segmentation of improved LWSPA, query structure sequence, reduce the vector temperature, control the error of the release data set, and optimize the data availability to realize the balanced development of privacy protection and data availability.
Key words:differential privacy;laplace mechanism;privacy protection;data utility