陳嘉霖 周宏志 陳倩


摘 要 為解決在線用戶行為數(shù)據(jù)隱私泄露問題,本文提出一種隱私保護(hù)選擇聚合算法(PPSAA),通過采用BGN密碼系統(tǒng)和添加噪聲法對用戶的敏感數(shù)據(jù)進(jìn)行加密,并支持在線用戶行為分析的選擇性聚合功能,將同態(tài)加密和差分隱私機(jī)制相結(jié)合,使個人隱私得到較好保護(hù)。最后,通過對真實(shí)在線行為數(shù)據(jù)集的跟蹤驅(qū)動,仿真表明,該算法有效地支持總體聚合查詢和各種選擇性聚合查詢,與僅添加噪聲算法相比,PPSAA算法具有較小的計(jì)算開銷。
【關(guān)鍵詞】在線用戶行為 選擇性聚合 隱私保護(hù) PPSAA算法
1 引言
隨著在線用戶規(guī)模的日益擴(kuò)大,在線行為數(shù)據(jù)分析已成為眾多領(lǐng)域的研究熱點(diǎn),如經(jīng)濟(jì)、學(xué)術(shù)以及社會事務(wù)等領(lǐng)域。通過分析用戶的在線行為,挖掘出用戶個人屬性和傾向,具有較大的商業(yè)價值。然而,數(shù)據(jù)聚合任務(wù)被外包給第三方聚合器進(jìn)行,盡管第三方的分析員和聚合者帶來了巨大的收益與價值,但也造成用戶隱私的泄露,即在防止用戶隱私信息泄露的同時也犧牲了數(shù)據(jù)分析的能力。因此,如何高效準(zhǔn)確的保護(hù)數(shù)據(jù)隱私和加強(qiáng)數(shù)據(jù)分析能力成為目前的研究熱點(diǎn)。
本文提出一種隱私保護(hù)選擇聚合算法(Privacy protection selection aggregation algorithm),通過采用BGN密碼系統(tǒng)和添加噪聲法對用戶的敏感數(shù)據(jù)進(jìn)行加密,并支持在線用戶行為分析的選擇性聚合,將同態(tài)加密和差分隱私相結(jié)合,使用戶隱私得到較好保護(hù)。最后,通過真實(shí)數(shù)據(jù)集的跟蹤對其性能進(jìn)行評估,結(jié)果表明,該算法有效地支持了總體聚合和各種選擇性聚合查詢,并與僅添加噪聲算法相比,PPSAA算法具有可接受的計(jì)算和通信開銷。
2 系統(tǒng)模型
2.1 模型建立
本文提出一個隱私保護(hù)數(shù)據(jù)聚合系統(tǒng),該系統(tǒng)由n個用戶,一個中介和分析員組成,用戶部署在客戶端,主要收集數(shù)據(jù),檢測并刪除異常值。中介負(fù)責(zé)從客戶端匯總用戶數(shù)據(jù),計(jì)算并評估分析員發(fā)出的聚合查詢,分析員查詢用戶個人或機(jī)構(gòu)的數(shù)據(jù)。
4 仿真分析
為評估算法性能,將使用加密庫(PBC)來實(shí)現(xiàn)BGN密碼系統(tǒng),參數(shù)t=80,根據(jù)1000個全國用戶的人口統(tǒng)計(jì)數(shù)據(jù)和在線行為數(shù)據(jù)集進(jìn)行跟蹤模擬。
4.1 準(zhǔn)確性度量
如圖1 所示,顯示了樣本大小隨相對誤差的變化示意圖,隨著樣本大小的增加,相對誤差值逐漸減小。由于相對誤差是由附加噪聲所引起的,且取決于隱私參數(shù)ε和查詢的真實(shí)結(jié)果。因此,當(dāng)ε=0.1時,相對誤差最小,準(zhǔn)確性最優(yōu)。
4.2 計(jì)算開銷分析
如圖2所示,顯示了PPSAA算法和PPOAA算法和直接添加噪聲算法(D-AN)在不同采樣量時的運(yùn)行時間。隨著樣本量的增加,PPOAA算法消耗的時間幾乎為零,而PPSAA和D-AN算法的消耗時間為正比例增加。
5 結(jié)論
為解決在線用戶行為數(shù)據(jù)隱私泄露問題,本文提出一種隱私保護(hù)選擇聚合算法(PPSAA),通過采用BGN密碼系統(tǒng)對用戶的敏感數(shù)據(jù)進(jìn)行加密,并支持在線用戶行為分析的選擇性聚合功能,將同態(tài)加密和差異隱私機(jī)制相結(jié)合,使個人隱私得到較好保護(hù)。最后,結(jié)果表明,該算法有效地支持總體聚合查詢和各種選擇性聚合查詢,并與僅添加噪聲算法相比,PPSAA算法具有可接受的計(jì)算和通信開銷。
(通訊作者:陳倩)
參考文獻(xiàn)
[1]楊善林,王佳佳,代寶等.在線社交網(wǎng)絡(luò)用戶行為研究現(xiàn)狀與展望[J].中國科學(xué)院院刊,2015,30(02):200-215.
[2]Chen D,Dong Y,Huang X,et al. A community finding method for weighted dynamic online social network based on user behavior[J]. International Journal of Distributed Sensor Networks,2015,2015:97.
[3]劉懷進(jìn),陳永紅,田輝等.一種可檢測數(shù)據(jù)完整性的安全數(shù)據(jù)聚合協(xié)議[J].計(jì)算機(jī)科學(xué),2016,43(S1):353-356.
[4]Ebadi H,Sands D,Schneider G. Differential Privacy[J].Acm Sigplan Notices,2015,50(01):69-81.
作者簡介
陳嘉霖(1973-)男,云南省人。云南大學(xué)碩士。從事信息化研究。
陳倩(1994-),女,云南省人。碩士研究生。研究方向?yàn)閿?shù)據(jù)安全。
作者單位
云南省能源投資集團(tuán)有限公司 云南省昆明市 650500