姚禹丞,宋 玲,鄂 馳
(廣西大學(xué) 計(jì)算機(jī)與電子信息學(xué)院,廣西 南寧 530004)
同態(tài)加密的分布式K均值聚類算法研究
姚禹丞,宋 玲,鄂 馳
(廣西大學(xué) 計(jì)算機(jī)與電子信息學(xué)院,廣西 南寧 530004)
針對(duì)分布式環(huán)境下多方聯(lián)合執(zhí)行K均值聚類挖掘任務(wù)過程中存在的安全性問題,如潛在的合謀攻擊和竊聽攻擊導(dǎo)致隱私泄露和敏感知識(shí)被發(fā)現(xiàn),提出了一種隱私保護(hù)算法(PPDK)。在數(shù)據(jù)對(duì)象水平分布的情況下,該算法利用同態(tài)加密的思想,設(shè)計(jì)了一種新的加密機(jī)制。通過改進(jìn)加密密鑰的生成方式,使得參與計(jì)算的各方持有不同的密鑰,對(duì)于產(chǎn)生的密文,其他參與方無(wú)法解密,并且在計(jì)算過程中所有的加密解密操作均由各參與方獨(dú)立完成,因此可以限制半誠(chéng)實(shí)的參與方試圖竊聽其他參與方的私有信息,以及與中心站點(diǎn)合謀揭露隱私的可能性。通過理論分析和實(shí)驗(yàn)結(jié)果表明,在有效的時(shí)間內(nèi),PPDK算法可以在確保分布式K均值聚類挖掘任務(wù)得到正確結(jié)果的前提下,很好地保護(hù)數(shù)據(jù)的隱私性。
分布式;K均值聚類;同態(tài)加密;隱私保護(hù)
隨著計(jì)算機(jī)網(wǎng)絡(luò)和數(shù)據(jù)庫(kù)技術(shù)的發(fā)展,許多組織和機(jī)構(gòu)收集和存儲(chǔ)了大量數(shù)據(jù),這些數(shù)據(jù)背后蘊(yùn)含著很多重要的信息而且大部分都按地理位置分布于多個(gè)場(chǎng)所。為了更好地利用這些數(shù)據(jù),人們希望對(duì)其進(jìn)行更深層次的分析。利用數(shù)據(jù)挖掘[1-4]技術(shù)可從這些數(shù)據(jù)中提取有價(jià)值的知識(shí),但在分布式場(chǎng)景下,數(shù)據(jù)挖掘任務(wù)需要通過多方之間的合作來完成。……