摘要:本文對Paillier同態加密算法原理進行深入研究,此外,本文還探索了在安全應用中使用同態加密算法進行數據去標識化的技術,并進行了實踐驗證。實驗結果表明,Paillier同態加密算法能夠有效地保護個人信息免受泄露和不當挖掘,將在未來的大數據時代中發揮關鍵作用。
關鍵詞:Paillier;同態加密;去標識化技術
一、引言
隨著科技的飛速發展,個人信息在大數據應用和移動設備中被廣泛使用,個人信息也越來越多地在不同的軟件或平臺被記錄、共享,而個人信息經過大數據挖掘后,會給國家和企業產生巨大的政治和經濟利益。個人信息去標識化的概念便是在這種背景下應運而生并持續發展的。Samarati和Sweeney兩位學者于1998年首次提出匿名化(即去標識化)的概念,意在對個人信息進行泛化和抑制處理,而后由不同學者先后提出了K-匿名模型(K-Anonymity),L-多樣模型(L-diversity),T-近似模型(T-closeness),同態加密等技術。
同態加密(Homomorphic Encryption,HE)算法是指一種加密函數,同態加密算法允許在加密數據上直接進行計算(如加法或乘法),使得計算結果與先對明文計算再加密的結果相同。基于此種性質,人們可以委托第三方對個人信息數據進行處理而不泄漏敏感信息。同態加密的概念最初由Ron Rivest,Leonard Adleman和Michael L. Dertouzos共同提出,同態加密支持的運算主要為加法運算和乘法運算。Paillier同態加密算法是由Pascal Paillier于1999年在“歐洲密碼學會議”上首次提出,其原理是基于n階剩余類問題,因其效率高、安全性證明完備的特點,在各大協會和實際應用中被廣泛使用。
本文提出和實現基于Paillier同態加密算法的去標識化技術,以解決個人信息在大數據時代存在被泄漏和被挖掘的可能性的問題,并通過實際應用來驗證同態加密算法在數據分析和處理中的安全性和正確性。
二、Paillier同態加密算法原理
Paillier同態加密算法,是1999年Pascal Paillier發明的概率公鑰加密算法,它基于n階剩余類困難問題。下面將以Paillier算法同態加密的密鑰生成、加密和解密為基礎,同時以參數優化為輔助來驗證其加法同態性質和正確性。
(一)密鑰生成
隨機選取兩個大素數p、q,計算n=pq,λ=lcm(p-1,q-1)(lcm為最小公倍數函數);選取隨機數使得,其中L(μ)=(μ-1)/n,gcd為最大公約數函數。記公鑰為,私鑰為λ。
(二)加密
選擇隨機數,對明文m加密生成密文,運算公式如下:
(1)
(三)解密
運用私鑰對密文數據進行解密,運算公式如下:
(2)
(四)加法同態性質
基于同態加密算法的加法同態性質,對于數據m1和m2對應的密文c1和c2(設加密函數E(x)),應滿足以下:
D(c1*c2 modn2)=D(gm1rn1*gm2rn2modn2)=D(gm1+m2(r1*r2)n
modn2)=D(E(m1+m2)modn2)=m1+m2
(五)參數優化
在不影響算法正確性的前提下,為了簡化運算,算法在密鑰生成階段可以取g=n+1。此后,加密過程中
計算gm,根據二項定理則可以簡化為:
三、去標識化技術
根據《中華人民共和國個人信息保護法》的規定,個人信息是指以電子或其他方式記錄,能夠單獨或者與其他信息結合識別特定自然人身份,或者反映特定自然人活動情況的各種信息。一般而言,按照信息可識別性,個人信息大致可以劃分為直接標識符和間接標識符兩類,直接標識符信息是指可以直接識別的包含個人識別符號的信息,如基因序列、生物特征、護照號碼、駕照號碼、居民編號、法律規定的其他可以識別個人的符號;間接標識符信息是指信息中所包含的姓名、生日及其他可以間接識別特定個人的信息。
去標識化技術是指個人信息經過處理,使其在不借助額外信息的情況下無法識別特定自然人的過程。以去標識化技術為例,使用“先生”或“女士”對真實個人姓名進行隱藏,對年齡則隱去最后一位數字,從而無法直接或間接地識別某個人。
2023年3月,全國安全標準化技術委員會正式發布了國家標準《信息安全技術個人信息去標識化效果評估指南》,該標準將于2023年10月1日正式實施。常用的去標識化技術就包含了泛化技術,局部抑制、同態加密、保序加密等算法。其中同態加密算法不同于傳統加密算法,它基于密文的處理和運算,包括檢索、統計等任務都成為可能。下面將結合應用來實踐和驗證同態加密算法在去標識化技術中關鍵作用。
四、應用
假設某公司擁有一批個人信息的數據,需要多方共享和處理,這里以年齡為例,比如銀行、保險公司等以年齡作為業務評估的主體,而業務評估的算法保密,傳統的數據管理與處理模型,是建立用戶與數據庫之間的聯系。
假設Alice是公司一員,如果能對數據源進行直接處理,則個人隱私將得不到任何安全保障,而傳統的加密模式,即對數據進行逐一加密,在數據處理前,仍需對每個數據項進行解密。
基于同態加密算法的理論,提出了一種安全計算模型:將數據進行加密,將密文存儲在第三方云平臺,在對數據進行處理時,直接處理存儲在第三方云平臺上的密文(比如分析和統計等業務評估),這種處理方式與傳統的對明文數據進行分析和統計的效果相同。在此過程中,第三方平臺和數據分析師均無法獲知個人信息數據的明文和業務評估算法,既保證了個人信息數據的安全性,又實現了對個人信息數據的分析、統計等處理的正確性,見圖1。
大致流程如下:
1.利用Paillier算法生成密鑰對,假設其中公鑰為(n,g),私鑰為λ;
2.利用公鑰對個人信息進行同態加密,將密文存儲在第三方云平臺;
3.個人信息評估系統對輸入的姓名進行動態加密,第三方云平臺比對輸入的姓名密文。匹配查詢條件的年齡密文,生成評估報表并將其傳送回個人信息評估系統。
五、實驗
本節對集成本方案技術的安全密碼模塊進行功能測試。
功能測試的云平臺服務器運行環境為:
CPU:單核Loongson-3A3000 @ 1400MHz
內存:16G
操作系統:NeoKylin Linux Desktop 7.0_U2 (Loongson)
客戶端運行環境為:
CPU: Inter(R) Core(TM) i7-10710U CPU @1.10GHz 1.61
內存:16G
操作系統:Windows 10
測試方法:
1.第三方平臺集成并配置Paillier同態加密算法,在內部同時生成同態加密公私鑰對;
2.配置業務評估算法,這里以插件形式加載;
3.客戶端A輸入一組個人信息(包括姓名、性別、年齡、身高等信息),通過數據庫加密網關加密后保存至第三方平臺,第三方平臺對密文數據進行存儲;
4.客戶端B通過個人信息評估系統查詢某位客戶信息得到的業務評估結果應和查詢明文數據對應的結果保持一致。
測試結果:通過個人信息評估系統,查詢得到個人的業務評估結果。
實驗結果表明,通過配置第三方平臺Paillier同態加密策略查詢得到的信息和通過明文查詢得到的個人信息保持一致。
六、結束語
本文通過分析研究Paillier同態加密的加法算法的原理,結合個人信息中的去標識化技術,實現了對個人信息密文的處理與對明文處理相同的效果,并且通過構建一個個人信息評估系統應用進行測試,測試結果表明,使用Paillier同態加密算法能夠在保障個人信息處理的正確性的同時,保護個人信息不被深度挖掘,其安全可靠性為數據傳輸安全提供了一種可行、可靠的方案。
作者單位:易濤 公安部第三研究所
參考文獻
[1] RIVEST R L, SHAMIR A, ADLEMAN L. A method for obtaining digital signatures and public-key cryptosystems[J]. Communications of the ACM, 1978, 21(2):120-126.
[2] PAILLIER P. Public-key cryptosystems based on composite degree residuosity classes[C] //International Conference on the Theory and Applications of Cryptographic Techniques. Berlin:Springer, 1999:223-238.
[3] GB/T 42460-2023.信息安全技術 個人信息去標識化效果評估指南[S]. 國家標準化管理委員會,2023.
[4] 臧禹,呂干云,賈德香.基于Paillier同態加密的電力交易數據加密方案[J].電氣自動化, 2023, 45(1):39-41.
[5] 蔣杰. (2020). 基于Paillier同態加密的可搜索加密算法研究. (Doctoral dissertation, 湖南大學).
[6]朱嵩,王化群,王少輝.一種基于Paillier同態加密算法的智能電網數據安全聚合方法.CN202011083569.0[2023-08-10].
[7] 綦曉偉.基于Paillier加密算法的私密近鄰檢測研究[D].北京交通大學,2016.
[8] 張薇,白平,李鎮林,等.基于謂詞的Paillier型密文解密外包方案[J].鄭州大學學報:理學版, 2018, 50(3):8.
[9] 翟峰,徐薇,馮云,等.面向智能電表隱私保護方案的改進Paillier算法設計[J].電力信息與通信技術, 2016, 14(12):6.
[10] 白亮.基于云存儲的同態加密檢索方案研究[D].電子科技大學,2016.
[11] 譚楚亭.通用公共可驗證謂詞加密方案設計與研究[D].哈爾濱工業大學,2015.DOI:10.7666/d.D01101233.
[12]陳志偉,杜敏,楊亞濤,等.基于RSA和Paillier的同態云計算方案[J].計算機工程, 2013, 39(7):35-39.
[13]王東,李春平,肖亞光.基于Paillier和ElGamal算法的雙層同態密碼系統[J].科技創新與應用, 2022(018):012.
[14]張敏情,李天雪,狄富強,等.基于Paillier同態公鑰加密系統的可逆信米非司酮藏算法[J].鄭州大學學報:理學版, 2018, 50(1):7.
[15]馮新亞,王瑋,胡水海.用于聯邦學習的基于FPGA芯片實現的Paillier加密方案:CN202010661420.X[P].CN111832050A [2023-08-10].
基金項目:本課題得到公安部第三研究所2023年度基本科研業務費專項資金項目[No.C23366]資助。
易濤(1985.07.21-),男,漢族,湖北監利,學士學位,實習研究員,研究方向:密碼學和算法應用。