牛欣怡 余樾 劉婷月

摘要:在數字化技術快速發展和國家政策的大力支持下,大數據技術已經滲透航天航空領域的方方面面,并形成一定規模的應用效果,但是數據共享帶來的隱私安全等隱患阻滯了其進一步發展。基于此,文章針對需要向業務合作部門共享的機密圖像數據,結合目標檢測算法和業務合作部門共享的實際需求,設計了一種基于加密技術的數據隱私保護方法。該方法采用目標檢測技術減小了部門共享機密數據的數據規模;結合非對稱加密算法(RSA)和對稱加密算法(AES),對共享數據進行混合加密,相較于單一RSA加密算法,加密時間減少約67%,解密時間減少約98%,實現了在保護數據隱私安全的同時,減少數據加密和解密過程的時間損耗。
關鍵詞:AES;DES;目標檢測;數據隱私;數據共享
中圖分類號:TP393.08;TP309.7? ? 文獻標識碼:A? ?文章編號:1674-0688(2023)01-0061-03
0 引言
在互聯網和信息技術的快速發展下,大數據技術受到社會各界越來越多的關注,從航天領域開始發展并逐漸滲透到各行各業,在促進科技進步的同時,也改變了人們的生產生活方式。由于傳統的行政觀念及部門之間的利益關系不同,使得工業部門或者其成員單位內部出現信息資源私有化、部門資源利益化等現象,導致大量資源浪費,“數據孤島”問題隨之而來。造成這一現象的本質原因是業務合作部門中涉及國家隱私數據較多,而隱私信息在部門間共享的過程中容易被泄露,對數據所持部門造成難以估計的損失。想要打破業務壁壘,實現部門間的數據共享和業務協同,就需要在數據共享過程中實現對隱私數據的保護,搭建起安全便捷的連接各部門的信息橋梁。
機密數據在共享過程中存在被第三方篡改和偷窺的風險。傳統的對稱加密算法,如數據加密標準(Data Encryption Standard,DES)、高級加密標準(Advanced Encryption Standard,AES),以及非對稱加密算法如李維斯特-薩莫爾-阿德曼算法(Rivest-Shamir-Adleman,RSA)可以保證對存儲的大數據中的隱私信息進行保護。其中,對稱加密算法在加解密過程使用同一個密鑰,非對稱加密算法在數據加密前會先生成一對密鑰,稱為公鑰和私鑰,加密過程使用公鑰,解密過程使用私鑰。DES算法是由美國國家標準研究所研發的數據加密算法,它使用簡單但安全性較低。張潔等[1]對DES算法進行了介紹,并對DES的安全隱患進行了說明。2001年,AES算法發布,彌補了DES算法安全性差的缺點,正式替代DES,成為當時最流行的對稱加密標準[2]。對稱加密算法雖然可以保證隱私數據的加密和解密速度,但是密鑰的商議及管理比較復雜,難以適用大型數據存儲系統。傳統的非對稱加密算法(RSA),雖然管理密鑰的過程相較于對稱加密算法更簡單,但是算法計算量大,加解密過程耗費時間太長[3]。李瑩[4]等針對RSA運算效率慢的問題,結合Montgomery乘法和中國剩余定理優化模冪,用三素數代替傳統的二重素數,對RSA算法的運算速度進行優化。
本文針對需要對業務合作部門進行共享的機密圖像數據,設計了基于加密技術的數據隱私保護方法,在各部門數據隱私被較好的保護的前提下,實現多部門間的數據共享,打破“數據孤島”的束縛。首先,根據不同業務合作部門的需求利用目標檢測技術檢測出圖片的隱私信息,將隱私信息提取出來,并對原圖的隱私部位進行打碼處理。然后,將提取出來的隱私信息用業務合作部門的RSA公鑰進行加密,實現多部門數據安全共享的目標。為了提高模型的效率,本文引入對稱加密算法AES對隱私信息進行直接加密,業務合作部門的RSA公鑰只對其對應的AES密鑰進行加密。此外,在數據共享過程中,為防止攻擊者跳過RSA部分,直接對AES加密部分進行破解,本文還使用AES加密算法對加密后的共享數據進行二次加密。
1 基于加密技術的共享機密數據隱私保護方法設計
針對可以對業務合作部門進行共享的機密圖像數據,首先在目標檢測算法的支持下,對隱私信息進行目標提取,然后對隱私信息提取的結果使用對稱加密技術(AES)和非對稱加密技術(RSA)相結合的方式,實現多部門間共享數據時的隱私保護,具體實現流程主要分為兩個步驟。
1.1 對圖片進行目標檢測及目標像素提取
在本文所提的設計方法中,不同部門將其需要的圖片及圖片隱私信息告知數據持有部門,數據持有部門根據各部門實際需求訓練相應的分類器,使用分類器檢測相應的隱私目標。目標檢測的輸入為jpg格式的圖片,輸出為目標的左上角和右下角頂點所在位置坐標,規定的輸出格式如下:
[Z={Zi,i=1,2,…,n}]
其中,n為圖片中目標區域的數量;[Zi=(xi,yi,wi,hi)],[xi]為第i個目標區域的左上角對應的橫坐標,[yi]為第i個目標區域的左上角對應的縱坐標,[wi]為該目標區域的寬度,[hi]為該目標區域的高度。
根據目標檢測結果,可以準確找到目標相對圖片的位置,對各目標區域像素進行提取,并與目標的左上角和右下角頂點所在位置坐標共同組成目標隱私信息文件,為之后的加密處理做準備。此外,為了保證數據在部門內部能夠抵御外來網絡的攻擊,本文將目標區域所在像素提取出后,對原圖的目標位置進行打碼處理,處理過后的原圖可對有隱私數據共享需求的部門開放。
1.2 對目標檢測結果中隱私信息進行加密處理
對目標檢測結果中隱私信息進行加密處理就是用非對稱算法(RSA)對目標隱私信息文件進行加密。加密過程具體如下:數據持有部門對需要加密共享的隱私數據使用業務合作部門對應的RSA公鑰進行加密并發布,業務合作部門收到發布通知后,使用對應本部門RSA私鑰解密密文,得到不失真的隱私信息。在本章節設計的混合密鑰加密算法中,各部門會事先生成一對RSA密鑰,其中私鑰由各部門保存,而對應的公鑰在部門間開放,其他業務合作部門均可見。這樣,假設A部門需要對B、C兩個部門進行數據共享,而B、C部門所定義的隱私信息不同,A部門可以根據B、C部門的需求檢測隱私信息,并用B、C各自的公鑰對其需要的隱私信息進行加密。如此就可以使用不同部門的公鑰對數據進行加密,并且只有具有加密公鑰對應私鑰的部門才能對收到的數據進行解密。
相比對稱加密算法,RSA算法由于大數因式分解困難,因此在安全性方面有著絕對優勢,并且目前可以破解的最長RSA密鑰長度為768位,因此1 024位的RSA密鑰可以提供等級非常高的安全保障。但是,RSA算法在滿足安全性的同時也帶來了巨大的計算量,其加解密的時間是對稱加密算法(AES)的幾十倍。因此,在上述提出的基于RSA算法的密鑰加密方法中,本文引入對稱加密算法(AES),使用AES算法對目標隱私文件數據部分進行加密,再用RSA算法對128位的AES密鑰進行加密,以此減少數據加解密所耗費的時間。在此基礎上,為了防止網絡攻擊者越過RSA算法加密直接破解AES算法密鑰,從而獲取AES算法加密的目標隱私文件數據,研究人員對目標隱私文件的加密方式從RSA算法加密改為AES算法加密,再對AES算法密鑰K[1]用業務合作部門RSA公鑰PK加密,最后對RSA加密結果及AES加密結果共同進行AES加密,并在共享數據時直接公布二次AES算法加密的密鑰K2。這樣不僅可以保證數據共享時的安全性,又能大大提高共享效率。
2 實驗結果及分析
研究人員對混合加密算法的可行性和高效性進行驗證,一方面驗證設計方法對圖像數據實現加密共享的可行性,另一方面通過對比設計方法和單一加密算法對數據的加解密時間,驗證設計方法在數據加解密時的高效性。
2.1 實驗環境
實驗的軟件和硬件環境如下,操作系統為Windows10;GPU為NVIDIA GeForce 820 M;CPU為Inter(R)Core(TM)i5-4210U CPU 1.70 GHz;內存大小為4.00 G;開發語言為Java,Python;開發工具為Eclipse,Pycharm。
2.2 實驗結果及分析
目標檢測部分由于涉及圖像隱私,因此無法進行展示,并且不同類型的圖片所含的隱私信息不同,需采用不同的目標檢測方法進行處理,例如圖像隱私信息為面部信息時,可利用多任務卷積神經網絡(Multi-Task Convolutional Neural Networks,MTCNN)進行面部特征提取,并對面部進行目標區域所在像素提取及打碼處理。因此,本小節直接利用目標檢測結果生成的目標隱私信息文件對本文提出的共享數據隱私保護方法進行可行性和高效性的驗證。實驗加密算法分別使用1 024位的RSA加密算法和128位的AES加密算法。
(1)可用性實驗及分析。每一個目標隱私信息文件中的隱私數據經歷了3輪加密,第一輪是對隱私數據進行AES加密,密鑰為K[1];在第二輪加密中,第一輪加密時使用的AES密鑰K[1]會被接收方的RSA公鑰加密;第三輪則對第一輪和第二輪的加密結果進行AES加密,密鑰為K2,K2會在數據發送時發布。由此可見,隱私數據經歷了2輪AES加密,加密后的數據將作為發布時的有效數據部分,而第一輪加密所使用的AES密鑰K[1];經歷了RSA和AES兩輪加密,加密結果構成密鑰信息部分。有效數據部分和密鑰信息部分構成待發送數據。
數據加解密時,只需要使用相應部分的密鑰對應解密,就能使數據完全復原,本方法只對隱私數據進行了處理,而本地打碼圖片因為不含隱私信息,所以打碼過后可以對有隱私數據需求的部門直接公開發布。
(2)高效性實驗及分析。本實驗通過比較單一加密算法(即RSA加密算法)和混合加密算法(即AES算法和RSA算法結合)對數據的加密和解密效率,驗證本文設計的混合加密算法的高效性。
在本文所提方法中,RSA算法只對AES算法的密鑰進行加密,由于密鑰長度只有128位,因此相比隱私數據加密,密鑰加密可以忽略不計。這就使得對單一加密算法和混合加密算法的比較轉化為對AES加密算法和RSA加密算法的比較。本小節的實驗數據集中有1張圖片的隱私數據轉化為文本文件,大小約為0.158 MB,實驗時通過內容復制得到了0.158 MB、1.266 MB、2.53 MB、3.796 MB、5.061 MB等5種大小不同的文本文件,并對這些文件分別進行RSA加解密和AES加解密,加密和解密時間對比如圖1所示。
從圖1中可以明顯看出,加解密數據量不足1 MB時,兩種算法的加密和解密時間相近,但隨著數據量的增大,AES算法的加解密時間幾乎沒有變化,保持在1 s以內,而RSA算法的加密時間成倍增長,1 MB數據量增加3倍時,RSA算法加密時間增加了4倍左右,而解密時間有了50倍的增長。
基于以上觀察,可以證明本文提出的對稱加密和非對稱加密算法的共同保護非常合理性且有效,尤其當數據量很大的時候,混合加密算法會在加解密效率上較單一加密算法有很大的提升。
3 結論
針對可以對業務合作部門進行共享的機密圖像數據,本文根據其共享及隱私保護要求提出了基于目標檢測技術、對稱加密技術和非對稱加密技術的數據共享隱私保護模型。首先,每個部門都生成一對RSA密鑰,各自部門保留私鑰,并向其他部門公布公鑰。其次,在數據加密前,利用目標檢測技術,根據不同部門所定義的隱私信息對數圖像進行目標檢測提取,并根據目標檢測結果對原圖隱私信息部分進行打碼處理。再次,針對大數據共享數據量大、更新速度快的特點,使用更快的對稱加密算法AES對隱私信息進行加密,并使用非對稱加密算法RSA對AES算法的密鑰加密。最后,發布前,用AES算法對全部加密信息進行再次加密,防止網絡攻擊者直接對加密隱私信息進行破譯。本文提出的隱私保護模型在保護隱私信息安全的前提下解決了多部門數據共享的問題,并通過實驗證明該模型具有較高的可行性和效率。
4 參考文獻
[1]張潔,朱麗娟.DES加密算法分析與實現[J].軟件導刊,2007(3):95-97.
[2]郎榮玲,夏煜,戴冠中.高級加密標準(AES)算法的研究[J].小型微型計算機系統,2003(5):905-908.
[3]步山岳.RSA加密算法分析與實現[J].信息安全與通信保密,2007(10):80-81.
[4]李瑩,趙瑞,曹宇,等.RSA加密算法的研究[J].智能計算機與應用,2020,10(3):166-168.