王建成

摘要:隨著云計算技術的快速普及和發展,云存儲數據訪問的隱私安全問題已經廣受社會關注。在此背景下,該文將以混合云為研究調查,提出一種混合云存儲方案,采用在私有云環境中對數據通過加密、合并、分割等方式進行處理,將文件元數據存儲在私有云組織內部數據庫,處理后的數據存放到公有云空間中,通過元數據與數據內容分離的方式來提高公有云存儲數據訪問隱私保護效果。
關鍵詞:混合云;存儲數據;隱私保護
中圖分類號:TP393? ? ? 文獻標識碼:A
文章編號:1009-3044(2021)15-0069-03
1 背景
近年來,云計算技術已經深入應用到人們的日常生活中,為信息存儲帶來了更多的便利。然而近日,某云平臺卻被曝出通過用戶存儲數據訪問日志學習、分析用戶的使用行為,進而獲取用戶的深層信息,并以此獲利。該云平臺雖然沒有直接對用戶云端存儲數據進行泄露,但也可以獲取用戶的深層信息,由此引申出云平臺存儲數據訪問隱私安全問題。
2 云端數據存儲要求
2.1 安全性
云端數據安全性主要是指用戶存儲在公有云平臺的數據內容不能夠在用戶允許的情況下被任何實體進行訪問、修改以及刪除。通常來說,加強云端數據安全性的方式主要分為以下兩種:其一,通過訪問控制機制有效避免無關操作者對云端數據進行訪問和操作[1];其二,通過加密、合并以及分割等方式對云端數據進行處理。雖然兩種方式存著差異,但可以進行融合使用,并在第三方平臺的支持下,構建第三方用戶訪問控制和加密密鑰分發,據此將可以進一步提升用戶云端數據存儲安全性,避免云端數據在存儲過程中出現泄露、丟失等問題[2]。
2.2 可用性
云端數據的可用性要求公有云平臺在向用戶提供云端數據存儲服務時,必須保證數據服務的無錯性。但結合實際情況來看,受網絡傳輸泄露、物理介質損壞等因素的影響,公有云平臺在向用戶提供云端數據存儲服務時,數據損壞、數據丟失等問題是客觀存在的,進而威脅到用戶的云端數據安全和隱私保護。為能夠避免出現這些問題,常用的應對方式是構建冗余系統,即將用戶云端數據同步存儲到多個公有云服務器中,各公有云服務器之間將會相互同步相互備份[3]。
2.3 數據訪問隱私保護
所謂數據訪問隱私保護就是指一種防止云平臺在提供云存儲服務過程中,通過用戶的訪問日志進行學習和分析用戶的使用行為的機制。然而,現有的公有云平臺的運行日志卻可以對用戶在云端平臺存儲數據的訪問者、訪問時間、被訪問的數據、用戶的操作行為等諸多隱私信息進行記錄,由此便引申出用戶的云端數據訪問隱私保護問題[4]。
3 云端數據訪問隱私保護方案
3.1 云端數據訪問隱私保護方案概述
本文所提出的云端數據訪問隱私保護方案的主要原理如下:首先,從需要存儲到公有云平臺的數據文件中提取出元數據;其次,將原數據文件內容通過合并、分割等方式進行有效處理;最后,將處理后的數據文件上傳到公有云平臺。此外,為能夠進一步提高云端數據存儲的安全性,還需要在數據文件上傳前通過加密的方式進行二次處理[5]。公有云平臺僅會存儲處理后的數據文件,元數據則會同時原始數據文件、數據信息上傳到云端平臺時的指定數據處理參數等數據信息一同存儲到本地服務器中,實現云端數據保護的安全性要求。
對于云端數據保護的可用性要求,則采用多個公有云平臺之間冗余存儲的方式進行,各公有云平臺中所存儲的數據信息將會通過相互備份、相互同步的方式構成云端數據存儲冗余系統。各公有云的同步、備份等參數信息均會與元數據運通存儲在本地服務器中。
用戶上傳云端數據的元數據以及用戶訪問云端數據時的操作行為一直都是公有云平臺供應商對用戶訪問行為進行學習和信息收集的主要數據來源,若是可以在云端數據上傳到云端平臺前,將數據文件內容及其元數據通過合并、分割等方式進行處理,并通過數據加密方式進行二次加密,便可以有效加強相關數據信息的隱私保護效果。
通過上述流程進行處理后,需要存儲到公有云平臺的數據文件以及處理前數據文件的相關數據信息均只會在已經提取出的元數據中進行體現,而這些數據信息則會存在本地服務器或者私有云平臺中,所以不會被公有云平臺所獲取。其次,由于上傳到公有云平臺的數據文件及其所對應的元數據均是被分割、合并處理后的數據文件,使得公有云平臺所獲取到的元數據與原始數據文件沒有明顯關聯性。最后,用戶在對云存儲數據進行訪問過程中,會根據用戶的訪問指令,先對存放元數據的本地服務器或者私有云服務器進行訪問,并在其中獲取相關元數據與處理后的云端數據之間對應關系,此對應管理并不是固定的一對一關系,而是會自行生成的一對一或者是一對多、多對一關系,如此將可以有效削弱處理前原始數據文件與處理后云端數據文件之間的關聯性,進而對公有云平臺供應商通過相關訪問行為進行學習發揮出相應的干擾效果。
3.2 混合云存儲系統
基于上述文件,本文所提出的系統的架構方案如圖1所示。
如圖1所示,本文所設計的混合云存儲訪問隱私保護系統主要分為用戶終端、私有云、防火墻以及公有云四部分。其中用戶和私有云均會設置在企業或者其他組織內部,由企業或者組織進行直接管理;私有云和公有云之間會通過互聯網進行相互連接,但兩者在進行數據交互時,所有數據信息均需要經由防火墻進行驗證分析;多個公有云共同構成公有云數據存儲平臺,各公有云之間會進行相互同步、相互備份,以此來共同為用戶提供云端數據存儲服務的同時,避免出現云端數據丟失情況[6]。
本文所設計的混合云存儲訪問隱私保護系統采用了Hadoop分布式架構,此架構可以在云端數據存儲過程中將云端數據以特定大小在多個數據節點中進行分散存儲,此種存儲方式不僅有利于提高文件系統的運行效率,還能夠進一步保障云端數據信息的存儲安全性。在混合云存儲訪問隱私保護系統的支持下,用戶的使用混合云進行云端數據存儲時,其只會看到云端數據文件以整體的形式進行存儲,但事實卻并非如此。用戶在將需要存儲到云端的數據文件通過混合云存儲訪問隱私保護系統進行上傳后,系統將會自行對數據文件進行處理和加密,然后再將處理后的數據文件在多個公有云中進行存儲。
4 混合云存儲訪問隱私保護系統分析
4.1 數據安全性分析
經由混合云存儲訪問隱私保護系統處理以后,所有上傳到公有云平臺的云端數據文件均會先通過分割、合并等方式進行處理,再經過加密技術進行二次加密。因此,處理后的云端數據文件無論是對公有云平臺供應商,還是不法攻擊者來說,其都無法直接獲取云端數據文件所對應的原始數據文件。若是想要根據云存儲數據訪問記錄來獲取各云端數據之間的相互關聯性,不僅會耗費大量的時間,而且還無法保障還原后數據文件的真實性和有效性。此外,由于系統還會通過加密技術進行二次加密,所以相關不法分子在獲取處理后的文件前還需要獲取加密文件的密鑰,如此將進一步加大不法分子的原始數據文件獲取難度,甚至在大部分時候,通過云端數據文件逆向獲取原始數據文件所需的開銷將可能會讓不法分子得不償失,進而降低破解積極性,保障數據安全性。
4.2 數據可用性分析
混合云存儲訪問隱私保護系統的公有云部分將會由多個公有云平臺共同組成,用戶在上傳文件時,系統將會自行通過冗余子系統將處理完成后的數據文件分別上傳到公有云平臺中。各公有云平臺之間將會起到著相互備份、相互同步的效果,當某一公有云平臺出現問題時,其他公有云平臺仍然可以為用戶提供良好的云端數據存儲服務,保障了數據可用性。
4.3 數據訪問隱私保護分析
通常情況下,公有云平臺供應商所能夠獲取的用戶云存儲數據訪問隱私包括在公有云平臺中存儲數據文件的元數據信息以及用戶對公有云平臺進行操作時的操作記錄兩種內容。在相關信息使用過程中,公有云平臺供應商會以相關數據信息為樣本,通過人工智能技術和大數據技術進行機器學習和數據信息挖掘,從而獲取數據信息中所蘊含的更加深層次的信息內容,威脅到用戶的隱私安全。本文的數據訪問隱私保護思路是將原始數據文件進行分割、合并處理,致使可用于機器學習的樣本被隱藏,再加上加密技術的二次加密,將可以有效隱藏原始文件樣本,避免數據訪問隱私被公有云平臺供應商所獲取。當然,由于公有云平臺在提供服務時還需通過訪問控制機制來獲取用戶的身份驗證信息,進而獲取到用戶的一部分隱私信息,如客戶端地址、訪問時間等,這些信息無法進行隱藏,所以將不會進行保護。
此外,傳統的用戶云端數據操作所采用的訪問請求模式均是有公有云平臺所提供,并且相關業務流程較為固定,所以公有云平臺供應商可以輕易獲取用戶的數據訪問隱私信息。而通過混合云存儲訪問隱私保護系統則會將原本固定的業務流程轉變為隨機業務流程,用戶在進行云端操作時,系統會隨機向不同的公有云平臺發出訪問請求,進而有效降低用戶數據訪問過程中的關聯性,促使單個公有云平臺供應商在對用戶數據訪問隱私信息進行獲取時的難度也會相應增加。綜上所述,本文所提出的混合云存儲訪問隱私保護系統對于用戶的數據訪問隱私安全具有良好的保護效果,值得進行普及和應用。
5 結束語
本文對公有云存儲數據訪問隱私安全現狀進行研究分析,結合云端數據存儲要求,提出云端數據訪問隱私保護方案、完成混合云存儲訪問隱私保護系統理論設計架構。通過研究發現,本文所提出的云端數據訪問隱私保護方案和混合云存儲訪問隱私保護系統可以有效保障用戶云端存儲數據的安全性、可用性,并為用戶提供良好的數據訪問隱私保護,在當今云計算技術得到大范圍普及應用的大背景下值得進行使用。
參考文獻:
[1] 何健.云端大數據平臺多維安全防護體系的研究與實踐[J].信息技術與信息化,2018(4):192-194.
[2] 梁桃紅,何麗,張洪革.一種面向云端存儲的大數據安全審計框架[J].電子技術與軟件工程,2018(18):173-174.
[3] 王觀上.保護身份隱私的云存儲共享數據審計方法[J].電腦知識與技術,2019,15(23):30-32.
[4] 李夢園,趙耿,許馨予,等.基于秘密共享技術的私有云存儲方案[J].北京電子科技學院學報,2018,26(4):41-45.
[5] 李樹全,劉磊,朱大勇,等.一種面向云存儲的數據動態驗證方案[J].計算機科學,2020,47(2):256-261.
[6] 王瑞錦,張鳳荔,王馨云,等.基于改進跳表的云端數據完整性驗證協議[J].電子科技大學學報,2018,47(1):88-94.
【通聯編輯:代影】