◆梁永堅 韋田 黎銳杏
融合多特征的云存儲中分類分級數據加密方法
◆梁永堅1韋田2黎銳杏2
(1.廣西電網有限責任公司 廣西 530000;2.廣西社會科學院 廣西 530000)
由于云存儲空間中存儲的數據種類較多,導致傳統的數據加密方法存在加密安全性差、時間開銷大的問題,為此提出融合多特征的云存儲中分類分級數據加密方法。在云存儲空間中采集多源數據信息,并對其進行預處理。在此基礎上,提取數據中的多種特征并實現對多特征的融合。以數據的特征融合結果為基礎,實現對數據的分類與分級,針對不同類型的數據進行加密處理,并對出對應的密文。實踐結果表明,提出的加密方法在安全性和時間開銷方面更加具有優勢。
多特征融合;云存儲;分類分級;數據加密
為保證加密算法的運行的安全性和有效性,在開始加密處理之前會進行數據的分級與分類處理[1]。現階段的加密方法存在時間開銷大、安全性低的問題,為此提出融合多特征的云存儲中分類分級數據加密方法,即在傳統加密方法的基礎上應用多特征融合技術實現對加密方法的優化設計,其目的是提高數據加密結果的安全性和加密效率。
云存儲實際上是一個以數據存儲和管理為核心的云計算系統,該系統可以實現對大量數據的處理與存儲,并配置相應的存儲資源。
云存儲系統由訪問層、用戶接口層、基礎管理層、存儲層四個部分組成。其中訪問層是直接與系統用戶對接的層級,能夠保障任何授權用戶順利通過云服務商提供不同類型的服務[2]。應用接口層能夠根據實際的業務需要開發不同的API,從而滿足不同的上層應用服務。基礎管理層是云存儲系統中的核心部分,該層通過利用集群技術、分布式文件系統等技術,將網絡中位于不同地理位置的存儲設備結合在一起,實現數據之間的協同工作,并對外提供統一服務。云存儲系統中的存儲層位于整個體系中的最底層,涉及光纖通道存儲設備、IP存儲設備、DAS存儲設備等多種類型的存儲設備,可以實現存儲的虛擬化管理、鏈路冗余以及物理硬件管理。為了保證數據加密的正常運行,首先在上述云存儲系統中采集數據樣本,一般來講云存儲中的數據包括文本數據、圖像數據、視頻數據、音頻數據等多種類型。分別設置數據的采樣范圍和采樣幅值,從而得出云存儲中的初始數據采樣結果。
在樣本數據的采集過程中可能會出現采集數據重復以及采集數據丟失的問題,因此在進行數據分類之前需要對初始樣本數據進行預處理。將采集的文本數據按照其語義順序以漢字或字母為單位進行排列,每一個固定單位劃分成一個數據塊并對其進行標記。分組完成后為每一個分組中的單位順序分配一個標號,每個標號代表對應單位在數據塊中的位置,使得標號向量與數據庫之間存在線性映射關系[3]。取兩個不同的數據塊數據對比兩組數據之間是否存在重復數據,若存在重復數據則直接刪除對應標號中所有的數據,否則進行下一組數據塊的對比,實現樣本數據中重復數據的刪除處理。
在樣本數據預處理結果的基礎上,進行數據的特征提取與融合,特征處理的目的是為數據的分類提供依據。文本特征選擇從高維空間選擇相關的信息特征,從而加速學習進程,提供模式泛化能力,減少實際應用程序的運行時間。文本特征提取的過程就是將云存儲中的數據樣本進行向量化表示,即將自然語言轉換成計算機可以直接讀取的數據語言。
通過多元特征融合的方式可以更加全面的提取并融合文本中的深層語義特征,拼接融合層采用合并拼接各個通路輸出向量的方式,將各個通路提取的文本特征向量拼接融合在一起,得出最終的云存儲中文本數據的多特征融合結果。同理將采集的圖像數據、視頻數據按照相同的方式進行特征的提取與融合,綜合所有的云存儲中多種數據特征的融合結果,并輸出綜合特征融合向量。
待分類數據類別即為所屬于文檔類別。同理可以將所有的標準類型數據向量與待分類問題的融合特征向量進行相似度的計算,直到得出相似度的最大值為止。
云存儲中分類分級數據的加密過程可以分為兩個階段,第一個階段就是數據塊隨機排序階段,第二個階段為數據塊的標號界面階段,具體的加密過程如圖1所示。

圖1 數據加密流程圖
首先根據分類分級數據塊的標號,利用隨機排序算法對云存儲數據F中的每一個數據塊對應的標號向量進行隨機排序,接著將數據庫與亂序標號進行逐一對應處理,并保證如下關系式成立。

此次性能對比實驗的測試目的是證明優化設計的融合多特征的云存儲中分類分級數據加密方法的應用性能,為了體現設計加密方法的優勢,此次實驗選擇對比實驗的研究模式,并采用多次測試取平均值的方式得出更加精準的測試結果。
通過對相關數據的統計與對比,分別從加密結果的安全性和加密時間開銷兩個方面,得出加密方法性能的測試對比結果。加密安全性能的測試與對比結果如表1所示。

表1 加密安全性能測試結果
從表1中可以看出,設計數據加密方法得出密文文件包的安全等級均為一級,即安全等級最高。從解密消耗時間來看,相比兩種對比加密方法,加密方法需要消耗的解密時間更多。由此可見設計的數據加密方法的加密結果安全性更高。
加密時間開銷分為兩個部分,一個是加密處理過程的時間開銷,另一部分為密文文件上傳到云存儲空間過程需要消耗的時間。經過綜合統計得出加密時間開銷的統計對比結果,如表2所示。

表2 加密時間開銷測試結果
從表中的數據統計對比情況可知,傳統數據加密方法和傳統方法中提出數據加密方法的平均加密處理時間分別為42.15s和31.33s,而設計的數據加密方法的平均加密處理時間為21.35s。
通過云存儲環境中分類分級數據加密方法的提出與應用,可以有效解決云存儲工作中存在的安全問題。然而設計的加密方法雖安全性較高,但存在解密時間過長的問題,這將是未來加密研究工作的重點研究和優化的方向。
[1]葉剛. 融合影像信息的LiDAR點云多特征分類方法[J]. 地理空間信息,2018,016(006):70-75.
[2]林子萱,金思靜,劉穎,等. 一種基于多特征融合的加密圖像檢索技術[J]. 海峽科學,2020,000(004):25-29,77.
[3]嚴新成,陳越,巴陽,等. 云環境下支持可更新加密的分布式數據編碼存儲方案[J]. 計算機研究與發展,2019,056(010):2170-2182.