陳希鋒 華南農(nóng)業(yè)大學(xué)珠江學(xué)院
通過(guò)改革開(kāi)放30多年的發(fā)展,我國(guó)互聯(lián)網(wǎng)技術(shù)都取得了突飛猛進(jìn)的發(fā)展,尤其是以互聯(lián)網(wǎng)技術(shù)為基礎(chǔ)的信息化平臺(tái)技術(shù),已經(jīng)實(shí)現(xiàn)了彎道超車。當(dāng)下大數(shù)據(jù),云計(jì)算都把數(shù)據(jù)量推到了前所未有的量級(jí)模式,為了更加高效快捷的處理相關(guān)信息。云計(jì)算突破了傳統(tǒng)的計(jì)算機(jī)計(jì)算能力,給人們生活帶來(lái)的極大的便利,與此同時(shí),所產(chǎn)生的信息不安全因素也越來(lái)越多。如何能保證云環(huán)境下信息安全數(shù)據(jù)泄露成為我們關(guān)注的主題。
我們所說(shuō)的云平臺(tái)一般由兩部分組成,一是客戶端,二是云端。用戶將文檔,圖片,視頻等數(shù)據(jù)經(jīng)過(guò)不安全的上傳通道,將數(shù)據(jù)上傳到云端。云服務(wù)商會(huì)將客戶的上傳數(shù)據(jù)進(jìn)行一次加密處理,以防止黑客對(duì)于云服務(wù)器的攻擊。一般的云平臺(tái)框架分為四層,用戶訪問(wèn)層數(shù)據(jù)服務(wù)處理層,數(shù)據(jù)服務(wù)管理層,數(shù)據(jù)存儲(chǔ)層。
數(shù)據(jù)用戶訪問(wèn)層,在開(kāi)通用戶只需要擁有訪問(wèn)權(quán)限,就可以通過(guò)手機(jī)移動(dòng)端或互聯(lián)網(wǎng)PC端,隨時(shí)隨地的通過(guò)相應(yīng)的端口對(duì)互聯(lián)網(wǎng)云平臺(tái)存儲(chǔ)設(shè)備進(jìn)行數(shù)據(jù)的存儲(chǔ)或讀取。
數(shù)據(jù)服務(wù)層,是個(gè)人用戶及網(wǎng)絡(luò)終端的交匯接口處主要起到的作用是對(duì)客戶的需求進(jìn)行有效反應(yīng),這其中包括備份數(shù)據(jù),共享數(shù)據(jù),獲取資源,請(qǐng)求存儲(chǔ)需求。
數(shù)據(jù)管理層,數(shù)據(jù)管理層在云存儲(chǔ)系統(tǒng)中主要起到的功能是管理多個(gè)存儲(chǔ)硬件設(shè)備,使之能夠協(xié)調(diào)工作將底層的數(shù)據(jù)存儲(chǔ)與上層的應(yīng)用銜接到一起,使他們能夠協(xié)調(diào)高效地為用戶提供良好的數(shù)據(jù)服務(wù)。
數(shù)據(jù)存儲(chǔ)層,數(shù)據(jù)云端存儲(chǔ)層是將服務(wù)器組成的集群存儲(chǔ)設(shè)備,通過(guò)虛化技術(shù)為客戶提供云端數(shù)據(jù)的存儲(chǔ)及隔離服務(wù)。
傳統(tǒng)的云平臺(tái)中端存儲(chǔ)數(shù)據(jù),雖然進(jìn)行了加密技術(shù)處理,擁有密鑰的服務(wù)商卻能夠通過(guò)。技術(shù)揭秘直接接觸到數(shù)據(jù)銘文。另外由于數(shù)據(jù)在傳輸過(guò)程中,客戶端與云端是以明文。傳輸?shù)挠嘘P(guān)數(shù)據(jù)。在這一過(guò)程中,所傳輸?shù)臄?shù)據(jù)非常容易被黑客截取。為了讓傳輸過(guò)程中信息更加機(jī)密??梢越档驮品?wù)商及黑客竊取數(shù)據(jù)的風(fēng)險(xiǎn)。需要在明文數(shù)據(jù)進(jìn)入云端之前進(jìn)行前期的數(shù)據(jù)加密處理。

圖1
為了解決上傳數(shù)據(jù)更加保密的問(wèn)題,我們?cè)O(shè)計(jì)出了一個(gè)系統(tǒng)模型,在該系統(tǒng)模型中。在用戶端對(duì)數(shù)據(jù)進(jìn)行加密密文數(shù)據(jù)的上傳與下載,以及用戶的個(gè)人身份確認(rèn)三部分進(jìn)行。完善及改進(jìn)。在云端存儲(chǔ)過(guò)程中,主要把數(shù)據(jù)檢索,文件檢索及數(shù)據(jù)存儲(chǔ)三部分加以改進(jìn)。如圖1所示:
第一,數(shù)據(jù)的有效存儲(chǔ)。用戶將數(shù)據(jù)上傳到云端存儲(chǔ)。有關(guān)秘聞?dòng)糜趯?duì)稱加密算法,加密過(guò)程中的關(guān)鍵詞集合及非關(guān)鍵詞集合以及檢索詞的屬性信息等是文檔資源池。云端服務(wù)器會(huì)通過(guò)該模型進(jìn)行合理的虛擬,從而區(qū)分所存儲(chǔ)的數(shù)據(jù)。另外云端數(shù)據(jù)存儲(chǔ)區(qū)也存儲(chǔ)相關(guān)的數(shù)據(jù),進(jìn)而共享相關(guān)權(quán)限。
第二,數(shù)據(jù)秘聞的檢索?;ヂ?lián)網(wǎng)用戶將數(shù)據(jù)檢索詞進(jìn)行對(duì)稱,加密處理后上傳到云端。云端存儲(chǔ)服務(wù)器就會(huì)對(duì)檢索文獻(xiàn)進(jìn)行有效的檢索,如果找到了匹配的相關(guān)檢索詞,就會(huì)通過(guò)檢索文件進(jìn)行有關(guān)的查找。通過(guò)數(shù)據(jù)指向倒排文件的某一個(gè)區(qū)域,進(jìn)而通過(guò)倒排文件區(qū)域找到相關(guān)的檢索文件。最后在云端計(jì)算出相關(guān)的檢索詞和這些有關(guān)的文檔之間的關(guān)聯(lián)度,進(jìn)而根據(jù)相關(guān)關(guān)聯(lián)度的大小將文檔進(jìn)行有效的排序,然后將這些文檔反饋給用戶。
第三,數(shù)據(jù)文件的索引。當(dāng)互聯(lián)網(wǎng)用戶需要索引時(shí),云端系統(tǒng)通過(guò)。索引的文件對(duì)數(shù)據(jù)進(jìn)行匹配檢索。為了更好地建立索引文件,需要解決兩方面的問(wèn)題。一是如何對(duì)文本進(jìn)行有效的區(qū)分,二是如何建立起云數(shù)據(jù)結(jié)構(gòu)的索引。文件生成的索引大小以及分詞的準(zhǔn)確與否,該系統(tǒng)都采用中文分詞法。用戶端需要對(duì)數(shù)據(jù)銘文進(jìn)行有效的中文分詞并將該有效的分詞結(jié)果進(jìn)行系統(tǒng)的加密為了使得數(shù)據(jù)加密的效率不影響,所以該處需要采用對(duì)稱加密的算法。這樣將對(duì)稱加密后的磁條以及全銅加密后的有效文檔一起高速地傳送至云端存儲(chǔ)服務(wù)器中。然后基于這些詞條,在數(shù)據(jù)云端存儲(chǔ)中有效的構(gòu)建倒排索引。這里我們所說(shuō)的倒排索引是指將每一個(gè)單詞作為一個(gè)索引項(xiàng),然后根據(jù)該索引項(xiàng)查找有關(guān)單詞所在的文檔文本。
最后,秘聞的上傳和下載模塊用于云端及。戶端的數(shù)據(jù)高速傳輸,為了有效地防止數(shù)據(jù)泄密以及黑客攻擊,云端存儲(chǔ)服務(wù)器會(huì)對(duì)存儲(chǔ)在云端的數(shù)據(jù)進(jìn)行再次加密,該模塊中包含了上傳數(shù)據(jù)時(shí),云端存儲(chǔ)服務(wù)器數(shù)據(jù)的二次加密,以及用戶在下載云端數(shù)據(jù)時(shí)數(shù)據(jù)的解密過(guò)程。
由于本文的字?jǐn)?shù)限制,無(wú)法對(duì)相關(guān)技術(shù)進(jìn)行更加深入的探討,本文通過(guò)對(duì)云存儲(chǔ)數(shù)據(jù)平臺(tái)模擬的簡(jiǎn)單結(jié)構(gòu)介紹分析了有關(guān)數(shù)據(jù),通過(guò)用戶端上傳以及云端存儲(chǔ)所存在的風(fēng)險(xiǎn)并針對(duì)該風(fēng)險(xiǎn)提出了相關(guān)的數(shù)據(jù)解決辦法,在此基礎(chǔ)上進(jìn)行了相關(guān)數(shù)據(jù)加密解密的流程闡釋。為有關(guān)研究人員提供了粗淺的意見(jiàn)。希望本文章能夠?qū)罄m(xù)云端存儲(chǔ)數(shù)據(jù)泄密保護(hù)工作有些許的參考意義。