紀(jì) 倩 楊 超 趙文紅 張俊偉
?
一種新的云存儲(chǔ)數(shù)據(jù)容錯(cuò)存儲(chǔ)方式檢驗(yàn)方法
紀(jì) 倩①楊 超*①趙文紅②張俊偉①
①(西安電子科技大學(xué)計(jì)算機(jī)學(xué)院 西安 710071)②(嘉興學(xué)院南湖學(xué)院 嘉興 314001)
云存儲(chǔ)中,防止數(shù)據(jù)丟失的關(guān)鍵是實(shí)現(xiàn)文件容錯(cuò)。然而,云存儲(chǔ)服務(wù)商可能沒有提供承諾的容錯(cuò)水平,導(dǎo)致用戶蒙受數(shù)據(jù)丟失和經(jīng)濟(jì)損失的雙重風(fēng)險(xiǎn)。現(xiàn)有云存儲(chǔ)數(shù)據(jù)容錯(cuò)存儲(chǔ)方式檢驗(yàn)方法存在服務(wù)器預(yù)讀取欺騙攻擊,并且效率低、實(shí)用性差,不能達(dá)到在一定概率范圍內(nèi),快速、輕量級(jí)地檢測(cè)出犯規(guī)的服務(wù)器行為的要求。針對(duì)上述問題,該文利用磁盤順序存取和隨機(jī)存取的差異性設(shè)計(jì)了一種遠(yuǎn)程數(shù)據(jù)容錯(cuò)存儲(chǔ)方式檢驗(yàn)方法隨機(jī)與順序訪問時(shí)間差異化(DRST)方法,其原理是文件塊被分散地放在不同磁盤上,讀取一個(gè)磁盤上順序存儲(chǔ)的文件塊比隨機(jī)讀取不同磁盤上的文件塊所需的響應(yīng)時(shí)間短。最后,對(duì)所提方法進(jìn)行了嚴(yán)格的理論證明和深入的性能分析,結(jié)果表明,所提方法能夠快速檢驗(yàn)出服務(wù)器是否為用戶提供了其承諾的容錯(cuò)水平,并且比現(xiàn)有方案更安全,更高效。
云存儲(chǔ);云文件安全;數(shù)據(jù)容錯(cuò)能力;隨機(jī)存取;順序存取
云存儲(chǔ)中安全問題是用戶最大的質(zhì)疑和擔(dān)心。用戶將數(shù)據(jù)放到云端,就喪失了對(duì)數(shù)據(jù)的絕對(duì)控制權(quán)。實(shí)際的云存儲(chǔ)環(huán)境下,數(shù)據(jù)主要分布存儲(chǔ)在數(shù)據(jù)中心上,存儲(chǔ)其上的數(shù)據(jù)規(guī)模往往達(dá)到PB級(jí)甚至EB級(jí),數(shù)據(jù)失效成了一種常態(tài)行為,極大地限制了云存儲(chǔ)的應(yīng)用和推廣[1]。因此,云存儲(chǔ)系統(tǒng)的數(shù)據(jù)容錯(cuò)十分重要,直接關(guān)系到整個(gè)系統(tǒng)的可用性。
早先,文獻(xiàn)[6,7]采用糾錯(cuò)碼與隨機(jī)抽樣相結(jié)合的請(qǐng)求響應(yīng)式協(xié)議進(jìn)行了數(shù)據(jù)擁有證明(PDPs)[8]和可恢復(fù)性證明(PORs),用于遠(yuǎn)程驗(yàn)證存儲(chǔ)在云端的文件的完整性。發(fā)表于2011年ACM CCS的文獻(xiàn)[3]針對(duì)遠(yuǎn)程驗(yàn)證云服務(wù)供應(yīng)商是否將文件均衡存儲(chǔ)在多個(gè)磁盤設(shè)備的問題,首次提出了一種實(shí)用性評(píng)估方法RAFT(Remote Assessment of Fault Tolerance)。其核心思路是用戶與服務(wù)商事先商量,就文件布局策略達(dá)成一致的前提下,將文件分配到多個(gè)磁盤,磁盤數(shù)目越多,文件塊分布越均衡,服務(wù)器并行讀取文件塊的速度越快,若服務(wù)商使用較少的磁盤或文件分布不均衡,會(huì)使響應(yīng)時(shí)間變長(zhǎng),以此來(lái)判斷服務(wù)商沒有將文件存儲(chǔ)到承諾的多個(gè)磁盤上。但RAFT方案在安全性及實(shí)用效率方面存在如下2個(gè)問題:
(1)服務(wù)器預(yù)讀取的欺騙攻擊: 若服務(wù)器沒有按照要求根據(jù)上一步訪問的文件塊內(nèi)容做哈希產(chǎn)生下一步要讀取的塊序號(hào),而是把預(yù)先讀取的塊作為隨機(jī)產(chǎn)生的請(qǐng)求塊返回,從而使響應(yīng)時(shí)間降低,用戶將無(wú)法根據(jù)響應(yīng)時(shí)間察覺服務(wù)商的作弊行為,就會(huì)被云服務(wù)供應(yīng)商所欺騙,數(shù)據(jù)被置于極大的丟失風(fēng)險(xiǎn)中。。
(2)效率低實(shí)用性差: 該方案本質(zhì)上只利用了數(shù)據(jù)并行讀取和串行讀取的時(shí)間差,該時(shí)間差比較小,尤其是在高性能磁盤情況下,要區(qū)分誠(chéng)實(shí)服務(wù)商與狡詐服務(wù)商,需要進(jìn)行很多步請(qǐng)求,才能使總的時(shí)間差比較明顯,性能較低。
文獻(xiàn)[11,12]也針對(duì)遠(yuǎn)程驗(yàn)證云服務(wù)供應(yīng)商是否將文件均衡存儲(chǔ)在多個(gè)磁盤設(shè)備的問題提出了新方案,其主要特點(diǎn)是文件被隨機(jī)存儲(chǔ)于任意磁盤上,要求云服務(wù)供應(yīng)商針對(duì)不同程度的容錯(cuò)冗余程度發(fā)布官方的響應(yīng)時(shí)間。但實(shí)際上,由于文件存儲(chǔ)布局是隨機(jī)的,即使存儲(chǔ)文件的冗余程度相同,其響應(yīng)時(shí)間也可能不盡相同,因此要求服務(wù)商提供官方的響應(yīng)時(shí)間不合理,而且文獻(xiàn)[12,13]缺少相關(guān)的性能分析、評(píng)估及對(duì)比。
2.1 DRST方法設(shè)計(jì)思想
服務(wù)供應(yīng)商可能是廉價(jià)且懶惰的[3],即存儲(chǔ)較少的冗余在較少的磁盤上,這些“狡詐服務(wù)供應(yīng)商”可能提供不合格的容錯(cuò),但不會(huì)惡意攻擊故障磁盤的安全漏洞。針對(duì)這個(gè)問題,新方案的設(shè)計(jì)思路是文件塊被分散地放到不同的磁盤上,讀取一個(gè)磁盤上順序存儲(chǔ)的文件塊比隨機(jī)讀取不同磁盤上的文件塊所需的響應(yīng)時(shí)間短。即基于磁盤順序存取和隨機(jī)存取的差異性,我們?cè)O(shè)計(jì)了一種遠(yuǎn)程數(shù)據(jù)容錯(cuò)存儲(chǔ)方式檢驗(yàn)方法DRST,該方案不僅可以檢測(cè)服務(wù)商是否將文件分布存儲(chǔ)在多個(gè)磁盤上,還可以證明文件分布是否均衡。
DRST方法特點(diǎn):(1)在服務(wù)器端按照規(guī)定的存儲(chǔ)策略存儲(chǔ)文件的前提下,由用戶端提出請(qǐng)求向服務(wù)器端說明每一步要讀取的文件塊序號(hào),服務(wù)器并不知道用戶端下一步要讀取哪一塊,無(wú)法預(yù)取來(lái)迷惑用戶,可防止服務(wù)器將預(yù)取的文件塊返回;(2)每步只請(qǐng)求一個(gè)文件塊,多步請(qǐng)求的文件塊實(shí)際是順序放在一個(gè)磁盤上的,而服務(wù)器事先不知道也無(wú)法預(yù)測(cè),若服務(wù)商不誠(chéng)實(shí)沒有遵守約定,而使用較少磁盤的話,文件塊可能分布在不同磁盤上,這樣讀取的文件塊的存儲(chǔ)位置呈現(xiàn)一定的隨機(jī)性,尋道次數(shù)增多,用戶則可通過變長(zhǎng)的響應(yīng)時(shí)間辨別服務(wù)質(zhì)量。由于磁盤隨機(jī)讀取和順序讀取的時(shí)間差相對(duì)較長(zhǎng),使用較少的步數(shù),便可快速、輕量級(jí)地檢測(cè)出犯規(guī)的服務(wù)器行為。
2.2 DRST方法詳細(xì)設(shè)計(jì)

圖1 用戶端與云服務(wù)商交互圖
具體步驟如下:
3.1 DRST方法安全性分析
本文方案的設(shè)計(jì)目標(biāo)是通過多步請(qǐng)求來(lái)識(shí)別在容錯(cuò)級(jí)別上欺騙用戶的存儲(chǔ)服務(wù)商,具體來(lái)講,用戶與存儲(chǔ)服務(wù)器事先約定好存儲(chǔ)布局,然后通過隨機(jī)多步的挑戰(zhàn)響應(yīng)交互時(shí)間差來(lái)判別存儲(chǔ)服務(wù)商是否按照用戶要求對(duì)數(shù)據(jù)進(jìn)行了容錯(cuò)存儲(chǔ)。本文方案使得存儲(chǔ)服務(wù)器在約定好的容錯(cuò)級(jí)別和存儲(chǔ)布局的前提下,不能通過預(yù)先讀取等手段來(lái)欺騙用戶,除非存儲(chǔ)服務(wù)器可以提前猜測(cè)到用戶隨機(jī)的數(shù)據(jù)塊請(qǐng)求順序。實(shí)際上,我們有定理1如下:
定理1 對(duì)于所提出的DRST方法,如果隨機(jī)數(shù)據(jù)請(qǐng)求的次數(shù)為,存儲(chǔ)服務(wù)器能欺騙用戶通過容錯(cuò)級(jí)別驗(yàn)證的復(fù)雜度遠(yuǎn)遠(yuǎn)小于猜中隨機(jī)數(shù)的概率,即。
證明 假設(shè)用戶在DRST方法中對(duì)存儲(chǔ)服務(wù)器進(jìn)行次隨機(jī)數(shù)據(jù)塊的請(qǐng)求,遠(yuǎn)程的存儲(chǔ)服務(wù)器能夠在沒有按照容錯(cuò)級(jí)別要求存儲(chǔ)用戶數(shù)據(jù)的前提下通過DRST方法的挑戰(zhàn)應(yīng)答響應(yīng),使得用戶不能覺察響應(yīng)時(shí)間較長(zhǎng),即用戶返回驗(yàn)證正確,進(jìn)而欺騙用戶已經(jīng)達(dá)到承諾的容錯(cuò)水平。這需要遠(yuǎn)程存儲(chǔ)服務(wù)器對(duì)用戶的次隨機(jī)數(shù)據(jù)請(qǐng)求的響應(yīng)時(shí)間(包括磁盤尋道和數(shù)據(jù)讀取時(shí)間)與同一個(gè)磁盤上順序存放數(shù)據(jù)塊請(qǐng)求的響應(yīng)時(shí)間非常接近,即,其中是個(gè)可以忽略的值。即,需要遠(yuǎn)程存儲(chǔ)服務(wù)器讀取隨機(jī)磁盤位置數(shù)據(jù)的時(shí)間與讀取順序磁盤位置數(shù)據(jù)的時(shí)間幾乎一樣。為了達(dá)到這樣的要求,要么磁盤尋道不需要時(shí)間,要么服務(wù)器能提前預(yù)先讀取數(shù)據(jù)塊。當(dāng)磁盤尋道不需要時(shí)間為真時(shí),這與現(xiàn)有物理磁盤尋道時(shí)間不為零相互矛盾;當(dāng)服務(wù)器能提前預(yù)先讀取數(shù)據(jù)塊為真時(shí),這要求服務(wù)器能正確猜測(cè)用戶次的隨機(jī)位置的數(shù)據(jù)請(qǐng)求,在這種情況下,假設(shè)一個(gè)磁盤可存放數(shù)據(jù)的位置共有處,則服務(wù)器正確猜測(cè)次用戶隨機(jī)位置的數(shù)據(jù)請(qǐng)求的概率為;因?yàn)楸疚姆桨傅牟樵兇螖?shù)一般小于100,而磁盤的數(shù)據(jù)存儲(chǔ)位置一般要比100大幾個(gè)數(shù)量級(jí),所以,即,則;進(jìn)一步而言,當(dāng)時(shí),正確猜測(cè)次用戶隨機(jī)位置的數(shù)據(jù)請(qǐng)求的概率為比直接正確猜測(cè)一個(gè)128比特位的加密密鑰還要小。
證畢
3.2 DRST方法性能的理論分析
根據(jù)DRST方法,誠(chéng)實(shí)服務(wù)商讀取文件塊時(shí)間:
狡詐服務(wù)商讀取文件塊時(shí)間:
時(shí)間差:
RAFT方法[3]中誠(chéng)實(shí)服務(wù)商讀取文件塊時(shí)間:
狡詐服務(wù)商讀取文件塊時(shí)間:
時(shí)間差:
其中,表示請(qǐng)求讀取的文件塊數(shù),表示誠(chéng)實(shí)服務(wù)商存儲(chǔ)文件使用的磁盤數(shù)目,表示狡詐服務(wù)商存儲(chǔ)文件使用的磁盤數(shù)目,是網(wǎng)絡(luò)延遲間,是磁盤尋道時(shí)間與讀取文件塊的總時(shí)間,。根據(jù)文獻(xiàn)[3]前期研究,云服務(wù)商按每塊64 kB來(lái)存儲(chǔ)文件效率最高,平均值約為6 ms,平均值約為3.4 ms,即, DRST和RAFT方法的差別如下:
3.3 DRST方法性能的測(cè)試與分析
文獻(xiàn)[1]對(duì)RAFT方法進(jìn)行了測(cè)試,并在相同網(wǎng)絡(luò)條件下對(duì)誠(chéng)實(shí)服務(wù)商和狡詐服務(wù)商具體的延遲時(shí)間進(jìn)行了實(shí)驗(yàn),結(jié)果表明網(wǎng)絡(luò)延遲時(shí)間分布穩(wěn)定,因此本文測(cè)試實(shí)驗(yàn)不關(guān)心網(wǎng)絡(luò)延遲。本小節(jié)對(duì)DRST方法進(jìn)行測(cè)試,與文獻(xiàn)[1]中RAFT方法的測(cè)試結(jié)果進(jìn)行對(duì)比。根據(jù)3.2式(3)及式(6),要區(qū)分誠(chéng)實(shí)服務(wù)商與狡詐服務(wù)商,DRST方法與即磁盤尋道時(shí)間有關(guān),RAFT方法與,即磁盤尋道時(shí)間與讀取文件塊的總時(shí)間有關(guān),。本測(cè)試旨在對(duì)比兩個(gè)方案的性能,不需要對(duì)兩個(gè)方案相同的網(wǎng)絡(luò)延遲時(shí)間進(jìn)行測(cè)試與比較,只需進(jìn)行DRST的核心步驟即發(fā)送請(qǐng)求、讀取文件塊及記錄響應(yīng)時(shí)間,最后與文獻(xiàn)[1]中RAFT方法的測(cè)試時(shí)間進(jìn)行比較。
3.3.1 DRST測(cè)試場(chǎng)景與測(cè)試方案
(1)測(cè)試場(chǎng)景: 由于不關(guān)心網(wǎng)絡(luò)延遲,我們?cè)诒镜卮罱藴y(cè)試系統(tǒng),使用HP Compad dx7408 MT DT PC主機(jī),具有ms-7352主板,雙核Intel(R) Core (TM)2 Duo CPU E8400 @3.00 GHz, 2 GB內(nèi)存,其上掛載4個(gè)空的Seagate Barracuda 7200.10.250 G硬盤,平均尋道時(shí)間為3.4 ms,安裝Ubuntu-14.04系統(tǒng),C語(yǔ)言編寫測(cè)試程序。
(2)測(cè)試方案: 所服務(wù)商承諾,在4個(gè)磁盤上存儲(chǔ)一個(gè)大小為2 GB的文件,根據(jù)DRST步驟3的算法,若服務(wù)商是誠(chéng)實(shí)的,將如圖2所示存儲(chǔ)文件,若服務(wù)商是狡詐的,就可能使用較少數(shù)量的磁盤,如使用3個(gè)磁盤,如圖3,圖中只畫出部分塊,每塊64 kB。可以看到圖3每個(gè)磁盤上存儲(chǔ)的文件塊集合與約定的形式有很大差異。該情況下,根據(jù)DRST方法不難檢測(cè)出服務(wù)商的犯規(guī)行為。用戶端向服務(wù)商提出讀取文件塊請(qǐng)求,發(fā)出多步請(qǐng)求,如依次請(qǐng)求第1號(hào),第5號(hào),第9號(hào),第13號(hào),發(fā)出51步請(qǐng)求。若服務(wù)商是誠(chéng)實(shí)的,按照規(guī)定的策略存儲(chǔ)文件,那么第1號(hào),第5號(hào),第9號(hào),第13號(hào)剛好位于同一磁盤,服務(wù)器只需順序訪問1, 5, 9, 13,即可,只需要一次尋道時(shí)間。若服務(wù)商是狡詐的,本應(yīng)在一個(gè)磁盤上順序存儲(chǔ)的文件塊就會(huì)分散存儲(chǔ)到其他磁盤上,出現(xiàn)一定的隨機(jī)性,如圖3,此時(shí)要讀取1, 5, 9, 13,,就需要多次尋道時(shí)間,使總的響應(yīng)時(shí)間變長(zhǎng)。因此,我們可以記錄讀取文件塊的響應(yīng)時(shí)間,若時(shí)間在一定的范圍內(nèi),則認(rèn)為服務(wù)商是誠(chéng)實(shí)的,否則,認(rèn)為服務(wù)商有犯規(guī)行為。

圖2 誠(chéng)實(shí)服務(wù)商存儲(chǔ)文件形式(4個(gè)磁盤)

圖3 狡詐服務(wù)商存儲(chǔ)文件形式(3個(gè)磁盤)
3.3.2 DRST測(cè)試數(shù)據(jù) 按照上述測(cè)試方案及參數(shù),我們進(jìn)行了200次實(shí)驗(yàn)得到200組數(shù)據(jù)。本應(yīng)順序存放在1個(gè)磁盤上的文件塊被狡詐服務(wù)商分散存儲(chǔ)到了3個(gè)磁盤上,用戶發(fā)出51步請(qǐng)求,記錄每一步讀取文件塊的時(shí)間,1表示隨機(jī)讀取51塊的總時(shí)間。誠(chéng)實(shí)服務(wù)商按照承諾將文件分配到4個(gè)磁盤,我們所請(qǐng)求的文件塊剛好存儲(chǔ)在1個(gè)磁盤上,用戶同樣發(fā)出51步請(qǐng)求,2表示順序讀取51塊的總時(shí)間。將200組1和2進(jìn)行統(tǒng)計(jì),表1展示出部分?jǐn)?shù)據(jù)。

表1 51步狡詐服務(wù)商和誠(chéng)實(shí)服務(wù)商讀取時(shí)間
3.3.3 DRST測(cè)試結(jié)果分析 根據(jù)200次實(shí)驗(yàn)統(tǒng)計(jì)的200組數(shù)據(jù),我們求出狡詐服務(wù)商的平均響應(yīng)時(shí)間,最短響應(yīng)時(shí)間,及誠(chéng)實(shí)服務(wù)商的平均響應(yīng)時(shí)間,最長(zhǎng)響應(yīng)時(shí)間。我們將通過這4個(gè)參數(shù)與RAFT方法[3]進(jìn)行對(duì)比。
(1)平均情況: 根據(jù)統(tǒng)計(jì)數(shù)據(jù)得到1和2分布圖,如圖4和圖5。將1和2畫于圖6,每次實(shí)驗(yàn)兩者均有明顯差異,說明我們利用順序讀取和隨機(jī)讀取的尋道時(shí)間差來(lái)區(qū)分誠(chéng)實(shí)與狡詐服務(wù)商是可行的且有效的。

圖4 51步隨機(jī)讀取時(shí)間T1(ms)分布圖

圖5 51步順序讀取時(shí)間T2(ms)分布圖

圖6 51步隨機(jī)讀取時(shí)間T1(ms) 和順序讀取時(shí)間T2(ms)分布圖
(2)完全區(qū)分情況: 根據(jù)統(tǒng)計(jì)數(shù)據(jù)得到1和2概率分布圖如圖7和圖8。將1和2畫于圖9,1和2分布的范圍相距較遠(yuǎn),更有力地說明我們利用順序讀取和隨機(jī)讀取的尋道時(shí)間差來(lái)區(qū)分誠(chéng)實(shí)與狡詐服務(wù)商是有效的。

圖7 51步隨機(jī)讀取時(shí)間T1概率分布圖

圖8 51步順序讀取時(shí)間T2概率分布圖

圖9 51步隨機(jī)讀取時(shí)間T1(ms)和順序讀取時(shí)間T2(ms)概率分布圖
本文的DRST方法只需要51步就能達(dá)到99 ms的時(shí)間差來(lái)完全區(qū)分誠(chéng)實(shí)服務(wù)商與狡詐服務(wù)商,而文獻(xiàn)[3]中RAFT方法需使用100步才能達(dá)到107 ms的時(shí)間差,如圖10。

圖10 100步完全區(qū)分誠(chéng)實(shí)服務(wù)商與狡詐服務(wù)商概率分布圖
從以上兩方面的數(shù)據(jù)分析結(jié)果,可以得出:
(1)平均情況下,DRST方法用50步達(dá)到約149 ms的時(shí)間差,與理論預(yù)測(cè)的170 ms相差不多,即實(shí)際測(cè)試和理論預(yù)測(cè)在一定的誤差范圍內(nèi)是匹配的,說明本文的理論是可信的,測(cè)試是可靠的,進(jìn)一步說明DRST方法優(yōu)于RAFT方法。
(2)完全區(qū)分誠(chéng)實(shí)與狡詐服務(wù)商的情況下,DRST方法使用51步就可達(dá)到約99 ms的時(shí)間差。相同情況下RAFT方法使用100步才能達(dá)到107 ms的時(shí)間差。本文方法使用的步數(shù)約是RAFT方法的一半,效率提高了一倍。
(3)本文采用由用戶端提出請(qǐng)求,每步都向服務(wù)器說明要讀取的文件塊序號(hào),服務(wù)器并不知道也無(wú)法預(yù)測(cè)用戶端下一步要讀取哪一塊,無(wú)法預(yù)取來(lái)迷惑用戶,可防止服務(wù)器將預(yù)取的文件塊返回,DRST方法更安全。
(4)RAFT方法中,不論是誠(chéng)實(shí)服務(wù)商還是狡詐服務(wù)商,進(jìn)行遠(yuǎn)程驗(yàn)證時(shí)服務(wù)器都需要從多個(gè)磁盤讀取文件,開銷大;本文的DRST方法中若是誠(chéng)實(shí)服務(wù)商,只需要從一個(gè)磁盤讀取文件,更節(jié)省開銷。
(5)DRST方法最重要的價(jià)值在于,以測(cè)試數(shù)據(jù)為基準(zhǔn)可以檢測(cè)云存儲(chǔ)數(shù)據(jù)存儲(chǔ)方式,即判斷服務(wù)商是否是按約定將文件均衡存儲(chǔ)在多個(gè)磁盤的。例如,用戶端發(fā)出51步請(qǐng)求,記錄響應(yīng)時(shí)間并驗(yàn)證文件塊的正確性,多次測(cè)試求平均值,減去實(shí)時(shí)網(wǎng)絡(luò)傳輸時(shí)延,若時(shí)間落在 71~83 ms之間則認(rèn)為是遵守承諾的,若響應(yīng)時(shí)間更長(zhǎng)說明服務(wù)商有犯規(guī)行為,存儲(chǔ)文件時(shí)使用了較少的磁盤。因此,可事先進(jìn)行多次實(shí)驗(yàn)求平均值,將該平均值作為后續(xù)用戶進(jìn)行判斷的依據(jù),方便更多的用戶方便、輕量級(jí)地辨別云服務(wù)提供商是否作弊。
綜上所述,本文的DRST方法效率更高,更安全,能夠?qū)崿F(xiàn)快速、輕量級(jí)地檢測(cè)出犯規(guī)的服務(wù)器行為的要求,從而判斷服務(wù)商是否是按照約定將文件均衡存儲(chǔ)在多個(gè)磁盤,具有很高的應(yīng)用價(jià)值。
云計(jì)算作為一種新型的計(jì)算模式,在科學(xué)計(jì)算和商業(yè)領(lǐng)域發(fā)揮著重要作用,受到當(dāng)前學(xué)術(shù)界和企業(yè)界的廣泛關(guān)注。用戶對(duì)云文件的依賴性日益增長(zhǎng),越來(lái)越多的數(shù)據(jù)存儲(chǔ)于數(shù)據(jù)中心中,但云服務(wù)宕機(jī)事件越來(lái)越多。防止數(shù)據(jù)損壞和丟失的關(guān)鍵是云存儲(chǔ)實(shí)現(xiàn)文件容錯(cuò),云存儲(chǔ)供應(yīng)商通常會(huì)按照要求的容錯(cuò)水平收費(fèi)。然而,云存儲(chǔ)服務(wù)商可能無(wú)法提供承諾的容錯(cuò)水平,用戶可能蒙受數(shù)據(jù)丟失和經(jīng)濟(jì)損失。
現(xiàn)有云存儲(chǔ)環(huán)境下數(shù)據(jù)容錯(cuò)存儲(chǔ)方式的檢驗(yàn)方法可能存在服務(wù)器預(yù)讀取的欺騙攻擊及效率較低實(shí)用性差的缺點(diǎn)。針對(duì)該問題,本文在研究已有檢驗(yàn)方法的基礎(chǔ)上,利用磁盤順序存取和隨機(jī)存取的差異性設(shè)計(jì)了一種遠(yuǎn)程數(shù)據(jù)容錯(cuò)存儲(chǔ)方式檢驗(yàn)方法DRST,該方法本質(zhì)是文件塊被分散地存儲(chǔ)在不同的磁盤上,讀取一個(gè)磁盤上順序存儲(chǔ)的文件塊比讀取不同磁盤上的隨機(jī)塊所需的響應(yīng)時(shí)間短。最后對(duì)所提方法進(jìn)行了嚴(yán)格的理論證明和深入的性能分析,結(jié)果表明,本文方法能夠快速、輕量級(jí)地檢測(cè)出犯規(guī)的服務(wù)器行為,從而判斷服務(wù)商是否是按照約定將文件均衡存儲(chǔ)在多個(gè)磁盤,具有很高的應(yīng)用價(jià)值。
[1] Chinese Institute of Electronics. Future oriented cloud service providers[C]. The Seventh Annual China Cloud Computing Conference, Beijing, China, 2015: 1080-1092.
[2] BARACALDO N, ANDROULAKI E, GLIDER J,. Reconciling end-to-end confidentiality and data reduction in cloud storage[C]. Proceedings of the 6th ACM Workshop on Cloud Computing Security, Scottsdale, AZ, USA, 2014: 4003-4108.
[3] BOWERS K, DIJK M, JUELS A,. How to tell if your cloud files are vulnerable to drive crashes[C]. Proceedings of the 18th ACM Conference on Computer and Communications Security (CCS), Chicago, IL, USA, 2011: 2780-2814.
[4] LORENA G and ORFILA A. An efficient confidentiality- preserving proof of ownership for deduplication[J]., 2015, 50: 49-59.
[5] LI M, QIN C, and LEE P. CDStore: toward reliable, secure, and cost-efficient cloud storage via convergent dispersal[C]. Proceedings of the 2015 USENIX Conference on Usenix Annual Technical Conference, Santa Clara, CA, USA, 2015: 3508-3520.
[6] JUELS A and KALISKI B. PORs–proofs of retrievability for large files[C]. Proceedings of the 14th ACM Conference on Computer and Communications Security (CCS), Alexandia, USA, 2007: 584-597.
[7] SHACHAM H and WATERS B. Compact proofs of retrievability[C]. Asiacrypt 2008, Springer-Verlag, Josef Pieprzyk, 2008: 90-107.
[8] ATENIESE G, BURNS R, CURTMOLA R,. Provable data possession at untrusted stores[C]. Proceedings of the 14th ACM Conference on Computer and Communications Security (CCS), Alexandia, USA, 2007: 598-609.
[9] DODIS Y, VADHAN S, and WICHS D. Proofs of retrievability via hardness amplification[C]. Theory of Cryptography Conference (TCC), San Francisco, USA, 2009: 235-248.
[10] CURTMOLA R, KHAN O, BURNS R,. MR.PDP: Multiple-replica provable data possession[C]. Proceedings of 28th IEEE International Conference on Distributed Computing Systems (ICDCS), Beijing, China, 2008: 767-779.
[11] WANG Z, SUN K, JING J,. Disk storage isolation and verication in cloud[C]. Proceedings of the Globecom, Anaheim, USA, 2012: 898-910.
[12] WANG Z, SUN K, JING J,. Verification of data redundancy in cloud storage[C]. Proceedings of the International Workshop on Security in Cloud Computing, Hangzhou, China, 2013: 457-468.
New Method for Checking the Data Stored with Fault Tolerance in Cloud
JI Qian①YANG Chao①ZHAO Wenhong②ZHANG Junwei①
①(,,,710071,)②(,,314001,)
Implementation of file fault tolerance is the key for preventing data loss in cloud. However, cloud storage service providers may not offer the committed level, which results in that users may suffer data loss and economic loss. Existing inspection algorithms of testing of data fault tolerance in cloud have disadvantages such as spoofing attack of pre-fetch, low efficiency and poor practicality, which can not detect the foul behavior of cloud storage providers within a certain probability. To deal with the above problems, utilizing the difference of sequential access and random access, a remote testing algorithm of data fault tolerance in cloud named (Difference of Random and Sequential access Time) (DRST) is designed. The core idea is that the time of reading blocks of a file stored in order on a disk is much shorter than reading blocks of a file stored random on different disks. A strict theoretical proof and a in-depth performance analysis to the proposed scheme are carried out. The results show that the proposed scheme can accurately detect whether the cloud storage provider supplies clients with the committed level of fault tolerance.What’s more, the proposed scheme is much more efficient than the existing ones.
Cloud storage; Cloud file security; Data fault tolerance; Random access; Sequential access
TP309
A
1009-5896(2016)10-2640-07
10.11999/JEIT151344
2015-12-01;改回日期:2016-07-12;網(wǎng)絡(luò)出版:2016-08-26
楊超 chaoyang@mail.xidian.edu.cn
國(guó)家自然科學(xué)基金青年基金(61303219),國(guó)家自然科學(xué)基金(61672415),中央高校基本科研業(yè)務(wù)費(fèi)(JB140303)
The National Natural Science Youth Foundation of China (61303219), The National Natural Science Foundation of China (61672415), The Fundamental Research Funds for the Central Universities (JB140303)
紀(jì) 倩: 女,1989年生,博士生,研究方向?yàn)樵拼鎯?chǔ)安全、云存儲(chǔ)文件去重刪除.
楊 超: 男,1979年生,博士,副教授,主要研究領(lǐng)域?yàn)榇髷?shù)據(jù)與云計(jì)算的安全、移動(dòng)智能計(jì)算的安全.
趙文紅: 女,1985年生,碩士,講師,主要研究領(lǐng)域?yàn)闊o(wú)線網(wǎng)絡(luò)安全、密碼學(xué)、協(xié)議的形式化分析與設(shè)計(jì).
張俊偉: 男,1981年生,博士,副教授,主要研究領(lǐng)域?yàn)闊o(wú)線網(wǎng)絡(luò)安全、密碼學(xué)、協(xié)議的形式化分析與設(shè)計(jì).