999精品在线视频,手机成人午夜在线视频,久久不卡国产精品无码,中日无码在线观看,成人av手机在线观看,日韩精品亚洲一区中文字幕,亚洲av无码人妻,四虎国产在线观看 ?

一種武警云計(jì)算環(huán)境下集群重復(fù)數(shù)據(jù)刪除策略

2016-08-09 05:31:20武警8710部隊(duì)通信科段志剛武警警官學(xué)院吳耕銳
電子世界 2016年13期

武警8710部隊(duì)通信科 段志剛武警警官學(xué)院 吳耕銳 薄 鳥

?

一種武警云計(jì)算環(huán)境下集群重復(fù)數(shù)據(jù)刪除策略

武警8710部隊(duì)通信科 段志剛
武警警官學(xué)院 吳耕銳 薄 鳥

1 引言

隨著大數(shù)據(jù)時(shí)代的發(fā)展,數(shù)據(jù)量正在爆炸式增長(zhǎng),數(shù)據(jù)更新變化也在時(shí)刻進(jìn)行[1]。調(diào)查發(fā)現(xiàn)云端數(shù)據(jù)中心有60%以上數(shù)據(jù)是冗余的,這就為數(shù)據(jù)同步提出了巨大挑戰(zhàn)。針對(duì)云環(huán)境下集群分布式存儲(chǔ)的全局重復(fù)數(shù)據(jù)刪除,存在著數(shù)據(jù)塊索引磁盤瓶頸和存儲(chǔ)節(jié)點(diǎn)信息孤島兩大困難:(1)數(shù)據(jù)塊索引磁盤瓶頸:在存儲(chǔ)服務(wù)器節(jié)點(diǎn)的磁盤上建立一個(gè)數(shù)據(jù)塊索引序列,完成集群內(nèi)數(shù)據(jù)存儲(chǔ)節(jié)點(diǎn)的重復(fù)數(shù)據(jù)刪除。(2)重復(fù)數(shù)據(jù)刪除節(jié)點(diǎn)信息孤島:針對(duì)云環(huán)境下集群系統(tǒng)的重復(fù)數(shù)據(jù)刪除過(guò)程,往往忽略節(jié)點(diǎn)之間的重復(fù)數(shù)據(jù)刪除,由此產(chǎn)生了重復(fù)數(shù)據(jù)刪除節(jié)點(diǎn)的孤島效應(yīng)。

2 相關(guān)工作

現(xiàn)有云環(huán)境下的全局重復(fù)刪除技術(shù),如EMC公司的data domain全局重復(fù)數(shù)據(jù)刪除陣列、IBM公司的protectTier、SEPATON公司的S2100-ES2等[2-4],由于在全局?jǐn)?shù)據(jù)縮減率、單節(jié)點(diǎn)存儲(chǔ)率、數(shù)據(jù)分布或者系統(tǒng)通信開銷上存在不足,利用這些技術(shù)來(lái)設(shè)計(jì)由成千上萬(wàn)節(jié)點(diǎn)構(gòu)成的集群,很可能不會(huì)成功。Bhagwat設(shè)計(jì)了Extreme Binning策略,Extreme Binning基于文件的相似性,以加密Hash生成的Chunk ID。文獻(xiàn)[5]設(shè)計(jì)了一種支持云環(huán)境下大數(shù)據(jù)備份的可擴(kuò)展在線集群重復(fù)數(shù)據(jù)刪除框架。

本文利用Bloom Filter機(jī)制為存儲(chǔ)節(jié)點(diǎn)內(nèi)的所有數(shù)據(jù)塊指紋建立一個(gè)全局的快速索引,從而實(shí)現(xiàn)支持高數(shù)據(jù)縮減率、高吞吐率、低通信開銷及負(fù)載均衡的全局重復(fù)數(shù)據(jù)刪除。

3 基于Bloom Filter的全局?jǐn)?shù)據(jù)刪重策略

利用Bloom Filter機(jī)制可以將集群內(nèi)所有節(jié)點(diǎn)存儲(chǔ)的數(shù)據(jù)塊指紋表示成Bloom Filter指紋摘要(Fingerprint Summary),形成全局的快速索引序列。例如集群中有p個(gè)存儲(chǔ)服務(wù)器節(jié)點(diǎn),假設(shè)所有節(jié)點(diǎn)的Bloom Filter長(zhǎng)度全部為n,并且所有節(jié)點(diǎn)采用k個(gè)相同且相互獨(dú)立的哈希函數(shù)。數(shù)據(jù)中心接收到客戶端發(fā)送來(lái)的數(shù)據(jù)塊指紋時(shí),檢測(cè)該塊是新塊還是已存儲(chǔ)的數(shù)據(jù)塊,其過(guò)程如圖1所示:

圖1 重復(fù)數(shù)據(jù)刪除過(guò)程

基于Bloom Filter機(jī)制及相似性理論,在超塊的基礎(chǔ)上進(jìn)行有狀態(tài)路由的重復(fù)數(shù)據(jù)檢測(cè)刪除的算法描述如下: (1)控制服務(wù)器節(jié)點(diǎn)依次計(jì)算出超塊Q{fp1,fp2,fp3,…fpn}中所有數(shù)據(jù)塊指紋對(duì)應(yīng)的k個(gè)哈希函數(shù)值,將hi(xj)保存并分發(fā)到每一個(gè)存儲(chǔ)節(jié)點(diǎn);(2)利用哈希值hi(xj)依次從FSA獲取映射位置的列值。若某一列對(duì)應(yīng)的值全是0(Negative),可判定其為新數(shù)據(jù)塊;(3)若任一哈希值hi(xj)映射的列向量的值不全為0(Positive),返回一條Duplication Possible的消息;(4)查詢結(jié)束后,若返回的數(shù)據(jù)塊類型值為Duplication Possible。若依次查詢到某一節(jié)點(diǎn)所有hi(xj)映射的位全部是1,則返回消息為Positive;(5)利用按行查詢即節(jié)點(diǎn)確認(rèn)算法返回的結(jié)果是節(jié)點(diǎn)的ID,進(jìn)而在對(duì)應(yīng)的存儲(chǔ)節(jié)點(diǎn)進(jìn)一步的細(xì)粒度查詢重復(fù)數(shù)據(jù),確認(rèn)數(shù)據(jù)塊是否是重復(fù)的。

4 實(shí)驗(yàn)分析

在實(shí)驗(yàn)室現(xiàn)有的硬件環(huán)境下,選用1臺(tái)計(jì)算機(jī)作為客戶端,1臺(tái)配置Hadoop框架的服務(wù)器及4臺(tái)計(jì)算機(jī)搭建Hadoop集群[6]。

通過(guò)與文獻(xiàn)[7]提出的基于Bloom Filter數(shù)據(jù)重復(fù)刪除策略、文獻(xiàn)[8]設(shè)計(jì)的Σ-Dedupe方案對(duì)比,實(shí)驗(yàn)結(jié)果如圖5-4所示。實(shí)驗(yàn)結(jié)果表明,三種方案在數(shù)據(jù)重刪消耗時(shí)間大致相同的情況下,本文設(shè)計(jì)的G-dedupe會(huì)獲得最大的數(shù)據(jù)縮減率,在數(shù)據(jù)龐大的集群存儲(chǔ)系統(tǒng)中就能極大地節(jié)省存儲(chǔ)空間,提高集群系統(tǒng)的整體性能。

圖3 試驗(yàn)對(duì)比結(jié)果

5 結(jié)論

本文主要研究集群內(nèi)部的全局重復(fù)數(shù)據(jù)刪除。運(yùn)用 Bloom Filter 技術(shù)為集群數(shù)據(jù)中心中存儲(chǔ)的所有數(shù)據(jù)塊建立快速索引的摘要信息,合成一個(gè)可以檢測(cè)重復(fù)數(shù)據(jù)的指紋摘要陣列,分布在存儲(chǔ)節(jié)點(diǎn)前端的控制服務(wù)器,控制服務(wù)器節(jié)點(diǎn)將客戶端發(fā)送到的數(shù)據(jù)塊指紋合并成若干粒度大小均勻的超塊,進(jìn)行重復(fù)數(shù)據(jù)的檢測(cè),然后將數(shù)據(jù)塊的重復(fù)刪除分布到存儲(chǔ)節(jié)點(diǎn)中進(jìn)行。研究成果實(shí)現(xiàn)了數(shù)據(jù)同步中的數(shù)據(jù)縮減率問(wèn)題,為集群存儲(chǔ)節(jié)省了大量的存儲(chǔ)空間。

參考文獻(xiàn)

[1]IBM Cloud Computing [EB/OL]. http://www.ibm.com/ibm/cloud.

[2]吳朱華.云計(jì)算核心技術(shù)剖析[M].北京:人民郵電出版社,2011,5.

[3]陳釗.基于云災(zāi)備的數(shù)據(jù)安全存儲(chǔ)關(guān)鍵技術(shù)研究[D].北京郵電大學(xué),2012.

[4]李俊中. 云存儲(chǔ)環(huán)境下數(shù)據(jù)完整性驗(yàn)證方法研究[D].重慶郵電大學(xué),2013.

[5]Bobbarjung D R, Jagannathan S, Dubnicki C. Improving duplicate elimination in storage systems[J]. Acm Transactions on Storage,2006,2(4):424-448.

[6]葉明江,崔勇,徐恪等.基于有狀態(tài)Bloom filter引擎的高速分組檢測(cè)[J].軟件學(xué)報(bào), 2006,18:117-126.

[7]毛波,葉閣焰,藍(lán)琰佳等.一種基于重復(fù)數(shù)據(jù)刪除技術(shù)的云中云存儲(chǔ)系統(tǒng)[J].計(jì)算機(jī)研究與發(fā)展,2015(6):1278-1287.

[8]楊超,張俊偉,董學(xué)文等.云存儲(chǔ)加密數(shù)據(jù)去重刪除所有權(quán)證明方法[J].計(jì)算機(jī)研究與發(fā)展,2015,1(1):248-258.

作者簡(jiǎn)介:

段志剛(1977—),男,江西景德鎮(zhèn)人,現(xiàn)供職于武警8710部隊(duì)通信修理所,助理工程師,主要研究武警通信與信息化。

吳耕銳(1985—),福建漳州人,現(xiàn)供職于武警警官學(xué)院信息工程系,研究方向:信息化。

薄鳥(1986—),女,陜西西安人,現(xiàn)供職于武警警官學(xué)院數(shù)學(xué)與物理系,研究方向:固體物理。

主站蜘蛛池模板: 欧亚日韩Av| 毛片网站在线播放| 欧美一级高清片久久99| 黄色网页在线播放| 免费在线成人网| 制服丝袜一区| 日韩欧美国产精品| a级毛片网| 一级在线毛片| 婷五月综合| 国产成人精品亚洲77美色| 欧美在线导航| 国产哺乳奶水91在线播放| 福利视频一区| 成人综合网址| 亚洲视频a| 99久久亚洲精品影院| 久久综合婷婷| 国产超薄肉色丝袜网站| 国产成人免费高清AⅤ| 亚洲视频四区| 伊人久久大香线蕉影院| 在线免费亚洲无码视频| 香蕉视频在线精品| 国产国语一级毛片| 国产精品99一区不卡| 国内精品视频区在线2021| 久久久受www免费人成| 国产av剧情无码精品色午夜| 91精品国产丝袜| 欧美日本在线| 欧美黄色a| 一本色道久久88| 黄色网在线| 亚洲国产综合精品一区| 伊人成人在线| 国产在线自乱拍播放| 亚洲国产成人麻豆精品| 亚洲av中文无码乱人伦在线r| 免费高清毛片| 永久在线精品免费视频观看| 永久免费无码日韩视频| 日本一区中文字幕最新在线| 婷五月综合| av大片在线无码免费| 欧美黄色网站在线看| 亚洲午夜片| 国产三级a| 国产麻豆永久视频| 精品国产乱码久久久久久一区二区| 亚洲女同欧美在线| 国产农村1级毛片| 伊人色在线视频| 久久国产精品夜色| 天堂久久久久久中文字幕| 国产白浆一区二区三区视频在线| 波多野结衣在线se| 91久久大香线蕉| a级毛片免费网站| 国产欧美视频在线观看| 国产一级毛片网站| 在线观看视频一区二区| 精品国产免费第一区二区三区日韩| 依依成人精品无v国产| 污网站免费在线观看| 毛片基地美国正在播放亚洲 | 日韩午夜片| 久久国产高潮流白浆免费观看| 操美女免费网站| 久久免费成人| 中文毛片无遮挡播放免费| 日本伊人色综合网| 国产第二十一页| 99热亚洲精品6码| 久久国产精品电影| 综合色88| 久久亚洲美女精品国产精品| 国产女人在线观看| 亚洲伊人天堂| 99精品一区二区免费视频| 黄色网站不卡无码| 91www在线观看|