[摘 要] 連續(xù)數(shù)據(jù)保護系統(tǒng)作用于生產(chǎn)運行系統(tǒng)之上,對用戶的關(guān)鍵數(shù)據(jù)進行連續(xù)的保護,當(dāng)生產(chǎn)數(shù)據(jù)遭受破壞時可提供任意時間點快速、有效的數(shù)據(jù)恢復(fù),使數(shù)據(jù)損失達到最小。本文通過研究并部署CDP服務(wù)器,實現(xiàn)采用軟件對生產(chǎn)運行系統(tǒng)進行災(zāi)難備份, 通過異地快照和錄像恢復(fù)數(shù)據(jù)等技術(shù)實現(xiàn)定期將數(shù)據(jù)復(fù)制至異地災(zāi)備中心。可實現(xiàn)將數(shù)據(jù)發(fā)生變化的差異數(shù)據(jù)量傳送到災(zāi)備中心進行存儲保存,形成歷史數(shù)據(jù)快照,并且當(dāng)生產(chǎn)運行系統(tǒng)遭遇故障停止運轉(zhuǎn)時,災(zāi)備中心主機可自動接管服務(wù),實現(xiàn)應(yīng)用系統(tǒng)運行支撐,以實現(xiàn)連續(xù)數(shù)據(jù)保護系統(tǒng)的異地災(zāi)備功能。
[關(guān)鍵詞] 連續(xù)數(shù)據(jù)保護;異地;快照
doi : 10 . 3969 / j . issn . 1673 - 0194 . 2013 . 21. 029
[中圖分類號] TP309.3 [文獻標(biāo)識碼] A [文章編號] 1673 - 0194(2013)21- 0049- 03
信息化建設(shè)快速發(fā)展的環(huán)境下,信息技術(shù)研發(fā)及應(yīng)用正催生新的經(jīng)濟增長點,以互聯(lián)網(wǎng)為代表的信息技術(shù)在全球范圍內(nèi)帶來了日益廣泛深刻的影響。加快推進信息化建設(shè),建立健全信息安全保障體系具有重大意義。數(shù)據(jù)的重要性逐步提高,由于系統(tǒng)應(yīng)用錯誤、硬件故障、不可抗力因素等原因所引發(fā)的數(shù)據(jù)損壞或者丟失是較為嚴(yán)重的問題,因此災(zāi)難備份與數(shù)據(jù)保護技術(shù)逐漸成為人們關(guān)注的焦點。
1 研究背景及意義
傳統(tǒng)的數(shù)據(jù)保護解決方案專注于數(shù)據(jù)的周期性備份,因此存在備份窗口、數(shù)據(jù)一致性以及對生產(chǎn)系統(tǒng)的影響等問題,難以保證靈活的目標(biāo)恢復(fù)點(RPO)及目標(biāo)恢復(fù)時間(RTO),而RPO和RTO已經(jīng)成為衡量容災(zāi)體系應(yīng)急能力和數(shù)據(jù)保護能力的關(guān)鍵性指標(biāo)。
因此,連續(xù)數(shù)據(jù)保護技術(shù)應(yīng)運而生,本文針對連續(xù)數(shù)據(jù)保護系統(tǒng)災(zāi)備體系方案進行研究,通過異地快照和錄像恢復(fù)數(shù)據(jù)以及精簡帶寬復(fù)制技術(shù)等關(guān)鍵技術(shù)實現(xiàn)連續(xù)數(shù)據(jù)保護系統(tǒng)的異地災(zāi)備功能。
1.1 連續(xù)數(shù)據(jù)保護技術(shù)概述
連續(xù)數(shù)據(jù)保護(CDP,Continuous Data Protection)是一種數(shù)據(jù)保護方法,它可以捕獲或跟蹤數(shù)據(jù)的變化,并將其在生產(chǎn)數(shù)據(jù)之外獨立存放,以確保數(shù)據(jù)可以恢復(fù)到過去的任意時間點。持續(xù)數(shù)據(jù)保護系統(tǒng)可以基于塊、文件或應(yīng)用實現(xiàn),可以為恢復(fù)對象提供足夠細(xì)的恢復(fù)粒度,實現(xiàn)幾乎無限多的恢復(fù)時間點。
CDP連續(xù)數(shù)據(jù)保護技術(shù)解決方案的優(yōu)勢:
(1)全面防御所有災(zāi)難,徹底消除災(zāi)難死角(傳統(tǒng)災(zāi)備體系完全不防御數(shù)據(jù)丟失也不防御存儲系統(tǒng)或數(shù)據(jù)庫系統(tǒng)的崩潰)。
(2)能自動瞬間接管發(fā)生故障的生產(chǎn)存儲,可以在主系統(tǒng)磁盤中斷時不停止業(yè)務(wù)。
(3)可以在操作系統(tǒng)中毒時迅速修復(fù)業(yè)務(wù)。
1.2 連續(xù)數(shù)據(jù)保護技術(shù)實現(xiàn)原理
CDP實現(xiàn)的關(guān)鍵技術(shù)是對數(shù)據(jù)變化的記錄和保存,以便實現(xiàn)任意時間點的快速恢復(fù)。一般有3種實現(xiàn)方式:基準(zhǔn)參考數(shù)據(jù)模式、復(fù)制參考數(shù)據(jù)模式和合成參考數(shù)據(jù)模式。這3種方式分別是通過正向、逆向、正向逆向相結(jié)合的方式記錄和保存已經(jīng)進行的文件操作來實現(xiàn)。
連續(xù)數(shù)據(jù)保護并非對數(shù)據(jù)變化進行簡單的復(fù)制,而是對數(shù)據(jù)的每個變化記錄日志或者編制索引,數(shù)據(jù)發(fā)生任何變化都會在CDP 設(shè)備中保留一個備份版本,因此能夠?qū)?shù)據(jù)恢復(fù)到過去任意一個時間點。而不間斷地捕捉數(shù)據(jù)的變化,通常采用的方法是在寫磁盤時,對備份源和備份目標(biāo)的數(shù)據(jù)進行比對,某些高性能的CDP 設(shè)備可以在磁盤塊大小為4kB的情況下將磁盤數(shù)據(jù)比對的粒度定為512B。
2 CDP系統(tǒng)關(guān)鍵技術(shù)研究與應(yīng)用
2.1 CDP系統(tǒng)功能及軟件概述
2.1.1 CDP系統(tǒng)功能
CDP系統(tǒng)通過部署CDP服務(wù)器,實現(xiàn)通過軟件對生產(chǎn)運行系統(tǒng)進行災(zāi)難備份, 通過異地快照和錄像恢復(fù)數(shù)據(jù)等技術(shù)實現(xiàn)定期將數(shù)據(jù)復(fù)制至異地災(zāi)備中心。可實現(xiàn)將數(shù)據(jù)發(fā)生諸如新建、修改等變化的差異數(shù)據(jù)量傳送到災(zāi)備中心進行存儲保存,形成歷史數(shù)據(jù)快照,并且當(dāng)生產(chǎn)運行系統(tǒng)遭遇故障停止運轉(zhuǎn)時,災(zāi)備中心主機可自動接管服務(wù),實現(xiàn)應(yīng)用系統(tǒng)運行支撐,以實現(xiàn)連續(xù)數(shù)據(jù)保護系統(tǒng)的異地災(zāi)備功能。
2.1.2 軟件概述
DiskSafe 通過持續(xù)或者周期方式將數(shù)據(jù)磁盤或分區(qū)拷貝到另外一個由CDP管理的存儲專用設(shè)備。在當(dāng)操作系統(tǒng)或數(shù)據(jù)磁盤發(fā)生物理或邏輯故障時,DiskSafe能提供可靠的數(shù)據(jù)保護及快速的數(shù)據(jù)恢復(fù)。使用CDP服務(wù)器與DiskSafe客戶端軟件,可以為應(yīng)用服務(wù)器建立一個簡單、快速、易用、強大的備份平臺。
2.2 CDP關(guān)鍵技術(shù)應(yīng)用
在企業(yè)調(diào)度管理信息系統(tǒng)中采用CDP技術(shù),能夠?qū)赡艹霈F(xiàn)的故障進行測試,進行生產(chǎn)系統(tǒng)故障模擬并將調(diào)度管理信息系統(tǒng)切換到備用數(shù)據(jù)庫,保障系統(tǒng)在發(fā)生災(zāi)難或突發(fā)事件時仍能穩(wěn)定運行和正常應(yīng)用。故障發(fā)生時切換到備用數(shù)據(jù)庫服務(wù)器,待生產(chǎn)數(shù)據(jù)庫服務(wù)器恢復(fù)后重新接管,對用戶訪問沒有任何影響。系統(tǒng)運行穩(wěn)定、性能可靠,為建設(shè)高性能、高可用性的信息平臺奠定了良好基礎(chǔ)。
2.2.1 多點自動快照機制TimeMark
TimeMark多時間點的自動連續(xù)快照技術(shù),是CDP系統(tǒng)非常重要的功能之一,它使用戶的業(yè)務(wù)系統(tǒng)能夠在較短時間間隔內(nèi)保存各個時間點的歷史數(shù)據(jù)版本。CDP高密度的快照視圖可保證將系統(tǒng)的RPO(動態(tài)及靜態(tài))降到最低范圍。
2.2.2 磁盤讀/寫優(yōu)化技術(shù)
SafeCache技術(shù)可以全面提升所管理的磁盤的寫入性能。當(dāng)磁盤性能無法滿足主機的I/O需求時,使用SafeCache配合高速磁盤設(shè)備可以明顯改善整體性能。
SafeCache的原理:將高速磁盤設(shè)備置于“前端”,生產(chǎn)數(shù)據(jù)可以先按順序?qū)懭敫咚俅疟P設(shè)備中,然后按照SafeCache設(shè)置的策略(基于Cache容量或基于時間),將Cache中的數(shù)據(jù)再隨機寫入后端存儲中。通過將隨機寫入向順序?qū)懭朕D(zhuǎn)換,大大提升CDP訪問IPStor 時順序?qū)懭敫咚買/O的性能。
HotZone技術(shù)則可以全面提升所管理的磁盤的讀性能。使用HotZone時,CDP會將磁盤劃分為容量相等的多個區(qū)域,然后監(jiān)控哪些區(qū)域經(jīng)常會被讀到,隨之將該區(qū)域的數(shù)據(jù)塊映射到高速磁盤中,這樣就會提高應(yīng)用主機讀取磁盤的速度。如果CDP監(jiān)控到某些區(qū)域不再經(jīng)常被讀到,則會將該區(qū)域移出高速磁盤。
2.2.3 MicroScan精簡帶寬復(fù)制技術(shù)
MicroScan重復(fù)數(shù)據(jù)刪除機制,消除了由于低效的應(yīng)用程序及文件系統(tǒng)層造成的不斷增長的變化數(shù)據(jù)塊,從而將數(shù)據(jù)的傳輸量減到最低。MicroScan是基于Hash算法的去重技術(shù),利用MicroScan技術(shù),使真正發(fā)生變化的數(shù)據(jù)按顆粒度或是磁盤扇區(qū)(512字節(jié))進行傳輸,這使得災(zāi)難恢復(fù)的帶寬成本以及相關(guān)的存儲成本極大削減。
傳統(tǒng)的傳輸技術(shù)由于寫入的精細(xì)度較低,由此造成了大量的冗余數(shù)據(jù)。MicroScan技術(shù)則有效地消除了這些數(shù)據(jù)的重復(fù)拷貝,以512字節(jié)為最小單位掃描磁盤變化并只傳輸變化的數(shù)據(jù),從而大大節(jié)省了廣域網(wǎng)絡(luò)的傳輸帶寬。在多個實際應(yīng)用項目中, CDP的遠(yuǎn)程容災(zāi)傳輸占用的帶寬極小,一般只需傳統(tǒng)容災(zāi)技術(shù)帶寬的1/50~1/5。
2.2.4 靈活的容災(zāi)復(fù)制傳輸策略
CDP的復(fù)制策略非常靈活,包括連續(xù)復(fù)制與定時復(fù)制,無論哪種復(fù)制策略,都是基于增量的,只將發(fā)生變化的數(shù)據(jù)塊傳輸?shù)竭h(yuǎn)端。用戶可以設(shè)定一種或多種策略,可以根據(jù)帶寬情況自動或手動地在多種復(fù)制策略間進行切換。通常在寬帶的遠(yuǎn)程傳輸系統(tǒng)中,可以采用連續(xù)方式傳輸,而在常規(guī)的廣域網(wǎng)絡(luò)中,則建議采用定時方式。
3 CDP災(zāi)備系統(tǒng)應(yīng)用與實現(xiàn)
3.1 連續(xù)數(shù)據(jù)保護技術(shù)與傳統(tǒng)災(zāi)備技術(shù)的整合
傳統(tǒng)的災(zāi)難備份與恢復(fù)技術(shù)已經(jīng)發(fā)展得較為成熟,在對特定應(yīng)用環(huán)境的適應(yīng)性、性價比等方面,也具有不可替代的作用,因此將連續(xù)數(shù)據(jù)保護技術(shù)產(chǎn)品和傳統(tǒng)災(zāi)難備份與恢復(fù)方案相整合,使連續(xù)數(shù)據(jù)保護和傳統(tǒng)災(zāi)備與恢復(fù)技術(shù)相互融合,形成更為完善的災(zāi)難備份與恢復(fù)解決方案,滿足應(yīng)用需求。
災(zāi)難防御機制具有以下特點:
有效的信息系統(tǒng)災(zāi)難防御機制需要具備以下3個特性。
(1)有效性。分析以往一些災(zāi)備系統(tǒng)建設(shè)的經(jīng)驗,“有災(zāi)無備”的現(xiàn)象使得一些災(zāi)備體系無法有效保障信息系統(tǒng)的安全,具體表現(xiàn)在:只建立了查詢系統(tǒng),卻作為災(zāi)備系統(tǒng)使用,根本不具備災(zāi)難后的回退能力;只采用了傳統(tǒng)的備份等非災(zāi)備手段進行防御,或者采用單一的存儲直連等手段來替代復(fù)雜應(yīng)用環(huán)境的多種災(zāi)備要求,造成故障發(fā)生時無法做出快速反應(yīng)。
(2)安全性。災(zāi)備系統(tǒng)建設(shè)十分重要的一點就是不能帶來新的不穩(wěn)定因素,災(zāi)備手段必須具有極高的安全性,具體表現(xiàn)在:災(zāi)備體系實施和運行不能影響生產(chǎn)系統(tǒng)的運行;保障投資的安全,不能造成今后投入的不可控和前期投資的浪費。
(3)經(jīng)濟性。實現(xiàn)有限投資下的多應(yīng)用保護,以及向未來發(fā)展的開放式結(jié)構(gòu),將使得災(zāi)備系統(tǒng)一次建設(shè),終生受益。這是最為經(jīng)濟的符合發(fā)展趨勢的建設(shè)思路。而一些企業(yè)在建設(shè)災(zāi)備體系時,耗費較大資金建設(shè)龐大的傳輸網(wǎng)絡(luò),當(dāng)業(yè)務(wù)擴展時,這類傳輸網(wǎng)絡(luò)需要更大的改造成本,使企業(yè)不堪重負(fù)。
3.2 CDP災(zāi)備系統(tǒng)構(gòu)建及部署
災(zāi)備體系設(shè)計重點: ①數(shù)據(jù)(數(shù)據(jù)損失量小);②恢復(fù)(數(shù)據(jù)10分鐘快速恢復(fù));③驗證(隨時隨地數(shù)據(jù)驗證);④帶寬(極小的廣域網(wǎng)帶寬)(見圖1)。
3.3 設(shè)計實現(xiàn)與工作流程描述
3.3.1 操作系統(tǒng)調(diào)研
前期生產(chǎn)主機環(huán)境:
Processor1-16 Inter Xeon CPU e5620@2.40GHz 2 394 MHz
Memory 15 913MB
3.3.2 CDP配置
(1)修改CDP設(shè)備名和網(wǎng)絡(luò)配置。選擇eth0網(wǎng)口并配置IP地址和子網(wǎng)掩碼及網(wǎng)關(guān)。啟用FC Target模式,切換光纖卡模式,展開物理資源下的物理適配器,選擇要切換到Target模式的光纖適配器,右鍵切換到Target模式。配置物理設(shè)備,創(chuàng)建存儲池,選擇物理資源下的存儲資源池并新建。
(2)創(chuàng)建SAN客戶端,客戶端協(xié)議選擇“光纖通道”,輸入保護的客戶端光纖卡的WWPN號及V890客戶端名稱類型。創(chuàng)建SAN資源并分配給SAN客戶端,并為SAN資源啟用快照及Journal功能。
(3)啟用配置存儲庫。
3.3.3 本地CDP和異地CDP的復(fù)制
在進行異地災(zāi)備復(fù)制前,確認(rèn)生產(chǎn)主機上的本地磁盤或分區(qū)和SAN資源的第一次全同步是否完成,若未完成,最好等待第一次全同步完成后再發(fā)起遠(yuǎn)程災(zāi)備復(fù)制。
在進行第一次復(fù)制時,在同一個IPStor Console上需要同時登錄兩臺CDP,當(dāng)生產(chǎn)端和災(zāi)備端CDP都連接時,才能看到復(fù)制的進度、上次同步完成時間和下次同步時間等。
復(fù)制SAN資源的數(shù)據(jù),在災(zāi)備CDP上為副本磁盤創(chuàng)建快照資源。
3.3.4 災(zāi)備CDP上快照功能的啟用
(1)在災(zāi)備端的CDP設(shè)備啟用“TimeMark”。啟用快照功能的過程中確認(rèn)TimeMark的策略,輸入要保持的快照數(shù)目。
(2)完成CDP保護主機策略。
4 總結(jié)及進一步工作
災(zāi)難備份與恢復(fù)技術(shù)一直是信息技術(shù)行業(yè)關(guān)注的焦點,連續(xù)數(shù)據(jù)保護技術(shù)產(chǎn)品正在各個行業(yè)快速普及,這種思想新穎、特點鮮明的災(zāi)難備份與恢復(fù)技術(shù)為寶貴的信息資源提供了前所未有的保護與恢復(fù)能力。在下一步的工作中,我們將繼續(xù)追蹤CDP技術(shù),研究CDP技術(shù)在虛擬化應(yīng)用環(huán)境下的實施,為信息資源提供更好的保護。
主要參考文獻
[1]王紀(jì)奎.成就存儲專家之路:存儲從入門到精通[M].北京:清華大學(xué)出版社,2009.
[2]王淑江.網(wǎng)絡(luò)存儲·數(shù)據(jù)備份與還原[M].北京:電子工業(yè)出版社,2010.
[3]王改性,師鳴若.數(shù)據(jù)存儲備份與災(zāi)難恢復(fù)[M].北京:電子工業(yè)出版社,2009.