在數據信息日益重要的今天,構建完善的數據保護系統成為研究的熱點。隨著企業對數據安全性以及業務連續性的要求越來越高,傳統上常用的數據復制、備份、恢復等數據保護技術逐漸難以保證靈活的目標恢復點及較快的目標恢復時間。持續數據保護(CDP)技術的產生解決了這一難題。CDP保存所有的數據改變操作,能夠將數據恢復到丟失前的任意歷史狀態。作為數據保護的一種高級形式,CDP技術已經成為存儲行業關注的焦點。
全球網絡存儲工業協會(SNIA)數據保護論壇(DMF)的持續數據保護特別興趣小組(CDP SIG)對持續數據保護的定義是:持續數據保護是一套方法,它可以捕獲或跟蹤數據的變化,并將其在生產數據之外獨立存放,以確保數據可以恢復到過去的任意時間點。持續數據保護系統可以基于塊、文件或應用實現,可以為恢復對象提供足夠細的恢復粒度,實現幾乎無限多的恢復時間點。
持續數據保護技術的關鍵詞是“持續”,其主要功能是在故障瞬發生的瞬間完成對數據的快速恢復,保證業務的連續性。因此,能夠從根本上解決傳統備份中恢復能力低和非精確時間策略(如按照天的備份)的先天弱點。就給定的數據集而言,持續數據保護提供連續的恢復點,能夠存取任何時間點上的數據,允許應用恢復到任意的時間點之前,而不僅僅針對那些由備份流程預先確定的特殊時刻,且恢復點可在事件發生后選定并動態重建。因此持續數據保護能夠提供無限密集的恢復點,有些情況下可以提供接近即時的恢復。
持續數據保護并不是一項全新的數據保護技術,它是建立在傳統數據保護、容災技術基礎之上的一套方法。和傳統的數據備份和恢復技術相比,持續數據保護在幾個方面有明顯的特點:

·保護連續性
·更小的恢復點目標(RPO)
·更小的恢復時間目標(RPO)
傳統的數據保護解決方案專注于數據的周期性備份,因此無法避免存在備份窗口、難以確保數據一致性以及會影響生產系統等問題。圖1所示為CDP與傳統數據保護在保護時間間隔上的比較。由圖1可以看出,備份技術實現的數據保護間隔一般為24小時,因此用戶會面i臨丟失多達24小時所產生的數據的風險。采用快照技術可以將數據的風險丟失量降低到幾個小時之內。數據復制技術可以通過與生產數據的同步來獲得數據的最新狀態,但卻無法防止由人為的邏輯錯誤或病毒攻擊所造成的數據丟失。而持續數據保護是一種精細化多點跟蹤技術,會不斷監測關鍵數據的變化,捕獲和保護數據中所有的變化,而非僅僅是某個預先選定的時間點,能將數據風險丟失量降低到幾秒。
1持續數據保護技術的實現
1.1持續數據保護關鍵技術
持續數據保護實現的關鍵技術是對數據變化的記錄和保存,以便實現任意時間點的快速恢復。一般來講,有3種實現方式。
(1)基準參考數據模式
基準參考數據模式如圖2所示。基準參考數據模式是一種AfterImaging的策略,對要保護的數據建立一個初始的映像,然后將其日志按數據請求到來的順序記錄。這種策略中每次數據請求最多只導致一次對磁盤的實際寫操作,因此實現簡單,帶來的額外開銷較小。基準參考數據模式在數據恢復時,需要從最原始的參考數據開始,逐步進行數據恢復,恢復點越靠近當前點,恢復所需要的時間就越長。

(2)復制參考數據模式
復制參考數據模式如圖3所示。復制參考數據模式是一種Before Imaging的策略,它維護的映像是數據的最新狀態,因此它克服了基準參考數據模式中數據讀效率低的缺點,適合于讀請求較多的環境。復制參考數據模式通常利用Copy onWrite技術,即映像中的原始數據被覆寫之前先將其拷貝到日志中。這樣記錄的日志在恢復點越靠近當前點時所需時間越短,但一次寫操作能引發兩次寫操作,因此,需要較多的系統資源。
(3)合成參考數據模式
合成參考數據模式如圖4所示。合成參考數據模式是以上兩種模式的折衷,較好地實現了以上兩種模式的妥協,因此可以得到較好的資源占用和恢復時間效果。但需要復雜的軟件管理和數據處理功能,實現起來比較復雜。
1.2持續數據保護實現層次
CDP技術或解決方案可以在不同的層次實現,參考SNIA的存儲共享模型,可以將當前實現CDP的產品或解決方案分為3類:
·基于應用的持續數據保護
·基于文件的數據保護
·基于數據塊的持續數據保護
(1)數據塊級持續數據保護技術
數據塊級的持續數據保護技術可以直接在物理的存儲設備上運行,也可以在數據塊傳輸層上運行。當發生數據塊寫入操作時,持續數據保護功能模塊可以將原始的數據復制并傳送到另外一個存儲設備中進行存儲。數據塊級的持續數據保護需要將所有更改過的數據塊按時間順序保存下來。每次寫操作都會生成帶有時間標記的數據塊副本。由于每次數據寫操作都被完整的記錄保存下來,因此數據塊級的持續數據保護技術能夠動態地訪問歷史任意一個時間點的數據。數據塊級的持續數據保護技術的最大優點是與應用的相關性比較小(因為運作在塊設備層,與文件系統、應用無關),性能以及效率都比較高(特別是對于數據庫這類直接訪問塊設備的應用)。其缺點是對備份存儲空間的要求比較高,同時對于數據一致性的處理也缺乏通用有效的機制。
數據塊級持續數據保護技術又有基于主機、基于傳輸層和基于存儲層3類實現方式。
(a)基于主機端卷管理軟件或客戶端代理軟件Agent實現
目前常見的主機端卷管理軟件有VeritasVxVM、LinuxLVM、Microsoft動態磁盤等,也有廠商針對Linux和Windows平臺開發了客戶端代理軟件Agent。它們的功能是通過卷鏡像的方式獲取生產數據的動態副本,并以此副本為基準進行數據持續保護。Symantec Storage Foundation、FalconStorCDP、浪潮CDP屬于此類。
(b)基于傳輸層實現
該方式通過含有DataSpliRer功能的FCSAN交換機來獲取同寫入生產卷相同的I/O數據塊,FCSAN交換機有BrocadeAP-7420B、CISCOMDS9000配置SANTAPSSM模塊等,價格比較高。EMCRecoverpoint、LSIStoragAge等屬于這種方式。
(c)基于存儲層實現
某些廠商的存儲陣列本身支持WfiteSplitter功能,比如EMCClariiON磁盤陣列,這種實現方式比較受限于廠商。
(2)文件級持續數據保護技術
文件級的持續數據保護技術工作在文件系統之上。它可以跟蹤文件系統中文件數據或者元數據的改變,及時備份這些變動信息并記錄發生改變的時間,以便將來能夠實現文件歷史任意時間點的恢復。
目前根據持續數據保護思想在文件系統級進行相關研究的公司不多,主要包括:Symantec的ContinuousProtection Server、XOsoft的XOsoft Engine、IBM的Tivoli Continuous DataProtection for Filest、Storactive 公 司 的LiveBackup for Desktop/Laptops、TimeSpfing公司的TimeDam等產品。
(3)應用級持續數據保護技術
實現應用級持續數據保護技術時,需要在受保護的應用程序中直接插入和運行持續數據保護功能程序代碼。持續數據保護程序代碼可以由應用程序開發商將其直接嵌入在軟件產品中,也可以由應用程序軟件開發商提供相關的應用程序接口(API),然后由第三方持續數據保護軟件開發商來完成持續數據保護的功能。在應用程序中實現持續數據保護的最大優勢是與能和應用程序無縫整合,確保應用程序的數據在持續保護過程中的一致性,同時管理也比較靈活,用戶容易部署和實施。目前在應用程序級實現的連續數據保護解決方案大多是針對成熟的應用開發的。已經有一些公司的持續數據保護軟件可以支持微軟公司的Office、Exchange,IBM公司的DBZ,以及Oracle公司的數據庫等。
對于以上3種類別的持續數據保護技術,數據塊級和文件級的持續數據保護技術是一種通用方法,可以支持多種不同應用。而應用級的持續數據保護技術則只為某種特定應用提供連續數據保護能力,其通常的表現形式是與應用程序的一種更為深入的集成。
2持續數據保護技術的應用
對于持續數據保護的應用范圍,目前大體可以歸納為3類:
(1)為數據中心內的文件服務器/網絡附屬存儲提供普通的數據保護
在這種應用中,持續數據保護逐漸取代了以前那種夜間的磁盤或磁帶備份任務。雖然,有些人認為持續數據保護只是為那些關鍵的數據而準備的,但是我們發現有些持續數據保護產品要比那些傳統的備份方法更加易于使用,并且效果也更好。因此完全可以用于普通的文件服務器的備份。
(2)為遠程的分支機構進行集中化的備份
將持續數據保護用于遠程分支機構備份應用的最大好處就是避免了遠距離轉移磁帶介質的風險。我們使用同總部一樣的復制技術將分支機構的備份數據同步傳輸回來;同時集中化的控制也可以讓異地之間的數據安全管理工作變得更加主動、高效。
(3)幫助實現筆記本電腦上的數據備份
也許人們曾經使用過很多方法’來保護筆記本電腦上的數據,但都收效甚微。如今,人們可以使用持續數據保護來將數據的變化統統保留在筆記本電腦自帶的硬盤上,然后在連接辦公室網絡的時候,自動地將它們發送到遠端的中心服務器。不過,從技術定義上講,這并不能稱為持續數據保護。因為這類產品只有在筆記本電腦與網絡連接的時候,才能上傳改變的數據。不過,像IBMTivoliCDP這樣的產品,即使在沒有連接網絡的情況下,依然可以很好地對數據進行保護。
最后一點要說的是CDP并不是對所有企業都很適合。CDP技術本身并不難使用,但卻非常昂貴。CDP采用基本的數據保護技術,因此CDP適用于那些對數據備份窗口以及RPO忽略的公司,那些處理非常繁忙的網絡事務的公司也非常適合。而不做這些事務的企業則可以找到更加適合于它們的磁盤備份技術,比如虛擬磁帶庫(van)以及快照技術。
3結束語
盡管CDP技術在數據保護和災難恢復中具有很多特點和優勢,但在實際應用中并沒有真正達到普及。一是用戶對數據備份的認識存在誤區。比如,一些用戶不清楚快照和備份間的差異,認為快照可以代替備份。實際則不然,快照的目的是為了恢復數據,而備份的目的不只是恢復,還有一個更重要的功能是存檔,以滿足法規遵從方面的要求。如果用戶不能理解這些區別,在接受CDP時就會有所疑慮。二是CDP產品缺乏國家標準和行業標準,不明確什么是真正的CDP以及CDP到底能做什么。在眾多存儲廠商的產品線中,CDP并不是主流產品,各廠家之間的差異性非常大,有的是硬件,有的是軟件,造成CDP產品魚龍混雜,直接影響了CDP的推廣和應用。
我們相信隨著持續數據保護技術的應用范圍的擴大和人們認知的深入,會有越來越多的真持續數據保護解決方案和產品出現。在實現持續數據保護的需求上,用戶將會有更多的選擇。持續數據保護技術也將會作為在線數據的重要保護手段而獨立開辟一條通道,成為一種新的貼近用戶目標的高級數據保護方式。