朱 龍,楊 非
基于VMware虛擬化環境下的連續數據保護技術探究
朱 龍,楊 非
(廣安職業技術學院 網絡與信息中心,四川 廣安 638000)
文章著重闡述了針對VMware虛擬化環境下數據保護面臨的挑戰與相關保護方法,分析了針對VMware虛擬機的RP4VM連續數據保護方案的機制及優勢,提出利用RP4VM產品方案建立實時備份域的二級備份體系,優化了傳統備份的業務架構.
虛擬化;RP4VM;連續數據保護
對于高校而言,數據保護與容災面臨著3個問題的困擾,包括邏輯故障、物理故障及機房故障.這些故障均有可能造成高校數據中心停止服務甚至無法恢復,這對高校業務系統來說都是致命性的.隨著VMware虛擬化環境在高校業務系統中的普及和廣泛應用,虛擬機本身及運行在虛擬機上面的數據安全逐漸受到用戶的重視[1].但目前虛擬機環境的數據保護方案繁雜,如何選擇一種最適合的虛擬機數據保護方案也成為高校業務系統當前面臨的問題.
1)數據的迅猛增長.在虛擬化環境下,通過虛擬化技術大幅度提高了系統資源利用率,尤其以CPU、內存、網絡等資源利用率大幅度提升,有效降低了計算成本.隨著數據量的增長,備份窗口也會大幅度增加,對生產業務影響的時間也就越長.
2)大量的冗余數據.當前主流的IT虛擬化環境中,大量的虛擬機大都使用相同的虛擬機模板進行快速的創建與部署,如此在系統備份時,會遇到冗余重復的數據很多,需要備份的數據量很大,受限于網絡傳輸瓶頸,導致整個系統備份時間太長;此外,備份的數據量太大也對備份存儲的容量提出了更高的需求,也難以通過遠程數據復制的方式進行異地的備份.目前業界成熟的做法是引入基于源端的重復數據刪除技術,可以大大提高備份效率,減輕備份網絡壓力,降低后端備份存儲空間需求,縮短備份時間窗口.
3)資源爭用問題.虛擬化可以帶來整合優勢,但是,在單一物理服務器上集中多個應用,資源(CPU、I/O、內存、網絡)將高度緊張,如果再采用傳統備份方式進行備份,即在虛擬機內部安裝備份軟件進行備份操作,這將導致過度消耗共享資源(CPU、I/O、內存、網絡),使得虛擬化效率降低.要避免由于數據備份導致的資源爭用問題,目前的成熟手段是在虛擬化環境中,采用部署一個或多個備份代理虛擬機,并對虛擬機對應快照進行備份;備份代理虛擬機可以直接部署在生產服務器上,也可以部署在專用的備份服務器上,只做備份代理服務,不對外提供其他服務,從而解決資源爭用問題.通過在備份代理服務器上完成備份的好處包括:
①降低生產系統資源消耗:在虛擬化環境中實現無需在虛擬機操作系統中安裝備份客戶端的備份,極大降低了備份對生產系統的資源消耗.
②更加靈活的恢復手段:支持恢復到源虛擬機,或恢復到新的虛擬機.
③快速部署:通過虛擬化管理平臺可以實現備份數據的快速導入與部署[2].
4)備份一致性問題.使用對虛擬機快照進行備份的方式,可以保證崩潰一致性備份.若只對同一時間點的虛擬機磁盤上現有數據進行備份,不對交易型數據庫等事務型應用系統進行靜默操作,不備份內存中數據,則無法確保應用一致性,備份出來的數據可能無法完全恢復.對于需要保證應用一致性的備份,需要采用所謂客戶機模式備份,在虛擬機上安裝支持對應應用的備份代理軟件,從而確保備份事務處理型應用的數據一致性.
5)業務數據恢復問題.對于邏輯故障問題的頻繁發生,例如誤操作、惡意篡改、病毒攻擊等防不勝防.如何在發生邏輯故障后,快速的恢復虛擬化環境下的業務系統,是當前面臨的最大挑戰之一.
除此之外,從高校仍至行業整體來看,大家熱衷于建設數據備份和容災系統.但是這些系統都需要很強的專業知識才能操作.因此,在方案選擇上要求做到操作簡單,在緊急情況下業務運維工作人員可以做出緊急應對措施.
根據企業、高校相關應用項目備份和恢復的實際需求,及業界在備份和恢復方面的長期實踐,數據備份恢復服務逐步提出了分級的概念,并且確定了數據備份服務各級別的定義.數據備份服務初步分為3個級別,每個級別分別有恢復時間點目標(RPO)、恢復時間目標(RTO)、可恢復性和保存時間、備份數據異地保存、異地備份數據可恢復性等5個關鍵性能指標(KPI)來對其進行量化.為了實現每一個服務級別,必須從技術實現的角度提出要求.
該服務級別基本能滿足企業和高?,F有絕大部分項目對備份和恢復的需求,并且能很好的體現資源優化配置的要求.對于核心的、關鍵的業務提供最快速度恢復手段,并且在恢復中保證數據盡可能少的丟失;對于影響相對較小的業務,可以允許其恢復時間適當延長,在允許數據丟失量方面的要求也可適當放寬.備份數據的保留時間和級別的關聯相對較小,需要根據具體項目的需求而定.
對業務應用容災保護的RTO、RPO定義,初步確定備份服務參考等級定義見表1,每個關鍵指標相對應的技術含義說明見表2.
鑒于VMware 虛擬環境的技術特點,通常需要保護的數據種類大致分為2類:VMware虛擬機本身、VMware虛擬機上的應用數據(如exchange/SQL/Oracle等應用).
目前,市面上針對虛擬機數據保護的產品基本有以下幾種:
1)通用備份軟件.盡管這類軟件可以備份VMware虛擬機鏡像及VMware虛擬機上的應用數據,但它們對虛擬網絡帶寬和VMware主機資源占用較高,特別是備份虛機上的應用數據時,會對虛擬機上的應用性能產生很大影響.
2)新一代源端去重備份軟件產品.這類產品在傳輸備份數據前先進行了壓縮和去重處理,只傳輸全局唯一、變化的數據塊,因此網絡帶寬占用小、對主機的CPU等資源占用率較低,可使備份和恢復性能得到大幅提升.

表1 備份服務參考服務級別定義

表2 備份恢復服務關鍵指標的技術說明
3)針對虛擬機的連續數據保護產品.通過基于記錄對每個VMware虛擬機的變更的時間點信息,可像錄像機一樣保護虛擬機的所有變化信息,從而實現任意時間點的數據恢復,并且通過同步或者異步遠程復制策略,將主機的虛擬機系統復制一份到備機實現容災.
在高校的生產業務系統中,各個業務系統對于數據備份的RTO和RPO要求均不相同,同時還需要考慮除各種類型數據庫外,大量臨時文件和管理數據的備份.所以建議在數據平臺采用統一備份恢復管理框架內,按照不同數據的不同備份恢復服務級別,采用不同的備份恢復技術架構,以實現最優的服務響應和最佳的性價比.
如果按照上文所述的三級備份恢復服務等級要求,不同服務等級對應的技術架構如下:
1)服務等級1級:由于要求RTO和RPO是在1小時之內,以分鐘為單位,傳統使用備份軟件拷貝恢復數據的方式很難滿足要求,一般多采用磁盤陣列內部卷快照克隆方式或連續數據保護技術(CDP).而由于磁盤陣列卷快照方式仍然有較長時間間隔,同時對數據空間要求較多,建議采用連續數據保護技術架構(CDP);
2)服務等級2級:由于要求RTO和RPO是在幾個小時之內,使用虛擬化環境專用備份軟件配合專用備份存儲設備,實現基于重復數據刪除的備份,可以滿足此類業務的備份恢復要求;
3)服務等級3級:由于RTO和RPO要求較低,保存數據多為需要長年累月存放的歸檔數據和法律法規要求存檔的歷史數據,使用備份軟件配合專門的歸檔存儲設備即可.
連續數據保護(Continuous Data Protection,簡稱CDP)是一種新型備份方式,是對傳統數據備份技術的重大改進.連續數據保護將受保護系統的所有數據變化做了記錄和保存,因而能實現基于任意時間點的快速恢復.連續數據保護與傳統的備份、快照最大的區別在于:連續數據保護可以根據事先設置的保護策略,實現任意時間點的數據恢復,類似數據保護的錄像機;而備份與快照由于受限于其數據保護操作頻率,只能恢復到有限的指定的時間點,類似數據保護的照相機,如圖1所示.
基于磁盤存儲的CDP方案,設計規劃的恢復時間的顆粒度可以是秒或分鐘為單位,從而滿足企業級IT對關鍵生產業務連續性的更高要求.RP4VM是一個成熟的軟件產品解決方案,它能通過現有的虛擬機平臺,以高性價比的方式,方便快捷地實現本地連續性數據保護、連續遠程數據復制保護及兩者結合的數據保護.
RecoverPonit for Virtual Machines(簡稱RP4VM)是這類產品的代表,是戴爾易安信專為虛擬化環境推出的數據保護方案,不同于快照、備份,RP4VM提供的連續數據保護,能夠像錄像機一樣,實時錄像,數據可以回滾到任意時間點,實現“秒級”恢復,可以實現虛擬機的實時復制和遠程容災.
如圖2所示,RP4VM除了可以提供針對本地數據中心虛擬機的連續數據保護外,還可以提供虛擬機遠程連續數據保護功能,從而實現虛擬機跨數據中心切換的災備功能[3-6].用戶可以在生產業務運行的同時使用它錄制下來的數據滿足多種業務需求.在兩地三中心架構中,RP4VM可實現數據壓縮進行廣域網傳輸,減少網絡帶寬占用,并支持“同步”和“異步”2種容災方式.
RP4VM的備份存儲可以使用任何存儲設備,充分利用現有存儲空間,保護用戶投資.需要增加存儲空間一般是進行CDP保護的應用數據的1.2倍,其中一倍的空間存儲本地連續數據保護的副本數據,20%左右的空間存放RP4VM日志數據.
RP4VM的備份存儲規劃按功能分為:生產卷,復制日志卷與復制副本卷.針對虛擬機的整個連續數據保護過程分為以下幾個階段:數據分解,數據標記,數據傳輸以及數據分發,如圖3所示.
1)數據分解:內嵌在Vmware Exi Server中的拆分器捕獲受保護虛擬機的每一個寫I/O,并將其拆分為2個寫I/O操作,一份寫到本地生產存儲,另一份寫到RP4VM的虛擬裝置vRPA(virtual RP Appliance).
2)數據標記:由vRPA組件對每個寫I/O操作進行相關命令封裝,加上對應時間戳標簽,以保證數據寫一致性.
3)數據傳輸:在完成數據標記操作后,vRPA將對數據進行進一步打包、數據縮減、封裝等一系列操作,將數據通過相關鏈路傳輸到異地的vRPA的歷史卷,從而組成基于不同時間點的歷史數據記錄.

圖1 連續數據保護與傳統的備份、快照區別示意圖

圖2 RP4VM連續數據保護機制示意圖

圖3 RP4VM連續數據保護過程示意圖
4)數據分發:在此階段,RP4VM系統將按照事先設定的連續數據保護策略,把不同時期的歷史卷與目標卷進行合并操作,從而生成針對特定時間的復制副本卷.由于數據傳輸與數據分發分為兩個相對獨立的操作階段,暫停數據分發并不會影響RP4VM數據復制傳輸.因而,在RP4VM暫停數據分發操作之后,用戶仍可以對數據復制卷進行讀寫操作.
通過RP4VM將虛擬機數據復制到異地數據中心后,目標端的復制卷與本地生產卷是完全一致的,用戶可以隨時使用Test Copy功能,啟動復制卷上的虛擬機,做任何操作,例如備份驗證,業務測試等.RP4VM是安裝在VMware虛擬化平臺上的,由vSphere Web Client進行統一管理,如圖4所示.
利用RP4VM提供針對虛擬機的連續數據保護功能,根據IT系統具體應用數據的具體備份恢復要求分析,可實現傳統備份業務架構的進一步優化,如圖5所示.

圖4 RP4VM的vSphere Web Client管理界面

圖5 利用RP4VM優化傳統備份業務架構示意圖
1)構建連續數據保護方式的一級備份體系——實時備份域.利用RP4VM技術對VMware虛擬化平臺實現連續數據保護,可以提供針對虛擬機邏輯故障與物理故障的有效防范.有別于傳統的備份技術,RP4VM最大的優勢就是能夠提供針對虛擬機的任意時間點的快速恢復.由于連續數據保護技術需要消耗額外的存儲空間,因此主要應用場景為針對運行核心業務的虛擬機數據保護增強上,可實現在發生故障時,業務丟失數據最少,恢復速度最快.
2)基于專用備份軟件和專用備份存儲集成的二級備份體系——定時備份域.采用通用備份軟件提供對虛擬機以及所有業務系統實現時間點備份,提供傳統的長期定時備份功能,同時借助備份專用存儲提高備份恢復性能,使用備份專用存儲的重復數據刪除功能,大大降低備份存儲空間.
通過RP4VM實現了對關鍵業務系統的連續數據保護,在發生故障時可以將業務系統恢復到指定的任意時間點,大大減少了故障導致的數據丟失.同時,RP4VM提供與vCenter高度集成的圖形管理界面,學習成本低,操作靈活簡單,能夠快速恢復故障虛擬機,大大降低了發生故障后業務系統的恢復時間.
RP4VM的引入,大大增強了傳統備份系統的業務保護能力,通過建立實時備份域與定時備份域的二級備份體系,實現對業務系統的分級數據保護.還可利用現有IT架構中的VMware環境,結合使用RP4VM提供高性價比的復制容災方案,同時保護了數據中心的現有投資.
[1] 王杰昌.高校數據備份技術的應用與探討[J].電腦知識與技術,2019,15(14):6-7.
[2] 袁靜,吳海燕,劉長興.基于云平臺的智能數據中心的構建[J].中國醫療設備,2014,29(11):58-61.
[3] 萬瑩,林奕,尤紅桃.連續數據保護中的滑動窗口技術的優化[J].計算機與現代化,2012(12):189-192,196.
[4] 趙科,郭磊.持續數據保護技術在企業級業務系統中的應用[J].上海船舶運輸科學研究所學報,2019,42(02):59-64.
[5] 牛超,楊英杰,毛秀青,等.基于虛擬存儲技術的持續數據保護機制[J].計算機工程與設計,2013,34(04):1207-1211.
[6] 韓榮杰,陳思超,傅浩峰.持續數據保護技術在電力信息安全中的應用[J].信息網絡安全,2013(10):28-30.
Research on Continuous Data Protection Technology Based on VMware Virtualization Environment
ZHU Long, YANG Fei
()
This article mainly deals with the current challenges and related protection methods for data protection in the VMware virtualized environment. The analysis is focused on the mechanism and advantages of the RP4VM continuous data protection solution for VMware virtual machines. The use of RP4VM product solutions to establish real-time backup domains is proposed. The second-level backup system greatly optimizes the traditional backup business architecture.
virtualization; RP4VM; continuous data protection
2020-06-22
朱龍,男,工程碩士,研究方向為校園信息化建設.
TP31
A
1672-0318(2020)05-0030-06
10.13899/j.cnki.szptxb.2020.05.006