李廣鵬 王柯
隨著云計算技術不斷深入發展以及運營商落實IT轉型規劃的需求,某運營商從2015年開始逐步落實公司私有云建設、運營及運維工作,支撐全公司IT云資源需求。在私有云架構的運營和運維的探索中,除關注基礎架構本身因素外,更多關注架構中最核心的資產,即數據。通過“私有云全局化多維度數據保護”、“云數據保護運維集中可視化”、“全生命周期云數據備份閉環管理”、“云數據備份與恢復能力服務化共享與開放”這幾方面的創新,研究私有云環境下全棧數據保護的技術架構和其運營體系,具有重要的實際意義和應用價值。
在私有云的運營和運維中數據保護一直是比較缺失的一環,體現的問題如下:
集中:業務數據集中化的運營方式,將各網元有價值數據進行全量歸集,災難性的故障將造成大批量、多維度的數據丟失,影響極大。
復雜:私有云設備數量多、數據流量大、部署分散、環境復雜。因此系統故障風險概率增大,運維人員利用原有手段很難系統的完成數據的備份與保護工作。
轉變:私有云逐漸向合作、開放的運營模式轉變,云數據作為商品與傳統物品價值存在較大區別,數據一旦丟失將嚴重影響客戶感知和企業形象。
服務:伴隨私有云的發展,需要提供一體化的云數據保護運維管理解決方案,提供SaaS數據保護應用服務,為企業各部門解決數據保護運維管理中所面臨的共性問題。
基于以上問題,本文探討對私有云數據保護的具體解決方案。
(一)私有云環境下的數據保護和雙中心數據保護
通過數據中心二層網絡互聯與應用負載切換、基于分布式與虛擬化的云數據同步、數據庫日志復制同步保護、集中存儲數據級容災復制保護等技術,對私有云建立同城雙活容災中心,并依托統一的數據備份管理平臺,建設完善的數據保護管理體系,實現私有云的關鍵數據持續性保護與業務連續性管理。
1、備份專網改造,提高備份速度
數據的備份傳輸主要為:LAN備份和LAN-Free備份兩種傳輸方式。
(1)LAN-Free的數據傳輸方式:
優點:數據備份統一管理、備份速度快、網絡傳輸壓力小、磁帶庫資源共享;
缺點:設備費用投資過高,與業務存儲共用主機的HBA卡端口,在備份過程中會影響存儲讀寫速率。
(2)LAN的數據傳輸方式:
優點:是節省投資、磁帶庫共享、集中備份管理;
缺點:對業務網絡傳輸壓力大。
經過反復測試驗證,在當前私有云萬兆網絡環境下,每個虛擬機的備份作業的速率可達到238MB/s,與LANFree的備份效率基本保持一致。對當前IP網絡進行優化改造,為備份系統建立完全獨立的備份網絡,并與業務網絡進行隔離,可以進一步提升備份速度。見圖1。

2、合理設計IaaS和PaaS備份架構,提高備份效率
目前IaaS平臺和PaaS平臺均采用萬兆網絡進行互聯,每套IaaS平臺與PaaS平臺都使用獨立的萬兆匯集交換機,為充分利用萬兆網絡的帶寬優勢,使用高速備份設備(備份一體機),并利舊傳統的SAN網將對象存儲,VTL,PTL設備掛接到高速設備后面,提供較大的備份數據存儲空間。
3、雙中心數據保護,提高安全指數
針對高可用的資源池部署雙中心數據保護,通過二層網絡將A數據中心虛擬機復制到B數據中心,當主中心發生故障后進行災備切換,以保證核心系統的業務連續性。
(二)數據分層與數據生命周期管理,提高介質利用率
按照數據的使用頻率以及各備份作業特點,將備份數據分為2層,即近線層和離線層。近線層(可參考最新的備份根據備份副本定義)將數據存放在一體化備份設備或者VTL設備上,注重高效備份快速恢復和數據使用;離線層將數據存放在對象存儲,云存儲或利舊的磁帶庫上,注重數據的長期保留。見圖2。

針對分類數據的重要程度,將數據部署為:金牌、銀牌、銅牌生命周期策略:
金牌生命周期策略:主要面向核心系統,數據備份至本地虛擬帶庫或者一體化備份設備上后,同時再復制兩份數據,一份復制到本地的對象存儲上保留6個月,一份復制到異地的物理帶庫永久保留。
銀牌生命周期策略:主要面向重要系統,數據備份至本地虛擬帶庫或者一體化備份設備上后,同時復制到本地的對象存儲上保留3個月。
銅牌生命周期策略:主要面向外圍系統及測試系統,數據備份至本地虛擬帶庫或一體化設備上。
(三)自服務備份方式,提升運維效率
在大量的云平臺應用數據需要備份時,如果使用傳統的備份配置方式,逐條配置備份任務,勢必增加備份管理人員的任務量,增加部門間的溝通復雜度,通過配置和開發云平臺自服務備份產品,可以更好的實現備份運維目標。
(四) 統一備份監控平臺,提高數據備份管理效率
對多個備份域統一納管,并與綜合網管系統進行對接,通過Snmp的trap信息,將備份失敗作業發送到ITSM平臺,對相關管理員進行短信及語音告警,實現對備份系統一體化監控及告警。
在推廣私有云建設大背景下,通過以上幾方面的優化,探索新的數據保護潛在價值。
(一)私有云全局化多維度數據保護
突破傳統手段:使用適配x86服務器大集群大數據量的技術特點,采用創新的技術架構對其進行數據保護,而不是用傳統備份架構應對新的云化架構;
數據去重:對于IaaS平臺所承載的虛擬機,可以通過數據去重,提高資源利用率,節省投資;
資源池雙中心數據保護:云化環境中,利用虛擬化技術以及存儲底層復制功能,實現資源池雙中心數據保護,保證業務的連續性。
(二) 數據分層與全生命周期云數據備份閉環管理
根據指定的策略將備份數據分層,并基于關鍵條件自動地將數據從一個層移動到另一個層。作為一項規則,較新的數據和那些很可能被更加頻繁訪問的數據,應該存儲在更快的,并且更昂貴的存儲媒介上,而那些不是很重要的數據則存儲在比較便宜的,稍微慢些的媒介上。
(三)云數據保護運維集中可視化
備份域的集中運維管理,通過提供數據保護環境的可見性來為組織提供幫助,通過生成全面的報告來跟蹤備份操作的有效性,使私有云備份運維支撐更臻完善:
(四)云數據備份與恢復能力服務化共享與開放
充分結合傳統架構與云計算數據保護功能體系,建立全局化的IT資源數據保護解決方案,為企業內部提供一站式綜合數據保護服務。
私有云環境下,IT架構不再是由幾十臺小機和集中存儲組成,而是動輒就到了上千甚至上萬臺虛擬機的規模。考慮今后容器技術,大數據技術的普遍推廣落地,這個規模的增長將是發散性的。唯有將數據備份和保護平臺,納入到云平臺的體系中去,將備份工作變成自動化、用戶自助可調度的服務模塊,才能在前端應用架構發散增長的趨勢下,實現后端數據保護架構的收斂。
作者單位:中國聯通北京分公司