聯通系統集成有限公司 北京 100032
隨著信息化建設的不斷推進和深化,各行各業的生產和運維對互聯網以及各類IT系統所產生數據的依賴程度越來越高,數據已經成為企事業單位的重要核心資產,數據的有效保護已經成為信息系統建設中最重要的環節。
當前,國內的信息系統建設情況表明,互聯網的角色正在發生變化,尤其是互聯網對于企業越來越重要的情況下,用戶更加渴望能夠實現“互聯網+”服務,渴望通過互聯網達到提升效率的效果。而在“互聯網+”模式驅動下,隨著云計算和虛擬化的不斷落地,現代的信息系統由以往的傳統IT架構環境邁向混合IT架構模式,傳統的IT架構環境與云化的IT架構并存,企業私有云的部署和公有云的嘗試,讓企業在IT運維過程中減少系統配置和上線過程的時間,降低企業IT建設成本,提高了IT利用率和管理效率,混合IT架構已經成為現代信息系統建設的新標準。
然而,混合IT架構的模式給信息系統的數據保護工作帶來了新挑戰。傳統數據保護方案已經不能滿足現代“互聯網+”業務的需求,現代信息系統更關注用戶對于數據保護在應用環境、大數據、虛擬化平臺的保護等方面的需求。業務驅動和“互聯網+”實踐的深入給信息系統的數據保護帶來挑戰。
1)虛擬化平臺的保護。傳統數據保護解決方案更適用于純物理環境,如果應用在虛擬化環境下會產生嚴重問題,如資源爭用嚴重影響用戶業務;無法精準恢復數據,恢復效率低。
2)大數據的挑戰。傳統數據保護方案的性能提升速度遠遠跟不上數據量增長的速度,缺乏精細化的數據恢復。企業會為此付出更多的計算資源、網絡帶寬資源,以及更長的恢復時間,無法達到恢復時間目標(RTO),備份所需的存儲空間在成本方面也給企業帶來極大壓力。
3)存儲系統的保護。企業信息系統的持續建設以及“互聯網+”業務的不斷實踐,傳統存儲系統與新型的軟件定義存儲系統不斷充斥著數據中心的基礎架構,隨著存儲系統的容量和性能越來越高,傳統的數據保護方案無法在既定的備份窗口完成越來越大的數據量的有效保護。
4)可管理性的挑戰。虛擬化的演進使得更多的用戶信息系統環境成為物理和虛擬的混雜環境,傳統數據保護方式不能很好地解決虛擬化環境下的數據保護難題,專門的虛擬化保護方案又無法兼顧物理環境下的數據保護,而多套保護方案的模式不僅成本高,且管理復雜,維護困難,這種變化使得數據保護變得更加具有挑戰性。
在目前常見的大型信息系統核心環境中,通常運行著小型機、操作系統、數據庫,后端連接多個品牌、型號的存儲,并存有大量結構化以及非結構化的數據。特點是數據總量大,動輒幾十、幾百TB,并且每年增長速度為幾十TB,業務系統復雜,數據量不斷激增,因此在數據保護方面需要能夠靈活進行數據備份和恢復,并可實現異地容災的解決方案。
方案應根據用戶的需求和業務特點進行數據備份與災難恢復管理的設計,為保證整個方案的針對性和合理性通常將以下幾點作為方案設計的原則。
1)符合行業技術潮流和發展方向。軟件產品應符合主流的技術和發展方向,符合大數據管理的要求和虛擬化應用的擴展,具有較長的技術壽命。
2)盡量減少對正常業務系統的影響。在資源爭用環境下盡量不占用虛擬化環境的資源,設計上應滿足節約資源合理分配的要求。
3)支持快速恢復和精細化恢復。通過技術提供有效的恢復方式,降低應用的停頓時間,數據恢復粒度變小,減少大數據量的恢復時間。
4)全面性。方案要能夠管理現有的所有環境,從異構環境、異構平臺到異構應用都能提供一體化的恢復和管理模式;從物理服務器環境到虛擬化環境,從操作系統、應用數據庫到文件數據,都能夠支持主流的虛擬化平臺及保護技術,提供統一管理,與現有設備兼容,并能兼容多個主流廠商的存儲設備與方案。提供備份和系統瞬間掛載多樣保護能力。這種全面性往往直接決定了方案的可行性。
5)數據恢復的可靠性。備份的數據系統具有可靠的恢復能力,快照瞬間掛載特性可隨時驗證切換演習,具有完善的數據監控和可恢復驗證體系。
6)系統的安全性。備份系統能夠提供全面的安全體系,生產數據、備份數據和備份系統的管理都應該具有高可靠的安全保障體系,保證數據的安全。
針對“互聯網+”業務的復雜性、多樣性以及高可用性的特點,應采用新一代集中備份方案,對現代信息系統環境下的數據庫、操作系統、文件系統進行安全的備份和保護,對重要應用實現短時間接管的能力。同時,還應綜合考慮具體的混合模式下統一管理、虛擬化、大數據的處理能力。
方案設計應針對核心、非核心業務系統采用不同保護方式,達成不同的SLA服務目標。1)針對核心業務系統,需要實現數據定時保護,并實現同城雙活以及異地數據級容災。2)針對非核心業務系統,需要實現本地數據保護,可有選擇地實現異地數據級容災。
數據保護方案設計采用的技術通常分為以下幾個部分。
1)本地數據集中備份(定時):通過完全備份與增量備份結合的手段,配合重復數據刪除、壓縮、加密等技術,實現從系統到數據庫到應用平臺及文件的全面保護,解決邏輯錯誤問題,避免數據丟失。此設計建議采用專門的備份產品,通過LAN以及SAN方式接入網絡(如本地服務器壓力或者網絡流量較大時,建議選用SAN方式,可確保系統整體的高效性),根據數據量及保留時間設計產品規格,并可橫向擴展為備份集群,提升存儲空間及并發備份性能。
2)通過CDP(連續數據保護)容災功能,將原生產環境進行P2V(物理機到虛擬機)保護,轉換的虛擬機存放在容災服務器中。當原主機故障時,可5分鐘內在容災服務器中啟動虛擬機(尤其是單機系統),實現應用接管,保障業務連續性。
3)針對核心業務系統,一般要求RTO(恢復時間目標)、RPO(恢復點目標)趨于0,應當實現架構上的冗余,自動切換與回切,可利用存儲虛擬化技術,實現存儲雙活保護。任意一臺存儲出現故障時,都可保證業務不中斷,數據不丟失。
4)無論是備份系統,還是存儲虛擬化網關,后續均可平滑擴展,在不改變現有組網的情況下實現異地容災。
備份策略的選擇與傳統的數據保護技術并無太大區別,周一到周六每天做增量備份,形成共計6天的增量數據,周末系統訪問量較小,建議在每周日進行全備份。同時,還應綜合考慮用戶現在的定時備份數據總量、未來數據增長量以及數據重刪、保留副本數,設計備份策略時通常是將定時備份數據保留1個月以上。
數據備份方案中應規劃使用專用備份設備和備份軟件,并一定要兼顧諸多系統的整體保護,無論是操作系統、數據庫還是文件系統,均可納入到保護范圍內,避免數據丟失或發生邏輯錯誤,導致數據恢復不可逆。
將備份系統部署到生產網絡中,應不改變現有網絡結構,并與需保護的服務器或虛擬機網絡連通,通過在多個層面分別創建各個系統相應備份任務與計劃,即可實現自動化數據保護。
1)操作系統保護。應將操作系統整體備份,做到信息全部保護,存放到備份設備中。當系統發生故障時,可通過光盤引導、USB引導、網絡引導等多種方式完成系統快速恢復,且支持原機恢復、異機恢復、裸機恢復等。
2)數據庫保護。數據庫的備份與恢復應覆蓋應用系統數據以及數據庫事務日志數據。數據庫的備份方法主要有完整備份、差異備份、事務日志備份等。根據數據安全性的要求,推薦的備份方式為每周一次完整備份,每天一次差異備份,每半個小時一次事務日志備份。
3)文件系統保護。支持對當前操作系統環境下的重要應用、文件、目錄進行整體保護,并支持整體恢復及單文件恢復,有效解決重要文檔的保護難題。
4)虛擬化備份與恢復。“互聯網+”業務的推廣也推動了虛擬化技術的廣泛使用,資源的合理利用也成為備份恢復技術新的關注點,在進行信息系統建設時應從以下幾個要點規劃虛擬化備份方案。①虛擬化無代理備份方式已經實現,無需在虛擬化平臺或者各個虛擬機上安裝客戶端代理,只需通過代理客戶端連接虛擬化平臺即可。無代理備份方式可有效避免虛擬機資源爭用。②重復數據通常是備份技術的難點,處理不當會導致存儲資源的浪費,因此,虛擬化備份必須與重復數據刪除技術相結合,可大幅減少備份數據所占用的存儲空間。③建議采用CBT(變化快追蹤)備份技術,只對新增的或變化的數據塊進行備份,提升增量備份效率。④應全面采用多種備份模式,以滿足復雜應用環境下多種虛擬機環境的備份需求。同時,還應支持高級備份方式,從而滿足虛擬機級別掛載恢復和文件級恢復。⑤虛擬機備份應支持掛載恢復,即使是TB級別的虛擬機,也可在幾分鐘內完成掛載恢復。通過掛載恢復,能夠在災難發生時,大幅減少虛擬機業務停頓時間,降低生產損失。⑥應支持細粒度恢復,可精準恢復虛擬機中的單個文件或文件夾等,提升恢復效率。
本方案不僅對所有物理服務器和虛擬化平臺提供全面集中的備份,而且還能使數據、應用、系統得到統一保護,以保證在數據丟失、系統損壞時高可靠的恢復性。
應全面支持物理服務器環境和虛擬化平臺下的數據保護,降低因混合IT環境而需要多套數據保護方案帶來的成本壓力和管理復雜性;同時,支持各種主流平臺下的系統、數據庫及文件數據的保護,也支持主流的虛擬化平臺的保護,并可對物理服務器及虛擬化平臺下的備份數據進行瞬間掛載恢復,提供業務應急的能力和數據快速恢復能力。
采用可變長數據塊檢查的全局重復數據刪除技術,可以將用戶環境中的不同操作系統平臺上的各類數據庫應用及非結構化數據進行全局去重,而先進的可變長數據塊檢查技術能夠使將分割的數據塊獲得更高的重復率,最大限度地節省存儲空間,即便是首次備份也能獲得相當高的去重率。而基于源端的去重,可使網絡傳輸的數據量大幅下降,從而節省帶寬資源。
當災難發生需要進行恢復時,恢復時間目標十分重要。傳統的恢復方案必須將整個備份集恢復出來,這就使海量數據的備份恢復變得極其困難。而很多情況下,用戶只需要恢復備份集中的部分數據,進行更細粒度恢復的需求就變得更加迫切,因此方案應采取虛擬機級別和文件級別恢復、數據庫單表級別恢復、單郵件級別恢復、操作系統備份文件級的恢復方式,將恢復時間大大縮短,使“互聯網+”復雜環境下的數據保護變得更加有效。
過度追求數據恢復顆粒度的細化,必然會導致硬件投資和維護管理成本的大大增加,因此,應依據需求區分對待。對于用戶關注的數據,如核心業務數據、郵件等,采取單表級別、單郵件級別恢復方式,針對其它數據則可根據實際情況采取虛擬機級別、操作系統級別等備份恢復方式。
應采用基于統一的管理控制平臺,對物理環境、虛擬化平臺環境以及傳統存儲平臺和新型的軟件定義存儲平臺提供統一的數據保護管理,對本地及異地災備系統提供統一的災備業務和數據管理,對多個備份站點提供統一的遠程監管平臺進行統一運維管理。基于統一的備份容災管理平臺,將能較好地支撐“互聯網+”業務需求,大大降低混合IT環境下數據保護的復雜度,降低方案本身部署、運維管理的復雜度,也會間接降低用戶的投資成本。
基于前文的設計原則和要點,在“互聯網+”業務中實現全面的數據保護,可根據用戶需求以及成本酌情選擇不同組合,分步實現,通常有三種方案可以進行選擇。
本方案中實現了主數據中心的全面數據保護,通過定時備份、實時備份等手段,將關系型數據庫以及應用產生的非結構化數據等保護起來,并異步傳輸到異地災備中心,可滿足24小時內數據不丟失的要求以及本地發生災難時,在異地仍有一份數據可以恢復的要求。
因為備份是容災的基礎,所以若要實現上述效果,需要通過兩套備份系統予以實現,第一套用于主數據中心,實現數據備份及數據容災,第二套用于災備中心,實現數據容災。
本方案中實現了本地數據中心內的存儲雙活,或升級為同城雙活數據中心,達到在本地數據中心或同城兩個中心核心業務不中斷、核心數據不丟失的目標。
由于用戶環境的多樣性、復雜性,為實現雙活建議配置存儲虛擬化網關,分別部署在同城兩個機房,并在兩機房至少各設計兩臺SAN交換機,配置級聯授權。為保障核心數據復制的及時性、準確性,應在同城的網關之間和SAN交換機之間均通過單模裸光纖連接。兩機房間業務網絡也需打通,并配置網絡負載均衡。
如只建設本地雙活,則不需要單模裸光纖和級聯授權,只需將設備都放在本地,通過多模光纖連接即可。
異地應用級容災是在同城雙活基礎上實現異地短時間內的核心業務接管,按照業內常規的設計指標以及用戶的心理預期,應用級容災至少應達到在異地RPO低于2小時、RTO低于8小時,這兩項指標越低越好,但投資成本也會倍增。
應用級容災設計指標主要與容災系統的數據恢復能力有關,最常見的設計指標就是RPO和RTO。RPO是指可以把數據恢復到過去的某個時間點,而RTO則是指在出現問題后多長時間可以恢復數據。
直觀地講,RPO其實就是企業所能容忍的最大數據丟失量。傳統數據備份方式,通常都是在晚上進行一天一次的備份工作。如果第二天出現錯誤,那從備份完成后到錯誤出現時所寫入的數據將都無法挽回,這期間沒有備份,數據就會全部丟失!如果錯誤出現在一天結束時,那一天的數據都將丟失,這種情況下,RPO就是24小時。為改進RPO,數據保護必須更頻繁地進行。大多數情況下,增加備份的頻率不現實。一是因為應用的高峰時段無法進行備份操作;二是因為備份數據所花時間太長。為改進RPO,應采用恢復管理策略,用連續復制和快照技術有效地改進RPO。
RTO則可簡單地描述為企業能容忍的恢復時間。在傳統的數據保護中,備份數據不能立即使用,必須先恢復。對象級別的恢復功能可以有效恢復單個目標,如一個文件或一封郵件,甚至是許多文件和郵件的集合。然而,恢復整個數據庫和海量數據時仍需要時間。要解決這個問題,應該對生產數據創建鏡像快照或連續復制,或兩者都做。因為復制是在線的,能立即投入使用,整個數據庫或海量數據的RTO也許只有幾分鐘甚至更短。
作為應用級容災方案,除了采取上述恢復手段,還應在異地災備中心增加與核心業務系統對應的主機,用于出現問題時快速接管業務。
“互聯網+”思路正在快速推動各行各業進行產業升級,各級政府、企事業單位都已加速業務戰略升級轉型,紛紛開始整合分散的業務和產業鏈,逐步形成更具平臺性質的業務系統,這也必然導致數據呈爆炸式增長。但目前大部分信息系統的數據保護架構仍然是傳統的技術架構,和“互聯網+”范疇內的云端、虛擬化及大數據技術架構難以融合。其直接影響是隨著企業數據規模越大,數據管理成本也越大,管理系統和設備也越來越臃腫,多個管理設備之間無法統一管理。可以說數據保護技術的優劣已經成為影響政府、企事業單位“互聯網+”戰略實施的重要因素,非常有必要引入新的技術理念,形成更多也更加完善的數據保護解決方案,為整個社會的“互聯網+”變革添磚加瓦。
參考文獻
[1]GB-T20988-2007信息安全技術信息系統災難恢復規范[S]
[2]張唯維.云計算用戶數據傳輸與存儲安全方案研究[D].北京:北京郵電大學,2011
[3]陳科有.混合云計算數據安全與隱私保護問題研究[D].南昌:江西師范大學,2013
[4]呂琴.云計算環境下數據存儲安全的關鍵技術研究[D].貴陽:貴州大學,2015
[5]段春樂.云計算的安全性及數據安全傳輸的研究[D].成都:成都理工大學,2012
[6]劉婷婷.面向云計算的數據安全保護關鍵技術研究[D].鄭州:解放軍信息工程大學,2013
[7]代煒琦.云計算執行環境可信構建關鍵技術研究 [D].武漢:華中科技大學,2015
[8]胡光永.基于云計算的數據安全存儲策略研究[J].計算機測量與控制,2011(10):2539-2541
[9]張璟.云計算模式下數據安全的關鍵技術與應用[J].計算機光盤軟件與應用,2012(21):50-51