李超 盧燦舉 張云峰
摘要:21世紀以來,互聯網技術日新月異,人們工作、生活對互聯網的依賴性也越來越高,因此互聯網世界對數據可靠性、安全性的要求也提到了前所未有的高度。云計算環境下,數據高度集中,_旦數據出現問題將會帶來不可估量的損失。文章以云計算為背景,分析了當前基于云計算環境下的數據容災相關技術,并提出了網絡數據的備份容災命令中樞備份服務器的設計。
關鍵詞:云計算;容災;安全
互聯網技術被稱為20世紀載體技術的第4次革命,它的發展影響之遠、作用之大遠遠超過了之前的所有技術。隨著互聯網的深度應用,信息技術的發展,給人們的生活、工作帶來便捷的同時,也蘊藏著巨大的風險,各種數據信息的完整性、關聯性、真實性成為今后數據安全工作者需要關注的重點。
云環境下,數據高度集中存儲,給數據存儲降低了成本、管理帶來了方便,但數據的安全性卻大大地降低。近5年來,黑客入侵、信息泄露、數據丟失給各行各業帶來了巨大的損失。在此背景下,云環境數據的安全研究提到了信息安全領域前所未有的高度。在數據安全保護的研究方面,數據的容災備份是一項重要的技術,本文從云計算的概念入手,分析了云計算環境下數據容災的現狀和流行的數據容災技術,最后重點針對數據容災的命令中樞備份服務器提出了一套設計方案。
1.云計算
云計算可理解為計算機+網絡技術+服務。云計算包括:存儲系統、服務器、交換設備、安全平臺等內容。
云計算是20世紀80年代繼客戶端服務器轉變后的一次巨變,它是并行計算、分布式計算、虛擬化、網絡存儲、熱備份冗余、負載均衡等計算機技術與網絡技術融合的產物。云計算是一種服務模式,它是互聯網上相關服務的使用、疊加以及交付。這種服務模式具有虛擬化服務(用戶可在任意位置使用種類終端獲得資源,并且不再是有形體,用戶無需關注資源的具體形態)、數百上千臺超大規模服務器群、數據多副本容錯的高可靠性、可同時支撐多個不同應用、高伸展性、數據集中的風險性等特點。
2.云計算環境下數據容災的現狀
在激烈的市場競爭中,企業的發展比任何一個時代更依賴數據,數據的安全性對企業的發展乃至生存起到了不可小覷的作用。對網絡中數據的破壞分為“天災”和‘叭禍”,對于‘‘人禍”而言,對網絡中數據的保護,通常采用數據定期備份的形式,備份又分為完整性備份、增量備份,這種數據保護的方式僅對因系統管理員的錯誤操作、黑客、病毒的惡意攻擊導致的數據破壞具有保護和恢復作用,但對一些災害性“天災”的數據破壞是無濟于事的。
在網絡世界中,雖然“天災”發生的概率遠遠低于“人禍”,但“天災”帶來的數據的破壞卻遠遠大于“人禍”。如不及早地采取有效措施,將帶給云環境下數據致命的破壞。為了應對“天災”,數據容災應運而生,它是在數據備份基礎上的延伸,將數據備份到安全的地點。當本地數據發生意外時,不影響遠程的數據。
據“互聯網數據中心”對美國數據災難企業的統計數據顯示,自2000年起,發生過數據災難的企業中,55%的企業在半年內破產倒閉,另外45%的企業中,有29%的苦苦掙扎2年,也以關門也告終,艱難生存下來的僅有16%。
而另一個事例,卻反映了另一個事實,也給企業容災建設提供了有效的參考??植阑亟M織發動的“911”事件,炸毀了美國的世貿大廈,大部分企業一時無法繼續貿易,然而摩根斯坦利公司卻創造了一個奇跡,該公司在第2天就能夠恢復正常營業。其主要原因是它們不僅像一般公司那樣在內部進行數據備份,而且在數英里外的新澤西州也保留著公司數據的完整備份。
按災難對數據信息的破壞程度,從高到低分為5個等級。
一級破壞:全部數據丟失。
二級破壞:主要數據及系統丟失。
三級破壞:鏡像(非主數據)及系統丟失。
四級破壞:遭受真正的攻擊,但沒有丟失數據。
五級破壞:沒有明顯證據的災難威脅。
3.容災系統評價的3R標準
數據容災系統的好壞由3個指標來決定,分別是冗余性(Redundance)、遠程性(Remote)、響應性(Replieation),也被稱為3R標準。
一個真正的容災系統要滿足冗余性就需要對數據、關鍵組件、設備進行冗余設計,一旦一個系統或服務器發生故障,備份系統將能及時替代,保證數據的穩定和連續性。數據災難一定要考慮要距離的影響,如果容災系統設計(生產中心與備份中心)距離過近,可能導致數據同時受到破壞,因此遠程性要求容災系統的生產中心與備份中心要足夠遠。容災系統另外一個評價指標就是數據恢復時間的及時性,也稱為響應性,恢復時間的長短直接影響到容災系統的好壞,也是容災系統重要的價值體現。
4.云計算環境下數據的容災技術
4.1Cache技術
Cache是一種緩存技術,它以數據庫(Database)的形式將數據存放在存儲設備中,對常用的數據進行備份,因此,當用戶再次訪問同一數據時,就從緩存中訪問,大大縮短了訪問時間。在容災系統中,將數據信息緩存在容災系統中,可以實現對數據的備份和快速恢復。
其中,數據容災的Cache技術還包括2種算法:第一,本地容災磁盤的飽和計算,該種方法是指通過對單位時間內數據恢復的次數進行統計與計算,替換恢復次數較少的數據塊;第二,對異地數據信息的恢復計算,所謂的異地數據信息恢復計算是指,通過單位時間內數據塊恢復的次數確定是否對異地數據塊進行替換。
4.2映射技術
映射技術在一般情況下對設備和程序管理之間形成的映射關系進行處理,它是完成信息儲存的主要技術,映射關系的出現導致了數據的自動遷移,而自動遷移是由一種指令的觸發而形成的自動化操作,如:數據的自動保存、復制和粘貼、刪除。當磁盤遭到損壞后,將映射技術應用到數據容災中,容災系統就會自動接收到該項指令,并對相關數據進行映射操作。在使用映射技術時,還可對磁盤的透明進行替換,但是用戶在使用之前,必須先建立一個云存儲環境,然后在云存儲環境中將映射的數據進行多項復制和備份到容災系統中,同時,為了避免磁盤的損壞導致數據的永久不可還原性,在數據備份的過程中可以同時創建多個副本。
4.3互連技術
由于數據容災系統涉及主節點與冗余備份節點,因此將它們連接起來的互聯技術在容災中十分重要。目前,主節點與冗余備份節點之間的連接主要是光纖通道連接,主要是基于SAN的遠程復制,即通過光纖通道Fc,把2個SAN連接起來,進行遠程復制。當災難發生時,由備份數據中心替代主數據中心保證系統工作的連續性,這種遠程容災備份方式存在的一些缺陷是:實現成本高,設備的互操作性差,跨越的地理距離短(10公里)等。
4.4CDP技術
Continuous Data Protection(CDP)是一個實時的數據備份系統,它自動將應用數據的所有變化實時記錄下來。它的關鍵是將每一個應用數據的變化加上了時間索引。這樣,當出現數據丟失、數據損壞或者安全問題時,就可能恢復到最近的完好數據。CDP技術不斷進步,在數據損耗的情況下,其允許快速的數據恢復,并把數據還原到生命周期任一指定點。
4.5主備機容災
對正在運行業務的每臺主機(業務機)各建立一套備份機(容災備份系統,主機與備機建立一對一的關系),有條件的在異地建立異地容災系統,一旦本地主機發生故障,數據錯誤或丟失,通過異地備份系統進行恢復。