
災難恢復通常需要花費高昂的成本。比如在遠處某個地方建好備用站點,擁有一整套的硬件、軟件和系統,并將數據復制到該遠程站點,以防萬一遇到了災難,可以保證系統正常運行。但這需要全面的系統冗余性,而一套備用系統在99.99%的時間里都處于閑置狀態。在眼下預算緊張的大環境下,其實很少有誰能實現這種夢想。
因此,云災難恢復服務提供商應運而生,比如RackWare、亞馬遜、谷歌和Zetta。它們給云計算的定位是它不僅僅是存儲數據的地方,還是替代傳統災難恢復的一種合理方案。
以下是將云服務添加到災難恢復計劃的七招。
選擇要慎重
現在有許多選擇。除了上述四家公司外,還有Zerto、HotLink和Veeam等提供商,它們都提供專業的云災難恢復服務。不過認真打量一番這些提供商,我們就會發現它們之間的不同。有些適合不太需要頻繁訪問的批量存儲,而另一些則更適合復制。當然,定價模式和費用也大不一樣。對某一種類型的流量而言是經濟高效的云服務,而對另一種類型的流量則可能不那么合適。
使用云改善RPO/RTO
恢復時間目標(RTO)是指用戶愿意等待、直到站點恢復如初的時間。恢復點目標(RPO)則是指萬一出現災難,用戶愿意失去的數據量。Zetta公司的產品副總裁Chris Schin指出,就傳統的災難恢復解決方案而言,RPO只適用于被遷移到災難區域以外某個異地位置上的一個備份集。如果災難發生時備份仍在現場,那備份到磁帶或閃驅上的任何近期數據都恢復不了。
Chris Schin說:“如果你使用物理存儲介質將數據遷移到異地,災難場景下的RPO并不取決于備份軟件的參數,而是取決于那些磁帶被送到異地磁帶庫的頻率。如果是每周一次,那么PRO最多就是為期一周的數據量,哪怕你之前每小時快照一次。”
遷移工作負載
RackWare公司的首席執行官Sash Sunkara鼓勵公司大膽嘗試:把備份之外的工作負載也放到云端。她建議,可以把一些工作負載整個放到云端,看看效果如何。她說:“毫無疑問,使用云基礎設施來備份數據具有優勢,不過,你不僅可以備份文件和數據,還能將物理服務器的整個工作負載(包括操作系統、應用程序和數據)直接移到任何云上,比如亞馬遜云服務、RackSpace或SoftLayer。”
考慮全面的云災難恢復
一些公司正在想方設法成為所有備份數據的云存儲庫,其中谷歌走得最遠,它竭力推銷Google Apps,希望將用戶的全部數據都存儲到云上,并負責處理相關的災難恢復。
Google Apps高級產品經理Rajen Sheth聲稱,Google Apps的RPO目標為零。它擁有在幕后復制所有數據的龐大云。其他公司也提供類似的服務,讓用戶可以繼續使用自己青睞的任何商務應用軟件,而不是完全求助于谷歌。
使用多個云
雖然這個行業的技術巨擘們拼命吆喝使用一個綜合云里面的多個數據中心,但LC Technology International公司的CEO David Zimmerman則提議,使用多家云服務提供商來用于災難恢復,以降低風險。他說:“別僅僅使用一個云,而要使用多個云來降低風險,可將數據備份到每個云,實現冗余機制。由于成本日益下降、可靠性日益提高,云大有希望,不過企業仍應該小心行事。”
物理系統作為補充
降低風險的另一個辦法就是,繼續保留某種基于物理系統的災難恢復方案。如果整個云被黑客盯上了,或者丟失了網絡,這實際上相當于將全部雞蛋都放在云這一只籃子里面。David Zimmerman說:“公司應該考慮物理存儲及其他方案,作為云的補充。云存儲依賴于互聯網訪問,所以關鍵系統應該還要有某種內部部署的存儲解決方案。”
莫忘保護不足的工作負載
Sash Sunkara支了另一個妙招。她特別指出,在許多數據中心,受保護的工作負載往往被分成兩類:關鍵任務型,這種工作負載即使停止運行幾分鐘都不行;低優先級型,這種工作負載在歸檔時可能需要花幾小時、甚至幾天才能恢復。前者通常由非常昂貴、先進的高可用性和集群解決方案加以保護,這類解決方案能實時同步復制系統。后者往往由磁盤歸檔或磁帶備份加以保護,成本非常低廉,但恢復速度也很慢。
Sash Sunkara說,介于這兩類之間的所有工作負載通常需要較快的恢復時間,但不需要昂貴的復制系統,它們缺乏保護力度。面對這些保護不足的工作負載,有一個解決之道,即使用云作為“虛擬災難恢復”站點,將工作負載出現的變化定期同步起來,萬一出現計劃內停止運行或意外停止運行,恢復系統可在短短幾分鐘內投入使用。
由于成本日益下降、可靠性日益提高,云大有希望,不過企業仍應該小心行事。