
IT專業人員對磁帶絕對是愛恨交加,這不是什么秘密。但是情況在發生變化!對于本地磁盤備份自身無法解決的問題,云存儲提供商擁有的高度冗余、不斷維護的磁盤庫,肯定能解決問題!
雖然云在一些應用場合絕對取代得了磁帶,但它無法始終滿足每個人的需要,這也是磁帶的日子為何仍過得有滋有潤的主要原因。
然而,如果你忍不住想丟棄磁帶,改到云端,將備份由他人操心,那你不用苦惱,情況絕對在改善——特別是你只處理數量比較少的數據,能應對漫長的恢復時間,或者有大量閑置帶寬的情況下。
為了了解與磁帶和其他各種內部備份相比,云適合什么、不適合什么,不妨先深入探究一下。本文給出的兩個例子將表明問題和決策并不如你想象的或希望的那么簡單。
磁帶備份場景
A公司是一家小型會計師事務所,擁有幾臺虛擬服務器,完整備份大概需要500GB (增量備份大概需要50GB)。現在它使用老一代的LTO-4驅動器進行備份,互聯網連接是速率為5Mbps的銅質線路,但考慮到該公司處于市中心,它擁有想象得到的幾乎任何連接方案。
B公司是一家制造公司,擁有約35臺虛擬服務器,完整備份大概需要8TB(增量備份大概需要800GB)。現在它結合使用磁盤到磁盤備份和最新一代的LTO-6自動加載機,用于備份數據。互聯網連接是速率為20Mbps的銅質線路,這是它希望在鄉村地區獲得的最佳連接方案。
為了力求簡單,兩家公司都使用了Veeam Backup and Replication的虛擬備份軟件,可將生產型機器預先經過壓縮和重復數據刪除處理的映像轉儲到本地磁盤上,然后在本地磁盤處備份起來。(在進行這番比較時沒有計入虛擬備份軟件和本地磁盤的成本,因為內部備份方案和云備份方案都需要這塊成本)。此外,這兩家公司還都面臨一個棘手的業務要求:數據在異地至少備份一年。會計師事務所是國稅局要求這種離線備份,而制造公司則是與一家要求異地備份的《財富》100強公司簽有國防合同。
首先來比較成本。A公司在LTO-4驅動器方面的開支約1600美元,構成每年GFS介質輪換體系的30只磁帶每只另花費30美元。一名辦公室經理每星期花大概兩個小時確保磁帶已換好,成本約為每小時15美元;每過個把月總會出問題(通常是他忘了換磁帶所引起的),就要請外包的IT人員遠程解決問題,費用達90美元。這種方案的總成本是每年約4000美元,顯然人力成本占了大頭。
B公司在16插槽LTO-6自動加載機方面的開支約4000美元,構成GFS介質輪換體系的90只磁帶每只另花費105美元。一名專職服務器管理員每星期花4小時維護備份,每小時成本約30美元,她很少需要外界的幫助來確保系統正常運行。假設自動加載機用了三年后需要更換,這種方案每年的成本約17000美元。這回,硬件占了成本的大頭(具體是存儲介質),但人力成本仍占總成本的三分之一多。
其次是冗余。嚴格地說,A公司或B公司在冗余方面都做得不夠。備份內容先寫入到磁盤,然后復制到磁帶上,那樣每個備份至少有兩個副本,但除此之外沒有太多的冗余機制。要是基于本地磁盤的副本被覆蓋(一般不超過一星期)后,某只存檔磁帶遭到了破壞,備份內容就沒有備份可言。對不信任磁帶的人來說,這種風險很嚇人,于是要求磁帶介質有副本,但這必然會大幅抬高成本。
再來比較備份速度。A公司和B公司似乎都受制于各自一代LTO驅動器的性能。然而事實上,限制因素通常是源存儲,而不是磁帶驅動器。要說磁帶驅動器在哪一個方面尤為擅長,那就是全速存儲大量的順序數據(LTO-4的速度為120MBps,LTO-6的速度為160MBps),當源存儲的速度不夠快,跟不上驅動器的速度時,磁帶驅動器就表現不佳,有時就會導致效率低下的緩沖區欠載(buffer underrun),以及當緩沖區被重新填充時試圖繼續接著運行。
為了方便比較,這兩家公司的吞吐量都大大高于單一1Gbps以太網鏈路的實際吞吐量(大約110MBps),也高于7200轉速磁盤組成的小型陣列的持續讀取性能,這類磁盤通常中間存儲目標用于備份(速度可能在70Mbps到100Mbps)。
假設該中間磁盤目標是A公司真正的瓶頸,完整備份可能需要約兩小時。考慮到B公司的存儲需求大得多,可以假設它會部署性能更好的中間存儲系統,可以全速運行磁帶驅動器,那樣完整備份可能需要約15個小時(如果換備份介質,時間更長)。
最后是恢復速度。假設你有本地中間磁盤備份副本,想要的數據又實際上包含在該副本中,恢復幾乎立即進行。然而,如果你的本地副本已被破壞(可能由于整個站點遭到災難),或者需要的數據比本地副本中所含的數據更久遠,那就只好回過頭去找磁帶。
找磁帶則需要從異地保管庫取回磁帶;如果站點果真遭到了破壞,要找到能讀取介質的磁帶驅動器。根據情況嚴重程度,這個過程可能短則幾小時,長則幾天,加上恢復的實際時間通常與備份時間相似。
假設磁帶妥善存儲在另外某個地方,而且兩個小時內可以獲取,那么A公司的完全恢復最少需要六個小時,B公司最少需要近一天。
云端備份場景
現在不妨比較這兩家公司備份到云端時面臨的備份現狀。
A公司決定將備份移到亞馬遜網站大受歡迎的S3云存儲平臺用于主備份,并使用亞馬遜的低成本Glacier用于存檔備份。現在,A公司無須弄清楚驅動器和介質可能多貴,只要弄清楚要耗用多少存儲空間,如何將數據上傳到云端。雖然磁帶模式并不適用于云,但解決這個問題的辦法是,每星期將完全備份傳送到云端,然后將每天的增量備份傳送到云端。之后,每月將該備份的存檔副本傳送到Glacier,不需要進行另外的備份。
該公司需要大約800GB的存儲空間來存儲一星期的完全備份,外加六天的增量備份。這要為S3中的800GB活動備份每月支付約76美元(每年912美元),還要為復制到Glacier的9.38TB備份每月支付約96美元(每年1152美元)。假設軟件運行正常,沒人需要維護,這種方案的成本大概只有磁帶方案的一半。
但等一下,需要考慮的不僅僅是存儲。該公司還要考慮數據如何傳送到云端。假設獨家享用速率為5Mbps的互聯網連接,將500GB的完全備份上傳到云端需要近9天。這顯然行不通。速率為100Mbps的連接只要11個小時多點的時間就能傳完,但成本不菲:5Mbps的連接每月可能成本不到200美元,而100Mbps的光纖連接成本每月大約高達1000美元。光這一項就要增加9000美元,因而每年的總成本達到11000美元。
對B公司來說情況更糟糕。就S3中的12.69TB和Glacier中的152.25TB而言,存儲成本每年將近15萬美元。而將這些數據傳送到云備份環境,又需要多少成本?成本為零,因為這無法完成,由于位于鄉村地區,B公司只能享用20Mbps的連接,而通過20Mbps的連接傳送每周8TB的完全備份需要的時間將遠遠超過一個月。
如何看待云備份
當然,這不是說云存儲對上面提到的這兩家公司絕對沒用。問題是,傳統的內部備份和云備份全然不同,所以將傳統的備份方案轉為云方案會有三個問題。
一個問題是,云環境下介質成本顯然大幅上升。一盒LTO-6磁帶每GB的成本約4美分,可以將這些數據存儲數個月,不用再花一分錢。相比之下,S3每月每GB成本為9.5美分(每年每GB 1.14美元),Glacier倒是便宜很多,每月每GB僅為1美分(每年每GB 12美分)。
第二個問題是,目前可用來將內部數據復制到云端的手段遠遠談不上最佳。
第三個也是最關鍵的問題是,上述兩家公司需要針對所有數據實行不同種類的存檔備份規則。在B公司的8TB備份中,可能只有一小部分數據是該公司的用戶真正致力于確保有可靠存檔備份的。從備份集中挑選出這部分特定的數據,并進行文件層備份,其實很容易。
但這就帶來了新問題:能不能將磁帶備份換成云備份?令人滿意的答案是,那得看情況。這取決于你是否有經常變化的大量數據,它會增加每次需要傳送的數據量,大到一定程度后可能造成對現有的互聯網連接而言成本過高或不現實;此外,這還取決于你備份什么內容、如何管理內容。
總之,如果你想使用云備份,先要徹底考慮清楚所有這些問題,看看云備份是否可行,然后再看看其成本是否合理。到時你可能會發現,磁帶還是更合適的方案。