
對(duì)于磁盤的備份和恢復(fù),是選擇簡單、熟悉的縱向擴(kuò)展還是技術(shù)和成本更具優(yōu)勢(shì)的橫向擴(kuò)展,企業(yè)需認(rèn)真權(quán)衡。
存儲(chǔ)行業(yè)中許多人在討論用于備份和恢復(fù)操作的“縱向擴(kuò)展”(scale-up)架構(gòu)與“橫向擴(kuò)展”(scale-out)架構(gòu)。近些年,越來越多的企業(yè)在部署使用重復(fù)數(shù)據(jù)刪除技術(shù)的基于磁盤的設(shè)備,以此減少磁帶的使用或者不用磁帶。但設(shè)備廠商們采用的架構(gòu)方法對(duì)所選擇解決方案的性能、可擴(kuò)展性和總體成本有著很大的關(guān)系。
在討論縱向擴(kuò)展方法和橫向擴(kuò)展方法的優(yōu)缺點(diǎn)之前,不妨先界定兩個(gè)術(shù)語。
縱向擴(kuò)展架構(gòu)通常指使用單一、固定的資源控制器來處理所有任務(wù)的架構(gòu)。想添加容量,可以附加磁盤柜;最多能附加多少磁盤柜,控制器已有規(guī)定。
橫向擴(kuò)展架構(gòu)通常指可以單獨(dú)擴(kuò)展或步調(diào)一致地?cái)U(kuò)展性能和容量的架構(gòu),不是依賴單一的控制器,而是為每個(gè)磁盤單位提供了處理能力。
滿足備份的經(jīng)濟(jì)意義
不管采用哪種方法,基于磁盤的備份重要的一點(diǎn)是,如果沒有重復(fù)數(shù)據(jù)刪除技術(shù),使用磁帶就缺乏經(jīng)濟(jì)意義。由于許多企業(yè)保留幾個(gè)星期、幾個(gè)月,甚至幾年的備份數(shù)據(jù),實(shí)際的備份數(shù)據(jù)量通常是企業(yè)環(huán)境中活動(dòng)數(shù)據(jù)量的好多倍,這就導(dǎo)致純粹使用磁盤成本過高。因此,結(jié)合磁盤和重復(fù)數(shù)據(jù)刪除技術(shù)是廠商向備份和恢復(fù)市場推出實(shí)際產(chǎn)品的第一步。
從表面上看,縱向擴(kuò)展架構(gòu)有一個(gè)簡單的前提:磁盤加上重復(fù)數(shù)據(jù)刪除技術(shù)形成了一種備份和恢復(fù)設(shè)備,能夠滿足備份的經(jīng)濟(jì)意義。但是備份和恢復(fù)絕不僅僅是個(gè)存儲(chǔ)問題。實(shí)際上,備份和恢復(fù)還是:數(shù)據(jù)移動(dòng)問題——在預(yù)先確定的備份窗口內(nèi)轉(zhuǎn)移大量數(shù)據(jù);數(shù)據(jù)處理問題——數(shù)據(jù)需要進(jìn)行處理,才能以經(jīng)過重復(fù)數(shù)據(jù)刪除處理的形式加以存儲(chǔ);以及存儲(chǔ)問題——重復(fù)數(shù)據(jù)刪除技術(shù)讓更多的備份數(shù)據(jù)得以存儲(chǔ)在少得多的磁盤空間。
話雖如此,但縱向擴(kuò)展方法也有幾大優(yōu)勢(shì):具有明顯的簡單性,因?yàn)檫@種方法通常只有一個(gè)計(jì)算單元——你在此進(jìn)行配置和管理;在一些情況下,縱向擴(kuò)展架構(gòu)可能只需較少的電源與冷卻資源;縱向擴(kuò)展方法的歷史比較久,對(duì)管理員來說比較熟悉,它一般提供了良好的功能特性,適合管理員所需的用途。
但數(shù)據(jù)迅猛增長導(dǎo)致縱向擴(kuò)展架構(gòu)出現(xiàn)了性能問題,原因很簡單,由于這種架構(gòu)只有一個(gè)計(jì)算單元放置所有的網(wǎng)絡(luò)端口、處理器和內(nèi)存,所以其性能受到該部件能力的限制。由于數(shù)據(jù)不可避免地增長,只好添加容量(意味著更多的工作負(fù)載),直至達(dá)到該控制器的最大容量。
這就導(dǎo)致了兩個(gè)重大問題:在數(shù)據(jù)增長期間,所有過程也都隨之變長,這包括備份時(shí)間、重復(fù)數(shù)據(jù)刪除時(shí)間、復(fù)制時(shí)間和恢復(fù)時(shí)間。很顯然,如果你將更多的工作負(fù)載扔給某一固定的資源,又不提供額外的處理能力,完成該工作就要花更長的時(shí)間;達(dá)到最大容量時(shí),你只好進(jìn)行叉車式升級(jí)(fork-lift upgrade),升級(jí)到功能更強(qiáng)大的控制器,這可能需要高昂成本。
而橫向擴(kuò)展架構(gòu)以不同的方式來應(yīng)對(duì)數(shù)據(jù)增長。在橫向擴(kuò)展架構(gòu)中,架構(gòu)的每個(gè)基本模塊確實(shí)含有或可以添加額外的性能單元,包括網(wǎng)絡(luò)端口、處理器、內(nèi)存和磁盤。因而,隨著數(shù)據(jù)不斷增長、容量不斷添加,處理能力也可以隨之添加。這意味著數(shù)據(jù)增長并不導(dǎo)致備份、重復(fù)數(shù)據(jù)刪除、復(fù)制和恢復(fù)所用的時(shí)間更長。如果工作負(fù)載增至4倍,架構(gòu)的處理能力也增至4倍。也不存在所謂的“最大容量”。雖然廠商們可能限制了多少設(shè)備可以共存于一個(gè)單獨(dú)管理的系統(tǒng),但從來不需要叉車式升級(jí),因?yàn)榭梢岳^續(xù)單獨(dú)添加設(shè)備,哪怕這意味著開始使用一個(gè)“新系統(tǒng)”。
選擇合身的系統(tǒng)
縱向擴(kuò)展方法存在的另一個(gè)難題與選擇大小合適的系統(tǒng)有關(guān)。許多縱向擴(kuò)展技術(shù)廠商提供了大小不一的控制器,這意味著控制器可以處理不同的最大磁盤數(shù)量。你可能也料到了,功能更強(qiáng)的、允許添加更多容量的控制器自然成本更高。所以,如果顧客選購這種方案,就要確定是購買能夠應(yīng)對(duì)比目前所需環(huán)境更大的控制器,還是購買會(huì)更早達(dá)到最大容量的更小控制器。
橫向擴(kuò)展方法避免了選擇大小合適的系統(tǒng)這個(gè)問題,因?yàn)檫@種架構(gòu)具有模塊性。客戶可以根據(jù)目前環(huán)境,再加上預(yù)計(jì)的合理增長,購置大小合適的系統(tǒng)。然后,隨著數(shù)據(jù)不斷增長,可以根據(jù)需要添加更多的基本模塊,不用擔(dān)心叉車式升級(jí)。這使得前期購買可能更具成本效益,同時(shí)又避免了以后進(jìn)行成本高昂的升級(jí)。
不利于縱向擴(kuò)展方法的最后一個(gè)理由是技術(shù)容易過時(shí)。IT專業(yè)人員對(duì)這一幕再熟悉不過了:購買一個(gè)新產(chǎn)品,卻發(fā)現(xiàn)買來不久就過時(shí)了。如果你決定買一只更大的控制器,以便適應(yīng)更大的擴(kuò)展需求,這個(gè)問題顯然尤為突出。控制器把你死死綁在了買來時(shí)還算先進(jìn)的技術(shù)上。如果廠商此后發(fā)布了基于更新技術(shù)的控制器,你想使用這種控制器,唯一的辦法就是進(jìn)行另一次叉車式升級(jí)。
橫向擴(kuò)展方法也許可以避免這個(gè)問題(取決于廠商),因?yàn)樗層脩艨梢栽谕粋€(gè)系統(tǒng)中混合搭配好幾代的基本模塊。假設(shè)廠商保證硬件可以升級(jí)到最新最好的軟件,你就不需要丟棄并更換成本高昂的部件,以便充分利用廠商提供的最新產(chǎn)品。