


云存儲建設中的重點技術
昆明卷煙廠為構建企業私有云平臺,利用存儲虛擬化技術,首先實現了云存儲,構建存儲基礎架構云。
1.利用虛擬化建設存儲基礎架構云
存儲虛擬化的建設步驟包括以下6個步驟。
(1)實現物理設備的虛擬化 通過虛擬化平臺,將現有系統中多個廠商的異構存儲組建成為一個虛擬化資源池,實現數據的跨平臺流動性和統一管理。
(2)實現存儲容量虛擬化 利用虛擬化平臺提供的精簡供應的能力,將資源池的資源進行回收再分配,消除之前普遍存在的容量過量分配問題,提升資源利用率。
(3)實現數據擺放虛擬化和自動優化 通過虛擬化平臺提供動態分層和智能優化技術,構建基于多種存儲介質的多層存儲平臺。通過動態分層技術,將繁忙的數據塊動態遷移至閃存介質,而將冷數據動態遷移至大容量的低成本介質中,從而優化成本結構,提升資金利用率。
(4)實現存儲服務虛擬化 在上述資源池中提供了常用的SAN、FCoE等服務器直連的塊存儲訪問能力,同時該平臺通過不同的協議網關可以對外提供NAS、歸檔和VTL的存儲服務,形成跨協議、跨數據類型的綜合存儲平臺。
(5)實現存儲資源高可用和多層保護 通過虛擬化平臺提供的高可用和數據保護技術,做到數據的跨設備保護以及存儲平臺的跨地域保護。
(6)建成統一管理的云存儲平臺 將該平臺與計算、網絡資源池結合,通過云平臺管理軟件實現整個平臺的云供給。
實現云的目的有很多,包括提高架構靈活性、提升服務水平、提升架構可靠性等,但是歸根結底是要提高資金的ROI(投資回報),因此,實施云及云存儲之前要進行項目的ROI分析,確定合理的資金投入,而在之后要根據項目的實際情況對評估進行檢查和修正,確定未來的項目進度。
存儲作為企業最重要的IT資產,其成本構成不僅包括采購成本(CAPEX),其使用和運營過程中還會產生大量的其他成本(OPEX),要科學地評價云帶來的成本效益就需要對這兩部分成本進行量化分析,從而得出存儲架構的總體成本(TCO)以及降低這些成本的有效途徑。
經濟學分析的步驟包括:
(1)以當前架構為基礎,從構成TCO的34種成本中,選取對企業影響最大的成本項進行量化,確定目前的存儲成本基線。
(2)對需要優化的成本項,選取合理的技術和方案,進行經濟學評估,得出該方案實施前后成本節省、ROI(投資回報率)、IRR(內部投資回報率)以及在評估周期內的財務現金流及NPV(凈現值)。
(3)根據企業的實際情況,細化不同方案的時間點和實現步驟,制定企業云存儲架構演進圖,分步驟完成。
(4)在不同的檢查點,對成本節省效果進行評估,對評估模型進行調整。
2. 難點與風險控制
在存儲虛擬化過程中有很多難點與風險,要加以控制,并制定相應的虛擬化整合策略來規避這些風險,使云平臺建設過程順利完成。
存儲虛擬化的難點與風險包括:
(1)數據遷移 對于目前的生產數據,虛擬化整合項目實施面臨的首要問題就是數據遷移及防范遷移過程中的風險。昆明卷煙廠需要采用成熟的、安全可靠的數據遷移方法,根據現有情況的不同而采用不同的方案。這里可能用到的幾種典型數據遷移方案列舉如下:
Unix 平臺利用LVM進行在線遷移 ,利用LVM的鏡像功能,在生產中心直接掛接新購磁盤陣列,并和原來的盤陣進行鏡像。鏡像完畢后,移除原磁盤陣列。
利用存儲虛擬化技術(例如HDS的UVM),通過虛擬化技術進行在線遷移。將原來的盤陣通過虛擬化技術掛接在虛擬化存儲平臺后,并提供給主機訪問。再通過新存儲陣列的虛擬化引擎及數據遷移軟件將原來的數據在線復制到新存儲陣列內部。在這種情況下,也可不進行數據遷移,即將原來的盤陣掛接在新存儲陣列后,仍然將數據存放在原來的存儲陣列上使用。
(2)計劃內停機 在虛擬化整合項目的實施過程中,由于數據遷移和系統切換會導致原業務系統短暫的停頓。具體的業務停頓時間,會因采用的方法不同而不同,結合上一節內容,如果采用存儲虛擬化技術結合自動的LUN Mirgration軟件,會自動實現從原來存儲設備到新存儲設備之間的數據遷移。對業務造成的停頓影響大概在2~3小時,主要是用來完成原來存儲設備和新存儲設備之間的物理連接及LUN對應關系的建立。該項工作完成后,即可啟動原來的業務系統,使數據遷移在后臺自動進行,并最終完成設備的切換。
(3)舊設備的再利用與投資保護 存儲虛擬化技術即是解決這個問題的有效措施和方法,可以實現將原來不同廠商的存儲系統集合到同一個存儲池中,具體就是掛接在新的存儲設備之后,作為外部資源,和新存儲設備本身的內部資源一樣進行分配使用,起到利用舊設備和保護投資的目的。
當然,我們在信息收集和需求分析階段就會對現有的設備做出分析評估,對技術上可以利用的存儲設備提出虛擬化的使用建議。
3. 虛擬化整合的管理策略
(1)規避風險 信息管理最大的敵人就是風險,信息管理人員思想上最怕的也是風險。如何規避風險成為信息管理,特別是SAN領域十分重要的課題。
業務系統日益復雜和龐大,而且要求存儲系統對應用提供高可用性保障,在如此復雜的環境中,信息的配置和管理也變得日益復雜。在這種情況下,如果沒有好的系統工具的協助,會有許多人為的錯誤產生。即便是熟練的管理技術人員,也不能避免不犯錯誤。所以,采用和選取簡化、自動化的管理工具進行協助管理和監控是有效的辦法。
昆明卷煙廠對整個存儲環境的各個元素的關鍵點進行了全面的性能、容量以及配置信息的收集分析,并提供自動化的存儲分配工具,為降低人為錯誤提供了強大的支持,使系統由于人為錯誤而導致的風險降低到最低,強有力地保證存儲系統和其所支撐的商務應用的風險得以規避。
(2)改善SLA服務質量 SLA(Service Level Agreement)是信息管理部門績效評估和服務能力的重要標志。SLA是根據信息服務的質量所作的服務質量承諾協議,以書面的形式表明當信息支撐系統或相關服務質量劣化到某種程度時,客戶(商務部門)可以得到相應的賠償或投訴。SLA服務水平承諾向客戶提供專業化和標準化的服務,是以信息服務的質量承諾來保證商務的正常運轉,實現由提供無差異服務到滿足客戶個性化需求的轉變,將有利于集中優勢的資源,保障重要商務應用的服務,有利于提高整體維護管理水平。
圍繞信息系統維護的關鍵指標,如存儲資源的開通時間、光纖網絡性能、服務響應時間、業務提供保證等對服務水平的承諾。例如對于新系統上線所需的存儲資源分配時間方面的SLA如下表所示。
表 存儲資源分配與SLA
除了在提供服務之前同商務部門或客戶簽訂的協議之外,還包括簽訂協議后,對于信息服務的實際執行狀況。另外,對于一些無法用明確條件標明的服務(例如遇到系統問題時,對于系統找到根本問題的時間、采取措施排錯的時間等),采取的是按年度或季度評估的方式,來保證服務管理水平不斷提高和改進。
(3)快速的存儲資源分配 以存儲分配為例,需要存儲管理工具能夠提供從應用到磁盤陣列底部的全面管理。統一的存儲管理工具,可以輕松實現存儲卷的創建、LUN同SAN路徑上各元素點的WWN的綁定(主機安全組的創建)和交換機相關的Zone的設置和操作等。過去被認為復雜和煩瑣的工作現在變得十分容易,且時間和進度方面變得更加可控。
4.云存儲平臺統一數據保護
在實現了云存儲虛擬化整合后,數據量更大,數據風險也開始集中。面對集中的風險,最好的規避方式就是建立相應的容災系統,確保在災難發生時,各個應用系統能夠繼續為業務提供支撐,確保昆明卷煙廠業務的持續開展。
對于昆明卷煙廠這種大型企業,目前80%用戶都是采用基于磁盤陣列的硬件數據復制技術,相比其他基于軟件、SAN的復制技術,陣列控制器的復制技術具有實施簡單、無主機資源占用、管理方便等優點。是目前主流的企業級容災方案。
但是傳統數據中心如果要實現基于硬件的數據容災解決方案幾乎是不可能完成的任務,因為數據中心中存在多個廠商、多個型號的磁盤陣列,實現容災必須遠端具備與生產端相同型號的陣列實現數據接收。基礎架構已有的復雜度以及大量的鏈路占用讓企業用戶只能選擇部分最核心系統實現1對1的數據級容災,這種方式不僅提供的保護范圍不夠,而且成本也較高。
采用存儲陣列虛擬化之后,企業客戶的異構容災有了全新的選擇,虛擬化的存儲資源池可以實現異構陣列之間的硬件級容災解決方案,生產端和容災各通過一臺存儲陣列組成的存儲池之間實現災難復制,底層的物理陣列完全無關,實現了任意到任意統一容災,以及一套軟件、一套策略的容災運維界面。
存儲陣列提供的豐富的容災解決方案選項包括同步機制、基于“拉”的異步機制、3DC(主中心-同城同步-異地異步)的閉環容災架構,能夠幫助客戶實現最高級別的數據高可用。
如何向云時代演進
從以數據為核心和云的實現途徑,云分為基礎架構云、內容云、信息云。它們分別標識著企業IT建設的不同階段。基礎架構云的建設將為企業IT提供一個統一的虛擬化平臺。無論內容云、信息云的數據最終將存取于統一的虛擬化平臺。
基礎架構云是第一步,從基礎架構云到內容云,再到信息云,逐次演進,幫助企業解決不同的問題,助力企業的發展。最終的信息云時代,IT部門將不僅僅只限于降低運營成本,提高運營效率,快速適應業務發展等傳統IT領域的目標實現,它可利用業務分析軟件與硬件的結合,通過發掘和分析數據,建立企業自身的跨平臺數據分析模型,可為企業的業務發展找到新的方向,提供創新能力。借助信息云,IT部門有能力從通常企業定義的“成本中心”轉變為“利潤中心”。