,, ,
隨著圖書館業務系統對存儲容量需求的增加,存儲系統的規模變得越來越龐大,管理越來越復雜。圖書館通常會根據存儲技術的發展選用多個廠商的存儲設備,甚至采用不同的存儲架構。這些來自不同廠商的存儲系統會給圖書館帶來“存儲信息孤島”、管理成本高、資源利用率低以及難以擴展等困擾。利用存儲虛擬化技術,打破了實體存儲設備間的界限,是解決圖書館存儲管理中所面臨問題的有效方法[1]。
存儲虛擬化技術就是通過一定的手段將多個物理上獨立存在的存儲介質進行整合,形成一個邏輯上的虛擬存儲單元供主機訪問。所有的存儲資源在一個存儲池中得到統一管理,從服務器端看到的不是多個硬盤或多個存儲設備,而是一個分區或者卷,就好像是一個超大容量的硬盤[2]。因此,存儲虛擬化技術是一種將不同存儲設備整合再分配的虛擬化方式。
存儲虛擬化技術能夠有效克服物理存儲設備的局限性,屏蔽具體物理存儲設備的物理特性,將物理設備整合成一個邏輯存儲池來實現對具體物理存儲設備的管理和使用。通過存儲虛擬化,物理設備的自身優勢不但能夠被充分利用,而且物理設備本身不可避免的局限性得到有效克服。
通過存儲虛擬化技術,能夠實現大容量存儲系統簡單、有效的集中管理,用戶能夠以自主、自動的方式在磁盤上存儲數據和方便地劃分、擴展、縮小存儲空間。在虛擬化環境中,所有的存儲管理操作,例如建立和分配虛擬磁盤、擴充存儲空間、系統升級等都可以自動實現,存儲管理變得輕松簡單[3]。存儲虛擬化技術能夠有效地提高存儲資源的利用率,最大限度滿足用戶對存儲資源的空間需求。用戶不必再關心后端存儲系統的硬件容量、類型等物理特性,只需將注意力完全集中在存儲的空間管理上。
存儲虛擬化技術屏蔽了具體物理設備,將不同類型、不同特性的異構存儲資源整合成一個統一的存儲空間加以利用,從而實現了對存儲資源的充分利用和有效規劃[4]。存儲虛擬化技術通過整合不同類型的存儲設備,實現存儲資源集中管理使用,為存儲資源管理提供了更好的靈活性。存儲虛擬化技術不僅能夠簡化存儲管理的復雜度,提高存儲效率,還能夠有效降低存儲管理中的總擁有成本(Total Cost of Ownership,TCO),增加投資回報(Return On Investment,ROI)。
存儲虛擬化技術在存儲層上能夠實現負載均衡,將數據平均合理地分配到存儲池中具體的物理設備上,避免了因負載不均導致各磁盤和各存儲設備利用不均衡的問題。虛擬化技術通過不同存儲設備存儲區域的共享提高了存儲系統的訪問性能,有效解決了不同存儲間訪問的不均衡,實現了差異化存儲的合理利用。尤其是對于高數據量進行傳輸的服務應用,通過存儲虛擬化技術能提高數據傳輸的整體帶寬,即把每一次數據訪問所需的帶寬合理地分配到各個存儲模塊上,不再需要根據各個業務應用的壓力高低進行調節,從而提高了系統的整體訪問效率[5]。
存儲虛擬化技術把不同類型的異構存儲設備虛擬成一個高性能、大容量的虛擬存儲池,各類數據都存放在這個虛擬存儲池中,所有基于網絡的RAID分布式I/O、數據冗余、硬盤組、邏輯卷、動態的多個路徑、分層存儲、在線的高速備份等有關問題,都由虛擬存儲管理系統處理,實現了無縫的存儲和數據管理[6]。存儲虛擬化技術可以對單一數據在多個存儲介質上創建副本,避免了因存儲環境發生故障引起的數據損壞丟失等問題,防止因個別存儲介質的損壞對整個系統的影響,確保系統的高可用性。
存儲虛擬化技術能夠提供一些更高級的功能,逐步成為共享存儲管理的主流技術。例如存儲虛擬化技術能夠提供基于指針的快照和克隆技術,實現在虛擬環境下異構存儲設備邏輯卷的數據復制、鏡像以及數據交互。在虛擬設備級別實現的快照功能[7],不僅可以使數據在不同種類的平臺之間相互遷移,而且具有更快的備份速度等。
基于主機的虛擬化,也稱為基于系統卷管理器的虛擬化,其實現一般由操作系統下的邏輯卷管理軟件為物理存儲映射到邏輯上的卷提供一個虛擬層。該方法需要在一個或多個主機上安裝代理或管理軟件,因此會占用主機資源,降低應用性能。而且基于主機的存儲虛擬化技術存在操作系統和應用的兼容性問題,不同操作系統的邏輯卷管理軟件也不相同,這使虛擬化移植性和可擴展性較差,難以應用在異構服務器環境上。但是,由于基于主機的存儲虛擬化技術不需要任何硬件支持,也不影響現有存儲系統的基本架構,因此基于主機的虛擬化方法最容易實現,其設備成本也最低[8]。
基于存儲設備的虛擬化,也稱為基于存儲控制器的虛擬化,其實現方式是在存儲設備內部的控制器上添加虛擬化功能。基于存儲設備的虛擬化方法依賴于提供相關功能的存儲模塊[9]。如果沒有第三方的虛擬化軟件,這種方法通常只能虛擬單一存儲供應商的特定系列產品,無法支持包含多廠商設備的存儲系統虛擬化,是一種不完全的存儲虛擬化解決方案。但是,基于存儲的虛擬化技術比較容易實現,并且它對用戶和管理人員都是透明的,因此更容易管理。
基于網絡的虛擬化是在主機和存儲之間的網絡設備上實現存儲虛擬化功能。
根據其數據通路和管理通路的耦合情況可分為帶內虛擬化技術和帶外虛擬化技術。所謂帶內即In Band,是指控制信令和數據走的是同一條線路。帶內虛擬化設備安裝在主機和存儲之間的數據通道中間,所有的控制信息和數據訪問都必須通過這個設備。這種虛擬化方式不會占用主機的資源,也不會影響現有的SAN架構,通常只需在SAN中加入存儲虛擬化控制單元,通過利用控制單元的大容量Cache提升系統性能。該方案同時具有很好的靈活性,是最常見的存儲虛擬化形式,也具有最廣泛的適用范圍。帶外即Out Band,是指控制信令和實際數據走的不是同一條線路,控制信令走單獨的通路。帶外存儲虛擬化設備位于主機和存儲之間的數據通道之外,通過其他的網絡連接方式與主機系統通信,因而在主機中需要安裝專門的客戶端軟件。帶外虛擬化技術擴展性比較好,但帶外存儲需要依靠代理主機和元數據控制器訪問存儲設備,不僅實施難度大,而且使存儲虛擬化更為復雜。
隨著業務的不斷發展,圖書館會在不同時期分批采購不同的存儲設備。每套存儲設備容量、性能都有很大差別,且不易于管理,圖書館正在存儲基礎架構中尋求一種全新的變革方式處理和大數據相關的日益增長的數據容量[10]。通過存儲虛擬化技術能夠將多個異構存儲資源整合成一個大的存儲池,為圖書館提供統一的數據存儲,對存儲資源進行集中管理和分配,消除不同品牌存儲間的隔閡和限制,最大限度地發揮各存儲設備的性能。
根據存儲虛擬化技術的發展并結合圖書館應用的實際需求,采用目前主流的基于網絡層的帶內存儲虛擬化技術實現對圖書館異構磁盤陣列的整合,從而實現存儲資源共享,消除應用服務器與底層磁盤陣列之間的硬件依賴性,提高存儲系統利用率。通過采用存儲虛擬化技術,所有的信息存儲、信息管理及信息共享均集中存儲在統一的平臺之上,實現對圖書館所有信息資源的統一管理和分配。存儲資源整合系統架構如圖1所示。

圖1 存儲資源整合系統架構
如圖1所示,利用存儲虛擬化技術對圖書館的異構存儲系統進行整合,首先需要將原有的磁盤陣列及應用服務器接入到SAN網絡中,然后采用帶有存儲虛擬化功能的存儲虛擬化控制器實現對所有磁盤陣列的整合。
為了保證系統的可靠性,采用冗余SAN網絡構建。在SAN網絡中同時部署2臺存儲虛擬化控制器,實現硬件上的冗余,消除單點故障。將2臺存儲虛擬化控制器構成一個組,具有更高的可靠性。異構的磁盤陣列由存儲虛擬化控制器掩蓋物理差異,虛擬化成一個統一的存儲資源池,為應用服務器提供存儲服務。服務器不直接訪問存儲設備,而是通過存儲虛擬化層提供的虛擬存儲空間存取數據。存儲虛擬化層完成存儲虛擬化工作,為系統提供存儲虛擬化的功能,管理各存儲設備。
存儲虛擬化技術采用3層映射機制將存儲網絡上不同品牌的存儲設備進行整合,第一層映射把異構存儲資源的所有物理硬盤分成多個存儲塊池,第二層映射將所有存儲塊映射成邏輯磁盤,第三層映射使一個或多個邏輯磁盤映射成不同大小的虛擬卷,并將這些虛擬卷按一定的讀寫授權分配給存儲網絡上的各種應用服務器。存儲虛擬化工作原理如圖2所示。

圖2 存儲虛擬化工作原理
由圖2可以看出,存儲系統中的一個或多個存儲單元被映射為存儲虛擬化控制器內部的存儲單元,一個或多個存儲單元可以被虛擬化為一個存儲池(Disk Pool),所有的存儲池對SAN網絡中的存儲虛擬化控制器均可見。Disk Pool是一個存儲池,基于這個存儲池可以按需創建任意數量的虛擬存儲單元(VDisk),VDisk的容量可以超過存儲池的容量。存儲虛擬化控制器以VDisk為單位對服務器提供存儲單元映射(LUN-Mapping)服務,使服務器可以訪問被提供LUN- Mapping服務的VDisk。
4.3.1 廣泛的異構支持能力
存儲虛擬化技術是一種具備強大擴展能力、全面開放的虛擬化技術,具有磁盤陣列無關性、存儲協議無關性、操作系統無關性以及應用無關性。也就是說,采用存儲虛擬化技術可以搭配任何品牌的磁盤陣列,可以與光纖通道(FC)、SCSI、iSCSI、Infiniband等存儲協議輕松連接,徹底消除了存儲廠商的品牌限制。在采購存儲設備時不再受限于特定品牌,用戶可以根據需求自由選擇合適的存儲設備,消除規劃和構建存儲網絡時的兼容性障礙,讓資源分配更加靈活,進而降低總體成本。基于網絡層的存儲虛擬化技術消除了主機相關性,可以支持Windows、Linux以及UNIX等廣泛的操作系統,同時可以支持Oracle、DB2、SQL、Exchange、Notes、SAP、VMware等眾多的應用。
4.3.2 良好的擴展性
存儲虛擬化技術采用先進的虛擬技術為存儲資源的無縫擴展提供了可行性[11]。對不同廠家、型號規格的磁盤陣列高度兼容,使用戶從存儲的技術壁壘中得以解放。隨著業務的增長,可往虛擬存儲池中動態地添加新型的存儲設備。靈活的擴展性為未來業務應用部署存儲打下堅實的基礎。
4.3.3 自動精簡配置技術
為了避免服務器運營時發生存儲空間不足,導致必須停機重新配置磁盤空間的困擾,通常會配置超過應用程序所需要的磁盤空間而導致存儲資源的極大浪費。存儲虛擬化基于虛擬卷的自動精簡配置技術(Thin Provisioning),可以用較大的虛擬磁盤對應較少的物理存儲空間,按照實際需求自動分配物理存儲空間,因此服務器不需要真正配置大量的物理存儲資源。這樣不僅大幅降低新設備的采購頻率及存儲成本,更能有效減少機房的空間占用與電力消耗。
4.3.4 異構存儲數據遷移
當磁盤陣列設備老舊或是根據業務需要進行調整時,都需要將數據遷移到新的設備上[12]。不同品牌的存儲設備之間遷移數據,不僅需要花費大量的時間,而且很難保證數據的正確性和安全性。存儲虛擬化技術支持存儲系統之間的同步鏡像,可以大幅簡化數據遷移的流程,而且在遷移數據過程中,應用服務器完全不需要停機,也不會影響數據一致性。
4.3.5 存儲性能加速技術
通過存儲虛擬化技術在指定的高性能存儲(例如SSD硬盤組)上開辟一個區域,用于為指定的虛擬磁盤提供緩存,存放常用數據。當某個數據區塊被重復讀寫幾次后,就會被當作常用數據自動移入該區域,此時讀寫這部分數據時的性能是高性能存儲的等級。這就是HotZone——將經常需要訪問的“熱”數據存放在高性能存儲中。利用HotZone只需配置少量的高性能(例如SSD硬盤)磁盤,就可以讓整個后端存儲看起來都像是高性能存儲。
4.3.6 存儲資源服務質量管理
在異構的存儲環境中,來自不同廠商的各種存儲設備不僅在功能上存在差別,而且其容量大小、性能等方面也各有所異。同時,不同的業務應用服務器具有不同的存儲服務需求。通過存儲虛擬化技術將不同的存儲及應用歸類,根據性能要求把不同的存儲設備被歸類到不同服務級別的存儲資源池中,把高性能的存儲資源分配給關鍵的應用,低端的存儲資源分配給非關鍵應用。
圖書館利用存儲虛擬化技術將存儲設備進行資源池化,不僅能夠實現存儲資源的整合,提高存儲設備的利用率,簡化系統的管理,而且能夠更方便地按需擴容和分級存儲,提供透明的高可用性和可擴展性,實現了對圖書館存儲資源的有效管理和利用。
作為一種有效的存儲管理手段,存儲虛擬化技術將成為未來圖書館存儲系統發展的一種趨勢。其在開放性、擴展性、可管理性等方面所體現出的優勢將在圖書館數據中心存儲管理及應用中充分顯現出來。圖書館通過利用存儲虛擬化技術,海量信息資源將能夠被高效存儲和利用,進一步提升圖書館信息服務的質量和水平。