郭 鋰,蒙慶全,葉惠文
(華南師范大學 教育信息技術中心,廣東 廣州510631)
在社會信息化日益深入,知識增長迅速的今天,各種網絡教學平臺和數字化教學資源在高校教學活動中的參與程度越來越高,各高校對教學資源建設的投入也越來越大。學校里的數據資源就相當于商業社會中的銀行資金,一旦數據資源管理系統出現故障或學習資源被破壞,師生將無法進行正常的教學和學習。隨著教育信息化程度的不斷推進,高校對于數據支撐系統的穩定性和可靠性的要求隨之提高。同時,在經歷了信息化建設的10多年過程后,由于存儲技術的進步、資金預算有限等眾多因素,各高校在數據存儲管理方面也普遍遭遇了一些問題和困惑,如:
目前高校絕大多數的應用服務器采用直連式存儲,每增加一臺服務器就需要增加相應的存儲,導致了存儲分布散、擴容難、利用率不高、異構化嚴重、不易管理等問題。
在不同的時期,各校都購置了各種各樣的存儲設備,其中多數設備是依賴當時硬件系統和應用系統理念來配置的,隨著時間推移應用系統升級,存儲設備的性能和容量不再滿足要求,存儲設備的動態擴展和兼容問題以及提高舊硬件設備的再利用率的問題也隨之出現。
隨著各高校教學資源數據量的與日俱增,由于人為誤操作、硬件故障、系統錯誤、不可抗災難等因素引發的數據損壞丟失問題也給管理人員愈加帶來困擾,災難備份與數據保護成為管理工作面臨的困難之一。
面對這些各高校普遍存在的代表性問題,華南師范大學在分析高校數據存儲管理新需求的基礎上,結合虛擬存儲和CDP等新技術,構建了一套存儲虛擬化應用方案,實現了對存儲資源進行統一管理和按需分配,提高了資源利用率和系統穩定性,降低了系統的投入和維護的成本。
存儲虛擬化這個名詞正越來越受到大家的關注,其相關技術作為一種適應當前社會數據爆炸性增長速度并緩解企業數據管理壓力的高端解決方案,已經為許多大型公司企業所普遍采用。隨著技術和產品的成熟發展,尤其是產品性價比的不斷提升,存儲虛擬化技術在教育行業中的應用也變得不再遙不可及。
虛擬存儲的概念可以理解為:通過一定的技術方法將所有存儲設備集中在一個存儲池(Storage Pool)中進行統一管理,并可根據服務器的需要分配存儲空間,對服務器而言就好像一個超大容量的虛擬磁盤。這種可以將多種不同的存儲物理媒介和存儲子系統整合起來,為使用者提供大容量、高數據傳輸性能的存儲系統,就稱之為虛擬存儲。[1]當前虛擬存儲的實現方式主要分為以下三種。
(1)基于服務器端
此種方式主要是在服務器平臺上安裝管理軟件,通過服務器端將鏡像映射到外圍存儲設備上,除了分配數據外,對外圍存儲設備沒有任何控制。由于控制軟件是運行在主機上,占用主機的處理時間,服務器端常常產生性能瓶頸問題。[2]
(2)基于存儲子系統端
此種方式中實施虛擬的位置在于存儲設備本身。在存儲子系統端的虛擬存儲設備主要通過大規模的RAID子系統和多個I/O通道連接到服務器上,智能控制器提供LUN訪問控制、緩存和其他如數據復制等的管理功能,此技術多被傳統儲存設備廠商采用。
(3)基于網絡設備端
此種方式是通過網絡設備端實施虛擬存儲,將邏輯鏡像映射到外圍存儲設備,除了分配數據外,對外圍存儲設備沒有任何控制。其優勢在于,其實施介于服務器和存儲設備兩個環境之間,可能是最“開放”的虛擬實施環境,最有可能支持任何的服務器、操作系統、應用和存儲設備。
華南師范大學虛擬存儲解決方案中采用上述第三種方式(基于網絡設備端的虛擬存儲),主要考慮到其便于支持眾多不同類型的服務器、操作系統、應用和存儲設備,擴展性和兼容性較強,且價格成本相對較低。存儲虛擬化軟件在設備上創建一個邏輯空間,在物理磁盤空間和邏輯磁盤空間之間建立映射關系的方式來管理源數據,存儲硬件的增減、調換、分拆、合并對服務器層完全透明。采用這種開發式存儲架構優勢在于:支持常規的標準存儲協議,實現強兼容,同時可提供二次開發API接口列表,有利于實現與教學輔助平臺的無縫鏈接,以最高的效率、最低的成本來滿足各類不同應用在性能和容量等方面的需求。
CDP(Continuous Data Protection,CDP)連續數據保護是當前數據備份領域內的一項新技術,它能夠持續實時地跟蹤捕獲數據變化,并記錄到專用的存儲設備或通過網絡發送到專用服務器上;在故障發生時,能夠將被保護的數據狀態恢復到任意時間點。[3]數據保護系統可以基于塊、文件或應用實現,可以為恢復對象提供足夠細的恢復粒度,將容災指標數據恢復點目標(Recovery Point Objective,RPO)和恢復時間目標 (Recovery Time Objective,RTO)提高到一個新的臺階[4]。
華南師范大學作為教育信息化建設起步較早的“211”師范類教學科研型大學,學科涉及門類眾多,多年來陸續建設有大量的精品課程、視頻資源、學習平臺、各類應用和管理系統,其數據存儲管理的需求在國內高校中具備一定的代表性,可歸納總結如下。
(1)當增加一個應用模塊時,通過系統能自動或手動虛擬一個與應用的虛擬服務器對應的虛擬磁盤。當減少一個應用模塊時,系統能自動或手動刪去相應的所虛擬的磁盤。
(2)實現將各種的存儲器陣列集成一個虛擬存儲器池,在物理上視為一個磁盤。根據應用模塊隨時劃出一個存儲空間與應用虛擬服務器對應,完成數據的存儲管理。
(3)實現存儲增刪的動態管理,即,當應用發展的需要發現存儲陣列中容量不足時,可隨之增加虛擬磁盤容量。
(4)具有對多種不同廠家和型號的存儲陣列的管理功能。
(5)支持應用模塊的各種數據需求(數據類型、容量、運行系統等),能夠自動或手動生成多個虛擬存儲空間的鏈接表,供用戶選擇合適的對應數據存儲服務。
(6)能夠建立各種存儲陣列的參數與信息詞典,清晰描述出各個存儲器的基本參數。
(7)能夠實現存儲空間預警功能。
為解決上述需求,經過多次研究和討論,通過各種測試和實驗,華南師范大學構建了一套存儲虛擬化應用解決方案,本方案的目的是實現資源的有效利用,通過將新舊資源的重新整合,實現對海量教學資源及眾多的應用系統進行有效的支撐,并且根據應用系統的需求動態分配存儲資源。本方案中虛擬存儲支撐平臺的結構如圖1所示。

圖1 虛擬存儲支撐平臺架構示意
本方案主要采用信核數據三種 “存儲引擎、SAN引擎、虛擬化引擎”的技術實現。信核數據設備采用OSN(Open Storage Network)開放式存儲平臺技術,通過標準的FC/IP/SAS/Infiniband等協議管理存儲設備,從而獲取存儲中的卷組信息。
(1)實現異構存儲虛擬化
1)構造虛擬系統平臺,支持多品牌存儲設備整合
本方案中采用的OSN(Open Storage Network)開放式存儲平臺技術能夠構建網絡存儲虛擬化平臺、統一管理異構設備和各種數據、整合不同類型的存儲資源,如ATDX、IBM、Dell等公司的存儲設備,其異構結構如圖2所示。

圖2 多品牌整合結構
2)虛擬系統對多品牌組成的存儲池管理方法
虛擬存儲管理解決方案將應用服務器與后端存儲進行透明的分離,通過集成 CDP、SnapShot、DR、HA 等多項增值保護功能,建立完整的數據保護體系,以經濟高效的方式將數據損失風險降至最低,保證在發生任意單點故障的情況下,業務能夠保持7×24小時的連續運行。
(2)實現存儲虛擬化與前端主機虛擬化的融合
前端主機采用了Red Hat KVM主機虛擬化軟件,每個虛擬機的文件系統都創建在虛擬化存儲系統上。服務器平臺上運行Red Hat GFS高性能的群集文件系統,允許多個物理服務器安裝同時訪問同一虛擬機存儲,實現安裝數據庫文件、系統數據等。這樣建立起來的系統,實現了服務器和存儲系統的無縫融合。
(3)數據遷移
在不改變原有數據的前提下,將數據從現有的存儲平滑遷移至其他存儲陣列上,對前端的業務等應用沒有影響。
(4)虛擬存儲的動態負載均衡
本方案中,在網絡層通過Block塊的技術去實現數據的同步寫入,不依賴主機和存儲系統,實現靈活的架構配置和管理。可在不影響現有應用的情況下,透明實現存儲集群,實現了以下幾點:
1)支持FC SAN+IP SAN綜合網絡存儲架構,實現統一存儲和應用混合使用。
2)支持 Standard、MPIO 和 Cluster,支持 Active/Active和Active/StandBy模式。
3)實現基于FC和IP的數據同步,對業務網絡不造成負擔壓力。
4)提供Cache能力,加速提升了存儲IO能力。
5)實現存儲故障自動切換和存儲修復自動切換,可提供99.99%的可用性,支持業務持續應用。
6)提供現有存儲自動遷移服務,最大限度地減少業務宕機時間。
(5)CDP在線系統級實時保護和恢復系統
本方案中的CDP模塊利用數據鏡像和數據復制(同步或異步)策略,實現將待備服務器的待備數據納入CDP平臺的保護體系,以確保數據發生錯誤時,數據恢復到最新的時間點。同時,采用配合數據復制卷的時間點快照技術(快照流),通過時間指針的方式,按增量快照的方式記錄下數據復制卷的變化,每一個快照對應一個時間點,記住了數據多個時刻的歷史變化過程,產生多個基于時間點數據影像 (自動情況下精確到每十分鐘,手動情況下精確到秒級)。這些數據影像不僅時間點細致精確,而且通過快照的回滾操作還可以直接使用,用戶經過簡單的設置就可以對快照數據進行操作,解決誤刪除、誤操作、病毒破壞等造成的數據丟失。
華南師范大學的存儲虛擬化應用方案,經過一年多的論證、建設和測試,實現了高穩定性、易維護性、高效低成本的建設目標。方案在利用現有的主機和存儲系統等硬件環境下,實現了存儲數據整合;有效的利用了閑置的、不同接口的存儲設備;提高了存儲的利用率;同時也優化了原存儲的性能。系統中配置的CDP在線保護模塊確保了整合后數據的安全性和教學平臺的連續性,避免了各種不可測因素造成的數據丟失,實現數分鐘立即恢復教學應用的保障效果。
目前,在新建成的虛擬存儲系統支持下運行了如下7個應用系統:“課程中心”網絡資源學習平臺、移動學習平臺、精品課程點播平臺、教育信息技術中心網站、機房管理中心、直播系統平臺、教學主樓教學觀摩系統目錄服務器,所有系統應用存儲合計占用20T空間,運行穩定良好,具體列表1所示。[5]
系統經過一年的反復實驗,證實其安全、易操作,能夠較好地緩解學校目前數據存儲和管理的壓力,并可以靈活適應將來的擴展需求。與舊有存儲結構相比,其優勢主要體現在以下幾點:
(1)可以集中管理分散的不同品牌的存儲設備,可以提高存儲空間的利用率。
(2)可以通過一個統一的存儲管理界面平臺或界面,來管理現有的存儲設備。

表1 虛擬存儲系統支持的應用平臺
(3)可以隨需擴展不同的異構存儲品牌,同時通過TVM功能遷移將原來存儲上的數據,通過底層技術遷移到新的存儲上。
(4)可以實現在異構的不同存儲系統之間進行數據容災或復制。
(5)可以按不同的存儲性能分層存儲,例如根據磁盤品種(SSD/FC/SAS/SATA)進行分類。[l4]
(6)可以實現存儲容量的靈活分配,可以超出物理磁盤空間,隨需擴容。
(7)使用OSN PA功能后,可以提高低端存儲系統的性能。
在高校教學支撐平臺中采用存儲虛擬等相關技術,是解決當前教育數據海量增長的一條新思路。華南師范大學在大數據量、多應用、多品牌的存儲系統環境下探索出的基于網絡設備端的存儲虛擬化應用方案,實現了對舊有資源的高效整合,解決了數據管理工作中的問題,為高校及教育科研單位的存儲設備的有效使用和管理找到了一條新路徑,我們將在后續的工作中繼續總結經驗,向讀者提供更具有借鑒價值的實踐指導。
[1]任永堅.存儲管理和數據保護.[EB/OL].http://www.infocore.cn/xzzx.aspx?ref=3.2010.6[l5]
[2]付云生.王開云.虛擬存儲技術的研究與比較[J].計算機科學,2011(10):202-203,238.
[3]李紅艷.塊級連續數據保護系統元數據管理方法[J].計算機應用,2012,32(8):2141-2145,2149.
[4]李珺晟.淺談CDP連續數據保護技術及其應用[J].數字技術與應用,2011(6):191.
[5]張效嚴.郭翠英.高校信息化多應用虛擬支撐平臺的應用研究[J].中國教育信息化,2012(2):93-96.