范玉林
摘 要作為一種經過多年時間檢驗的的磁盤系統數據保護技術標準,RAID技術自出現以來一直作為存儲系統的基礎性技術,近些年來,隨著整個社會信息化水平不斷發展,數據趨勢呈爆發式增長,數據已經取代計算成為信息系統的中心。這促使人們對數據越來重視。隨著數據中心不斷追求海量容量、性能、安全、可用、擴展、管理等等,傳統RAID逐漸暴露出越來越多的問題。
【關鍵詞】醫療行業 數據儲存 RAID技術
1 前言
根據近年來醫院存儲系統的硬件故障問題統計發現,存儲陣列中90%的硬件故障是磁盤故障,只有12%是完物理故障。現業界常用的RAID5組,在磁盤發生邏輯故障后,會立即將該磁盤踢出RAID組,雖然可以通過校驗來進行數據恢復,但是在RAID重建期間,控制器的數據的處理能力嚴重下降,而且醫院需要為100%的故障磁盤買單,還需要承擔RIAD重建時同一RAID組中其他磁盤邏輯故障所造成的數據丟失風險。
2 CRAID技術的應用
CRAID技術的出現,基于Cell數據塊的管理模式,解決了這一困擾。
Cell,稱之為“細胞”,是指數據單元,是陣列資源管理的基本單位。引入Cell的基本單位后,在RAID具體的實現上,首先用磁盤創建RAID組,然后把RAID組的有效的可用空間根據指定大小(默認1GB,可以調節)劃分為多個Cell,在創建LUN時,系統自動使用空閑Cell,破除了LUN到RAID,RAID到Disk之間的綁定關系,使RAID組的最小處理單元由原來的磁盤改變為更加靈活的Cell,完全實現了的存儲的虛擬化架構。按照Cell健康狀態,突破了傳統RAID組容忍故障磁盤數目的限制。例如,傳統的RAID組允許1塊磁盤故障,第2塊磁盤故障時,RAID組失效,數據不能使用。在CRAID組中,只要磁盤邏輯故障的區域不在同一個Cell內,CRAID中的數據仍然可以實現訪問,即CRAID組內可實現多個磁盤發生邏輯錯誤(非同一Cell中),大大提高了存儲陣列對磁盤的冗余性以及業務的連續性。
CRAID采用磁盤層管理和資源層管理,兩層虛擬化的模式管理,每塊磁盤空間被劃分成小的Cell管理,在這些Cell的基礎上來創建RAID組,使得數據平均分布到存儲陣列的每一塊磁盤上,同時,以為Cell單元來進行管理,有效提升了管理的效率。
每個磁盤被切分成固定大小的數據塊(Chunk,也叫CK),每個Chunk為如:64MB等大小。存儲系統將不同磁盤的Chunk(CK)按照RAID算法組成Chunk Group(DCG),如圖1所示。
DCG被劃分為固定大小的存儲單元Cell,每個Cell的大小為如:1GB等,Cell是構成LUN的基本單位。一個存儲池基于指定的一個磁盤域創建,可以從該磁盤域上動態的分配Chunk(CK)資源,并按照每個存儲層的“RAID策略”組成DCG向應用提供具有RAID保護的存儲資源。CRAID 技術原理圖如圖2。
CRAID的實現框架如圖3所示。
同時,針對同一個Cell中多塊磁盤發生故障的情況,采用基于物理隔離的方式進行處理,將磁盤錯誤隔離在當前Cell,其他Cell繼續使用,最小限度的降低錯誤的影響范圍。
而且,基于Cell的管理模式,在后續重建數據時也能極大的提升重建的效率,區別于傳統RAID組,直接將磁盤踢出RAID組后進行重建,CRAID的快速重建只需要重建錯誤磁盤上有錯誤的Cell數據,沒有錯誤的Cell數據直接使用復制的方式將Cell數據復制到熱備盤,這種方式可以大大降低RAID組重建過程對RAID組計算性能的影響。
傳統RAID組重建時,大量的性能和時間消耗在調用所有磁盤進行異或校驗。快速重建只需將RAID組全部磁盤校驗方式轉換成了按Cell校驗+磁盤復制的方式,其校驗量只有傳統RIAD組重建全盤重建校驗量的幾百分一或千分之一,校驗時間大大減少,而磁盤復制可以利用磁盤本身的讀寫速度。以1TB的SATA磁盤為例,在15塊盤的RAID組中,傳統的全盤重建大約需要30小時時間,而快速重建最快6小時就可以重建完成。
CRAID還支持局部重建模式,適用于磁盤完好,但發生過人為誤插拔。這種模式可恢復5分鐘內磁盤被拔出過程中未寫入磁盤的數據,提高了RAID組可靠性。
3 結語
基于CRAID技術創建的RAID組和傳統RAID組相比較,繼承了傳統RAID組的優點,改良了傳統RAID組的不足,實現了磁盤資源的按需分配,極大的提供了磁盤利用率,性能的負載分攤,提高了磁盤的使用壽命;在數據安全方面,基于Cell塊的管理模式,安全可靠,提高了RAID組的安全想和容錯率,在后續數據恢復,數據重建等方面也優于傳統RAID組,減少了運維人員的工作量,也為醫院數據中心建設添加了一層保障。
作者單位
浙江省人民醫院信息中心 浙江省杭州市 310000