陰江烽
(廣東省委黨校圖書館,廣東 廣州 510053)
RAID誕生于1987年,其定義要追溯到1988年發表的A Case forRedundant Array of Inexpensive Disks(RAID)中,是由三位加州大學伯克利分校的研究人員提出的這種陣列的發展方向。它的作用是將小的廉價磁盤組合起來建立一個大型、快速和安全穩定的數據儲存媒介,代替大的昂貴磁盤,以此降低數據存儲的費用。它在物理上由多個磁盤組成,但在邏輯上就只有一個邏輯盤,通過把數據分成多個數據塊(Block)在多個磁盤上并行寫入/讀出,以提高訪問磁盤的速度。早期RAID一般是在SCSI磁盤驅動器上實現的,SCSI適配器保證每個SCSI通道隨時都是暢通的,在同一時刻每個SCSI磁盤驅動器都能自由地向主機傳遞數據,不會出現像IDE磁盤驅動器爭用設備通道的現象。
RAID是一個服務器大容量硬盤,其可用性強,延展性好,作業效率高,在大型主機上經??梢?,尤其在信息存取量大的主機上。RAID的主要特點是:(1)性能好。這是最重要的一個方面。開發RAID就是為了提高性能,從理論上說,僅RAID0就可以獲得使用單硬盤雙倍的速度,如果使用者想要增加信息存儲量及存取速度,那么RAID是極好的選擇。(2)價格低。如前所述,RAID開發的初衷就是利用“便宜”的小硬盤組合起來代替大的昂貴硬盤,自然在價格上就有一定的優勢。(3)穩定性好。特別是硬RAID的穩定性要比軟RAID更高一些。(4)操作簡便。RAID操作簡便,比較容易掌握。(5)兼容性。硬RAID的兼容性很好,甚至可以兼容DOS,而軟RAID只有Windows2000/XP才能支持。(6)安全性。RAID具有很好的安全性,這也是信息存儲最需要的。
RAID在信息存儲方式上,因不同的需求有不同的規格,經過不斷的發展,現在已擁有了從RAID 0到RAID 7共8種基本RAID級別,還有一些基本RAID級別的組合形式,如RAID 0+1(即RAID 0與RAID 1的組合),RAID 50(RAID 0與 RAID 5的組合)等。不同的RAID級別代表著不同的存儲性能、數據安全性和存儲成本,其比較如下圖:

RAID 0是一種串行架構,其全名叫做數據分塊儲存陣列(Stripping),是最常用的,也是所有規格中惟一不具容錯性,但效率卻是最高的。它將一個邏輯盤的數據分割成數個區塊分布在多個物理磁盤上,由于RAID 0使用了一種名為“數據串行”的機制,數據是用連續“串行”的形式,以規定的大小儲存在實體硬盤上,這表示大于實際串行大小的文件將會被分散儲存在硬盤陣列中,因此單一文件中的不同串行可以平行處理,在這種情況下,其陣列或“串行集合”的數據傳輸率即為陣列中最低速硬盤的數據傳輸率與該陣列硬盤數之乘積。若使用相同的硬盤,則數據傳輸率帶寬恰好是單個硬盤傳輸率的倍數,為了不浪費空間,一般在RAID 0的組建時,均選用容量相同的硬盤,若條件允許,最好選用型號也相同的硬盤。此規格最需提醒用戶的是,如果陣列中任何一塊硬盤損壞,整個系統的信息將全部損失。且構建好陣列后,陣列中的硬盤將無法單獨使用。
RAID 1是一種鏡像架構,又稱為Mirror或Mirroring(鏡像),因為它就是將一份信息同時儲存于兩個硬盤中。簡單地說,即是一個兩塊硬盤所構成的RAID 1陣列,其容量僅等于一塊硬盤的容量,因為另一塊只是當作數據“鏡像”。若其中一個硬盤出現問題,系統仍可正常運作,它具有備份的功能。顯然這是最可靠的一種陣列,不過也是較貴的一種RAID解決方案。RAID 1的寫入速度通常較慢,是由于數據要分別寫入兩塊硬盤中并作比較導致的,讀取速度較單一硬盤來得快,是因為數據會從兩塊硬盤中較快的一塊中讀取。
RAID 2是RAID 0的改良版,以漢明碼(Hamming Code)方式將信息編碼后分割為獨立位元,并將信息分別寫入硬盤中,但是因為加入了錯誤修正碼(ECC,Error Correction Code),所以儲存的信息會比原來的大。
RAID 3也被稱為帶有專用奇偶位的條帶,每個條帶片上都有相當于一“塊”那么大的空間來有效存儲冗余信息,即奇偶位。奇偶位是數據編碼信息,如果某個磁盤發生故障,可以用來恢復數據。RAID 3需要經過編碼將信息位元分割,并分別存于硬盤中,而將同位元檢查單獨存于一個硬盤中。但由于信息的位元分散在不同的硬盤上,因此就算讀取一小段信息都有可能用到所有的硬盤,故這種規格比較適合在讀取大量信息時使用,尤其有益于訪問較長的連續記錄。RAID 3需要同步主軸驅動器來預防較短的記錄導致的性能下降。
RAID 4與RAID 3不同的是,它在分割時是以區塊為單位分別存放于硬盤中,但每份信息存取都必須從同位元檢查的那個硬盤中取出,并于相對應的同位信息核對,由于使用頻繁,所以該硬盤損耗率可能會提高。
RAID 5也被叫做帶分布式奇偶位的條帶,每個條帶片上都有相當于一個“塊”那么大的地方用來存放奇偶位。它改善了RAID 4同位元檢查使用頻繁的問題,將原始信息與同位元檢查重新組合后,以位元分割的方式儲存于各硬盤中,所以每個硬盤都有同位信息,以降低存取過度的問題。
這是一種Dual Level RAID,也有人稱之為RAID Level 10,它就像是由RAID 0和RAID 1組合而成,叫做“零加一”,也稱為RAID 10,方法就是鏡像一個串行集和將鏡像做串行格式化。即兩組按一定的分割區域,連接不同的兩塊大容量的陣列硬盤,它們互為“鏡像”。因為使用了串行結構,所以讀寫性能極佳,系統也十分可靠。在每次寫入數據時,磁盤陣列控制器會將數據同時寫入兩組 “大容量陣列硬盤組”。同RAID 1一樣,雖然其硬盤使用率只有50%,但它卻是最高效率的劃分方式。其特點使其特別適用于既有大量數據需要存取,同時又對數據安全性要求嚴格的領域。
RAID 50也被稱為分布奇偶位陣列條帶,RAID 50其實就是RAID 0與RAID 5的組合。它像RAID 0一樣,跨磁盤存取數據;又像RAID 5一樣,使用分布式奇偶位,RAID 50提供數據可靠性,優秀的整體性能,并支持更大的卷尺寸,最適合需要高可靠性存儲、高讀取速度、高數據傳輸性能的應用。
信息存儲技術目前已經得到了IT業界和各應用領域專業人士的重視,同時也為數字圖書館提供了解決海量信息存儲難的技術和信息存取與檢索的絕妙空間。
數字圖書館從電子圖書館之父——美國學者Vannevar Bush于1945年在 《大西洋月刊》中提出“Memex”一詞至今,已經歷了半個多世紀的歷程。隨著信息技術的發展和完善。數字圖書館的網絡化、互聯化、世界化的程度將進一步加深,并將逐步形成數字圖書館群,實現真正意義上的資源共享。目前,各國正在致力于創建全球數字圖書館 (Global Digital Library,GDL)模型。GDL 是未來圖書館的發展趨勢,一旦GDL建設成功,全球用戶將能夠以最低的成本、極快的速度存取分布在全球的數字化信息資源庫的信息。
3.1.1 21世紀現代化圖書館的特征。(1)辦館模式、存在形態的一體化、網絡化、國際化。(2)館藏資源的電子化、虛擬化、特色化。(3)業務工作的標準化、規范化、兼容化。(4)用戶需求的社會化、多元化、集成化。(5)用戶利用圖書館的自助化、遠程化、即時化。(6)服務手段的自動化、智能化、便捷化。(7)服務內容的深入化、精品化、專業化。(8)業務組織結構的學科化、平面化、矩陣化。
3.1.2未來圖書館的存在形式。(1)物理形態——現實空間和虛擬空間的統一。(2)載體形態——紙質印刷型文獻和電子型文獻的統一。(3)信息記錄形態——數字化與非數字化的統一。(4)資源配置形態——協作收藏與資源共享的統一。(5)功能形態——整理和創新的統一。
眾所周知,在傳統的圖書館中,信息和知識的傳播完全依賴于其物質載體,一本書中的資源不能同時被多個讀者共享,另外讀者還必須到圖書館借閱書籍,才能獲得其中的信息資源。而現代化管理的圖書館則運用現代信息技術,徹底改變了這種現象。現代化的網上圖書館系統軟件是其重要組成部分,也是不可或缺的,一般該系統均采用了先進數據壓縮解壓縮技術、虛擬光驅和光盤管理技術。系統管理員可通過該系統軟件將現有的光盤軟件壓縮并拷貝到服務器的磁盤陣列上,形成資源庫,建立網上圖書館。在局域網內的任意一臺工作機上的用戶可以同時或不同時地調用資源庫中相同或不同的信息資源,實現了真正意義上的資源共享。而不用去圖書館等待借閱,更不會遭遇“此書已借出”的煩惱。
網上圖書館主要包括建立系統和點播系統兩個功能,建立系統是指系統管理員將光盤壓縮并拷貝到服務器所連接的磁盤陣列中,并對這些資料實施分類管理,以便于系統管理員和讀者查詢瀏覽;點播系統是指網上圖書館建立后,在網絡中的任意一臺計算機上,讀者可以查詢已建立的分類資料庫,并點播出自己所需的資料,而不必擔心資料是否被其他讀者所使用。網上圖書館作為校園網的一個重要組成部分,上網后既可供校園網所有站點點播查詢館藏資源,又可作為一個獨立的子系統獨立存在。
RAID不失為目前中小型圖書館信息存儲技術的最佳選擇。但隨著寬帶網絡技術、INTERNET網絡技術的發展,IT領域的又一次浪潮—網絡數據存儲將進入一個新的發展空間。IT用戶已經深刻地認識到:不管網絡功能發展到什么程度,人們最終需要的是網絡上的數據,數據是網絡的核心,簡便、快速、安全地傳輸可用數據才是網絡最根本的用途。因此,在未來可以預見,各用戶的網絡數據將以驚人的速度保持增長,越來越多的用戶要求從原來的以“服務器中心”模式,轉變以“數據中心”為模式的智能的獨立地位的網絡存儲解決方案。目前流行的存儲結構主要有以下三種。
3.3.1直接網絡存儲系統NAS(Network Attached Storage),實施以“數據中心”為模式,它集成IP技術及RAID技術于一身,是通過網絡接口和以太網絡直接相連的存儲服務器系統,各種文件服務器及網絡工作站都可透過網絡直接存取NAS上的數據,由于它不需要通過文件服務器,明顯縮短了響應時間,充分發揮網絡的帶寬。NAS可在幾分鐘內增加到網絡,可提供高可用性的磁盤陣列存儲系統,還能提高文件服務速度,減輕網絡主機的負擔,降低購買及維護成本,以及在不間斷網絡運行環境下增加或設置存儲系統,是最符合我國國情的存儲解決方案。
3.3.2 存儲區域網SAN(Storage Area Network),是以光纖技術為核心組成的、多功能的、以“數據中心”為服務模式的區域網絡存儲備份系統,它的組成包括存儲備份管理軟件系統、光纖陣列、磁帶庫或光盤庫、光纖交換機等設備,目前它在存儲領域里是容量最大、速度最快、擴充性最強、安全性最高、功能最完善的存儲備份系統,但最大的缺點是管理較復雜及價格太昂貴而讓大多數客戶望而卻步。
3.3.3 直接附加存儲DAS(Direct Attached Storage),被定義為直接連接在各種服務器或客戶端擴展接口下的具備RAID技術的數據存儲設備。它依賴于服務器,其本身是硬件的堆疊,不帶有任何存儲操作技術。屬于以“服務器中心”模式。
[1] 林林.深入淺出玩 RIAD[J].電腦愛好者,2001,(2).
[2] 陳東平.電腦配置雙劍合壁之雙硬盤和RIAD篇[J].電腦愛好者,2001,(7).
[3] 鄒蓬.走近 RAID[N].電腦報,2002-1-28(F1).
[4] 胡舟.軟/硬 RAID 的比較[N].電腦報,2002-6-3(C16).