吳海旋 魚 冰 李 江 趙鵬翔
(國家知識產權局專利局專利審查協作河南中心,河南 鄭州 450000)
在社會發展之初已有人們使用骨骼、石頭和樹枝來記錄數據,但只有記錄者自己可看懂。隨著人們之間交流頻繁,文字語言便成了交流的工具,將自己所知的信息通過文字傳遞給他人,如今網絡的盛行和普及更使人們的生活發生了革命性的變化。而存儲的含義也從信息的記錄轉變為一種服務,可以根據應用環境的不同,采取合理、有效以及安全的方式將數據保存到若干物理介質上,并保證可被有效地訪問,它結合了物理介質和保證數據安全完整的存放方式,為用戶提供數據存放方案。數據的增長又使存儲系統從計算系統中分離并形成獨立的系統。
竹簡是中國古代使用記錄文字的工具,之后被紙張取代。20世紀中期出現了電子存儲裝置,它將直觀的存儲轉換為機器存儲,20世紀70年代中期穿孔卡和穿孔磁帶可用來輸入數據,磁帶作為數據存儲設備使用是從1951年開始的,這時使用磁帶機來傳輸字符,1932年磁鼓存儲器被創造,通常作為內存使用,容量大約10KB。
上述存儲介質目前已不常使用,現在經常使用的存儲介質主要有硬盤、軟盤、光盤、FLASH芯片、卡式存儲磁盤陣列以及大型網絡化磁盤陣列,存儲容量在逐步擴大,應用的環境也更加復雜。隨著通信網絡技術的發展與處理能力的提高,單機數據處理方式被網絡數據處理方式替代,下面將重點介紹網絡存儲的相關內容。
網絡技術的飛速發展促使存儲系統向基于網絡的存儲形式轉變,同時信息量正在以驚人的速度增長,這也使得直連式存儲不能滿足應用對信息的管理、使用以及存儲的需求。因此,存儲系統從計算系統中分離,并成為一個獨立的系統是互聯網信息時代的應用需求以及存儲技術發展的必然趨勢。網絡存儲已成為信息化產業化發展的新浪潮,代表了存儲發展的新方向。
NAS和SAN是兩個基本的網絡存儲系統形式,NAS基于IP網絡,通過標準文件訪問協議提供存儲服務,內部是定制并優化了的專用于服務器的軟件和硬件,只要具有自己的磁盤和文件系統,對外提供訪問其文件系統的接口就是一臺NAS;SAN是基于IP網絡和FC,它通過塊訪問協議并以塊設備的方式提供存儲服務。SAN實際上是一個網絡上的磁盤,NAS是一個網絡上的文件系統[1]。
存儲虛擬化技術的思想是通過添加虛擬化層,把實際物理存儲實體與存儲邏輯分離,使應用服務器只與邏輯層面相關聯,方便了網絡存儲系統的管理,也降低了成本。虛擬化的網絡存儲系統中,邏輯卷和物理存儲設備的映射關系是可以由應用服務器上的虛擬化管理軟件、存儲設備系統上的控制器或者存儲網絡中網絡設備來完成。典型的系統有IBM的SAN SVC HDS UVM等等,存儲虛擬化技術正在向管理簡單化、接口規范化以及功能更強的方向發展。
根據虛擬化功能模塊在網絡存儲系統中的位置不同,存儲虛擬化可分為3種結構:基于主機的虛擬化、基于存儲設備的虛擬化以及基于網絡的虛擬化。基于主機的虛擬化依靠主機上的軟件或硬件提供存儲虛擬化管理功能,使用較多的是邏輯卷管理,它在服務器上實現存儲虛擬化,提供一個虛擬層,將存儲設備映射到邏輯卷的虛擬層,而服務器只處理虛擬卷,不用對存儲設備的物理參數進行管理。這種虛擬化方式會占用主機的資源,會影響其他應用的運行。基于存儲設備的虛擬化將一個物理設備虛擬化為多個邏輯分區或將多個物理存儲設備虛擬為一個邏輯存儲設備。基于網絡的存儲虛擬化在網絡上實現,可分為帶內虛擬化以及帶外虛擬化。帶內虛擬化是指控制信令和實際數據在一條線路上,就是說進行虛擬化的動作設備是直接橫在發起者和目標路徑之間的,執行中介操作,發起者看不到目標,只能看到結果虛擬化的目標。帶外虛擬化是指控制信令和實際數據不在一條線路上,兩組的線路是并聯的,發起者必須先咨詢控制信令線路上的虛擬化設備,經過授權后才能根據虛擬化設備的指示向目標請求數據[2]。
集群使用多個節點代替一個節點完成任務,提高了處理能力,當某個節點發生故障時,其他節點可以立即接替故障點的工作。集群存儲技術通過將集群技術應用在存儲系統中,實現了對海量數據的管理。集群系統可以分為對稱結構和非對稱結構。對稱結構的集群中所有節點都是磁盤結構并提供數據的訪問服務;非對稱結構的集群中使用專用的元數據服務器維護文件系統和磁盤結構,并且提供元數據訪問服務。
網絡存儲中涉及大量數據的計算、傳輸以及存儲,數據的保護也就成為一個重要的環節。
數據保護就是對當前位置上的數據備份到其他介質上,當磁盤損壞或數據丟失時利用備份數據把原始數據恢復,最大限度降低損失。數據備份可以分為文件級備份和塊級備份。文件級備份通過將數據以文件的形式讀出,再將其存儲在另一存儲介質上,讀出的文件在原來的介質上可以是不連續的,通過文件系統來管理這些不連續的塊。備份至另一存儲介質的文件在很大程度上是連續存放的。塊級備份直接對扇區進行讀取,將讀取到的扇區寫入新的磁盤對應的分區,不管塊上有沒有數據,備份之后原來不連續的文件仍然是不連續的,有很多碎片[3]。更高級的數據保護方法還有遠程文件復制,遠程磁盤鏡像以及快照數據保護。
云存儲是在云計算的基礎上發展起來的,它是一個以數據管理和存儲為核心的云計算系統,采取的是并行架構,具有海量的擴展能力,可以實現負載均衡,也便于管理。它能夠實現存儲虛擬化和自動化,通過網絡技術、集群應用或分布式文件系統等功能,將網絡中大量分散的各種類型的存儲設備通過應用軟件集合在一起協同工作,對外共同提供數據存儲和業務訪問的功能。對于用戶,云存儲不是具體的設備,而是一個由多個存儲設備和服務器構成的集合,通過層次化的服務架構向用戶提供所需的存儲服務。其結構模型一般由存儲層、基礎管理層、應用接口層和訪問層4個層組成,而網絡存儲技術在各個層都有應用。云存儲系統的實現要以多種技術的發展為前提,其關鍵技術主要有寬帶網絡、WEB技術、應用存儲、集群技術、網絡技術和分布式文件系統、數據壓縮技術、數據加密技術、重復數據刪除技術、存儲虛擬化技術、存儲網絡化管理技術等。可見云存儲的應用已滲透至各種計算相關的領域,并且它的發展也依賴于多種技術的發展,在其發展道路上還要解決性能、可靠性、安全性和支持性等多方面的問題,才能為用戶提供多樣化的存儲服務。
本文依據存儲介質介紹了各個時期存儲設備的發展,重點分析和研究了網絡存儲及其關鍵技術,使讀者能夠了解網絡存儲的發展現狀及趨勢,可為網絡存儲技術的研究和應用提供一定的參考。
[1]陳全,鄧倩妮.云計算及其關鍵技術.計算機應用[J].2009,29(9):2562-156.
[2]Peter Fingar.Dot Cloud:The 21 st Century Business Platform Built on Cloud Computing[M].Meghan-Kiffer Press,2009.
[3]ARMBRUSTM,FOXA,GRIFFITHR,etal.Above the Cloud:A Berkeley View of Cloud Computing[R].Berkeley,CA,USA:University of California,2009.