〔摘 要〕就當前高校數字圖書館海量數據存儲的現狀及需求而言,構建一個安全、高效的存儲后臺已成為數字圖書館建設中的重要任務。網絡存儲模式主要有DAS、NAS、SAN 3種,且各具特色,但由于SAN架構具有集中管理和高性能存儲的優點,在現代存儲模式中脫穎而出,成為當前數字圖書館普遍采用的網絡存儲方式。本文通過對不同存儲架構的對比分析,提出一種切實可行的基于IP-SAN架構的網絡存儲方案。
〔關鍵詞〕數字圖書館;網絡存儲;FC-SAN;IP-SAN;DAS;NAS;iSCSI
DOI:10.3969/j.issn.1008-0821.2010.12.021
〔中圖分類號〕G250.76 〔文獻標識碼〕A 〔文章編號〕1008-0821(2010)12-0077-04
Study and Practice on the Construction of Storage Network in Digital LibraryZhu Guangju
(Library,Yunnan Normal University,Kunming 650092,China)
〔Abstract〕Aiming at the current situation and the demand of mass data storage in digital libraries,it is important to build a secured and efficient database in the construction of digital libraries.There are three main types of network storage model,namely,DAS,NAS and SAN,with their own characteristics.For SAN architecture has centralized management and high-performance storage characters,it is widely used in modern digital library network storage as a storage pattern currently.This article analysed different storage architectures,then proposed a practical storage solution based on IP SAN.It will be ensure the consistency of the data,safety and reliability.At the same time,it will achieve a centralized management and accessing of different data and will provide a safe efficient management environment of storage,and it has good expansibility.
〔Keywords〕digital library;network storage;FC-SAN;IP-SAN;DAS;NAS;iSCSI
高校數字圖書館數據庫不僅存儲了大量的中外文期刊數據庫、數字圖書及音像視頻資料等,還有一些自建的特色資源庫。隨著信息數據的急劇增長以及對數據安全性的考慮,建立一個完備的網絡存儲系統是高校圖書館亟待解決的重要任務。建立存儲系統不僅要考慮到大容量存儲、存儲整合、分級存儲、數據備份、虛擬化、遠程容災等,還應考慮到不同的應用對以太網和光纖網等不同的網絡環境的需求。因此,建設一個高性能、高可用的存儲后臺,為龐大的數字資源提供一個安全存儲、高效管理的環境,已經成為高校數字圖書館建設中面臨的中心任務。
1 不同存儲架構的對比分析
1.1 直接附加存儲(DAS,Direct Attached Storage)
直接附加存儲指將SCSI或光纖信道的磁盤陣列、光盤庫、磁帶庫等大容量存儲設備直接連接到服務器,是一種以服務器為中心的存儲方式[1]。DAS的缺點是服務器與存儲設備獨立相連,存儲設備的資源難以共享且利用率低[2]。DAS是一種非常類似于PC機的最原始的存儲方式,不適合大容量的存儲,現在只應用在一些小數據量的單機應用上,比如云南師范大學圖書館的圖書館管理系統ILASII,存儲容量在2G左右,目前使用DAS存儲方式。
1.2 網絡連接存儲(NAS,Network Attached Storage)
網絡連接存儲是一種特殊的專用數據存儲服務器,內嵌操作系統及管理軟件,使用傳統以太網和IP協議,采用TCP/IP協議傳輸數據,可提供跨平臺文件共享功能[3]。NAS架構的缺點是擴展性受設備限制;性能受網絡帶寬的限制(數據讀寫占用網絡帶寬);對大量數據進行備份時,容易導致網絡堵塞;很難與現有備份系統集成,因此NAS的備份與恢復實現相當困難[4]。因此,NAS存儲方式適合于文件級共享存儲,而不適于基于數據庫的存儲。為了保護以往的投資,可以和SAN組合使用,以發揮各自的特長。
1.3 存儲區域網絡(SAN,Storage Area Network)
存儲區域網絡從它的物理架構來定義,高性能的光纖通道交換機、集線器,系列存儲設備和相關服務器,通過光纖通道網絡協議而組成的SAN系統[3]。SAN存儲方式的特點是服務器與存儲設備在硬件上已分離開來,并且實現了數據的集中存儲。可以直接對存儲設備進行操作如增加磁盤、劃分磁盤、初使化、變更RAID方式等而不再通過應用服務器。除些之外,SAN還具有良好的兼容性,可以跟其它存儲方式組合使用,是目前應用最廣泛的網絡存儲方式。
2 FC-SAN與IP-SAN的對比分析
最初的SAN是基于光纖通道技術的,其數據傳輸快、可靠性高、擴展性好,但價格比較昂貴。使用FC-SAN搭建存儲網絡,必須配套使用HBA卡、光纖交換機、光纖磁盤陣列等昂貴的硬件設備,并且管理也較為復雜。除些之外,FC IP協議只能用于光纖通道技術的連接,互操作性仍是目前FC-SAN實施過程中存在的主要問題,從而易形成信息孤島[5]。鑒于此,出現了一種是基于iSCSI技術的SAN(稱為IP-SAN),它是一種在以太網上進行數據塊傳輸的標準,是一個供硬件設備使用的,可以在IP協議上運行的SCSI指令集,無需采用專用光纖通道網絡,因而使用戶能夠在連接其服務器和計算機系統的相同IP網絡上部署入門級存儲區域網絡[5],解決了遠程傳輸的問題。換句話說,IP-SAN采用了一種更廉價的IP方式實現了網絡集中存儲,除了傳輸速度以外,幾乎實現FC-SAN的所有功能,在某些方面甚至比FC-SAN更具優勢。表1詳細比較了FC-SAN與IP-SAN的差異。
表1 FC-SAN與IP-SAN的比較
項目IP-SAN(iSCSI)FC-SAN網絡速度1Gb/s、10Gb/s1Gb/s、2Gb/s、4Gb/s接口卡成本軟件版Initiator、TOE HBA、IP HBA,價格從低到高專用FC HBA,價格相對較高成本投入購買及維護成本低購買及維護成本較高軟件支持主要有備份、快照、鏡像等軟件支持豐富傳輸距離無傳輸距離限制,衰減率低本地FC-SAN,小于100m保證數據安全傳送可使用多種安全方法無安全機制及安全通用協議傳輸質量通過局域網封包傳輸,穩定性較差通過專用光纖通道,傳輸速度快、穩定性好主機對數據封裝的
負擔大小千兆網卡+軟件方式,會增加主機負擔;IP HBA卡方式,不造成主機負擔分段和重組操作是在網卡中實現的,因此減輕了主機CPU的負擔兼容性能整合各種存儲設備,有效保護以往投資設備的互操作性較差,易形成信息孤島容災情況本身包含數據容災功能需另購與高端設備搭配的容災軟件使用和維護操作簡單,管理方便技術和管理復雜,需長時間學習培訓,對技術人員要求較高
2010年12月第30卷第12期高校數字圖書館存儲網絡建設研究與實踐Dec.,2010由于IP技術發展已很成熟,IP-SAN可以借助IP網絡的優勢延伸至各種應用中,不僅解決了FC-SAN的劣勢,即信息孤島問題,還可以通過IP-SAN來連接各個FC-SAN孤島,解決了遠程傳輸問題。通過使用標淮數據傳輸通道、接口及虛擬化管理技術,IP-SAN存儲網絡可以與各種磁盤陣列兼容。目前來看,盡管基于千兆以太網的IP技術與基于光纖的FC-SAN在傳輸速度上還存在一定的差距,但隨著萬兆以太網的普及,相信IP-SAN的性能會得到很快提升。就網絡的靈活性、兼容性、可擴展性、管理和維護、數據容災及整體擁有成本來看,IP-SAN具有明顯優勢,是高校圖書館網絡存儲的理想選擇。
3 數字圖書館網絡存儲系統設計方案
3.1 存儲現狀分析與未來建設目標
云南師大圖書館非常重視信息化和電子資源的建設,目前已購置多個學術數據庫,其中中文數據庫有中國知網CNKI、萬方、維普、人大復印資料等,電子圖書有方正Apabi、書生之家、超星等,外文數據庫有ProQuest、Gale、EBSCO、國道外文數據庫等,此外還有網上報告廳等視頻數據庫。這些數據庫都是國內外比較重要、權威的、包含學科范圍廣泛的大型綜合性全文數據庫,形成紙質資源和電子的互補,擴大了師生獲取信息的途徑,受到了師生們的普遍歡迎,利用率很高。另外,還自建了館藏中外文圖文報刊書目數據庫、古籍、西南聯大特藏圖書、西南聯大文庫等幾個特色數字資源庫,正在著手建設云南師大專家信息庫、云南師大專家論文、論著數據庫和博碩論文數據庫等特色數據庫以及即將建設的云南省級中心Calis文獻保障系統等,原文總容量高達40TB。逐步形成紙質文獻與電子文獻兼備、文字類資源與多媒體類資源互補的藏書特點。
目前圖書館主要存儲索引文件,采用DAS數據存儲架構,這種架構使得我館數字資源只能存儲在各服務器自帶的硬盤中,而這種存儲方式從數據管理、安全性、穩定性及擴展性及數據共享方面都比較差。為了讓新館更高效地服務讀者,滿足讀者日益增長的文獻及信息需求,圖書館對存儲系統的性能、帶寬、安全性、穩定性提出了更高的要求。我館網絡存儲的建設目標是實現大容量數據的集中存儲,可根據不同應用訪問需求進行分級存儲并實自動數據漂移,具備較強的可擴展性,具有自動精簡配置功能,能保障數據安全,易于管理。
3.2 網絡存儲架構方案設計
存儲系統是圖書館信息中心系統的核心部分、它擔負著集中式數據存儲、備份、歸檔、容災。為前端的應用、WEB、數據庫提供了統一的數據所在中心。根據整個圖書館對存儲系統的高性能、高帶寬、高安全性、高穩定性的要求,建立一個以虛擬化技術為核心的存儲中心。能夠滿足用戶對性能、安全的要求。同時又具有高可用性、運行性能、平滑的可擴充性、采用工業標準的開放性、以及可維護性、簡易性。作為一個圖書館數據中心龐大的存儲系統,一個詳細、務實、具有前瞻性和技術先進性的方案是非常重要的。
本系統設計方案的原則是:①數據的安全性和可靠性;②系統的性能;③系統的可擴展性;④系統的靈活性;⑤系統管理的簡單性。根據本館經費情況,結合性價比,本館擬采用以iSCSI技術為核心的IP-SAN存儲架構設計。
圖1 圖書館網絡核心存儲系統拓撲結構圖
整個網絡系統以一臺匯聚交換機為中心,連接和管理服務器群交換機與各樓層交換機。在IP-SAN網絡存儲架構中,用兩臺經過優化的存儲以太網交換機組成了雙冗余SAN架構的核心以連接應用服務器平臺與存儲設備及虛擬磁帶庫,這樣不僅起到冗余的作用,還能起到負載均衡的作用。如圖1所示,每臺連入SAN網絡的服務器均安裝4塊以太網卡,并加入TOE模塊,其中2塊網卡分別與兩臺存儲交換機相連,另外2塊連接到服務器群交換機。中心存儲由4臺Equallogic PS6000磁盤陣列組成,通過存儲管理軟件整合為一個40T的大容量動態虛擬存儲池。存儲池可以根據應用需求創建不同的邏輯卷,邏輯卷不但可以跨磁盤陣列分布在4個磁盤陣列上,也可以根據需要將邏輯卷動態漂移在不同的磁盤陣列上,形成16Gb的高速I/O帶寬。存儲硬盤由高速SAS盤和大容量SATA盤組成,對于訪問頻率較高、數據量小的數據,存儲在性能較好的SAS磁盤陣列中,對于使用頻率一般且容量大的數據,存儲在SATA磁盤陣列中,實現數據的分級存儲。
在數據備份、容災方面,采用PS4000E磁盤陣列,通過虛擬管理軟件進行管理,能夠實現異地存儲,也可以與主存儲整合。由于商業數據庫可以通過廠商重新獲取,所以備份主要對核心系統及自建數據庫進行,這樣可以節余成本,數據恢復也較快。由于自建數據庫增長不是很快,數據變化量不大,備份時間可以安排在圖書館閉館時間進行,如期末做全備份,平時夜間或周末做增量或差分備份即可。
3.3 系統設計方案的特性
本數字圖書館存儲架構方案設計集中體現了如下幾個優勢:
(1)實現了數據的集中管理。采用以iSCSI技術搭建的IP-SAN存儲架構設計,解決數據分散存儲和管理的問題,實現了數據資源的共享。
(2)冗余的IP-SAN存儲架構。通過兩個存儲交換機和冗余接口,使得整個SAN形成冗余,防止單點故障, 相互還能起到備援及負載均衡的作用。
(3)數據分級存儲。不同硬盤的磁盤陳列,實現了分級存儲的數據管理模式,根據數據的重要性和訪問率,自動科學、合理地組織和分布數據的存儲。
(4)多個物理磁盤陣列組成一個虛擬盤陣,其大小可以隨著應用的需求任意進行擴充與縮小,不受到物理設備的限制。LUN能夠漂移在不同物理陣列上,能夠跨物理陣列實現LUN,因此能充分利用所有物理存儲設備的處理能力,使得磁盤陣列能夠做到容量和處理能力一起線性擴容。
(5)自動精簡配置功能能夠實現了磁盤陣列的自我學習、自我管理、自我優化,極大程度降低磁盤陣列的管理復雜性。
(6)數據的安全性。采用虛擬磁帶庫的方式,通過備份軟件或自帶的鏡像、快照軟件對重要數據及自建數據進行定時或實時備份,保障了核心業務系統和館藏數據的安全。
4 結束語
IP技術是目前使用最多的網絡數據傳輸協議,其標準性和開放性早已成為共識。系統基于以太網的SAN架構,通過iSCSI協議來實現存儲數據在服務器和存儲設備之間快速傳輸,而且IP網絡具有較高的可靠性、容易管理、可擴展性極強、自適應性強等優點,提供了優良的遠程數據復制和容災特性,為云南師大數字圖書館海量數據的存儲提供了一個切實可行的解決方案和保障。隨著萬兆以太網的推廣,IP-SAN所帶來的優勢會顛覆SAN網絡存儲的重心,成為高校數字圖書館的首要選擇。
參考文獻
[1]秦元.基于IP SAN的圖書館存儲網絡建設[J].網絡財富,2008,(7):164.
[2]劉喜球.高校圖書館數字資源存儲系統模式設計[J].現代情報,2007,(10):89.
[3]焦志彬,許勝軍.數字圖書館存儲系統現狀分析[J].內蒙古科技與經濟,2007,(16):145.
[4]李靜,董倩.SAN與NAS融合技術在數字圖書館中的應用研究[J].現代情報,2009,(9):102.
[5]朱月梅,徐豁,朱玉,等.FCSAN與IPSAN架構在數字圖書館中的應用研究[J].2006,(9):114.