季瑩,趙寧,韓露
(1.哈爾濱工業大學圖書館,黑龍江哈爾濱 150001;2.黑龍江電視臺,黑龍江哈爾濱 150001)
隨著網絡技術的發展和數字圖書館的使用,數字圖書館的用戶和資源量訪問量的增加,對數字圖書館的數據存儲與系統輸入輸出的穩定性和數據安全有更高的要求。
高校數字圖書館存儲了大量電子文獻,學位論文庫、特色庫、媒體庫、自建庫和購買的電子期刊備份、全文庫等都在隨著年份的增長而不斷增加,數據是多樣性的[1]。
高校圖書館的存儲面臨以下問題:需要保證數據安全和服務器7×24 h 可用;數據的傳輸性、實時性和兼容性較差;需要解決服務器系統之間交換數據文件,滿足大塊數據的輸入輸出、數據的共享性、跨平臺的計算環境、足容災容錯集群管理、多級備份、在線備份與近線備份等問題;存儲多數使用磁盤列,不能共享;主流硬件設備和存儲類型不同,擴充不便。
高校數字圖書館存儲技術包括DAS、NAS、SAN。DAS是直接附加存儲技術,通過SCSI 接口或者光纖等將磁盤陣列接到服務器上,但是加大了管理難度[2],不適合大規模存儲。按照存儲網絡工業協會SNIA 的定義,SAN 是存儲區域網,利用互聯網協議,在服務器與存儲之間傳送數據;NAS是存儲設備,直接連接LAN,提供文件級服務[3]。
SAN 是服務器連接存儲的結構。存儲設備不在服務器系統中。SAN 將LAN 上的存儲轉換到由存儲設備組成的SAN 上[4-7]。
優點是高寬帶,低延時,數據傳輸速度高、距離長,子網不影響主網的帶寬和性能,操作的可靠安全性和可擴展能力高[8-9]。缺點是互操作性差,成本較高,無法實現異構環境的文件共享,維護較難。
NAS 是跨平臺數據存儲設備。通過網絡協議和I/O 方式數據傳輸,即插即用LAN,支持共享數據。將數據存儲任務從主服務器分離出來,主服務器只用于數據處理[3]。
優點是設備故障不影響其他服務器,在網絡上存取數據減小CPU 開銷,支持共享數據和多種傳輸協議[10],文件級操作,價格低廉。缺點是難與現有備份系統集成,備份恢復困難,操作占用大帶寬,其他I/O 受影響,擴展受限多,增加存儲介質影響網絡性能,讀寫占用流量,不能集中管理,不支持數據庫服務,傳輸速度慢。
NAS 和SAN 存儲優勢互補。SAN 用作數據庫的快速運行,NAS 負責客戶端,通過專線網絡存儲與備份數據,不占用原來帶寬,傳輸性能改善,無限擴展[11-12]。
SAN 和NAS 互聯只是設備互聯,兩種存儲方式并用,各自的網絡還是各自響應數據的I/O 方式。SAN 和NAS 的互聯如圖1 所示。

圖1 SAN 和NAS 的互聯
NAS 是功能服務器和存儲器件。去掉存儲,即RAID 卡,加上一個FC 卡,通過光纖交換機或集線器連接共享和訪問網絡存儲資源。NAS 服務器提供子系統的文件級服務或用NAS 引擎連接存儲區域網,提供數據塊I/O 操作和數據庫應用。NAS 負責文件和數據塊之間的轉換,實現數據共享。但文件級的NAS 承受不了大負載。NAS 和SAN 的集成如圖2 所示。

圖2 NAS 和SAN 的集成
增加FCP 協議。安裝NIC 網卡訪問局域網和HBA 卡連接光纖交換機,將NAS 存儲子系統融入SAN。NIC 在主機和存儲設備之間傳送數據包,塊狀數據通過HBA 或者并行SCSI 接口傳送;HBA 負責主機和存儲之間傳送塊狀數據。NAS 對存儲資源進行數據塊訪問,獲得迅速的數據響應。SAN 和NAS 的統一連接如圖3 所示。

圖3 SAN 和NAS 的統一連接
高校數字圖書館采用靈活的網絡拓撲結構,通過光纖交換機及設備連接,高速傳輸,實現任意節點間的多路可選擇的數據交換,并將專用數據存儲局域網與應用網絡分離,設計滿足數字圖書館不同數據處理要求的存儲系統。
采用EMC 公司存儲設備產品,如Clariion CX400/500,磁盤陣列采用光纖通道技術,采用通用的硬件體系結構和軟件應用程序套件。NAS 設備NS501 前端口連接以太網接口或iSCSI 口,后端連接DPE 獲得存儲資源,NAS 管理臺管理存儲容量。NAS 設置NFS/CIFS/HTTP 和FCP 文件服務器,前端口用NIC 連接以太網交換機,后端口配置HBA 卡,或者通過FC Switch 連接DPE。光纖交換機FC switch 是擴展CX400/500 磁盤陣列連接的服務器數目。組建的FC-SAN(8 端口)可以使得128 臺主機通過存儲網絡訪問磁盤陣列的存儲資源。關鍵性業務采用SAN 的Lan-free,不占用LAN帶寬,不降低性能,一般業務通過Server-free 方式,提高了網絡傳輸速度。
SAN 和NAS 融合是一種新的存儲方式,既有SAN 的高性能和可直接訪問存儲設備的特點,又有NAS 的統一管理、共享數據的特點。結合高校數字圖書館要求對于所保存信息的數字化、服務方式的網絡化,實現集中存儲、訪問和共享。保持系統持續運行,高速有效的訪問;不僅擴充硬件設備,還兼容異構系統,確保數據完整一致。