●王慕抽(溫州大學,浙江 溫州 325035)
圖書館自動化系統的連續穩定運行及數據安全至關重要。一旦系統中斷運行,將給各個業務部門及全校師生帶來極大的混亂,而數據一旦丟失,則帶來的損失和后果都是災難性的。目前,我校圖書館自動化管理系統在PC服務器上運行,數據保存在本地主機內,通過FPT方式做每日全備份,隨著兩校合并、學生擴招、書目數據量劇增以及應用軟件不斷升級、功能擴展等,PC服務器處理能力和性能已無法充分滿足使用要求,隨時存在停機和數據丟失的可能。在這次自動化系統更換升級的實踐中,如何確保業務不中斷,如何確保數據安全,如何在災難發生時能快捷準確地進行恢復,是方案考慮的關鍵問題。應當采用基于雙機熱備技術、SAN技術、備份軟件和環境保障的支撐一體化解決方案,以徹底解除系統隱患,保障業務連續性。
從廣義上講,雙機熱備就是對于重要的服務使用兩臺服務器,互相備份,共同執行同一服務。當一臺服務器出現故障時,可以由另一臺服務器承擔服務任務,從而在不需要人工干預的情況下,自動保證系統能持續提供服務。
雙機熱備主要解決服務器故障問題。服務器比交換機、存儲設備復雜得多。它包括硬件系統、軟件系統,故障概率也要高得多,如設備故障、操作系統故障、應用系統故障等等,一般地講,在技術人員在現場的情況下,恢復服務器正常可能需要10分鐘、幾小時甚至幾天。從實際經驗上看,除非是簡單地重啟服務器(可能隱患仍然存在),否則往往需要幾個小時以上,如果技術人員不在現場,則恢復服務的時間就更長了。對于圖書館的關鍵應用來說,師生很難忍受長時間的服務中斷。因此,對于需要持續可靠地提供應用服務的系統,雙機熱備還是非常重要的。
雙機熱備是一種軟硬件結合的高可靠性應用模式,有兩種實現方式,一種是基于共享的存儲設備方式,另一種是沒有共享的存儲設備方式(純軟件方式)。我們選擇基于共享存儲設備的雙機熱備方式,該系統由兩臺服務器+磁盤陣列柜+熱備軟件構成,操作系統和應用程序安裝在兩臺服務器上,數據庫存放于共享的磁盤陣列柜,通過RAID技術保證數據的可靠性,數據庫與應用軟件在某一時刻只由一臺主機控制。系統運行時,兩臺服務器將以一個虛擬的IP地址對外提供服務,通過熱備軟件的監測模塊來互相監測對方的心跳及服務,當一臺服務器出現故障時,另一臺服務器根據心跳偵測的情況做出判斷,并進行切換,接管服務,故障切換過程中數據能確保完整性,切換時間很短,而且無需人工干擾,能夠很好地滿足圖書館自動化系統實時性要求較高的需求。
基于存儲區域網SAN的存儲共享雙機熱備模式是目前雙機熱備較好方案。我館服務器IBM P550兩臺,其操作系統為AIX 5.3,存儲為SAN,實踐證明比較穩定可靠。[1]
存儲區域網SAN技術主要解決數據硬盤問題。數據硬盤故障是系統中斷運行的重要原因之一,而且硬盤故障往往會導致數據的丟失,從而帶來災難性的后果。因此要解決系統連續運行和數據丟失的問題,必然要解決存儲的問題。在今天,“數據與系統分離”觀念已經成為當前IT技術的新潮流。隨著數字圖書館數據的重要性越來越大,存儲設備已成為整個系統的中心,采用開放性的存儲系統也顯得越來越重要。我們設計并實施了基于存儲業界領導者EMC公司的CX 700光纖磁盤陣列系統為存儲核心的SAN存儲解決方案,通過存儲局域網SAN的架構對服務器的數據進行集中存儲管理。
本館使用的光纖交換網絡的核心是一臺16口光纖交換機和一臺8口光纖交換機。其中四服務器均配置了兩塊HBA卡,分別連接這兩臺光纖交換機,余下一臺服務器配置了單塊HBA卡與16卡光纖交換機進行連接。光纖交換機一方面連接各服務器,另一方面連接光通道磁盤陣列系統。在系統擴展時,光纖交換機可以通過自身的端口或通過級連方式進行擴展。整個存儲網絡除配置單塊HBA卡的服務器外,通過EMC的路徑管理軟件PowerPath做到了鏈路冗余,無單點故障。系統構建完成后,速度性能得到了很大的提升,將原有的數據分散模式變為數據集中模式,使數據的管理帶來很大的便利,目前系統運行穩定。應用三年中證實具有高度的可靠性、穩定性、安全性。
本校圖書館網絡、存儲系統拓撲圖改造前和改造后分別如圖1、圖2所示:

圖1 改造前圖書館網絡、存儲系統拓撲圖

圖2 改造后圖書館網絡、存儲系統拓撲圖
備份軟件主要解決數據異地備份問題。數據的安全性保障包括多方面,如防病毒、系統入侵檢測、硬件故障冗余、雙機系統冗余、系統數據備份等,而數據備份是上述安全性保障最核心也是最重要的保障手段,因為它直接對用戶的各種數據進行備份,是保證為圖書館提供正常服務的最后一道防線,當各種影響數據安全的情況發生時,以最短的時間恢復受損的數據。
目前本館使用南京匯文自動化管理系統,其業務數據存儲在Oracle數據庫當中。所以自動化系統的數據備份,實際上就是Oracle數據庫備份。Oracle數據庫在備份與恢復方面的功能較完善,除了硬件級的備份(如RADI1、雙機熱備等)之外,還包括邏輯備份和物理備份。物理備份又包括冷備份和熱備份。
Oracle的備份與恢復有3種標準的模式,大致分為兩大類,備份恢復(物理上的)以及導入導出(邏輯上的),而備份恢復又可以根據數據庫的工作模式分為非歸檔模式 (Nonarchivelog-style)和歸檔模式(Archivelog-style),通常,我們把非歸檔模式稱為冷備份,而相應的把歸檔模式稱為熱備份。Oracle的這3種方式各有優缺點,下面比較一下這3種方式的優缺點:
以上3種備份方式,使用頻率最高的首推邏輯導入導出方式備份。鑒于冷備份只能在關機時使用,我們主要使用邏輯備份和物理備份的熱備份方式。
為了使可能丟失的重要數據能盡快恢復,且保證數據的一致性和完整性,我們采用如下數據備份方案:
(1)Oracle的邏輯備份,數據庫主機和備份機交互備份相結合,磁帶、光盤等介質異地備份為輔助的方式。普通PC做備份機定時自動備份到硬盤,每天22:00備份。Oracle數據庫服務器同時將腳本寫入主配置文件/etc/crontab/cron在本機定時備份,每天23:00備份。光盤、磁帶等輔助備份介質,根據實際情況,不定期將數據保存在光盤或磁帶等介質上。

表 備份方式比較表
在備份機上的備份腳本語句格式,備份機備份腳本:exp用戶名/密碼@tns file=fileName.dmp本館考慮數據及存儲空間方面,于是將一周作為循環周期。語句如下所示:exp userid=system/orcl@libsys file=d:ak\%date:~11,3%.dmp log=d:ak\%date:~11,3%.log owner=libsys buffer=1024000
將以上命令行存成.bat格式放在Windows系列的備份機上可執行腳本文件,進行定時備份。邏輯備份恢復,采用Oracle自身的導入命令進行。把備份出的用戶級備份文件完全導入到Oracle數據庫即可。
導入時的命令行:imp用戶名/密碼 full=y file=fileName.dmp
如果導出采用的命令是:exp system/orcl file=20110101.dmp,則相應的導入命令是:
例:imp system/orcl full=y file=20110101.dmp
(2)物理備份的熱備份方式,Oracle數據庫運行在歸檔模式;每天晚上將歸檔日志文件通過備份軟件備份到磁帶庫中;每周五凌晨進行一次數據庫RMAN全備份,備份數據存儲在SAN上歸檔日志文件存儲區域中;每周五晚上將RMAN全備份數據通過備份軟件備份到磁帶庫中,刪除存儲(SAN)兩周前備份數據和一天前歸檔日志文件;在存儲上始終保持一份完整的RMAN全備份數據和有效的一周內歸檔日志文件。[2]
機房環境監控系統是一個綜合利用計算機網絡技術、數據庫技術、通信技術、自動控制技術、新型傳感技術等構成的計算機網絡,提供的一種以計算機技術為基礎、基于集中管理監控模式的自動化、智能化和高效率的技術手段,系統監控對象主要是機房動力和環境設備等(如:配電、ups、空調、溫濕度、漏水、煙霧、視頻、門禁、消防系統等)。
我館目前主控機房180m2UPS四臺,三臺10KV和一臺2KV;有5臺3P格力空調;二氧化碳滅火器2對;煙霧探頭若干,視頻攝像頭1對。
由于學校的特殊性,寒暑假尤其是暑假機房溫度非常重要,考慮到精密空調價格高、噪音大等問題,于是在原來格力空調的基礎上,增加空調來電重啟控制器 (sAC-2501)。
雙機熱備技術、存儲區域網技術、備份技術及機房環境監控系統等是圖書館保障業務連續性的支撐技術,它們相互形成,不可缺少。雙機容錯技術解決了服務器故障問題和用戶對服務中斷的容忍時間,存儲區域網技術技術解決了硬盤故障和數據丟失問題,備份技術解決了系統出現問題后數據損壞、丟失時的恢復問題,機房環境監控系統提供必要的環境保障功能。本文在機房環境監控系統智能化方面未做詳細的描述,有待進一步完善。經過兩年多運行,證明系統具有高性能、高可用性和高安全可靠性等特性。
[1] 劉新宇,等.雙機熱備份機群的可信性建模分析與比較[J].小型微型計算機系統,2004(4):747-751.
[2] 潘傳迪.高可用性醫院信息系統核心部件的構建與實現[J].醫學信息,2006(5):768-770.