熊延萍
容災(zāi)備份是指為防止系統(tǒng)出現(xiàn)軟硬件故障、人為誤操作、自然災(zāi)害等造成系統(tǒng)宕機(jī)、數(shù)據(jù)丟失,而將全部或部分系統(tǒng)文件和數(shù)據(jù)資源復(fù)制到備份介質(zhì)中。當(dāng)系統(tǒng)宕機(jī)、數(shù)據(jù)丟失時(shí),可從備份介質(zhì)中恢復(fù)。為確保北京數(shù)字檔案館(電子文件中心)系統(tǒng)數(shù)據(jù)的安全性和可持續(xù)性,建設(shè)高效可靠的容災(zāi)備份體系是至關(guān)重要的。
一、概述
北京數(shù)字檔案館(電子文件中心)的容災(zāi)備份體系建設(shè),本著先進(jìn)性、可靠性、可擴(kuò)展性的原則,針對(duì)系統(tǒng)中不同數(shù)據(jù)對(duì)象和數(shù)據(jù)量,設(shè)計(jì)相應(yīng)的備份架構(gòu),采用不同的備份策略,確定相應(yīng)備份頻率、介質(zhì)、容量等,在北京市檔案館專網(wǎng)、政務(wù)外網(wǎng)、因特網(wǎng)分別建設(shè)部署。
其中,北京市檔案館專網(wǎng)與政務(wù)外網(wǎng)和因特網(wǎng)是完全物理隔離的,而政務(wù)外網(wǎng)和因特網(wǎng)則采用的是邏輯隔離。
二、備份架構(gòu)
北京數(shù)字檔案館(電子文件中心)的容災(zāi)備份體系主要通過高性能共享文件系統(tǒng)、備份軟件和物理磁帶庫等,在北京市檔案館專網(wǎng)與政務(wù)外網(wǎng)、因特網(wǎng)上實(shí)現(xiàn)自動(dòng)化的本地備份,確保系統(tǒng)和數(shù)據(jù)的有效備份與恢復(fù)。總體架構(gòu)圖如圖1所示:
在北京市檔案館專網(wǎng)部署獨(dú)立的備份系統(tǒng)域(圖1中備份域1),使用一套備份數(shù)據(jù)管理軟件和備份設(shè)備,實(shí)現(xiàn)網(wǎng)內(nèi)業(yè)務(wù)系統(tǒng)的自動(dòng)化集中備份;同時(shí)考慮應(yīng)用需求,采用先進(jìn)的共享文件系統(tǒng),以滿足多應(yīng)用同時(shí)訪問同一數(shù)據(jù)對(duì)象的需求。
在北京市檔案館政務(wù)外網(wǎng)和因特網(wǎng)內(nèi)部署統(tǒng)一的備份系統(tǒng)域(圖1中備份域2),兩網(wǎng)共用一套備份數(shù)據(jù)管理軟件和備份設(shè)備,使兩網(wǎng)內(nèi)業(yè)務(wù)系統(tǒng)可自動(dòng)化集中備份,實(shí)現(xiàn)備份系統(tǒng)在兩網(wǎng)間的統(tǒng)一管理。
備份架構(gòu)在設(shè)計(jì)選型時(shí)考慮如下因素:
一是備份服務(wù)器應(yīng)可建立在集群服務(wù)器上,實(shí)現(xiàn)物理冗余;還可在異地部署災(zāi)備備份服務(wù)器,實(shí)現(xiàn)邏輯冗余,以便本地備份系統(tǒng)發(fā)生重大故障時(shí)及時(shí)恢復(fù)。
二是多個(gè)介質(zhì)服務(wù)器可共享同一物理磁帶庫設(shè)備,介質(zhì)服務(wù)器與物理磁帶庫之間采用冗余備份鏈路,避免單一鏈路失效導(dǎo)致備份失敗。
三是為便于靈活操作,備份軟件還應(yīng)支持?jǐn)?shù)據(jù)庫圖形化備份/恢復(fù)操作;對(duì)于文件和數(shù)據(jù)庫的備份/恢復(fù),應(yīng)支持自動(dòng)斷點(diǎn)續(xù)傳和異機(jī)恢復(fù)等功能等;還應(yīng)支持單文件、單虛擬機(jī)、物理機(jī)等不同恢復(fù)方式,以及傳統(tǒng)客戶端備份配置的全備份、增量備份等備份方式。
(一)專網(wǎng)備份架構(gòu)
專網(wǎng)備份架構(gòu)設(shè)計(jì)應(yīng)考慮網(wǎng)內(nèi)各個(gè)業(yè)務(wù)系統(tǒng),包括數(shù)據(jù)庫應(yīng)用及文件類應(yīng)用,涉及的數(shù)據(jù)包括結(jié)構(gòu)化數(shù)據(jù)(如數(shù)據(jù)庫文件)及非結(jié)構(gòu)化數(shù)據(jù)(如紙質(zhì)檔案數(shù)字化副本、照片檔案、音視頻檔案數(shù)字化副本等)。結(jié)構(gòu)化數(shù)據(jù)采用一體化備份數(shù)據(jù)管理平臺(tái)實(shí)現(xiàn)集中備份管理;非結(jié)構(gòu)化數(shù)據(jù)采用集成高性能共享文件系統(tǒng),在實(shí)現(xiàn)數(shù)據(jù)共享訪問的同時(shí),利用基于共享文件系統(tǒng)的存儲(chǔ)管理功能,結(jié)合近線存儲(chǔ)和大容量物理磁帶庫多級(jí)存儲(chǔ)設(shè)備,實(shí)現(xiàn)數(shù)據(jù)的自動(dòng)分層歸檔和分級(jí)存儲(chǔ),并可歸檔多份數(shù)據(jù)副本,實(shí)現(xiàn)歸檔數(shù)據(jù)的備份。因此,專網(wǎng)備份以傳統(tǒng)備份和遷移歸檔兩種方式結(jié)合完成。專網(wǎng)備份架構(gòu)如圖2所示:
其中,物理磁帶庫分為兩部分:一是作為傳統(tǒng)備份軟件的專用備份設(shè)備;二是作為高性能共享文件系統(tǒng)的專用歸檔設(shè)備,作為分層存儲(chǔ)體系中的三級(jí)帶庫存儲(chǔ)。
該架構(gòu)可實(shí)現(xiàn)磁盤-磁盤-磁帶(D-D- T)的備份模式,只需在二級(jí)大容量低速存儲(chǔ)陣列中劃出一塊磁盤空間(圖2中磁盤備份空間)給備份服務(wù)器,將數(shù)據(jù)庫數(shù)據(jù)及需要快速恢復(fù)的業(yè)務(wù)數(shù)據(jù)備份到此空間,通過備份軟件的輔助拷貝功能將備份數(shù)據(jù)拷貝到物理磁帶庫。磁盤數(shù)據(jù)應(yīng)設(shè)置較短的保留周期,便于騰出空間繼續(xù)備份新的數(shù)據(jù),磁帶庫的備份數(shù)據(jù)應(yīng)設(shè)置較長的保留時(shí)間,以便長期保存。
(二)政務(wù)外網(wǎng)和因特網(wǎng)備份架構(gòu)
政務(wù)外網(wǎng)和因特網(wǎng)之間采用邏輯隔離,故在不影響業(yè)務(wù)系統(tǒng)和網(wǎng)絡(luò)運(yùn)行的前提下,在兩網(wǎng)間部署一體化的備份管理系統(tǒng),共享一套備份物理磁帶庫資源,在節(jié)省投資的同時(shí),更有利于兩網(wǎng)備份的統(tǒng)一管理和資源優(yōu)化利用。政務(wù)外網(wǎng)和因特網(wǎng)的統(tǒng)一備份架構(gòu)如圖3所示:
物理磁帶庫同時(shí)接入到政務(wù)外網(wǎng)和因特網(wǎng)的存儲(chǔ)區(qū)域網(wǎng)絡(luò)(SAN),為兩網(wǎng)分配不同的磁帶驅(qū)動(dòng)器。各業(yè)務(wù)服務(wù)器分別部署備份軟件的客戶端模塊,通過專用備份通信鏈路接收來自政務(wù)外網(wǎng)、因特網(wǎng)備份管理服務(wù)器的控制指令,經(jīng)各自的存儲(chǔ)區(qū)域網(wǎng)絡(luò)將各業(yè)務(wù)服務(wù)器上的數(shù)據(jù)備份到磁帶、磁盤陣列等設(shè)備中。整個(gè)過程中,政務(wù)外網(wǎng)與因特網(wǎng)僅共享同一個(gè)物理磁帶庫資源,并沒有備份數(shù)據(jù)流交互,從而實(shí)現(xiàn)了邏輯隔離。
該架構(gòu)同樣可實(shí)現(xiàn)磁盤-磁盤-磁帶(D-D-T)的備份模式,具體策略同專網(wǎng)備份架構(gòu)相同。
三、備份策略
備份策略需要考慮備份方式、備份對(duì)象、備份頻率等,按照備份對(duì)象的不同確定相應(yīng)的備份頻率、介質(zhì)、容量等。
北京數(shù)字檔案館(電子文件中心)主要采用LANFREE備份方式,此種備份方式中數(shù)據(jù)流不經(jīng)過局域網(wǎng)(LAN)而直接從磁盤陣列通過存儲(chǔ)區(qū)域網(wǎng)絡(luò)備份到物理磁帶庫中,無需占用局域網(wǎng)網(wǎng)絡(luò)帶寬,從而提高業(yè)務(wù)系統(tǒng)的網(wǎng)絡(luò)資源利用率。
由于磁帶介質(zhì)較其他備份介質(zhì)單位容量成本更低、保存期更長(最長可達(dá)50年)、性能更穩(wěn)定、耗能更低,且磁帶讀寫分離,運(yùn)輸更方便,是一種性價(jià)比較高、更可靠的大容量長期保存和備份介質(zhì),是北京數(shù)字檔案館(電子文件中心)備份介質(zhì)的首選,同時(shí)結(jié)合選取大容量低速(較低成本)磁盤陣列作為磁盤輔助備份,達(dá)到快速恢復(fù)的目的。
另外,應(yīng)根據(jù)現(xiàn)有檔案數(shù)據(jù)、系統(tǒng)管理數(shù)據(jù)及工作增量計(jì)算出所需磁帶的數(shù)量,并結(jié)合當(dāng)前信息技術(shù)的現(xiàn)狀及發(fā)展趨勢(shì),確定性價(jià)比較優(yōu)的磁帶類型、物理磁帶庫和磁盤陣列設(shè)備。其中,物理磁帶庫可以方便擴(kuò)容,如可增加磁帶數(shù)目或增加磁帶驅(qū)動(dòng)器數(shù)目,提高備份容量和并行備份能力。
(一)操作系統(tǒng)和應(yīng)用系統(tǒng)的備份
服務(wù)器操作系統(tǒng)和應(yīng)用系統(tǒng)是支撐業(yè)務(wù)系統(tǒng)正常運(yùn)轉(zhuǎn)的基礎(chǔ),一旦這些系統(tǒng)文件丟失或出錯(cuò),重新安裝系統(tǒng)所需時(shí)間較長,為了快速恢復(fù)系統(tǒng),需對(duì)這些系統(tǒng)文件和數(shù)據(jù)進(jìn)行備份。
備份對(duì)象主要包括操作系統(tǒng)和應(yīng)用系統(tǒng)的安裝、配置文件,由于其重要性,采取全備份方式。操作系統(tǒng)和應(yīng)用系統(tǒng)正式投入運(yùn)行后,產(chǎn)生變更的情況較少,故采取每月一次的定期全備份;此外,需在系統(tǒng)初次安裝完成及每一次配置更改后,由系統(tǒng)管理員手動(dòng)執(zhí)行一次全備份。此部分?jǐn)?shù)據(jù)量不大,可在磁帶和磁盤中進(jìn)行雙備份,用于快速恢復(fù),磁帶和磁盤的數(shù)據(jù)保留時(shí)間可設(shè)置為3個(gè)月。
當(dāng)然,有一些系統(tǒng)文件,存有與日常業(yè)務(wù)運(yùn)行相關(guān)的數(shù)據(jù)文件,且這些文件變化較頻繁,具體的備份策略應(yīng)視系統(tǒng)文件的大小、更新頻率及系統(tǒng)恢復(fù)時(shí)間點(diǎn)目標(biāo)、系統(tǒng)恢復(fù)時(shí)間目標(biāo)而靈活確定。
(二)數(shù)據(jù)庫的備份
數(shù)據(jù)庫是北京數(shù)字檔案館(電子文件中心)系統(tǒng)中關(guān)鍵應(yīng)用,也需要快速恢復(fù),故對(duì)數(shù)據(jù)庫采取每周做一次定期全備份;同時(shí),考慮到數(shù)據(jù)實(shí)時(shí)變化,故每周其他時(shí)間做定期增量備份,縮短備份時(shí)間,減少對(duì)磁帶的使用??稍O(shè)置為:周一至周六晚做定期增量備份,周日晚做定期全備份等。此種策略結(jié)合定期全備份和增量備份兩種方式,保證數(shù)據(jù)快速恢復(fù)到指定時(shí)間點(diǎn),靈活與可靠并行。此部分?jǐn)?shù)據(jù)量也不大,也可在磁帶和磁盤中進(jìn)行雙備份,磁帶和磁盤的數(shù)據(jù)保留時(shí)間可設(shè)置為3個(gè)月。
(三)檔案數(shù)字資源的備份
北京數(shù)字檔案館(電子文件中心)系統(tǒng)的核心是檔案數(shù)字資源,一般包括傳統(tǒng)載體檔案數(shù)字化副本、電子檔案、電子資料和數(shù)字編研成果等以數(shù)字形式存在的各類檔案資源,因此,檔案數(shù)字資源備份容災(zāi)是備份體系的核心所在??紤]到檔案數(shù)字資源數(shù)據(jù)量巨大,目前為數(shù)百TB,將來會(huì)繼續(xù)增多,故選取磁帶作為大容量長期保存介質(zhì)。由于數(shù)據(jù)量大,采用每年一次的定期全備份方式,考慮每天可能會(huì)有新增檔案數(shù)字資源,故每天固定時(shí)間點(diǎn)做定期增量備份,如每晚做定期增量備份。
為確保檔案數(shù)字資源的安全,不僅要做好本地備份,還應(yīng)開展同城、異地備份工作。
北京市檔案局(館)按照國家檔案局的相關(guān)要求,開展重要檔案異地備份工作,于2012年制定了《館藏檔案數(shù)字資源備份策略》與《館藏?cái)?shù)字檔案資源備份實(shí)施方案》,明確了每兩年進(jìn)行一次數(shù)據(jù)同城(市災(zāi)備中心)、異地(陜西省檔案館)備份工作,定期將磁帶自動(dòng)出庫,由專人負(fù)責(zé)運(yùn)輸?shù)疆惖乇4妗?/p>
截止2016年10月,北京市檔案館已完成了兩輪全市檔案異地備份數(shù)據(jù)(市檔案館及十六區(qū)檔案館的數(shù)據(jù))同城、異地?cái)?shù)據(jù)備份工作以及第一輪同城、異地備份數(shù)據(jù)恢復(fù)驗(yàn)證工作,經(jīng)驗(yàn)證,全市檔案異地備份數(shù)據(jù)可讀、正確。
四、結(jié)語
隨著電子政務(wù)和信息化技術(shù)的快速發(fā)展,檔案管理工作越來越依賴信息系統(tǒng),業(yè)務(wù)數(shù)據(jù)的丟失、應(yīng)用系統(tǒng)的停止、網(wǎng)絡(luò)的異常等造成的損失也越來越大。因此,積極建設(shè)容災(zāi)備份體系,對(duì)檔案部門具有越來越重要的價(jià)值。我們將結(jié)合實(shí)際工作,總結(jié)經(jīng)驗(yàn),不斷完善本地、同城、異地備份和恢復(fù)策略,完善容災(zāi)備份體系建設(shè),確保北京數(shù)字檔案館(電子文件中心)系統(tǒng)中檔案數(shù)字資源的安全、長期保存,進(jìn)一步提升災(zāi)難應(yīng)對(duì)能力。
參考文獻(xiàn):
王建文.北京數(shù)字檔案館(電子文件中心)存儲(chǔ)體系建設(shè)[J].北京檔案,2017(5):7-9.