孔令啟 李鳳生
(作者單位:江蘇省水土保持生態(tài)環(huán)境監(jiān)測總站 210012 淮河水利委員會(huì)水文局(信息中心) 233001)
數(shù)據(jù)容災(zāi)備份是信息安全的基礎(chǔ),它通過特定的容災(zāi)機(jī)制,將全部或部分生產(chǎn)數(shù)據(jù)從應(yīng)用主機(jī)的硬盤或陣列復(fù)制到其他存儲(chǔ)介質(zhì)中,當(dāng)各種災(zāi)難發(fā)生后,能夠最大限度地防止數(shù)據(jù)丟失,以保障信息系統(tǒng)提供正常服務(wù)。
隨著江蘇省水利信息化的深入推進(jìn),重要應(yīng)用系統(tǒng)越來越多,寶貴數(shù)據(jù)資源不斷積累,對(duì)于數(shù)據(jù)安全存儲(chǔ)的需求也越來越高。水利數(shù)據(jù)容災(zāi)備份中心作為江蘇省水利數(shù)據(jù)中心建設(shè)的重要組成部分,不僅可為水利核心業(yè)務(wù)應(yīng)用提供長期、不間斷的可靠服務(wù),同時(shí)也能保證重要、珍貴的水利基礎(chǔ)數(shù)據(jù)的信息安全,是提高水利信息化支撐服務(wù)水平的根本保障。由于數(shù)據(jù)容災(zāi)備份中心構(gòu)成相對(duì)復(fù)雜、牽涉面廣,如何對(duì)其進(jìn)行全面、有效的監(jiān)控與管理,確保容災(zāi)備份體系正常、穩(wěn)定、安全運(yùn)行顯得尤為重要。
主數(shù)據(jù)中心集中承載各類重要的水利應(yīng)用及基礎(chǔ)數(shù)據(jù),現(xiàn)有110臺(tái)服務(wù)器、50個(gè)應(yīng)用系統(tǒng),數(shù)據(jù)資源達(dá)75TB。在主數(shù)據(jù)中心主機(jī)房布設(shè)1臺(tái)備份管理服務(wù)器、1套存儲(chǔ)系統(tǒng),備份服務(wù)器和存儲(chǔ)系統(tǒng)實(shí)現(xiàn)雙線冗余,滿足數(shù)據(jù)資源集中存儲(chǔ)和高可靠性的要求。同時(shí),配有數(shù)據(jù)備份軟件、數(shù)據(jù)同步復(fù)制軟件、數(shù)據(jù)庫管理軟件、虛擬平臺(tái)管理等基礎(chǔ)管理軟件,將本地?cái)?shù)據(jù)中心的公共數(shù)據(jù)和核心業(yè)務(wù)應(yīng)用,在災(zāi)備備份中心進(jìn)行遠(yuǎn)程備份,實(shí)現(xiàn)數(shù)據(jù)和應(yīng)用的遠(yuǎn)程容災(zāi)。
遠(yuǎn)程備份鏈路是將主數(shù)據(jù)中心的鏡像或備份傳輸至遠(yuǎn)程災(zāi)備中心的高速通道,由2條不同運(yùn)營商、不同物理路由裸光纖相連,單條實(shí)際路由長度不超過40km,數(shù)據(jù)網(wǎng)絡(luò)信號(hào)和存儲(chǔ)網(wǎng)絡(luò)信號(hào)通過波分設(shè)備可在同一光纖物理線路上實(shí)現(xiàn)復(fù)用承載。
災(zāi)備中心存儲(chǔ)主數(shù)據(jù)中心的數(shù)據(jù)鏡像或備份,建有遠(yuǎn)程容災(zāi)備份系統(tǒng),配置2套高端存儲(chǔ)、2套虛擬帶庫、1套備份帶庫及相應(yīng)備份介質(zhì)和軟件,通過既定的備份策略定期將主數(shù)據(jù)中心核心數(shù)據(jù)庫的重要數(shù)據(jù)備份到磁帶庫上。此外,容災(zāi)中心使用2臺(tái)高端unix服務(wù)器,部署2套應(yīng)急數(shù)據(jù)庫環(huán)境,當(dāng)主數(shù)據(jù)中心生產(chǎn)數(shù)據(jù)庫的雙重保障失效時(shí),業(yè)務(wù)系統(tǒng)可切換至應(yīng)急數(shù)據(jù)庫環(huán)境,確保關(guān)鍵業(yè)務(wù)的快速恢復(fù),將災(zāi)難影響降到最低。
物理環(huán)境監(jiān)控主要對(duì)數(shù)據(jù)容災(zāi)備份中心基礎(chǔ)設(shè)備運(yùn)行所需的環(huán)境因素進(jìn)行監(jiān)控,包括電源、空調(diào)、消防、門禁、溫濕度和視頻監(jiān)控等基礎(chǔ)設(shè)施。
其中,精密空調(diào)管理最為重要,合理的配置管理空調(diào)系統(tǒng)不僅可以保障機(jī)房環(huán)境的安全,還可以節(jié)省電費(fèi),舒適的溫度保障設(shè)備運(yùn)行狀態(tài)穩(wěn)定,延長設(shè)備運(yùn)行壽命。日常維護(hù)應(yīng)加強(qiáng)溫濕度的監(jiān)控,每六個(gè)月校準(zhǔn)一次溫度和相對(duì)濕度傳感器,避免溫濕度錯(cuò)誤監(jiān)測數(shù)據(jù)導(dǎo)致空調(diào)冷卻單元無法協(xié)同工作。
(1)備份類型
包括全備份和增量備份。①全備份:每次備份定義的所有數(shù)據(jù),優(yōu)點(diǎn)是恢復(fù)快,缺點(diǎn)是備份數(shù)據(jù)量大,需要較長時(shí)間。②增量備份:備份自上一次備份以來更新的所有數(shù)據(jù),其優(yōu)點(diǎn)是每次備份的數(shù)據(jù)量少,缺點(diǎn)是恢復(fù)時(shí)需要全備份及多份增量備份。
(2)備份內(nèi)容
數(shù)據(jù)備份的內(nèi)容包括數(shù)據(jù)庫備份和文件日志備份。數(shù)據(jù)庫備份作為重點(diǎn),每臺(tái)數(shù)據(jù)庫服務(wù)器單獨(dú)配專用的HBA光纖存儲(chǔ)卡,與磁帶庫和備份服務(wù)器共同組成備份系統(tǒng),從而大大提高備份系統(tǒng)的存取速度。備份可以采用D2D2T(Disk to Disk to Tape)方式,提高備份和恢復(fù)的性能和效率,減少備份與恢復(fù)的時(shí)間窗口。對(duì)大數(shù)據(jù)量應(yīng)用, 可以采取Server-Free方式,降低備份對(duì)整個(gè)系統(tǒng)的干擾。
(3)備份策略規(guī)劃
數(shù)據(jù)庫備份需要根據(jù)實(shí)際系統(tǒng)中備份數(shù)據(jù)量的大小和恢復(fù)的實(shí)時(shí)性要求,制定合理、有效的備份策略;文件備份則依據(jù)應(yīng)用系統(tǒng)的重要性來設(shè)定。根據(jù)業(yè)務(wù)應(yīng)用對(duì)于數(shù)據(jù)備份與恢復(fù)的要求,同時(shí)依據(jù)存儲(chǔ)空間大小,設(shè)定在線和離線備份的保存周期,具體備份策略如表1所示。
數(shù)據(jù)恢復(fù)在災(zāi)難發(fā)生后進(jìn)行,通過數(shù)據(jù)恢復(fù)可將數(shù)據(jù)或應(yīng)用系統(tǒng)還原到災(zāi)難發(fā)生前的狀態(tài)。日常工作中,應(yīng)定期安排和組織備份恢復(fù)和數(shù)據(jù)庫應(yīng)急環(huán)境演練,以確保運(yùn)維人員能夠熟練掌握備份恢復(fù)及數(shù)據(jù)庫應(yīng)急方案。
數(shù)據(jù)恢復(fù)基于數(shù)據(jù)備份來實(shí)現(xiàn),首先利用本地備份進(jìn)行數(shù)據(jù)恢復(fù),若本地備份失效,再基于遠(yuǎn)程備份進(jìn)行數(shù)據(jù)和系統(tǒng)恢復(fù)。與數(shù)據(jù)備份對(duì)應(yīng),包括數(shù)據(jù)庫恢復(fù)和文件恢復(fù),具體實(shí)現(xiàn)方法上,細(xì)分為在線冗余和離線冗余兩種方案,在線冗余主要針對(duì)本地化的數(shù)據(jù)恢復(fù),離線冗余則應(yīng)用與遠(yuǎn)程容災(zāi)恢復(fù)。

表1 江蘇省水利數(shù)據(jù)容災(zāi)備份策略表
(1)在線冗余方案
首先,通過高冗余提高本地?cái)?shù)據(jù)和文件存儲(chǔ)的可靠性:對(duì)于數(shù)據(jù)庫、重要配置文件及操作系統(tǒng),均采用本地磁盤鏡像、RAID10最高可靠性的存儲(chǔ)方案;對(duì)于統(tǒng)一存儲(chǔ)設(shè)備,每套均配置8塊以上HOTSPARE熱備盤,最大支持8塊硬盤同時(shí)損壞對(duì)業(yè)務(wù)無影響。其次,依托在線恢復(fù)系統(tǒng)實(shí)現(xiàn)自動(dòng)數(shù)據(jù)恢復(fù):當(dāng)出現(xiàn)單點(diǎn)故障,維護(hù)人員零干預(yù)或者少量干預(yù)之后,能自動(dòng)加入并啟動(dòng)恢復(fù)任務(wù)完成數(shù)據(jù)恢復(fù),確保系統(tǒng)安全穩(wěn)定、不間斷運(yùn)行。
(2)離線冗余方案
當(dāng)極端災(zāi)難情況發(fā)生時(shí),本地在線冗余和數(shù)據(jù)恢復(fù)方案失效后,對(duì)關(guān)鍵的數(shù)據(jù)和業(yè)務(wù)系統(tǒng),能夠根據(jù)遠(yuǎn)程數(shù)據(jù)備份完成基于時(shí)間點(diǎn)的選擇性恢復(fù),從而使得業(yè)務(wù)應(yīng)用能夠在允許的中斷時(shí)間內(nèi)恢復(fù)系統(tǒng)。
信息安全保障系統(tǒng)依據(jù)三級(jí)等級(jí)保護(hù)的建設(shè)要求,優(yōu)化調(diào)整網(wǎng)絡(luò)域劃分,部署防火墻、防毒墻、入侵檢測與防御系統(tǒng)、UTM、數(shù)據(jù)庫審計(jì)系統(tǒng)、漏洞掃描系統(tǒng)、安全服務(wù)器(堡壘機(jī))等安全設(shè)備,完善數(shù)據(jù)加解密、惡意代碼檢測、安全策略實(shí)施、漏洞掃描、入侵檢測、終端防護(hù)、用戶統(tǒng)一認(rèn)證授權(quán)、主機(jī)行為審計(jì)與監(jiān)控分析等信息安全保障防護(hù)模塊。日常工作中,應(yīng)加強(qiáng)安全日志、數(shù)據(jù)備份日志的監(jiān)控與分析,做好數(shù)據(jù)庫安全審計(jì),確保信息安全和數(shù)據(jù)備份的有效性。
本文介紹了江蘇水利數(shù)據(jù)容災(zāi)備份中心的系統(tǒng)組成,并從環(huán)境監(jiān)控、數(shù)據(jù)備份、數(shù)據(jù)恢復(fù)和安全保障等四個(gè)方面探討了水利數(shù)據(jù)容災(zāi)備份策略、恢復(fù)方案和日常運(yùn)維的要點(diǎn),其數(shù)據(jù)備份和恢復(fù)等機(jī)制可為水利行業(yè)相關(guān)數(shù)據(jù)的容災(zāi)備份提供借鑒。
隨著當(dāng)前水利數(shù)據(jù)中心建設(shè)的深入推進(jìn),對(duì)于數(shù)據(jù)中心以及容災(zāi)備份體系的運(yùn)維管理也變得越來越重要。面對(duì)日益加劇的運(yùn)維管理壓力,未來工作中仍需探索相關(guān)新技術(shù)產(chǎn)品的應(yīng)用,如引入新的數(shù)據(jù)中心基礎(chǔ)設(shè)施管理工具,可以實(shí)現(xiàn)跨IT基礎(chǔ)設(shè)施的全部系統(tǒng)實(shí)時(shí)監(jiān)控和管理,減輕復(fù)雜系統(tǒng)的運(yùn)維壓力,提高數(shù)據(jù)容災(zāi)備份中心的管理效能與服務(wù)能力■