摘要:在介紹災(zāi)難備份與恢復(fù)的基本概念的基礎(chǔ)上,分析了目前主要的災(zāi)難備份技術(shù)的優(yōu)缺點,存在的問題,解決的方案以及它們的應(yīng)用。并針對金融行業(yè)的特點,研究了其容災(zāi)備份技術(shù),根據(jù)不同金融業(yè)的特點,提出了選取容災(zāi)技術(shù)的幾種策略。
關(guān)鍵詞:容災(zāi)備份;容災(zāi)技術(shù);金融業(yè)
一、容災(zāi)備份的概念與內(nèi)涵
容災(zāi)備份是通過特定的容災(zāi)機制,在各種災(zāi)難損害發(fā)生后,仍然能夠最大限度的保障提供正常應(yīng)用服務(wù)的信息系統(tǒng)。容災(zāi)備份可以分為數(shù)據(jù)備份和應(yīng)用備份。
1.數(shù)據(jù)備份。數(shù)據(jù)備份是指為防止系統(tǒng)出現(xiàn)操作失誤或系統(tǒng)故障導(dǎo)致數(shù)據(jù)丟失,而將全系統(tǒng)或部分?jǐn)?shù)據(jù)集合從應(yīng)用主機的硬盤或陣列復(fù)制到其它的存儲介質(zhì)的過程。數(shù)據(jù)備份又分為在線備份和離線備份。在線備份就是對正在運行的數(shù)據(jù)庫或應(yīng)用進(jìn)行備份,通常對打開的數(shù)據(jù)庫和應(yīng)用是禁止備份的,因此要求數(shù)據(jù)存儲管理軟件能夠?qū)υ诰€的數(shù)據(jù)庫和應(yīng)用進(jìn)行備份。離線備份是指在數(shù)據(jù)庫關(guān)閉或應(yīng)用關(guān)閉后對其數(shù)據(jù)進(jìn)行備份,離線備份通常只采用全備份。
2.應(yīng)用備份。應(yīng)用備份是在數(shù)據(jù)備份的基礎(chǔ)上,在異地建立一套完整的、與本地生產(chǎn)系統(tǒng)相當(dāng)?shù)膫浞輵?yīng)用系統(tǒng)(可以是互為備份),在災(zāi)難情況下,遠(yuǎn)程系統(tǒng)迅速接管業(yè)務(wù)運行。
數(shù)據(jù)備份需要保證用戶數(shù)據(jù)的完整性、可靠性和一致性。而對于提供實時服務(wù)的信息系統(tǒng),用戶的服務(wù)請求在災(zāi)難中可能會中斷,應(yīng)用備份卻能提供不間斷的應(yīng)用服務(wù),讓客戶的服務(wù)請求能夠繼續(xù)運行,保證信息系統(tǒng)提供的服務(wù)完整、可靠、一致。
數(shù)據(jù)備份是容災(zāi)系統(tǒng)的基礎(chǔ),也是容災(zāi)系統(tǒng)能夠正常工作的保障,應(yīng)用備份則是容災(zāi)系統(tǒng)的建設(shè)目標(biāo),它必須建立在可靠的數(shù)據(jù)備份的基礎(chǔ)之上,通過應(yīng)用系統(tǒng)、網(wǎng)絡(luò)系統(tǒng)等各種資源之間的良好協(xié)調(diào)來實現(xiàn)。一個完整的容災(zāi)備份系統(tǒng)應(yīng)該包括本地數(shù)據(jù)備份、遠(yuǎn)程數(shù)據(jù)復(fù)制和異地備份中心。
由于金融行業(yè)的業(yè)務(wù)系統(tǒng)對實時性的要求非常高,因此容災(zāi)系統(tǒng)的要求也更高。金融機構(gòu)應(yīng)該根據(jù)自己的業(yè)務(wù)量、大集中的情況、容災(zāi)系統(tǒng)對業(yè)務(wù)系統(tǒng)的影響和投資效益進(jìn)行不同程度、不同進(jìn)度的數(shù)據(jù)災(zāi)難備份系統(tǒng)建設(shè)。
在實施數(shù)據(jù)集中工程的時候,系統(tǒng)的安全性是核心問題。為了保護(hù)數(shù)據(jù)安全和提高數(shù)據(jù)的持續(xù)可用性,數(shù)據(jù)集中系統(tǒng)需要從RAID保護(hù)、雙機熱備、部件冗余、數(shù)據(jù)備份、故障預(yù)警等多方面考慮,這些措施足以防范一般性風(fēng)險,但是對區(qū)域性、毀滅性災(zāi)難(恐怖主義襲擊、地震、火災(zāi)、水災(zāi)等)則不具備難恢復(fù)能力。對于數(shù)據(jù)集中后的銀行來說,一旦數(shù)據(jù)中心遭到災(zāi)難打擊,將引起銀行業(yè)務(wù)停頓、營業(yè)額損失、客戶流失,甚至引起社會的動蕩和法律糾紛,所以金融機構(gòu)應(yīng)意識到數(shù)據(jù)集中后災(zāi)難數(shù)據(jù)備份的重要性。
二、容災(zāi)備份方式分析
災(zāi)難備份系統(tǒng)一般由生產(chǎn)系統(tǒng)、可接替運行的后備系統(tǒng)、數(shù)據(jù)備份系統(tǒng)、備用通信線路等部分組成。在正常生產(chǎn)和數(shù)據(jù)備份狀態(tài)下,生產(chǎn)系統(tǒng)向備份系統(tǒng)傳送需備份的數(shù)據(jù)。災(zāi)難發(fā)生后,當(dāng)系統(tǒng)處于災(zāi)難恢復(fù)狀態(tài)時,備份系統(tǒng)將接替生產(chǎn)系統(tǒng)繼續(xù)運行。此時重要營業(yè)終端用戶將從生產(chǎn)主機切換到備份中心主機,繼續(xù)對外營業(yè)。根據(jù)所采用的數(shù)據(jù)備份技術(shù)與方式,有以下幾類容災(zāi)備份方式:
1.定期備份。定期備份就是按一定時間間隔將系統(tǒng)某一時刻的數(shù)據(jù)備份到磁帶等介質(zhì)上,及時傳遞到遠(yuǎn)離運行中心的安全地方保存起來。備份介質(zhì)的傳遞可以通過數(shù)據(jù)通信網(wǎng)絡(luò)進(jìn)行。不同的數(shù)據(jù)類型采取不同的備份頻率,如系統(tǒng)數(shù)據(jù)可以半年備份一次,基礎(chǔ)數(shù)據(jù)可一個月備份一次,業(yè)務(wù)數(shù)據(jù)每天備份一次。定期備份一般要制作至少兩套數(shù)據(jù)備份,一套用于運行中心的內(nèi)部恢復(fù),一套用于災(zāi)難恢復(fù),且要異地存放。
定期備份的主要優(yōu)點是投資少,現(xiàn)有操作系統(tǒng)和數(shù)據(jù)庫管理系統(tǒng)都提供了定期備份的工具。如果采取遠(yuǎn)程磁帶庫或數(shù)據(jù)通信方式傳送備份數(shù)據(jù)則要增加設(shè)備投資和通信費用。
2.定期備份+關(guān)鍵數(shù)據(jù)備份。在定期備份之外,還要將數(shù)據(jù)更新的日志或流水等關(guān)鍵數(shù)據(jù)及時地備份下來傳送到安全的地方,關(guān)鍵數(shù)據(jù)備份的頻率應(yīng)比定期備份的頻率更高。關(guān)鍵數(shù)據(jù)中包含了數(shù)據(jù)更新的全部操作,通過定期備份介質(zhì)和關(guān)鍵數(shù)據(jù)備份介質(zhì)可以將數(shù)據(jù)恢復(fù)到備份最后的關(guān)鍵數(shù)據(jù)時的狀態(tài)。關(guān)鍵數(shù)據(jù)的數(shù)據(jù)量相對較少,以數(shù)據(jù)通信方式傳送對帶寬的要求不高。
此種方案的主要優(yōu)點是投資較少,可利用現(xiàn)有的磁帶備份設(shè)備和數(shù)據(jù)庫管理系統(tǒng)工具。采取人工方式傳送定期備份介質(zhì)、數(shù)據(jù)通信方式傳送關(guān)鍵數(shù)據(jù)的方式。但是要重建后備運行系統(tǒng)的應(yīng)用環(huán)境,系統(tǒng)恢復(fù)時間仍然較長。仍然要依靠紙質(zhì)憑證或其他介質(zhì)來恢復(fù)孤立數(shù)據(jù)。如果傳送的是應(yīng)用系統(tǒng)的關(guān)鍵數(shù)據(jù),則關(guān)鍵數(shù)據(jù)的提取要充分,同時要仔細(xì)設(shè)計從關(guān)鍵數(shù)據(jù)恢復(fù)業(yè)務(wù)數(shù)據(jù)的應(yīng)用程序,否則恢復(fù)的數(shù)據(jù)可能失真,無法恢復(fù)全部的業(yè)務(wù)數(shù)據(jù)。
3.關(guān)鍵數(shù)據(jù)備份連續(xù)恢復(fù)。在恢復(fù)場地的磁盤上保存有運行系統(tǒng)數(shù)據(jù)的影像拷貝,數(shù)據(jù)更新的日志/流水等關(guān)鍵數(shù)據(jù)備份介質(zhì)收集在恢復(fù)場地,并通過恢復(fù)程序和工具及時追加到影像拷貝中,關(guān)鍵數(shù)據(jù)的傳輸一般采取數(shù)據(jù)通信方式。
此策略與定期備份+關(guān)鍵數(shù)據(jù)備份策略相比,不同之處在于后備運行中心已將數(shù)據(jù)恢復(fù)到最近的狀態(tài),數(shù)據(jù)的組織形式與運行系統(tǒng)相同,數(shù)據(jù)備份系統(tǒng)與后備運行系統(tǒng)可以是同一臺主機也可以是同一場地的不同主機。在實際應(yīng)用時,數(shù)據(jù)的初始影像拷貝可以較前述兩種策略比較長的時間間隔進(jìn)行,然后采用日志/流水備份追加。一般來說,由于保持備份數(shù)據(jù)的組織結(jié)構(gòu)與運行系統(tǒng)的數(shù)據(jù)一致較困難,數(shù)據(jù)庫日志備份方式較易實現(xiàn),而應(yīng)用系統(tǒng)業(yè)務(wù)流水方式并不現(xiàn)實。此策略投資較大,需要數(shù)據(jù)備份主機或后備運行主機以及磁盤設(shè)備,如果采用數(shù)據(jù)通信方式傳關(guān)鍵數(shù)據(jù),還要有通信費支出。
4.實時備份異步更新。將數(shù)據(jù)更新操作日志記錄在運行系統(tǒng)日志的同時通過數(shù)據(jù)通信線路傳送到備份系統(tǒng),并立即對備份系統(tǒng)的數(shù)據(jù)影像拷貝進(jìn)行更新。備份系統(tǒng)的數(shù)據(jù)更新與運行系統(tǒng)的數(shù)據(jù)更新是異步的,對運行系統(tǒng)的性能及交易響應(yīng)時間沒有什么影響。采用的技術(shù)一般有遠(yuǎn)程磁盤鏡像異步方式、遠(yuǎn)程數(shù)據(jù)庫復(fù)制異步方式、網(wǎng)絡(luò)數(shù)據(jù)鏡像異步方式等。
由于數(shù)據(jù)更新操作被及時追加到備份系統(tǒng),因而,孤立數(shù)據(jù)很少,另外備份數(shù)據(jù)的組織結(jié)構(gòu)與運行系統(tǒng)相同,所以災(zāi)難發(fā)生后的恢復(fù)時間很短,主要是追補孤立數(shù)據(jù)和網(wǎng)絡(luò)切換的時間。異步方式傳輸一般要采用較高速的數(shù)據(jù)通信線路,備份系統(tǒng)與運行系統(tǒng)之間的距離幾乎沒有限制,不過通信費用會很高。此策略的投資比前面幾種方式都高,運行管理也更復(fù)雜。
5.網(wǎng)絡(luò)數(shù)據(jù)鏡像。對生產(chǎn)系統(tǒng)的數(shù)據(jù)庫數(shù)據(jù)和所需跟蹤的重要目標(biāo)文件的更新進(jìn)行監(jiān)控與跟蹤,并將更新日志實時通過網(wǎng)絡(luò)傳送到備份系統(tǒng),備份系統(tǒng)則根據(jù)日志對磁盤進(jìn)行更新,以保證生產(chǎn)系統(tǒng)與備份系統(tǒng)數(shù)據(jù)同步?,F(xiàn)在用得較多的是虛擬私有網(wǎng)絡(luò)備份(Lan-free)。它是SAN內(nèi)部的一種備份方式,服務(wù)器和存儲設(shè)備之間是一種多對多的關(guān)系。一個服務(wù)器可以把數(shù)據(jù)備份到多個存儲設(shè)備上,多個服務(wù)器也可以把數(shù)據(jù)備份到一個存儲設(shè)備上,存儲設(shè)備之間也可以進(jìn)行備份,所以稱這種備份系統(tǒng)為Lan-free備份。
備份的數(shù)據(jù)是以塊的形式通過SAN傳輸,在局域網(wǎng)內(nèi)只進(jìn)行控制信息的通信,大大地降低了局域網(wǎng)的負(fù)載并提高了備份的速度。然而,備份的數(shù)據(jù)需要從磁盤陣列經(jīng)過備份服務(wù)器到備份設(shè)備,進(jìn)行兩次拷貝操作,這不僅浪費了SAN的帶寬,而且加重了備份服務(wù)器的負(fù)擔(dān)。這樣,備份服務(wù)器性能直接影響了備份的速度,特別是多個備份進(jìn)程同時運行時這個情況會更加突出。另外,各個廠商的設(shè)備缺少統(tǒng)一的標(biāo)準(zhǔn),也影響了Lan-free備份。為了解決這個問題,可以通過硬件的方法和采用具有共享能力的存儲備份軟件。
6.遠(yuǎn)程鏡像磁盤。通過高速光纖通道線路和磁盤控制技術(shù)將鏡像磁盤延伸到遠(yuǎn)離生產(chǎn)機的的地方,鏡像磁盤數(shù)據(jù)與主磁盤數(shù)據(jù)完全一致,更新方式為同步或異步。一旦生產(chǎn)磁盤或主磁盤出現(xiàn)故障,備份機可接替生產(chǎn)機運行,快速恢復(fù)終端用戶服務(wù)。磁盤鏡像可備份所有類型的數(shù)據(jù)。遠(yuǎn)程鏡像技術(shù)早已被用在遠(yuǎn)程容災(zāi)和業(yè)務(wù)持續(xù),它可為兩地點間的重要信息傳輸提供豐富的存儲空間。
7.實時備份同步更新。數(shù)據(jù)更新操作同時在運行系統(tǒng)和備份系統(tǒng)中進(jìn)行,運行系統(tǒng)的數(shù)據(jù)更新操作既寫入本地磁盤,又通過高速數(shù)據(jù)通信線路傳到備份系統(tǒng)的磁盤,運行系統(tǒng)在沒有收到備份系統(tǒng)完成數(shù)據(jù)更新操作的確認(rèn)之前,不返回數(shù)據(jù)更新完成的響應(yīng)。此方案的后備運行系統(tǒng)處于熱備份狀態(tài),因此災(zāi)難發(fā)生后的恢復(fù)時間極短,主要是網(wǎng)絡(luò)切換的時間。采用的技術(shù)一般有遠(yuǎn)程磁盤鏡像同步方式、遠(yuǎn)程數(shù)據(jù)庫制同步方式和網(wǎng)絡(luò)鏡像同步方式等。
由于此方式需要高速通信線路,在目前技術(shù)條件下只限于同城范圍,而且通信費用很高。此策略投資和運行費用最高。
三、金融機構(gòu)容災(zāi)備份策略
以上分析的容災(zāi)備份方式各有其優(yōu)勢及局限性,在實際應(yīng)用中,具體選用哪種或哪幾種方式,則應(yīng)針以系統(tǒng)中不同的數(shù)據(jù)類型選擇不同的容災(zāi)備份策略,往往是要將幾種備份策略結(jié)合起來使用。在實施過程中應(yīng)重點注意的是備份數(shù)據(jù)的完整性,對系統(tǒng)數(shù)據(jù)、基礎(chǔ)應(yīng)用數(shù)據(jù)、數(shù)據(jù)庫數(shù)據(jù)和非數(shù)據(jù)庫數(shù)據(jù)等都要有相應(yīng)的備份。
金融機構(gòu)在建立容災(zāi)系統(tǒng)之前,首先要進(jìn)行全面的系統(tǒng)分析,包括業(yè)務(wù)系統(tǒng)風(fēng)險分析、容災(zāi)系統(tǒng)對業(yè)務(wù)系統(tǒng)的影響分析和投資效益分析。從經(jīng)濟(jì)角度考慮,最佳的容災(zāi)解決方案不一定是性能最好的容災(zāi)解決方案,容災(zāi)系統(tǒng)的總體投入TCO和投資回報ROI,也是十分重要的參考指標(biāo)。TCO包括建立系統(tǒng)、維護(hù)系統(tǒng)和擴(kuò)充系統(tǒng)的總投入。由于容災(zāi)系統(tǒng)的啟用概率很低,新技術(shù)的發(fā)展和新產(chǎn)品的性價比的提高,必定造成容災(zāi)設(shè)備的貶值,TCO越高,ROI越低。因此,需要對總體投入成本TCO和投資回報率ROI進(jìn)行認(rèn)真的分析和計算,從業(yè)務(wù)系統(tǒng)發(fā)展的角度考慮容災(zāi)系統(tǒng)投資的合理性。首先,要考慮準(zhǔn)備建設(shè)的容災(zāi)系統(tǒng)與正在運行的業(yè)務(wù)系統(tǒng)的延續(xù)性,保護(hù)前期投資,應(yīng)該盡量避免對原有業(yè)務(wù)系統(tǒng)進(jìn)行大規(guī)模改造。其次,要考慮業(yè)務(wù)系統(tǒng)擴(kuò)展對容災(zāi)系統(tǒng)的影響,特別是存儲容量增加和通信線路負(fù)荷的影響。再次,還要考慮系統(tǒng)維護(hù)管理成本和使用通信線路的費用。
就金融行業(yè)來說,災(zāi)難備份的目標(biāo)是很明確的,那就是:一旦遭遇災(zāi)難事故,數(shù)據(jù)和應(yīng)用可以在遠(yuǎn)程備份地點盡快得到恢復(fù)。要達(dá)到這個目標(biāo),一定要考慮三個要素:(1)備份地點準(zhǔn)備就緒;(2)數(shù)據(jù)在備份地點準(zhǔn)備就緒;(3)兩個不同地點之間的數(shù)據(jù)如何傳送。
金融機構(gòu)應(yīng)該根據(jù)自己的業(yè)務(wù)量、大集中的情況、容災(zāi)系統(tǒng)對業(yè)務(wù)系統(tǒng)的影響和投資效益進(jìn)行不同程度、不同進(jìn)度的數(shù)據(jù)災(zāi)難備份系統(tǒng)建設(shè)。對于數(shù)據(jù)容災(zāi)要求較低的金融機構(gòu),比如保險行業(yè),社會保障系統(tǒng)等,對提供數(shù)據(jù)服務(wù)的間斷性要求較低,數(shù)據(jù)備份窗口較大,對數(shù)據(jù)備份設(shè)備的速度要求不是很高。因此,可以采用傳統(tǒng)的數(shù)據(jù)冷備份方式,同時采用雙機熱備、磁盤鏡像或容錯、備份磁帶異地存放、關(guān)鍵部件冗余等多種災(zāi)難預(yù)防措施。在數(shù)據(jù)量比較大的分行也可以考慮采購自動加載機進(jìn)行準(zhǔn)自動化的磁帶管理。對于數(shù)據(jù)容災(zāi)要求較高的金融機構(gòu),比如銀行、證券數(shù)據(jù)中心,要考慮采用更高層次的備份,即NAS數(shù)據(jù)備份方案,因為NAS價格合理、便于管理、靈活且能實現(xiàn)文件共享,備份軟件可以采用CA、EMC/Legato等廠商提供的NAS網(wǎng)絡(luò)存儲備份軟件。該方案數(shù)據(jù)量達(dá)到TB級、完全無停機備份、可靈活恢復(fù)數(shù)據(jù)又不占用業(yè)務(wù)應(yīng)用網(wǎng)絡(luò)帶寬。對于總行或數(shù)據(jù)中心等對性能和可靠性要求較高的場合,可以采用先進(jìn)的SAN數(shù)據(jù)存儲網(wǎng)絡(luò),使數(shù)據(jù)的存儲、備份等活動獨立于原先的LAN之外,從而減輕LAN的負(fù)載,保證原有網(wǎng)絡(luò)應(yīng)用的順暢進(jìn)行,同時SAN網(wǎng)可以得到高數(shù)據(jù)傳輸率。通過快照、遠(yuǎn)程數(shù)據(jù)復(fù)制等技術(shù)將數(shù)據(jù)實時傳輸?shù)疆惖剡M(jìn)行備份,并在異地建立熱備份站點,使系統(tǒng)在災(zāi)難發(fā)生后能夠自動切換。備份軟件可以采用CA、EMC/Legato等廠商提供的SAN網(wǎng)絡(luò)存儲備份軟件和遠(yuǎn)程容災(zāi)軟件。在SAN中,數(shù)據(jù)以集中的方式進(jìn)行存儲,加強了數(shù)據(jù)的可管理性,同時適用于多操作系統(tǒng)下的數(shù)據(jù)共享同一存儲池,降低了總成本。
容災(zāi)涉及到眾多技術(shù)以及眾多廠商的各類解決方案。性能及價格都是必須考慮的因素,服務(wù)商的資金實力、市場運作能力、技術(shù)手段、行業(yè)背景、運營管理能力、災(zāi)難備份服務(wù)體系和方法論等企業(yè)綜合實力也是考量的重要依據(jù)。金融系統(tǒng)的用戶應(yīng)該根據(jù)自己的實際情況選擇適合自己的數(shù)據(jù)災(zāi)難備份系統(tǒng)建設(shè)方案。
四、結(jié)論
金融行業(yè)進(jìn)行災(zāi)難備份系統(tǒng)建設(shè)是大勢所趨,電子信息化系統(tǒng)的安全穩(wěn)定運行已成為金融機構(gòu)在市場競爭中的生存基礎(chǔ),其抵抗風(fēng)險的能力將成為衡量銀行競爭力的重要因素之一。所以,在構(gòu)建了先進(jìn)的容災(zāi)系統(tǒng)后,還需要經(jīng)常對現(xiàn)行容災(zāi)方案進(jìn)行評估和實地演練。此外,考慮到災(zāi)難恢復(fù)計劃涉及到業(yè)務(wù)風(fēng)險分析、方案的選擇、實施、測試、培訓(xùn)、演習(xí)等內(nèi)容是一項既繁鎖且復(fù)雜的工作。也可以采用外包方式將災(zāi)難恢復(fù)計劃交給專業(yè)計算機公司來完成,金融企業(yè)則可專心從事業(yè)務(wù)經(jīng)營。
參考文獻(xiàn):
[1]李君.區(qū)分熱備份、數(shù)據(jù)備份與數(shù)據(jù)管理[N].中國計算機報,2001,11.
[2]Bill Mansfield. LAN/ Server Free Backup Experiences[ R]. Solution Technology Inc., 2002.
[3]韓德志,謝長生,李懷陽.存儲備份技術(shù)探析.計算機應(yīng)用研究,2004,(6):1-7.
[4]范寧.銀行數(shù)據(jù)備份及容災(zāi)技術(shù)探討.華南金融電腦,2006,(2):68-71.
(作者單位:湖南大學(xué)工商管理學(xué)院)