朱潤娟,魏能強,肖菊香
(航空工業(yè)成飛,四川 成都 610091)
數(shù)據(jù)備份是指為了防止系統(tǒng)故障或人為操作失誤等因素造成生產(chǎn)數(shù)據(jù)的丟失或損壞,影響公司科研生產(chǎn)正常運行的事件發(fā)生,而將生產(chǎn)的文件系統(tǒng)或數(shù)據(jù)庫數(shù)據(jù)從應(yīng)用主機的硬盤或磁盤陣列備份到專用備份存儲介質(zhì)的過程,是對備份數(shù)據(jù)進行有效管理的一系列工作。
人工備份比較簡單,一般通過數(shù)據(jù)庫或者系統(tǒng)自帶的命令來實現(xiàn),簡單的幾條腳本語句就能完成相關(guān)數(shù)據(jù)的備份工作,備份數(shù)據(jù)存放于本地,適合規(guī)模較小的生產(chǎn)環(huán)境。但是,當(dāng)備份需求的規(guī)模或是數(shù)據(jù)量達到一定程度時,對于數(shù)據(jù)備份的基本管理就有了更進一步的要求,部署簡單的幾個備份腳本已遠遠無法滿足管理的需求,這就需要通過專業(yè)的備份軟件及備份設(shè)備對數(shù)據(jù)進行統(tǒng)一的管理。
為了滿足種類繁多、數(shù)據(jù)量大,數(shù)據(jù)保護要求高的備份需求,企業(yè)通常會采用集中、統(tǒng)一管理的備份系統(tǒng)對數(shù)據(jù)進行自動化備份,即在專用的服務(wù)器和存儲設(shè)備上部署專業(yè)的備份軟件,同時,在需要進行數(shù)據(jù)備份的各類平臺上部署備份客戶端對數(shù)據(jù)庫或文件系統(tǒng)進行自動化備份,由備份系統(tǒng)負責(zé)調(diào)度備份任務(wù)的執(zhí)行及備份數(shù)據(jù)介質(zhì)的管理等。
兩種備份方式相對而言,人工備份成本較低,容易實現(xiàn),但其備份效率較低,數(shù)據(jù)保護的時效性較差,無法滿足數(shù)據(jù)量較大且對數(shù)據(jù)保護要求較高的場景。而通過備份系統(tǒng)進行數(shù)據(jù)備份的方式雖然成本較高,且對備份人員的技術(shù)水平要求較高,但其系統(tǒng)穩(wěn)定性好、備份效率高、數(shù)據(jù)保護性好,符合各類場景的數(shù)據(jù)保護需求,成為目前主流的數(shù)據(jù)備份方式。
數(shù)據(jù)中心包含一個企業(yè)幾乎所有的信息系統(tǒng),但并不是所有的數(shù)據(jù)都要進行備份,要區(qū)分清楚哪些數(shù)據(jù)需要備份。
首先,與科研生產(chǎn)密切相關(guān),數(shù)據(jù)一旦丟失,將影響科研生產(chǎn)正常運行的數(shù)據(jù),如操作系統(tǒng)數(shù)據(jù)、數(shù)據(jù)庫數(shù)據(jù)、文件系統(tǒng)數(shù)據(jù)等。其次,信息系統(tǒng)原始的配置參數(shù)信息,如果信息系統(tǒng)崩潰,關(guān)鍵時候用來進行系統(tǒng)恢復(fù)的數(shù)據(jù),如原始安裝文件、配置參數(shù)等。
此外,備份系統(tǒng)本身的配置信息、調(diào)度信息和介質(zhì)信息,這些數(shù)據(jù)關(guān)系到備份作業(yè)的運行狀態(tài),一旦備份系統(tǒng)出現(xiàn)故障,可通過這些數(shù)據(jù)進行分析和恢復(fù),如備份系統(tǒng)日志文件等。
一般包括備份頻率和備份時間窗口,備份頻率是指多長時間進行一次數(shù)據(jù)備份作業(yè),一般根據(jù)備份內(nèi)容的重要程度,分為日備份、周備份、月備份和年備份,并根據(jù)備份內(nèi)容的類型和數(shù)據(jù)量大小采用不同的備份方式及數(shù)據(jù)保存期限。通常采用幾種備份頻率相結(jié)合的方式進行數(shù)據(jù)備份,提高了備份數(shù)據(jù)的有效性和安全性。
備份時間窗口一般指的是數(shù)據(jù)備份時間段,配置備份策略時,首先,要考慮什么時候執(zhí)行備份操作,因為在數(shù)據(jù)備份過程中,會產(chǎn)生大量的讀寫操作,從而占用部分I/O資源,因此通常會選擇在非業(yè)務(wù)時間或者業(yè)務(wù)不繁忙的時候進行數(shù)據(jù)備份,避免對正常生產(chǎn)業(yè)務(wù)造成影響。
備份角色一般包括備份系統(tǒng)管理人員、應(yīng)用系統(tǒng)管理人員和數(shù)據(jù)庫管理人員,其中,應(yīng)用系統(tǒng)管理人員負責(zé)提出數(shù)據(jù)備份的需求申請,包括備份內(nèi)容、備份啟動窗口及備份數(shù)據(jù)保留期限等,同時,配合備份系統(tǒng)管理人員分析處理備份異常問題。
數(shù)據(jù)庫管理人員負責(zé)提供數(shù)據(jù)庫備份腳本,通過備份系統(tǒng)調(diào)用實現(xiàn)數(shù)據(jù)備份,同時配合備份系統(tǒng)管理人員分析處理數(shù)據(jù)庫備份異常問題。備份系統(tǒng)管理人員根據(jù)已溝通確認的備份需求,結(jié)合實際備份資源情況,制定備份策略,包括備份啟動窗口、備份頻率、備份級別等,同時,負責(zé)監(jiān)控備份任務(wù)日常運行情況,對備份異常情況進行處理,必要時,需要聯(lián)合應(yīng)用系統(tǒng)管理人員和數(shù)據(jù)庫管理人員一起進行故障處理。
最后,應(yīng)用系統(tǒng)管理員、數(shù)據(jù)庫管理員和備份系統(tǒng)管理員需要相互配合制定恢復(fù)方案,對備份數(shù)據(jù)進行恢復(fù)測試,校驗備份數(shù)據(jù)的有效性,包括恢復(fù)對象、恢復(fù)方式、恢復(fù)時間點等,由備份系統(tǒng)管理員負責(zé)執(zhí)行數(shù)據(jù)從備份存儲到應(yīng)用存儲的恢復(fù)操作,由系統(tǒng)管理員或數(shù)據(jù)庫管理員執(zhí)行備份數(shù)據(jù)到應(yīng)用系統(tǒng)的恢復(fù)操作。
掌握了以上基本信息,接下來應(yīng)該考慮如何進行備份操作。數(shù)據(jù)備份的意義在于當(dāng)意外發(fā)生時,如何通過數(shù)據(jù)備份規(guī)避數(shù)據(jù)丟失,保障生產(chǎn)業(yè)務(wù)連續(xù)性。
首先,要明確備份對象,即需要備份的是數(shù)據(jù)庫還是文件;其次,需確認備份頻率,即多久備份一次,備份級別是全備還是增量;然后,確定備份時間窗口,即什么時候開始備份,大致什么時候可以完成備份;最后,確定備份數(shù)據(jù)的保留期限,即備份介質(zhì)保存多久后可以回收再利用。
在確認了以上幾點后,就可以有針對性地配置相關(guān)的配置參數(shù)進行備份。制定備份策略有以下思路。
(1)當(dāng)生產(chǎn)系統(tǒng)對數(shù)據(jù)丟失的容忍度較低,即RPO值盡量小時,一般可通過提高備份頻率來實現(xiàn)。例如,Oracle數(shù)據(jù)庫的在線備份可以適當(dāng)提高歸檔日志備份頻率。(2)當(dāng)生產(chǎn)系統(tǒng)對恢復(fù)時間的容忍度較低,即RTO值盡量短時,一般有兩種解決方案,一是提高恢復(fù)的速度,比如,可通過SAN網(wǎng)絡(luò)傳輸備份速度來提高恢復(fù)速度;二是減少恢復(fù)的數(shù)據(jù)量,比如,可以每次進行全備,在恢復(fù)時可直接恢復(fù)全備即可,而無須再進行全備加增量的恢復(fù)步驟,省去了增量數(shù)據(jù)的恢復(fù)時間。(3)當(dāng)備份數(shù)據(jù)的保留時間較長時,需要考慮備份介質(zhì)的壽命,設(shè)置合適的備份保留時間,在介質(zhì)壽命到期前進行介質(zhì)轉(zhuǎn)換儲存。(4)當(dāng)需要備份的時間窗口盡可能短時,可以選擇在業(yè)務(wù)空閑時間進行備份,同時,可以通過源端去重技術(shù)和全備結(jié)合增量備份的方式減少備份數(shù)據(jù)量,從而縮短備份時間。
總之,備份策略的制定需要具體情況具體分析,針對不同的備份需求進行綜合考慮,根據(jù)實際情況來制定最合適的備份策略,再按照備份策略及備份軟件的操作手冊進行相應(yīng)的部署實施工作。
為了避免備份數(shù)據(jù)在需要時找不到相應(yīng)的數(shù)據(jù)或者備份數(shù)據(jù)損壞無法恢復(fù),我們需要妥善保存?zhèn)浞輸?shù)據(jù)。備份數(shù)據(jù)存放在備份介質(zhì)上,備份介質(zhì)通常是磁盤和磁帶。備份介質(zhì)應(yīng)進行專人管理,建立備份檔案,對備份介質(zhì)存放與提取進行嚴格管理,實行審批并登記;選擇適合備份介質(zhì)保存的環(huán)境,包括溫度、濕度和磁場三方面,存放溫度建議控制在5~40℃,濕度控制在20%~80%RH,同時避免磁場干擾;根據(jù)磁帶使用情況定期進行轉(zhuǎn)儲,通常磁帶壽命一般為5~10年,讀寫次數(shù)不超過2000次,對于長期保存的磁帶,需要定期進行轉(zhuǎn)儲,防止備份數(shù)據(jù)過期失效。
數(shù)據(jù)備份的最終目的就是在需要數(shù)據(jù)恢復(fù)時,能夠及時地將數(shù)據(jù)恢復(fù)出來。為了驗證備份數(shù)據(jù)的可恢復(fù)性,需要在平時做好數(shù)據(jù)的恢復(fù)演練,做好測試驗證,確保在關(guān)鍵時刻體現(xiàn)出備份數(shù)據(jù)的意義和價值。
備份系統(tǒng)管理員應(yīng)該每天對備份系統(tǒng)的運行狀態(tài)進行監(jiān)控,查看備份系統(tǒng)整體運行是否正常,備份任務(wù)是否按計劃成功完成,如發(fā)現(xiàn)異常,則需進一步查看相關(guān)的日志信息,及時處理備份故障,確保備份數(shù)據(jù)的時有效。
一般按照監(jiān)控對象的不同分為備份硬件監(jiān)控和備份軟件監(jiān)控。
硬件監(jiān)控:機房實地巡查設(shè)備是否有指示燈告警,或者遠程登錄設(shè)備查看硬件狀態(tài),確認硬件正常運行。
軟件監(jiān)控:登錄備份軟件查看備份任務(wù)、備份存儲和備份磁帶庫的運行情況,若有備份失敗,通過報錯日志分析原因并及時處理,必要時,請應(yīng)用系統(tǒng)管理人員和數(shù)據(jù)庫管理人員共同協(xié)調(diào)解決備份故障。
目前,現(xiàn)有的備份技術(shù)和備份手段越來越成熟,已形成一套完善的數(shù)據(jù)保護體系。但大多數(shù)軟硬件產(chǎn)品依然采用國外品牌,未完全實現(xiàn)國產(chǎn)自主產(chǎn)權(quán),國產(chǎn)化備份軟件及備份設(shè)備品牌較少,數(shù)據(jù)備份應(yīng)緊跟軟硬件產(chǎn)品的國產(chǎn)化替代步伐,在信息技術(shù)國產(chǎn)化的過程中,及時做好數(shù)據(jù)保護工作,為科研生產(chǎn)的正常運行保駕護航。