林偉勝,許卓偉
(廣東電網有限責任公司汕頭供電局,廣東汕頭 515000)
在現今的大數據時代,數據是一個企業最寶貴的資源。但是數據安全問題卻難以得到保證,軟件自身缺陷、人為操作失誤、電腦病毒破壞、硬件損毀、黑客攻擊、自然災難等諸多不確定因素都有可能造成計算機中數據的丟失的原因。因此,各個行業領域對數據的保護尤為關心[1-6]。
汕頭供電局經過多年的建設形成多套主營業務系統、有幾十臺套的服務器主機、需要備份的數據有操作系統、數據庫、中間件、郵件數據、虛擬機等各類數據,數據分布在不同類型的設備上,有小型機、微機服務器。隨著系統的建設復雜化和數據量增多,數據的安全對于企業的運轉也越來越顯得重要,對數據備份系統的架構設計和管理提出了復雜的要求。
汕頭供電局隨著信息系統逐步完善,業務數據量成倍增加,應用數據的存儲變得越來越重要,整個企業信息化建設對存儲系統有更高的建設需求,對數據中心可靠性要求也日漸提高,備份需求隨之突顯出來,需要應對數據丟失、誤操作、存儲損壞、自然災害等造成重要數據損壞時的恢復問題。
備份系統需要解決的難題主要有以下幾點[7]。
(1)備份節點多,要連接備份的服務器節點數量眾多,涉及的有幾十臺套的多類型服務器主機。
(2)備份數據量大,類型多。例如主營業務系統要保留多個用于追溯恢復的版本,頻率高。類型覆蓋了IBM小型機操作系統備份、數據庫、中間件、虛擬化服務器數據等。
(3)要求備份任務管理自動化并合理地安排調度策略,設備高效利用,要求快速備份,必要時能夠短時間恢復到指定設備;需要對核心系統的數據提供遠程保護數據,提供系統容災數據備份、異地災備恢復環境[8]。
解決這些問題急需要設計軟件兼容性好、硬件擴展性強的備份系統解決方案,合理的備份方式與策略等等,將零散的備份資源集中,節約資源,提高管理效率。
備份系統的建設從軟件建設方面、硬件方面,還有備份管理配置方面進行考慮。
軟件平臺方面由于供電局已建設的應用系統有多品牌的基礎環境,備份軟件在客戶端要兼容已有的Windows、Linux、AIX、HP-UX,OS/400等操作系統,在數據庫方面考慮兼容Oracle、SQLserver等數據庫系統。核心備份系統選用了IBM的TSM備份軟件,它具有高性能,靈活高效的解決方案。
硬件方面的設計,使用的設備兼容已建設的IP網絡與存儲網絡環境,數據備份盡量不影響業務系統,重要系統使用了LANfree的備份方式。在數據備份存儲這塊使用高效率硬件,VTL虛擬磁帶庫作為數據備份的一級存儲池,而慢速的磁帶庫設備作為二級存儲池,在有限資源條件下發揮前者速度快、后者容量大、經濟的優點。
備份的策略方面,統一進行策略規劃和調度規劃,根據不同業務系統的使用高峰期、數據備份量和時長,錯開各策略的啟動時間,盡量將業務分散在全天各系統空閑的時候。比如營銷系統晚上的實時訪問量不大,備份策略即安排在該時間段執行,而計量系統前置數據庫在白天有空閑時間段,則在該時間段安排日志備份,另外也要考慮一二級數據備份池的遷移調度,設置合理的磁帶回收水位線,及時回收資源。
部署后的系統拓樸結構如圖1所示。
IDC機房內的服務器通過備份系統管理,業務系統服務器使用LANfree方式實現快速備份與恢復,備份數據存儲使用了VTL虛擬磁帶庫技術,另外核心系統還直接通過存儲復制技術在遠程數據備份機房實現容災備份。
IBM TSM(Tivoli Storage Manager)數據備份系統,是企業級跨平臺網絡備份、恢復及存儲管理軟件。TSM客戶端軟件負責向TSM服務器提供需要備份的數據,或向TSM服務器索取已備份數據及歸檔數據以便恢復數據。TSM服務器負責管理備份數據、備份策略及管理連接在其上的存儲系統。
小型機操作系統備份,IBM小型機操作系統備份和恢復可以通過網絡來進行,由于主營業務系統基本都是安裝AIX系統的IBM小型機,即可以通過其NIM功能進行操作系統的備份,由一臺IBM工作站定期將各小型機的操作系統做mksysb鏡象集中存放,再使用備份客戶端進行壓縮備份。實現操作系統的定期備份,系統的恢復也實現集中管理。
VTL(Virtual Tape Library),虛擬磁帶庫技術仿真物理磁帶庫的驅動器并且在磁盤上存儲備份映像。VTL支持使用現有的磁帶備份軟件識別為磁帶庫類型并進行連接操作,管理方便。虛擬磁帶庫使用物理磁盤驅動器,它的讀寫速度比磁帶庫快得多,同時還具有數據壓縮功能。虛擬磁帶庫上的數據可以快速恢復到系統中,因此選用其作為備份系統的一級存儲池,超過一定水位數據再遷移到二級池,即磁帶庫中。

圖1 數據備份架構拓樸
LANfree備份是指通過光纖通道備份,通常的備份可以通過IP網絡進行備份數據傳送,這樣在業務高峰的時候有可能會影響系統性能,而TSM備份系統允許使用SAN網絡進行調度備份,即客戶端通過其本機的存儲光纖接口直接向備份設備復制數據,由于光纖存儲接口速度高,而且備份數據不再經由備份系統主機轉存到帶庫,所以LANfree備份效率更高,供電局各主營業務系統備份采用光纖存儲網絡備份,部分沒有光纖存儲接口的系統采取LAN網絡備份方式。
其他備份設置方面,核心業務系統的Oracle數據庫均開啟日志歸檔模式,即對數據庫的每筆變更都在存儲在日志中,通過執行RMAN工具經由數據庫客戶端轉存,且多套數據庫的備份與恢復管理集中使用同一個備份管理Catalog數據庫。另外,還通過虛擬化服務器平臺的TSM備份組件,實現了服務器虛擬機的整機備份。對于營銷系統,還使用了存儲級別的數據鏡像,如在IBM DS5100存儲系統啟用了遠程異步數據復制ERM(Enhanced Remote Mirror)功能,將多個主營業務系統數據遠程實時地復制到20 km外的數據備份機房,一旦發生災害事件,企業的核心數據將得以保全。
汕頭供電局備份系統每天要應對近40個客戶端節點,發起近30個大數據量的備份任務,每天接近1.5 T的數據備份,備份存儲的數據總量近45 T。由于使用了LANfree技術,性能較在LAN環境下速度提高多倍,比如電力營銷系統的異機恢復,從IBMp570小型機數據庫備份出來的數據全庫恢復到另外的p570小型機上,近1.2 T整數據庫數據網絡恢復需要近20個小時,而LANfree的恢復只需要5個小時。而使用ERM的數據遠程復制,也解決了數據容災備份的問題,異地災備系統的快速啟用3個小時內就可以完成。
數據備份系統的建設不僅僅需只是軟硬件設備的構建,對數據系統的管理也十分重要。因此制定科學、系統和合理的管理方法以及備份策略對備份系統實現備份功能,恢復數據有著重要的意義。
(1)統一策略規劃與日常檢查
系統管理人員應從數據量的大小,數據的重要性和恢復的角度考慮,結合實際資源使用狀況,制訂數據分組備份策略和存儲介質池對應策略,任務應錯開業務高峰,并定期開展策略清理和資源調整,定期開展運行狀態檢查,保證備份系統高效穩定運行。
(2)定期開展數據恢復與系統災備演練
數據備份都是為發生系統災難做準備的,備份系統架構的優劣不僅在于它的備份速度,更重要的是通過數據恢復測試備份系統里面的數據的有效性。汕頭局定期開展主營業務系統數據恢復和啟用備用應用系統進行測試,檢驗數據備份是否安全可靠,另外也定期開展遠程災備數據的恢復演練,模擬核心業務系統硬件整體損壞情況下的災備數據的啟用,通過實踐驗證災備數據的有效性。
汕頭供電局數據備份架構基于統一的存儲區域網絡,采用當前流行的備份軟硬件平臺,集成多品牌存儲產品,覆蓋從操作系統到數據庫的各類型數據備份,利用存儲設備鏡像技術實現了遠程的數據備份,實現了高效且安全的數據備份系統架構,簡化管理。同時通過加強維護管理,定期開展數據恢復以驗證系統有障性,從而保障了企業信息系統的數據安全。
[1]于洋.計算機數據存儲備份探討[J].制造業自動化,2011(16):134-136.
[2]李偉.基于SAN架構的數據存儲和備份系統[J].電腦知識與技術,2010,6(20):5406-5407.
[3]呂廣平.計算機磁盤陣列及異地容災備份系統分析[J].科技傳播,2012(7):161-162.
[4]王帆飛.國土資源空間數據存儲備份系統的設計與實現[J].計算機與現代化,2012(3):190-193.
[5]呂小婷,施艷,張振芳.存儲局域網(SAN)在地質調查數據存儲中的應用[J].地質通報,2012(9):1531-1536.
[6]申新鵬,曾雷杰,趙曉.磁盤陣列上虛擬磁盤的管理[J].現代電子技術,2010,33(20):144-146.
[7]孫曉南,余婕.網絡存儲與數據備份[M].北京:清華大學出版社,2010.
[8]劉洪發,唐宏,賈卓生.網絡存儲與災難恢復技術[M].北京:電子工業出版社,2008.