姚嚴峰
摘要:本文對運營商備份系統過程建設工程中涉及的技術、管理問題進行研究分析,力圖為備份系統提供借鑒。
關鍵詞:運營商;備份系統;技術實現
中圖分類號:TP309.3 文獻標識碼:A 文章編號:1007-9416(2018)04-0044-02
隨著業務量和數據量迅速增長,電信運營商業務對數據的依賴性也越來越強,保證數據的安全性和可靠性也越來越重要,備份系統作為生產系統的最后一道防線,備份能力與備份質量必須隨著生產系統的發展不斷提高。
1 背景
某電信運營商業務支撐網備份系統經過多年的建設,有力支撐了資源池等業務平臺的操作系統、業務數據及應用數據的全面保護。隨著業務量和數據量的快速增長,業務對數據的依賴性也不斷增強,保證數據的安全變得越來越重要,備份系統作為其他生產系統正常運作的基礎,備份能力和備份質量必須不斷進行提升。
2 備份系統技術實現目標
某運營商為滿足某業務部門的業務需求,對現網1套物理帶庫進行擴容滿足A節點數據庫導表、云詳單等備份需求,新增2臺備份一體機進行核心數據庫的快速備份和恢復驗證,新增1套備份監控軟件,對備份作業、備份任務異常、備份數據量異常、帶庫使用狀態等進行監控。滿足BOSS和CRM、管理信息化、互聯網電渠等多個業務系統的oracle數據庫的快速備份和恢復驗證的需求。
3 備份系統技術實現方案
3.1 備份系統建設方案
某運營商業務支撐網oracle數據庫主機集中部署于A節點和B節點兩個數據中心,本期新增的備份系統須滿足單個數據中心100TB有效數據的備份數據量并容量擴展能力。本期新增萬兆以太網絡進行數據庫備份,在A節點和B節點各新增1對(2臺)萬兆以太網交換機,將現網oracle數據庫主機接入新建萬兆以太網網絡,新增備份系統接入現有備份SAN網絡與本期新建的萬兆以太網網絡,本期新增的備份系統通過萬兆網絡對雙中心oracle數據庫主機的數據進行備份和存儲,并通過現有備份SAN網絡將數據庫的兩個備份集轉存至現網虛擬帶庫。
3.2 備份系統技術方案
3.2.1 技術架構及兼容性要求
(1)系統必須具備橫向擴展性,如存儲及計算節點的橫向擴展。(2)備份系統作為后端存儲介質必須兼容Veritas NBU備份軟件。(3)備份系統對外提供一個IP地址或邏輯定義地址以及API進行服務,除TCP/IP交換機或光纖交換機外,無需采購其它設備。
3.2.2 備份性能要求
(1)備份速度:不低于13TB/小時(oracle數據庫備份總量近130TB,每天進行一次全量備份,根據需求必須在10小時以內完成全量備份,即工程實施完成后能夠保證在10個小時以內完成oracle數據庫的全量備份)。(2)恢復速度:不低于1.2TB/小時(現網最大的備份數據規模為portb數據庫11.13TB,根據需求必須在10小時以內完成數據恢復,即工程實施完成后滿足10個小時以內完成現網最大規模備份數據的恢復)。
3.2.3 設備配置要求
(1)系統內部必須采用SAS/NL-SAS接口磁盤作為存儲備份的物理介質。(2)系統提供至少4*10GE以太網接口(支持至少可擴展8個端口)、2*GE以太網光接口(支持至少可擴展4個端口,以太網光接口均含多模光模塊)和2*GE以太網電接口,提供至少4*8Gb/s光纖通道接口(可擴展至10端口,光纖通道接口均含光模塊),用于對外數據傳輸接口。(3)系統內部連接網絡必須采用萬兆TCP/IP網絡或者Infiniband交換網絡。(4)提供IPMI遠程管理接口,便于進行設備的遠程維護。
3.2.4 備份功能要求
(1)實現LAN備份和LAN-Free備份方式。LAN-Free備份既支持傳統物理環境包括主流UNIX/Linux/Windows平臺,也支持虛擬化環境包括Vmware和Hyper-V,可以支持采用備份系統內磁盤、磁帶庫、及VTL等各種備份設備實現LAN-Free備份。(2)為縮短備份時間,節省存儲空間,系統必須支持重復數據刪除及數據壓縮功能,根據所備份對象的類型進行智能消重,同時支持并可自由選擇備份客戶端和/或備份系統端消重,備份數據自動壓縮提升備份空間利用率。(3)內置系統管理軟件,支持意外掉電后的迅速恢復及存儲容量無縫擴展。(4)內置主機加固和入侵防護功能、以及操作審計功能,杜絕各種威脅和人為違規操作導致備份系統故障。(5)支持對Oracle數據庫在線的全備份、增量備份和日志備份,實現不同級別的Oracle數據庫備份和恢復,包括Oracle數據庫、部分表空間、部分數據文件、FRA區、以及歸檔日志,實現對Oracle單表的備份和恢復。(6)對備份數據能夠多副本分級管理,至少支持保存3個備份副本,可同時備份多個數據副本保存到不同的備份設備上(并行多副本),也可以先備份到某一設備再復制到其他設備(串行多副本)。(7)支持oracle數據庫備份即所得功能,即備份的oracle數據庫可以直接啟動而無需恢復;支持數據庫增量合成,即第一次備份后,以后全部的數據庫只需要增量備份,但每次增量備份都會合成一個全量數據庫備份。(8)支持oracle數據庫多副本(根據全量備份的內容合成不同的備份集進行版本管理)的備份即所得功能,即備份的oracle數據庫副本都支持直接在該設備無需恢復直接啟動備份數據庫。(9)備份內容支持通過NBU轉存到其他帶庫,備份系統廠家需提供相應的官方支持文檔。
3.2.5 可擴展性要求
(1)重刪壓縮前(壓縮比按照4:1)備份容量可擴展至不小于800TB。(2)實時在線動態擴容:可以通過增加磁盤容量、服務節點的方式實時對存儲容量進行擴充,動態擴容期間服務不中斷。(3)單節點支持實時在線磁盤的熱插拔,新增資源可以立即被系統識別、管理和數據讀寫,而不需要重啟節點。(4)節點在線動態擴展硬盤后,無需人工遷移數據,自動均勻平衡數據到新增存儲磁盤。
3.2.6 可靠性要求
(1)系統高可用性達到99.99%。服務故障恢復時間或切換時間在5分鐘以內。(2)系統設備的內部備份計算節點、內部互聯網絡、存儲、電源、風扇全系列部件均有冗余, 無任何單點故障風險。(3)系統內部節點出現單點故障時不能引起業務中斷。在故障排除后,節點應當能夠平滑的重新接入系統,重新提供服務。(4)備份設備具備遠程復制到其他同構備份設備的能力。(5)系統應通過一套管理系統管理備份設備機頭、存儲、內部網絡等組件,提供靈活全面的故障告警規則設置,實時進行故障告警,故障發生時能夠快速地進行分析、診斷并可自動上報。(6)對系統級的異常情況,能夠提供手段進行詳情追溯和故障恢復。(7)系統運行過程如出現機房異常掉電等情況下,數據不會丟失。(8)系統可根據不同冗余策略設置容忍多個節點故障。(9)數據要求有糾錯碼等保護機制,要求數據可靠性達到99.999%。(10)支持設置用戶數據糾錯碼比例、向用戶提供不同級別的數據可靠性保護策略。(11)系統發生單節點或單節點硬盤故障恢復后,需確保任何數據及元數據的一致性。
4 結語
某電信運營商根據業務需求改造備份系統,對現網一套備份系統進行擴容升級,備份系統不僅需要考慮備份速度、備份質量、可靠性,增量備份等基礎性能指標,也需要考慮對現網使用的各種不同數據庫及新的備份技術(如Veritas NBU備份軟件)兼容性的問題,為備份系統未來的擴展及升級打好基礎。