劉虹
摘 要:本文通過分析業務連續管理的技術和方法,結合某特大型國有能源企業自身信息系統的實際特點,提出符合特大型國有企業的災備及業務連續性體系建設方案,并分析了實施方式和效果,為同類型企業災備系統建設具有一定的借鑒意義。
關鍵詞:業務連續性 災備 體系
中圖分類號:TP319 文獻標識碼:A 文章編號:1672-3791(2017)10(a)-0024-02
1 業務連續性的挑戰
作為大型央企的某特大型國有能源企業,關鍵業務系統面臨各種威脅和挑戰,其中包括自然災害和社會災害的威脅,以及如何確保業務的持續可用、滿足國家法律法規的要求、承擔企業決策層對風險管理的責任等。
隨著某特大型國有能源企業各重要應用系統的建設和部署、關鍵系統高度集中化、云計算系統和大數據系統的深入使用,數據中心的面臨的風險更加集中。一旦數據中心發生災難,則將導致總部、全國所有分支機構、企業的業務停頓,或造成重要數據的丟失,其后果不堪設想。同時國家標準《信息系統安全等級保護基本要求》相關條文規定,三級等保以上的應用系統必須建災備。如何防范各類風險,確保數據安全和業務的連續性、滿足國家相關法規的要求,成為當面急迫解決的難題。
同時,災備中心及災備系統建設成本高昂,災備建成后的長期運維,鏈路租用,預案開發及演練等都是不小的費用。如何提高災備系統的實際效果、提高災備系統資源利用效率也是災備建設面臨的深層次問題。
近年來,國外的災備及業務連續性建設獲得迅速發展。災備管理由單一的項目管理升級為全面管理,災備建設從圍繞數據存儲向圍繞應用服務轉變,災備系統的建設不僅僅是IT系統的建設,而是包括災備管理體系建設在內的業務連續性整體建設;災備管理體系建設包括組織、人員、制度、流程、預案、演練等多項內容,業務部門的深度參與是業務連續性建設是否完善的重要標志。
2 災備及業務連續性定義
災備技術主要指利用科學的技術手段和方法,提前建立系統化的數據應急方式,以應對災難的發生。內容包括數據備份和系統備份,業務連續規劃、人員架構、通信保障、危機公關,災難恢復規劃、災難恢復預案、業務恢復預案、緊急事件響應、第三方合作機構和供應鏈危機管理等。災備恢復指標最關鍵的有兩個;一個是RTO,Recovery Time Objective,它是指災難發生后,從IT系統宕機導致業務停頓之時開始,到IT系統恢復至可以支持各部門運作、恢復運營之時,此兩點之間的時間段稱為RTO,廣道容災備份系統RTO達到分鐘級。另一個是RPO,Recovery Point Objective,是指從系統和應用數據而言,要實現能夠恢復至可以支持各部門業務運作,系統及生產數據應恢復到怎樣的更新程度,這種更新程度可以是上一周的備份數據,也可以是上一次交易的實時數據。RTO、RPO均無限接近于0是所有災備產品的終極目標。
業務連續性管理(Business Continuity Management,簡稱BCM),是一項綜合管理流程,它使企業認識到潛在的危機和相關影響,制訂響應、業務和連續性的恢復計劃,其總體目標是為了提高企業的風險防范能力,以有效地響應非計劃的業務破壞并降低不良影響。業務連續性管理系統(BCMS)是經常進行的活動的集合,業務連續性管理支持企業業務連續性管理活動,也支持技術災難恢復活動。這些可以包括項目規劃和管理、人員配備、計劃、預測、預算編制、研究和開發、資源管理、通信、會議、教育活動、宣傳和促銷活動、活動網站、績效評估活動、按天進行處理查詢等。
3 災備及業務連續體系建設方案及效果分析
某特大型國有能源企業業務數量眾多、種類繁雜,涵蓋了油田、煉化、銷售、科研、工程設計等各個業務方向,業務系統及相應數據已實現高度集中,部署方式已實現多樣化,近年來,建成了云平臺為各業務系統提供資源,實現了大數據HANA部署,提高了數據抽取及報表生成能力。但因其各個數據中心較為分散,對區域性的自然災害和社會災害應對能力明顯不足。
結合業務系統的部署現狀、面臨的自然風險和社會風險,該公司按照統一規劃、分布實施的策略,利用先進的理念和技術,逐步構建適合自身應用特點的災備體系。
(1)兩地三中心和應用分級模式的建立,確保業務連貫性的實現。
建設北京和南京兩個數據中心,同時結合現狀,在北京現有三個數據機房,通過先進技術形成同城備份模式。按照應用系統關鍵及重要程度的不同,采取應用級災備和數據級災備相結合的方式。根據應用特點采用多樣化的數據同步技術,包括存儲層同步、數據庫層同步、應用層同步等,實現總部多類型重要應用系統業務數據的遠程災備復制。建成10個重要應用系統災備,并開展了對云計算系統、大數據HANA系統的災備實現。實現了“兩地三中心”向“同城雙活、異地備份”的架構過渡,并最終演進到多活數據中心、實現災備云、數據云。
(2)統一共享的遠程數據同步平臺,實現所有業務數據同步。
通過主機、存儲、網絡、安全的虛擬化技術,實現災備中心各類資源的資源池化、云計算化;通過主機虛擬化技術為應用級災備系統在南京災備中心部署專有計算資源,為數據級災備系統部署共享計算資源,提高了各類資源的共享程度和利用效率;通過虛擬子網技術、分區分域技術構建共享的網絡架構和安全體系;通過存儲區域網絡融合創建共享的數據復制平臺,從多方面入手,努力提高災備中心的資源利用效率,降低能耗,創建綠色中心;通過存儲資源整合、通信鏈路復用、云資源平臺構建等設計理念的貫徹和實施,直接節省了機房、機柜空間,節省了電力資源,提高了系統和數據的性能、安全和可維護性。
(3)體系化的災備演練制度,提高風控意識。
隨著災備中心及災備系統的初步建成,對關鍵業務系統進行了風險分析、業務連續性分析,并依據國家標準和規范建立了災難恢復預案管理和更新機制等,確定了災難應急管理組織、應急響應流程,開展災備演練。同時實現演練常態化,通過業務連續性管理的方法和內容,完善災難恢復體系。
在工作中,實現了重要應用系統的災備演練,包括桌面演練、模擬演練與實戰演練,由簡入繁,由易到難,鍛煉隊伍,積累經驗,再進行風險度較高的實戰演練。其中桌面演練的頻度以每年一次或按需進行,模擬演練1~2年一次,對于較大型的系統,實戰演練3~5年一次。在災備演練實踐中,對重大系統進行了應用級災備演練,各個業務部門均深度參與,共同完成復雜的交互業務。通過災備演練,驗證災備系統的可用性,驗證災難恢復應急響應流程的可行性、業務邏輯的可操作性以及災備端數據的可用性,檢驗組織、崗位、人員之間的配合程度,熟悉災難恢復預案和業務連續性計劃,提高了各部門的風險意識、安全意識。
4 結語
隨著國家“兩化融合”戰略的深入,信息化促進工業化發展,起到了舉足輕重的作用,構建完善的災備體系成為了企業提供核心競爭能力的重要手段之一。某特大型國有能源企業的災備及業務連貫性體系的運行,為集團公司經營管理、生產營運、客戶服務、科研工程等各方面活動開展提供了條件,為信息化促進工業化發展提供了有力保障。
參考文獻
[1] 張春林,陳小峰.商業銀行業務連續性管理[M].機械工業出版社,2016.
[2](美)奧克麗塔,著.構建企業級業務連續性規劃[M].于天,譯.機械工業出版社,2015.endprint