徐益強
基于異構系統的容災研究
徐益強
隨著環境保護信息化的不斷深化,信息系統的重要性日趨突出。本文針對現有系統容災需求,選擇了基于存儲的陣列復制型容災系統,通過容災系統的建設,將大大提升環保業務系統的安全性。
江蘇省環保廳通過建設江蘇省生態環境監控系統,建成了一系列環境保護業務系統和相關數據庫,在基礎設施和應用開發上打下了較好的基礎。在數據保護方面,僅采用集群服務和虛擬化的技術,當硬件服務器出現故障時,實現虛擬機的漂移,在很大程度上避免了硬件設備的單點故障,提高了業務系統的可用性。在數據備份方面,僅采用了本地機房備份的方式,一旦出現數據丟失或損壞,需要通過人工方式進行數據恢復。
隨著信息化的不斷發展,業務需求對信息系統的高可用性要求越來越高,要求業務系統可以在發生災難時快速恢復,將損失降到最低點,容災系統的建設變得十分迫切。
容災的概念
容災是一個范疇比較廣泛的概念,對于IT而言,容災就是要提供一個確保業務系統不中斷運行的環境。在實際容災系統建設過程中,就是要在不同的地方,建設一套或多套應用系統,能夠提供業務應用獨立的運行,并且幾個應用系統之間能相互在線切換,一旦某一個地方的應用系統遭到破壞無法繼續運行,整個應用系統可以切換到另一個地點繼續運行。
容災的主要目的是,當自然或人為的原因導致生產系統發生災難時,能夠盡可能地保證業務的連續性。
容災的主要技術
容災技術主要包括基于主機層的是軟件復制、基于SAN網絡層虛擬化網關的復制、基于存儲層的陣列復制。
基于主機層的是軟件復制主要是對數據庫進行復制,通常采用數據庫支持的日志復制功能,按照本地數據庫的操作日志,實現遠程數據庫的一致;基于SAN網絡層虛擬化網關的復制,通常是通過SAN網絡層構建虛擬存儲網關來實現數據的復制;基于存儲層的陣列復制,通常是直接在本地存儲和遠端存儲之間通信,保持存儲陣列數據一致,以達到數據復制的目的。
同城災備中心需整合現有軟硬件資源,建設災備平臺。充分發揮虛擬化技術、滿足按需使用、動態擴展的特性,為省環保廳提供數據備份和災后恢復服務,實現軟硬件集中部署、統建共用,避免重復投資。

圖1 容災備份技術示意圖

圖2 容災備份系統示意圖
災備需求
充分利用現有機房設備及技術,擴充計算及存儲資源,通過對環境信息資源的整合共享,實現對異構資源的統一管理,建設同城災備中心,構建滿足各業務處室使用需求的災備中心,為其提供高可用性的硬件架構、軟件平臺及技術支持,為全省環境監控、環境監測、環境監管和環境決策提供數據安全備份和災后恢復支撐,避免因中心機房軟硬件故障或不可預見的災難造成業務長時間中斷或數據丟失。容災備份系統盡量不影響上層主機性能,在保證原有系統高性能運轉的同時可實現容災備份。
技術選型
針對省環保廳本地數據中心的現狀,業務系統的數據庫系統大多為SQL Server,且分布在多套異構的存儲陣列上,按照本項目的備份容災要求,除了對數據庫系統進行容災,還必須對關鍵業務系統的web服務器進行容災。因此,在容災備份的系統架構上,應用層的數據庫容災軟件對本項目的適用性不強,而使用直接對存儲陣列底層數據進行直接復制的陣列遠程復制技術,直接對存儲陣列同步,對上層web應用或數據庫應用沒有任何限制。
基于存儲層的陣列復制型容災系統搭建
本地數據中心部署高端存儲,將現有環境中不同品牌存儲資源進行統一管理,并部署一臺服務器安裝災備管理系統,在需要保護的每臺生產服務器上安裝代理軟件。
同城災備中心部署同品牌備份存儲,并部署刀片服務器,本地數據中心故障時,用于承載生產業務,每臺備用服務器上部署代理軟件。
本地數據中心的存儲與災備中心的存儲均配置陣列遠程復制功能和虛擬快照功能,用于實現存儲層的數據復制功能。陣列復制為陣列層復制技術,不需要在主機上安裝鏡像軟件,不影響上層主機性能,在保證原有系統高性能運轉的同時可實現災備。
本地數據中心與災備中心之間的數據傳輸鏈路,采用FC鏈路或是IP鏈路。
災備管理系統作用:對主機和陣列集中管理。提供容災業務管理圖形化操作界面,進行容災業務的日常管理;提供容災業務流程控制、容災策略調度、容災資源、容災業務配置等管理;提供業務狀態監控及完善的告警機制。
代理軟件作用:提供主機、應用的發現及應用數據一致性的保證和應用的恢復。
本地數據中心和災備數據中心之間的數據同步通過陣列遠程復制來實現,根據同步的方式,可分為異步方式和同步方式兩種。同步復制對本地數據中心和災備數據中心之間鏈路要求較高,最好為裸光纖,能最大性能保證傳輸鏈路的帶寬。
通過陣列遠程復制,實現主備數據中心之間的數據一致,一旦本地數據中心遭到破壞,災備數據中心會在完成前一次數據同步后立刻啟動,代替原數據庫運行。當本地數據中心修復完畢,具備運行條件式,災備數據中心會與本地數據中心進行一次同步,將最新的數據同步至本地數據中心,然后本地數據中心恢復運行,災備數據中心繼續進入數據同步階段。
同城容災系統建設實現了重要業務的應用級容災,提高了應用系統應對重大災難和事故的能力,整體提升了系統穩定性和數據安全性。

徐益強
江蘇省生態環境監控中心
10.3969/j.issn.1001-8972.2016.09.019