煙草物流是煙草行業的核心業務之一,確保數據安全和數據不間斷在線訪問,成為煙草信息化建設的重點之一。
中煙商務物流有限責任公司承擔著行業電子商務發展規劃的實施、商務平臺的建設、卷煙工商交易的運行、行業卷煙經營決策管理系統的運行維護和技術支持、行業物流的規劃、建設、管理、運行、信息化等方面工作。
計算機系統的穩定運行對中煙商務物流公司至關重要。早在數年前,公司就對計算機軟硬件故障、人為因素以及資源不足等引起的非計劃性停機采取了各種措施,實現了系統冗余,增強了業務系統的高可用性。目前,公司的關鍵業務支持系統都建立在集群系統的環境中,系統中UPS、服務器、存儲設備、網絡、系統軟件、數據庫平臺、應用系統都可以消除單點故障。
小范圍的災難事件可能只影響部分系統,但大范圍的災難事件不僅會破壞整個計算機系統,還會破壞機房場地,電力供應、通信等社會服務公共基礎設施,造成無法挽回的損失。由于中煙商務物流公司的辦公基本都在同城完成,公司決定建立一套高性能、高可靠性、高擴展性和低管理成本的異地容災系統,以解決數據的安全問題。
異地容災系統的核心在于在不同的地方將災難化解,在實踐中保證數據安全和業務連續性。但是,建立異地容災中心不能紙上談兵,必須考慮企業自身情況,有重點的建設異地容災中心,實現資源配置最大化。
當然,也并不是所有網絡系統都需要安裝容災系統,只有對不可中斷(一般中斷時間不可超過24小時)的關鍵業務才有必要進行災難預防。另外,容災系統也不能防止所有災難,這很難做到。所以,企業應認真分析自身業務,確定成功恢復所需的條件,建立一套好用、實用、物有所值的容災系統。其中,備份、容災、恢復演練一個都不能少。
備份是基礎
備份是數據提高可用性的基礎,其目的是為了系統數據崩潰時能進行數據快速恢復。為保證備份數據和源數據的一致性和完整性,中煙商務物流公司將備份分成六步驟:
1.采用本地定期磁帶備份數據;
2.采用遠程磁帶庫、光盤庫備份,即將數據傳送到遠程備份中心制作完整的備份磁帶或光盤;
3.采用遠程關鍵數據+磁帶備份,磁帶備份數據,生產機實時向備份機發送關鍵數據;
4.遠程數據庫備份,就是在與主數據庫所在生產機相分離的備份機上建立主數據庫的一個拷貝;
5.采用網絡數據鏡像,這種方式是對生產系統的數據庫數據和所需跟蹤的重要目標文件的更新進行監控與跟蹤,并將更新日志實時通過網絡傳送到備份系統,備份系統則根據日志對磁盤進行更新;
6.采用遠程鏡像磁盤,通過高速光纖通道線路和磁盤控制技術將鏡像磁盤延伸到遠離生產機的地方,鏡像磁盤數據與主磁盤數據完全一致,采取同步或異步的更新方式,同時采用服務器集群。
容災不可少
一套完整的容災方案應該包括本地容災和異地容災兩套系統。中煙商務物流公司將異地容災的技術思路分為基于主機系統的數據復制和基于智能存儲系統的遠程鏡像兩種。
基于主機系統的數據復制是通過軟件形式來實現,能夠把數據定期、在線地復制到目的地的機器上去。對用戶來說,這種復制方式的優點是能夠較好地保證數據的一致性,但它將消耗大量的主機資源(至少要占用監控和復制兩個進程)。而且,嚴格來講,這種方法很難有真正的同步方案,因為數據復制要求做任何一筆交易,都要實時地將結果發送到遠程的站點中,等遠程操作結束后,再執行下一筆交易,這在實際操作中,很難做到,只能做異步的數據復制。
基于智能存儲系統的遠程鏡像是基于控制器的遠程拷貝,它有在主副存儲子系統之間同步數據鏡像的能力,對主機的資源占用很小,能保證業務正常運行下的I/O響應。但缺點是會受通信鏈路的通信條件影響。當帶寬不夠的時候,只能做遠程的異步復制。
最終,在這兩種技術的選擇上,中煙商務物流公司在成本預算較緊、主機資源還不是瓶頸的情況下,考慮選用基于主機系統的通過軟件實現復制的方法。另外對于公司今后的一些關鍵應用,由于對可靠性要求高,業務不能中斷,還需要選用針對高端應用的容災解決方案。
恢復演練是保障
無論選擇怎樣的容災方案,其最終目的都是在災難發生后實現快速系統的恢復。這就需要在系統正常運行時進行災難恢復演練。
但災難恢復演練不能以停機為代價,更不能發生演練后系統無法正常運行情況。此外,還應該定時進行恢復演練,確保備份中心能恢復系統。
建立實際的災難恢復計劃是一個非常復雜的過程,而且情況千差萬別。因此,首先要明確災難恢復的每一個細節,清楚最大的風險是什么?系統對哪些災難最為敏感?系統停機對每個部門會產生怎樣的影響?同時要進行人員分工。當發生災難時,誰將負責數據恢復?誰負責監控設備?誰負責與設備供應商聯系?這些都必須在演練中明確分工,并且按照計劃執行。
最后,要定時進行演練。僅僅制定出一個計劃是不夠的,必須對其進行經常性測試。這就需要對企業自身系統進行風險評估,了解實際需求,以此來制定災難恢復演練計劃。
明確了企業異地災備中心的建設思路和目標,還要做好準備工作。首先,需要建立一個符合要求的備份中心。所謂符合要求,就是說備份中心應該具備與主中心相似的網絡和通信設置、具備業務應用運行的基本系統配置、具備穩定高效的通信鏈路連接主中心(例如鋪設光纖)以確保數據的實時備份、與主中心相距足夠安全的距離等。無論是現有的數據中心還是備份中心,都應該有完善的容錯措施,這將減少系統故障。其次,及時進行有效的備份。為了做好備份,應該注意選擇恰當的硬件和軟件,這是成功備份和災難恢復的重要環節。
此外,完善的管理制度對企業來說,其重要程度不亞于技術和產品。數據的及時備份、災難發生的處理方法等都將對災難恢復的效果、速度產生非常大的影響。
鏈接
煙草行業特色異地容災系統四項基本特點
1. 高性能:強調關鍵數據的保護與應用。保證關鍵信息系統運行永不停頓,隨時提供全面的數據保護和恢復功能;大幅度降低受損數據的恢復成本,保證恢復過程的快速有效;減少創建數據保護備份所需的時間,在復制與備份的過程中對應用不產生任何影響。
2. 高可用性:對數據訪問做到零等待。數據必須是可用的和完全有效的,并保證無論數據保存在何處,根據用戶的要求能夠快速重新分配存儲資源,并且可以進行自由和即時的信息交換。
3. 高可擴展性:保證異構平臺的通用性。中煙商務物流公司現有的服務器和存儲平臺能夠快速的支持新應用,滿足新的服務器不斷變化的性能要求。同時保持系統的可擴展性,對更大靈活性的需求具有可根據情況集成新型存儲技術的出色能力。
4. 低管理成本:滿足自身的異地容災系統的策略,并在現有的基礎設施上支持對容災功能進行系統的管理。