楊國斌
南京軍區南京總醫院 醫務部江蘇 南京 210002
隨著醫院信息化的發展,計算機網絡規模不斷擴展,原有數據中心的空間和設備性能已經不能滿足現有和將來發展的需求。為此,我院在外科樓建立了新的網絡中心機房,對原有部分設備進行更新擴容,以滿足醫院業務系統的正常運轉。在網絡中心機房建成后,數據中心將實施搬遷工作,而醫院業務系統的特點是:數據集中、業務量大、業務連續性要求極高,因此,保證業務連續性和數據不丟失是數據中心遷移的核心要求。數據遷移過程中保證數據的安全并最大限度地降低對業務的影響就成為遷移技術選型、方案設計的依據。如果在方案實施中出現數據大量丟失或者業務長時間中斷將可能造成無可挽回的災難性后果,因此要保證系統的平滑割接和業務的平穩運行,這也是遷移方案設計的主要難點。
我院當時要搬遷的服務器主要有數據庫服務器和應用服務器,其中,數據庫服務器是遷移中的難點,主要有醫院信息系統(HIS)的數據庫服務器、門急診數據庫服務器以及實驗室信息系統(LIS)的數據庫服務器等。在需要搬遷的數據庫服務器中,有Oracle和MS SQL Server兩種數據庫系統。經過調研論證,我們選用了EMC公司提供的AutoStart集群管理軟件來進行數據遷移和系統切換。AutoStart軟件支持任何主流的數據庫,且高效穩定,能保證主、備機數據的實時同步,根據需要或自動偵測相應的軟硬件故障,并將相應系統在另一臺服務器上重新啟動,從而保證整個應用系統的7×24 h連續運行的能力,滿足業務系統不能中斷的要求[1]。
針對當時數據中心遷移的實際情況,將需要解決的事情分為遷移、備份和應急等三類工作。其中“遷移”指的是將數據庫服務器從老機房遷移到新機房;“備份”指的是數據庫的手工備份,以保證系統中原有數據的安全;“應急”指的是當主服務器發生故障時,如何能在短時間內迅速啟動備用系統,保證醫院業務的不中斷運行。在進行服務器搬遷前,要先期備份服務器各項數據,并檢驗備份的服務器各項數據是否完全能用[2-3]。同時成立專門的管理小組,制定應急計劃,將各個產品供應商和各相關科室納入統一管理,集中調度。
當時,運行關鍵業務的HIS和門急診數據庫服務器已趨于飽和狀態,并且過了維保期,而且面臨新內科樓的啟用,在搬遷過程中可能存在一定的風險。因此,我們新增兩臺PC服務器,分別用于HIS和門急診數據庫服務器,安裝在新的網絡中心機房,與原有的服務器通過雙機軟件組成雙機熱備系統。用于雙機熱備系統的兩臺服務器必須各有一塊網卡,以反絞線連接,作為數據鏡像的專用通道。用于鏡像上綁定的靜態IP地址與局域網的IP地址不能在同一子網。服務器可以是域模式,也可以是獨立 Server模式,也可以是“域+獨立Server模式”,但兩臺服務器必須在相同的網段內。
在安裝服務器操作系統時,必須注意服務器分區類型、分區大小以及操作系統與數據分區的位置。AutoStart軟件對硬盤沒有特別的要求,一塊或多塊硬盤都能實現鏡像,支持任何Raid類型。但只有基本分區可以進行數據實時同步、被保護,而動態分區與該軟件不兼容,并且要求鏡像的數據分區不能與操作系統在同一個分區,而且從服務器的數據分區不能比主服務器數據分區小[4]。在數據分區不能有任何系統文件,包括系統的頁面文件,并且必須將AutoStart軟件安裝在數據分區。
AutoStart雙機集群管理軟件的安裝分為Agent和Console兩部分,其中Agent安裝后以服務形式出現,Agent安裝成功后需要重啟系統。每次系統啟動,Agent服務會自動啟動。Console只是一個管理界面的程序,安裝后無需重啟。在主服務器和備用服務器上都要安裝Agent和Console,可在任意一臺服務器先安裝AutoStart軟件。第一臺服務器的AutoStart軟件安裝成功后,通過Console,需要為第二臺服務器的AutoStart軟件的安裝做好準備,才能在第二臺服務器上安裝AutoStart軟件。
在主機和備機上分別部署雙機軟件后,對雙機軟件進行調試,期間需要重啟一次數據庫服務器,可以在夜間進行。通過雙機軟件將數據庫磁盤從主機鏡像到備份服務器上,完成鏡像后主數據庫和備份數據庫的數據完全一致。然后,對備份服務器的數據庫進行測試,判斷服務器是否正常。如果一切正常,主、備機即可進行切換,啟用數據庫服務,客戶端就可以訪問新的服務器,進而把原有系統進行斷電、搬遷,實現數據中心的遷移。在搬遷完成后,可以采用該雙機軟件部署一個實時同步的數據庫系統,在主數據庫發生意外故障時,根據需要進行切換。
為了保證數據中心搬遷工作順利進行,在盡可能做好相應準備工作的同時,制定遇到緊急事件的應急預案是必不可少的重要環節。我們制定的應急預案包括:在系統切換不成功的情況下,實施回退方案或啟用備機方案。
(1)回退方案。在整個系統切換過程中,先保留主機數據,確保主機在切換前是正常關閉數據庫。如果切換方案由于種種原因不能進行正常切換,我們將采用回退機制,以保證業務系統可以正常使用。在切換到熱備份服務器的過程中若發生遷移失敗的情況,只需要重新恢復主機的IP地址即可,然后繼續使用切換前的主服務器,期間的數據不會有任何損失。然后進行原因分析與排查,直至問題解決,再擇機進行系統切換。
(2)備機方案。將備機先行遷移到新的網絡中心機房,將數據備份到備機上,在此期間,主數據庫服務器仍然正常服務。在短時間之內回退方案如果確實存在問題,導致業務系統中斷,我們將啟用備機方案。暫停主服務器的對外服務,利用歸檔重做日志將數據與備份服務器進行同步,這個階段需要暫停服務較長時間[5-6]。然后,啟動備份服務器的數據庫,進行測試,確保備份服務器的數據庫可以正常使用。接著,切換主服務器IP地址,客戶端即可訪問備用服務器,盡可能把對業務的影響降低到最小。
數據中心的遷移是一個精確的系統工程,要充分結合科學的管理以及專業的技術實現,細化和監控好每一個環節,做好詳細的風險預防計劃,才能保證方案的成功實施。針對我院實際情況,使用雙機熱備份系統并采用AutoStart集群管理軟件,從技術層面有效地保證了遷移的成功實施,還為以后的主、備機數據實時備份和主機的故障恢復提供了更好的保障,并兼顧了設備投資的長期和短期效益。將熱備份的數據分別存放在兩臺服務器的本地硬盤中,雙機中任何一臺機器發生故障,可以讓另一臺機器接管相應的IP地址、主機名、數據庫服務及業務應用,保證業務系統不中斷運行。實踐證明,在項目實施過程中要特別注意以下幾個方面:一是要正確選擇方案,盡可能縮短停機時間,保障業務系統的連續性;二是要詳細進行測試,避免遷移過程中發生差錯;三是要做好數據備份,保證醫療數據的安全[7-8];四是要制定回退機制,保證整個遷移過程可控;五是要完善后繼工作,積累實踐知識、總結經驗及完善文檔。
[1]趙春曉.醫院信息系統中的數據安全[J].醫療裝備,2010,23(2):31-32.
[2]翁盛鑫,黃影.安全數據備份系統的建設[J].醫療衛生裝備,2009,30(11):54-56.
[3]葉俊,劉松林,陳健美,等.我院HIS數據備份與容災技術方案[J].中國醫療設備,2008,23(1):37.
[4]馬錫坤,楊國斌.基于PC服務器非共享磁盤高可用系統的實現[J].中國醫療設備,2010,25(4):29-30.
[5]馮凱,崔毅,劉書占.軍隊醫院信息系統數據的備份與恢復案例[J].中國醫學教育技術,2010,24(3):288-290.
[6]羅緋,李明,張安仁,等.醫院信息系統備份策略[J].西南國防醫藥,2010,20(11):1254-1255.
[7]李國亮.醫院網絡數據災難恢復與備份[J].中國醫療設備,2011,26(2):87.
[8]姜瓊,張泉方.醫院信息管理中的數據備份研究[J].中國數字醫學,2008,3(11):49-51。
[9]王學海.ORACLE數據庫備份及恢復[J].中國醫療設備,2012,27(6):57-58.