王東方,李 崢
(機械工業信息中心,北京 100043)
雙機熱備機制就是利用不同的服務器,通過建立心跳協議(heart beat)的方式,檢測對方的可用狀態,可以把服務器分為主服務器和從服務器。研究雙機熱備機制的主要目的在于,及時發現系統故障、恢復系統服務、保證主服務器和從服務器的一致性。
系統故障主要有三種原因:(1)系統硬件自身出現損壞;(2)計算機軟件運行出現問題;(3)機房環境不滿足系統運行條件。機房環境造成的故障和前兩者不同,具有強烈的前后關聯,要進行定量分析。
主服務器故障時,前后關聯的服務器故障概率為9%,能夠降低系統發生故障的概率。不管是哪種原因引發的系統故障,雙機熱備系統都具有高度的穩定性。
現如今我國經濟發展和國家頒布的一系列政策為企業創造了良好的外部環境,中小型企業業務量猛增,與此同時,得益于互聯網的普及,企業網絡訪問量呈現指數級別的提升,給計算機系統帶來了挑戰,傳統的單一服務器無法承擔如此巨大的工作量。如果對現有設備棄之不顧,升級硬件設備,會產生不必要的浪費;可以使用負載均衡技術,不僅節省成本,還能緩解業務壓力。如圖1所示,單一服務器性能不強,存在缺陷,將多臺服務器進行組合,形成集群,其能量不容小覷。負載均衡技術,是以現有網絡結構為基礎的,能夠有效擴展服務器的帶寬,在加強服務器數據計算和處理能力的同時,也加強了服務器的可用性。

圖1 服務器集群
在設計中小企業服務器雙機熱備系統升級方案的過程中,應該注重以下幾點原則:(1)前瞻性。要充分考慮到未來3-5年的實際發展需要,降低成本,最大化利用資金,為中小型企業減輕系統升級帶來的資金負擔;(2)先進性。在經費允許的范圍之內,引進和學習最新技術,提升系統運行效率,保障中小企業計算機軟件和硬件領先時代平均水準;(3)開放性。雙機熱備系統所采用的軟件和硬件設施,應該滿足國家的工業標準,具有開放性的設計原則;(4)安全性。這是中小企業提升服務器雙機熱備系統的重要環節,也是設計過程中首要考慮的問題,對保障系統穩定運行有重要促進作用,與此同時也需要具備故障恢復功能;(5)完整性。從整體性的角度考慮,雙機熱備系統中的各個子系統需要構成完成數據系統,應該包含文件系統、磁盤管理、多機熱備份系統等;(6)可擴展性。在提升硬件設施質量的基礎上,盡量選用易擴充的服務器,實現系統的平滑升級,避免因系統升級導致數據遺失。
雙機熱備系統是近些年企業比較熱衷的系統,具有高度的可用性和改善性,同時還能對企業應用軟件進行良好管理,確保軟件在使用過程中不會出現系統故障。雙機熱備份指的是計算機系統對主機、硬盤、通信線路等核心設備采用雙機備份的形式,計算機系統在正常運行的過程中,主機開始工作,相關人員在系統中設置一定的時間,每到了設定時間時,系統就需要開始進行自動檢測,一旦發現系統中有故障或是其他緊急情況,則可以立即切換到備份機系統繼續開始工作,在這種狀態下,計算機系統依舊能夠正常運行,不會受到影響。雙機熱備份方案的網絡拓撲如下圖所示:
群集是該系統的主要工作模式,需要依靠兩臺服務器共同開始工作,并且所需要的網卡數量要在四塊以上,其中兩塊網卡要用于兩臺服務器主機集群內部的“心跳”同步,另外的兩塊網卡要承擔服務器和局域網連接的工作。磁盤存儲是兩臺服務器共享使用的,需要磁盤陣列,常用的主機接口包括FC、SAS等,具體使用的類型要根據實際情況來決定。

根據企業所提出的實際要求來看,為了最大程度上節約成本,需要充分利用到現有的設備和系統,相關人員采購了一臺服務器以及一套新的磁盤列陣系統,對企業現有計算機進行了升級改造,構建了雙機軟件,同時也研發了具有共享磁盤列陣的雙機備份方案。
兩臺服務器的內部存儲硬盤上,利用了局域網和心跳網絡將兩臺服務器進行了連接。當主機開始工作之后,系統正式開始運行,雙機軟件開始對該系統進行監控,避免系統在運轉過程中出現問題,并且還會利用私用網絡傳遞的心跳信息來監控另外一臺主機在運行過程中是否處于良好狀態。如果主數據服務器在運行時出現了故障和突發情況,心跳信息就會及時作出調整和變化,這種調整和變化能夠傳遞到數據庫服務器上,通過控制系統進行服務器切換,備數據庫服務器就會接替主數據庫服務器的工作,并且隨后會發出警報,通知相關人員對發生故障的服務器進行維修和處理。
具體所需的軟硬件如下:

序號 產品規劃 部署描述 單位 數量1. 機架式服務器(雙千兆網卡) 主數據庫服務器 臺 1 2. 原服務器(雙千兆網卡,利舊) 備數據庫服務器 臺 1 3. StorageWorks81E8GbSPPCI-eFC 給服務器擴展FC口 塊 2 4. 磁盤陣列設備 共享數據庫存儲 臺 1 5. 磁盤(三塊以上,RAID5) 共享數據庫存儲 塊 4 6. 雙機熱備軟件 故障切換 套 1
(1)在切換的過程中,不影響計算機應用程序的正常使用,同時也不用重啟計算機或再次登錄軟件系統。
(2)在該系統的支持下,計算機工作極為高效,磁盤列陣能夠輕松完成數據收集、讀寫、管理、儲存工作,雙機軟件也能對服務器進行監控,及時發現其中存在的故障,便于工作人員及時排查。監控系統正常運行依靠的是專業的網卡線路,不占據計算機主機CPU的資源,也不會影響網絡帶寬。
(3)Oracle、SQLServer、Sybase、Exchange等配置都能應用。
(1)構建雙機熱備架構的應用服務器系統。安裝服務器,安裝WindowsServer操作系統、數據庫及雙機熱備系統,遷移老服務器上的軟件到新服務器,老服務器系統重裝安裝和新服務器相同的軟件系統。新、老服務器采用心跳線連接,通過雙機熱備軟件的控制,按“主-備”方式實現雙機熱備運行,保證應用軟件系統的可靠運行。
(2)配置與上述服務器系統關聯的數據存儲設備。安裝磁盤陣列,數據庫及公司管理信息系統安裝在磁盤陣列里,作為上述雙機熱備服務器系統的數據存儲設備,同時為今后應用系統的擴充留有余量。
(3)完成新購設備與原有設備的系統整合,進行相關的安裝、調試和集成工作。
(4)管理信息系統遷移。將管理信息系統從遠端到上述改建后硬件平臺的平穩遷移,并合理部署原有應用軟件。
從以上方案可得知這種雙機熱備份方案最大的特點就是較低的成本、非常高的穩定性能和可擴展性能。因為它采用的是性能比較高的FC總線存儲類型,充分利用了光纖通道高帶寬、低延時、無干擾的特性,給用戶關鍵數據提供了高可靠性和高存儲效率,其優良的性能和強大的功能已得到無數用戶的認可。