摘要:安全、實時、高效是計算機系統的主要要求。由于容錯設計能為計算機系統提供更高的安全性能,在醫院、銀行、電力等安全要求高的行業得到了廣泛應用。
關鍵詞:網絡;容錯設計
容錯設計來源于這樣的思想:按照概率論,無論多么先進的系統,其故障率必然大于零,要使系統避免失效,就要提供冗余系統。容錯設計的目的不是避免系統發生故障或提高平均無故障時間,而是在系統發生故障時保證系統正常功能不受或少受影響。
這種系統設計思想與不斷提高的軟件、硬件質量結合起來,就能形成具有強大性能的實時不間斷的網絡系統。經過容錯設計的網絡系統有兩大優勢:
1、故障不停網優勢:容錯網絡在服務器、交換機等關鍵設備故障的情況下也能正常運行。這就為搶救數據、維修設備提供了充足的時間,避免了故障損失的擴大。
2、消除網絡瓶頸:容錯網絡由于采用了冗余設計,可以進行負載均衡,使網絡瓶頸問題得到解決或緩解。所以,容錯網絡的網速更高,堵塞更少。
本文通過幾種典型的網絡結構對網絡的容錯性能做一分析。
雙機熱備份是一種較早的服務器備份方法,這種方法將兩臺服務器用光纖連接起來,并通過在服務器上運行的服務器備份軟件做實時的備份。其中工作的為主服務器,另一臺為輔服務器,它們作為一臺邏輯服務器來工作。同時,兩臺服務器各通過一塊網卡連接到同一臺交換機上。主服務器故障時,輔服務器可以立即升格為主服務器接替工作。其網絡主體結構圖見下圖:

由于集線器和個人計算機通常較廉價而多有備份,本文為方便研究視其為完好。在實踐中,同類設備還往往采用統一型號的設備,所以不妨設,服務器Server(i)故障率為E(si)=Es,交換機Switch(i)故障率為E(swi)=Esw,網卡故障率為E(ni)=En。
通過分析上面的雙機熱備網絡結構圖,我們知道,兩臺服務器構成并聯容錯子系統,此并聯容錯子系統又與交換機構成了一個串聯容錯系統。此系統的失效率P可計算如下:
P=P并+Esw-P并*Esw
=Es1*Es2+Esw-Es1*Es2*Esw
=Es1*Es2(1-Esw)+Esw
由上式可知,當Esw=1時,P=1;當Es1=Es2=Esw=0.001時,P=0.001000999≈0.001。也就是說,此容錯系統的失效率主要受到交換機的影響,而且若交換機故障,此容錯系統必定失效。這是不能容忍的。因而,有了改進的雙交換機結構的雙機熱備份系統。
在這種網絡結構中,每臺服務器都通過雙網卡分別與兩臺交換機連接。雙網卡形成并聯容錯子系統,雙交換機形成并聯容錯子系統,雙網卡服務器和雙交換機又構成了串聯容錯系統。其容錯結構的示意圖如下:

根據公式和容錯關系,可以用單網卡服務器的失效率Es表示雙網卡服務器的失效率和系統失效率。不妨設服務器中除網卡外其余部分的失效率為X。則
Es=X+En-X*En可解得
X=(Es-En)/(1-En)
雙網卡服務器的失效率Es’和系統失效率P’可計算如下:
Es’=X+En1*En2-X*En1*En2
=(Es—En)/(1-En)+(1-Es)*En*En/(1-En)
=Es-(1-Es)*En
P’ =Es1’*Es2’+Esw1*Esw2-Es1’*Es2’*Esw1*Esw2
=Es’*Es’+Esw*Esw-Es’*Es’*Esw*Esw
=Es’*Es’(1-Esw*Esw)+Esw*Esw
不難看出Es’遠小于Es,P’遠小于P。所以雙交換機、雙服務器的容錯能力遠高于一般的雙機熱備系統。而且,當Es’=Esw=0.001時,P’=0.000001999999,即該容錯網絡的失效率不再受單一因素影響,網絡瓶頸消失。這對安全要求高的計算機網絡系統很有實用價值。
網絡容錯性能的提高是以高昂的成本為代價的。隨著計算機硬件生產技術的發展,單機安全性能日益提高,價格昂貴成為容錯網絡的主要缺點。今天,多數信息化管理人員已經不用進行這種復雜的容錯分析了。最新的服務器本身提供了CPU多路冗余、RAID5磁盤冗余、電源冗余和網卡冗余,整機集成帶來了更高的安全性能。
但是,整機平均無故障時間的延長代替不了容錯設計。對于醫院、電力等要求提供實時不間斷服務的行業用戶,網絡容錯設計仍是非常必要的。在航空領域,甚至采用了四余度的表決容錯系統。計算機容錯網絡正向著專業化、高端化發展。
參考文獻:
1、劉宏.Windows NT4.0使用組網技術[M].中國水利水電出版社,1998.
2、劉錦德.計算機網絡技術及其應用[M].電子科技大學出版社,1997.
3、楊孝宗.計算機容錯技術[M].哈爾濱工業大學出版社,1995.
(作者單位:黑龍江省電力開發公司)