席曉宇
摘 要 隨著時代的發展,信息技術的進步,計算機已經逐漸的成為了各行各業中不可取代的一部分,我國對于計算機技術的應用也十分的廣泛。其中,計算機服務器系統是計算機中十分重要的一個技術,能夠為國防、醫療以及金融等各個行業為計算機系統提供不間斷的服務,如果它出現問題那么會造成十分嚴重的損失,因此應該對于計算機服務器系統的容錯技術進行足夠的重視并且對其進行進一步的發展。本文主要對其進行了詳細的闡述。
關鍵詞 計算機 服務器系統 容錯技術
中圖分類號:TP302.8 文獻標識碼:A
1容錯必要性
隨著計算機技術的普及,通過計算機系統來進行信息的傳輸并提供服務逐漸應用的越來越廣泛,但是計算機的軟硬件都有可能會發生故障,這些故障如果沒有及時的進行解決很容易造成巨大的損失,甚至會造成整個服務的終止網絡也會因此而癱瘓,因此產生難以估量的損失。因此,系統的容錯性以及不間斷的性質顯得尤為重要,為了能夠更好地保證系統安全、可靠地運行,必須要采取一定的措施來保證計算機系統能夠在出現故障的時候已然可以正常的使用。經過人們地長時間的研究,總結出來了兩種方法,一種叫做避錯,就是使用正確的設計并且進行相應的質量控制盡可能的避免系統產生錯誤,防止將錯誤引進系統之中,但是在實際的運行中難免會產生一些意料之外的事情,因此這種方法在實施起來有著很大的難度。另外一種就是容錯,在系統中出現了某些硬件或者軟件的錯誤的時候,系統能夠執行規定的一組程序,或者說這種程序不會因為系統的故障而被中斷或者在中途被修改,且其執行的結果也不包含系統中的故障引起的差錯。
隨著科技的不斷發展,計算機技術的逐漸普及,設備的安全性以及可靠性逐漸的引起了越來越多的人的重視,因此計算機服務器系統的容錯技術十分重要。當系統的內部出現故障的時候,通過容錯技術能夠消除故障產生的影響并且使系統最終仍然能夠給出正確的結果。按照時間進行故障的劃分,故障可以分為以下幾種類型:永久性的故障、間歇性的故障以及偶然性的故障。隨著計算機的硬件技術的不斷發展,容錯計算機的系統開銷逐漸的降低,同時糾錯的速度變得越來越快。而軟件方面的容錯,對于硬件不會提出過高的要求。
2容錯技術概述
容錯指的是計算機系統的一個或者多個關鍵的部件發生故障或者將要發生故障的時候,仍然能夠保持正常的工作而不影響其正確結果的一種性能或者是措施。容錯往往是使用榮譽的方法來對故障及西寧消除的,因此冗余技術是計算機的容錯技術的基礎,一般情況下冗余技術可以分為以下的幾種類型。
2.1硬件冗余
這種冗余技術指的是通過增加一定的硬件設備的方式來檢測或者屏蔽一些故障。硬件冗余中可以將其再細化分為部分冗余和完全冗余兩種主要的方式,對于完全冗余的方式來看,可以按照工作方式的不同而將其劃分為熱備、冷備、溫備以及雙工等四種工作方式。
在機器處于熱備工作方式時,兩個互為冗余的計算機系統都是處于加電的工作狀態的,但是熱備的計算機系統對于系統的處理結果不會輸出。在主計算機系統發生故障的時候,熱備計算機系統直接的接手主系統開始進行工作,在系統的故障修復完畢以后,熱備的機器又再次的處于備用的狀態。
與此相對的,冷備工作方式和熱備工作方式存在一定的差異,冷備工作方式的備用計算機系統沒有進行加電,當主機發生故障的時候冷備機器才會進行接手,在故障完成以后冷備機器又會重新的變成備用機器。
而溫備的機器的工作方式則是冗余的兩個系統都是處于加電的狀態的,其中一個正在工作,另外一個處于等待的狀態。如果工作的機器發生了故障,那么另外一個機器就能夠直接進行接手工作,并且在故障結束以后主機繼續工作,備用的機器繼續變為備用狀態。
雙工的工作方式,指的就是在這個方式中兩個機器處于同時工作的狀態,并且將處理結果進行輸出,在發生了故障以后,對兩個機器的結果進行比較之后再進行輸出,這樣能夠盡可能的降低故障造成的損傷。
2.2軟件冗余
軟件冗余指的是為了能夠檢測或者屏蔽軟件中的一些差錯,增加一些在正常運行的時候不需要的軟件方法。和硬件系統的故障研究相比較而言,對于軟件的錯誤進行糾正顯得更加的困難,目前為止還沒有一個相對來說比較成熟的、完整的方法來檢測系統中軟件的可靠性、安全性。目前來看,比較普遍使用的對于軟件故障的處理方式有兩種,一種是前向回復,一種是后向恢復。
其中,前向恢復主要指的是將計算機的當前計算狀態繼續的進行下去,然后將之后的狀態能夠正確的和當前的狀態連接起來使其具有連貫性。目前來看使用的前向恢復狀態的方法主要是N-versionProgramming方法,這種方法的基本思路是由不同的團隊開始進行獨立化的設計,然后通過使用不同的方法以及不同的設計語言,在不同的開發環境下使用不同的目的來展示同一個結果,這樣就能夠減少在各個版本的軟件上出現相關的錯誤的可能性。
而后向錯誤指的就是在計算機的軟件出現故障以后,將計算機的系統狀態恢復到之前的某一個正確的狀態上。目前來看比較普遍的一種后向恢復方式主要有恢復塊方法以及防衛式程序設計兩種方式。其中恢復塊方法就是在同一個功能下,有主塊和多個后備塊,當主塊運行的時候如果沒有通過最后的驗收測試,那么就指令第一個后備塊開始進行工作,使其吃呢個為主塊然后以此為順序直到所有的后備塊都被耗盡。在這樣的方式下,設計出來的主塊以及后備塊應該盡可能的保持相對的獨立性,這樣就不會因為主塊出現了錯誤而導致后備塊的運行受到影響。
2.3信息冗余
所謂信息冗余指的就是除了實現正常的功能所需要的信息之外,額外的增加一些信息來保證程序能夠正常的運行并且得到正確的結果。這些冗余的信息往往被加入到原始的數據中,加入的信息通常情況下包括檢錯以及糾錯這兩種編碼。我們使用加入的檢測編碼來自動的檢測軟件中具有的錯誤,同時使用糾錯的編碼來對錯誤進行糾正。
2.4時間冗余
時間冗余就是通過額外的增加一定的時間來完成系統的某些功能,這些附加的時間主要能夠用來進行故障的檢測、或者故障的屏蔽上面。
目前來看,比較流行的時間榮譽方式有兩種,一種是RSHW,這種冗余方式主要是對一組數據執行同一種指令,然后通過在相同的硬件上在不同的時間片對這些指令進行執行。另一種時間冗余方式則是使用數據延遲設備將其與表決電路結合到一起,將一次數據處理的輸出結果進行不同的延遲大小的設置,使其能夠復制成多個版本并且在表決器中進行比較。
2.5簡單的雙機備份
這種方式主要在20世紀30年代的時候得到了廣泛的應用,通過使用雙處理機或者雙機的方式來進行容錯。根據系統的工作情況的不同,又可以將之微熱備份和冷備份這兩種情況。
其中,雙機熱備份技術是一種將軟硬件很好地結合起來的一種方案,這種方案主要包括兩臺服務器以及一個恭喜那個的磁盤陣列柜,還有相應的程序。在這種技術中,有著專業的人員對數據進行管理,并且這些數據是存放在這些磁盤陣列柜中,這樣能夠使得數據十分安全。在工作的時候,數據通過中央儲存器進行讀取以及存儲,這樣在實際的工作過程中及時主服務器出現了一定的問題,也能夠有另外一臺服務器理科的啟動并且同時接替該主服務器的工作,從而保證了系統能夠安全的運行。為了保證這個系統能夠正常的運行工作,這個系統中運用了兩臺服務器,兩臺服務器之間互相的發送通訊信號從而保證聯系,服務器在之前會約定好一定的時間間隔進行信號的發送,如果某一臺服務器沒有及時的發送信息,那么另外一臺服務器就可以判斷出這臺服務器存在問題,系統的相應管理軟件就會迅速的啟動備用的系統,這樣能夠維持系統不間斷的正常的進行工作。
而雙機熱備份方案中還可以進一步的區分出這樣的三種模式:雙機熱備模式、雙機互備模式、雙機雙工模式。
(1)雙機熱備模式,在這樣的模式中存在著主服務器以及備用的服務器,這兩臺服務器能夠同時的對數據進行寫入,這樣就保證了數據的同步。而當主服務器發生故障的時候,備用的服務器就能夠及時的被激活,從而保證了服務器始終運行嗎,確保了系統的安全。
(2)雙機互備模式。這種模式下,系統中存在兩臺服務器并且這兩臺服務器能夠同時的運行兩個獨立的應用,在運行的時候無論哪一臺的服務器發生故障,另外一臺服務器都能夠接管這一臺服務器的內容并且繼續工作下去,這樣就保證了的服務能夠連續的運行,因此有著很高的安全性,并且這種模式下對于服務器有著較高的配置要求。
(3)雙機雙工模式。在這種模式下,即有兩臺服務器,這兩臺服務器能夠同時的工作,并且運行的程序是一樣的,這樣能夠保證負載較為均衡。
2.6操作系統支持的雙機備份
這種冗余方式進行容錯主要是在20世紀70年代的中期出現的,是一種軟件和硬件結構的容錯方式,這種容錯方法是在操作系統的層次上的,支持聯機的維修,也就是說故障部分在退出以后能夠及時的進行維修并且在維修之后重新的投入到運行中,這個過程中對于正常的正在運行的程序不會產生影響。系統的容錯是在操作系統下進行控制的,每一個處理機上面都保持了所有的系統資源的狀態的表格,以及本機和其他機所具有的相關工作的工作進程。
2.7單機容錯
所謂單機容錯指的就是在系統中只使用一臺服務器來進行一種高性能的容錯。這種方式和其他的容錯技術相比較而言所具有的最大優勢就是能夠把發貨所能故障的模塊自動的分離出去,并且把故障的模塊和備用的模塊記性調換,在故障的部分被排除以后,使用相應的容錯技術能夠保證系統繼續的運行下去。為了實現真正的容錯,單機的容錯服務器能夠通過系統內部的所有冗余的部件進行同步的運行。并且由于單機的容錯方式實際上只需要使用一臺服務器,而雙機的容錯模式則需要使用兩臺服務器,因此單機的容錯方式相對表而言投入更少一些。目前市場上使用的單機容錯產品除了有著較好的兼容性之外,還能夠支持主板等關鍵性的硬件的熱插拔,用起來十分的方便。
3結論
隨著計算機技術逐漸的成為了人們的工作學習生活中不可或缺的一部分,人們對于計算機的依賴程度的增加,計算機服務器的故障性問題也逐漸的引起了越來越多的人的重視,其直接的影響到計算機的性能,并且如果沒有設置相應的容錯方案很有可能產生巨大的財產損失。因此,本文主要在介紹了計算機容錯的必要性的基礎上,對于現有的計算機服務器系統的容錯技術進行了詳細的分析,希望能夠起到一定的參考價值,促進未來計算機服務器系統的容錯技術的進一步發展。
參考文獻
[1] 史飛.關于計算機服務器系統的容錯技術[J].中小企業管理與科技(下旬刊),2016,(06):171-172.
[2] 吳輝明.關于計算機服務器系統的容錯技術[J].電子測試,2015,(12):60-61.
[3] 吳玥.淺析計算機服務器系統的容錯技術[J].無線互聯科技,2014,(11):67-68.
[4] 許敏.分布式文件系統容錯機制的研究與實現[D].電子科技大學,2012.
[5] 楚國鋒.基于LoadRunner的高端容錯機性能評測系統的研究與設計[D].哈爾濱工業大學,2010.
[6] 陳匯遠.計算機信息系統安全技術的研究及其應用[D].鐵道部科學研究院,2004.
[7] 邵艷明.集群視頻服務器容錯與流共享策略研究[D].華中科技大學,2004.
[8] 谷國棟.容錯冗余技術研究及其在水利樞紐工程計算機監控系統中的應用[D].河海大學,2001.
[9] 莊蓉茹.集群系統下的通信系統開發[D].昆明理工大學,2001.