李紹昆
摘 要:作為計算機網(wǎng)絡維護管理人員,面對的是龐大的網(wǎng)絡系統(tǒng)、復雜的網(wǎng)絡設備和系統(tǒng)的不斷擴充與升級。要想保證網(wǎng)絡順暢運行,必需做好預防性日常維護管理工作,要在熟悉網(wǎng)絡技術體系和設備性能的基礎上,掌握網(wǎng)絡技障分析與排除的原則、方法和過程;學會操作使用相關測試分析工具和儀表;勤于實踐,積累經(jīng)驗,以期達到快速準確地分析和排除故障的目的。本文針對計算機網(wǎng)絡故障的診斷與排除的相關問題進行了分析與研究,希望能夠為相關領域提供一些幫助。
關鍵詞:計算機;網(wǎng)絡故障;診斷與排除
一、識別故障現(xiàn)象
在進行故障排除之前,必須確切地知道網(wǎng)絡到底出現(xiàn)了什么問題,無法共享網(wǎng)絡、不能瀏覽網(wǎng)頁,還是在“網(wǎng)上鄰居”中查不到對方的計算機。知道出現(xiàn)了什么問題并能夠及時的對其進行定位是成功排除故障的首要條件,所以我們在進行排查網(wǎng)絡故障的時候一定要找到處理問題的出發(fā)點:
總體說來,在識別網(wǎng)絡故障的時候要注意下面幾個方面:
(1)當網(wǎng)絡發(fā)生故障的時候,正在運行哪些程序?
(2)這些程序以前是否成功運行過?
(3)如果成功運行過,最后一次運行是在什么時候?
(4)第一次發(fā)生故障之前,對系統(tǒng)配置、軟件配置以及硬件設備配置,做了哪些更改?
二、收集相關信息
(1)以前是否正常
—個曾經(jīng)工作正常然后出現(xiàn)故障的設備與一個從未正常工作的設備之間存在著巨大的差別。如果某個發(fā)生故障的設備曾經(jīng)工作正常,我們可以推論一定是什么原因破壞了這種過程;我們應該進入故障分析模式,并且繼續(xù)與用戶的交流。
(2)故障發(fā)生時間
假設發(fā)生故障的部件以前能夠正常工作,那么您必須確認這種故障的發(fā)生時間。提出這個問題的目的不僅僅是為了確定故障發(fā)生的時間和日期,同時也是為了確定當時哪些事件導致了故障。例如當故隱發(fā)生的時候是否有其他的應用程序正在運行或者正在打開空調(diào)等事件。
(3)系統(tǒng)變動情況
安裝新的應用程序、硬件設備或?qū)ΜF(xiàn)有程序和硬件進行升級都可能導致故障的發(fā)生。您自己也必須考由這個伺題,是否財網(wǎng)絡設置進行的更改導致了故障?是否對服務器進行了升級或者是對路由器曲配置進行了更新?
(4)網(wǎng)絡基準信息
當網(wǎng)絡正確配置和運行時測試基準,然后間斷住地進行這種檢測。將這種間斷性的基準和先前的基準進行比較。以確定其是否可以預示發(fā)展的趨勢以及前面可能遇到的問題。這些信息可以與實際排除故障時所收集到的統(tǒng)計資料進行比較,并且可以指明故障的原因。
三、列舉故障原因
在得知了詳細的網(wǎng)絡故障情況之后,用戶就要從多方面來列舉有可能導致故障的原因。比如無法瀏覽網(wǎng)頁時,到底是網(wǎng)卡硬件故障、網(wǎng)絡連接故障、網(wǎng)絡協(xié)議設置不當,還是歷瀏覽器的參數(shù)設置有誤。這時不可能一下子找出最終問題的根源所在,只能根據(jù)出錯的可能性將所有導致故障的原因逐一列舉出來。記住,不要忽略其中的任何一個故障產(chǎn)生原因。
四、設計排障方案
當分析了可能導致故障的原因以后,就可以方便的設計相關的解決方案了。
在設計某種解決方案之前,必須考慮下面問題:
(1)所確定的原因是否真是故降原因所在。
(2)是否可以對設定的解決方案進行充分的測試。
(3)設定的解決方案應該得出什么樣的結果。
(4)所設定的解決方案對于網(wǎng)絡的其他部分是如何處理的。
在實施一項計劃之前,您必須做好這樣的準備:這種方案可能會產(chǎn)生比現(xiàn)有故隨更壞的影響無論故障以及相應的解決方案涉及到的是整個網(wǎng)絡或者是個別的用戶,您都必須了解如何將事件恢復到應用方案前的初始狀態(tài)。基于對故障范圍以及解決方案助理解程度,您需要做以下一些工作:
(1)保存全部的網(wǎng)絡設置配置文件。
(2)對工作站的配置文件進行備份記錄。
(3)記錄配線室的結構,包括設備的位置以及網(wǎng)絡的連接等。
(4)建立最終的基準以便于新舊結果對照,同時在需要恢復時可以作為比較的準則。
五、實施故障排除
在實施排障方案時,一般一次只改變一個變量,否則就不知道哪個改變導致了問題的修復。此外,有一個恢復計劃是重要的,以防所做他的行動使情況變得更糟。比如,在實施方案中,包含一個初始化的步驟,保存現(xiàn)有的配置。如果問題出現(xiàn)了,可以使用保存的配置返回到一個已知的狀態(tài)。
在實施過程中應該設計一些中間環(huán)節(jié),以便在一些關鍵點進行測試,而不是在整個方案構實施過程結束以后,再對結果作出評價。逐步對一些個體進行測試遠比對整個解決方案進行測試要簡單得多。因為前者可能產(chǎn)生有限的故障,而后者卻可能在許多方面產(chǎn)生故障。
當計劃方案會對網(wǎng)絡中的其他部分和其他用戶產(chǎn)生影響時,必須通知用戶在實施過程中可能受到影響的服務,以便用戶有充分的時間來安排停機時間。
當完成了方案列表的制訂以及中間測試步驟的安排,并且通知了相應的用戶以后,就可以將方案付諸實施了。
六、檢驗排障效果
基于排障方案,處理了一個變量后,收集數(shù)據(jù),看是否已經(jīng)修復了問題。測試做出的所有修復,確信沒有使問題變得更糟或引入新的問題。讓用戶再次運行他們的應用程序,以驗證問題是否已經(jīng)被處理了。如果還沒有修復問題,重復以上解決過程。
應該全面測試已經(jīng)實施的操作。測試過程應該盡可能地模擬實際情況。例如在解決一臺發(fā)生故障的工作站時,僅使用Ping工具確定其與服務器的連接是不夠的。如果可能,您應該以系統(tǒng)用戶的身份登錄網(wǎng)絡,然后再嘗試運行位于工作站上的程序。最后記錄下相關的信息。
七、填寫排障記錄
在確認故障排除后,要制作一個連貫的故障排除記錄文檔。其主要內(nèi)容,應包括所有與故障相關的信息,如:故障定義、解決方法、操作過程、測試手段、測試步驟、調(diào)試結論等。這樣,將來在同樣或類似的故障出現(xiàn)時,就可以通過查閱此排障文檔,很方便地解決問題。
八、采取預防措施
一個優(yōu)秀的網(wǎng)絡管理員,不僅能夠排除各種網(wǎng)絡故障,而且還耍制定相應的對策,來防止此類問題的再次發(fā)生。比如,若網(wǎng)絡故障是由于系統(tǒng)或者應用程序參數(shù)變更引起的,那么,就要告訴用戶,在以后的使用中,不要擅自修改這些參數(shù)。假設故障是由于某種網(wǎng)絡傳播的病毒引起的,那么,就可以通過安裝相應的防病毒軟件,以及強化軟件管理和電子郵件下載等手段,來預防相同故障的發(fā)生。設計預防措施是一種主動的網(wǎng)絡管理方式,而不是一種被動的管理方式。
參考文獻
[1]李學聰,萬頻,李敏,宋亞男,李軍. 基于組合導航系統(tǒng)的網(wǎng)絡故障檢測與容錯技術研究[J]計算技術與自動化, 2010, (02) .
[2]劉紅. 嵌入式系統(tǒng)技術發(fā)展趨勢淺析[J]中國建設教育, 2010, (10) .