江 杰
一、網絡故障診斷原則
網絡診斷是一門綜合性技術,以網絡原理、網絡配置和網絡運行的知識為基礎。從故障現象出發,以網絡診斷工具為手段獲取診斷信息,確定網絡故障點,查找問題的根源,排除故障,恢復網絡正常運行。
網絡故障診斷應該實現三方面的目的:確定網絡的故障點,恢復網絡的正常運行;發現網絡規劃和配置中欠佳之處,改善和優化網絡的性能;觀察網絡的運行狀況,及時預測網絡通信質量。
網絡故障通常有以下幾種可能:1、物理層中物理設備相互連接失敗或者硬件及線路本身的問題。2、數據鏈路層的網絡設備的接口配置問題。3、網絡層網絡協議配置或操作錯誤。4、傳輸層的設備性能或通信擁塞問題。5、上三層或網絡應用程序錯誤。
網絡故障的診斷過程應該沿著OSI七層模型從物理層開始向上進行。首先檢查物理層,然后檢查數據鏈路層,以此類推,設法確定通信失敗的故障點,直到系統通信恢復正常為止。
網絡診斷可以使用包括局域網或廣域網分析在內的多種工具:路由器診斷命令、網絡管理工具和其他故障診斷工具。一般情況下查看路由表是解決網絡故障的起點。ICMP的ping、trace命令和cisco的show命令、debug命令是獲取故障診斷有用信息的網絡工具。通常使用一個或多個命令收集相應的信息。
二、網絡故障的分類
(一)按網絡故障的性質分類
1、硬件故障:硬件故障指的是設備或線路損壞、插頭松動、線路受到嚴重電磁干擾等情況。
2、軟件故障:軟件故障中最常見的情況就是配置錯誤,就是指因為網絡主機或網絡設備的配置原因而導致的網絡異?;蚬收?。
另一類軟件故障就是一些重要進程或端口關閉,以及系統的負載過高導致。
(二)按網絡故障的對象分類
1、線路故障:線路故障最常見的情況就是線路不通,診斷這種情況首先檢查該線路上流量是否還存在,然后用ping命令檢查線路遠端的路由器端口能否響應,用traceroute命令檢查路由器配置是否正確,然后找出問題逐個解決。
2、路由器故障:線路故障中的很多情況都涉及到路由器,因此也可以把一些線路故障歸結為路由器故障。檢測路由器故障,需要易用MIB變量瀏覽器,用它收集路由器的路由表、端口流量數據、計費數據、路由器CPU的溫度、負載以及路由器的內存余量等數據。通常情況下網絡管理系統有專門的管理進程不斷地檢測路由器的關鍵數據,并及時給出報警。
3、主機故障:主機故障常見的現象就是主機的配置不當。例如主機配置的IP地址與其它主機沖突,或IP地址根本就不存在子網范圍內,由此導致主機無法連通。主機的另一故障就是安全故障。
三、網絡故障診斷步驟
網絡故障以某種癥狀表現出來,故障癥狀包括一般性的(象用戶不能接入某個服務器)和較特殊的(如路由器不在路由表中)。對每一個癥狀使用特定的故障診斷工具和方法都能查找出一個或多個故障原因。
一般故障診斷及排除模式如下:
第一步,當分析網絡故障時,首先要清楚故障現象。應該詳細說明故障的癥候和潛在的原因。為此,要確定故障的具體現象,然后確定造成這種故障現象的原因的類型。例如,主機不響應客戶請求服務??赡艿墓收显蚴侵鳈C配置問題、接口卡故障或路由器配置命令丟失等。
第二步,收集需要的用于幫助隔離可能故障原因的信息。向用戶、網絡管理員、管理者和其他關鍵人物提一些和故障有關的問題。廣泛的從網絡管理系統、協議分析跟蹤、路由器診斷命令的輸出報告或軟件說明書中收集有用的信息。
第三步,根據收集到的情況考慮可能的故障原因。町以根據有關情況排除某些故障原因。例如,根據某些資料可以排除硬件故障,把注意力放軟件原因上。對于任何機會都應該設法減少可能的故障原因,以至于盡快的策劃出有效的故障診斷計劃。
第四步,根據最后的可能的故障原因,建立一個診斷計劃。開始僅用一個最可能的故障原因進行診斷活動,這樣可以容易恢復到故障的原始狀態。如果一次同時考慮一個以上的故障原因,試圖返回故障原始狀態就困難的多了。
第五步,執行診斷計劃,認真做好每一步測試和觀察,直到故障癥狀消失。
第六步,每改變一個參數都要確認其結果。分析結果確定問題是否解決,如果沒有解決,繼續下去,直到解決。
四、路由器接口故障排除
(一)故障排除一般過程。第一步:收集故障現象:第二步:收集能夠確定故障原因的一切信息;第三步:根據收集到的信息考慮可能的故障原因;第四步:根據可能的故障原因,建立一個診斷計劃;第五步:執行診斷計劃,做好每一步測試和觀察,每改變一個參數都要確認其結果,只至故障癥狀消失。
(二)路由器的串口故障排除。串口出現連通性問題時,一般是從show interface serial命令開始,分析屏幕輸出的報告內容,找出問題之所在。接口和線路協議的可能組合有以下幾種:
1、串口運行、線路協議運行,這是完全的工作條件。
2、串口運行、線路協議關閉,這說明可能的故障發生在路南器配置、調制解調器等方面。
3、串口和線路協議都關閉,可能是電信部門的線蹄故障、電纜故障或者是調制解調器故障。
4、串口管理性關閉和線路協議關閉,這種情況是在接口配置中輸入了shutdown命令??梢酝ㄟ^輸入no shutdown命令,打開串口連接。
(三)路由器的以太接口故障排除。以太接口的典型故障問題是寬帶的過分利用,碰撞沖突次數頻繁。使用不兼容的幀類型。使用show interface ethernet命令可以查看該接口的吞吐量、碰撞沖突、信息包丟失、以及幀類型的有關內容等。
1、通過查看接口的吞吐量可以檢測網絡的利用。
2、當兩個基本點接口試圖同時傳輸信息包到以太電纜上時,將發生碰撞。碰撞沖突產生擁塞,碰撞沖突的原因通常是由于敷設的電纜過長或者過分利用。
3、如果接口和線路協議報告運行狀態無誤,并且節點的物理連接都完好,可是不能通信,引起問題的原因也可能是兩個節點使用了不兼容的幀類型。解決問題的辦法是重新配置使用相同幀類型。
五、結語
網絡發生故障是不可避免的。網絡建成運行后,網絡故障診斷是網絡管理的重要技術工作。搞好網絡的運行管理和故障診斷工作,提高故障診斷水平需要注意以下幾方面的問題:認真學習有關網絡技術理論;清楚網絡的結構設計,包括網絡拓樸、設備連接、系統參數設置及軟件使用:了解網絡正常運行狀況、注意收集網絡正常運行時的各種狀態和報告輸出參數;熟悉常用的診斷工具,準確的描述故障現象。總之,作為網絡管理人員的最大職責就是利用一切可能利用的方法保障網絡安全暢通運行。