房春玲 王英瑜
(吉林油田試油測試公司信息中心,吉林 138000)
線路故障最常見的情況就是線路不通,診斷這種故障可用ping檢查線路遠端的路由器端口是否還能響應,或檢測該線路上的流量是否還存在。一旦發現遠端路由器端口不通,或該線路沒有流量,則該線路可能出現了故障。這時有幾種處理方法。首先是ping線路兩端路由器端口,檢查兩端的端口是否關閉了。如果其中一端端口沒有響應則可能是路由器端口故障。如果是近端端口關閉,則可檢查端口插頭是否松動,路由器端口是否處于down的狀態;如果是遠端端口關閉,則要通知線路對方進行檢查。進行這些故障處理之后,線路往往就通暢了。如果線路仍然不通,一種可能就得通知線路的提供商檢查線路本身的情況,看是否線路中間被切斷,等等;另一種可能就是路由器配置出錯,比如路由循環了。就是遠端端口路由又指向了線路的近端,這樣線路遠端連接的網絡用戶就不通了,這種故障可以用traceroute來診斷。解決路由循環的方法就是重新配置路由器端口的靜態路由或動態路由。
事實上,線路故障中很多情況都涉及到路由器,因此也可以把一些線路故障歸結為路由器故障。但線路涉及到兩端的路由器,因此在考慮線路故障是要涉及到多個路由器。廂有些路由器故障僅僅涉及到它本身,這些故障比較典型的就是路由器CPU溫度過高、CPU利用率過高和路由器內存余量太小。其中最危險的是路由器CPU溫度過高,因為這可能導致路由器燒毀。而路由器CPU利用率過高和路由器內存余量太小都將直接影響到網絡服務的質量,比如路由器上丟包率就會隨內存余量的下降而上升。檢測這種類型的故障,需要利用MIB變量瀏覽器這種工具,從路由器MIB變量中讀出有關的數據,通常情況下網絡管理系統有專門的管理進程不斷地檢測路由器的關鍵數據,并及時給出報警。而解決這種故障,只有對路由器進行升級、擴內存等,或者重新規劃網絡的拓撲結構。另一種路由器故障就是自身的配置錯誤。比如配置的協議類型不對,配置的端口不對等。這種故障比較少見,但沒有什么特別的發現方法,排除故障就與網絡管理人員的經驗有關了。
主機故障常見的現象就是主機的配置不當。比如,主機配置的IP地址與其他主機沖突,或IP地址根本就不,在子網范圍內,這將導致該主機不能連通。還有一些服務的設置故障。比如E-Mail服務器設置不當導致不能收發E-Mail,或者域名服務器設置不當將導致不能解析域名。主機故障的另一種可能是主機安全故障。比如,主機沒有控制其上的finger,rpc,rlogin等多余服務。而惡意攻擊者可以通過這些多余進程的正常服務或bug攻擊該主機,甚至得到該主機的超級用戶權限等。另外,還有一些主機的其他故障,比如不當共享本機硬盤等,將導致惡意攻擊者非法利用該主機的資源。發現主機故障是一件困難的事情,特別是別人惡意的攻擊。一般可以通過監視主機的流量、或掃描主機端口和服務來防止可能的漏洞。當發現主機受到攻擊之后,應立即分析可能的漏洞,并加以預防,同時通知網絡管理人員注意。
目前網絡管理的工具很多,但很多網絡管理工具都集成到網絡管理系統中,單獨的網絡管理工具不多。但仍然存在一些簡單、實用的網絡管理工具,這些工具包括:連通性測試程序(ping)、路由跟蹤程序(traceroute)和MIB變量瀏覽器。
連通性測試程序就是ping,是一種員常見的網絡工具。用這種工具可以測試端到端的連通性,即檢查源端到目的端網絡是否通暢。ping的原理很簡單,就是從源端向目的端發出一定數量的網絡包,然后從目的端返回這些包的響應,如果在一定的時間內收到響應,則程序返回從包發出到收到的時間間隔,這樣根據時間間隔就可以統計網絡的延遲。如果網絡包的響應在一定時間間隔內沒有收到,則程序認為包丟失,返回請求超時的結果。這樣如果讓ping一次發一定數量的包,然后檢查收到相應的包的數量,則可統計出端到端網絡的丟包率,而丟包率是檢驗網絡質量的重要參數。
在廣域網中,線路一般是網絡的重要對象,因此監測線路的通斷,統計線路的延遲與丟包率是發現網絡故障、檢查網絡質量的重要手段。而網絡中線路兩端一般是路由器的兩個端口,所以通常的監測手段就是登錄到線路一端的路由器端口上ping線路另一端路由器的端口地址,從而掌握該線路的通斷情況和網絡延遲等參數。同時,由于登錄是可以遠程進行的,所以即使網絡管理者在北京,如果他有足夠的權限,他甚至能監測廣州到上海線路的情況。
ping這種工具有一個局限性,它一般一次只能檢測一端到另二端的連通性,而不能一次檢測一端到多端的連通性。因此ping有一種衍生工具就是fping,fping與ping基本類似,唯一的差別就是fping一次可以ping多個IP地址,比如C類的整個網段地址等。網絡管理員經常發現有人依次掃描本網的大量IP地址,其實就是fping做到的。
路由跟蹤程序就是traceroute,在WIN95中是tracert命令。由于ping工具存在一些固有的缺陷,比如從網絡的一臺主機ping另一臺主機,我們可以知道端到端之間的通斷和延遲,但這個端到端之間可能有多條網絡線路組成,中間經過多個路由器。用ping檢查端到端的連通情況,如果不通則無法知道是網絡中哪一條線路不通,即使端到端通暢也無法了解線路中四條線路延遲大,哪條線路質量不好,因此這就需要traceroute工具了。traceroute在某種方面與ping類似,它也是向目的端發出一些網絡包,返回這些包的響應結果,如果有響應也返回響應的延遲。但traceroute與ping的最大區別在于traceroute是把端到端的線路按線路所經過的路由器分成多段,然后以每段返回響應與延遲。如果端到端不通,則用該工具可以檢查到哪個路由器之前都能正常雞應,到哪個路由器就不能響應了,這樣就很容易知道如果線路出現故障,則故障源可能出在哪里。另一方面,如果在線路中某個路由器的路由配置不當,導致路由循環,用traceroute工具可以方便地發現問題。即traceroute一端到另一端時,發現到某一路由器之后,出現的下一個路由器正是上一個路由器,結果出現循環,兩個路由器返回的結果中間來回交替出現,這時往往是那個路由器的路由配置指向了前一個路由器導致路由循環了。
MIB變量瀏覽器是另一種重要的網絡管理工具。在SNMP中,MIB變量包含了路由器的幾乎所有重要參數,對路由器進行管理很大程度上是利用MIB變量來實現的。比如,路由器的路由表、路由器的端口流量數據、路由器中的計費數據、路由器CPU的溫度、負載以及路由器的內存余量等,所有這些數據都是從路由器的MIB變量中采集到的。雖然對MIB變量的定時采集與分析大部分都是程序進行的,但一種圖形界面下的MIB變量瀏覽器也是需要的。一般MIB變量瀏覽器,都按照MIB變量的樹形命名結構進行設計,這樣就可以自頂向下,根據所要瀏覽的MIB變量的類別逐步找到該變量,而無需記住該變量復雜的名字。網絡管理人員可以利用MIB變量韌覽器取出路由器當前的配置信息、性能參數以及統計數據等,對網絡情況進行監視。
[1]《網絡管理與維護實用教程》