引言:筆者單位內部網絡間都采用OSPF動態路由協議。OSPF使用廣播在路由拓撲結構中交換路由的變化信息,從而選擇最小代價量度的路由,一旦建立鄰居關系之后,雙方路由器開始通信,周期性地互發Hello數據包來維護鄰居關系,并更新OSPF鏈路狀態數據庫。但是,可能由于通信鏈路質量不佳、設備故障和配置丟失等原因造成路由協議未能啟用,導致通信網絡故障。本文筆者就結合實例和大家共同探討。
故障現象一
最近,由于單位網絡升級改造,單位與下級單位之間擴容為兩條相同帶寬的路由,一主一備分擔網絡負荷,提高網絡通信的穩定性。下級單位報告說,升級改造后網絡速度的確有了明顯提高,但網速好了一段時間后就回到了升級改造前,上網速率非常慢,網絡擁塞現象比較明顯。
分析與排除:首先通過show ip route查看路由表,發現本級和下級單位之間只有一條主用信道的路由在用,而備用信道的路由沒有啟動。這就使得實際通信帶寬減少了50%,交換處理能力下降,網速降低。
而后輸入命令show ip ospf neighbor,通過查看OSPF配置,發現在該備用信道上,單位和分部之間并未建立鄰居關系。嘗試啟用OSPF協 議,其具體配置命令如下:
(global)router ospf 1
(router)network 互連網段 通配掩碼 area 0
例如,本級單位與下級單位的互聯網段是10.10.11.1/29,則 上 行 命令 為 :(router)network 10.10.11.1 0.0.0.7 area 0
執行命令后,顯示雙方鄰居關系建立成功,兩條信道通信正常,故障排除。
故障現象二:下級單位報告聯不上網,網絡聯接不通。分析與排除:首先觀察本單位到下級單位的物理端口是否正常,如果不正常,可能的原因是:一是本級單位到下級單位的線路阻斷,則處理線路問題。二是本單位到下級單位的端口損壞或者是下級單位的出口端口損壞,更換端口即可。
如果物理端口正常,則需要測試網絡的連通性。登錄路由器Ping下級單位路由器,如果不通,輸入命令“tracert 目的地址”,出現“** *”,說明該地址不可達,跟蹤不到路由。筆者最后用show ip route命令查看故障網絡的路由路徑時,發現下掛用戶的端口顯示line up、line protocle down,表明兩個路由器之間物理鏈路是Up的,但協議是Down的。通過比對兩端配置,確認網間網IP地址配置正確。再次輸入命令show ip ospf neighbor,發現 OSPF 協議未啟動。
故障原因查找到了,排除方法也比較簡單,按照故障一中的方法啟動OSPF協議后,再Ping下級單位的路由器網關,網絡測試通過,故障排除。

圖1 路由器的部分日志信息
故障現象三:單位某部門報告說網絡不通,通過現場查看發現無法Ping通路由器網關,但可以Ping通匯聚層交換機。
分析與排除:筆者首先排除了匯聚層以下可能導致網絡故障的因素,直接登錄單位路由器查看日志信息,發現在互聯線路質量不好的時間段,與該用戶交換機直連的端口頻繁出現Up/Down告警。圖1為路由器的部分日志信息。
很快,該端口變為errdisable狀態,對應的日志信息如下:
*Feb 9 10:46:31.967
ZZ: %PM-SP-4-
ERR DISABLE: link
flap error detected
on fastEthernet9/12,
putting in err-disable
state
*Feb 9 10:46:32.147 ZZ: %PM-SP-STDBY-4-ERR DISABLE: linkflap error detected on fastEthernet9/12, putting in err-disable s
查閱技術資料,該款路由器的以太網端口反復出現告警后會造成網絡不通。原因是該設備廠商為保證網絡的可靠性,啟用了保護功能:如在10秒鐘內路由器的以太網端口反復出現5次以上Up/Down告警,路由器會因檢測到端口出現linkflap error錯誤,而將端口置于err-disable狀態。
針對這種情況,廠商也提供了相對應的自動恢復功能,只不過該功能默認關閉。輸入命令“errdisable recovery cause Linkflap”,可以啟動自動回復功能,提示設置自動恢復延時,默認為300秒,根據實際情況,設置自動恢復延時即可。