單位接入路由器出現傳輸速率明顯下降,訪問內部網站時延較大,而且多個網絡通信端口都有嚴重數據丟失現象。重新開啟路由器時網絡運行正常,但上網一段時間后就經常掉線,關閉路由器后再重啟又可以連通網絡。
引起這種故障的原因比較復雜,可能是由于硬件方面的問題,也可能是由于路由協議設置不當造成的,還有可能是受網絡攻擊、病毒感染、路由器內存不足或者占用過多,以及路由器CPU持續過載等,都有可能導致這種現象的發生。先從輸入電源和工作環境排查,均未發現可疑現象。遭受木馬病毒攻擊是網絡頻繁掉線的一個典型特征,因此懷疑可能網內有遭受病毒或ARP攻擊的用戶,因計算機感染病毒或木馬,對內部網絡進行阻斷性流量攻擊所致。為此,使用查毒軟件和木馬專殺工具,掃描檢測各用戶計算機硬盤,重新安裝軟件防火墻。通過檢查未發現內部計算機受病毒感染的嚴重癥狀,基本上排除病毒或木馬攻擊的可能。
使 用“disp memory”命令查看路由器內存使用情況(如圖 1),發現路由器內存利用率32%,可用內存足夠,排除內存不足的原因。然后使用“disp cpu-usage”命令查看路由器的CPU利用率(如圖 2),發現 CPU利用率已經超過80%,屬于嚴重過載。正常情況下5分鐘內CPU利用率不應大于60%,如果長時間持續過載,則會導致路由器工作效率下降,進而導致一個或者多個端口轉發的數據包丟失。
繼續分析導致路由器掉線或網絡丟包問題出現的其他原因,需要借助網管軟件對網絡情況進行分析判斷。通過監測網內流量和網絡丟包的時間特征分析,可能是在共享網絡中存在大流量下載等影響網速問題的用戶訪問。因此,在頻繁掉線發生的時間范圍,檢查局域網內是否有經常使用各種軟件上傳下載電影音樂等的用戶,并分析用戶使用特征及影響因素,逐步逼近問題根源。

圖1 路由器內存占用情況

圖2 路由器CPU利用率情況
為確切分析流量來源,借助Sniffer工具軟件統計分析網絡通信流量情況,發現BT點對點傳輸占用了大量帶寬,基本確定網絡故障是由于用戶使用BT軟件上傳下載大容量資源,導致嚴重影響網絡性能。
隨著內部網絡覆蓋范圍的擴大,網絡帶寬資源管理日益重要,在對單位各部門入網限速的同時,還應對占用大量帶寬資源的應用實施有效的監管。為此,采取以下措施加以解決。
一是分析整個網絡內部結構,按單位組成結構基于各交換機端口劃分樹型層級VLAN,對不同VLAN組用戶以及用戶與服務器之間進行有效隔離,確保每個子網環境相對獨立性,利用VLAN對邏輯網絡的隔離特性,有效防止網絡沖突和廣播風暴等網絡阻塞問題。
二是借助路由器IP訪問列表禁用BT端口,并將該IP列表應用于路由器LAN端口。同時,在內網防火墻上添加訪問控制策略,禁止BT等大流量應用通過。此后,路由器工作狀態恢復正常,網絡用戶訪問丟包現象基本消失。
另外,路由器、文換機等網絡設備對電源和接地特性都較敏感,為此,更換性能優良的在線式UPS作為供電電源,采取措施改進網絡機房接地性能,改善機房工作環境,提高供電穩定性,確保網絡設備和信息系統正常運行。