引言:無線路由器是如今使用得越來越多的設備,由其引發的各種網絡問題也不容小覷。筆者單位因業務需要添加了一臺新購置的無線路由器。然而,就是這臺新購置的路由器造成了網絡故障。本文介紹故障的排查及結果過程。
單位網絡使用三層結構,用戶電腦及室內交換機等接入樓層弱電井匯聚層交換機,再由匯聚層交換機接入機房核心三層交換機。核心交換機上接有新聞采編系統等業務系統服務器,防火墻、負載均衡等設備。采用華為eSihgt網管系統,可以對匯聚層及核心網絡交換機等可網管設備進行管理。
單位網絡的設計原本并未考慮無線上網的需求,但隨著無線上網越來越普及,特別是近年來單位開發了掌上長沙手機新聞客戶端APP后,用戶對無線上網的需求越來越多。技術部在部分樓層增設了無線上網設備,但覆蓋率不能完全滿足用戶要求,有時在重點部位應用戶要求還需增設小型無線路由器。隨著無線設備的增加,網絡故障發生率也在悄悄增加。

圖1 故障端口本月帶寬利用率及端口速率(包含輸入輸出)監控圖

圖2 非故障端口本月帶寬利用率及端口速率(包含輸入輸出)監控圖
某日下午,多個部門先后反映多臺電腦不能上網。到現場查看的同事發現,故障有如下共同點:故障電腦都連接在同一臺室內小型交換機上,分布在不同樓層的不同部門。交換機上還連有其他已關機的電腦,并且這些已關機電腦網線燈閃爍,證明有數據在傳輸。將室內交換機上連接的已關機的電腦斷電或開機,故障可以排除。
技術部同事當天晚上加班時,對白天發生過故障的端口進行了監測,故障并未再現,但在凌晨仍有別的部門上晚班的同事反映,需共享的視頻無法傳遞。第二天正好是周末,因單位上班的人數相對較少,技術部僅安排筆者一人上班,筆者密切監視網絡,同時用Wireshark抓包工具在不同時間段抓包,也未見異常。登錄eSight網管系統,對發生故障及未發生故障的室內交換機接入端口同時進行監測比對,發現發生故障的端口在故障當天帶寬流出利用率及端口流出速率出都達到了本月峰值(如圖1),未發生故障的端口帶寬接收速率也達到了近期的峰值(如圖2)。
到底是什么原因導致故障當天數據量猛增呢?轉眼快到下午5點了,由于晚上是出報時間,上網的人數漸漸多了起來。突然電話鈴響了,夜班編輯中心有同事反映不能上網。趕到現場,在不能上網的電腦上安裝Wireshark進行抓包分析,軟件運行后幾乎卡死,原來是有大量的UDP數據在網絡中發送,造成抓包軟件響應遲緩,據軟件統計,76秒內有150多萬條,且數據包的大小都一致,顯然是非正常的通訊數據包(如圖3)
終于找到原因了,于是根據發包的源IP地址在設備管理系統里查找相應設備,根據登記的資料顯示,是夜班編輯中心的一臺電腦。但是拔除這臺正在使用的電腦網線后,大量發包現像仍存在。仔細核對Wireshark中抓到的源MAC地址和找到的電腦MAC,發現不對應,僅IP是相同的。再次在設備管理系統里通過源MAC查找,但沒有找到設備。為加快查找速度,通知同事共同查找。同事趕到后也沒找到此MAC地址的登記,面對分布在不同樓層的幾百臺網絡接入設備沒有了頭緒。

圖3 故障電腦Wirshark 軟件數據包抓取界面
筆者決定,還是登錄eSight網管設備來查找這臺未知設備。因為只要設備接入了網絡,其MAC地址、使用過的IP及曾接入的交換機端口,在網管系統里應該都有記錄。在網管系統里輸入源MAC地址,這臺設備曾使用的真實IP及接入的交換端口都顯示出來。同事一看IP,驚呼道:“這不是昨天下午我設置的一臺無線路由的IP嗎!”。原來,故障發生那天,有位用戶需要手機上網查看掌上長沙的新聞客戶端,于是向技術部申請安裝無線路由器,正好是由同事設置安裝這臺新購的無線路由器。當時測試無線使用是正常,但沒想到會引起網絡故障。
立即趕到安裝故障路由的辦公室,將設備拆下來,網絡恢復正常。
第二天,同事又對此臺路由器又進行了測試,發現只要接入集團局域網,立刻就會有大量UDP數據發送,此時對百兆網絡的占用率超過40%(影響較大),千兆網絡占用率超過4%(影響不明顯),這就是為什么網絡故障均發生在連入室內小型交換機,及需要大量傳輸數據的用戶端的原因。再次確認了此臺無線路由器是故障所在,并且重置路由器更換網絡設置無效,只能更換設備。在更換此無線路由器后,又對網絡進行了多天的監控,網絡故障未再現,網絡恢復了暢通。
在無線應用越來越多的今天,各種無線設備的使用便利了用戶,也增加了網絡管理的難度。手機、筆記本、無線路由器等各設備的增加,對傳統網絡帶來的各種安全問題是不可回避的。
首先,切記網絡設備的登記,特別是無線路由器等入網設備的MAC地址及時登記,這是網絡管理的基礎資料。故障設備的定位一直是個難題,如果有詳細的設備登記,在排查故障時將省時省力不少。
第二,要了解網絡協議相關知識,善于借助網絡分析管理工具。網絡故障現象各式各樣,有的可以根據現象判斷原因,但情況復雜時僅根據現象是難以判斷故障原因的。這時就要借助專業的網絡分析管理工具,并且了解一些網絡傳輸協議的相關知識,學會使用分析管理工具對網絡數據包進行相關統計分析。這次將開源軟件Wireshark網絡數據分析工具和集團現有的eSight網管系統結合使用,是快速診斷并排除故障的有效方法。
第三,密切關注單位業務的發展方向,當單位業務向無線發展時,或是用戶無線上網的需求增加時,就應根據業務的發展方向及用戶的需求適時改變現有網絡結構。重視無線局域網的建設,適時引入無線網絡管理產品,排除網絡安全隱患,避免網絡的故障發生。如果將來上線移動采編系統,實現移動辦公,對現有的無線局域網安全和性能將會要求更高。以業務為核心驅動的信息化建設,是將來信息化建設發展的必然方向。