交換機作為局域網連接的主要設備,成為應用普及最快的網絡設備之一。在日常網絡運維過程中,充分了解和掌握網絡的流量模式,是能否發揮交換機作用的一個非常重要的因素。因為使用交換機的目的就是盡可能地減少和過濾網絡中的數據流量,所以如果網絡中的某臺交換機由于配置不規范,需要轉發接收到的所有數據包的話,交換機就無法發揮優化網絡性能的作用,反而降低了數據的傳輸速度。
筆者單位的一臺交換機端口流量達到100%,正在準備進行鏈路擴容的時候,仔細觀察到端口廣播包異常,根據這一現象,將交換機設備互聯端口中的默認VLAN刪除后故障排除。

圖1 網絡拓撲結構
近日,網管中心通告一臺專線交換機端口流量超越閾值,根據網管中心的通報,我們立即對設備的使用狀態進行查看。使用show命令查看到端口的利用率入方向已達100%,按照常規做法,我們會立刻對端口進行擴容,但是根據現有網絡狀態進行分析,該交換機主要承擔某單位的專線接入工作,該專線業務比較單純,并沒有新增的數據業務,為什么端口的流量一下子猛增上來呢?
通過網管平臺查看最近一個月的交換機端口流量情況,發現流量是從兩天前開始上升起來的。咨詢專線單位,得到的答案是,最近沒有新增業務。那么流量增加肯定存在問題。
為了盡快搞清楚故障的原因,首先梳理下網絡拓撲結構,具體的網絡拓撲結構如圖1所示。
從圖1可以看到,專線匯聚交換機A承擔著各分支點的數據匯聚,以及將數據轉發至專線單位分部,同時又有一條鏈路將該專線資源上傳至專線總部。端口利用率100%的交換機端口即我方數據機房的專線交換機A連接專線單位分部的交換機B端口。
根據拓撲結構很容易得知,交換機A的入方向對應的是B交換機出方向。根據這一具體的故障現象,需要分析故障產生的原因,在交換機A上執行命 令display interface GigabitEthernet 4/0/31,查看到該端口的廣播報文很多,而且廣播報文甚至超過了端口的單播報文數量。端口上的廣播報文從何而來呢?同單播和多播相比,廣播幾乎占用了子網內網絡的所有帶寬。網絡中不能長時間出現大量的廣播幀,否則就會出現所謂的“廣播風暴”。
廣播風暴是指當廣播數據充斥網絡無法處理,并占用大量網絡帶寬,導致正常業務不能運行,甚至徹底癱瘓。一個數據幀或包被傳輸到本地網段上的每個節點就是廣播,由于網絡拓撲的設計和連接問題,或其他原因導致廣播在網段內大量復制,傳播數據幀,導致網絡性能下降,甚至網絡癱瘓,這就是廣播風暴。廣播風暴是網絡長時間被大量的廣播數據包所占用,使正常的點對點通信無法正常進行,其外在表現為網絡速度慢。出現廣播風暴的原因有很多。要避免廣播風暴,可以采用恰當劃分VLAN、縮小廣播域、隔離廣播風暴,還可在千兆以太網口上啟用廣播風暴控制,最大限度地避免網絡再次陷入癱瘓。
根據我們對廣播風暴的簡單了解,接下來就開始進行故障處理。首先使用命令display currentconfiguration interface GigabitEthernet 4/0/31查看下專線交換機端口的配置,具體查看命令即:

根據兩側交換機端口的配置,我們可以發現配置存在不規范的地方,首先端口允許通過的VLAN是全部,其實該端口并沒有多少VLAN,所以這里我們需要規范地配置業務VLAN。其次交換機端口還需要限制VLAN1通過,VLAN1是該品牌交換機的默認VLAN,如果對VLAN1沒有需求,需要將該VLAN1進行刪除,否則如果網絡拓撲過大,使用的交換機過多,網絡架構復雜后,VLAN1就會在網絡中形成巨大的廣播風暴,從而會引起網絡擁塞。
根據這一思路,接下來就更改一下端口的配置。具體配置即:

上面我們完成了專線交換機的端口配置,用相同的方法再修改一下專線分部交換的端口配置。完成這些操作后,再一次使用命令display interface GigabitEthernet 4/0/31查看端口的廣播包以及端口利用率,其中廣播包得到了實質性的下降,而端口利用率從原來的100%下降至20%,網絡通道得到了明顯的改善,這樣網絡就得到了優化。
上面我們從端口的利用率居高開始入手,通過對專線業務實際情況和網絡拓撲的分析,并使用show命令查看端口存在廣播包過多的情況,并對廣播報的產生進行了分析,得知端口配置不規范,存在默認VLAN1不規范使用的情況。最后,通過對配置的修改,達到了網絡優化的目的。
后期,我們通過調研得知,專線單位交換機是最近剛剛更換的,在配置和我方互聯端口時,由于專線單位網管人員不熟悉業務,采取了端口VLAN全部通過的辦法,巧合的是我方交換機端口也是VLAN全部通過,從而引發網絡廣播風暴。針對此次網絡的處理思路,我們計劃對現網所有網絡設備進行默認VLAN的清理,從小處著手,一步一步地對網絡進行優化。