近日,某專線用戶向我們反映該機構查看視頻圖像出現了卡頓的現象,得知這一現象后,我們開始著手排查。
首先梳理下網絡拓撲結構(如圖1),通過圖1我們可以看到,在數據機房使用全光口交換機作為業務匯聚,連接EPON設備,然后再使用全光交換機將數據傳輸至專線單位。了解了網絡拓撲結構后,登錄到全光口交換機上,使用命令show interface gigaethernet 1/13 查看端口的利用率(如圖2)。

圖1 網絡拓撲結構示意圖

圖2 查看交換機端口利用率示意圖
通過圖2可以看到,連接專線單位的交換機端口利用率是62%,也就是620M(千兆口),這個流量并沒有達到閾值,那為什么會出現視頻卡頓呢?為了給專線用戶提供更好的網絡服務,我們做兩手準備,即準備給該專線單位鏈路進行擴容,在此同時也繼續排查故障原因。就在到達該專線單位機房準備進行設備配置的時候發現了端倪,該單位新增了一臺交換機A用于連接交換機B(如圖3)。
仔細觀察該機構所有的網絡設備均連接在交換機A上,而交換機B的以太網口均沒有使用,兩個交換機之間連接使用的是五類網線。眾所周知超五類網線傳輸的帶寬是100M,而該專線單位大概有200多路攝像頭,每路攝像頭按照5M來算的話,也有1 G,使用1根只有百兆的網線來傳輸,勢必會引起數據傳輸擁塞,從而造成視頻畫面卡頓。
我們決定將所有A交換機上的網線轉移至B交換機上,繼續保留B交換機連接全光口交換機。為了提高該單位視頻監控傳輸通道的帶寬,我們將在1 G的基礎上再增加1 G,即采用鏈路聚合的辦法將物理上的兩個端口邏輯的綁定在一起,形成了2G的通道,從而達到了帶寬擴容的目的,也在一定程度上起到了負載分擔和鏈路備份的目的。接下來開始配置設備,首先配置的是全光口交換機,具體配置命令是:

上面的配置完成了全光口交換機上鏈路聚合的配置,接下來配置專線單位的B交換機。具體配置命令即:


這是專線單位交換機鏈路聚合的配置命令,值得一提的是,鏈路聚合分手動聚合和動態聚合兩種,不同廠家的設備互聯實現鏈路聚合的話,需要使用手動聚合的方式,這里使用的也是手動聚合的方式。這樣我們就完成兩端設備鏈路聚合的配置工作,接下來查看全光口交換機聚合組和端口的利用率。

通過對端口13和22端口利用率的查看,端口流量都在320M左右,兩個端口進行端口匯聚后我們看到trunk 1/3的端口利用率是32.5%,這個利用率是端口13和22端口利用率的平均值,流量是325*2=650M,這個數據和沒有進行端口匯聚前,總流量基本相同,然后這650多兆的流量讓端口13和22共同分擔,保證了帶寬的冗余性。
從我們得知網絡故障后開始排查,先后采用了查看交換機端口利用率的辦法,然后在專線單位機房發現了故障原因,最后通過調整網絡結構和配置鏈路聚合的辦法,既優化了網絡結構,又增加了鏈路帶寬,達到了兩全其美的效果。后期我們得知,該專線單位先前使用的A交換機是一個二層交換機,最近為了業務的發展需要使用三層交換機B,該單位網絡管理人員為了省事并沒有將B交換機完全替代A交換機,而是使用了一根網線將兩個交換機串聯起來使用,然后將三層交換機B連接全光口交換機。這樣就出現了文章開頭的這一幕。
通過這次排查故障,作為網絡運維人員,在工作上一定要按照規范來實施,如果背道而行的話,就會給網絡埋下安全隱患,危及網絡的穩定性。其實,在網絡運維過程中還要具有前瞻性,就如上面我們利用鏈路聚合的辦法將鏈路帶寬做到了冗余和備份,實現了高性能和低成本的雙收益,既保障了專線用戶對高帶寬的需求,又實現了低成本的運作。