近日,同事反映某小區部分用戶不能正常上網,寬帶撥號錯誤代碼678。該小區機房都部署了2臺OLT設備,小區內的OLT采用串聯的方式連接,第一級OLT連接了一臺匯聚交換機,然后這臺交換機上聯BRAS完成整個上網過程。
該小區的互聯網用戶分別屬于不同的OLT,但是這2個OLT都連接到了一臺交換機。我們首先排查了交換機,通過對端口流量、CPU和內存利用率的查看,并沒有發現異常,查看ONU設備的接收光功率都在正常范圍內。
因為小區位置較遠,我們決定和故障現場采用兩頭一起查,逐漸將故障范圍向中間縮小的辦法進行處理。首先在機房匯聚交換機上進行測試,上網沒有問題。這時現場的同事告訴我們,其中一個小區的級聯OLT上測試也沒有問題。趕到小區機房,安排同事到故障用戶家中進行配合,通過ONU的MAC地址查找到該ONU屬于第一級型號為6800的OLT。立即在該OLT上進行上網測試,結果是撥號不成功,錯誤代碼678。
回顧一下故障現象,能在級聯OLT上撥號成功,而在第一級OLT上卻不能撥號成功,會不會是第一級OLT出現了故障,還是級聯OLT影響的?斷開級聯OLT的端口后,第一級OLT可以正常上網,故障用戶家中的同事也反映可以正常撥號了,但是級聯OLT下的用戶由于和第一級OLT斷開,則不能正常上網。
為了徹底排除故障,我們決定在第一級OLT上進行抓包,發現整個OLT上充斥著大量的異常報文。經分析得知,這是OLT設備默認VLAN1發送的廣播包。由于VLAN1廣播域太大,會造成ONU地址表學滿。通過查看ONU上聯口,發現其學到約1200條MAC,從而導致第一級OLT上的ONU數據由于VLAN1而擁塞,出現寬帶錯誤代碼678。
在OLT 的所有GE端口間斷開VLAN1流量,從而達到了禁止VLAN的廣播包在OLT內洪范的問題。做完這些操作后,故障得以排除。