■
近日,接到網管監測人員的通知,位于某鄉鎮的OLT設備脫離網管。同時客戶服務中心也陸續接到了該轄區用戶的報修。
得知這一故障后我們立刻展開排查,首先對該OLT的管理地址進行了Ping測試,結果不通。接下來查看OLT上聯BRAS的端口狀態,發現端口是Down的。聯系該OLT所屬的維護人員,讓其使用光功率計測量了下該線路的光功率,得到的值是-18db,但是我們機房BRAS側是測量不到光功率的,這時維護人員也告訴我們,該設備上聯BRAS的端口以及PON口指示燈都處于滅的狀態。于是進一步使用光時域反射儀測量了整個鏈路的光路情況,均沒有發現異常,這樣就可以初步斷定OLT設備出現了故障,于是指導維護人員重啟OLT設備,但均沒有奏效。
到達現場后,簡單查看了一下設備的工作狀態,發現設備的上聯口以及PON口指示燈處于滅的狀態,而且設備也不能在現場正常登錄,由此斷定該設備需要更換。更換完設備后,由于事情發生得突然,手頭沒有準備該設備的配置線,就在我們一籌莫展的時候,在配置端口的左側看到了MGMT口,該端口是一個帶外管理端口即本地管理端口,在設備出廠前,該接口已經設置了一個默認IP地址172.18.3.207。
立即使用網線登錄到設備上,因為這是一個新設備,沒有配置文件,接下來就是配置OLT,打通設備的網關。具體配置如下:


配置完OLT設備的管理IP地址后,測試從OLT的設備上Ping BRAS設備是成功的,這樣就完成了新OLT設備管理地址的配置。接下來要恢復用戶的互聯網業務,即配置PON口和業務VLAN,具體配置即:


通過上面的命令,完成OLT設備業務和PON口的配置,最后需要配置用戶接入層設備ONU,具體配置命令如下:

按照上面的配置方法,逐一對ONU進行了配置,在機房內使用ONU測試了一下網絡是可以正常撥號上網,這樣我們就完成了OLT設備的更換工作。
從接到網絡監測人員關于OLT脫離管理的通知,到對設備端口的進行查看以及使用Ping命令的測試,并初步斷定現場OLT出現故障,最后到現場對設備進行了更換。在更換設備后,經過對設備管理地址、PON口以及ONU的配置,最終網絡得以恢復。
通過這次故障的排除,作為網絡管理員除了熟悉設備的配置外,還要熟悉設備的硬件配置,在設備無法通過配置線登錄時,可以通過帶外管理口進行登錄,從而提高了設備的配置效率。
其實,這次故障的出現是偶然的,后期為了避免或者降低設備的故障率,我們將制定定期對設備進行巡檢的工作機制,同時按照設備的重要程度以及區域劃分情況準備備機,從而在設備出現故障后能第一時間進行更換,特別是對于覆蓋互聯網用戶數量比較多的設備,將逐步做到冷備份,以期達到設備出現故障后,只需更換事先配置好的設備即可,這在可以縮短網絡故障排除的時間,從而為提高互聯網用戶的上網體驗打下堅實的基礎。