ONU是英文Optical Network Unit的縮寫,即光網絡單元。ONU分為有源光網絡單元和無源光網絡單元。本文涉及到的PON使用光纖連接到OLT,然后OLT連接到ONU,指的是有源ONU,它主要提供數據、IPTV(即交互式網絡電視)等業務,被廣泛應用到寬帶用戶的接入上,在互聯網開通的過程中發揮著重要的作用。
筆者單位最近在開展點播業務的時候,遇到了點播視頻卡頓的問題,通過在機房搭建測試環境,然后入戶排查,最終將故障定位在了ONU的設置上,在將ONU上聯口流控功能開啟后,故障解決。接下來就詳細介紹一下整個故障的處理過程。
近一段時間以來,點播業務作為主推業務陸續開通,可是在開通的過程中,我們接到同事反映,點播視頻出現卡頓的現象。
在展開排查的同時,進一步收集故障信息,得知部分點播用戶使用點播服務出現卡頓、馬賽克等現象。為了盡快解決故障,需要尋找一個平衡點,即可以比照的參照物。在點播業務正式商用之前,為了提供一個良好的點播監測平臺,我們對點播業務進行全天候監測,主要涉及到點播平臺關鍵設備的網管,具體包括交換機在線狀態、主備服務器服務狀態、用戶在線數量實時統計、故障告警等其他常見參數。
在對點播平臺網管進行梳理,并在數據機房對點播業務進行了實時觀看后均沒有發現問題。根據用戶報障的信息,我們迅速鎖定了就近的數據基站,在靠近用戶側的數據基站對反映點播故障的視頻節目進行查看,也沒有發現視頻卡頓的問題。這樣我們就可以肯定視頻資源是沒有問題的。
既然點播視頻資源和基站測試正常,下一步就需要按照網絡層次排查下匯聚和接入網,即EPON設備,在排查設備之前需要了解下網絡拓撲情況,具體的網絡拓撲情況即BRAS直連OLT,然后使用ONU入戶,實現互聯網和點播的接入工作。剛才我們介紹到在覆蓋報障用戶的數據基站測試點播正常,那么可以排除整個鏈路的帶寬使用情況,即BRAS和OLT,PON口的流量,這樣故障就逐步縮小在了OLT的PON以下。我們來到用戶側進行查看,在用戶側我們首先排查的是物理層的問題,即網線、高清線等環節,均沒有發現問題,嘗試更換ONU設備,在設備更換后,并將ONU端口的數據配置成功,再次觀看點播視頻時,視頻卡頓的現象均沒有出現,經過長時間觀察,沒有再次出現視頻卡頓的問題。這樣故障就解決了。
問題分析到這里似乎故障的處理十分簡單,只是在機房對點播平臺進行了查看,然后在用戶側更換了一臺ONU就解決了故障。將新更換的ONU和故障ONU進行對比,發現型號和外觀就存在很大差異。將故障ONU帶回機房進行測試,對故障現象進行了還原,然后通過查找資料和請教廠家工程師,得知該款ONU設備上沒有開啟流控功能,網絡中的流量影響到了視頻業務,開啟流控功能后能夠有效抑制這個影響。具體解決辦法是,在ONU配置模式下執行uplink flowcontrol enable命令,開啟流控功能即可。
上面我們從得知故障現象,然后再使用尋找可以比照參照物的方法,在機房搭建測試環境,并根據網絡拓撲結構,逐步將故障定位在了ONU上,最終達到了解決故障的目的。
針對此款ONU出現的問題,我們專門制定了解決方案,具體方法是,對在網使用該型號的ONU進行遠程升級,對升級帶來的影響進行了評估,計劃采取分批次、由少到多逐步遠程升級,并根據報障情況靈活采取單個ONU開啟流控功能相結合的辦法,對升級過程中出現升級失敗的情況采取更換ONU的辦法解決,這在一定程度上將用戶上網的影響降低到最小,同時也達到了在快速解決故障的基礎上兼顧了經濟成本。