楊富民+花純征+劉軍偉+梁永進
摘要:ONU(光網絡單元)的異常上行光信號干擾是PON(無源光網絡)中常見且難以徹底避免的問題,在PON系統傳輸距離延伸之后,這個問題更加嚴重威脅著PON的穩定運行。為解決這個問題,該文設計了一種新的PON系統ONU故障診斷模型,并提出了一種基于OLT和ONU相互協作的ONU故障管理機制。通過從ONU硬件故障和軟件故障兩個方面的分析可知,該文提出的ONU故障管理機制很好地解決了現有的ONU故障管理的問題,提高了故障管理的準確性和及時性。
關鍵詞:無源光網絡;光網絡單元;干擾;故障管理
中圖分類號:TP393 文獻標識碼:A 文章編號:1009-3044(2017)34-0063-03
Abstract: Abnormal uplink optical signal interference of ONU (Optical Network Unit)is a common problem in PON (passive optical network), which is difficult to be avoided completely. After the PON system transmission distance is extended, this problem is more serious threat to the stable operation of PON. In order to solve this problem, a new fault diagnosis model of ONU for PON system is designed, and an ONU fault management mechanism is proposed. Through the analysis of ONU hardware failure and software failure, the ONU fault management mechanism proposed in this paper solves the ONU fault management problem and improves the accuracy and timeliness of fault management.
Key words: PON; ONU; Interference; fault management
1 背景
PON 技術具有節省光路資源、動態分配帶寬等諸多優點,但是,傳統的PON系統的傳輸距離一般局限在20KM以內[1-2]。但是在農村和偏遠地區,要求PON系統的傳輸距離遠遠大于20KM。當前已有研究中,針對GEPON系統,采用再生GEPON信號技術提高GEPON系統的傳輸距離到80km,滿足了農村和偏遠地區的傳輸距離要求[3]。PON技術可以提高光纖資源的利用率,但是在上行鏈路中容易受到干擾,影響PON系統的穩定運行。尤其是PON傳輸距離延伸之后,這個問題更加嚴重威脅著PON的穩定運行。
為解決這個問題,當前已有一些研究成果[4-5]。但是,當前已有研究基于現有協議模型,將OLT和ONU分為兩個相互獨立的實體進行故障診斷,影響ONU故障管理的準確性和及時性。基于此,本文設計了一種新的PON系統ONU故障診斷模型,并提出了一種基于OLT和ONU相互協作的ONU故障管理機制。該機制通過在OLT和ONU的OAM層和多點控制協議(MPCP)層部署Agent,實現OLT和ONU的相互協作,生成發光時長模型,并由OLT和ONU相互協作進行更新。基于發光時長模型,OLT和ONU分別進行主動控制和自動控制,提高了故障管理的準確性和及時性。
2 問題分析
PON 技術具有節省光路資源、動態分配帶寬等諸多優點,但是,ONU的發光異常,容易導致其他ONU上行信號受到干擾,影響PON系統的穩定運行。導致ONU發光異常的主要原因是ONU(光網絡單元)的軟件故障或者硬件故障,導致ONU不能在允許的時間范圍內進行發光。另一方面,在PON系統傳輸距離延伸之后,ONU上行數據經過OEO-GEPON設備后連接到OLT,使得OLT與ONU的發光信號協商更容易出現問題。在發生PON上行鏈路干擾故障時,ONU會出現長時間發光、不在OLT指定的時間限制內發光、短時發光或任意發光等幾種故障癥狀。
從上述現象可知,為了有效解決ONU故障導致的PON系統運行問題,需要收集故障和癥狀特征,并分析其之間的關系,從而建立故障和癥狀特征之間的關聯關系,解決GEPON系統的上行鏈路受干擾的問題。另外,該解決問題的方法既相對容易實現,而且可保證結果的可靠性。所以,為提高本文提出的ONU故障管理機制的可用性和有效性,本文基于現有的EPON協議參考模型,進行優化和調整后提出新的ONU故障診斷模型。
3 ONU故障診斷模型
3.1 模型基礎架構
現有的EPON協議的參考模型中數據鏈路層如下圖1所示。與本文研究比較相關的是OAM 子層、多點MAC控制子層[6]。其中,OAM 子層是指負責網絡的運營和維護的子層,主要實現PON網絡的實時監控和維護工作。多點MAC控制子層是指負責網絡接入控制的子層,主要按照多點控制協議(MPCP),實現OLT下的所有ONU的光路資源分配等功能。其中, 在IEEE 802.3 標準中定義了多點控制協議(MPCP) [7]。
3.2 ONU故障管理模型
從ONU故障原因和癥狀分析可知,OLT和ONU之間的控制消息受到影響和ONU發光故障是導致ONU上行鏈路干擾的主要原因。所以,本文提出的ONU故障管理模型優化思路為: 基于OLT與ONU間進行協作, 提高OLT和ONU之間的控制消息的可靠性和穩定性。基于此,本文提出的ONU故障管理模型需要滿足下面幾個目標: 1)當OLT和ONU的光路受到干擾時,也可以對ONU進行控制。2)OLT與ONU支持遠程管理協議。 3)在ONU出現故障時,可以通過打開和關閉發光器的方式、打開和關閉電源的方式進行遠程控制ONU。 4)基于決策樹、支持向量機等算法,實現自動化檢測并告警,定位到具體的故障ONU。
為了實現上述ONU故障管理模型目標,本文提出的ONU故障管理模型如下圖2所示。在OAM 子層,增加OLT OAM Agent和ONU OAM Agent,其中,ONU OAM Agent從業務、發光、電源,三個方面,對ONU進行自主控制;實現故障的自診斷、自管理。OLT OAM Agent從業務、發光、電源,三個方面,對ONU進行主動控制;實現故障的遠程診斷、遠程管理。在多點MAC控制子層,增加OLT MPCP Agent和ONU MPCP Agent,其中,OLT MPCP Agent基于OAM Agent的主動管理能力,將發現的問題和采取的行動發送給MPCP層,有助于MPCE層進行數據的發送和接收。ONU MPCP Agent基于OAM Agent的自主管理能力,將發現的問題和采取的行動發送給MPCP層,有助于MPCE層進行數據的發送和接收。
基于ONU故障管理模型,OLT 和ONU相互協作,完成ONU的發現、注冊、測距、定時、上行動態帶寬分配等工作。在OLT 側:OLT不但實現 對ONU 進行發現、注冊、認證、測距、定時等功能,并且基于歷史信息,挖掘各ONU的業務特點,有助于確定MPCP(多點控制協議)的時間分配。例如,當業務突然異常時,可以對發光時間進行調整。如業務無異常,但發光時間變化,需要啟動故障診斷算法進行故障診斷。在ONU側:主要完成業務上報、發光時長調整、定時向 OLT報告擁塞狀態等功能。如業務需要調整,發送消息給OLT側,請求調整發光時長。
4 基于ONU故障管理模型的故障管理機制
4.1 基于ONU故障管理模型的故障管理機制
基于ONU故障管理模型的故障管理機制分為2個級別。第一個級別是ONU側Agent的自主故障管理機制,第二個級別是OLT側Agent的主動故障管理機制。下面分別進行介紹。
1) ONU側Agent的自主故障管理機制:ONU根據發光時長模型,自主確定是否在時限內發光。如不在其允許的發光時間內發光,ONU自主關閉發光器。如果關閉發光器失敗,ONU關閉發光器電源。
2) OLT側Agent的主動故障管理機制:首先,OLT根據發光時長模型,主動確定相連接的ONU是否在時限內發光。如某個或某些ONU不在其允許的發光時間內發光,主動發送關閉發光器信息給相關的ONU,并檢測ONU是否關閉發光器,,如沒有,則下發相關ONU關閉電源的信息。
從上述分析可知, 發光控制機制是故障診斷的關鍵,下面進行介紹。
4.2 發光控制機制
OLT對ONU的發光控制可分為靜態帶寬分配、動態帶寬分配(DBA)2種。靜態帶寬分配即固定帶寬分配,雖然簡單,但是帶寬資源利用率較低。DBA可以根據各個ONU業務的需求和OLT資源情況,動態地進行對光路資源進行調整,從而提高了帶寬資源利用率。所以,現有場景中,發光控制以DBA為主。
本文在現有基礎上,通過OLT側Agent和ONU側Agent的協作,提出一種基于ONU故障管理模型的發光控制機制,如圖3所示。該機制主要包括下面五個過程:1)業務調整請求:當ONU的業務調整時,ONU側OAM層的Agent向OLT側OAM層的Agent提交業務調整信息;2)業務調整:OLT側OAM層的Agent向MPCP層的Agent提出發光時長調整請求;3)發光時長調整:OLT側MPCP層的Agent基于發光時長調整信息,請求對發光時長模型進行創建和更新;4)發光時長模型創建和更新:基于新需求,創建或更新現有的發光時長模型;5)發光時長控制:ONU側MPCP層Agent接收OLT側MPCP層Agent的發光控制指令,按照分配的時限進行發光。
4.3 ONU故障管理機制性能分析
下面從ONU硬件故障和軟件故障兩個方面,對基于ONU故障管理模型的故障管理機制進行分析。
在ONU硬件故障方面:硬件故障一般是由于ONU硬件出現故障,光發射機打開后無法關閉導致。本文提出的故障管理機制,可以通過關閉發光器、關閉電源的措施,有效解決長發光、漏光、加電啟動或復位的問題。在ONU軟件故障方面:軟件故障一般是因為時鐘不準或ONU對光模塊的開關操作時間過長、ONU 與OLT時鐘存在偏差或硬件參數配置錯誤導致。本文提出的故障管理機制,可以通過ONU和OLT在OAM層的協商,更加有效地確保時鐘一致,有效解決了時鐘偏差等問題。
5 結束語
PON 技術具有節省光路資源、動態分配帶寬等諸多優點。但是,PON系統的上行鏈路易受到干擾,導致PON 鏈路遭到破壞進而崩潰,嚴重威脅到PON的穩定和安全。在PON系統傳輸距離延伸之后,這個問題更加嚴重威脅著PON的穩定運行。本文提出一種基于OLT和ONU相互協作的ONU故障管理機制。通過從ONU硬件故障和軟件故障兩個方面,對基于ONU故障管理模型的故障管理機制進行分析可知,本文提出的ONU故障管理機制很好地解決了現有ONU故障管理的問題,提高了故障管理的準確性和及時性。
參考文獻:
[1] 張歐. 光纜線路的故障分析及障礙處理[J]. 中國管理信息化, 2015(18):84-85.
[2] 顧林君, 沈元隆. 下一代無源光網絡技術[J]. 通信技術, 2010(9):95-97.
[3] 程洪. GEPON系統的長距離傳輸技術方案探討[J]. 電子世界, 2015(23):160-161.
[4] 于金輝, 余辰東. PON網絡中的ONU 干擾問題研究[J]. 光通信研究, 2015(4):19-21.
[5] 余辰東. PON網絡中的ONU 干擾問題研究[J]. 光通信研究, 2017(1):23-26.
[6] 張鵬, 閻闊. FTTX PON技術與應用[M]. 北京: 人民郵電出版社, 2010.
[7] 王宏偉, 陳明華, 謝世鐘. 智能電網用電信息采集系統EPON DBA 算法研究[J]. 光通信技術, 2014(2):16-18.