沈 超,徐 俊,劉佳誕(無錫供電公司,江蘇無錫214000)
EPON手拉手保護在配電通信網的應用及優化
沈 超,徐 俊,劉佳誕
(無錫供電公司,江蘇無錫214000)
基于以太網原理對以太網無源光網絡(EPON)的手拉手保護倒換特性進行詳細的分析,以電力系統中實際EPON組網方案為模型,通過企業網絡仿真平臺(eNSP)模擬手拉手保護倒換過程中交換機、光線路終端(OLT)以及光網絡單元(ONU)的網絡行為。針對現網中EPON手拉手組網業務倒換速度過慢的情況給出合理的解釋,在不改變EPON協議棧的情況下,采用端口隔離和免費地址解析協議(ARP)2種輔助功能對EPON手拉手保護倒換進行優化,實現業務倒換速度在毫秒級別,并采用實際系統進行驗證。
EPON;手拉手保護;端口隔離;免費ARP
目前,配電通信網主要采用以太網無源光網絡(EPON)技術進行組網,EPON技術結合了以太網技術和無源光網絡(PON)技術,在多個城市配電自動化建設中得到了廣泛應用[1-3]。為滿足電力配電網對系統可靠性的特殊要求,EPON廠家提出了手拉手組網保護機制,采用主備冗余的思想確保通信系統在故障狀態下的可靠運行[4,5]。隨著EPON技術的深入應用,部分城市在組建配電通信網EPON網絡中發現,當EPON主用線路發生故障或主用OLT發生故障后,手拉手保護并不能及時將業務倒換至備用線路,業務倒換時間為數分鐘至數十分鐘,嚴重影響了系統的實時性和可靠性。文中以EPON中的以太網技術為基礎,采用仿真軟件企業eNSP對手拉手保護過程中光線路終端(OLT)、光網絡單元(ONU)的網絡行為進行模擬,分析了業務倒換時間過慢原因,并采用端口隔離、免費地址解析協議(ARP)的方法對手拉手保護機制進行優化。
配網自動化組網中支持多種PON組網保護方案,包括Type B保護、EPON Type D保護 (GPON Type C保護)和獨立上行保護,其中GPON Type C保護和EPON Type D保護原理相同。
電力系統中通常所說的手拉手保護是在EPON Type D保護基礎上發展而來[6]。EPON Type D保護分為單歸屬和雙歸屬,配電通信網中通常采用的是雙歸屬模式,即上行冗余PON口分別在2臺OLT上,如圖1所示。在雙歸屬的組網場景中,ONU具有雙PON口,ONU與OLT之間的2條PON線路處于主備狀態,正常工作狀態下,ONU僅能通過主用線路PON口轉發報文,備用PON口在備用OLT上注冊信息,但不能用于轉發報文。當主用線路中的某器件發生故障導致主用線路中斷時,ONU可快速切換到備用OLT。

圖1 Type D保護雙歸屬模式
在配電網實際組網應用中,EPON手拉手組網比圖1所示網絡復雜,整個網絡可以分為核心層、匯聚成、接入層3個層面,如圖2所示。核心層包括設置在主站的核心交換機,用于快速轉發數據;匯聚層包括位于變電站內的OLT、匯聚交換機以及傳輸設備SDH/ MSTP,OLT將數據傳送至匯聚交換機,進行數據匯聚、安全控制、流量控制等處理后通過骨干通信網傳輸至核心交換機;接入層包括放置在環網柜/開閉所/柱上開關的ONU、分光器和配電終端設備,ONU通過主備用2條光纖線路分別連接至不同變電站的OLT。

圖2 配電通信網EPON組網方案
在大部分企業測試環境中,通常采用圖1的網絡拓撲對手拉手保護功能進行測試[7,8],測試結果表明在主用線路發生故障的情況下,業務能夠很快地倒換至備用線路,整個倒換大約在50 ms。但是在實際生產環境中,主用線路發生故障后,往往需要數分鐘甚至更多時間,業務才能夠倒換成功。
對比測試環境拓撲和實際組網環境拓撲,發現測試環境和實際組網的差別在于實際環境比測試環境多了匯聚層和核心層交換機,為研究交換機對EPON手拉手保護特性的影響,采用仿真軟件eNSP模擬手拉手倒換過程中OLT、ONU、交換機的網絡行為。不考慮PON的物理特性,OLT、ONU的網絡交換特性可以等效成以太網2層交換機,因此在仿真中采用2層交換機模擬OLT和ONU,仿真拓撲如圖3所示。

圖3 實際組網仿真拓撲
圖中CORE模擬主站核心交換機,SW1和SW2模擬變電站匯聚交換機,SW1的g0/0/1與SW2的g0/0/1之間采用3層通道互聯,CORE與SW1、SW2之間運行OSPF協議;OLT和ONU均由2層交換機模擬,SW1、SW2、OLT1、OLT2以及ONU之間均用二層鏈路連接,其中SW1的g0/0/4與SW2的g0/0/4之間采用2層通道互聯;配電終端設備(DTU)用PC進行模擬,IP地址為10.1.20.100,在SW1設置DTU網關10.1.20.254。仿真過程中通過控制ONU上聯端口g0/0/1和g0/0/2的開關狀態模擬主用PON鏈路故障后的倒換動作。在DTU上使用命令“ping 1.1.1.1-t”來模擬實時遙測信息,1.1.1.1為CORE環回口地址。
2.1穩態運行
穩態運行情況下,ONU的g0/0/1端口被關閉,主用PON鏈路為ONU-OLT2。通過命令在所有設備上查看實際物理地址(MAC)表,列出與DTU的MAC相符合的表項,結果如表1所示。
在SW1上查看DTU對應IP地址10.1.20.100的ARP表項,發現其對應MAC地址為5489.9850.7777,對應出接口為g0/0/4。
通過抓包分析可知DTU向CORE上傳數據路徑:DTU—ONU—OLT2—SW2—SW1—CORE,CORE向DTU下發數據路徑:CORE—SW1—SW2—OLT2—ONU—DTU,此時DTU能夠持續連通CORE,表明系統能夠正常工作。

表1 正常工作時MAC地址
2.2故障倒換
將ONU的g0/0/2關閉,并打開ONU的g0/0/1,模擬主用PON鏈路失效后數據從備用PON鏈路進行發送,發現DTU無法連通CORE,連接中斷。通過命令在所有設備上查看MAC地址表,列出與終端DTU的MAC相符合的表項,結果如表2所示。

表2 發生保護倒換后MAC地址
在SW1上查看10.1.20.100的ARP表項,發現結果與正常運行時相同,對應出接口仍為g0/0/4。
由表2可知,當備用的鏈路被啟用時,除了OLT2丟失DTU的MAC地址表項外,OLT1、SW1、SW2的MAC地址表項均未發生變化,而且SW1的ARP表項也未發生變化。抓包分析顯示,DTU上傳的信息直接在OLT1處即被丟棄,無法上傳至SW1和CORE。等待5 min后再次查看MAC表,結果如表3所示。

表3 保護倒換5 min后MAC地址
此時在SW1上查看10.1.20.100的ARP表項,發現結果與正常運行時相同,10.1.20.100對應出接口仍為g0/0/4。結果表明,此時MAC地址表已經被正確學習,但是由于SW1關于10.1.20.100的ARP表項仍然存在錯誤,故DTU無法恢復與CORE的通信。
抓包分析發現,DTU發往CORE的數據已經被CORE正確接收,但CORE向DTU發送的回復報文全部被SW1通過g0/0/4接口發送出去,從而導致DTU無法接收到回復報文,與CORE的連接關系建立失敗。再等待20 min后,發現DTU和CORE的連接恢復,此時查看MAC表和ARP表,發現均學習正確,SW1關于10.1.20.100的ARP表項對應出接口已從g0/0/4更新至g0/0/2。
2.3原因分析
在手拉手倒換過程中,限制業務進行快速倒換的原因主要有二:(1)OLT1的MAC地址表項沒有及時更新;(2)當OLT1和SW1的MAC地址表項更新后,SW1的ARP表項沒有及時更新。分別采用MAC地址漂移和ARP更新原理對上述現象進行解釋。
2.3.1MAC地址漂移
MAC地址漂移是指某個端口的源MAC地址老化之前,設備從另一個端口學習到該源MAC地址,并刷新MAC地址表中源MAC地址和物理端口的對應關系,這就好像是MAC地址從一個端口漂移到另一個端口。為應對惡意用戶利用MAC地址漂移原理仿冒其他用戶或上層設備的MAC地址,OLT支持防御MAC地址漂移特性,簡稱防MAC漂移。實現原理是從端口A接收到某個源MAC地址的報文后,設備會檢查MAC地址表中是否已存在該MAC地址。如果MAC地址表中記錄端口B對應該MAC地址,則設備根據主控板、端口類型等判斷是否允許該MAC地址從端口B漂移到端口A。對于禁止漂移的情況,在MAC地址老化之前,設備會丟棄從端口A接收到的含有該源MAC地址的報文。
在EPON系統中,OLT默認開啟防MAC地址漂移功能,OLT網絡側接口(NNI)MAC地址優先級為1,用戶側接口(UNI)MAC地址優先級為 0,因此當OLT網絡側接口學習到某個MAC地址后,即使該MAC地址立刻從UNI被學習到,該MAC仍然不會被覆蓋,而從用戶側發來的帶有該源MAC地址的報文會被全部丟棄。
對應仿真拓撲,OLT1的NNI接口為g0/0/1,UNI接口為g0/0/2,在穩態運行情況下,OLT1從NNI接口學習到了DTU的MAC地址5489.9850.7777,當備用PON線路備啟用后,OLT1又從 g0/0/2學習到5489.9850.7777,但由于g0/0/2的MAC地址優先級低于g0/0/1,該MAC地址無法被正確學習,因此表2中OLT1關于DTU的MAC地址5489.9850.7777對應接口仍然是g0/0/1。這種情況會持續到OLT1中該MAC地址表項老化時間結束,當該MAC地址在老化時間達到后仍然無法被刷新,OLT1丟棄這個MAC地址,開始接收g0/0/2的MAC地址學習。MAC地址的老化時間默認為5 min,因此等待5 min后,表3中MAC地址被正確學習。
2.3.2ARP更新原理
ARP用于確定對應IP地址的網卡物理地址。在實際環境中,只有同時滿足以下2個條件時,設備的ARP表項才會更新:(1)設備收到來自某IP的ARP請求包或免費ARP包;(2)設備現有ARP表項中已經存在該IP對應的ARP表項。其他非ARP報文不會對設備的ARP表項產生影響。
以仿真系統為例,系統剛開始運行時,DTU不知道網關10.1.20.254對應的MAC地址,則會發送ARP請求,SW1以自身MAC地址回應,DTU收到ARP回復后即在ARP表中保存相應的ARP表項,同樣SW1中也會保存關于DTU的ARP表項。當發生故障倒換后,DTU無法感知上層網絡變化,仍然采用原ARP表項封裝數據包,并不會發送ARP請求或免費ARP報文,因此雖然網絡拓撲發生變化,但是SW1由于沒有收到DTU的ARP請求或免費ARP,SW1中關于DTU的ARP表項仍不會更新。因此,即使倒換后SW1能正確學習關于DTU的MAC地址(如表3),由于不滿足ARP更新的2個條件,當CORE發往DTU的數據經過SW1時,SW1仍會按照原ARP表項中的對應接口g0/0/4將數據發送出去,從而導致DTU與CORE建立連接失敗,這種情況會持續到ARP老化時間到達。當DTU的ARP表項老化時間達到后,SW1會發送一個ARP探測確定原ARP對應DTU主機是否存活,由于DTU上聯通道已經連接至OLT1,SW1自然無法從g0/0/4獲取ARP探測的回應,嘗試數次仍無法得到回應后,SW1會刪除相應ARP表項。此時若有CORE發往DTU的流量,SW1會發出ARP廣播,請求DTU的MAC地址,從而獲取正確的ARP表項。
需要注意的是,在Cisco設備中ARP表項只起到IP地址和MAC地址互相轉換的功能,具體數據發送則會查找相應的MAC地址表項。國內大部分廠家在優化ARP表功能時,在ARP表中添加了出接口一項,雖然減少了查找多個表項帶來的延遲,但是也帶來了MAC表和ARP表無法同步刷新而導致數據被錯誤轉發的問題。
根據上述分析可知,當EPON手拉手保護從主用PON鏈路切換到備用PON鏈路過程中,倒換延遲主要體現在MAC地址老化時間和ARP表項老化時間兩方面。MAC地址老化時間默認為5 min,ARP表項老化時間默認為20 min,遠超過了網絡故障自動恢復的允許時間,影響了電力系統的實時性和可靠性。通過減少MAC表和ARP表的老化時間可以縮短保護等待時間,然而多次嘗試發現,如果將老化時間略減少后,對手拉手保護倒換的提升效果非常有限;但是如果將老化時間大幅減少(5 s),整個網絡內會產生大量的ARP報文,在網絡結點數量較多的情況下有可能產生報文堵塞,影響整個網絡的正常運行,產生的后果比倒換失敗更加嚴重。
通過研究MAC表和ARP表的更新機理,采用以下2種方式對手拉手保護倒換機制進行優化:(1)在網關交換機上配置端口隔離功能,避免OLT在NNI接口學習到終端DTU設備的MAC地址,解決防端口漂移帶來的問題;(2)在發生主備PON鏈路倒換時,ONU通過備用PON鏈路同步發送免費ARP報文,主動更新網關交換機的ARP表,解決MAC地址表和ARP地址表無法同步更新的問題。
3.1端口隔離
端口隔離是為了實現報文之間的2層隔離而產生的高級功能,正常情況下,同1個VLAN內所有的設備均屬于同1個廣播域,同1個廣播域中設備的MAC地址、IP地址可以被同1個廣播域中另外1臺設備學習。采用端口隔離特性,可以實現同1個VLAN內端口之間的隔離,用戶只需要將端口加入到隔離組中,就可以實現隔離組內端口之間2層數據的隔離,使用隔離技術后隔離端口之間不會產生單播、廣播和組播。采用端口隔離,不但增強了網絡的安全性,提供了靈活的組網方案,同時節省了大量的VLAN資源。
在EPON手拉手保護網絡的網關交換機上部署端口隔離,即可保證主用PON鏈路上的OLT和備用鏈路上的OLT均不可能從NNI學習到終端設備的MAC地址,不但保留了OLT防MAC地址漂移的安全功能,而且解決了保護倒換過程中MAC地址老化的等待時間。以仿真系統為例,在SW1上部署端口隔離,將g0/0/2和g0/0/4放入一個隔離組。在穩態運行情況下,OLT1的g0/0/1不會從SW1學習到DTU的MAC地址,在發送故障倒換后,OLT2的g0/0/1也不會從SW2學習到DTU的MAC地址,如圖4所示。

圖4 穩態運行下端口隔離功能
3.2免費ARP
免費ARP報文是一種特殊的ARP報文,該報文中攜帶的發送端IP和目標IP地址都是本機IP地址,報文源MAC地址是本機MAC地址,報文的目的MAC地址是廣播地址。設備通過對外發送免費ARP報文來實現以下功能:(1)確定其他設備的IP地址是否與本機IP地址沖突。當其他設備收到免費ARP報文后,如發現報文中的IP地址和本機IP地址相同,則給發送免費ARP報文的設備返回一個ARP應答,告知該設備IP地址沖突。(2)設備改變了硬件地址,通過發送免費ARP報文通知其他設備更新ARP表項。
免費ARP具有更新其他設備ARP表項的功能。在EPON手拉手組網中,利用該特性即可實現主備PON鏈路倒換過程中匯聚交換機ARP表項主動更新功能。具體思路如下:在正常工作狀態下,ONU設備會保存終端設備的ARP表項。當ONU監測到主用PON鏈路發生故障后,將業務導向備用PON鏈路時,同步發送一個免費ARP報文,該報文中攜帶的發送端IP地址和目標IP地址都是終端設備IP地址,報文源MAC地址是終端設備的MAC地址,報文的目的MAC地址是廣播地址。當備用OLT和匯聚交換機收到該免費ARP報文后,會立即更新本地的ARP表和MAC地址表,無須再等待相應表項的老化時間。
以仿真系統為例,正常運行時ONU會保存DTU的 ARP表項 IP:10.1.20.100—MAC:5489.9850.7777,當ONU檢測到主用PON鏈路故障后,會主動通過備用PON鏈路發送免費ARP,免費ARP的源IP地址和目的 IP地址均為 10.1.20.100,,源 MAC地址為5489.9850.7777,目的MAC為廣播地址。雖然此時DTU本身沒有發出ARP,但是SW1仍然可以從g0/0/2接口接收到免費ARP報文,從而更新本地的ARP表項,確保倒換過后系統正常運行,如圖5所示。

圖5 故障倒換后ONU主動發送免費ARP更新MAC表和ARP表
以無錫地區配電自動化EPON網絡為驗證對象,誠飛、灰凌、仕途、竹輝路為某條線路上4個饋線終端設備(FTU),各FTU所連ONU以EPON手拉手保護方式組網,主備用鏈路分別連接至楊亭變OLT和商貿變OLT,如圖6所示。設備地址規劃如表4所示。

圖6 無錫配電通信網EPON手拉手保護組網拓撲

表4 EPON手拉手組網地址規劃
在主站前置機通過輸入命令 “ping 10.X.20.36-t”,長時間觀察誠飛FTU終端的在線情況,在核心交換機通過輸入命令 “ping-m 10-c 50000 10.X. 20.36”觀察誠飛FTU終端的在線情況。
優化前,斷開誠飛ONU與楊亭OLT直連光纖,啟用商貿變備用PON鏈路,倒換后主站前置機與核心交換機一直處于丟包狀態,且主站前置機產生告警信息,顯示誠飛FTU離線,等待約20 min后誠飛FTU恢復在線,告警消失。實施優化措施后,斷開誠飛ONU與楊亭OLT直連光纖,啟用商貿變備用PON鏈路,核心交換機顯示丟包數為2,表明業務倒換延遲在50 ms以內,主站前置機未顯示丟包,同時無告警產生。
EPON手拉手保護組網方式提高了EPON網絡的可靠性,但大部分廠家在研發、測試手拉手保護功能時,僅考慮EPON光路的倒換時間,并未結合實際業務和全局拓撲進行考慮,導致手拉手保護在應用中存在較多的問題。文中結合真實EPON系統,從以太網分析角度提出了端口隔離、免費ARP的優化策略,縮短了手拉手保護的業務倒換時間,提高了配電通信網網絡自愈功能。文中所做優化均基于華為的EPON產品,多品牌EPON設備互聯互通、協議的兼容性以及手拉手保護倒換測試的標準還需進一步規范、完善。
[1]蔡萬升,湯 輝.基于EPON技術的配電自動化通信系統[J].電力系統通信,2010,31(12):11-15.
[2]唐 琳.配電自動化通信系統的設計與實現[J].電力系統通信,2003,24(12):45-47,54
[3]孫曉霞.xPON和工業以太網技術在配電網中的應用研究[D].北京:華北電力大學碩士畢業論文,2010.
[4]鮑興川.配電通信網接入層EPON保護組網可靠性與性價比分析[J].電力系統自動化,2013,37(8):96-100.
[5]羅鵬程,金 光,周經倫,等.通信網可靠性研究綜述[J].小型微型計算機系統,2000,21(10):1073-1077.
[6]格倫·克雷默.基于以太網的無源光網絡[M].北京:北京郵電大學出版社,2007:20-25.
[7]工業和信息化部.YD-T1809—2008接入網設備測試方法-以太網無源光網絡(EPON)系統互通性[S].北京:北京郵電大學出版社,2008.
[8]工業和信息化部.YD-T1771—2008接入網技術要求-EPON系統互通性[S].北京:人民郵電出版社,2008.
Application and Optimization of EPON Hand-in-hand Protection in Distribution Communication Network
SHEN Chao,XU Jun,LIU Jiadan
(Wuxi Power Supply Company,Wuxi 214061,China)
This paper presents a method to improve the EPON hand-in-hand protection in event failure.The simulation mode of power distribution communication network in EPON is established,which is applied in analyzing the network characteristics of OLT,ONU and Switch under hand-in-hand protection.Based on Ethernet principles,two assistive functions,port-isolated and gratuitous ARP,are proposed for the optimization of hand-in-hand protection.The switching delay less than 50 microseconds is achieved.Effectiveness of the proposed method is verified by a real system.
EPON;hand-in-hand protection;port-isolated;gratuitous ARP
TP391
B
1009-0665(2015)03-0041-05
2014-12-02;
2015-02-16
沈超(1987),男,江蘇無錫人,工程師,從事電力系統通信研究工作;
徐俊(1978),男,江蘇江陰人,工程師,從事電力系統通信研究工作;
劉佳誕(1975),男,江蘇無錫人,高級工程師,從事電力系統通信研究工作。