◆張莉
PTN網絡中的自愈DCN技術
◆張莉
(江西山水光電科技股份有限公司 湖北 430079)
DCN(Data Communication Network)是通信網絡中必備的一項管理技術,用于解決網絡中批量網元的網管問題。本文主要針對PTN網絡,提出了一套帶保護的DCN方案,它融合傳統的DHCP協議,實現遠端設備零配置逐級上線,通道故障快速檢測,線路恢復迅速自愈,有效地避免了以太網環路,且不占獨立帶寬。
DCN;零配置上線;自愈
DCN(Data Communication Network)是通信網絡中必備的一項管理技術,主要用于解決網絡中批量網元的網管問題,通常具有網絡復雜、共用物理端口、獨立邏輯連接的特點。
DCN技術被廣泛應用于移動、電信等運營商或者大型企業的在網設備管理[1],良好的DCN系統能保證系統穩健維護。但這些DCN網絡通常復雜、區域大,一旦出現故障,很難定位到故障源,維護工作量巨大,若沒有人工干預,往往也難以恢復,網絡的復雜度和故障恢復速度往往成為DCN管理的瓶頸。而且隨著通信領域技術的進步,越來越多的網絡應用場景有了零配置上線的需求,目前通信網絡中真正能夠做到即插即用的DCN系統是較少的,一般需要對新接入的設備進行少量的配置。
本方案針對移動PTN網絡中的DCN組網需求[2],剛好解決了快速故障檢測恢復以及零配置上線兩個難題。
在移動小型化接入控制網絡(PTN Signal Control Network, SCN)中,提出了這樣的需求:
(1)通過一張路由可達的信息網絡,實現DCN的控制通道,控制通道應通過帶內通道,與業務通道邏輯隔離。
(2)小型化接入設備要求即插即用,重啟之后按先前保存的配置上線。
(3)小型化接入設備能自動檢測到網絡故障,并通過其他路徑重新上線,重新上線的過程不可引起環路。
(4)網管平臺能繪制拓撲圖并及時發現拓撲變化。
如圖1所示,網管機站與要管理的設備通過骨干PTN網絡相連,骨干PTN網絡中已有一條VLAN ID = 4094的專線業務為DCN通道。局端(HUB)PTN設備與遠端(CPE)PTN設備都需要被網管平臺管理,要求局端設備由網管配置開通上線,遠端設備即插即用。
考慮上述需求,骨干PTN網絡提供的專線業務為帶內DCN通道,與普通業務邏輯隔離。遠端PTN設備下掛于局端PTN設備,看起來適用DHCP協議自動分配IP的方法,DHCP協議的客戶端可以零配置上線且能按先前保存的配置重新上電。但是,傳統的DHCP協議[3]不宜穿越PTN網絡,自動檢測網絡故障和重新上線又如何解決呢,網絡防環從來不是個簡單的課題,網管平臺要繪制和更新拓撲,也需要一些特殊手段。

圖1 DCN應用場景
本方案的設想是以DHCP協議為基礎,使用它的協議報文分配IP,利用VLAN的特性打通DCN通道逐級上線和穿越PTN網絡,自定義部分私有協議,實現連通性檢測和重新上線,同時由局端PTN設備通過連通性檢測的結果及時上報拓撲信息。
本場景通過網管平臺對局端設備進行DHCP-DCN的配置,使它作為DHCP服務端,為下行遠端設備分配IP地址,遠端設備自動開啟DHCP客戶端功能,向所有連接的端口發送DHCP請求。網管與局端設備的通信以及局端與遠端交互的DHCP報文都使用VLAN4094的標簽。遠端設備分配到IP之后,自動將上行端口加入VLAN4094,若收到其他遠端設備發送的DHCP請求,將請求轉發給上行端口,同時打通下行端口的VLAN通道,實現設備逐級上線。設備上線之后局端與遠端發送心跳報文互動,若檢測不到心跳則進入自愈流程,斷開VLAN通道,重新發送IP請求(之前分配的IP),直到再次上線為止。
具體執行流程按如下三種情況[4]進行分析:
情景1:C設備與S設備直連的上線流程
(1)C設備啟動后,定時向所有連接的鏈路發送dhcp-discover報文。
(2)S設備收到discover報文,根據設備mac和option判斷該報文是否合法,如果合法,則回復offer報文。
(3)C設備收到offer報文后,根據client-id判斷是否為回復給自己的offer報文,如果是,則繼續發送request報文。
(4)S設備收到request報文后,給對應的C設備回復ack報文,并將C設備的信息貯存起來。同時,S設備向網管系統上報拓撲變化trap,網管系統重新采集拓撲信息,對新上線C設備進行網管。
(5)C設備收到ack報文后,進行IP地址和網關配置,并將上聯口(收到ack報文的端口)加入管理VLAN。
(6)S設備對C設備發起自定義的心跳報文,C設備收到報文后回應,建立連通性檢測,在三倍超時時間內收到報文認為連接正常。

圖2 直連設備上線流程
情景2:C2設備經過中繼C1設備上線
(1)C2設備啟動后,定時向所有連接的鏈路發送dhcp-discover報文。
(2)C1收到該報文后,判斷自己是否已經上線,如果是則在報文中添加option82(包括設備dcn ip和收到該報文的端口信息)信息,然后將報文從上行口轉發出去,否則丟棄該報文。
(3)S設備收到C1轉發過來的discover報文后,根據設備mac和option判斷該報文是否合法,如果合法,則回復offer報文。
(4)C1設備收到offer報文之后,根據報文攜帶的option82中的端口信息,判斷是自己的端口則從該端口轉發,否則丟棄該報文。
(5)C2設備收到offer報文后,根據client-id判斷是否為回復給自己的報文,如果是則回復request報文。
(6)C1設備收到request報文后,從上行口轉發該報文。
(7)S設備收到request報文后,給C2回復ack報文,并將C2的信息和它攜帶的option82中的C1相關信息貯存起來。同時,HUB設備向網管系統上報拓撲變化trap,網管系統重新采集拓撲信息,對新上線的C2進行網管。
(8)C1收到ack報文后,同第4步操作。
(9)C2收到對應ack報文后,進行IP地址和網關配置,并將上行口加入管理VLAN。
(10)C2上線之后,S設備更新DCN拓撲圖,向C2發送私有的管理報文,將C2下聯口加入管理VLAN。
(11)C2收到S設備配置VLAN的報文后,判斷報文內的server-ip是否與自己上線的server-ip相同,如果相同則將下聯口加入管理VLAN內,至此,一條基于VLAN管理通道已打通。
(12)S對C2發起心跳報文,C2收到報文后作出回應,建立連通性檢測,在三倍超時時間內收到報文認為連接正常。

圖3 通過中繼設備上線流程
情景3:自愈流程
如圖4所示組網圖,需要網管的設備S和C(1)C2成環路連接,
(1)假設 C1首先通過S的ge1口上線,C2則通過C1的ge2口上線,此時有C1的ge(1)ge2,C2的ge2屬于VLAN4094。
(2)若C1與C2之間的鏈路斷開,S與C2之間的心跳報文則出現超時,C2發現超時,主動刪除IP,并將自身的ge2口從網管VLAN中退出。
(3)S設備發現超時,刪除離線網元C2的信息,向網管系統上報拓撲變化trap,并且通過自定義的管理協議將C1的ge2口從網管VLAN中退出。
(4)C2重新進入上線流程,此時S與C2之間的鏈路是連接的,C2走直連設備的上線流程,通過S的ge2口上線,依然分配到之前的IP地址,同時,S設備可以感知C2重新上線的路線,告知網管,網管重繪拓撲圖。C2設備從故障到自愈的流程完成。

圖4 自愈流程組網圖
本案所述方法帶自愈的DCN技術,現已廣泛應用于中國移動小型化接入PTN設備的網管自通場景。一般部署方式有兩種:一種是部署在經城域PTN網落地的網管機房,如圖5中的網管平臺A,另一種是直接部署在PTN網落地的網管機房,如圖5中的網管平臺B。

圖5 具體實施組網圖
實際接入網絡的設備組網是復雜多樣的,不拘泥于章節2中描述的場景,可以有多個地址池,如圖5中的POOL-A和POOL-C。如POOL-C,類似章節2描述的自愈組網,網管平臺直接管理HUB-C,由CPE-E/F/G組成的環路接入HUB-C的下行端口,按響應順序依次上線,自動進行故障檢測。使用更多的是如POOL-A的組網,兩臺HUB設備組成的保護通道,配置相同的地址池,首先由HUB-A完成服務器工作,由CPE-A/B/C/D及更多小型化PTN設備組成的環路按響應順序依次上線,自動進行故障檢測。若故障出現在HUB-A上,則由HUB-B接管服務器工作,下行CPE設備按原有配置重新上線,形成配置加DCN環路的雙重保護。
如圖5實施的DCN網絡布局,同一網管平臺可網管的設備數量可以千計甚至更多,網管的瓶頸或許會體現到網管平臺的性能上,而不再體現在網絡復雜度和故障恢復上。
本文針對移動PTN網絡跨域廣、組網復雜、時效性能要求高的特點,提出了PTN網絡中一種即插即用的、主動愈合的DCN方案。它除了具有常規DCN技術能批量網管,不占用獨立線路的特點,還解決了復雜網絡對設備零配置上線的需求,而且能快速地檢測到故障并修復,減少了大量的人工維護工作,不失為一種優異的DCN解決方法。該方法不止能應用于移動PTN網絡,其原理也可在其他DCN場景中得到擴展。
[1]譚群芳,魯曉霞.一種基于SDN的云數據網絡中心解決方案[J].電信工程技術與標準化,2017(1):25-28.
[2]小型化接入PTN S-SCN網管自通方案[Z].北京:移動研究院,2016:1-11.
[3]RFC2131:Dynmic Host Configuration Protocol[S]. R. Drmos.1997(5):1-45.
[4]張莉.一種基于vlan管理通道的DCN保護系統[P].江西山水光電科技股份有限公司,2018:1-8.