趙春雨,李紀欣
(中國聯(lián)合網(wǎng)絡通信有限公司煙臺市分公司,山東 煙臺 264000)
光傳送網(wǎng)(Optical Transport Network,OTN)是本地網(wǎng)最重要的傳送網(wǎng)絡,互聯(lián)網(wǎng)、移動網(wǎng)、智能城域網(wǎng)以及政企客戶等重要業(yè)務都由其承載。網(wǎng)絡安全性直接決定了整個本地網(wǎng)的業(yè)務承載是否可靠安全、用戶體驗是否通順暢聯(lián)。對OTN 系統(tǒng)部署多樣化的安全保護措施,能夠有效抵御業(yè)務中斷、網(wǎng)絡中斷等高等級風險,提高網(wǎng)絡健壯性[1]。
本地網(wǎng)OTN 波分設備型號為華為6800/8800 和9600,市到縣10 各節(jié)點疊加2 個環(huán)網(wǎng),其中6800/8800系統(tǒng)單波道40 Gb/s、9600 系統(tǒng)單波道100 Gb/s,業(yè)務由2個系統(tǒng)負荷分擔。這2個系統(tǒng)的保護方式如下:6800/8800 系統(tǒng)采取業(yè)務子網(wǎng)連接保護(Sub Network Connection Protection,SNCP),即線路2 個方向均配置線路處理板,業(yè)務配置時采用SNCP 方式配置到2 個方向,雙發(fā)選收;9600 系統(tǒng)采取4 路通道保護板內1+1 通道保護,即配置4 路通道保護板,單波業(yè)務通過該板從2 個方向的合分波板雙發(fā)選收。
這2 種保護都可歸類于環(huán)路保護,其優(yōu)勢是具備環(huán)路自愈功能,能夠自動倒換且倒換迅速,并具備SD 觸發(fā)倒換功能,能夠根據(jù)誤碼情況自動倒換,保障了業(yè)務承載質量。其劣勢是環(huán)路不能抗多點中斷風險,即環(huán)路中只能同時存在1 處線路斷點,否則會引起網(wǎng)元脫網(wǎng)[2]。
1.2.1 通知流程
當光纜線路故障發(fā)生后,維護人員根據(jù)省公司故障派單信息,經(jīng)過對專業(yè)網(wǎng)管告警初步判斷后,再通知相關處理人員及分管領導。根據(jù)2020 年3 月—2021 年6 月骨干光纜故障通知時限數(shù)據(jù),共計24 次,歷時為5 ~50 min。其中,10 min 內完成通知調度的次數(shù)占比為50%,30 min 內完成通知調度的次數(shù)占比為87.5%。
這種故障通知調度延時的情況,在各分公司都是一個較為普遍的現(xiàn)象。網(wǎng)管集中化以后,故障的通知調度主要靠派單與手機短信。這種方式存在一些缺陷,“維護人確認”是主要問題。集中網(wǎng)管的故障派單和短信通知需要人工二次確認和通知,或者需要維護人員主動實時查看,但是工作人員無法做到24 h緊盯短信通知,實時性較差;故障派單為屬地化派單,網(wǎng)管集中在市公司操作,而光纜故障可能發(fā)生在縣公司,市、縣收到的故障派單不一致,尤其是非工作時段,值守人員為非傳送網(wǎng)專業(yè)人員時,更易造成網(wǎng)絡維護與線路維護暫時性脫節(jié)。
1.2.2 處理流程
維護人員接到故障單或電話通知后,需要從資源系統(tǒng)或保存資料中確定故障段的光纜信息,然后應急調度、光纜搶修及線路保障3 個小組同步進行故障處理工作。應急調度組任務是利用備用路由恢復環(huán)路保護;光纜搶修組任務是判斷光纜中斷點和現(xiàn)場接續(xù)搶修;線路保障組是加強環(huán)路其他段落的光纜巡線工作,防范二次斷纜。該處理流程看似有條不紊、各負其責,實則費時費力、效果不顯。具體原因如下:參與故障的處理人員組織龐大,以本地網(wǎng)市到縣OTN系統(tǒng)為例,某處C3 光纜中斷,則至少7 個縣市、3個市公司網(wǎng)格、2 個市公司部門參與,直接處理人員20 人、車輛12 臺起步,搶修成本可見一斑;在應急調度保護倒換恢復前,二次線路開環(huán)故障風險依舊較高,參與人員面臨精神和身體雙重重壓。由此可知,本地網(wǎng)線路維護的壓力主要來自于OTN 網(wǎng)絡的保護能力不足,從發(fā)現(xiàn)到處理甚至日常維護都需要進行優(yōu)化完善,以降低脫網(wǎng)風險和維護成本。
OTN 多樣化保護策略及部署方案從線路故障實時性通知與調度、OTN 線路雙物理路由改造、光線路保護(Optical Line Protection board,OLP)改造、OTN 二平面建設以及本地網(wǎng)光纜故障3 級預警機制等5 個方面進行了全面優(yōu)化完善[3]。
簡化告警模型,利用專業(yè)網(wǎng)管聲告驅動監(jiān)控人員一站式實時通知調度,5 min 內完成相關故障處理人電話通知,解決了實時性和機線配合問題,有效縮短了搶修歷時。
一是線路告警模型選擇“MUT_LOS”,以排除其他雜項告警影響直觀故障判斷。根據(jù)告警模型的優(yōu)劣分析,定制告警采用“MUT_LOS”進行實際測試。測試方式是機房斷開跳纖和中斷模擬光纜。測試結果如下:線路中斷后,無其他干擾告警,監(jiān)控終端的聲音告警響亮清楚、拓撲中斷的纖纜連接變紅色明顯,可第一時間完成告警發(fā)現(xiàn)、判斷與通知。
二是資源標注,資源系統(tǒng)導出各段落的光纜光路資料,與現(xiàn)場資料核對無誤后,在監(jiān)控纖纜連接上標注信息。一旦光纜發(fā)生故障,只要鼠標輕移到變紅的纖纜段,該段光路信息就可顯示出來,節(jié)省了維護人員到資源系統(tǒng)查找光纜光路信息的時間。
三是制定培訓資料和通信錄,保證值班人員即看即會。
統(tǒng)籌打通C3和C4網(wǎng)光纜、盤活舊桿路、管道資產(chǎn)、置換或租用電信以及移動光纜纖芯資源,降低改造成本,提高改造效率,實現(xiàn)完全的光纜雙物理路由。
在雙物理路由改造的基礎上,啟動OLP 保護改造建設,完善OTN 系統(tǒng)的保護策略,形成OLP 線路保護+光通道保護的四路由+的安全保護策略,既解決了線路二次斷纜的保護問題,又能通過SD 劣化驅動通道倒換機制,提高了業(yè)務承載質量。一平面改造后,每節(jié)點抗二次開環(huán)能力提高了300%,環(huán)網(wǎng)理論提升1 300%。
為解決智能城域網(wǎng)100 Gb/s 中繼鏈路雙系統(tǒng)負荷分擔問題,完成市到縣OTN 二平面的建設。該方案優(yōu)化了市到縣的OTN 組網(wǎng),由傳統(tǒng)大一環(huán)分成2個小環(huán),提高了資源利用效能和波道質量。同時,由于部署OLP 保護和通道保護,網(wǎng)絡健壯性得到了極大提升[4]。
隨著OLP 保護建設的完成,傳統(tǒng)維護方式也發(fā)生了新變化,由一級預警機制變?yōu)槿壘o急預警機制,具體如表1 所示。

表1 本地網(wǎng)光纜故障3 級緊急預警機制對照表
OLP 保護屬于光線路保護,雙發(fā)選收,當主備用通道光功率差值超過5 dB,在故障段落觸發(fā)倒換機制,與環(huán)路上其他段落無關,不具備信號劣化保護(Signal Degrade protection,SD)觸發(fā)倒換功能,無須配置監(jiān)測通道。OLP 保護的優(yōu)點是倒換機制簡單、倒換速度快,缺點是無法監(jiān)測單波道運行質量,不能針對波道SD 觸發(fā)倒換。
2022 年某日,開發(fā)區(qū)至蓬萊段光纜故障,該段落OTN 一平面發(fā)生OLP 倒換、二平面?zhèn)溆寐酚芍袛唷?00 min 后,中斷光纜尚未完成接續(xù),棲霞至萊陽光纜發(fā)生故障中斷,該段落OTN 一平面發(fā)生OLP 倒換、二平面?zhèn)溆寐酚芍袛啵? 次故障業(yè)務均未中斷。
故障處理過程如下:2 次故障發(fā)生后,專業(yè)網(wǎng)管聲告驅動故障通知流程,值班人員均在2 min 內電話通知到相關維護人;5 min 內發(fā)布釘釘群預警信息,第2 次故障預警增加重點段落巡視重保信息;10 min內完成釘釘群故障段光纜信息及網(wǎng)管拓撲截圖發(fā)布;20 min 內完成釘釘群光纜中斷距離信息發(fā)布;2 次光纜修復歷時均在2.5 h 內完成。
故障原因總結如下:一是故障通知調度流程順暢,無拖延、脫節(jié)現(xiàn)象;二是故障信息發(fā)布及時,準確;光纜修復歷時短,比4 h 時限要求提前1.5 h 完成;三是本次故障OLP 保護正常倒換,全程未發(fā)生節(jié)點脫網(wǎng)、業(yè)務中斷情況。該故障如發(fā)生在改造前,有可能會造成5 個區(qū)縣公司脫網(wǎng)的重大故障,在實戰(zhàn)中驗證了OTN 傳送網(wǎng)OLP 保護策略部署的必要性。
QCP 保護屬于SNCP 類的光通道保護,光層雙發(fā)選收,倒換機制為主備光功率差值5 dB 和SD 觸發(fā)2 種方式。其中,SD 觸發(fā)需配置監(jiān)測通道。QCP保護優(yōu)點是能夠保護單波道的運行質量,有利于提升用戶感知度,缺點是相比OLP 投資更大,不具備抗二次斷纜脫網(wǎng)風險。光轉換單元(Optical Transform Unit,OTU)保護原理也屬于SNCP 保護,電層交叉配置雙發(fā)選收,信號丟失(Loss of Signal,LoS)、幀丟失(Loss of Frame,LoF)或SD 告警觸發(fā)倒換,無須配置監(jiān)測通道。OTU 保護的優(yōu)點是由于每個方向均配置相同OTU 板卡,相比QCP 保護安全性更高,缺點是配置板卡最多、能耗最大、成本最高以及不具備抗二次斷纜脫網(wǎng)風險。
2022 年某日,某縣部分5G 基站有閃斷現(xiàn)象,智能城域網(wǎng)監(jiān)測該縣有1 條上聯(lián)中繼有誤碼。
該條上聯(lián)中繼承載在OTN 二平面,網(wǎng)管監(jiān)測光纜線路光功率正常,OTU 單板性能監(jiān)測有誤碼。障礙處理過程如下:人工倒換備用通道,OTU 單板監(jiān)測誤碼消失,智能城域網(wǎng)監(jiān)測上聯(lián)中繼誤碼消失;8通道光譜分析板掃描波道信噪比顯示該條波道異常,信噪比為13 dB,正常應大于16 dB;微調該波道發(fā)送光功率后,8 通道光譜分析板掃描波道信噪比為23 dB。倒換回主用通道,OTU 單板監(jiān)測誤碼為0,智能城域網(wǎng)監(jiān)測上聯(lián)中繼誤碼為0,基站正常。
故障原因總結如下:一是智能城域網(wǎng)因多廠家設備共存,未部署SD 觸發(fā)倒換策略;二是OTN 二平面該波道未倒換,QCP 保護組未配置SD 觸發(fā)的監(jiān)測通道,因此未能觸發(fā)自動倒換;三是由于OTN 波道帶寬越來越大,其承載的業(yè)務也越來越多,單波道故障也會對本地網(wǎng)用戶產(chǎn)生較為強烈的感知影響。隨著設備運行時間增長,單波道降質的故障會更加常見,本次故障也側面驗證了本地網(wǎng)OTN 配置QCP 保護的必要性[5]。
文章主要對OTN 多樣化保護策略進行分析,其中OLP 保護案例驗證了抗二次斷纜脫網(wǎng)風險能力的可靠性,QCP保護案例驗證了配置波道保護的必要性。這2 個案例充分體現(xiàn)了OTN 網(wǎng)多樣性保護策略的部署在應對線路和波道故障的抗風險能力已經(jīng)得到極大提升,網(wǎng)絡健壯性比優(yōu)化前更強,還有故障搶修成本降低、抗二次斷纜脫網(wǎng)風險、搶修歷時縮短、維護質量提升以及降壓減負等優(yōu)勢。