俸麗琴
(中國移動通信集團云南有限公司西雙版納分公司,云南景洪 666100)
眾所周知,傳輸網絡故障主要劃分為設備側和線路側2大類故障。其中,設備側故障主要是由于設備性能和結構等原因引起的。而引起線路側故障的原因比較多,主要包括光纜纖芯質量、尾纖質量、接頭情況、環境因素等。如何有效壓降傳輸故障,降低網絡運維成本,成為通信運營商一直以來的工作目標和努力的方向。
傳統的巡檢方式是維護人員徒步逐桿進行巡檢,效率低、耗時長[1],隱患發現不及時,線路故障得不到壓降。隨著近年來無人機的快速發展,技術也越來越成熟,操作簡單,便于推廣,是輔助桿路巡檢最佳的選擇對象。利用無人機巡檢,具有以下優點:(1)針對特殊場景,可以利用無人機巡檢,大大提高了維護人員戶外作業的安全性[2],有效避免維護人員在戶外作業時與野生動物、毒蛇等危險動物遭遇的風險。(2)在發生暴風雨或地質災害如泥石流、塌方、地震等情況后需要對重要線路開展巡檢時,利用無人機巡檢既可以快速有效地完成工作[1],又能保證維護人員人身安全不受自然環境的威脅。但是無人機存在的缺陷不容忽視,即無人機的續航能力存在局限性,一般只有半小時至1小時左右,不能長時間進行作業。
隨著經濟的快速發展,公路等基礎設施建設的覆蓋使得大型交通工具也能實現通車,而鄉鎮上傳輸網絡建設初期,跨路電桿多為7m桿或5m桿,現在,7m的高度已然不能滿足大貨車的通行高度,時常因貨車超高或司機在車輛行駛過程中因環境因素的影響,如烈日、雨天、夜晚等視線不佳的時候會出現對跨路光纜高度與車輛自身高度差判斷失誤而掛斷光纜,引起傳輸線路故障。結合日常巡檢工作,將跨路桿路換成12m桿或者在原有基礎上增加槽鋼,已基本達到增高跨路光纜高度的效果,同時懸掛通信光纜警示牌,可以有效避免光纜被大車掛斷的風險。
光纜拖地主要是因為桿路掛件是鐵制品,隨著網絡建設時間越來越久,經過長期的風吹日曬,吊線、掛件等就會生銹,隨著光纜數量越來越多,經常出現吊線無法承載光纜重量而斷裂以及電桿倒桿導致光纜脫落的情況。造成光纜拖地的主要原因有以下幾個方面:(1)工程為了趕工期臨時沿路布防光纜未上桿。(2)維護或故障搶修時臨時沖放了光纜未及時上桿。(3)為市場發展能搶先競對無線拉遠覆蓋沒有路由而沿路臨時布防的光纜等。而沿路光纜拖地還會給人們出行造成安全隱患,造成交通事故,嚴重的甚至會造成人員死亡,給運營商帶來不必要的賠償。光纜長時間拖地,也會因為摩擦、外力拉扯、人類生產活動造成光纜損耗,甚至被人為砍斷造成故障等。
光纜接頭盒封裝不嚴,時間長了,很容易進水[3]、進螞蟻。螞蟻在里面筑巢后經常會啃咬纖芯,導致光纜纖芯中斷,引起故障。為有效解決這一問題,經過多次實驗觀察,得到最有效且效果最好的辦法就是在接頭盒內裝上樟腦球,外加使用密封條和熱熔膠封裝。因樟腦球具有揮發性,揮發時間較長,揮發后不會遺留粉塵之類的固體物體,不會對光纜纖芯造成衰耗及誤碼等影響,且揮發的氣體在接頭盒封閉的空間內,氣味不容易散,藥效持久。可以有效避免接頭盒進螞蟻,減少故障的發生。此外,要規范使用接頭盒,避免使用礦泉水瓶等物品替代封裝。
光纜衰耗過大會引起業務發生閃斷[4],尤其是2G業務對光纜衰耗較為靈敏,光功率低于門限值時業務就會發生倒換或者閃斷,而備纖修復可以降低光纜衰耗,提高光纜纖芯資源的質量。匯聚層以上環路承載的業務量較多,如發生故障將會導致大面積業務中斷,造成很大的損失。所以匯聚層以上光纜優質纖芯資源儲備尤為重要,故障發生時,在光纜不全阻的情況下,可以通過纖芯調整快速恢復業務,縮短故障時長。
匯聚層以上的光纜因同路由發生故障將會導致大量業務中斷,傳統的同路由隱患排查方法是通過設備網管拓撲圖結合日常維護經驗總結出同路由情況,此做法憑借主觀因素較多,缺乏參考,容易有遺漏。可以借助Google Earth地圖展示功能把設備網管拓撲圖與運營商資源外線數據統一融合呈現輔助排查。具體是將資源管理系統中匯聚層以上環路使用的光纜以及承載的桿路信息導出后,導入Google Earth(前提是資源管理系統中的數據要準確),并用不同顏色區分每一個光纜段落,同一個環網的光纜數據放在同一個文件夾下,方便排查時使用軟件自帶的文件夾隱藏功能,快速排查發現同路由隱患。如2條纜走向有重疊部分就代表同路由,重疊線纜長度即為同路由長度。維護人員可以利用系統自帶的測距工具測量同路由長度,對判斷隱患的重要等級提供參考依據。
造成光纜故障的原因有很多,如:光纜纖芯受到外力擠壓、拉抻、光纜打折導致光纜彎曲半徑過大使得光纜內部的玻璃纖維中斷引起故障;光纜敷設距離過長,中間使用太多的接頭,接頭工藝不達標導致的光纜衰耗過大、信號丟失;光纜連接器受損導致的故障[3];尾纖老化引起的衰耗大等。如何有效預防傳輸線路故障,不僅要對存量光纜隱患進行整治,也要嚴格管控新建工程的入網標準,不能為了趕工期而降低對工程質量的要求,要嚴把質量關,拒絕帶病入網。
結合ZXSEM巡檢小工具可以導出設備網管中的長支鏈明細,提高設備成環率是提高支鏈退服的最佳手段。而隨著我們設備入網越來越多,前期已開通的站點現在會出現一些結構不合理,距離過長,或者組網有隱患等的情況,需要在維護過程中不斷地優化設備組網結構,提高傳輸網絡的安全性,進而降低傳輸故障。
2.1.1 長支鏈成環改造,提高設備成環比
在傳輸網絡結構長支鏈中,上游節點無論是停電或者是光纜中斷,下游節點都沒有辦法通過其他隧道修改業務,只能等上游節點恢復后下游節點的業務才可能恢復,其間影響業務時長較長,一旦因上游問題發生故障將陷入被動搶修的模式,而通過把支鏈成環后就可以有效解決這一問題。
長支鏈改造思路:以最短的光纜路由實現最多的網元成環,雙歸環優于單歸環,同時光纜路由的選取要避免出現同纜同路由的情況。資管管理系統的外線采用的是GIS地圖,缺乏參照物,路由的選取可以借助Google Earth將所需的資源外線數據導出后整理成系統支持的文件格式,將數據導入Google Earth,可以利用Google Earth輔助光纜路由的選取。
2.1.2 建立匯聚環逃生路由,有效縮短故障時長
匯聚環雙斷,會造成大面積的網元托管和業務中斷。緊急搶通業務需優先搶通傳輸監控,但由于匯聚環是數據骨干域(0域),接入環都屬于非骨干域(非0域),需要通過和其他雙跨匯聚環的接入環搶通托管的網元,待托管網元上線后才可以運用故障搶通工具對業務進行搶通。而修改網元數據耗時與接入環長短成正比,為了爭取能夠在最短的時間內恢復業務,可結合倒換測試模擬統計出所有匯聚層鏈路中斷后能夠通過最短接入環進行搶通的路由明細,減少故障發生時因查找可用路由所消耗的不必要的時間,同時,將路由明細作為一份重要的日常維護資料按月進行動態更新,這可以有效地縮短故障時長。
另一方面,因為通過修改接入環數據搶通監控路由需占用一部分時間,為了更快搶通業務,在光纜資源允許的情況下對不同匯聚環又另組一條專用搶通業務的鏈路,這樣就省去修改接入環數據時間,可以更快地搶通業務。
主要難點:(1)資源管理系統中啞資源數據不準確,導致光纜路由選取困難,需要花大量的時間精力去找出各個匯聚環間存在現網中光纜路由或者相連距離較短具備低成本放纜條件的光纜路由。(2)逃生路由通道鏈路帶寬至少滿足10GE以上。帶寬太低在搶通過程中會導致流量超限,影響客戶感知,而現網中10G或者100G板卡基本是根據前期規劃配置的,可能現網中沒有多余的10G或100G端口提供逃生路由鏈路使用,這需要額外的板卡和光模塊。
主要優勢:網管能夠根據現網設備拓撲自動計算出距離較短的搶通路由。
逃生路由的實現:(1)在2個不同的匯聚環間找到一條可用光纜,并確保光纜路由與環路上其他段落不存在同路由隱患,若現網無光纜資源可以利舊,原則上應選取一條路由距離相對短、布放光纜成本費用低的路由重新布放一條到目標網元的光纜。(2)規劃好設備端口,準備好板卡、光模塊及尾纖,現場根據規劃的端口完成跳纖,并確保光功率正常。(3)后臺做好DCN即可完善逃生路由。
當匯聚環路發生雙斷時,此時匯聚環上的網元是不會托管的,即可以通過網管的搶通工具快速恢復業務。主要操作:割接調整->隧道遷移->故障搶通->選擇故障鏈路->選擇搶通隧道->搶通路由計算->搶通數據下發,實現業務恢復。
倒換測試是核查傳輸設備隱患的重要手段,是自我糾錯、驗證的手段。通過關閉端口激光器模擬可能出現的故障場景,可以發現網絡中業務數據配置是否準確,網絡通道保護是否有效,是否存在其他異常情況等,可以有效排查現網運行存在的安全隱患,做到事前發現隱患,避免不必要的故障發生。
設備網管上的告警是上報故障最為直觀的方式[5],做好日常網管巡檢,對已上報的告警及時處理,可以有效避免故障的發生,尤其是單板脫位告警、性能越限告警、高溫告警、防塵網堵塞告警等,這些告警如不重視將會直接引發故障,影響業務,同時告警太多會引起告警風暴帶來嚴重后果。近年來室外一體化機柜也越來越多,且室外一體化機柜散熱效果不好,特別是在熱帶地區,室外氣溫本身就很高,如果不及時處理設備高溫問題,將會導致設備被燒壞,引起故障,所以定期清理防塵網必不可少,尤其是匯聚層以上的設備更是要定期進行防塵網清洗,并對巡檢發現的高溫隱患及時處理。風扇單元在清潔時需要注意規范操作,一次只能進行單個風扇單元的清洗,不能一次把子架中3個風扇單元全部拔出進行清潔,清潔完成后需要立即還原。且清潔需采用毛刷或者吸塵器的方式進行,不能用濕毛巾或者水洗的方式,因為風扇單元上有電路部分,水洗可能會將風扇燒壞。風扇正常工作才能保證系統通風對流,設備單板的工作溫度才能在正常溫度范圍內,否則溫度過高會導致單板運行異常出現誤碼等影響業務的不良情況。
另外,對未使用的尾纖頭應使用防塵帽保護,未使用的光板的光口應使用光口塞蓋住。維護中要保證尾纖頭、砝蘭盤避免受到灰塵的污染。尾纖頭插入單板砝蘭盤前,應進行清潔檢查,對不清潔的尾纖頭及時使用擦纖盒和壓縮空氣清潔器進行清潔處理,不然容易造成光功率損耗,導致弱光、誤碼等情況影響業務的正常開展。
近年來,人為破壞通信設備設施的情況依然屢禁不止,隨著家寬業務的大量發展,特別是在全球“缺芯”的背景下,資源的短缺促使部分人鋌而走險,開始走向違法犯罪的道路,頻頻出現機房內PON板、光模塊、電源線被偷盜的情況。而一旦出現機房被盜,將會嚴重影響客戶業務的正常使用,故障恢復的時長也會消耗大量的人力和時間。且報警后警方破案難度較大,很難追回被盜物資,減少損失。為有效解決這一問題,一是在機房內安裝攝像頭。攝像頭的安裝應選擇合適的位置,對機房全方位監控,以便在需要時可以能夠提供清晰有效的視頻,為警方破案提供有力的幫助。也可針對特定設備進行監控,將攝像頭對準所需重點監控的設備,進行重點保護,當人員靠近監控設備時攝像頭能夠自動發出警告,可以起到一定的震懾作用。二是更換機房門鎖,將鎖反向安裝在機房內側,留一小孔夠手進入機房內部開鎖,以此增加開鎖的難度,致使無法從外圍進行撬鎖,提高門鎖的安全性,能夠有效起到防盜的效果。三是設備廠家應在如何有效避免被盜的板件、光模塊無法上線使用或在線跟蹤定位被盜板件方面多做升級更新考慮,能夠協助通信運營商對遺失板件進行追回提供相應的技術支持,有效打擊違法犯罪行為。
想要傳輸網絡故障得到有效的壓降,只有在維護過程中不斷地提升維護人員技能,避免因人員誤操作導致大面積故障的發生[6]。合理地對網絡結構優化,線路側和設備側同時抓,才能切實提升網絡的安全性,保障通信網絡的健康發展。