李麗
摘要:大連空管站自動轉報系統是負責本地飛行航班動態、氣象、情報信息、客運信息等相關信息的傳遞工作,屬于中國民航自動轉報系統網絡中的一個網絡節點。主要與沈陽建立通信傳輸鏈路進行轉報業務數據信號的傳遞。主要傳輸鏈路包括:幀中繼同步鏈路、ATM鏈路、VG鏈路、撥號鏈路共四條,通信原則為主用幀中繼鏈路,備用ATM鏈路、VG鏈路,應急為撥號鏈路。在對設備進行巡檢中發現幀中繼設備電源模塊突發故障,導致自動轉報系統大連至沈陽DYX主用同步鏈路中斷。
關鍵詞:傳輸鏈路;自動轉報系統;幀中繼
一、背景描述:
1、事件經過:
大連自動轉報系統是民航自動轉報網絡中的一個網絡節點,主要與沈陽自動轉報系統之間通信傳輸鏈路共有4條,主用通信鏈路是通過FRS-800設備作為中繼系統的同步傳輸鏈路,鏈路標識為DYX。網絡傳輸室值班員巡檢中發現轉報系統出現DYX斷線告警提示。值班員進入機房對設備進行檢查,發現協議轉換器指示燈滅,狀態顯示異常。為確保轉報信號傳輸正常,值班員迅速將DYX同步鏈路切換為備用ATM鏈路,進行信號傳輸,確認收報報文正常且無漏發、漏收報文出現。隨即,當日值班人員根據應急處置程序立即電話通知當日科值班領導,詳細報告故障現象。
2、處理過程:
在確認轉報業務信號正常傳輸后,對故障情況進行詳細排查,首先排查傳輸鏈路問題。同步鏈路租用的是聯通2M業務,與聯通值班人員進行溝通后,確認聯通通信鏈路正常,排除通信鏈路原因造成業務中斷。
值班員同時對FRS-800幀中繼設備進行檢查,發現幀中繼設備兩塊電源指示燈均熄滅,幀中繼設備處于停機狀態,至此,確認為幀中繼電源故障,造成該設備斷電,DYX鏈路業務中斷。與此同時,值班員發現機房空調發生故障,溫度高達30多度,緊急聯系空調維修人員檢查設備并且進行搶修。
為保障安全生產,聯系沈陽相關部門測試備用及應急系統鏈路工作狀態,確認收發報文均正常后,將備用、應急鏈路均接入主用自動轉報系統。
3、故障搶修:
確認幀中繼設備電源模塊故障后,將電源模塊取出,檢查電路板,發現電路板已經出現焦黑現象,無法進行維修。科值班領導立即聯系廠家人員以及其他單位調撥備件,由于該設備已經運行16年,硬件老化嚴重,并且硬件缺乏,無法調撥備件;同時,廠家對故障電源也無法進行修理,只能自行尋找維修地點。
通過多方的尋找,確認中南網絡公司可以對該電源模塊進行維修,值班人員立即將故障電源送修。
B號電源模塊兩個月后修復到貨,進行上架測試,幀中繼設備可開機單電源運行,DYX鏈路恢復正常。A號電源模塊目前仍在中南進行維修。值班員拔出幀中繼故障電源。
二、設備及人員資質
1、故障設備
FRS-800(美國ECI公司)于1998年3月投產。上線運行時間過長,備件嚴重缺乏,每日每兩小時對該設備進行一次巡檢。
2、故障原因分析
FRS-800幀中繼設備自1998年3月份投產使用以來,已連續工作十八年,硬件設備器件老化嚴重,是造成此次故障的直接原因。將故障電源設備拆開后,其內部電容器件已經發生漏液現象,導致電源模塊燒壞,無法正常供電。
此次故障搶修過程中,還有一些其他原因也應該引起足夠重視:
(一)核心機房總長超過40米,機房中間位置區域,空調制冷效果最差。根據以往經驗中間區域溫度比其他區域溫度至少高1-2度,如果空調設備故障無法制冷,對機房中間區域位置擺放的設備影響最大,設備容易因溫度過高而產生故障或者縮短壽命。
(二)FRS-800系統1998年3月投入生產,至今工作十八年,且一直為主用同步中繼鏈路傳輸設備,硬件服役時間過長,廠家對該系統硬件已經不支持維護保修工作,備件嚴重不足,不適合再作為重要中繼鏈路的傳輸系統。
(三)硬件廠家對故障電源不能正常維修,在故障修復期間增加了處理難度,需要自行尋找維修地點,大大的拖延了故障設備恢復時間。
3、后期處置及經驗總結
(一)FR設備由于其故障率較高,已不適于作為主用同步鏈路保障通信工作。故障發生后上報相關請示,建議上級部門統籌考慮,開通其他同步鏈路取代FR設備。同時對部門負責的設備進行統一排查,安全風險評估,對于運行時間過長,硬件老化嚴重,備件嚴重缺乏的系統進行整改工作,將風險降至最低。
(二)鑒于FR設備仍屬于單電源工作,其提供的DYX鏈路存在不穩定因素。網絡傳輸室對自動轉報系統中繼鏈路進行了重新的劃分,明確了在鏈路故障情況下的使用次序:主用ATM鏈路,備用VG鏈路和幀中繼同步鏈路,應急撥號鏈路。
(三)結合網絡設備巡檢,對于目前大連-沈陽的幾條中繼鏈路提出了整改意見:(1)加快ATM同步鏈路的改造(2)新建中國移動等第三運營商提供的基站業務,用于取代撥號鏈路作為應急鏈路。
(四)值班人員應加強機房巡檢,特別對于空調溫度和工作狀態燈,應予以足夠的重視,一旦發現故障情況以及報修后勤并進行記錄后續值班跟蹤。
(五)值班人員應進一步進行應急預案的學習,發生故障后,第一時間啟動應急預案,保障安全生產服務。
(六)開展自查、自糾工作,對網絡傳輸室所負責的全部設備進行安全檢查,查找目前運行系統運行過程中存在的危險源、排查安全隱患,制定切實可用的安全風險保障措施。
參考文獻:
[1]自動轉報系統網絡拓撲
[2]網絡傳輸室應急預案
[3]網絡傳輸室維護規程endprint