李茜
山西陽泉升華通信技術有限公司, 山西 陽泉 045000
我在單位主要負責EWSD交換機的運行維護,故障處理。工作近二十年來,從1994年8月開通的全國首家專網(wǎng)六千門EWSD程控交換機到現(xiàn)在發(fā)展成五萬余門的規(guī)模,設備第一次出現(xiàn)雙側硬盤均UNA的嚴重情況,相對來說比較重視。特認真分析,仔細研究,寫成論文,以便今后更好地管理維護,保證交換機安全、可靠、穩(wěn)定運行。
2006年7月22日,我局所屬703分局突然出現(xiàn)AIC-0告警,即風扇告警。由于當時我離告警現(xiàn)場較遠,只好電話通知就近的非維護人員看了一下程控機房的空調(diào)及CP113C機柜的風扇。但未看出什么問題,空調(diào)未停,機柜風扇也轉。我有些奇怪,以前遇見的風扇告警都是停電告警,通電告警自動消除。這次是?急急忙忙往告警地點趕。沒想到人未到,故障繼續(xù)升級惡化,具體告警內(nèi)容顯示如下:


表明1側硬盤已退出服務,于是采取相應動作,試圖激活該側硬盤,但不成功。此時,0側硬盤也出現(xiàn)告警,雙硬盤故障產(chǎn)生!告警消息如下:


通過以上報告,可以得出結論:1側硬盤及其上級單元IOC-1均UNA,因此決定先激活0側硬盤,并嚴格按照雙硬盤故障處理流程操作,命令如下:

交換機隨后提示如下消息:

根據(jù)操作流程,決定執(zhí)行第三條命令CONTMDDACT;
意思是在雙側硬盤均UNA的情況下,`用文件控制處理機去重新激活。命令執(zhí)行.
接著UPDGEN; 命令接受。52秒后命令執(zhí)行。
該命令為的是在硬盤上恢復一個可執(zhí)行的GEN,繼續(xù)系統(tǒng)的操作。這條命令可被用來在硬盤故障調(diào)試程序期間保存非永久性數(shù)據(jù)。

此時全部電話正常,都能打出去了。系統(tǒng)已從雙硬盤故障中恢復,接下來要檢查相應數(shù)據(jù)。

2.1 此次故障原因是703局停電,交換機靠蓄電池供電,幾乎快放空所致。在這個過程中,風扇是一個一個往下掉電,而且是首先告警,然后是MDD1側和0側。我讓非維護人員看空調(diào)和風扇,那時設備已來電,但硬盤均UNA。不到現(xiàn)場輸命令,設備不能自動恢復。還算發(fā)現(xiàn)的及時,否則,后果不堪設想。再拖延一段時間,那就會造成話費丟失的重大故障。這就要求我們維護人員一定要及時迅速處理故障,勿因小失大。
2.2 事后,我仔細看了OMT上的自動輸出報告發(fā)現(xiàn):其實在13:59時已有POWER FAILURE的告警自動提示。說明EWSD交換機軟件系統(tǒng)對此早有考慮。告警很準確,很到位。是很成熟的產(chǎn)品。機房的技術資料中也有這類描述。平日多翻翻,積少成多,天長日久,維護水平才會不斷提高。
2.3 程控交換機告警的同時,703局ADSL設備也同樣有故障,上不了網(wǎng)。一般來說,它們之間互不影響。有經(jīng)驗的技術人員應馬上懷疑到它們的共性:電源問題!