
摘 要:羅德施瓦茨甚高頻監控系統是一套對羅德施瓦茨甚高頻電臺設備狀態進行數據采集、顯示和遠程控制的監控軟件。此套監控系統簡稱ARCEMIS系統,是一套基于網絡構建的監控系統。支持主控端和客戶端接入方式,應用軟件被稱為RSCC。
關鍵詞:羅德施瓦茨;故障分析;故障研究
1 羅德施瓦茨甚高頻監控系統介紹
該套系統通過羅德施瓦茨公司生產的多鏈路控制器、傳輸路由、主控電腦及后臺的數據庫實現其功能性(系統鏈接圖如圖1所示)。
該套系統能夠實現對羅德施瓦茨設生產的甚高頻電臺數據的實時監控,其中包括發射機的輸出功率、調制度、駐波比等設備參數,接收機狀態等。同時,該系統還可以對電臺進行遠程控制,包括主備機切換、開關機、發射等功能。能夠確保在電臺發生故障時第一時間確定故障原因,排除故障,保障飛行安全。進而實現對電臺的24小時不間斷的管理。是保障電臺正常工作的重要監控及保障手段,在甚高頻地空通信系統中占有舉足輕重的地位。
2 監控數據庫介紹
ARCEMIS系統是基于后臺數據庫監控甚高頻電臺的狀態、參數和進行遠程控制,所以后臺數據庫的穩定運行就成為了該套監控系統的關鍵,由于早期羅德施瓦茨公司生產的甚高頻電臺較多應用于國外,其監控方式與我國存在差異,在我國早期應用時,為滿足我國的需求,特意對后臺數據庫進行了研發,該數據庫并非使用的目前較常用的SQL SERVER等軟件,而是一套由德國廠家自行開發的程序,而后期因為該套系統應用的局限性,該套開發軟件已無更新及使用,造成了目前對于該套監控的后臺數據庫的源代碼無法查詢和修改的可能,進而無法對該數據庫進行修改,為后續的數據庫改進造成了障礙,技術人員只能通過現有的數據庫,對已有的配置信息進行修改,才能提高數據庫的穩定性及功能性。
3 監控系統數據庫故障分析
近年來,隨著華北地區甚高頻系統的建設規模不斷增加,甚高頻電臺數量也與日俱增,早期搭建的ARCEMIS系統數據庫對電臺數量的冗余度下降,多次出現系統癱瘓的故障,進而對設備正常運行產生了安全隱患。前期的解決辦法為搭建備用系統對甚高頻電臺實時監控,但由于主備用系統切換過程較復雜,時間較長,且需要手動調整,增加了值班員的工作負荷,并存在相應風險,為解決上述問題,開展了專項的故障原因分析調查。
技術人員首先對系統進行了研究分析,發現該套系統是實時對設備參數進行數據采集,但各個設備之間采取的是輪詢方式,所以系統對于硬件要求不是很高,一般的計算機均能滿足上述要求,所以基本排除了硬件原因造成系統癱瘓的可能性。
技術人員進而對傳輸路由進行了分析,因為各個設備不同屬于同一地點,傳輸路由也不同,且每條路由均有其他不用業務,而系統癱瘓時,其他業務均正常,所以也基本排除了傳輸路由造成系統癱瘓的可能性。
基于上述兩點,技術人員將可能性基本鎖定為監控主控端故障。經研究發現,該套ARCEMIS系統是通過數據庫實時對設備發送指令,并收集設備送回的信息存儲于數據庫內,且該數據庫在ARCEMIS系統參數變化(包含設備數量、設備異常狀態,ARCEMIS系統重啟等)時自動對其數據庫參數設置進行安全文件備份,該安全文件也存儲于數據庫中。技術人員對崩潰的系統數據庫進行了分析,發現所有崩潰的數據庫的安全文件均已達到上限值,且無法進行刪除與修改,進而判斷導致ARCEMIS系統崩潰的故障點應該是安全文件達到上限值引起的。在該套數據庫早期建設中,由于未考慮到后期電臺數量的增加所產生的ARCEMIS系統參數變化,所以在對該文件的大小進行設置時設定值較小,進而導致當備份次數增加,該文件存儲空間沒有空余時,安全文件溢出,導致數據庫癱瘓的現象發生,最終造成ARCEMIS系統崩潰,無法完成監控和控制功能。
4 解決辦法
為解決安全文件備份溢出的故障,首先對該數據自動安全備份功能進行了分析研究。研究發現該備份功能主要目的是使技術人員在ARCEMIS系統故障發生后恢復其數據庫參數設置提供依據。在實際使用過程中,不會發生數據庫參數設置發生變化。基于上述理由,將該數據庫的安全文件備份功能關閉,就可以避免數據庫安全文件溢出進而導致ARCEMIS系統崩潰的故障發生。但是在關閉安全文件備份功能后,系統將無法對參數修改的情況進行監控與記錄,雖然不影響該套系統的正常運行,但是卻存在了潛在的運行風險,一旦數據庫的參數修改發生變化,系統仍存在崩潰的可能,而且無法查證原先的正常參數配置,導致整個監控系統無法還原,那樣做后只能將整個監控系統重新安裝并調試,對運行造成無法監控的重大隱患。在查找方法的同時,技術人員也考慮到數據庫維護人員不能做到24小時對該系統進行監控,為避免誤操作造成的數據庫參數設置發生變化又無相關記錄的事情發生,維護人員進一步對安全文件備份進行了研究,發現在數據庫的參數配置中,可以對安全文件的數量、大小、路徑進行修改,為解決問題提供了新思路。技術人員開始對每次安全文件備份的字節數及頻次進行了統計,同時結合設備的使用年限,計算出在使用年限內可能的最大備份數量,同時適當增加其冗余度,最終設定了新的安全文件數量及大小,這樣保證了即使打開安全文件備份功能,也不會造成文件溢出的故障。此舉既可以記錄數據庫參數設置發生的變化,又不會造成安全文件溢出的故障發生。為ARCEMIS系統正常運行提供了更深層次的保護。
5 結束語
ARCEMIS系統是基于該系統數據庫來實現甚高頻電臺的數據監控及遠程控制,所以該系統數據庫是該套系統的運行之本。保證數據庫的正常運行才是該套系統運行正常的根本,目前,除華北地區外仍有許多該套系統運行的單位及部門,而且,在今后的中小機場設備運行中,該套ARCEMIS系統仍然可能成為主力運行設備,為保障系統的正常運行,文章中提及的解決辦法對其他應用本套ARCEMIS系統的單位提供了一個研究方向。同時,由于缺少對該套數據庫的認識,其數據庫內的更多功能及隱患也有待相關人員的繼續研究。所以,該套數據庫的穩定,冗余度將直接影響設備的正常運行,維護人員應該更多的去尋求技術的探索,保證數據庫的穩定性,并增加其功能性,進而保證甚高頻地空通信的正常運行。同時也讓技術人員有所反思,就是對于目前包括監控系統在內的各套系統中,計算機、數據庫及網絡已經成為了系統運行的根基,技術人員應更多的考慮其作用,開發潛在功能,這樣才能為各類系統的正常運行提供保障。
作者簡介:黃云鵬(1988,12-),男,漢族,上海市,助理工程師,大學本科,研究方向:地空通信設備。