劉靜敏
(國家新聞出版廣電總局無線電臺管理局2021臺中控機房,黑龍江 齊齊哈爾161000)
【摘 要】針對轉動天線遠程控制系統存在問題,進行了全面系統分析,并提出解決方案。
【關鍵詞】自動化;串口通訊
一、概述
由于我臺中控機房進行集總控制,各機房端只進行設備維護、必要的巡視和應急故障處理工作,所以相關設備的遠程控制系統穩定與否直接影響全臺的安全播音工作,本文就新系統運行以來發生的一些典型故障進行了總結分析,并提出有針對性的解決辦法。
二、典型故障
類型一:
中控機房遠程控制系統執行倒頻操作時出現參數無法切換,“Power on” 異常打開故障。A:轉動天線頻率、組態和角度無法切換。天線本地控制柜屏幕提示“Power on”打開狀態,天線本地觸摸屏被屏蔽無法進行操作,發射機端顯示天線互鎖閉合,如重啟天線本地控制系統后現象依舊。此種情況采用升落高壓的方法處理“Power on” 異常打開故障,然后可以進行后續正常的遠程或本地操作。B:轉動天線頻率、組態切換到位,但角度無法切換。天線本地控制柜屏幕提示“Power on”打開狀態,天線本地觸摸屏被屏蔽無法進行操作,發射機端顯示天線互鎖開,如重啟天線本地控制系統后會額外出現ATU水冷故障和ATU控制故障。此種情況需要的復位轉動天線四層B4R1柜控制系統中的相關故障,之后天線互鎖閉合,再采用升落高壓的方法處理“Power on” 異常打開故障后,可以進行后續正常的遠程或本地操作。
類型二:
中控機房遠程自動倒頻時,預設值已經設置成功,但轉動天線頻率、組態和角度無法切換,無法自動進行后續執行操作,遠程切換為手動仍無法進行操作。此時可倒本地進行手動天線倒頻操作。
三、分析及處理
對類型一的故障進行原因分析:
天線控制系統判定天線是否在加高壓狀態,完全依靠于遠程控制系統反饋的“Power on”信號,此信號級別最高,保證在天線加高壓狀態下禁止天線的任何本地或遠程操作。
A:倒頻過程中遠程控制系統異常給出“Power on”播音指示信號的激活命令,將造成天線本地控制系統進入異常狀態,會立刻禁止所有正在進行(或準備進行)的操作。直至“Power on”解除。此時天線控制系統處于既不執行倒頻操作又無法給出天線到位的閉鎖信號的狀態。遠程控制系統后續指令處于隊列中,無法執行。機房端本地控制全部屏蔽,也同樣無法執行。
B:落高壓過程中遠程控制系統沒有關閉“Power on”信號,由于“Power on”一直存在,造成遠程控制端操作受限,無法倒頻,并且使后續指令處于隊列中,無法執行。機房端本地控制全部屏蔽也無法進行相關操作。
類型一故障的解決辦法:
由于轉動天線遠程通訊接口DF1協議在通訊過程中校驗不足,可能在通訊過程中發生錯碼,誤激活“Power on”播音指示信號位,造成意外“Power on”播音指示信號激活。解決辦法:在遠程控制端采取措施,與開發人員聯系,修改遠程控制端程序,去掉實際意義不大的“Power on”信號指示功能,系統不去激活使用該功能,同時增加關閉“Power on”的獨立按鈕,在特殊情況下可以強制關閉。同時檢查整改通訊鏈路設備的可靠性,強化光貓等設備的接地和抗干擾措施。
其中一次故障出現在自動播音狀態下,遠程端手動落高壓,然后手動輸入進行倒頻操作過程中,可能存在程序未知bug,導致切換后手動操作時程序處于不穩定狀態,或此過程中其他未知因素出現,結果導致異常“Power on”激活。此隱藏bug排查起來十分困難,且找不到相關影響因素。需要積極與開發人員聯系,查找遠程控制端程序bug,排除潛在隱患,增加設備可靠性。
本地控制系統設備老化造成的可能性較小,首先本地控制核心器件plc處理器,之前進行過更換,且羅克韋爾的PLC具有高度穩定性。為了排除相關可能性,可以更換新的SLC5/03板、SLC5/04板核心處理器板卡。
對于附加的天線系統水冷故障解決方案是進行轉動天線ATU冷卻系統加裝水流接點延時裝置,解決ATU水冷系統啟動初期60秒左右時間內,純凈水逐漸充滿整個冷卻管線和器件過程中,流量計浮子大幅度波動,造成接點頻繁開閉,進而導致控制系統出現水冷故障,避免此故障同時出現具有重要意義,可以大幅度縮短異態處理時長,減少停播時間。
對類型二的故障進行原因分析:
倒頻操作由二條寫命令和對應的返回確認數據組成,第一條為遠程發送的預置數據寫命令,天線本地端返回確認數據,然后第二條為根據返回的確認數據發出執行命令,天線本地再次返回確認數據,天線同時開始動作。如果遠程第一條指令發出后,收不到返回確認指令,或返回指令傳輸過程中發生錯誤,會導致系統一直處于等待狀態。
是否會進入異常處理分支程序及如何處理,這完全依賴于程序設計。如果沒有及時有效異常處理機制和串口通信管理機制,由于通訊口指令隊列中原(寫)指令未完成,會導致后續對串口操作(包括手動)指令一直處于后續隊列排隊中,無法執行。進而遠程無法操作。
解決辦法:
由于轉動天線遠程通訊接口DF1協議在通訊過程中校驗機制不足,可能在通訊過程中受到干擾發生錯碼,導致回傳確認數據格式錯誤,被遠程控制端丟棄忽略。在遠程控制端采取措施,與開發人員聯系,修改遠程控制端程序,完善通信異常處理機制,采用定時重發和執行結果確認方式,同時完善串口管理程序,采用優先級管理,保證重要操作優先執行。同時檢查整改通訊鏈路設備的可靠性,強化光貓等設備的接地和抗干擾措施。加強機房監測平臺的監測功能,監測倒頻時的設備運行狀態,如未在規定時間內動作,及時給出告警提示。
其他可能因素:
通訊速率也是影響系統穩定性關鍵問題之一,由于PLC系統通訊處理能力有限,過短的刷新周期將有可能造成系統不能及時響應,特別是當PLC處于進行復雜運算狀態,此時PLC一個掃描周期將變長,此時通訊內容可能沒有被執行前就被后一條刷新,如果遠程端沒有完善的異態處理機制,將會造成未知的故障,為此,可在保障通訊時效性基礎上,將通訊速率降低,避免此類問題發生。
四、小結
自動化系統改變了原有的運行方式,提高了運行效率,把值班人員從繁重操作中解放出來,但隨著自動技術的發展,設備的穩定運行越來越依賴于自動化系統,這對自動化系統提出了更高的要求,而自動化系統必然會存在漏洞和不足,這就要求我們在工作中善于發現問題,及時總結分析,對系統不斷進行完善,以便使自動化系統更加穩定的運行,更好的服務于安全播音工作。