蔣鋒
(江蘇華電通州熱電有限公司,江蘇 南通226300)
某廠AVC系統采用雙主機配置,單臺服務器出現故障時,切換至另一臺服務器運行,同時將AVC目標值、電壓調節情況、各等級電壓實際值、閉鎖情況等信號傳至NCS系統,以供監盤人員監視。
系統投運初期,AVC系統頻繁出現運行中自動切換服務器的現象(就地檢查未發現服務器故障),切換現象約1 個月發生一次。同時NCS系統運行過程中,發現針對AVC系統正常運行中的報警、提示信息過多,絕大部分為AVC系統運行過程中的閉鎖、增減磁等信息。重要的報警信息出現時,不容易發現,亦影響了正常的事件追溯。
現場針對AVC系統進行了排查,所做工作如下:
①登陸系統終端,持續監視程序進程工作情況,發現變化較大的有psx_main 主程序占用內存情況,所占內存由程序運行初始的200M 左右升至1G 左右,并保持增長趨勢。進一步分析發現,主程序在內存控制機制中存在一定的缺陷,在對畫面及程序進行正常的操作中有引發內存泄露缺陷的可能,進一步引發程序的不穩定,導致主程序自動退出。
②雙機同步通道為TCP 以太網通道,且為唯一同步通道。當此通道故障或受干擾時,導致的后果即為雙服務器間無法同步,最終導致雙服務器系統失去穩定。
③對AVC服務器硬件系統檢查發現,TCP 以太網通道的網線水晶頭制作不規范,未能正確地將屏蔽層金屬絲接地。在特殊情況下,附近電磁干擾有可能對通訊造成干擾。
現場針對NCS系統進行了排查,發現日常運行中各類報警及SOE 事件過多過雜,其中大部分為AVC系統正常運行中的閉鎖,增減磁信息等。這些事件大量占用了報警信息欄的空間,導致重要事件發生時可能漏過報警,亦對事件后追溯SOE信息造成不便。因此,亟需對NCS報警系統進行優化,刪除部分重要性不高的報警,僅保留其在分界面的光字牌功能[1]。
根據上述檢查結果,對AVC及NCS系統進行了如下優化工作:
①針對內存管控機制的漏洞,升級主程序,增加防內存溢出機制(圖1為升級前,圖2為升級后),可以發現,升級后的程序穩定地將內存占用率控制在55M 左右。升級看門狗程序,除狗糧倒計時外,增加心跳機制(見圖3),狗糧倒計時與心跳計時做邏輯處理,當雙計時同時失效時,方判定看門狗程序錯誤,有效杜絕因看門狗自身問題導致程序的異常退出[2]。

圖1

圖2

圖3
②增加串口同步通道,日常運行中以以太網同步為主,特殊情況下可自動切換至串口同步通道,保證雙服務器同步順暢[3]。
③在NCS的AVC界面增加第一組串口故障、第二組串口故障、TCP 同步故障三個報警信號,針對AVC同步情況進行直觀化監視(見圖4)。

圖4
④對AVC服務器柜的盤柜接地、以太網網線接地進行全面排查及整改,最大程度避免電磁干擾對AVC服務器運行的影響。
⑤針對NCS系統報警信息系統進行數據庫配置修改,取消AVC調節中的閉鎖信號、增減磁信號、越限信號等,僅保留其光字牌功能。這樣即保證了這些信號的可視化,也避免了過多冗余信號對運行監盤的影響。
改造完成后,經長時間運行的觀察,AVC系統未發生切換現象,母線電壓調節過程中調節速度快,調節精準到位。NCS系統工作正常,報警欄簡明直觀,AVC分畫面各調節信息光字牌工作正常,總體改造效果顯著。
隨著電網系統的日益發展,組成結構的日益龐雜,對發電機組的調度管理要求也越來越高,考核也越來越嚴。對AVC系統的運行穩定性要求也越來越高,經實踐與觀察表明,此次改造有效地提高了AVC系統的性能與可靠性。