黃海軍,胡金平,李金陽,浦 亞,單 良
(1.華電云南發電有限公司,云南 昆明 650228;2.南京河海南自水電自動化有限公司,江蘇 南京 210032)
隨著電力改革的持續深入和技術的創新發展,遠程集控中心已成為機組建設的標準配置。但傳統的計算機監控系統普遍適用于單一廠站或機組,存在一些無法適應流域性生產管理的緊要問題,亟待處理。以金沙江流域某大型集控中心(簡稱J 集控中心)為例,介紹了其自2017 年以來實施的基礎功能消缺、關鍵功能增強和主要功能全面質量改造等改進工作,依次解決了系統“不經用”“不夠用”“不好用”等問題,實現了流域集控中心的精益化改造與提升,取得了良好效果。
計算機監控系統是具有數據、監視和控制功能的機組監視控制系統,為發電生產工作提供自動化、信息化的平臺,是電力廠站的核心系統。J 集控中心的受控電站系統信息如表1 所示。

表1 受控電站系統信息
(1) 對電力現貨市場的不適性。在現貨市場機制下,電力調度不確性增大[1],負荷調整、開停機操作頻繁,水電機組的振動、擺度加劇,主輔設備穩定性風險增多,集控側發生人為誤操作、誤調度的概率也明顯提高。
(2) 電力調度嚴苛管理的不適性。J 集控中心受控的電廠位于云南境內,對電網的局部頻率穩定起著重要的作用,所有影響500 kV 線路的操作,均需要征得電力調度的許可。集控中心面臨著如何快速協調電網許可和電廠緊急消缺的挑戰。
(3) 對“無人值班、少人值守”模式的不適性。電力生產“發、輸、變、配、用”等環節均在同一時刻完成,國家電力監管機構要求發電廠必須高度可靠,發生異常時,應急處置必須快速高效[2]。J集控中心面臨著有限的條件下如何快速、準確地發現與控制每一個生產異常的技術挑戰。
J 集控中心投產初期,存在信息延時、遠控失敗、文本報警間歇性停止、歷史曲線錯誤等問題(見圖1),嚴重影響了安全生產。

圖1 投產早期的技術缺陷因果示意
流域遠程集控管理并非全新事物,但由于定位不清晰,各發電集團均存在人員投入不足、設計規劃不當、調試質量不達標、維護工作不到位等問題,如圖2 所示。
上述問題的本質是:精確、實時的生產要求與落后的設備管理平臺之間無法調解的嚴重矛盾。數據量大、監管要求嚴格、人員投入少等問題,加劇了集控中心建設初期在整合電站的設計差異、功能差異、習慣差異等方面的困難。這些困難主要包括畫面繁多而難用,廠站數據參差不齊,設備缺陷和平臺缺陷交織,功能關系錯綜復雜,管理上眾說紛紜,誤改、漏改頻發,甚至陷入了“越檢修、越技改,出錯越多,總是無法避免”的怪圈。

圖2 投產早期的管理缺陷因果示意
J 集控中心在汲取多次教訓后,制定了科學的治理策略,采取軟件成熟度模型(capability maturity model,CMM)[3]和PDCA 方法來管理項目改造工作,如圖3 所示。首先按緊迫性、重要性制定項目的優先矩陣圖,然后循序漸進地逐一分析其原因、制定對策并及時閉環測試,反復迭代。J 集控中心的優先矩陣圖中,依次需要解決的是基礎功能不經用、關鍵功能不夠用、主要功能不好用等問題。

圖3 軟件成熟度模型與PDCA 結合應用
遠程集控精益化改造的首要工作是解決實時控制中的難題,包括解決遠控超時、報警功能故障、歷史庫異常等問題。
改造前,集控中心與受控電廠間偶發遙控執行不成功且無明顯反饋的問題,如集控中心對電站A進行開停機組、分合開關等操作時,信息反饋平均延時4.5 min,最高超過30 min,多次在電網重大故障中衍生出不安全事件。
采取了以下處理措施:
(1) 進行對照試驗和通信檢測,排除了通道容量不足等因素。
(2) 關閉了電站A 中數據類型為FA,FB,FC 的自定義104 報文,杜絕了大量內部文本上送導致的系統嚴重擁塞問題。
(3) 解決了電站A 服務器時間不一致導致的執行延時問題。
(4) 關閉了不必要的GUI 界面和后臺服務。
經過處理后,再也沒有發生過類似問題。
操作員工作站不定期出現簡報無故停止刷新的情況,經過深入研究,判斷為主機狀態識別不當引起報文廣播中斷所致,多次升級節點狀態判斷程序后得以解決。
歷史數據是集控中心快速定位故障原因、指導電廠進行消缺的重要工具。但早期存在模擬量歷史數據不完整、圖形數據異常變0、曲線擬合不當等問題,導致歷史數據庫不經用。經多方努力查找,確認為查詢引擎cx_oracle 存在兼容性問題,導致AI 表創建異常等問題的產生。
為快速解決上述問題,增加了2 套MySQL 歷史庫,開發了基于Tomcat 的查詢系統,不光解決了數據準確性、完整性問題,而且查詢時間也從平均145 s 以上降低到了3.5 s 以下,多次為電廠功率波動等問題的解決提供了有力的支撐。
解決了集控側服務器對時功能異常、文本報警顏色不符合行業規范等影響生產值班工作的問題,系統的年不經用次數從15 次降低到了0 次。
2017 年初電站C 全面接入后,J 集控中心包含有8.31 萬個監控測點,數據量遠高于國內大多數流域集控中心,信息浪涌現象頻發,值班員平均每2 s 就必須對一條報警信息做出處理,精神上稍有疏忽,漏監視、漏執行、誤調度、誤操作等不安全事件就會突然發生。為消除平臺關鍵功能“不夠用”狀況,須盡快解決信息繁多、不準確、難識別、易出錯等問題,避免功能不足、維護不到位等上升為系統的“不經用”問題。
解決信息浪涌,主要是優化實時信息的呈現方式,消除信息浪涌的次數及時長,采取措施如下。
(1) 文本報警頻報的處理。集控中心依靠文本報警完成電站的生產狀態監視,為解決信息浪涌問題,開展了相關整治工作。
① 報文分級,根據其重要性調整文本、語音、畫面、光字牌、報表等各類報警功能的出現方式和頻次[4]。
② 報文分層,按信息的重要性、緊迫性、冗余度等要素設定即時報警、越限報警或者不報警。
③ 報文分類,根據場合與系統的不同,各測點打散后列入“事故”“故障”“操作”等類別,運行人員可以按類別進行設備監視。
報文分層后,再針對各廠站的生產特點,采取畫面替代、關停過程量等方式,消除了80 %以上的頻報條目。
經相關整治優化后,每分鐘僅產生5 ~10 條告警信息,人工干預量也降到了原來的1/3 以下。
(2) 語音報警頻報的處理。開停機或者運行異常時,語音數量多、語句過長,甚至40 min 后,舊語音仍在消息隊列中排隊待播。改造后,僅選取緊迫的、關鍵的、容易疏忽的環節進行語音報警,其他的信息直接剔除,初期優化量就超過16 000 項;同時,通過語音文本的斷句、簡化、自然化等處理,提高了語句的辨識度和準確性,時效性大大提高。
(3) 內部文本報警的過濾。針對電站A 內部文本動作量是常規遙信報警的9 ~100 倍左右。J 集控中心牽頭增加上位機報文過濾等功能,消除了內部報文過多導致的嚴重延時現象。
防誤是遠程集控重要的安全需求。通過聯合開發,增加了遙調設定過大再確認、操作驗證碼、集控側邏輯閉鎖、畫面布局分離等功能,增強了防誤能力。
文本報警側重于“點”,需要持續監控;而曲線則支持“線”的監視,采用“線”監視技術可以化解值班監控的壓力。J 集控中心牽頭研發了實時曲線、突變報警、曲線數量擴容、多坐標軸設置、收藏夾、計劃曲線轉發、計劃變化預警[5]等高級功能,提升了負荷檢測、數據查詢、數據比對等工作效能,有效化解了事故排查以及實時監控的風險,為電力市場的自動化運營提供了支撐。
為增強系統的功能性和安全性,J 集控中心牽頭開展了改用安全操作系統、部署方式優化、主機加固、計算自動化等工作,降低了維護操作失誤風險,夯實了設備系統本質安全基礎[6]。
J 集控中心積極推進數據治理優化、人機界面優化、程序功能升級等工作,解決了一批懸而未決的問題,提高了勞動生產力。
為解決數據量大、辨識度低等基礎問題,開展了名稱統一化、簡化、規范化等優化工作,如圖4所示。配合報文的分級、分層、分類以及未復歸一覽表、簡報分屏等模塊的開發,為全面落實“無人值班、少人值守”管控要求打下了堅實的基礎。

圖4 數據治理的對策示意
一方面是重新整合和繪制各類操作、監視的畫面,整合數據,優化調用方式[7];另一方面,開發了近期歷史雙擊快查、對象邏輯可視化等全新的功能,取得了良好的人機結合效果。
加強聯合開發與測試,優化了大量的程序功能,具體表現在:數據一覽表實現了安全、快速的數據檢索和查看;未復歸一覽表實現了核心狀態一屏掌控;程序庫啟動方式變更為離線解壓縮,啟動時間從最高35 min 降至2 min 左右等。
通過治理和改造,J 集控中心逐步掌握了設備系統的維護管理能力,盤活了各項功能,系統可靠性、功能完備性、使用舒適度、綜合滿意度、信息準確性等均達到了較高的水平。
從運行實際出發,提出了基于準確性、完備性、易用性的精益化改造方法,解決了集控中心系統“不經用”“不夠用”“不好用”等問題。改造后,系統可用率、告警準確性、模塊使用效率均得到有效提升,同時文本報警、語音報警實現了精簡,降低對人員監盤的影響,滿足了流域集控的生產需要,實現了系統的最優化配置,適應快速變化的電力市場環境,為“全監、全控”等工作奠定了堅實的技術基礎。