黃海軍
(華電云南發電有限公司,云南 昆明 650228)
流域遠程集控中心源源不斷地收到大量的生產現場信息,值班員面臨著巨大的信息甄別和處理困難。某大型水電集控中心(以下簡稱為“J集控中心”)管理裝機容量6 560 MW,是金沙江多個大型水電站的異地運行值班單位,實施“全采、全監、全控”的流域管控模式,電廠不進行運行值班。由于J集控中心約有8.31萬個測點,每小時最高報出3 000多條文本報警和400多條語音告警,3個值班員平均每2 s就必須對一條信息做出處理;加上受控電廠“無人值班”,漏監視、風險處理不及時是電網頻率波動的最大隱患來源,網省兩級調度對大型廠站的值班監視做了嚴格的要求[1];而智能報警系統等新產品無法解決泛化力弱、穩定性差、不可解釋、不能替代計算監控系統等難題,如何有效地開展運行值班工作成為了集控中心的重大難題[2-4]。J集控中心提出了優化報警、設置預警、組合報警的方法,建立基于數據驅動的專家模型[5],解決頻報、漏報、錯報等問題,提升系統的易用性,取得了顯著的流域生產效能提升效果,為集控中心的安全有序運行提供了保障。
流域集控中心的報警,主要指的是計算機監控系統中的系列事件。集控中心異地值班的主要目標就是識別信息中的異常信號,及時有效地做出處理。J集控中心通過遙信、遙測組態信息的采集,分析其必要性、緊急性、冗余度等特征,建立報警專家模型,減少無關報警、提高報警識別率、組合化簡報警,設置多級風險預警,從而減少人工分析、辨別的工作量,實現提取生產信息與輔助決策的目的。
報警數據的優化建立在對大量特征數據的分析之上[6]。特征數據主要來源于組態數據庫和歷史事件的離線分析,必要時輔以實時事件的在線分析[7]。
組態數據庫含有海量事件的各種屬性數據,是主要的分析研究對象,通過采集整理大量的原始組態數據表獲得,如圖1所示。

圖1 組態數據庫的VBA采集示意
歷史信息的采集來源于歷史數據的導出,適用于疑難事件的專題分析和越復限限值的研究。
實時事件采集于系統報警窗口,適用于高頻告警的分析和報警模型的效果評估。
解決報警過多的首要方法是:降頻、去重。采取詞頻分析技術,對汛期、枯期等典型時段以及開停機、檢修等重要環節的報警日志進行pandas (python軟件的一個數據分析包)數據清洗、jieba (python軟件的一個中文分詞庫)分詞并剔除停用詞后,獲得詞頻分析表;其中高頻報警組成一個狹窄的頭部,剩余的長尾部分須進一步分析研究,如圖2所示。

圖2 報警的“長尾效應”示意
優化的策略是頭部的高頻信息原則上不設置報警,采用畫面、替代測點等方式來監控;而長長的尾部信息原則上應根據必要性設置報警。
報警語句的規范、整齊,可有效提高報警信息的辨識度,確保同類報警設置的一致性。不同廠站、不同系統的命名千差萬別,如,某廠站測點名為“5311動作”,可理解為“5311合閘動作”“5311保護動作”“5311三相不一致保護動作”“5311操作條件具備動作”等多種內涵,給故障辨識、溝通匯報等工作造成了極大的困難,應予以規范化處置。
2.2.1 解決表述多樣化的問題
調管設備按《××電網雙重化配置繼電保護調度命名業務指導書》等電網規程修訂,并對廠管設備統一表述,避免同一設備、同一系統出現多種表述的情況。2.2.2 解決語義不明的問題
為避免語義不明:
1) 增加LCU區域或系統名稱作為前綴,以標識不同區域(系統)的同名信息。
2) 明確切換把手、設備狀態等定義,避免狀態不明。
3) 完善測點情景信息或定語、狀語,避免表述不全;使用通俗易懂的名稱。
基于測點的必要性、緊急性、冗余度等特征建立組合報警的組態數據庫,以實現數據驅動值班信息減負的目的。
2.3.1 數據關系的梳理
南瑞(南自)的計算機監控系統中,組態數據庫的報警屬性都涉及到多個屬性的鏈式配置,必須予以明確,避免遺漏。
1) 開關量報警涉及時標、文本、語音、窗口、歷史、雙節點等屬性,如圖3所示。

圖3 開關量的報警屬性關系
2) 模擬量的報警屬性設置。模擬量報警涉及限值、文本、語音、死區等屬性,如圖4所示。

圖4 模擬量的報警屬性關系
2.3.2 報警權重的計算
信息過多,須根據權重來進行篩選簡化,權重計算用貝葉斯估計公式,如式(1)所示。
由式(1)可知,起關鍵作用的是重要性因子P(πxi)。重要性因子取值主要來源于生產經驗和設備原理,對集控中心而言,需要人工干預的事件設置報警,否則不建議報警。
提前預警是生產值班的高階需求,通過數據發展趨勢分析來設置預警。
1) 基于定值單和歷史數據的預警。結合各廠站的熱工、直流等系統的定值單及歷史數據分析和設備風險估計值,建立一套越復限預警值。
2) 基于專家經驗的預警。對負荷設定、閘門遠控、頻率控制、電源供應等影響安全生產的非定值性關鍵數據,基于專家生產經驗設置預警。
類似地,重要的開關量、發電曲線等應配置征兆性報警,提前播放預警信息。
3.1.1 報警屬性的泛化處理
因同類LCU區域的測點順序、命名存在差異且無法消除,在建立報警模型時,須對同類測點進行泛化處理,以便確保報警設置的一致性,具體步驟如下:
1) 基于LCU列出基準區和待處理區的信息。
2) 通過Excel的MID函數去除前綴、VBA去除數字等方法,實現命名配對,依次構建基準區、待處理區的映射關系表。
3) 通過INDEX+MATCH函數進行一覽表、報警等相關屬性的整體遷移設置。
4) 人工檢查與糾正映射錯誤。
5) 生成完整的報警屬性表。
3.1.2 報警組態的自動化處理
對大量的報警特征屬性完成分析后,最終通過更新組態數據庫來實現數據模型的落地。步驟如下:
1) 導出原始組態數據表,采取圖1的方法獲得可便捷編輯的數據表集合Sx。
2) 探索分析,建立高頻報警、規范命名、開關量、越復限等擬處理信息的關鍵詞表Ki。
3) 對上述關鍵詞表進行分類,提出優化規則,并打上分類標識,形成關鍵詞和規則值的映射關系表Ti。
4) 對擬處理的數據表集合Sx逐一應用映射關系表Ti中的規則;存在同類屬性的,采取3.1.1中的方法進行批量映射處理。
5) 檢查和測試設置是否得當。
6) 進行異動統計與標記。
7) 重復上述過程若干次,至模型收斂為不頻報、不漏報、易識別。報警組態的自動化處理如圖5所示。

圖5 報警組態的自動化處理示意
為確保數據模型的適應性,須加強試運行時的抽樣測試,及時與原系統比較報警的完善率、漏報率和識別率,研判典型事件的處置效能,及時調整模型映射表。對必要性不強、頻報刷屏的測點,取消報警、調整定值或改用其他方式監控;對漏報、易疏忽的隱患,增設報警、增設測點,完善文本、語音、畫面、聲光、曲線、腳本等立體化監控功能;對未能診斷、識別困難的事件,設置對象腳本來輔助處理。
在J集控中心的實踐中,4輪大調整后,報警模型已明顯趨于收斂,可在生產環境中正式使用。
報警名稱的規范化通過名稱差異率來評價,一方面可以復核差異較大的測點,及時調整命名優化規則;另一方面則是將關鍵性的命名差異通報電廠,確保信息的一致性。命名差異率計算如式2所示。
其中,Count(S1x/S2)是字符串匹配計算的函數,將舊字符串S1的第x個字符與新字符串S2進行匹配,若配對成功則計數加1。Len(S2)是字符串S2長度計算函數。
J集控中心基于數據分析形成了100多子項的專家策略(見表1),5.16萬測點實現分級、分層、分類調整,4.24萬測點報警屬性被大幅調整,6 250個測點設置了限值報警;18 071個名稱被優化,8 361項語音被清理,80 %以上的頻報事件被消除;678個錯誤被糾正,3 827項模擬量刷新死區不合理問題被解決。

表1 報警優化的專家策略
優化后,每分鐘產生5~10條告警,人工干預量降至原來的1/3以下,關鍵故障定位時間從1 min級降低到10 s級,多次發現了傳感器異常、調速器油壓持續性下降等重大隱患或隱秘故障。
基于數據構建報警模型,充分適應了調管關系、生產經驗等的變化情況,有助于后期反復調整。數據驅動的報警優化方法,實現了全過程量化、可視化管理,提高了經驗應用的自動化、規范化。
J集控中心采用Excel和VBA方法進行數據驅動報警模型的建立和優化,優點是準確度高、操作性強,缺點是專家經驗要求高、優化過程漫長。后續擬用Shell腳本增強嵌入式報警功能[8],擬用深度學習等方法開展典型工況的診斷與決策研究,以提高靈活性和泛化能力[9-10]。
J集控中心采用基于數據驅動的專家模型進行報警優化后,實現了報警信息的輔助診斷功能,報警監視率降低45.02 %,完備性提升14.78 %,辨識度提升21.51 %,滿足了流域集控“全監、全控”和安全生產的需要,為同類集控中心的優化提升提供參考。