黃晨貴 羅一 王志文 韋鳳梅



摘要:隨著變電站無人值守及電網規模的逐步擴大,對變電站監控信息的接入質量、規范性提出更高的要求。為提高存量監控信息的規范性,本文通過研究基于線性相關序列的Markov算法,對長序詞條進行分段預處理,建立監控信息標準庫、監控信息比對知識庫,實現監控信息與標準信息的自動校核。通過監控信息校核能夠準確的、快速的對比出監控信息與標準信號的差異情況。對在運站點表進行標準性校核,為監控信息表管理提供有效技術支持。
Abstract: With the unattended substation and the gradual expansion of the scale of the power grid, higher requirements are put forward for the access quality and standardization of substation supervision information. In order to improve the standardization of inventory supervision information, this paper uses the Markov algorithm based on linear correlation sequence to preprocess the long-order entries in segments, establish a supervision information standard library and a supervision information comparison knowledge base, and realize supervision information and standard information automatic verification. Through the supervision information check, the difference between the supervision information and the standard signal can be accurately and quickly compared to perform standard checks on the station tables in operation and provide effective technical support for the management of supervision information.
關鍵詞:線性相關序列;Markov算法;文本處理;監控信息;校核
Key words: linear correlation sequence;markov algorithm;text processing;supervision information;check
中圖分類號:TP301.6;O211.62? ? ? ? ? ? ? ? ? ? ? ? ? 文獻標識碼:A? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? 文章編號:1006-4311(2020)31-0215-03
0? 引言
隨著智能電網的逐步推進以及調控一體化的全面實施,電網監控數據的及時性、準確性的要求日益凸顯,電網監控人員所面臨的壓力也逐日增加。變電站監控信息表作為調控一體化運行的基礎數據,對電網設備健康運行狀態監控具有重要作用[1]。變電站監控信息的規范程度直接影響著監控工作的效率甚至是電網的安全穩定運行。對于存量變電站監控信息的標準化梳理、處置,是減輕監控人員工作強度,提高工作效率的重要保障。變電站監控信息的標準化這項基礎工作對于調度、監控人員日常的監控信息分析、電網故障判斷起著舉足輕重的作用,有利于對電網的運行狀態進行有效的監控和評估。
1? 監控信息預處理方法
變電站的遙信、遙測、遙控、遙調等信息都是以文本弄的方式進行存儲的,且傳統的監控信息編制都以純手工的方式實現,各站監控信息點表差異較大。由此導致了雖然已發布相關規范,但存量監控信息不規范情況仍較為普遍。
基于上述問題,為了避免文本數據中因為不規范的寫法造成的分析錯誤,在進行信息處理抽取前,需要根據規則對文本內容進行標準化處理,使得同一類數據有相對統一的寫法。非結構化的監控信息在結構化分析過程中,采用自然語言處理技術進行分析[2]-[3]。具體方法如下:
1.1 設備類型信息處置
同一個設備類型,可能有不同的名稱描述,需要在分析之前對相關信息進行標準化處置,方便后續對設備的定位與辨識。表1為主要設備的類型名稱規范表。
1.2 序號類信息處置
對于變壓器、電容器、電抗器、站用變等,有“1#變壓器、#1變壓器、1號變壓器、變壓器1”等多種不同的寫法,需要進行規范化處置。在處置的過程中,注意信息之間的分割。比如針對1#電容器間隔,對應的開關編號為231,有些不規范的文本描述中,會把開關編號、電容器序號混寫在一起,寫成“2311#電容器”;在分析的過程中,需要根據變電站信息查找包含的電容器列表,根據拓撲判斷電容器包含的開關編號信息,根據電容器、開關編號的組合,將文本分割為231、1#電容器這樣的信息組合。
1.3 數字類信息處置
針對數字(比如XX三線中的“三”),可能有漢字、阿拉伯數字、羅馬數字、不規范的羅馬數字(比如Ⅲ可能會用英文字母組合III代替),需要對多種寫法的數字進行統一。在此過程中,處理的目標信息是單獨的數字,注意不要對設備編號、保護型號等信息中的數字信息造成干擾。
另外,還需要對全角半角等各類信息進行規范化處置。
2? 隱馬爾科夫模型研究
隱馬爾科夫模型(Hidden Markov Model,HMM)[4]:先由隱藏的馬爾科夫鏈隨機生成的不可觀測的隨機狀態序列,再由產生的狀態生成一個可觀測的隨機序列的過程。其中,把由隱馬爾科夫鏈隨機生成的狀態序列,稱為狀態序列(State Sequence);把每個狀態生成觀測組成的隨機序列稱為觀測序列(Observation Sequence)。因此,HMM 就是定義了觀測序列 x 和狀態序列 y 的聯合概率 p(x,y)。由于狀態序列是一個馬爾科夫鏈,并且狀態序列不可見,因此稱該過程為隱馬爾科夫過程。
3? 基于線性相關序列的Markov算法實現監控信息知識庫的構建
變電站監控信息表是一種按電網調度規則,電網設備信息等組成的具有規律性的中文詞條。但由于不同的編制人員的對監控信息規范理解的差異性,導致監控信息的標準化程度因站而議,各站信息差距較大,人工辨識的難度、工作量都非常大。
通過研究變電站一、二次設備的信號命名規則,根據典型監控信息的組成原理進行深入探究[5],最終將通過預處理的監控信息分為電壓等級、間隔、設備類型、設備編號、信號描述等部分,對應本體監控信號的標注為:V(電壓等級)、S(間隔)、D(設備類型)、N(設備編號)、I(信號描述)。
對于監控信息的描述不完備的情況,需基于具體的信號描述進行補充,實現數據的完整性評估及填充工作。
下面以“2051水車Ⅱ線RCS-923A保護跳閘”信號為例展開說明:
①電壓等級:無,通過開關編號命名規范補充電壓等級為220kV;
②間隔:2051/水車Ⅱ線;
③設備類型:無,通過“RCS-923A”補充設備類型為線路保護;
④設備編號:RCS-923A;
⑤信息描述:保護跳閘。
詳細的拆分及標注情況示例如表2所示。
中文長詞條中缺少對分詞的明顯分隔符,通常需要依靠人為分斷對長詞條進行分界點判別。因此如何對監控信息的分詞間斷點判別成為了監控信息文本處理的關鍵。基于線性相關序列的Markov算法可以有效對該類長詞條中文信號進行分詞[6]。
首先通過對電網規程的深入分析與解讀,構建一套經典電網詞庫,包含電網變電站的電壓等級、間隔、設備、常見告警等信息,提取變電站遙信、遙測、遙控監控信號表中的經典詞,與空間向量建立映射關系,假設監控信息點表中含有x個經典詞庫收錄短詞,將它們按順序編號為1, 2, …, x。x維空間向量可采用下面的公式表達:
W=[w1, …, wk, …, wx]
通過對監控信號的分詞,實現監控信息文本的向量化,以此構建空間向量模型。對于監控信息的文字信息處理,采用語義框架槽填充的方法實現對監控信息的挖掘;運用Space Vector探索了監控信息中文文本的挖掘方法。
標準信息的詞條分斷方式同監控信息,不再贅述。
通過上述方法完成監控信息、標準信息的詞條分斷,完成監控信息標準庫、監控信息校核知識庫,為標準化校核提供數據支撐。
4? 監控信息與標準信息的校核
基于監控信息及標準信息的長序詞條分斷技術,構造監控信息知識庫。隨著測試樣本的增加,基于監控信息知識庫將不斷更新完善,并通過“最優可信度占位”理論的監控信息的匹配算法,實現監控信息與標準信息的自動校核與匹配,整體方案路線見圖1。相似度在70%以上的信息可實現自動校核,準確性可達到92~95%。
5? 結束語
在電網調控一體化模式下,集中監控變電站數量及監控數據數量龐大,因信息錯漏和相關管理不到位導致的安全風險始終存在。本文通過基于線性相關序列的Markov算法實現監控信息的詞條分斷,完成監控信息知識庫的構建,進而實現對監控信息標準化的自動校核,將存量的監控信息與標準信息實現精準匹配,發掘存量信息存在的問題,提高監控信息管理的效率和信息表質量,為后續監控信息智能化分析奠定堅實的基礎,保障監控運行安全。
參考文獻:
[1]吳曉燕.一體化監控信號管理在電力系統監控中的應用[J]. 科技資訊,2014,32:70.
[2]張春曉,陸建峰,夏士兵,饒莉莉,蔡丹,冉光瑩.基于專家系統的變電站監控信號智能處理系統[J].東南大學學報(自然科學版),2008(S2):140-144.
[3]張琳.提升無人值守變電站監控質量探析[J].科技視界,2015,04:328.
[4]解宇涵.基于深度學習的中文分詞模型應用研究[D].重慶:重慶大學,2017.
[5]林英,陸穎銓.變電站集中監控信號優化方案探究[J].中國新技術新產品,2014,16:40-41.
[6]李英,錢建國,方響,等.基于大數據背景的集中監控輔助決策系統研究[J].浙江電力,2019,38(10):34-39.DOI:10.19585/j.zjdl.201910006.