摘要:調控一體化模式監控員需要面對海量監控告警數據。調控系統需要有效濾除“噪聲”,提取有效信息,提高監控員判斷的準確度。應用專家系統等方法對明顯的“噪聲”信號進行了處理,在使用Apriori算法對歷史告警數據挖掘后,通過研究標簽傳播算法(label propagation algorithm LPA)對告警信號的相關性進行分析,并取得了一定成果。提出了一種基于“標簽”的告警信號預測方式,為需要重視的告警信號進行標記,同時應用信號和設備的關聯建模指向一次設備本身,以引導監控員更好地完成工作。
關鍵詞:告警窗;標簽傳播算法;Apriori算法;調控一體
中圖分類號:TK21 文獻標識碼:A 文章編號:1007-0079(2014)35-0211-03
隨著國家電網公司“三集五大”[1,2]建設的深入開展,作為公司核心業務之一的“大運行”體系提出了“調度集控專業融合、調度結構優化調整”的改革方向,這就需要整合多級電網調度和變電運行資源,推進變電設備集中監控業務與電網調度運行業務的融合,實現各級調控一體化,以提高駕馭大電網的調控能力和大范圍優化配置資源的能力,保障大電網的安全、經濟、優質、高效運行。根據業務分工不同,監控員主要負責對設備狀態監視,但海量的設備狀態信號對于監控員來說并不友好,同時充斥著大量“噪聲“嚴重影響監控員的判斷。作為電網運行的重要要素,一次設備的運行狀況會直接影響整個電網的安全,由于設備本身的問題造成電網故障的案例在國內外屢見不鮮。
目前在實際運用中針對監控信號的過濾、優化有延時告警、頻發告警抑制等方法。這些方法對于告警信息使用經驗數據來過濾多余的頻發告警信息,從某種程度上講,有效抑制了“噪聲”告警信息,但“一刀切”的監控方式,對某些可能是正常頻發的故障信號造成誤傷,或者是某些設備異常狀況卻無法被監控員及時發現,耽誤了最佳處理時機。與此同時,由于信號本身缺乏關聯性,導致監視重點很難突出。目前調控一體系統普遍采用的策略是告警分等級[3]的方式,即在系統建設初期就將信號點按照重要程度順序分級,監控員只需要重點關注最高等級的告警即可。從實踐來講,該方法簡單有效,某種程度上固化了信號的含義,雖然能及時發現問題,但忽視了信號間的關聯性,無法及時將設備故障解決在問題發生之初,從而降低了設備在電網中的故障運行風險。
本文通過分析監控員的日常使用習慣及信號特征,實現了一種較為實用的“噪聲”消除方法,在目前普遍應用的五級告警分級基礎上提出了一種結合“推薦系統”“頻繁項”、[4,5]人工“標簽”的數據挖掘算法,在設備出現異常的初期及時提醒監控員重視,通過靈活的變化確保告警,避免事故擴大化,進而控制事故蔓延。
一、調控一體化應用及調控告警信息簡介
調控一體化應用(即:采用電網調度監控中心加運維操作站的管理模式),具體而言,就是電網調度與變電監控一體化設置,變電站運行管理機構分片布點。調度控制中心主要承擔電網調度、變電站監控及特殊情況下緊急遙控操作等職責;運維操作站主要負責調度指令的分解、變電站刀閘操作、運行巡視等工作。
隨著調度、監控業務合并到主站端,一方面解決了設備安全運行和電網安全運行的及時信息互通,合多人之力共同解決問題;另一方面由于監控員面對的監控對象由過去的某一個變電站轉變為本電網公司轄區下的所有變電站,需要監視的信號數量呈幾何級增加,但由于技術不成熟等多種原因造成的信號質量不佳,大幅增加了信號數量。如果對告警進行處理缺乏有效手段,那么監控對于維護電網安全運行的功效將大打折扣。
集中監控的監控員在日常工作中按責任區劃分對電網公司管轄范圍內的廠站分區、劃片進行監視,通常的監視手段為實時告警窗和光字間隔圖。綜上所述,在電網,設備平穩運行的階段,基于現在的分類方式,任何一種風格的告警窗都可以很好的配合監控員工作。但是一旦出現電網波動或是設備故障,抑或是信號誤發,對于調度端來說,都會有海量信號涌入,因此,研發出一種合理的信號關聯處理方法十分必要。
二、理論依據
1.現狀分析
調控一體應用采用了一二次模型建模的方法,將二次設備產生的保護信號和一次設備進行了關聯。各個孤立的保護信號通過一次設備建立了關聯,部分無法對應到唯一的一次設備的保護信號則通過間隔進行關聯,而一次設備通過拓撲建立關聯關系,如圖1所示為簡化的設備、間隔、信號模型。[7]
目前國家電網公司對信號進行了五級分級,即一類為事故、二類為異常、三類為越限、四類為變位、五類為告知。通常一類信號產生意味著電網中已經出現了嚴重的事故,這類信號往往最少,而其他幾類信號普遍較多,并且往往蘊含著電網事故發展的趨勢,但是由于數量巨大,有用的信息經常被淹沒在頻繁的動作信息之中。
2.標簽傳播算法
標簽傳播算法label propagation algorithm(LPA)[6]是一種基于圖的半監督學習方法,其基本思路是用已標記節點的標簽信息區預測未標記節點的標簽信息。利用樣本間的關系建立關系完全圖模型,在完全圖中,節點包括已標注的和未標注的數據,節點之間的邊則表示兩個節點之間存在的關聯關系,節點的標簽按相似度傳遞給其他節點。
目前在社交網絡分析領域中,標簽傳播算法被廣泛采用,該算法主要用來自動挖掘社交關系中的“團結構”(通俗講就是不同的圈子)。該算法能夠廣泛使用主要因為它有兩個明顯優點:首先,該算法思路非常直觀易監測、易理解、易實現;其次,該算法機制易于實現對大規模數據處理,具有很強的實用性。對比與電網中的二次信號,兩者之間的不同處在于社交網絡的信息更具隨機性和隨意性。作為調控一體應用來說,電網中的信號則更具有規律性;兩者的相同性在于針對任何一個電網設備,或是整個電網都類似于社交網絡均可以將信號(包括開關信號)和設備、電網建立網絡關聯,進而結合信號的產生推測出信號狀態在電網或是某一設備的傳播,通過人工指定的某些一類事故信號,提前提醒監控員重視某些非一類信號,及早發現電網設備的事故隱患。
對一個電網絡E來說,將電氣設備抽象為節點,那么電網絡包含若干個節點,節點之間由邊相互連接。這足夠抽象為一個圖的結構,考察其電氣屬性,節點之間相互連接代表兩個設備之間相互連通,那么某設備的某一信號出現異常,那么故障會首先在設備內部開始發展,如果沒有保護裝置的及時切除,持續發展下去就會導致整個電網出現嚴重故障。
對于電網E來說,應用標簽傳播算法自動發現其中的密集連通子圖,在初始階段可以為圖中每個節點賦予一個獨一無二的標簽L,這個標簽即為節點的初始標簽值。接下來通過多輪迭代計算,通過圖的邊將標簽向其他節點傳播。在一輪迭代運算過程中某個節點將根據與其右邊聯系的其他節點標簽來決定此輪應該賦予那個標簽。其基本原則為:將鄰居節點的標簽中出現次數最對的那個標簽賦予自己,如果鄰居節點的標簽數目一樣多,無法找出最多個數標簽,則隨機賦予一個標簽。每個節點都根據該原則重新確定本輪中本節點應該獲得的新標簽,這樣就完成了一輪標簽復制運算。當進行了多輪運算后,絕大多數節點的標簽都已經相對穩定,不再發生變化,此時就是計算的最終結果。如果圖中節點具有相同的標簽,那么可以認為這些節點屬于同一個“團結構”。那么可以將模型中的保護信號節點化,然后使用上述方法挖掘出信號的密集連通子圖,根據目前五級分類在預先定義五級告警的基礎上,就可以在某個非事故信號產生時提前引起監控員重視。
三、使用標簽傳播算法計算信號關系圖
應用標簽傳播算法挖掘告警信號之間的傳播。標簽傳播算法是一個標準的圖挖掘算法,[8-9]即其計算對象是有節點和節點之間的邊構成的圖。對于電網中的告警信號,圖中的節點就是告警信號,應用上一節生成的關鍵字代表節點的唯一編號,節點之間的邊代表告警信號之間的關聯關系,考慮可以在歷史數據庫中設置一個時間窗口,該時間窗口的大小可設置為一次事故發生的時間長度,所有在這一時間段內出現的信號具有標簽傳播的分析價值,信號之間兩兩相連。應用Apriori算法分析出信號之間的關聯關系,并通過信號的模型歸屬進行剪枝,去掉一些信號之間的關聯關系,即S1信號告警產生,S2信號告警也將很快發生。如圖3所示,兩堆信號關聯之間的聯系由設備的拓撲關系決定。
通過信號告警,伴隨歷史數據的積累,可以構建一張含有大量節點的大圖,對于標簽傳播算法來說,需要標注初始的“標簽”信息,考慮監控員在日常使用中可對監視到的信號進行確定,可以要求監控員在系統前期建設中在確認信號的基礎上對信號增加標識的工作內容,以便系統建設初期,即使是在信號不完善的情況下也可以借助監控員輔助將重要的、次重要、誤發的告警進行分類標記,在系統完成建設后即可享受成果帶來的便利性。
根據頻繁項集L3可以看出,(S1,S4,S5)、(S5,S4,S2)表示信號可能同時出現,由于信號具有時間維度屬性,因此標簽也應當具有時間維度屬性。此時這些信號中總是存在已被標簽信號和未被標簽的信號,希望找到信號之間的密集連通子集,應用第四節中所述的三個步驟可以實現標簽的傳播,直至所有的信號都具有標簽,且可能出現兩種情況:所有信號都共享一個標簽或是在整個關聯信號中有兩個或兩個以上的關聯標簽。對于共享一個標簽的信號來說,這些告警信號都緊密關系,即任何一個信號出現,其余信號都有極大的可能出現,此時再遍歷本密集連通子圖中的其余信號,如果當中存在一類事故信號,則說明某一低等級的告警信號是事故先兆,需要監控員加強關注。
五、結論
本文討論了電網監控信號的關聯分析與重要信號“推薦”方法,主要解決在面對海量告警數據時的處理方法。以本文方法為基礎,根據實際情況可以靈活擴展,只要對“標簽”進行適當的研究,通過設置合理標簽使其符合實際的調度監控環境。對于信號歷史挖掘需要豐富的數據,在系統建設的初期需要監控員參與,當有了足夠的數據積累和合理的標簽后可以使信號更為智能的呈現在監控員面前。
將來,電網監控可在本文討論的基礎上進一步研究,設計一套針對電網調度監控系統的信息標簽,研究出更加適合電網告警信息的搜索方法,以提高形成基本信號關聯模型的速度。
參考文獻:
[1]辛耀中.新世紀電網調度自動化技術發展趨勢[J].電網技術,
2001,25(12):1-10.
[2]殷自力,陳杰.福建電網調控一體化運行管理模式的研究與實現[J].電力與電工,2012,(4):4-8.
[3]張瑛,孔慶偉.調控一體化信息專家處理系統探討[J].新疆電力技術,2013,(1):10.
[4]Han J,Kaufmann M K M.Datamining:concepts and techniques[M].韓家煒,譯.北京:機械工業出版社,2000.
[5]Linden G,Smith B,York J.Amazon.com recommendations:Item-to-item collaborative filtering[J].Internet Computing,IEEE,2003,7(1):76-80.
[6]ZHU Xiao-jin,GHAHRAMANI Z.Learning from labeled and unlabeled data with label propagation,CMU-CALD-02-107[R].Pittsburghers:Carnegie Mellon University,2002.
[7]楊勝春,姚建國,高宗和,等.基于調度大二次系統的智能化電網調度輔助決策的研究[J].電網技術,2006,(2).
[8]張俊林.標簽傳播算法在微博用戶興趣圖譜的應用[J].程序員,
2012,(7).
[9]郝建柏,陳賢富,黃雙福,等.一種基于模糊近鄰標簽傳遞的半監督分類算法[J].微電子學與計算機,2010,27(2):30-33.
(責任編輯:孫晴)