林政潤,陳虹岑,劉 方
(國網邵陽供電公司,湖南 邵陽422000)
大量的頻發信息對監控人員的正常值班造成了干擾,同時也從側面反映了電網的健康水平。減少頻發信息量,對提高監控效率,保證電網安全穩定運行具有重大意義。然而,頻發信息數量大、種類多、價值密度低,數據的挖掘與分析難度大,使頻發信息的整治成為監控專業的一大難題[1]。
在監控大數據平臺上線之前,頻發信息的統計工作更多的依賴于值班監控人員對信息的持續追蹤以及open3000系統的歷史數據查詢。由于open3000系統的局限性,給頻發信息的統計帶來了很大的困難,極易造成頻發信息的漏記,未能及時反饋消缺,給電網的安全穩定運行埋下了一定的隱患。
湖南監控大數據平臺實現了對頻發信息的初步統計,暴露出了一些存在已久而尚未發現的設備缺陷,該大數據平臺實現了對頻發信息次數與時間的粗略統計,但還需監控人員對每個月上千條信號,數十萬的頻發信息量進一步人工統計分析,大大增加了監控人員的工作強度。采用大數據分析方法,深入挖掘分析頻發信息,從多個維度出發,以點帶面,全面提高頻發信息整治效率,提高電網智能化程度與安全運行水平[2,3]。
按照《國家電網公司調控機構設備監控信息處置管理規定》要求,24 h內超過20條,每月超過40條的信號即認定為頻發信號,需及時進行處置。
然而,對于不同類型的信號由于其重要程度以及頻發原因不同,統一的40次/月的限值會對數據分析產生干擾。例如,告知類信息故障錄波裝置啟動等,設備正常運行時也會動作,因此將其限值調高至500次/月。40次~500次的部分則列入觀察名單,而對于保護裝置異常/故障等信號,直接影響到電網安全運行,屬于危急缺陷,將其限值降低至20次/月。為了更好的清洗與過濾數據,首先要實現頻發信息的分類,在頻發信息分類的基礎上對不同類型的數據設置不同的權重值以達到信息篩選與過濾的效果。
根據國調中心印發的《調度集中監控告警信息相關缺陷分類標準》以及國網公司發布的《變電站設備監控信息規范》,從信息類型、告警分級、缺陷類型等方面對信息進行分類,讓數據更直觀地顯示出來,進而針對不同類型的問題,以點帶面,各個擊破。
然而,數十萬的數據單純的通過人工分類的方式幾乎難以實現,而且長期高強度的工作大大降低了數據分類的準確性。本文利用了自然語言處理技術,以變電站監控信息規范以及缺陷分類標準為標簽,實現其與對待分類的信息的語意識別,通過計算文本間的距離,求出其相關性,最后將該信息劃入相關系數最高的那類。
關峽變故障錄波裝置啟動與故障錄波裝置啟動相似度高達84%,因此該信息劃入公用設備-故障錄波裝置啟動-一般缺陷-告知信息類。但待分類信號中攜帶無關信息太多,導致與對應標簽的相關性降低時,將影響分類的準確度。因此在計算相關性前對該詞條進行預處理。以變電站監控信息規范以及缺陷分類標準為字典,對該詞條進行分詞處理,僅提取所需的關鍵詞,篩去無關信息的干擾,若待分類信息命名規范,可達到100%的匹配度。
經分類分析,邵陽地區頻發信息主要集中在保護裝置、公用設備、站用電源系統、母線接地及斷路器本體等。
數據挖掘是指從大量的數據中通過算法搜索隱藏于其中信息的過程。對雜亂無序的信息數據進行深入挖掘與分析,獲取有價值的信息,為檢修消缺工作提供指導。
帕累托法則(二八定律)提出,當80%的消費及集中在20%的客戶群體,這20%的客戶群體則是重點分析的對象,因為他們創造了80%的價值。利用帕累托法則,深入挖掘有價值的信息,通過重點分析20%的群體所蘊含80%的價值,提高整治效率。
頻發信息所屬的類型有保護裝置、公用設備、串聯補償設備、斷路器本體、母線接地、事故信號及消弧線圈等十余類。而公用設備、保護裝置、站用電源及母線接地等類型信息累計占比超過80%,其余類型信息累計占比不足20%,因此針對前80%的信號應重點分析。
以公用設備中占比80%的故障錄波啟動為例,如圖1所示,水廟、月溪、江潭及丁界等變電站故障錄波頻發次數達到8 400次,公用設備類占比78%,頻發信息總數占比39%。而故障錄波頻繁啟動的主要原因是零序電壓或電流突變量啟動定值不符合運行需求。合理調整故障錄波裝置零序電壓啟動或電流突變量啟動定值可大幅度減少頻發次數。因此集中檢查這些廠站故障錄波設備啟動原因和定值大小,進行相應的調整,可大幅度降低頻發信息量。

圖1 故障錄波帕累托圖
當某條信息在某段時間集中頻發而其他時間幾乎不發,如白倉變#1主變第二套保護裝置TA斷線動作,該信號在2019年6月20日頻發高達6 130次,而在6月份其他時間段未動作一次。主變保護裝置TA斷線屬于危急缺陷,將閉鎖主變差動保護,若不立即處理,則可能會引發越級跳閘,造成大面積停電事故,因此需要實時監控,立即處理。然而經核實,該信號頻發是因為當天現場有檢修工作,調試設備造成信號頻發。根據湖南省調發布的《國網湖南電力調控中心關于進一步優化設備監控信息的通知》,對變電站調試信息,在不影響正常運行設備的前提下,基建或檢修調試部門應在變電站側采取投入測控裝置檢修壓板,且斷開所調試裝置接入監控系統的上傳通道等措施,以減少信息的頻發量。
關聯規則反映了一個事物與其他事物之間的相互依賴性和關聯性。如果兩個或者多個事物之間存在一定的關聯關系,那么其中一個事物就能通過其他事物預測到,比較經典的案例即沃爾瑪公司的“啤酒與尿布”。
在變電站中,遙信信號通過硬接點或者軟報文的方式上送,對于軟報文信號,可能有兩個或多個信號合成。例如,間隔事故總信號,是由保護裝置出口與間隔斷路器分位合并而成。由于廠家信號合成的不規范,導致諸多變電站事故總信號合成邏輯錯誤,最終導致信息的頻發和誤發。
通過關聯規則算法求出各動作信號之間的關聯性,判斷合成邏輯的準確性,挖掘出一些隱藏的,易被忽視的缺陷,為頻發信息整改提供指導。
支持度與置信度是關聯規則的兩個重要指標,定義如下。
關于支持度,{信號A、信號B}同時動作的概率為:

關于置信度,信號A動作時,信號B動作的概率為:

信號B動作時,信號A動作的概率為:

利用Apriori算法通過計算支持度,確定頻發信息的頻繁項集,利用頻繁項集產生強關聯規則,實現對頻發信息的分析。川城I線412線路測保裝置異常與川城I線412間隔事故總置信度達到100%,川城I線412斷路器控制回路斷線與間隔事故總置信度為47.5%。事故總信號是反映線路或斷路器跳閘時所發的事故信號,根據事故總信號合成邏輯,測保裝置異常和控制回路斷線將不會引發間隔事故總信號動作。大概率為設備廠家關聯錯誤,引起信號的誤發送,應重點核查川城I線412間隔事故總信號內部合成邏輯,完成缺陷的治理。
在對數據進行了清洗、過濾、標簽分類及數據挖掘后,將當前月度頻發信息分析結果與上月度分析結果對比,并自動生成相應的報表,總結本月度頻發信息整治工作以及為下月度信息整治工作提供指導[3]。
該報表主要包含已整改頻發信息、新增已整改頻發信息和未整改頻發信息3類。
(1)已整改頻發信息的頻發次數較上月減少50%及以上,且總頻發次數低于該類頻發信息的門檻值。(2)新增頻發信息的頻發次數較上月增加50%及以上,且總頻發次數高于該類頻發信息的門檻值。(3)未整改頻發信息的頻發次數較上月增加或減少50%及以下,且總頻發次數高于該類頻發信息的門檻值。
已整改的頻發信息表明了該信息在被發現后已及時消缺處理,是對檢修及調控人員工作的肯定。新增頻發信息體現了設備某些新增缺陷或健康狀況有下降的趨勢,需運維人員及時檢查并進行相應的整治工作。未整改頻發信息主要包括如下3個方面原因。
一是監控人員未發現該信息頻發或與檢修人員溝通不到位,未及時上報該缺陷。二是設備老舊等一系列原因導致短時間內無法處理,需結合停電檢修計劃或整站改造期間集中處理。三是現場檢查設備無異常且尚不影響設備正常運行,需加強監視。
經過4個月的不懈努力,邵陽地區頻發信息量已得到大幅度改善,通過對頻發信息的挖掘、分析與集中整治,解決了一些存在已久卻不易察覺的設備缺陷以及一些長期存在的頑固缺陷,大大提高了設備的健康水平。
經統計,頻發信息占比50%的公用設備類頻發信息已從25 000/次每月下降至11 000/次每月。其中,江潭、大嶺、寺山、桔園及關峽等變電站故障錄波頻發均已得到有效整改。歷史遺留問題110 kV荷花塘變10 kV設備測保裝置異常因裝置對時問題每月頻發高達20 000余次,已通知縣公司屏蔽該信號待下次檢修工作時集中處理。110 kV火廠坪變多條10 kV線路過負荷告警每月頻發2 000余次,經保護人員調整相關定值后已不再頻發。35 kV九龍變、莨山變事故總信號頻發高達20 000余次,通知現場檢查發現為事故總信號關聯錯誤,現已全部整改到位。
在分析整治的過程中,也暴露出了一些新的問題,如監控信息命名的不規范,在自動分類時由于老舊設備不規范命名導致分類錯誤,進而影響分析結果。針對此類問題,在下階段工作中將對各變電站信息點表進行集中整治,規范信息名稱。
本文在監控大數據平臺的基礎上對邵陽地區頻發信息進行深入挖掘與分析,運用了大數據分析方法實現了對頻發信息清洗、過濾、分類與挖掘,并結合歷史頻發信息結果,自動生成分析報表,降低了監控人員的工作強度,提高了工作效率與智能化水平。同時,這也有利于加強對頻發信息的管理,為運維與檢修人員的消缺工作提供指導,進一步保證了電網設備的安全穩定運行。