999精品在线视频,手机成人午夜在线视频,久久不卡国产精品无码,中日无码在线观看,成人av手机在线观看,日韩精品亚洲一区中文字幕,亚洲av无码人妻,四虎国产在线观看 ?

基于FP-Growth 的電力調度通信網告警信息關聯分析

2022-09-20 01:30:24劉習義劉明輝劉普森
長江技術經濟 2022年4期
關鍵詞:數據挖掘關聯規則

劉習義,龍 林,劉明輝,劉普森,肖 雪

(1. 三峽水利樞紐梯級調度通信中心,湖北 宜昌 443002;2.智慧長江與水電科學湖北省重點實驗室,湖北 宜昌 443002)

1 研究背景

隨著電力發電領域數字化、智能化技術的快速發展,作為承載多樣電廠業務的電力調度通信網的網絡規模、網絡結構、延伸覆蓋面和承載能力得到迅速發展。作為發電廠內部各種發電、輸電、配電設備等眾多分散節點之間信息傳輸的主要通道,電力調度通信網運行可靠性將直接影響智能配電網調度和控制能力。因此,需要及時發現并清除通信系統運行過程中產生的告警與故障,而隨著電力調度通信網絡逐漸龐大,各類通訊設備數量極大、種類繁多,涉及的設備類型和網管系統也多種多樣,其關聯性難以直接梳理,給電力通信網的告警、故障識別與處理帶來了困難。

數據挖掘是近年來新發展起來的融合了統計學、機器學習、數據存儲信息檢索等最新研究成果的多學科領域。隨著計算機計算能力的不斷提升,在越來越多的領域得到應用[1-5]。數據挖掘在從大量、復雜的數據提取有效關聯數據方面的優勢明顯,通??杀硎緸楦拍睢⒁巹t、規律、模式等形式,可以被用于信息管理、查詢優化、決策支持和過程控制以及數據自身的維護等[3-4]。目前,該技術也被應用于解決電力行業中存在的一些問題。例如,丁宏等[1]對基于機器學習的通信網告警信息關聯性分析進行了綜述,從告警信息預處理、關聯性分析方法以及告警關聯規則的生成等多個方面進行了較為詳細的梳理與總結。馬瑞敏等[2]以FP-Growth 算法為基礎,研究了學生共同愛好之間的關聯關系問題。文獻[4-6]整體描述了關聯規則挖掘方法,以Apriori 算法為核心,對變電站二次設備缺陷的關聯關系進行了建模與分析。文獻[7-10]分析了通信網的部分特點及其容易出現的告警信息,采用一般的關聯關系分析方法,得到了一定的關聯性結果。但上述文獻采用的分析算法主要是傳統的關聯分析方法,在大樣本量、高頻繁度中難以有較好的表現,而且少有數據挖掘在電力調度通信系統中的應用,沒有對其特點進行細致研究與分析,難以滿足未來智能配網調度發展的需要。

FP-Growth 算法是頻繁模式挖掘上領先的算法,相比于數據挖掘傳統的Apriori 等方法有著極大的提升,也更適合在大規模的、復雜程度更高的系統中應用。為此,本文首先分析了電力調度通信系統告警信息特點,然后基于FP-Growth 算法提出了一種電力調度通信網告警信息關聯分析方法,建立基于關聯規則的數據挖掘模型,并以某公司某段時間內通信網絡告警數據為例,驗證了該方法的高效性,可為電力調度通信網的故障排查及檢修規劃提供指導。

2 電力調度通信網告警信息分析

2.1 電力調度通信網

隨著數字化技術的不斷發展,電力調度通信網涵蓋工業以太交換網絡、電力載波網絡、電力無線專網和無線公網在內的綜合性配網通信業務承載網絡。調度通信網的可靠運行直接影響著各業務的高效開展。

電力調度通信網中,各設備網元之間相互連接,相互影響,在實際運行過程中,通常某一網元設備出現故障,就會引起其關聯的多個設備或承載系統出現告警,出現連鎖性故障的現象。然而,由于當前配網通信設備與開關、配電房等安裝在一起,數量眾多且地理位置分散,設備種類及廠家不一,給通信設備管理帶來巨大的挑戰。特別是隨著設備數量的不斷增加,整個通信網絡中的告警數量呈指數級增長,導致難以準確進行故障定位、處理等操作。因此,十分有必要對產生的大量數據進行有效分析與利用,以指導未來更加復雜的網絡下高效的故障分析、定位、檢修等工作。

2.2 告警信息特點

電力調度通信網每天將會產生大量的告警信息,主要包含各類數據探針、傳輸光纖監測設備、主機監控設備等產生的告警,此外還有網絡內部鏈路、數據庫、機房環境、電力設備通信異常等告警。電力調度通信網告警信息產生及處理流程如圖1 所示,告警信息有如下特點。

圖1 電力調度通信網告警信息處理基本流程

(1)字段多。一般網絡告警信息可能包含多個字段,而真正有較強關聯關系的字段有限,主要有產生時間、設備編號、告警類別等,繁雜的告警信息會給管理人員帶來較大的管理辨別難度。

(2)關聯性。電力調度通信網各設備之間聯系較為緊密,網絡中某一網元設備出現告警,與其相互連接的多個鏈路或信號均可能在相近的時間內發出類似告警,呈現連鎖性、傳播性與關聯性等特點。同時,若相近時間產生大量告警,不同告警級別的信息可能疊加到一起,容易忽略較為嚴重的告警信息。

(3)突發性。電力調度通信網絡中發生故障或告警,一般呈突發性,如施工不當、維護不到位、突發性數據訪問、硬件意外故障等,常常難以預測,突發性、隨機性較強。

(4)時序性。在整個調度通信網中,各監控部分的時間需要時刻同步,保證整個告警信息的時序連貫。此外,由于網絡及設備之間存在較強的關聯關系,告警信息的出現與上報有較強的時序性。

3 基于FP-Growth 的數據挖掘模型

3.1 關聯規則

關聯規則能夠反映事物與事物之間的相互依存性和關聯性。如果通過數據挖掘能夠反映兩個或多個事物之間存在一定的關聯關系,將有助于進一步分析事物間的關聯機理,甚至可以通過其中一項事物的發生去預測其他事物的發生[3]。

告警信息數據挖掘需要從大量的告警數據中發掘相互之間實際存在的某種關聯性,進而形成一個關聯規則,每一個關聯規則所涉及的一個事物被稱為一個項目,由不同的項目構成的集合稱為項集I(Itemset),其元素個數稱為項集的長度,長度為k的項集稱為k-項集(k-Itemset)。被用于關聯規則挖掘的樣本集Y 是項集的一個子集,即Y ∈I,樣本的全體構成了樣本數據庫D[2,7-8]。

評價一條關聯規則的好壞有兩個關鍵指標:支持度(Support)和置信度(Confidence)[8]。支持度表示某關聯規則發生可能性的大小,置信度表示某關聯規則值得信賴程度的高低。對于一個項集I 的2個子項集A 和B(B ∈I,A ∈I,且A ∩B = ? )而言,兩者的關聯規則R 可以表示為:

用count(A)表示樣本集Y 中包含A 的樣本數量,用count(B)表示樣本集Y 中包含B 的樣本數量,則項集A 的支持度為:

規則R 的支持度為:

規則R 的置信度為:

關聯規則的最小支持度記為Smin,用于衡量規則需要滿足的最低重要性;關聯規則的最小置信度記為Cmin,表示關聯規則需要滿足的最低可靠性。如果規則R 滿足S(R)≥Smin且C(R)≥Cmin,稱關聯規則R 為強關聯規則,強關聯規則對于指導實際決策具有建設性的意義。

3.2 FP-Growth 算法

FP-Growth 算法是由Han 等[1]提出的一種基于FP-Tree 結構的頻繁項集生成算法,相較于Apriori 算法通過枚舉的方式進行關聯規則挖掘,當事務數較多或頻繁項集數較大時難以有效處理,FP-Growth 方法以FP-Tree 為基礎,通過樹干、樹枝等樹模型來進行數據存儲與分析,將同前綴的項歸于同一類樹結構,可極大減少數據處理復雜度,提升處理效率,對龐大的數據項集也可高效處理[2,7]。該算法的主要流程如圖2 所示。

圖2 基于FP-Growth 算法的關聯分析流程

(1)遍歷樣本數據庫D,統計D 中全部數據項的頻數,根據規則排除不滿足最小支持度Smin要求的事務,將得到的頻繁項集按遞減方式排序。

(2)在前述結果基礎上,創建根節點(NULL),依次讀入事務,按照頻繁項階數添加到整個樹結構中。

(3)重復以上過程,直到滿足置信度和支持度的整個事務全部插入到樹結構中,形成最終的FPTree 結構。

應用FP-Growth 算法進行關聯分析時,算法的最小支持度Smin和最小置信度Cmin需根據實際數據庫進行合理設置,過大可能排除一些頻繁項集,過小則會出現一些關聯性不強的結果。

4 算例分析

為對比FP-Growth 與Apriori 算法的性能,分別采用兩種算法在云服務器上進行數據分析試驗,采用的云服務器配置為Intel Xeon E3 CPU、32GB DDR4、Windows Server 2012 系統。

以某電廠電力調度通信系統某月產生的部分原始告警數據5 萬余條為基礎樣本,在進行消除不完整數據、壓縮與歸一化等降低冗余和不一致性等預處理后[9-10],分別采用Apriori 和FP-Growth 兩種算法進行關聯規則挖掘,所耗費的時間見圖3??梢钥闯觯S著算法支持度的不斷提高,兩種算法的計算時間都不斷迅速減小,這是因為隨著支持度要求的不斷提高,其滿足支持度要求的規則越來越少。但在同等支持度下,FP-Growth 算法耗時比Apriori 算法節約50%以上。可知同等條件下,FP-Growth 算法的關聯關系挖掘效率更高,而Apriori 算法在樣本量、頻繁項階數較大的情況下,難以高效完成關聯關系挖掘工作。

采用FP-Growth 算法對電力調度通信網的告警信息進行關聯規則分析,可幫助通信系統運維管理人員快速分析定位故障原因。從圖3 可以看出,算法的支持度過小將極大影響關聯關系結果的挖掘時間??紤]到總樣本量以及重點發掘關鍵的關聯關系,設置FP-Growth 算法的Smin為85%,Cmin為65%,最終得到的頻繁項集數為31 條,最大階數為5,部分強關聯規則如表1 所示,部分電力調度通信網告警信息關聯關系見圖4。

圖3 Apriori 和FP-Growth 算法性能對比

圖4 告警信息關聯關系

從表1 可以看出,空調狀態異常導致機房的動態環境的溫度、濕度限值越界的概率很高,置信度為96%。此外,路由器、交換機等網口協商失敗可能導致以太網連接錯誤,負載過流連續告警可能導致電源電壓過低等故障告警信息。

表1 部分強關聯規則

在日常的電力調度通信網的運維中,找到故障并解決修復相對容易,而及時有效地發現故障卻較為困難。本文針對日常運行中的基礎告警信息分析得出的告警信息關聯關系,能夠為相關電力企業的電力調度通信網運維、檢修提供一種更加有針對性的快速溯源、告警故障高效處理的新思路。隨著電力調度通信系統的建設加快,調度通信網具有更廣泛的監測能力、更豐富的數據屬性,必然使得告警信息量爆發式增長,僅僅依靠傳統的人工方式篩選學習難以勝任。針對更復雜的關聯和數據量的樣本,可依據本文的分析思路與方法,進行高效挖掘分析,幫助相關工作人員快速分析定位出故障源頭,有效提升運維效率,降低運維成本。

5 結語

針對電力調度通信網規模不斷增大、告警信息難以有效發掘的問題,采用FP-Growth 算法對電力調度通信網告警信息進行關聯關系挖掘,得到如下結論:

(1)電力調度通信網的告警信息具有字段多、關聯性強、突發性、時序性等特點。

(2)采用FP-Growth 算法對大容量的數據樣本進行關聯關系分析時,比采用Apriori 算法時的效率更高。

(3)通過對電力調度通信網告警信息關聯分析,可以深入了解不同設備、不同字段時間的關聯關系,為通信網的運維及檢修提供指導。

猜你喜歡
數據挖掘關聯規則
撐竿跳規則的制定
“苦”的關聯
當代陜西(2021年17期)2021-11-06 03:21:36
數獨的規則和演變
探討人工智能與數據挖掘發展趨勢
奇趣搭配
讓規則不規則
Coco薇(2017年11期)2018-01-03 20:59:57
基于并行計算的大數據挖掘在電網中的應用
電力與能源(2017年6期)2017-05-14 06:19:37
智趣
讀者(2017年5期)2017-02-15 18:04:18
TPP反腐敗規則對我國的啟示
一種基于Hadoop的大數據挖掘云服務及應用
主站蜘蛛池模板: 在线观看亚洲精品福利片 | 国产成人做受免费视频| 亚洲天堂日韩av电影| 狠狠色丁香婷婷| 六月婷婷综合| 日韩免费无码人妻系列| 欧美精品影院| 国产精品丝袜在线| 亚洲精品第一在线观看视频| 亚洲最新在线| 日本AⅤ精品一区二区三区日| 亚洲第一精品福利| 成人免费网站在线观看| 亚洲aⅴ天堂| 久久综合AV免费观看| 欧美在线网| 啪啪永久免费av| 日韩国产一区二区三区无码| 小说 亚洲 无码 精品| 最新痴汉在线无码AV| 国产在线观看第二页| 国产精品无码一区二区桃花视频| 免费视频在线2021入口| 国产成人区在线观看视频| 色欲综合久久中文字幕网| 91无码国产视频| 日韩精品亚洲精品第一页| 91色爱欧美精品www| 性欧美精品xxxx| 国产欧美成人不卡视频| 久久人搡人人玩人妻精品一| 91福利国产成人精品导航| 伊人狠狠丁香婷婷综合色| 色婷婷电影网| 亚洲一区免费看| 一区二区影院| 国产男人天堂| 天天躁夜夜躁狠狠躁躁88| 国产区人妖精品人妖精品视频| 2024av在线无码中文最新| 99无码中文字幕视频| 亚洲精品国产首次亮相| 国产激情影院| 亚洲一区二区在线无码| 亚洲三级a| 国产精品成| 99久久国产综合精品女同| 色播五月婷婷| 国产免费看久久久| 国产精品内射视频| 国产亚洲精品97在线观看| 欧美日韩精品综合在线一区| 波多野结衣中文字幕久久| 中文字幕 91| 91久久偷偷做嫩草影院电| 亚洲中文字幕国产av| 性欧美久久| AV老司机AV天堂| 91毛片网| 久久久91人妻无码精品蜜桃HD| 波多野结衣第一页| 欧美在线中文字幕| 中国国产A一级毛片| 国产精品亚洲欧美日韩久久| 最新精品久久精品| 毛片在线看网站| 久久性妇女精品免费| 精品無碼一區在線觀看 | 五月激情婷婷综合| 亚洲自偷自拍另类小说| 91欧美亚洲国产五月天| 99re热精品视频国产免费| 毛片视频网| 91福利免费视频| 乱人伦视频中文字幕在线| 久久久久青草线综合超碰| 特级aaaaaaaaa毛片免费视频| 99re热精品视频国产免费| 老色鬼欧美精品| 亚洲国产清纯| 国产自产视频一区二区三区| 亚洲中文无码av永久伊人|