999精品在线视频,手机成人午夜在线视频,久久不卡国产精品无码,中日无码在线观看,成人av手机在线观看,日韩精品亚洲一区中文字幕,亚洲av无码人妻,四虎国产在线观看 ?

基于數據挖掘的電網故障診斷研究

2014-02-24 08:59:27康建東劉宇星秦長鋒胡建勇中國電力科學研究院100192國網冀北電力有限公司100053
電子測試 2014年23期
關鍵詞:數據挖掘關聯規則

康建東,李 偉,張 雋,劉宇星,秦長鋒,胡建勇(中國電力科學研究院,100192;國網冀北電力有限公司,100053)

基于數據挖掘的電網故障診斷研究

康建東,李 偉,張 雋,劉宇星,秦長鋒,胡建勇
(中國電力科學研究院,100192;國網冀北電力有限公司,100053)

在實際電網故障診斷中,面臨如何從海量數據中找到所發生的連鎖故障之間的相互影響關系、以及一個故障發生可能引起其他故障發生的概率問題。本文研究內容是將數據挖掘技術中的聚類分析、關聯規則、貝葉斯網絡、綜合應用于電網故障的處理。首先應用聚類分析技術對電網的故障數據進行故障聚類,其次對數據進行關聯規則分析、發現故障之間的相互影響關系,再次基于貝葉斯網絡統計分析故障間相互影響的概率問題,最后結合以上分析結果給出輔助決策信息。

數據挖掘;ETL;電網故障;數據倉庫;關聯規則;聚類分析;貝葉斯網絡

0 引言

隨著電網規模的不斷擴大,電網發生故障時會有大量的故障信息,這些信息被送入了調度中心,調度員應該快速分析故障特征,判斷故障設備并盡快恢復用戶供電。除了提高調度員自身的業務素質以外,國內科研機構也正在研究利用計算機輔助決策來提高故障的處理效率。如何從大量的故障信息中有效挖掘信息,從信息中及時發現知識,提供給調度員做出相應決策。針對這些問題本文基于數據挖掘技術對電網故障診斷進行研究,給出相應的輔助決策信息供調度員參考。

1)數據挖掘的概念

數據挖掘(Data Mining簡稱DM)就是從大量、不完全、有噪聲、模糊的或者隨機的數據中獲取有效的、新穎的、潛在有用的、最終可理解的信息和知識的過程。數據挖掘不是簡單的數據查詢和檢索,而是對數據的統計、分析、綜合和推理,為決策提供更多可用數據和判據。

2)數據挖掘的分析方法

數據挖掘的方法可粗分為:統計方法、機器學習方法、神經網絡方法和數據庫方法。統計方法可細分為:回歸分析、貝葉斯判別、聚類分析、探索性分析、以及模糊集、粗糙集、支持向量機等。機器學習可細分為:決策樹、基于范例的推理CBR、遺傳算法、貝葉斯信念網絡等。神經網絡方法可細分為:BP算法、自組織神經網絡等。

3)數據挖掘與傳統分析方法的區別

數據挖掘與傳統的數據分析(如查詢、報表、聯機應用分析)的本質區別是數據挖掘是在沒有明確假設的前提下去挖掘信息、發現知識。數據挖掘所得到的信息應具有先前未知,有效和實用三個特征。

1 基于數據挖掘的電網故障預測

監控設備故障、通道故障等原因會照成電網設備的部分實時參數丟失或者錯誤,傳統的專家系統無法使用歷史數據中的規則進行分析,給出決策。因此要在大量的歷史數據中找到與當前故障最相近的模型非常困難。因此通過聚類分析、關聯規則和貝葉斯網絡進行綜合應用對電網故障進行有力的判據。

1.1 聚類分析對故障的分析

聚類分析是將物理的或者抽象的數據集合劃分為多個類別的過程,聚類之后的每個類別中任意兩個數據樣本之間具有較高的相似度,相似度可以根據數據樣本的描述屬性的具體取值來計算,通常采用數據樣本間的距離來表示。通過聚類分析來完成電網故障的相似度處理,進行故障的歸類,并可以作為關聯規則的預處理工作。

1.2 關聯規則對故障的分析

關聯規則是從歷史數據集合中發現不同數據項之間的相互影響關聯關系。下面就故障發生判斷故障的區域進行分析。

關聯規則定義:給定一組故障信息F={F1,F2,…,Fm}、故障區域A={A1,A2,…,An},故障關聯規則是形如R:X => Y的蘊含式,其中X為規則的條件并且是F的模式,Y為規則的結果并且是A的模式。

如果通過關聯規則得到表達式為{F1,F2 => A1},既說明由故障F1,F2這些故障信息診斷得出故障區域是A1。

關聯規則的項集支持度:

其中support(X)描述項集X出現的概率

關聯規則的可信度:

綜合上述支持度和可信度指標進行判定故障之間的關聯關系結論的有用性。

1.3 貝葉斯網絡對故障的分析

貝葉斯網絡是以貝葉斯概率為理論基礎,最早起源于貝葉斯統計分析,它是概率理論和圖論相結合的產物。多用于專家系統,成為不確定性知識和推理問題的流行方法。

貝葉斯網絡主要功能是預測和診斷,在貝葉斯網絡工作之前,需要對歷史數據進行訓練。

貝葉斯網絡的建立和訓練算法,首先把實際問題的事件抽象為節點,第二步建立兩個或者多個結節之間的連線。給定一個節點P,PS和QS分別表示節點的兩個狀態。從歷史數據中訓練出節點之間的條件概率和聯合條件概率,判斷故障發生相互影響的可能性概率。

條件概率:

聯合條件概率:

2 電網故障挖掘系統架構設

2.1 數據倉庫體系結構

電力系統故障數據倉庫的系統架構提出是為了簡化設計、建模、管理和實現,用于描述各個模塊之間的相互關系。電力系統故障數據倉庫系統架構如圖1所示,數據源包括文件、數據庫、設備,是從EMS/SCADA、PMUs、GIS等系統中進行采集的。數據導入包括對數據抽取、轉換和加載,在轉換過程中對數據進行檢查和出錯處理。之后將數據加載到數據倉庫中并為后續業務提供服務。

2.2 ETL處理過程

應運專門的ETL工具對數據源進行數據的抽取、轉換、清洗、裝載到數據倉庫中。ETL工具實現的功能包括數據抽取和轉換裝載、源數據建立和數據倉庫建模。所以這些數據都保存到數據倉庫中,由于各個數據源采用不同的數據存儲形式,所以構建數據倉庫時必須通過ETL工具將這些數據按一定規則導入到數據倉庫中,來保證數據的一致性,達到綜合應用各種數據源的目的。

圖1 電力系統故障數據倉庫系統架構圖

1)數據抽取

數據倉庫中的大量歷史數據主要是從SCADA/EMS、MIS、DBMS、PUMs、GIS等系統中獲得。

2)數據轉換

數據轉換是更改數據的類型、大小、小數位數、精度或者字段為空性等。

轉換工具中提供相應的函數對數據的重新格式化、字符串的處理和類型轉換進行處理。在轉換過程中應該對不同的數據源,列如:TXT、Excel、Doc、DB等進行相應的轉換。

3)數據加載

將轉換后的數據進行統一、分類加載到數據倉庫中,由于關心的主題不同把數據倉庫的數據建立各種數據集市。

2.3 多維數據模型建立

由于故障發生的影響因素眾多,因此本文設計了PMUs中心數據倉庫的數據采集模塊,包括PMUs實測數據采集、EMS/SCADA數據采集及其它可利用的數據源采集。根據研究問題的不同建立故障的數據集市。如下圖2中間表格是故障的事實,為四周的每一個維度增加一個字段作為維度表的外鍵,通過外鍵和事實表進行互聯,在此基礎上,可以利用OLAP技術進行各種復雜的查詢,掌握故障的一些基本信息。

圖2 故障星型模式

3 數據挖掘與結果分析

3.1 數據準備

基于冀北電網2011年到2013年期間的事故數據進行聚類分析、關聯規則分析、貝葉斯網絡分析。與電網故障的類別劃分、關聯性分析、貝葉斯網絡有關的屬性項主要包括發生時間、設備名稱、故障區域、故障發生原因和類型。

3.2 聚類分析挖掘

對冀北電網故障數據進行故障相似類型的聚類得到故障相應的分類。

(1)利用歐氏距離作為故障數據樣本間的相似性度量。

(2)選擇評價聚類性能的準則函數。

(3)選擇某個初始分類,之后用迭代的方法得到聚類結果,使得評價聚類的準則函數取得最優值。

3.3 關聯規則挖掘

基于聚類分析結果對變壓器類故障利用關聯規則對其進行分析,設定最小支持度=0.25時生成頻繁項集如表1所示。

通過對頻繁項集的分析發現在張家口和唐山易發生220千伏變壓器跳閘事故,設備的“產品質量”導致事故占比重較大,“產品質量”與“保護裝置故障”的關聯性較大。

表1 冀北電網故障頻繁項集表(部分)

3.4 貝葉斯網絡挖掘

根據關聯規則分析結果中相應的故障診斷的特點、建立相應Bayes網絡結構如圖3所示。Bayes網絡是由網絡結構和條件概率分布表組成。網絡結構是一種基于有向無環圖的圖表模型,由節點和有向弧段組成。

圖3 Bayes網絡結構圖

1) 網絡結構圖形

上層節點表示故障原因,下層節點表示故障類型。設有故障樣本集F={F1,F2,F3…Fn}和故障類型樣本集C={C1,C2,C3,C4…Cm}其中n,m分別代表元素個數。假定兩個樣本集中的所有元素是相互獨立的。

2) 節點的條件概率表(CPT)

表中列出了所有故障節點相對應于其故障原因節點所有可能的條件概率值P。例如對于上述的Bayes網絡結構,假設故障原因有兩個分別是產品質量和保護裝置故障,選取與這些故障相關受影響區域得出其條件概率表如表2。

表2 條件概率表(部分)

3.5 結果分析

1) 測試數據

基于冀北電網2011年到2013年期間的事故歷史數據。

2) 系統運行結果分析

通過對關聯規則的分析可以得出需要的知識。例如:張家口、產品質量和保護裝置故障,說明在張家口由于產品質量很容易導致保護裝置故障。如圖4冀北電網220千伏變壓器跳閘故障關聯分析部分關聯規則圖。

圖4 變壓器故障關聯性分析關聯規則(部分)

通過對Bayes網絡的分析可以得出需要的知識。如圖5 所示診斷結論為秦皇島、廊坊、承德地區由于維護不當導致變壓器故障所占概率比重較大,系統建議維護人員在維護過程中多加注意。張家口、唐山地區由于產品質量導致變壓器故障所占比重較大,系統建議在選擇產品時多加注意。

4 結束語

本文提出的基于數據挖掘技術的電網故障診斷研究方法有如下特點,首先建立了多數據源的中心數據倉庫,解決了數據來源的廣泛問題,同時根據不同的需求建立了相應主題的數據集市,使數據檢索更加方便。其次利用數據挖掘中的三種典型算法分別是聚類分析、關聯規則、貝葉斯網絡對數據進行分析,最后對三種算法的結果進行綜合分析發現未知知識,對電網故障處理給出輔助建議。

[1] 于之虹,郭志忠.數據挖掘與電力系統[J].電網技術,2001,25(8): 58-62

[2] 張克君,李伯群.基于DWLMS模型的分布式web用戶訪問模式挖掘[J].清華大學學報,2005,45(S1): 62-66

[3] 陳志泊.數據倉庫與數據挖掘[M].清華大學出版社,2009

[4] Jiawei Han,Micheline Kamber. 數據挖掘概念與技術.2版.[M].北京:機械工業出版社,2007

[5] 王珊.數據倉庫技術與聯機分析處理[M].北京科學出版社,1999

[6] 張耀天,何正友,趙靜.基于粗糙集理論和樸素貝葉斯網絡的電網故障診斷方法[J].電網技術,2007,31(1)

[7] 馮潔,陶宏才.快速挖掘最大頻繁項集[J].微電子學與計算機,2007,24(5):123-124

[8] 顧雪平,張文勤,高曙. 基于神經網絡和元件關聯分析的電網故障診斷[J].華北電力大學學報,1999,(02):12-17.

[9] 霍利民,朱永利,賈蘭英. 基于貝葉斯網絡的電網故障診斷[J].華北電力大學學報,2004,(03):30-34.

[10] Liu Bing,Hsu Wynne,Ma Yiming.Integrating Classification and Association Rule Mining. In:Proceedings of 1998 International Conference on Knowledge Discovery and Data Mining.NewYork:1998

Power System Fault Diagnosis Research Based on Data Mining

Kang Jiandong,Li Wei,Zhang Jun,Liu Yuxing,Qin Changfeng,Hu Jianyong
(China Electric Power Research Institute,100192;country Ji North Power Co.Ltd,100053)

In actual power grid fault diagnosis,facing how to find out what happened from the huge amounts of data in a cascading fault between the interaction relations,as well as a fault may cause the probability of other fault issues.In this paper,the research content is to clustering analysis and association rules and Bayes Network in data mining technology,comprehensive applied to power grid fault processing.The first application of clustering analysis technology to power grid fault data clustering,secondly,association rules of data analysis,found the mutual influence of relationship between the fault,again based on Bayes Network Statistics analysis of the mutual influence between fault probability problem,finally combining the above analysis results give auxiliary decision-making information.

Data Mining;ETL;Power System Fault;Data Warehouse;Association rules;Clustering Analysis;Bayes Network

圖5 變壓器故障原因分析圖

猜你喜歡
數據挖掘關聯規則
撐竿跳規則的制定
“苦”的關聯
當代陜西(2021年17期)2021-11-06 03:21:36
數獨的規則和演變
探討人工智能與數據挖掘發展趨勢
奇趣搭配
讓規則不規則
Coco薇(2017年11期)2018-01-03 20:59:57
基于并行計算的大數據挖掘在電網中的應用
電力與能源(2017年6期)2017-05-14 06:19:37
智趣
讀者(2017年5期)2017-02-15 18:04:18
TPP反腐敗規則對我國的啟示
一種基于Hadoop的大數據挖掘云服務及應用
主站蜘蛛池模板: …亚洲 欧洲 另类 春色| 国产成人精品高清在线| 国产精品成人观看视频国产 | 久久久成年黄色视频| 98精品全国免费观看视频| 2022精品国偷自产免费观看| 国产成人久视频免费| 毛片在线播放a| 日韩欧美国产另类| 国产成人精品在线1区| 亚洲综合18p| 午夜啪啪福利| 亚洲精品自产拍在线观看APP| 婷婷色婷婷| 久久亚洲欧美综合| 久久精品人妻中文系列| 久久精品亚洲专区| 亚洲热线99精品视频| 日本欧美视频在线观看| 国产在线98福利播放视频免费| 91精品国产丝袜| 在线观看无码a∨| 国产农村精品一级毛片视频| 国产成人精品男人的天堂下载| 第一页亚洲| 五月激激激综合网色播免费| 国产丝袜精品| 呦女亚洲一区精品| 亚洲国产成人在线| 欧美精品1区| 亚洲另类第一页| 全部免费毛片免费播放| 国产浮力第一页永久地址| 国产精品自在线天天看片| 亚洲一区二区在线无码| 日本国产一区在线观看| 精品视频第一页| 欧美精品啪啪一区二区三区| 久久精品亚洲专区| 欧美www在线观看| 国产啪在线| 一区二区欧美日韩高清免费| 国产日本视频91| 精品国产欧美精品v| 不卡色老大久久综合网| 一级毛片免费播放视频| 亚洲A∨无码精品午夜在线观看| 日韩精品无码免费一区二区三区| 国产亚洲精品在天天在线麻豆| 精品国产成人av免费| 国产视频 第一页| 亚洲第一天堂无码专区| 亚洲一区二区三区国产精品| 日韩欧美综合在线制服| 欧亚日韩Av| 成人综合在线观看| 欧美三级视频在线播放| 欧美日韩中文国产| 91亚洲精选| 欧美三级日韩三级| 婷婷午夜天| 国产毛片高清一级国语 | 国产91精品调教在线播放| www.91在线播放| 在线免费无码视频| 国产97视频在线观看| 国产免费精彩视频| 在线播放真实国产乱子伦| 18禁高潮出水呻吟娇喘蜜芽| 精品无码专区亚洲| 亚洲最大福利网站| 54pao国产成人免费视频| 婷婷亚洲视频| 日韩视频精品在线| 精品一区二区三区无码视频无码| 夜夜操国产| 色哟哟国产精品| 亚洲成人在线免费观看| 日本少妇又色又爽又高潮| 国产精品99一区不卡| 色偷偷一区二区三区| 国产精品视频观看裸模|