999精品在线视频,手机成人午夜在线视频,久久不卡国产精品无码,中日无码在线观看,成人av手机在线观看,日韩精品亚洲一区中文字幕,亚洲av无码人妻,四虎国产在线观看 ?

基于GSA的用電信息采集異常精確定位研究

2014-01-16 05:57:48左慶鄰慕福林
電子設計工程 2014年14期
關鍵詞:數據挖掘信息

左慶鄰,慕福林,冉 艷,朱 鸝,楊 歡

(1.國網重慶市電力公司 客戶服務中心,重慶 400017; 2.國網重慶市電力公司 江北供電分公司,重慶 400017)

在當今經濟的發展趨勢下,傳統電網已經不能夠滿足電力行業的需求,智能電網成為發展方向。而就目前來說,電網已成為工業化、信息化社會發展的基礎和重要組成部分。隨著市場化改革的不斷推進,智能電網已成為現代電網技術發展的必由之路。其中,隨著電子技術的發展,用電信息采集系統為實現電量采集、數據統計分析及電量考核提供了切實可行的技術手段,從根本上克服了傳統人工抄表模式的弊端。隨著電網的結構與運行方式日趨復雜,人們對電網運行的可靠性與電能質量也提出了更高的要求。提高用戶信息采集數據準確性,研究可行的異常數據辨識及異常點精確定位方法,對電力系統的安全和穩定運行意義重大。

1 研究背景

1.1 用電信息采集異常精確定位技術

用電信息采集系統已在電力系統建設中起到重要作用,但與之相對應的用電信息采集異常精確定位一直沒有良好的解決方案。如集抄系統雖然可以滿足負荷分析和低電壓監測的要求,但難以滿足配網狀態檢修的需要。當電能表發生故障時,只能靠用戶電話反饋才能確定電能表發生故障并確定故障位置。因此找到一種合理有效的用電信息采集異常精確定位解決方法,是我國發展“電網2.0”的必然要求。

用電信息采集異常精確定位建設需要解決的是企業經營活動所覆蓋區域內復雜的、分布的、異構的信息資源的交換、轉換、集成與共享。從采集的數據中獲取故障集中器、關口表或電能表的地址信息,確定故障出現的具體位置。

1.2 數據挖掘在電力系統中的應用

用電信息采集異常精確定位的建設更重要的是從數據中獲取故障電能表的地址信息,不斷完善多種分析策略為電力生產服務。在電力系統中,數據挖掘技術可以用來完成電力系統的調度運行、決策支持控制、電力系統建模、設備運行狀態的監視和電力系統負荷預測分類等決策任務。

數據挖掘中聚類分析的一個主要的難題是估計聚類的最佳數量,聚類離散度與聚類個數的關系包含著最佳聚類個數的信息,基于GSA(Gap Statistic Algorithm)的數據挖掘是挖掘此類信息的方法之一。目前,國外對GSA方法的研究剛起步,Tibshirini R.和Walther G.于2000年提出這種方法[1],但許多方面仍有待進一步完善,之后幾年在IEEE等期刊中陸續出現基于GSA方法的應用論文,表明GSA方法具有其一定的應用價值。本文將研究基于GSA的數據挖掘的方法,探索新的電力系統中異常數據檢測定位方法,并將之引入到電力系統異常數據定位的應用中來。

2 基于GSA的數據挖掘體系

在應用于電力系統異常數據定位時,并不是對電力系統原始量測數據直接進行分析,而是建立在人工神經網絡對量測數據的預處理的基礎上的。利用神經網絡處理非線性輸入輸出關系的特性[2],從神經網絡的輸入輸出數據中挖掘出有關量測誤差值的信息。聚類分析階段對接收到的已處理數據進行自動定位,接著確定最佳聚類個數,最終對應定位原始數據中的異常數據。

2.1 基于GSA的異常數據算法

GSA算法主要由神經網絡和聚類分析兩個模塊構成,如圖1[3]。

圖1 GSA算法模塊組成圖Fig.1 GSA algorithm module composition

文中選用BP神經網絡,首先將獲取到的用戶信息采集數據對BP神經網絡進行訓練,采樣200組實時量測數據,取出現異常數據前的180組正常數據對神經網絡進行訓練,完成后再代入余下的20組待測試數據進行處理。訓練調整網絡的權值后,量測值的估計值受外界的影響將會最小。這樣,量測值中如果存在異常數據,則其與網絡輸出必然有較大差值。取期望輸出和實際輸出之差的平方和為誤差函如果實際輸出不滿足要求,反向傳回誤差信號,并修改每個隱含層的各個神經元的權系數,直至誤差函數值最小,可使得輸出滿足系統精度要求[4-5]。

BP神經網絡的輸出數據作為聚類分析模塊的待測數據輸入。聚類模塊采用的是K-means聚類算法[6-7]。對于每次輸入的聚類數k ,計算得到聚類離散度 Wk。

2.2 GSA算法的流程

圖2給出了基于GSA算法的程序流程圖[3]。

圖2 GSA算法程序流程圖Fig.2 GSA algorithm program flow

如圖所示,首先把聚類數量 置為1,然后執行 直到確定最佳的聚類數量 為止。主要的計算過程有以下幾步[3]:

1) 待檢測數據計算誤平方

通過BP神經網絡的工作,獲得每個輸入變量ei(系統中各節點的測量數據與安全可靠運行數據之間的差值)相應的輸出Qi。這一步得到的平方誤差數據(ei-Qi)2作為下一步的輸入數據。

2) 平方誤差(ei-Qi)2進行聚類

這一步中,根據上一步獲得的數據通過K-means算法進行聚類,聚類數據的聚類離散度

3) 參考數據進行聚類

作為比較基準,參考數據集采用在待檢測數據范圍內產生均勻分布的隨機值。對于每個W(k) ,產生F組參考數據集。參考數據集聚類離散度也同樣通過式(1)計算得到,稱為Wi,j(k) (j=1,2,…,F)。然后使用2)中的方法對參考數據進行聚類。

4)確定最佳的聚類個數這一步中,首先計算值

接著,最佳聚類個數將等于 k-1,如果滿足下式:

5)檢測和定位異常數據

注意到當最佳聚類數量為1時,意味著所有待檢測數據都可以被認為是正常數據,而一旦最佳聚類數量不為1時,所觀察的待檢測數據中存在異常數據。接著計算每個聚類的(ei-Oi)2的平均值,其中具有最小(ei-Oi)2平均值的聚類被認為是正常數據的聚類,而其它的都被認為是異常數據的聚類。查詢這些均值較大的聚類中元素,相應地可以挑選出異常數據。通過上述流程,正常數據被歸并到一個類中,而異常數據被分離開來。

本文利用C語言根據此流程圖編寫GSA算法程序,以下有關GSA算法的數據均由此程序計算得出。

3 GSA算法仿真與分析

3.1 數據集

文中算法所用的數據選取連接500 kV、220 kV電網各變電站的聯絡線及變電站出線的有功值,共103條線路的有功測量值。仿真數據選取2013年3月15日至2013年3月18日SCADA所采集的用電信息實時數據,間隔為15分鐘,每天共88組數據。

3.2 算法仿真

本節以狀態估計后的正常數據為基礎,經過人為設置異常數據后代入程序進行驗證仿真,將對不含異常數據情況、含單個異常數據情況以及含多個異常數據情況等做進一步的仿真與分析。采用2013年3月16日數據,此日狀態估計系統共進行264次估計計算,估計計算結果全部收斂。首先利用3月16日的前80組數據對BP神經網絡算法進行訓練,81-83組數據為待測數據,其中第81、82、83組數據分別為不含異常數據的正確數據、含有單個異常的數據、含有多個異常的數據。利用神經網絡對數據進行訓練,完成后測試訓練結果。

1) 不含異常數據情況

采用數據集中2013年3月16日第81組數據進行測試,此組數據均為正常數據,不含異常數據。將BP神經網絡預處理后的數據代入GSA算法程序,各聚類參數結果如表1所示:

根據GSA算法最佳聚類判定公式有gap(k-1) ≥gap(k)-sk,當聚類個數為2時,gap(2) -s2=4.519 2,小于gap(1)的值,則最佳聚類為 (k-1)=1類,程序結果表明最佳聚類為1類,無異常數據,與實際情況相符。結果表明在無異常數據時,GSA算法能正確做出判定,將數據聚為一類,無異常數據。

表1 不含異常數據情況各聚類參數Tab.1 Clustering parameters without abnormal nodes

圖3 不含異常數據情況各聚類gap值折線圖Fig.3 Clustering gap values line graph without abnormal nodes

2) 含單個異常數據情況

采用數據集中2013年3月16日第82組數據進行測試,此組數據為準確數據,人為設置一個誤差量,假設電力系統中節點34中出現用電信息采集異常數據,歸一化處理后,對某一用電信息數據由0.867 4設置為1.305 6,為方便比較分析,表2列出了此類情況下聚類個數為1至5時所得的參數值:

表2 含單個異常數據情況各聚類參數Tab.2 Clustering parameters with one abnormal node

圖4 待測數據中含單個異常數據情況各聚類gap值折線圖Fig.4 Clustering gap values line graph with one abnormal node

由圖可看出,當聚類個數為2時,gap(2) -s2=8.297 4-0.095 7=8.201 7,大于gap(1)值5.768 6,則最佳聚類不是聚類為 (k-1)=1類,當k=3時,gap(3) -s3=6.998 7-0.102 4=6.896 3,此結果小于gap(2)值8.297 4,表明(k-1)=2為最佳聚類。

通過比較各聚類中數據平均值大小來確定異常數據所在的聚類。聚類結果中聚類元素平均值最小的被認為是正常數據所在聚類,而均值較大的其他聚類都被認為是異常數據所在的聚類。然后找出這些聚類內的數據,就能相應地定位出異常數據。進一步分析各聚類結果如表3所示。

表3 含單個異常數據情況聚類元素及各聚類中心Tab.3 Clustering elements and centers with one abnormal node

聚類1內各數據均值:

聚類2內各數據均值:

比較結果知,聚類1元素均值要大于聚類2元素,說明異常數據所在聚類為聚類1,第34個數據為異常數據,結果符合預期,說明GSA算法能準確定位出設定的異常數據。

3)含多個異常數據情況

電力系統中出現異常數據的概率較小,同時出現多個異常數據的概率更小,但為驗證GSA算法在多個異常數據定位方面也有較好表現,此處采用2013年3月16日第83組數據進行測試,異常數據設置位置于節點20、45、74、99,其中節點20數據由0.547 5設置為0.954 6,,節點45數據由0.354 9設置為0.567 6,節點74數據由0.493 5設置為0.156 7,節點99數據由0.986 4設置為0.643 8。將含有多個異常數據的數組代入程序,為方便比較分析,表4列出聚類數為1至5時所得的參數值:

表4 含多個異常數據情況各聚類參數Tab.4 Clustering parameters with multiple abnormal nodes

圖5 待測數據中含多個異常數據情況各聚類gap值折線圖Fig.5 Clustering gap values line graph with multiple abnormal nodes

由圖可看出,當聚類個數為2時,gap(2) -s2=4.600 6-0.078 5=4.522 1,大于gap(1)值4.265 4,則最佳聚類不是聚類為 (k-1)=1類,當k=3時,gap(3) -s3=3.769 4-0.085 4=3.684 0,此結果小于gap(2)值4.600 6,表明(k-1)=2為最佳聚類。

為確定異常數據所在的位置,計算各聚類中心以確定各聚類的平均誤差。

表5 含多個異常數據情況聚類元素及各聚類中心Tab.5 Clustering elements and centers with multiple abnormal nodes

聚類1內各數據均值:

聚類2內各數據均值:

比較結果知,聚類1元素均值要大于聚類2元素,說明異常數據所在聚類為聚類1,第20,45,74,99個數據為異常數據,結果符合預期,說明在同時出現多個異常數據時,GSA算法也能準確定位出異常數據。

將假定異常點數量增加,仿真得到聚類結果出現多于兩個聚類數量的情況。

3.3 結果分析

從仿真結果中可以看出,GSA算法在不含異常數據和含有單個異常數據情況下能夠精確進行定位,在出現多個異常數據定位過程中,若出現將異常數據聚為兩類及兩類以上的情況,這是由K均值算法固有特點決定的,這種情況也能精確定位出異常數據。

可見GSA算法的檢測效果取決于神經網絡以及聚類算法,只要神經網絡構造得好,訓練精度高并且聚類分析算法選擇恰當,對于各種規模的電力系統,不論異常數據的形式如何,GSA 算法都能夠將其精確定位。

4 結束語

GSA算法是一種新的異常數據檢測算法。它結合了神經網絡技術與聚類算法在異常數據監測方面的優點,為檢測異常數據提供了一個新的方法。本文研究基于GSA算法的用電信息采集中異常數據的精確定位,采用電力系統中采集到的用電信息進行各種情況下的仿真,比較驗證了GSA算法在定位異常數據的優越性,表明GSA算法具有更廣闊的應用范圍。

[1]Tibshirini R, Walther G, Hastie T. Estimating the Number of Cluster in a Dataset via the Gap Statistic[J]. Unpublished Technical Report: Stanford University. 2000: 1-18.

[2]H. Salehfar, R. Zhao. A neural network pre-estimation filter for bad-data detection and identification in power system state estimation[J]. Electric power system research. 1995, 34(8): 127-134.

[3]HUANG Shy-jier, LIN Jeu-min. Enhancement of Power System Data Debugging Using GSA-based Data-mining Technique[J].IEEE Trans on Power Systems, 2002, 17(4): 1022-1026.

[4]聞新, 周露. Matlab神經網絡仿真與應用[M]. 北京:科學出版社, 2003.

[5]邵峰晶, 于忠清. 數據挖掘原理與算法[M]. 北京:中國水利水電出版社, 2003.

[6] 黃新波,王婭娜, 劉林,等. 變壓器油色譜在線監測中BP神經網絡算法分析[J]. 陜西電力,2013(6):56-60.HUANG Xin-bo,WANG Ya-na,LIU Lin,et al. Application of back propagation neural network in dissolved gas analysis based on transformer oil chromatographic on-line monitoring[J].Shaanxi Electric Power,2013(6):56-60.

[7] 寧姍. 基于蟻群聚類的多目標環形分類的方法研究[J]. 工業儀表與自動化裝置,2012(5):70-73.NING Shan. Research on annular sort of multi-objects based on ant colony clustering[J]. Industrial Instrumentation &Automation,2012(5):70-73.

猜你喜歡
數據挖掘信息
探討人工智能與數據挖掘發展趨勢
訂閱信息
中華手工(2017年2期)2017-06-06 23:00:31
基于并行計算的大數據挖掘在電網中的應用
電力與能源(2017年6期)2017-05-14 06:19:37
數據挖掘技術在中醫診療數據分析中的應用
一種基于Hadoop的大數據挖掘云服務及應用
展會信息
中外會展(2014年4期)2014-11-27 07:46:46
數據挖掘的分析與探索
河南科技(2014年23期)2014-02-27 14:18:43
基于GPGPU的離散數據挖掘研究
信息
建筑創作(2001年3期)2001-08-22 18:48:14
健康信息
祝您健康(1987年3期)1987-12-30 09:52:32
主站蜘蛛池模板: 久久精品中文字幕免费| 黄片一区二区三区| 思思热精品在线8| 大香伊人久久| 国产成人1024精品| 香蕉综合在线视频91| 无码免费试看| 91福利在线观看视频| 精品无码日韩国产不卡av| 高潮毛片免费观看| 999国产精品永久免费视频精品久久 | 国产激情无码一区二区免费| 亚洲 欧美 中文 AⅤ在线视频| 新SSS无码手机在线观看| 97综合久久| 久久精品女人天堂aaa| 亚洲国产欧美自拍| 国产啪在线91| 国产成人免费手机在线观看视频| 成人国产精品视频频| 好久久免费视频高清| 欧美成人国产| 亚洲中文字幕日产无码2021| 久久久久久久久亚洲精品| 欧美日韩亚洲综合在线观看| 精品一区二区三区水蜜桃| 99热这里都是国产精品| 国产Av无码精品色午夜| 日本人妻一区二区三区不卡影院| 五月天天天色| 亚洲日韩精品综合在线一区二区| 美女免费黄网站| 日韩福利在线视频| 九九九精品成人免费视频7| 伊人成人在线| 色视频国产| 天天躁狠狠躁| 97se亚洲综合在线韩国专区福利| 一区二区三区在线不卡免费| 国产青青操| 精品国产成人av免费| 久久久精品国产亚洲AV日韩| 特级毛片免费视频| 色综合综合网| 日韩精品亚洲人旧成在线| 欧美一区二区福利视频| 国产成人免费| 亚洲精品制服丝袜二区| 亚洲无码在线午夜电影| 国产精欧美一区二区三区| 国产成人高清亚洲一区久久| 欧美成人午夜视频| 精品国产免费观看| 一边摸一边做爽的视频17国产| 亚洲精品成人7777在线观看| 国产精品网拍在线| 日韩在线播放中文字幕| 亚洲三级影院| 国产主播在线观看| 亚洲日韩AV无码一区二区三区人| 国产69精品久久| 久无码久无码av无码| julia中文字幕久久亚洲| 亚洲成人免费在线| 欧美成人精品一级在线观看| 五月天久久综合| 欧美在线综合视频| 亚洲AV电影不卡在线观看| 国产真实乱子伦精品视手机观看 | 亚洲无线视频| 青草视频在线观看国产| 精品無碼一區在線觀看 | 在线观看视频99| 久久精品日日躁夜夜躁欧美| 女人18一级毛片免费观看| 色悠久久综合| 无码视频国产精品一区二区| 91无码人妻精品一区二区蜜桃| 综合色88| 91青青在线视频| 精品无码视频在线观看| 尤物国产在线|