常成



摘要:
主動配電網系統結構復雜、DG滲透率高、負荷波動大、控制要求嚴格,運行數據信息呈現出大量、高速、多樣和價值的特點。針對主動配電網大數據處理的問題,依據云計算理論,采用數據挖掘技術和分布并行計算方式,建立了一套PDMiner大數據挖掘平臺的主動配電網安全監測系統模型。分別研究了系統對歷史數據和實時故障數據的處理。研究表明該系統通過對歷史數據的處理可進行風險區域劃分、制定規劃方案、運行狀態評價,通過對故障數據的處理可進行故障分析與處理,并為配電網安全改造提供依據。通過仿真算例驗證了該系統的工作效果。
關鍵詞:
大數據;云計算;數據挖掘;主動配電網;自愈控制
DOI:10.15938/j.jhust.2017.02.012
中圖分類號: TM612
文獻標志碼: A
文章編號: 1007-2683(2017)02-0061-06
Abstract:
Active distribution network system has the characteristics of complex structure, high DG permeability, large load fluctuation, strict control requirements. The data information of operation has the characteristics of high volume, high speed, diversity and value. For active distribution network data processing, according to the theory of cloud calculation, using the data mining technology and distributed parallel computing method, establishing an active distribution network security monitoring system model based on PDMiner large data mining platform. The processing of historical data and real time fault data are studied respectively. Research results show that the system by processing of historical data for risk zoning, development planning, operation state evaluation, by processing of fault data for fault analysis and processing, providing the basis for the distribution network security. The result of the system is verified by the simulation example.
Keywords:big data; cloud computing; data mining; active distribution network; selfhealing control
0引言
隨著配電網架構的日趨復雜和智能電網技術的飛速發展,配電網運行數據呈現出規模性、多樣性、價值性和快速性的特點[1],已經從TB級躍升為PB級,電力大數據的概念也應運而生。電力大數據在電網運行監測、故障診斷與恢復和分布式發電選址定容等方面有著廣泛的應用。
主動配電網(active distribution networks)于2008年國際大電網會議(CIGRE) C6.11研究組提出后已經在世界各地建立示范工程并投入建設實施[2]。主動配電網由于高滲透率DG接入、負荷波動和網架結構復雜等因素,使得對于配電網數據處理的難度顯著增大,尤其是在主動配電網的安全評估和故障診斷方面,若不能有效地對運行和故障數據進行處理,將嚴重影響配電網的安全、可靠性,這也成為主動配電網實現自愈控制的關鍵環節。基于云計算的數據挖掘技術能夠實時并迅速的將配電網中有價值的數據信息提取出來,顯著提高了數據處理的效率。目前,將數據挖掘技術用于配電網運行控制和故障診斷已經取得了一定的研究成果。文[3]研發了一種基于多源異構數據環境的配電網故障信息統計分析系統,通過數據挖掘手段可從不同的業務系統中提取到反映配電網運行狀態的目標數據,極大地提高了配電網的運營效率和管理水平。文[4]將數據挖掘技術應用在主動配電網的全景信息展示系統中,能夠為配電網運行檢修科學決策提供可靠的數據依據。
本文在云計算并行分布式大數據挖掘平臺PDMiner的基礎上研發了一套主動配電網故障監測系統。該系統安裝在主控中心,在配電網正常運行時能夠對實時采集的數據和已有的歷史數據進行篩選、分類和對比,通過對數據的分析處理可以劃分出風險區域、等級;在配電網發生故障時,能夠快速、準確的提取到有價值的故障數據,建立故障信息數據庫,為運行檢修人員制定故障預防和故障恢復策略提供了合理的依據。
1配電網云計算
云計算(cloud computing)采用分布式網絡存儲(distributed network storage)技術和并行效用計算(parallel and utility computing)方式[5],其核心思想是將分散的數據資源聚集在由大量分布式計算機構成的資源共享池中,各應用系統可根據需要隨時獲取相關數據存儲和服務信息[6]。云計算是實現大數據應用的關鍵技術,兩者密不可分。
大量分布式電源的引入和用戶端負荷的復雜多變性使得傳統配電網難以應對龐大的數據資源,無法確保配電網運行的安全性和可靠性。智能配電網和主動配電網打破了傳統電網被動控制模式,不僅在運行控制和網絡優化方面變得主動化、智能化,也在數據處理方面引入了云計算技術使其更加高效化、精確化。“電力云”概念一經提出,便得到了行業內的廣泛認可,國家電網公司也就此制定了云計算技術研究框架,將其應用在軟硬件資源配置和數據中心建設等方面。配電網云計算對配電網內部的計算和存儲資源進行有效整合,顯著提高了電網的交互、處理能力。
配電網的數據主要來源于用戶端、電力企業和外部數據3類[7],3類數據彼此相互制約、相互聯系,共同組成了配電網數據資源庫。但是,在對主動配電網進行事故預防、安全評估、故障診斷和決策制定等方面也面臨著數據的準確性和價值性問題。因此,需要建立以數據挖掘為關鍵技術的配電網數據在線處理系統。
2配電網大數據挖掘平臺
目前的數據分析系統普遍采用的是雙層數據架構(double data structure,DDS),即以數據融合技術為核心的處理外層和以數據挖掘技術為核心的處理內層[8]。數據挖掘技術是根據人為的需要通過統計學觀點和人工智能搜索算法從大數據庫中提取出有價值的、準確的數據信息。
常用的數據挖掘方法有集中式計算、分布式計算和并行計算[9]。集中式計算僅利用一臺計算機系統,難以適應大數據環境,處理效率低,不能提供豐富的圖形用戶界面[10]。與其相對的分布式計算將計算任務分配到不同的計算機中進行,具有很強的資源共享和平衡計算負載能力[11]。并行計算具有更高的計算效率,通過流水線技術和多處理器并發技術實現在計算時間和空間上的并行[12],可同時執行多指令運算和解決多離散問題,顯著縮短了運算時間[13]。分布計算和并行計算是目前最廣泛使用的數據挖掘算法。
PDMiner是一種基于并行分布式系統架構Hadhoop的大數據挖掘平臺,利用其框架內部的HDFS和MapReduce進行數據的存儲和運算處理[14],其中HDFS是建立在大型集群的大數據存儲文件系統,可用于對大數據文件的可靠存儲[15],MapReduce為分布式程序設計模型,使程序具有超大集群的適應能力,為大數據提供了準確高效的并行計算方法[16]。PDMiner主要由UI、MapReduce和HDFS三部分組成,具有異構性、強容錯性、高效性和可靠性等優點。PDMiner的總體框架結構如圖1所示。
HDFS是基于流式的數據訪問方式,可對數據源中的數據進行分布式存儲[17]。MapReduce為PDMiner平臺提供了完備的并行計算系統[18],可以很好地處理決策樹算法的并行問題,提高了算法的執行效率。并行ETL系統可對數據源中的數據進行抽取(extract)、轉換(transform)和加載(load)[19],經過清洗和重構后的數據再通過并行數據挖掘子系統進行并行計算,主要采用并行關聯規則、并行分類和并行聚類3種算法[20]。UI包括工作流子系統和用戶接口子系統,用戶可通過該環節建立所需的數據挖掘任務,算法選擇模塊中包含ETL數據預處理、分類、聚類和關聯規則4種[21]。用戶接口子系統為配電網運行監視人員提供了良好的數據交互界面和結構展示界面,監視人員可對算法的參數進行設置,運算的結果也可通過界面快速、清晰的反饋給監視人員。
3配電網大數據分析平臺
主動配電網系統是一種高維非線性的復雜系統,其內部的數據量主要包含電力流、業務流、故障流。主動配電網的大數據分析平臺包括大數據分析處理模塊、大數據存儲模塊、大數據調度模塊。
數據處理模塊主要完成數據提取、數據挖掘、數據清理等任務,是進行大數據計算分析的核心部分,涉及數據分析和數據處理技術。數據分析的關鍵是并行化處理的數據挖掘技術,將原始數據信息經提煉、加工后轉變為知識流,以對數據的進一步處理進行科學決策,在PDMiner平臺上使用的是MapReduce。數據處理是對數據進行運算,可分為分布式運算、內存運算和流處理運算,PDMiner平臺以分布式運算作為主要的數據運算方式,較適合主動配電網數據采集領域的大規模數據源。
大數據存儲模塊依賴于高效的分布式存儲方式,可將有價值的歷史數據信息保留下來為配電網運行規劃和優化改造提供可靠依據,關鍵技術為數據集成管理技術,PDMiner平臺的數據集成管理采用基于NoSQL數據庫的分布式存儲技術[22],通過將多應用系統的數據源合并來創建一個多功能的應用進程。
數據調度模塊與數據庫進行實時交互,可根據需要調取數據庫中的數據信息,運行監視人員可隨時掌握配電網的實際運行狀況。PDMiner為監視人員提供了良好的人機界面和交互功能,這歸功于先進的數據展現技術,包括歷史流展現、空間信息流展現和可視化應用。
各模塊的工作維持和相互配合需要操作系統軟件和硬件服務器的支撐。主動配電網大數據分析平臺的總體架構如圖2所示。
基于PDMiner平臺的主動配電網安全監測系統主動配電網異于傳統配電網,復雜的拓撲結構、高滲透率的DG接入和間歇性、隨機性變化的負荷都使得配電網的事故發生率大大提高,而主動配電網又對自愈控制體系有著嚴格的要求,需要配備一套安全監測和保護控制系統。
傳統配電網使用的是基于SCADA/EMS的配電網數據在線采集與監視系統。然而在面對電力大數據環境時,該系統無法準確、高效的進行數據提取、數據挖掘、數據整合等流程,不僅對于配電網保護難以實現選擇性、速動性和靈敏性,并且無法根據數據資源庫中的歷史信息對配電網進行安全評估和改造規劃。配電網大數據分析平臺的引入為解決此問題提供了很好的手段。
將PDMiner大數據挖掘平臺配置在主動配電網數據在線采集與監視系統中,建立一套針對主動配電網的安全監測系統。該系統采用分層分布式的控制方式,由數據源層、算法模型層、數據分析與處理層、安全評估與故障處理層和業務應用層組成,如圖3所示。數據源層是主動配電網輸入到該系統中的數據來源,主要是用戶端數據、電力企業數據和外部數據,系統可根據需要從3種數據庫中提取相應的歷史和實時數據信息。算法模型層為配電網各安全監測任務提供算法引擎,包括故障診斷與隔離、故障分析、風險區域劃分、系統運行評價和系統優化策略,可使其在進行并行計算時調用相應的算法函數進行針對性處理。數據分析與處理層為PDMiner大數據挖掘平臺,是進行數據分析與處理的核心設備。安全評估與故障處理層根據分析后的故障數據信息建立相應的數據庫。業務應用層根據數據庫中的數據信息對故障進行處理和制定系統優化方案。故障診斷與隔離模塊可將故障區段快速隔離出配電網;故障分析模塊可根據相應的算法理論判斷出故障相、故障類型、故障原因和測定出故障距離,這兩個模塊為配電網故障處理與供電恢復提供了可靠的依據。系統改造與規劃部分中的風險區域劃分與識別模塊可在配電網正常運行下按照風險等級劃分出不同區域;系統運行狀態評價模塊對配電網系統的實時運行狀況進行安全評估,并通過人機交互界面展現給監控人員;系統優化方案制定模塊為配電網安全系統升級改造提供了最佳方案。
基于PDMiner平臺的主動配電網安全監測系統在配電網系統正常運行時可根據歷史數據信息劃分出配電網的風險區域,對各區域的風險狀況進行評估。當配電網某處發生故障時,系統可對采集到的故障信息進行提取、挖掘、清理和加工,并根據數據分析處理報告了解到故障的相關信息,為故障處理提供依據,并可根據該數據信息制定出配電網改造與規劃方案。其具體工作流程如圖4所示。
5仿真研究
分別選取單機IEEE33標準測試系統和New England10機39節點標準測試系統進行仿真分析。將基于PDMiner平臺的主動配電網安全監測系統配置在兩種主動配電網系統的主站控制中心。
如圖5所示的含有高滲透率DG的IEEE33主動配電網系統,選取貴州某地區2013年用戶負荷情況、光伏電站DG出力情況和配電網故障情況的歷史數據信息作為源數據,將其輸入到PDMiner平臺的安全監測系統中。根據事故發生率和配電網運行狀況將主動配電網系統分為7個區域,各區域的故障發生率按從大到小排列為區域1、區域2、區域3、區域4、區域5、區域6、區域7,根據各區域的歷史故障信息數據可得到主動配電網運行的總體評價報告和最佳優化方案,比如事故高發區域1中的80%的故障是由自然因素雷擊造成的,故應重點改造防雷裝置。若要興建醫院、政府機關等一類負荷場所,應優先考慮安全性高的區域,如區域7。主要涉及安全狀況評估、重點改造方向、新建設施建議、DG選址定容、配電網規劃等方面。
當配電網某處發生故障時,如母線4、5間距離4母線10km處。PDMiner接收到饋線上的數據采集裝置(如FTU)采集到的實時數據信息,然后對其進行挖掘處理,對得到的有價值的數據信息進行故障分析,其分析結果如表1所示。〖HJ5mm〗〖FL)〗〖HJ〗
現將故障數據輸入到未使用PDMiner平臺的SCADA/EMS的配電網數據采集與監視控制系統中,可得到的故障分析和處理結果如表2所示。
由表2可知,SCADA/EMS對于數據的處理效果遠不及PDMiner平臺的安全監測系統。開關動作時間長,故障測距結果誤差大,所直接得到的故障信息匱乏,大部分信息的獲得要靠運檢人員的經驗、翻閱相關事故報告和現場巡視,不能為檢修人員提供科學合理的故障處理措施,也延長了供電恢復的時間。
如圖6所示為含有高滲透率DG的New England10機39節點主動配電網系統,選取甘肅某地區2013年用戶負荷情況、風電場DG出力情況和配電網故障情況的歷史數據信息作為源數據,將其輸入到PDMiner平臺的安全監測系統中。此時可將該系統劃分成6個風險區域,編號原則同IEEE33系統,即區域6安全性最好,區域1故障率最高。
PDMiner根據相關故障歷史數據制定出各區域和整個配電網的規劃改造方案、運行評價報告等,具體涉及內容同IEEE33系統。現令故障發生在區域2距離22母線15km處,再分別對PDMiner平臺安全監測系統和SCADA/EMS系統的故障分析和處理結果進行對比,如表3和表4所示。
由表3和表4可知,PDMiner平臺安全監測系統可為監控中心提供有關New England系統的完備故障信息,故障隔離時間和故障測距精度都比SCADA/EMS系統要高很多。
6結語
主動配電網系統結構復雜、DG滲透率高、負荷波動大、控制更加主動化、智能化,需要具備較強的大數據分析處理能力。結合配電網云計算和大數據挖掘技術,提出設計一套PDMiner平臺的主動配電網安全監測系統。該系統可根據數據源輸入的歷史數據對配電網運行狀態進行評估,劃分出風險區域并提供最優規劃方案。配電網故障時可提取到價值性高的故障信息數據,快速、準確的切除故障并對故障進行相關分析,制定出合理的故障處理方案和安全改造策略。該系統進一步完善了SCADA/EMS的性能,監控中心可隨時掌握配電網的運行狀況,并極大的方便了檢修人員對于故障的處理,為配電網安全系統升級改造、配電網規劃設計提供了有力的科學依據。
參 考 文 獻:
[1]張東霞,苗新,劉麗平,等. 智能電網大數據技術發展研究[J]. 中國電機工程學報,2015(1):2-12.
[2]趙波,王財勝,周金輝,等. 主動配電網現狀與未來發展[J]. 電力系統自動化,2014(18):125-135.
[3]宋杰,謝海寧,楊增輝,等. 基于多源異構數據挖掘的配電網故障信息統計分析[J]. 電力系統保護與控制,2016(3):141-147.
[4]劉俊勇,黃媛,劉友波,等. 基于數據挖掘的主動配電網全景信息展示系統[J]. 供用電,2015(9):13-17.
[5]林闖,蘇文博,孟坤,等. 云計算安全:架構、機制與模型評價[J]. 計算機學報,2013(9):1765-1784.
[6]鄧維,劉方明,金海,等. 云計算數據中心的新能源應用:研究現狀與趨勢[J]. 計算機學報,2013(3):582-598.
[7]劉科研,盛萬興,張東霞,等. 智能配電網大數據應用需求和場景分析研究[J]. 中國電機工程學報,2015(2):287-293.
[8]李德仁,張良培,夏桂松. 遙感大數據自動分析與數據挖掘[J]. 測繪學報,2014(12):1211-1216.
[9]宛婉,周國祥. 基于并行抽樣的海量數據關聯挖掘算法[J]. 合肥工業大學學報(自然科學版),2013(8):933-937.
[10]應毅,任凱,劉正濤. 基于云計算技術的數據挖掘[J]. 微電子學與計算機,2013(2):161-164.
[11]焦潤海,王景兵,林碧英. 配電網高級應用分布式計算平臺通信架構設計[J]. 電力系統自動化,2013(22):66-72.
[12]潘巍,李戰懷. 大數據環境下并行計算模型的研究進展[J]. 華東師范大學學報(自然科學版),2014(5):43-54.
[13]黃偉,龐琳,曹彬,等. 基于數據級任務分解的配電網分布式并行計算平臺[J]. 電網技術,2014(4):1103-1108.
[14]何清,莊福振,曾立,等. PDMiner:基于云計算的并行分布式數據挖掘工具平臺[J]. 中國科學:信息科學,2014(7):871-885.
[15]廖彬,于炯,張陶,等. 基于分布式文件系統HDFS的節能算法[J]. 計算機學報,2013(5):1047-1064.
[16]宋杰,劉雪冰,朱志良,等. 一種能效優化的MapReduce資源比模型[J]. 計算機學報,2015(1):59-73.
[17]孟祥萍,周來. 基于hadoop云平臺的智能電網HDFS資源存儲技術研究[J]. 電測與儀表,2014(19):24-30.
[18]劉義,景寧,陳犖,等. MapReduce框架下基于R-樹的k-近鄰連接算法[J]. 軟件學報,2013(8):1836-1851.
[19]宋杰,郝文寧,陳剛,等. 基于MapReduce的分布式ETL體系結構研究[J]. 計算機科學,2013(6):152-154.
[20]楊來,史忠植,梁帆,等. 基于Hadoop云平臺的并行數據挖掘方法[J]. 系統仿真學報,2013(5):936-944.
[21]張鵬,王桂玲,徐學輝. 云計算環境下適于工作流的數據布局方法[J]. 計算機研究與發展,2013(3):636-647.
[22]申德榮,于戈,王習特,等. 支持大數據管理的NoSQL系統研究綜述[J]. 軟件學報,2013(8):1786-1803.
(編輯:溫澤宇)