楊鳳生,曾 惜,王元峰,劉 暢,董飛軍,蔡廣林
(1.貴陽供電局,貴州 貴陽 550004;2.廣州思泰信息技術有限公司,廣東 廣州 511493)
鑒于大數據在電力系統的應用場景越來越多,本文對大數據在城市配電網運行狀態評估中的應用進行分析,提出了基于大數據技術的城市配電網運行狀態評估分析方法,利用配電大數據采集、存儲、分析、關聯、預測技術,從海量數據中挖掘、提煉關鍵信息,預測未來一定時刻的運行狀態指標參數,判斷運行可靠性和經濟性水平。
隨著城市化進程的加快,配電網自動化程度越來越高,包括配電自動化系統、調度自動化系統、電網氣象信息系統、電能質量監測管理系統、生產管理系統、地理信息系統、用電信息采集系統、配變負荷監測系統、負荷控制系統、營銷業務管理系統、ERP系統[6]、95598客服系統和經濟社會類數據等數據源,這些數據源的總體狀況如表1所示。
對于配電網安全運行而言,大數據技術的意義不在于海量的數據,而是海量數據中對于配電網安全運行有效的數據,以及這部分數據被持續挖掘所付出的代價能否被電力企業后續發展所承受。

表1 典型配電網數據源特點
基于大數據技術的城市配電網運行狀態評估指標[7]主要包括以下幾個:①安全性評價指標,比如配電系統的頻率、節點電壓水平、主變和線路負載率等指標;②供電能力評價指標,比如容載比、線路間轉供能力等;③可靠性和供電質量[8]評價指標,比如負荷點故障率、系統平均停電頻率、系統平均停電時間、電壓合格率、電壓波動與閃變、三相不平衡度、波形畸變率、電壓偏移和頻率偏差等;④經濟性評價指標,比如線損率和設備利用效率等。
在運行狀態評估指標體系中,指標變量個數多,建模與計算復雜,各指標之間又存在一些冗余信息,逐個分析將增加大量冗余工作。在實際工作中,運用主成分分析法[9],采用離差平方和或方差計算各指標的信息量,將重復或相關性強的指標刪去,從而提取相關性小且能包含絕大部分原信息的少數幾個評估運行可靠性指標,篩選影響系統運行狀態的關鍵元件、重要區域和薄弱環節,縮小評估范圍。
3.2.1 評估指標標準化
運行狀態各指標的量綱不同,需要對各指標參數進行標準化處理。基于配電大數據得到各指標的分布函數,并按式(1)對各指標變量X進行正態分布標準化處理,轉換為對應的正態分布變量Z:
本文以TMS320DM642處理器為核心芯片,攝像頭為前端,農產品服務器為總存儲器,PC機與智能手機為終端設計了農產品生產全過程監控系統。該系統使用視頻/圖像定點數字信號處理器TMS320DM642對視頻信號進行壓縮,使用H.264編碼算法且進行優化,壓縮比能達到200∶1,滿足3G傳輸的理論要求,視頻信號處理系統流程如圖1所示。

3.2.2 建立相關矩陣并計算其特征值
在統計學中,通常用Pearson相關系數σXY[10]來度量2個隨機變量X,Y之間線性相關性的強弱。
n個指標變量Z1,Z2,…,Zn的自相關矩陣R為:

根據各指標變量的自相關矩陣R求得其特征值λ1≥λ2≥…≥λm(m≤n)及特征向量u1,u2,…,um.
3.2.3 確定主成分
按照式(3)(4)求得第i指標變量的方差貢獻率ωi和累計方差貢獻率ρ,即:

根據實際需求,選取累計方差貢獻率最小值。累計方差貢獻率大于所選取的最小值的,就選為主成分fi,主成分的個數p取決于累計方差貢獻率最小值和累計方差貢獻率,前p個主成分F={f1,f2,…,fp}包含了m個原始指標變量所含有的絕大部分信息。
3.2.4 確定主要評估指標
U=[σ(fi,zj)]為主成分因子載荷矩陣,U中的不同數值σ(fi,zj)分別對應第i個主成分fi與原第j個評價指標zj間的相關性系數,其取值為[-1,1],正負號分別代表正相關和負相關,絕對值越大,表明相關性越強。在評估運行狀態時,不需要全部指標的全部信息,只需選取代表主要信息的部分指標即可。因此,可根據載荷矩陣,對p個主成分分別選取|σ(fi,zj)|最大值對應的1個指標zj作為主要評估指標,所得的q個(q≤p)主指標即運行狀態評估的主要指標。
數據挖掘是從大量數據中提取或挖掘出知識或所需要信息的一種技術方法。本文采用關聯分析挖掘方法,從配電網的異構多源數據中挖掘出主要影響因素,用于預測模型的輸入,以減少輸入的維度,加快預測速度。
關聯分析是發現數據間關聯規則的一種數據挖掘模式。關聯規則存在的概率用置信度或可信性來描述,置信度或可信性越高,關聯規則存在的可能性就越大[11]。最小支持度閾值和最小置信度閾值是由用戶按需求定義的,支持度與置信度均大于或等于最小閾值的規則被稱為“強規則”。通過尋找“影響因素-運行可靠性指標”的“強規則”,可以得到影響運行狀態的主要影響因素。
“強規則”挖掘最重要的步驟是從事務數據庫中尋找頻繁項集。Apriori算法是一種常用的挖掘關聯規則的頻繁項集的方法[12]。在Hadoop框架上,將Apriori算法在MapReduce中分布實現,從原始數據中挖掘出全局頻繁項集,再從頻繁項集中生成關聯規則,計算其支持度和置信度,從而挖掘出強規則,實現大數據條件下的并行關聯規則挖掘。
配電網運行狀態預測,是指根據歷史和實時大數據,推測未來一段時間內可行性指標參數的過程。配電系統的運行狀態指標值從現場長期運行記錄的大量統計數據中得出,預測復雜,難以建立影響因素與運行狀態指標值之間的精確解析模型。本文采用人工神經網絡法[13]對運行狀態進行預測,預測流程如圖1所示,具體方法如下。

圖1 基于人工神經網絡的預測流程
基于歷史數據,將3.3節中采用關聯分析挖掘所得的主要影響因素作為人工神經網絡模型的輸入I(T),根據需求選取評估尺度t;基于3.2節中經主成分分析提取的主要評估指標,選取(T+t)時刻的指標值O(T+t)作為輸出,對人工神經網絡進行訓練,得到人工神經網絡預測模型。將實時數據的主要影響因素數據作為人工神經網絡的輸入,即可預測t時間后的運行狀態指標值。
基于不同的預測時間進行指標計算,可得到相應的時限類指標用于不同的場合。時間尺度選為分鐘、小時級,可評估未來幾分鐘或幾小時元件、節點、區域、系統的電壓、潮流是否越限,可用于實時運行控制和風險管控;時間尺度選為天、月或年,可預測區域、系統的切負荷概率與期望、供電可用率等指標,用于檢修、調度等控制與決策或電網規劃。
隨著大數據應用技術的發展,利用現有電網運行數據和氣象環境數據進行設備故障預測成為可能。通過集成各分散系統的信息,規范數據類型,形成豐富的、同質的大數據樣本,對不同類型、不同型號、不同狀態的設備進行故障發生可能性預測,可為電網運檢采取針對性的防護措施提供支持,為電網安全運行、智能電網自愈提供保障。
精準的用電預測結果對于智能配電網的規劃和運行有積極意義。通過對用戶用電行為特征的分析,建立基于大數據的自適應用電預測模型,有可能得到更高精度、更細粒度的預測結果,這有利于電源與負荷協同調度的實現。
在傳統的配電網網架規劃中,由于數據源或數據分析不足,網架優化面臨較大的不確定性,理論上的優化結果往往與實際結果之間存在較大差異。在大數據環境下,海量、多類型、時變基礎數據的引入,可以降低網架優化的不確定性。
不同用戶的負荷特性、用電理念和節電策略之間存在較大差異,導致用戶用電行為模式的多樣性,而分布式電源以及電動汽車等新型設備的接入也將加速這種多樣性的發展。了解用電行為模式的多樣性,有助于從用戶的角度為其量身訂制經濟、合理的用電方案。
電力信息化建設是利用大數據技術,在企業數據共享的平臺下獲取電力企業生產數據、管理數據等有效數據,提煉準確的、有價值的數據,為管理效益、決策能力的提升提供有效幫助。特別是在運行檢修基礎數據不斷積累的前提下,利用大數據分析技術,能對檢修工作進行有效預測,并提供數據支持,從而進一步提升設備的運行管理水平,為運行檢修科學決策提供可靠的數據支持。