彭葛樺
(1.國網江西省電力有限公司培訓中心,江西 南昌 330006;2.江西電力職業技術學院供用電工程學院,江西 南昌 330032)
隨著智能電網規模的擴大和輸出負荷量的提升[1],在運行過程中,電網難免會發生故障,如輸電電線故障、變壓器故障、母線故障等。這些故障發生后,電力系統中的負荷分布、線損情況等均會發生變化[2-3]。這會對用電信息的判斷造成較大影響,使電力系統無法精準掌握用電需求,導致用電規劃的合理性降低。因此,電力系統進行終端用電規劃的關鍵在于有效地采集和管理電網故障下的用電信息[4]。數據融合是1種常用的信息處理方法。數據融合是將采集的多源信息進行聯合處理[5],以獲取更為全面、完整的信息。由于電力系統結構復雜,運行數據具有動態變化特性,并且電力系統在故障情況下所產生的信息具有一定的隨機性和變化性[6],導致用電信息的融合效果較差。為實現信息的智能融合,文獻[7]利用深度反向傳播(back propagation,BP)神經網絡的非線性學習能力,實現信息智能融合。但是在應用過程中,如果存在較多動態數據,則其融合誤差較大。為實現多源數據的融合、避免發生數據之間的沖突,文獻[8]基于差異信息量,提出相關多源數據融合方法,以實現多源數據的精準融合。但是該方法在應用過程中難以對數據中的異常數據進行處理。
為此,本文基于數據驅動、采用用電信息采集智能融合技術對電網多源故障展開研究。數據驅動是通過計算或者互聯網等相關軟件技術,對海量數據進行處理,以完成數據的整合和提煉。數據驅動在整合過程中以啟發式規則為依據,能夠建立數據之間的關聯。其具有顯著的自動化特點[9]。通過數據驅動對數據進行處理,能提升原始信息涵蓋的內容,并且保證數據的融合質量。
本文針對電網多源故障用電信息的特點和采集需求,提出基于數據驅動的電網多源故障用電信息采集智能融合技術。電網多源故障用電信息采集智能融合技術框架如圖1所示。

圖1 電網多源故障用電信息采集智能融合技術框架
由圖1可知,電網多源故障用電信息采集智能融合技術以數據驅動技術為核心,構建多源用電信息融合框架。該框架整體包含在線運行機制和離線運行機制這2個部分。
①在線運行機制。在線運行機制的主要作用是通過相關智能算法對用電數據實施分類,并完成特征提取。該機制能夠結合多源數據的特性,較好地完成數據處理。
②離線運行機制。離線運行機制對應數據驅動引擎的模型操作策略調整功能。其主要是依據數據驅動實現多源數據的融合,并且對融合結果進行評價;依據評價結果調整融合策略,以確保最佳的融合效果。
1.2.1 多源用電信息分類
電網中智能終端的用電信息在采集和傳輸過程中,會存在數據部分丟失或者損壞的情況[10]。除此之外,終端用戶的用電習慣等存在一定差異。用電采集過程中,獲取的數據有靜態和動態這2種,并且數據的分布呈現不平衡狀態。因此,在進行多源用電信息融合時,需先通過在線機制對用電信息進行分類處理。本文將先驗知識和深度玻爾茲曼機(deep Boltzmann machine,DBM)相結合,形成基于先驗知識和DBM的采樣模型,并依據該模型完成多源用電信息分類。多源用電信息分類模型結構如圖2所示。

圖2 多源用電信息分類模型結構
圖2所示的多源用電信息分類模型以從電網側采集到的原始用電數據為基礎,在完成對數據的初步篩選后,對其中的小樣本數據執行采樣以及復制這2種處理。在此基礎上,模型通過DBM網絡對小樣本數據執行解耦和編碼處理,從而建立編碼數據集。復制處理主要是通過DBM網絡對新數據進行編碼處理后,對該數據和原始數據進行縱向拼接操作,以獲取用電的擴充數據[11]。本文依據該數據進行極限學習機網絡的訓練,以實現用電數據的分類處理。
本文設原始數據為D=[d1,d2,…,d48]∈R1×48、第i個采集點采集的用電數據為di、數據行向之間的相關系數矩陣為R、DBM網絡的可視層節點數量為48。本文對D進行篩選處理,在獲取其中的小樣本數據后,將獲取的采樣數據用Ds表示。D和Ds通過DBM網絡進行訓練學習后,輸出分別為Dt和Dst。兩者具有相同的維度,并且耦合度較低。采用縱向拼接的方式對兩者進行處理,可獲取D的采樣數據結果DST。
(1)
多源用電信息分類詳細步驟如下。
①在獲取D的訓練樣本后對樣本實施歸一化處理,得到其中的小樣本數據。
②將小樣本數據輸入DBM網絡,通過該網絡的學習和訓練,輸出用于測試的數據DS。依據該數據進行極限學習機網絡的訓練,可實現用電數據分類,并形成靜態數據集和動態數據集。
1.2.2 多源數據特征提取
通過上述步驟完成多源用電信息的分類處理后,本文對靜態和動態這2種數據集進行特征提取。本文通過數據驅動的互信息原理完成特征提取。
互信息用于描述2個隨機變量之間的相關性。本文令X、Y分別表示靜態數據集和動態數據集。兩者之間的互信息計算式為:
(2)
式中:p(x,y)為X和Y之間的聯合概率密度函數;p(x)和p(y)均為邊緣概率密度函數,分別對應X和Y。
本文基于互信息提取X和Y的特征量。提取結果為:
(3)
式中:X0為初始特征量;X′為維度為m的特征量。
依據式(3)即可獲取最大化的互信息結果,從而在保證類別不發生變化的基礎上完成特征選擇。本文為保證互信息的最大化,采用分解的方式對多維互信息進行處理,以形成一維互信息。I(X,Y)的計算式為:


(4)
式中:Xi與Yj為X和Y數據集的已選特征。
本文在式(2)~式(4)的基礎上,實現用電信息特征集的快速提取。
初始變量選擇為:
(5)
第二變量選擇為:

(6)
依據式(5)和式(6)即可完成剩余變量的選擇。每次選擇依據互信息最大的原則進行下一個特征的選擇;在進行選擇時,設定閾值N。當循環次數達到該閾值時選擇停止。通過本文技術獲取的特征集具有特征信息完整、特征的類別不會發生改變的優點。
本文通過1.2節完成多源用電信息特征集提取后,依據數據驅動技術,通過離線機制獲取特征集,從而進行用電信息的一致性融合。
用電信息的采集是通過多源采集方式完成的。該方式采集的信息具有明顯的冗余特點[12]。因此,提取的特征集也存在一定的冗余特征。本文為保證較好的用電信息融合效果,對提取的特征集進行匯總,使其均位于源節點內,并通過卡爾曼濾波算法對特征集中的冗余特征進行處理,在此基礎上完成用電數據的一致性融合。用電數據的融合方法結構如圖3所示。

圖3 用電數據的融合方法結構
本文將提取的多源特征集均匯集至源節點,采用卡爾曼濾波方法去除特征集中的冗余信息。以X′類特征集為例,使用卡爾曼濾波對特征集進行處理時,在(t+1)時刻的濾波計算式為:
xt+1=Ftxt+Γtwt
(7)
式中:Ft為卡爾曼濾波系數;Γt為Ft的加權平均值;wt為權重比例。

(8)
式中:E為最優期望函數;γ為所有用電信息特征之和。

(9)
式中:n為特征數量。
本文采用εq和ξ(z)表示用電數據集合中的任意誤差和標準差。
(10)
(11)
依據εq和ζ(z)的計算結果即可獲取用電信息特征數據的分布規律,從而可在融合過程中刪除其中異常特征數據,并進行一致性融合。此時,每個源節點的測量值滿足正態分布規律。本文在融合過程中引入融合節點支持程度理念。如果節點p對節點q的支持程度用Ψqp表示,則有:
(12)
式中:ξqp為節點p和節點q之間的標準差。
以此確定的融合節點之間的支持度關系矩陣ΨN×N為:
(13)
本文依據融合節點之間的ΨN×N結果實現用電信息的一致性特征描述,從而完成用電信息融合。
為驗證基于數據驅動的電網多源故障用電信息采集智能融合技術的應用效果,本文選擇某電力企業采集的電網側420個用電終端的數據作為試驗測試數據。該數據的采集時間間隔為0.5 h、連續采集時間為7 d。該數據中包含用電終端的動態和靜態2種數據。
試驗參數設定如下:DBM網絡隱含層節點數量為30個;分類器的節點數量為60個;學習率為0.001。
為驗證本文技術對于多源用電信息的分類效果,本文采用戴維森堡丁指數(Davies-Bouldin index,DBI)作為評價指標。該指標可以反映數據之間的的緊密程度。其取值范圍為[0,1]。數值越小,表示聚類效果越好。DBI的計算式為:
(14)

在不同的數據維度下,本文依據式(14)計算應用本文技術后的DBI指標測試結果。
通電信息分類性能測試結果如表1所示。

表1 通電信息分類性能測試結果
由表1可知:在不同的數據維度下,隨著數據數量的逐漸增加,通過本文技術進行用電信息分類后,DBI的測試結果均在0.017及以下。因此,本文技術具有較好的用電數據分類性能,能夠可靠完成用電數據的分類。
為了進一步分析本文技術的數據分類效果,測試采用本文技術對采集的用電信息進行分類處理后,獲取數據的分類結果。該結果通過二維空間進行呈現。用電信息分類結果如圖4所示。

圖4 用電信息分類結果
由圖4可知:應用本文技術后,能夠在二維空間內對動態數據和靜態數據進行有效分類,并且類別之間的界線顯著,沒有發生重疊以及錯誤分類情況。因此,本文技術的用電數據分類效果良好。
本文技術在進行用電數據融合的過程中,對數據進行異常數據處理。處理效果直接影響數據的融合結果。因此,本文將變異系數λ作為測試指標,以衡量經本文技術處理后數據的離散程度。λ的計算式為:
(15)

λ的數值越大,表示數據的離散程度越高,說明數據特征處理效果越差。其取值范圍在0~1之間。
依據式(15)計算本文技術應用前后在不同的數據殘差率下的λ計算結果。異常數據處理效果測試結果如表2所示。

表2 異常數據處理效果測試結果
由表2可知:隨著數據殘差率的逐漸增加,本文技術對動態數據和靜態數據進行異常處理后,λ的計算結果均在0.020以下。其中,最大值為0.019。這是由于本文技術在進行異常用電數據處理時,依據用電數據集合中的任意誤差和標準差完成數據處理。這樣可保證較好的處理效果。
為驗證本文技術的應用性,測試采用本文技術對用電信息進行融合處理后,依據處理后的用電信息對電網正常運行和故障運行這2種情況下的用電需求進行預測,并獲取其分析結果。
用戶用電需求預測結果如圖5所示。由圖5可知:隨著用電用戶數量的逐漸增加,在電網正常運行和故障運行這2種情況下,均可依據本文的用電信息融合結果完成用電需求的預測,并且預測結果與實際需求結果吻合程度較高。這為電網的能源規劃提供可靠依據。

圖5 用戶用電需求預測結果
為進一步驗證本文技術的應用性,測試根據本文技術的用電信息融合結果,對異常用電進行識別,從而獲取電網中異常用電的識別結果。異常用電識別結果如圖6所示。
由圖6可知:依據本文技術融合的用電信息,能夠完成終端用戶用電量的統計,并且獲取統計結果中的異常用電結果。凌晨5:00屬于用電低谷時刻,但卻產生較大的用電量。18:00屬于用電高峰時刻,卻出現用電量下降情況。因此可判定這2個時刻屬于異常用電時刻,從而實現對異常用電的識別。該結果證明本文技術具有較好的應用性。融合后用電信息能夠為電網的用電規劃以及竊電監測提供可靠依據。
電網的用電信息對于電網用電規劃、竊電監測、用電需求預測等均具有重要意義。用電信息在采集過程中具有顯著的時間序列特征,并且會受到電網運行狀態的影響。因此,本文提出基于數據驅動的電網多源故障用電信息采集智能融合技術。本文對該技術的應用效果展開相關測試。測試結果顯示:本文所研究的融合技術具有較好的用電信息融合效果,并且在融合過程中能夠有效處理信息中的冗余數據和異常數據;依據融合后的用電信息可精準預測用戶的用電需求以及識別異常用電行為,應用性良好。