張浩海,王昊,丁耀杰
(北京中電普華信息技術(shù)有限公司,北京 100000)
電力物聯(lián)網(wǎng)應(yīng)用于電力系統(tǒng)發(fā)電、輸電等全部環(huán)節(jié)中,電能數(shù)據(jù)具有極強(qiáng)的周期性[1],利用歷史數(shù)據(jù)作為電能數(shù)據(jù)缺失修復(fù)方法的依據(jù),對于電能數(shù)據(jù)修復(fù)具有重要意義。DA(Data Augmentation)多重插補(bǔ)法通過缺失電能數(shù)據(jù)的可能分布值修復(fù)缺失數(shù)據(jù)。DA 多重插補(bǔ)法結(jié)合觀測數(shù)據(jù)與數(shù)據(jù)的先驗數(shù)據(jù)實現(xiàn)數(shù)據(jù)修復(fù)。該文提出基于DA 多重插補(bǔ)法和電力物聯(lián)網(wǎng)的電能數(shù)據(jù)缺失修復(fù)方法,提升電力物聯(lián)網(wǎng)中海量電能數(shù)據(jù)的應(yīng)用性能。
電力物聯(lián)網(wǎng)的總體結(jié)構(gòu)圖如圖1 所示。

圖1 電力物聯(lián)網(wǎng)總體結(jié)構(gòu)圖
通過圖1 電力物聯(lián)網(wǎng)的總體結(jié)構(gòu)圖可以看出,電力物聯(lián)網(wǎng)的各個環(huán)節(jié)共同作用,實現(xiàn)電力物聯(lián)網(wǎng)在電力系統(tǒng)中的良好應(yīng)用。電力物聯(lián)網(wǎng)利用感知層的設(shè)備終端采集電能信息,處理電能信息相關(guān)數(shù)據(jù)[2-4]。電力物聯(lián)網(wǎng)的通信層,利用移動通信技術(shù)等網(wǎng)絡(luò)設(shè)施,對感知層采集的信息進(jìn)行數(shù)據(jù)接入與傳輸。平臺層將所采集的電能信息整合處理,平臺層具有存儲數(shù)據(jù)、缺失電能數(shù)據(jù)修復(fù)、檢索數(shù)據(jù)以及保護(hù)電力系統(tǒng)的數(shù)據(jù)資源安全性的功能。應(yīng)用層接收用戶提交請求后,從平臺層調(diào)取數(shù)據(jù),利用平臺層分析處理后的數(shù)據(jù),為用戶提供服務(wù)。電力物聯(lián)網(wǎng)利用感知層的電能數(shù)據(jù)采集終端采集電能數(shù)據(jù)。電力物聯(lián)網(wǎng)運(yùn)行過程,是采集電能數(shù)據(jù)、傳輸電能數(shù)據(jù)與處理電能數(shù)據(jù)的過程[5-7]。電能數(shù)據(jù)的完整性與可靠性是電力物聯(lián)網(wǎng)可靠運(yùn)行的重要前提。電力系統(tǒng)在數(shù)據(jù)感知與處理過程中,容易出現(xiàn)數(shù)據(jù)缺失情況,數(shù)據(jù)缺失對于電力系統(tǒng)電能數(shù)據(jù)的實際應(yīng)用具有重要影響。數(shù)據(jù)缺失將導(dǎo)致很多業(yè)務(wù)無法順利開展。如電能數(shù)據(jù)中的電壓波形數(shù)據(jù)丟失時,無法精準(zhǔn)識別電能質(zhì)量干擾情況,無法精準(zhǔn)定位電力系統(tǒng)故障信息[8-9]。及時修復(fù)電力物聯(lián)網(wǎng)中的電能缺失數(shù)據(jù),對于保障電力系統(tǒng)中業(yè)務(wù)正常運(yùn)行、利用完整數(shù)據(jù)建設(shè)電力物聯(lián)網(wǎng)具有重要意義。
利用EM 插補(bǔ)算法對電能物聯(lián)網(wǎng)中的電能數(shù)據(jù)的缺失值進(jìn)行初始插補(bǔ)處理。EM(Expectation-Maximum)算法即期望最大化算法,該算法利用極大似然估計方法,估計給定的電能觀測數(shù)據(jù)。假設(shè)X為電力物聯(lián)網(wǎng)中電能數(shù)據(jù)的觀測數(shù)據(jù)集,Y為電力物聯(lián)網(wǎng)中的缺失電能數(shù)據(jù)集,電力物聯(lián)網(wǎng)中包含缺失電能數(shù)據(jù)的全部電能數(shù)據(jù)集Z=(X,Y),該電能數(shù)據(jù)集Z的概率密度函數(shù)表達(dá)式為:
式中,p為缺失電能數(shù)據(jù)的概率,θ為電能數(shù)據(jù)概率密度函數(shù)的缺失電能數(shù)據(jù)參數(shù),x、y、z分別為電力物聯(lián)網(wǎng)中電能數(shù)據(jù)集X、Y、Z中的數(shù)據(jù)。缺失電能數(shù)據(jù)y的假設(shè)、缺失電能數(shù)據(jù)參數(shù)θ的初始估計值、缺失電能數(shù)據(jù)y與觀測電能數(shù)據(jù)變量及電能數(shù)據(jù)邊緣密度函數(shù)p(x|θ)間的關(guān)聯(lián),是決定電能數(shù)據(jù)概率密度函數(shù)p(z|θ)的重要因素。依據(jù)式(1),獲取電力物聯(lián)網(wǎng)中全部電能數(shù)據(jù)集的似然函數(shù)表達(dá)式為:
式中,L為電能物聯(lián)網(wǎng)中全部電能數(shù)據(jù)集似然函數(shù)的似然性。考慮到電力物聯(lián)網(wǎng)中,缺失的電能數(shù)據(jù)存在未知性[10],因此似然函數(shù)L(θ|Z)是依據(jù)缺失電能數(shù)據(jù)Y產(chǎn)生的隨機(jī)數(shù)。為提升似然函數(shù)估計的準(zhǔn)確性,假設(shè)缺失電能數(shù)據(jù)變量為不完全隨機(jī)缺失[11-12],即該類電能數(shù)據(jù)的缺失依賴于其他完全電能數(shù)據(jù)的變量。
給定觀測數(shù)據(jù)集X與缺失電能數(shù)據(jù)參數(shù)θ的初始估計值后,利用EM 算法的E 步驟與M 步驟對電力物聯(lián)網(wǎng)中的缺失電能數(shù)據(jù)進(jìn)行挖掘。E 步驟是計算與完全電能數(shù)據(jù)對數(shù)似然函數(shù)lnp(X,Y|θ)關(guān)聯(lián)的缺失數(shù)據(jù)集Y的期望。完全電能數(shù)據(jù)對數(shù)似然函數(shù)期望的表達(dá)式為:
式中,θi表示現(xiàn)有已知參數(shù)的估計值。其中,Y中的數(shù)據(jù)服從y→f(y|X,θi)分布。
似然函數(shù)h(θ,Y)的最優(yōu)化表達(dá)式如下:
式(4)可以轉(zhuǎn)化如下:
式中,f(y|X,θi)表示電力物聯(lián)網(wǎng)中電能缺失數(shù)據(jù)y的邊緣密度函數(shù),參數(shù)θi和觀測數(shù)據(jù)對邊緣密度函數(shù)影響較大。
存在式(6)的函數(shù):
參數(shù)θ與因子f(X|θi)無直接關(guān)聯(lián),電力物聯(lián)網(wǎng)中電能數(shù)據(jù)缺失修復(fù)過程中,將f(y|X,θi) 利用f(y,X|θi) 代替,對式(4)的似然函數(shù)最優(yōu)化不存在影響。
利用EM 算法對電力物聯(lián)網(wǎng)中的電能數(shù)據(jù)進(jìn)行插補(bǔ)處理的第二步M 步驟,通過搜尋θi+1,將期望值g(θ|θi,X)進(jìn)行最大化處理,令θi+1值滿足以下公式:
式中,Θ 表示參數(shù)空間。
EM 算法依據(jù)算法參數(shù)與電力物聯(lián)網(wǎng)中缺失電能數(shù)據(jù)間的關(guān)系,插補(bǔ)缺失數(shù)據(jù)。電能缺失數(shù)據(jù)已知,算法參數(shù)未知時,算法參數(shù)可以利用電能缺失數(shù)據(jù)估計;算法參數(shù)已知時,利用算法參數(shù)可以精準(zhǔn)估計電能缺失數(shù)據(jù)。假設(shè)可以利用算法參數(shù)估計電能缺失數(shù)據(jù),利用電能缺失數(shù)據(jù)修復(fù)算法參數(shù)[13-14]。重復(fù)迭代以上過程,直至算法參數(shù)為收斂狀態(tài),利用收斂的算法參數(shù)獲取電力物聯(lián)網(wǎng)中的缺失電能數(shù)據(jù)。EM 算法利用重復(fù)迭代過程,獲取極大似然估計結(jié)果。數(shù)據(jù)重復(fù)迭代過程,可以增加似然函數(shù)值,同時將似然函數(shù)值快速收斂至局部極大值,該算法具有較高的穩(wěn)定性,計算簡便。
將利用EM算法獲取的電力物聯(lián)網(wǎng)缺失電能數(shù)據(jù)初始插補(bǔ)結(jié)果[15-16],作為DA 多重插補(bǔ)法的插補(bǔ)初始值,獲取最終電能數(shù)據(jù)缺失修復(fù)結(jié)果。DA多重插補(bǔ)法充分考慮電力物聯(lián)網(wǎng)中電能數(shù)據(jù)的時間序列,利用局部加權(quán)回歸模型修復(fù)電力物聯(lián)網(wǎng)的缺失電能數(shù)據(jù)。用φ0表示包含利用EM 算法獲取缺失電能數(shù)據(jù)初始插補(bǔ)結(jié)果的初始觀測數(shù)據(jù),DA 多重插補(bǔ)法修復(fù)電力物聯(lián)網(wǎng)缺失電能數(shù)據(jù)的觀測方程表達(dá)式如下:
缺失電能數(shù)據(jù)修復(fù)的狀態(tài)方程表達(dá)式如下:
式中,Yt與φt分別觀測向量以及期望向量,vt與wt分別表示觀測誤差與狀態(tài)誤差。DA 多重插補(bǔ)法采用動態(tài)正態(tài)模型,更好的修復(fù)缺失電能數(shù)據(jù)。相對于φt-1,φt存在一個狀態(tài)誤差,狀態(tài)誤差序列wt與觀測誤差序列vt為互相獨立狀態(tài)。
DA 多重插補(bǔ)法利用局部加權(quán)回歸模型,更新電能數(shù)據(jù)狀態(tài),修復(fù)電力物聯(lián)網(wǎng)內(nèi)海量電能數(shù)據(jù)的缺失數(shù)據(jù)。局部加權(quán)回歸模型可以靈活地探索不同變量間的關(guān)系。利用局部加權(quán)回歸模型修復(fù)電力物聯(lián)網(wǎng)的缺失電能數(shù)據(jù)時,對電能數(shù)據(jù)φt進(jìn)行局部多項式估計處理,構(gòu)建一元非參數(shù)回歸模型表達(dá)式如下:
式中,yt與m(φt) 分別表示實際電能數(shù)據(jù)以及模型預(yù)測值,ut表示隨機(jī)誤差項。電能數(shù)據(jù)缺失修復(fù)時,隨機(jī)誤差項的期望值為0。
設(shè)m(φt) 表示電力物聯(lián)網(wǎng)電能數(shù)據(jù)φ0附近的p+1 階導(dǎo)數(shù)。數(shù)據(jù)φ0的鄰域表達(dá)式如下:
一元非參數(shù)回歸模型的加權(quán)誤差平均和需要滿足以下公式:
式中,wt表示模型的權(quán)重,t=1,2,…,T,表示局部加權(quán)時間參數(shù)。
式(13)中的穩(wěn)健權(quán)數(shù)表達(dá)式如下:
式中,c表示固定時間段內(nèi),電力物聯(lián)網(wǎng)電能數(shù)據(jù)的中值函數(shù)。
利用穩(wěn)健權(quán)數(shù)ξ對模型參數(shù)估計,獲取最新預(yù)測誤差值et。依據(jù)誤差最小化原則,獲取電力物聯(lián)網(wǎng)電能數(shù)據(jù)缺失值修復(fù)的插補(bǔ)值,完成電力物聯(lián)網(wǎng)的電能數(shù)據(jù)缺失修復(fù)。
為了驗證所研究方法修復(fù)電力物聯(lián)網(wǎng)的缺失電能數(shù)據(jù)有效性,選取某電力企業(yè)作為研究對象。該電力企業(yè)利用電力物聯(lián)網(wǎng)為用戶提供服務(wù),電力物聯(lián)網(wǎng)缺失電能數(shù)據(jù)修復(fù)性能決定電力企業(yè)對用戶的服務(wù)性能。選取該電力企業(yè)供電區(qū)域的某用戶的電流數(shù)據(jù)作為研究對象。采集該用戶2019年12月1日-12 月31 日的用電電流數(shù)據(jù),該用戶A 相、B 相以及C相三相電流的額定電流為4 A,電能數(shù)據(jù)缺失值的取值區(qū)間為[0,4]。用戶的電流數(shù)據(jù)具有極強(qiáng)的周期性,缺失電能數(shù)據(jù)修復(fù)有助于分析用戶用電情況。
電力物聯(lián)網(wǎng)的感知層利用電能數(shù)據(jù)采集終端,采集該用戶的三相電流原始數(shù)據(jù),如表1 所示。

表1 用戶原始三相電流數(shù)據(jù)
通過表1 電能數(shù)據(jù)采集結(jié)果可以看出,電力物聯(lián)網(wǎng)利用感知層采集的用戶電能數(shù)據(jù)中的三相電流數(shù)據(jù)中,存在明顯的缺失數(shù)據(jù),影響電能數(shù)據(jù)在電力物聯(lián)網(wǎng)中的應(yīng)用。利用文中電力物聯(lián)網(wǎng)電能數(shù)據(jù)缺失修復(fù)方法,精準(zhǔn)修復(fù)用戶缺失的三相電流數(shù)據(jù),提升電力物聯(lián)網(wǎng)的應(yīng)用性能。
利用EM 插補(bǔ)算法,依據(jù)所采集的電力物聯(lián)網(wǎng)電能數(shù)據(jù),插補(bǔ)計算缺失的電能數(shù)據(jù)。EM 算法獲取缺失數(shù)據(jù)的初始插補(bǔ)結(jié)果如表2 所示。

表2 缺失電能數(shù)據(jù)初始插補(bǔ)結(jié)果
通過表2 實驗結(jié)果可以看出,采用文中方法可以有效利用EM 插補(bǔ)算法,獲取電力物聯(lián)網(wǎng)中,該用戶三相電流數(shù)據(jù)中的電流插補(bǔ)數(shù)據(jù)。將利用EM 插補(bǔ)算法獲取的缺失電能數(shù)據(jù)插補(bǔ)結(jié)果,作為DA 多重插補(bǔ)法的初始值。DA 多重插補(bǔ)法依據(jù)初始插補(bǔ)數(shù)據(jù)對缺失電能數(shù)據(jù)進(jìn)行多次插補(bǔ)。DA 多重插補(bǔ)法的插補(bǔ)結(jié)果如圖2 所示。

圖2 DA多重插補(bǔ)法的插補(bǔ)結(jié)果
通過圖2 實驗結(jié)果可以看出,該文方法利用DA多重插補(bǔ)法,可以有效獲取電力物聯(lián)網(wǎng)中三相電流數(shù)據(jù)的缺失插補(bǔ)值。
計算利用DA 多重插補(bǔ)法,對電力物聯(lián)網(wǎng)電能缺失數(shù)據(jù)插補(bǔ)結(jié)果的狀態(tài)誤差方差,八次插補(bǔ)的狀態(tài)誤差方差統(tǒng)計結(jié)果如圖3 所示。

圖3 插補(bǔ)狀態(tài)誤差方差統(tǒng)計結(jié)果
通過圖3 實驗結(jié)果可以看出,利用DA 多重插補(bǔ)法插補(bǔ)電力物聯(lián)網(wǎng)的缺失電能數(shù)據(jù),三相電流數(shù)據(jù)的插補(bǔ)結(jié)果中,第六次插補(bǔ)的三相電流數(shù)據(jù)的狀態(tài)誤差方差為8 次插補(bǔ)結(jié)果中的最低值,實驗結(jié)果表明,八次插補(bǔ)中,第六次的插補(bǔ)結(jié)果為最優(yōu)值。選取第六次的插補(bǔ)結(jié)果作為電力物聯(lián)網(wǎng)缺失電能數(shù)據(jù)的最終修復(fù)結(jié)果。
電能數(shù)據(jù)缺失率對電力物聯(lián)網(wǎng)缺失電能數(shù)據(jù)修復(fù)結(jié)果存在明顯影響。統(tǒng)計不同缺失率時,采用該文方法修復(fù)電力物聯(lián)網(wǎng)缺失電能數(shù)據(jù)的觀測誤差方差,統(tǒng)計結(jié)果如圖4 所示。通過圖4 實驗結(jié)果可以看出,采用該文方法修復(fù)電力物聯(lián)網(wǎng)中的缺失電能數(shù)據(jù),不同缺失率情況下,采用該文方法修復(fù)電力物聯(lián)網(wǎng)中用戶的三相電流數(shù)據(jù),電能數(shù)據(jù)缺失修復(fù)的觀測誤差方差均低于0.2。實驗結(jié)果驗證,該文方法具有較高的缺失電能數(shù)據(jù)修復(fù)水平,不受電能數(shù)據(jù)缺失率影響。不同電能數(shù)據(jù)缺失率時,缺失電能數(shù)據(jù)修復(fù)性能良好,可應(yīng)用于電力物聯(lián)網(wǎng)的實際應(yīng)用中。
為了進(jìn)一步衡量該文方法對電力物聯(lián)網(wǎng)中的缺失電能數(shù)據(jù)的修復(fù)性能,統(tǒng)計采用該文方法對用戶于2019 年12 月5 日-12 月12 日的缺失電能數(shù)據(jù)修復(fù)結(jié)果,如圖5 所示。

圖5 電能數(shù)據(jù)缺失修復(fù)結(jié)果
通過圖5 實驗結(jié)果可以看出,采用該文方法不僅可以修復(fù)電力物聯(lián)網(wǎng)在短期內(nèi)缺失的電能數(shù)據(jù),對于缺失的長期電能數(shù)據(jù)同樣具有良好的修復(fù)性能。該文方法可以有效修復(fù)電力物聯(lián)網(wǎng)中缺失的電能數(shù)據(jù)。采用該文方法修復(fù)電力物聯(lián)網(wǎng)缺失電能數(shù)據(jù),修復(fù)性能穩(wěn)定,電力物聯(lián)網(wǎng)缺失電能數(shù)據(jù)修復(fù)的應(yīng)用性較高。
對電力物聯(lián)網(wǎng)感知層的電能數(shù)據(jù)采集終端,采集電能數(shù)據(jù)過程中的缺失數(shù)據(jù)進(jìn)行修復(fù),對于提升電力物聯(lián)網(wǎng)的數(shù)據(jù)完整度,以及服務(wù)質(zhì)量具有重要意義。選取某電力企業(yè)的電力物聯(lián)網(wǎng)作為研究對象,驗證不同缺失率情況下,該方法均可以有效修復(fù)電力物聯(lián)網(wǎng)的缺失電能數(shù)據(jù),修復(fù)效果良好。該方法充分考慮了電力物聯(lián)網(wǎng)電能數(shù)據(jù)的波動特性,不僅可以有效描述電力物聯(lián)網(wǎng)內(nèi)電能數(shù)據(jù)的短期變化,同時可以描述電力物聯(lián)網(wǎng)電能數(shù)據(jù)的長期變化規(guī)律,對于短期與長期的缺失電能數(shù)據(jù),均可以精準(zhǔn)修復(fù),提升電力物聯(lián)網(wǎng)的電能數(shù)據(jù)質(zhì)量。