基于DA多重插補(bǔ)法和電力物聯(lián)網(wǎng)的電能數(shù)據(jù)缺失修復(fù)方法

2024-04-19 13:56:54張浩海王昊丁耀杰

電子設(shè)計工程 2024年8期

關(guān)鍵詞：電能利用

張浩海，王昊，丁耀杰

（北京中電普華信息技術(shù)有限公司，北京 100000）

電力物聯(lián)網(wǎng)應(yīng)用于電力系統(tǒng)發(fā)電、輸電等全部環(huán)節(jié)中，電能數(shù)據(jù)具有極強(qiáng)的周期性[1]，利用歷史數(shù)據(jù)作為電能數(shù)據(jù)缺失修復(fù)方法的依據(jù)，對于電能數(shù)據(jù)修復(fù)具有重要意義。DA（Data Augmentation）多重插補(bǔ)法通過缺失電能數(shù)據(jù)的可能分布值修復(fù)缺失數(shù)據(jù)。DA 多重插補(bǔ)法結(jié)合觀測數(shù)據(jù)與數(shù)據(jù)的先驗數(shù)據(jù)實現(xiàn)數(shù)據(jù)修復(fù)。該文提出基于DA 多重插補(bǔ)法和電力物聯(lián)網(wǎng)的電能數(shù)據(jù)缺失修復(fù)方法，提升電力物聯(lián)網(wǎng)中海量電能數(shù)據(jù)的應(yīng)用性能。

1 電力物聯(lián)網(wǎng)的電能數(shù)據(jù)缺失修復(fù)方法

1.1 電力物聯(lián)網(wǎng)總體結(jié)構(gòu)

電力物聯(lián)網(wǎng)的總體結(jié)構(gòu)圖如圖1 所示。

圖1 電力物聯(lián)網(wǎng)總體結(jié)構(gòu)圖

通過圖1 電力物聯(lián)網(wǎng)的總體結(jié)構(gòu)圖可以看出，電力物聯(lián)網(wǎng)的各個環(huán)節(jié)共同作用，實現(xiàn)電力物聯(lián)網(wǎng)在電力系統(tǒng)中的良好應(yīng)用。電力物聯(lián)網(wǎng)利用感知層的設(shè)備終端采集電能信息，處理電能信息相關(guān)數(shù)據(jù)[2-4]。電力物聯(lián)網(wǎng)的通信層，利用移動通信技術(shù)等網(wǎng)絡(luò)設(shè)施，對感知層采集的信息進(jìn)行數(shù)據(jù)接入與傳輸。平臺層將所采集的電能信息整合處理，平臺層具有存儲數(shù)據(jù)、缺失電能數(shù)據(jù)修復(fù)、檢索數(shù)據(jù)以及保護(hù)電力系統(tǒng)的數(shù)據(jù)資源安全性的功能。應(yīng)用層接收用戶提交請求后，從平臺層調(diào)取數(shù)據(jù)，利用平臺層分析處理后的數(shù)據(jù)，為用戶提供服務(wù)。電力物聯(lián)網(wǎng)利用感知層的電能數(shù)據(jù)采集終端采集電能數(shù)據(jù)。電力物聯(lián)網(wǎng)運(yùn)行過程，是采集電能數(shù)據(jù)、傳輸電能數(shù)據(jù)與處理電能數(shù)據(jù)的過程[5-7]。電能數(shù)據(jù)的完整性與可靠性是電力物聯(lián)網(wǎng)可靠運(yùn)行的重要前提。電力系統(tǒng)在數(shù)據(jù)感知與處理過程中，容易出現(xiàn)數(shù)據(jù)缺失情況，數(shù)據(jù)缺失對于電力系統(tǒng)電能數(shù)據(jù)的實際應(yīng)用具有重要影響。數(shù)據(jù)缺失將導(dǎo)致很多業(yè)務(wù)無法順利開展。如電能數(shù)據(jù)中的電壓波形數(shù)據(jù)丟失時，無法精準(zhǔn)識別電能質(zhì)量干擾情況，無法精準(zhǔn)定位電力系統(tǒng)故障信息[8-9]。及時修復(fù)電力物聯(lián)網(wǎng)中的電能缺失數(shù)據(jù)，對于保障電力系統(tǒng)中業(yè)務(wù)正常運(yùn)行、利用完整數(shù)據(jù)建設(shè)電力物聯(lián)網(wǎng)具有重要意義。

1.2 基于EM插補(bǔ)算法的電能數(shù)據(jù)缺失值初始插補(bǔ)

利用EM 插補(bǔ)算法對電能物聯(lián)網(wǎng)中的電能數(shù)據(jù)的缺失值進(jìn)行初始插補(bǔ)處理。EM(Expectation-Maximum)算法即期望最大化算法，該算法利用極大似然估計方法，估計給定的電能觀測數(shù)據(jù)。假設(shè)X為電力物聯(lián)網(wǎng)中電能數(shù)據(jù)的觀測數(shù)據(jù)集，Y為電力物聯(lián)網(wǎng)中的缺失電能數(shù)據(jù)集，電力物聯(lián)網(wǎng)中包含缺失電能數(shù)據(jù)的全部電能數(shù)據(jù)集Z=(X,Y)，該電能數(shù)據(jù)集Z的概率密度函數(shù)表達(dá)式為：

式中，p為缺失電能數(shù)據(jù)的概率，θ為電能數(shù)據(jù)概率密度函數(shù)的缺失電能數(shù)據(jù)參數(shù)，x、y、z分別為電力物聯(lián)網(wǎng)中電能數(shù)據(jù)集X、Y、Z中的數(shù)據(jù)。缺失電能數(shù)據(jù)y的假設(shè)、缺失電能數(shù)據(jù)參數(shù)θ的初始估計值、缺失電能數(shù)據(jù)y與觀測電能數(shù)據(jù)變量及電能數(shù)據(jù)邊緣密度函數(shù)p(x|θ)間的關(guān)聯(lián)，是決定電能數(shù)據(jù)概率密度函數(shù)p(z|θ)的重要因素。依據(jù)式（1），獲取電力物聯(lián)網(wǎng)中全部電能數(shù)據(jù)集的似然函數(shù)表達(dá)式為：

式中，L為電能物聯(lián)網(wǎng)中全部電能數(shù)據(jù)集似然函數(shù)的似然性。考慮到電力物聯(lián)網(wǎng)中，缺失的電能數(shù)據(jù)存在未知性[10]，因此似然函數(shù)L(θ|Z)是依據(jù)缺失電能數(shù)據(jù)Y產(chǎn)生的隨機(jī)數(shù)。為提升似然函數(shù)估計的準(zhǔn)確性，假設(shè)缺失電能數(shù)據(jù)變量為不完全隨機(jī)缺失[11-12]，即該類電能數(shù)據(jù)的缺失依賴于其他完全電能數(shù)據(jù)的變量。

給定觀測數(shù)據(jù)集X與缺失電能數(shù)據(jù)參數(shù)θ的初始估計值后，利用EM 算法的E 步驟與M 步驟對電力物聯(lián)網(wǎng)中的缺失電能數(shù)據(jù)進(jìn)行挖掘。E 步驟是計算與完全電能數(shù)據(jù)對數(shù)似然函數(shù)lnp(X,Y|θ)關(guān)聯(lián)的缺失數(shù)據(jù)集Y的期望。完全電能數(shù)據(jù)對數(shù)似然函數(shù)期望的表達(dá)式為：

式中，θi表示現(xiàn)有已知參數(shù)的估計值。其中，Y中的數(shù)據(jù)服從y→f(y|X,θi)分布。

似然函數(shù)h(θ,Y)的最優(yōu)化表達(dá)式如下：

式（4）可以轉(zhuǎn)化如下：

式中，f(y|X,θi)表示電力物聯(lián)網(wǎng)中電能缺失數(shù)據(jù)y的邊緣密度函數(shù)，參數(shù)θi和觀測數(shù)據(jù)對邊緣密度函數(shù)影響較大。

存在式（6）的函數(shù)：

參數(shù)θ與因子f(X|θi)無直接關(guān)聯(lián)，電力物聯(lián)網(wǎng)中電能數(shù)據(jù)缺失修復(fù)過程中，將f(y|X,θi) 利用f(y,X|θi) 代替，對式（4）的似然函數(shù)最優(yōu)化不存在影響。

利用EM 算法對電力物聯(lián)網(wǎng)中的電能數(shù)據(jù)進(jìn)行插補(bǔ)處理的第二步M 步驟，通過搜尋θi+1，將期望值g(θ|θi,X)進(jìn)行最大化處理，令θi+1值滿足以下公式：

式中，Θ 表示參數(shù)空間。

EM 算法依據(jù)算法參數(shù)與電力物聯(lián)網(wǎng)中缺失電能數(shù)據(jù)間的關(guān)系，插補(bǔ)缺失數(shù)據(jù)。電能缺失數(shù)據(jù)已知，算法參數(shù)未知時，算法參數(shù)可以利用電能缺失數(shù)據(jù)估計；算法參數(shù)已知時，利用算法參數(shù)可以精準(zhǔn)估計電能缺失數(shù)據(jù)。假設(shè)可以利用算法參數(shù)估計電能缺失數(shù)據(jù)，利用電能缺失數(shù)據(jù)修復(fù)算法參數(shù)[13-14]。重復(fù)迭代以上過程，直至算法參數(shù)為收斂狀態(tài)，利用收斂的算法參數(shù)獲取電力物聯(lián)網(wǎng)中的缺失電能數(shù)據(jù)。EM 算法利用重復(fù)迭代過程，獲取極大似然估計結(jié)果。數(shù)據(jù)重復(fù)迭代過程，可以增加似然函數(shù)值，同時將似然函數(shù)值快速收斂至局部極大值，該算法具有較高的穩(wěn)定性，計算簡便。

1.3 基于DA多重插補(bǔ)法的電能數(shù)據(jù)缺失修復(fù)方法

將利用EM算法獲取的電力物聯(lián)網(wǎng)缺失電能數(shù)據(jù)初始插補(bǔ)結(jié)果[15-16]，作為DA 多重插補(bǔ)法的插補(bǔ)初始值，獲取最終電能數(shù)據(jù)缺失修復(fù)結(jié)果。DA多重插補(bǔ)法充分考慮電力物聯(lián)網(wǎng)中電能數(shù)據(jù)的時間序列，利用局部加權(quán)回歸模型修復(fù)電力物聯(lián)網(wǎng)的缺失電能數(shù)據(jù)。用φ0表示包含利用EM 算法獲取缺失電能數(shù)據(jù)初始插補(bǔ)結(jié)果的初始觀測數(shù)據(jù)，DA 多重插補(bǔ)法修復(fù)電力物聯(lián)網(wǎng)缺失電能數(shù)據(jù)的觀測方程表達(dá)式如下：

缺失電能數(shù)據(jù)修復(fù)的狀態(tài)方程表達(dá)式如下:

式中，Yt與φt分別觀測向量以及期望向量，vt與wt分別表示觀測誤差與狀態(tài)誤差。DA 多重插補(bǔ)法采用動態(tài)正態(tài)模型，更好的修復(fù)缺失電能數(shù)據(jù)。相對于φt-1，φt存在一個狀態(tài)誤差，狀態(tài)誤差序列wt與觀測誤差序列vt為互相獨立狀態(tài)。

DA 多重插補(bǔ)法利用局部加權(quán)回歸模型，更新電能數(shù)據(jù)狀態(tài)，修復(fù)電力物聯(lián)網(wǎng)內(nèi)海量電能數(shù)據(jù)的缺失數(shù)據(jù)。局部加權(quán)回歸模型可以靈活地探索不同變量間的關(guān)系。利用局部加權(quán)回歸模型修復(fù)電力物聯(lián)網(wǎng)的缺失電能數(shù)據(jù)時，對電能數(shù)據(jù)φt進(jìn)行局部多項式估計處理，構(gòu)建一元非參數(shù)回歸模型表達(dá)式如下：

式中，yt與m(φt) 分別表示實際電能數(shù)據(jù)以及模型預(yù)測值，ut表示隨機(jī)誤差項。電能數(shù)據(jù)缺失修復(fù)時，隨機(jī)誤差項的期望值為0。

設(shè)m(φt) 表示電力物聯(lián)網(wǎng)電能數(shù)據(jù)φ0附近的p+1 階導(dǎo)數(shù)。數(shù)據(jù)φ0的鄰域表達(dá)式如下：

一元非參數(shù)回歸模型的加權(quán)誤差平均和需要滿足以下公式：

式中，wt表示模型的權(quán)重，t=1,2,…,T，表示局部加權(quán)時間參數(shù)。

式（13）中的穩(wěn)健權(quán)數(shù)表達(dá)式如下：

式中，c表示固定時間段內(nèi)，電力物聯(lián)網(wǎng)電能數(shù)據(jù)的中值函數(shù)。

利用穩(wěn)健權(quán)數(shù)ξ對模型參數(shù)估計，獲取最新預(yù)測誤差值et。依據(jù)誤差最小化原則，獲取電力物聯(lián)網(wǎng)電能數(shù)據(jù)缺失值修復(fù)的插補(bǔ)值，完成電力物聯(lián)網(wǎng)的電能數(shù)據(jù)缺失修復(fù)。

2 實驗分析

為了驗證所研究方法修復(fù)電力物聯(lián)網(wǎng)的缺失電能數(shù)據(jù)有效性，選取某電力企業(yè)作為研究對象。該電力企業(yè)利用電力物聯(lián)網(wǎng)為用戶提供服務(wù)，電力物聯(lián)網(wǎng)缺失電能數(shù)據(jù)修復(fù)性能決定電力企業(yè)對用戶的服務(wù)性能。選取該電力企業(yè)供電區(qū)域的某用戶的電流數(shù)據(jù)作為研究對象。采集該用戶2019年12月1日-12 月31 日的用電電流數(shù)據(jù)，該用戶A 相、B 相以及C相三相電流的額定電流為4 A，電能數(shù)據(jù)缺失值的取值區(qū)間為[0,4]。用戶的電流數(shù)據(jù)具有極強(qiáng)的周期性，缺失電能數(shù)據(jù)修復(fù)有助于分析用戶用電情況。

電力物聯(lián)網(wǎng)的感知層利用電能數(shù)據(jù)采集終端，采集該用戶的三相電流原始數(shù)據(jù)，如表1 所示。

表1 用戶原始三相電流數(shù)據(jù)

通過表1 電能數(shù)據(jù)采集結(jié)果可以看出，電力物聯(lián)網(wǎng)利用感知層采集的用戶電能數(shù)據(jù)中的三相電流數(shù)據(jù)中，存在明顯的缺失數(shù)據(jù)，影響電能數(shù)據(jù)在電力物聯(lián)網(wǎng)中的應(yīng)用。利用文中電力物聯(lián)網(wǎng)電能數(shù)據(jù)缺失修復(fù)方法，精準(zhǔn)修復(fù)用戶缺失的三相電流數(shù)據(jù)，提升電力物聯(lián)網(wǎng)的應(yīng)用性能。

利用EM 插補(bǔ)算法，依據(jù)所采集的電力物聯(lián)網(wǎng)電能數(shù)據(jù)，插補(bǔ)計算缺失的電能數(shù)據(jù)。EM 算法獲取缺失數(shù)據(jù)的初始插補(bǔ)結(jié)果如表2 所示。

表2 缺失電能數(shù)據(jù)初始插補(bǔ)結(jié)果

通過表2 實驗結(jié)果可以看出，采用文中方法可以有效利用EM 插補(bǔ)算法，獲取電力物聯(lián)網(wǎng)中，該用戶三相電流數(shù)據(jù)中的電流插補(bǔ)數(shù)據(jù)。將利用EM 插補(bǔ)算法獲取的缺失電能數(shù)據(jù)插補(bǔ)結(jié)果，作為DA 多重插補(bǔ)法的初始值。DA 多重插補(bǔ)法依據(jù)初始插補(bǔ)數(shù)據(jù)對缺失電能數(shù)據(jù)進(jìn)行多次插補(bǔ)。DA 多重插補(bǔ)法的插補(bǔ)結(jié)果如圖2 所示。

圖2 DA多重插補(bǔ)法的插補(bǔ)結(jié)果

通過圖2 實驗結(jié)果可以看出，該文方法利用DA多重插補(bǔ)法，可以有效獲取電力物聯(lián)網(wǎng)中三相電流數(shù)據(jù)的缺失插補(bǔ)值。

計算利用DA 多重插補(bǔ)法，對電力物聯(lián)網(wǎng)電能缺失數(shù)據(jù)插補(bǔ)結(jié)果的狀態(tài)誤差方差，八次插補(bǔ)的狀態(tài)誤差方差統(tǒng)計結(jié)果如圖3 所示。

圖3 插補(bǔ)狀態(tài)誤差方差統(tǒng)計結(jié)果

通過圖3 實驗結(jié)果可以看出，利用DA 多重插補(bǔ)法插補(bǔ)電力物聯(lián)網(wǎng)的缺失電能數(shù)據(jù)，三相電流數(shù)據(jù)的插補(bǔ)結(jié)果中，第六次插補(bǔ)的三相電流數(shù)據(jù)的狀態(tài)誤差方差為8 次插補(bǔ)結(jié)果中的最低值，實驗結(jié)果表明，八次插補(bǔ)中，第六次的插補(bǔ)結(jié)果為最優(yōu)值。選取第六次的插補(bǔ)結(jié)果作為電力物聯(lián)網(wǎng)缺失電能數(shù)據(jù)的最終修復(fù)結(jié)果。

電能數(shù)據(jù)缺失率對電力物聯(lián)網(wǎng)缺失電能數(shù)據(jù)修復(fù)結(jié)果存在明顯影響。統(tǒng)計不同缺失率時，采用該文方法修復(fù)電力物聯(lián)網(wǎng)缺失電能數(shù)據(jù)的觀測誤差方差，統(tǒng)計結(jié)果如圖4 所示。通過圖4 實驗結(jié)果可以看出，采用該文方法修復(fù)電力物聯(lián)網(wǎng)中的缺失電能數(shù)據(jù)，不同缺失率情況下，采用該文方法修復(fù)電力物聯(lián)網(wǎng)中用戶的三相電流數(shù)據(jù)，電能數(shù)據(jù)缺失修復(fù)的觀測誤差方差均低于0.2。實驗結(jié)果驗證，該文方法具有較高的缺失電能數(shù)據(jù)修復(fù)水平，不受電能數(shù)據(jù)缺失率影響。不同電能數(shù)據(jù)缺失率時，缺失電能數(shù)據(jù)修復(fù)性能良好，可應(yīng)用于電力物聯(lián)網(wǎng)的實際應(yīng)用中。

為了進(jìn)一步衡量該文方法對電力物聯(lián)網(wǎng)中的缺失電能數(shù)據(jù)的修復(fù)性能，統(tǒng)計采用該文方法對用戶于2019 年12 月5 日-12 月12 日的缺失電能數(shù)據(jù)修復(fù)結(jié)果，如圖5 所示。

圖5 電能數(shù)據(jù)缺失修復(fù)結(jié)果

通過圖5 實驗結(jié)果可以看出，采用該文方法不僅可以修復(fù)電力物聯(lián)網(wǎng)在短期內(nèi)缺失的電能數(shù)據(jù)，對于缺失的長期電能數(shù)據(jù)同樣具有良好的修復(fù)性能。該文方法可以有效修復(fù)電力物聯(lián)網(wǎng)中缺失的電能數(shù)據(jù)。采用該文方法修復(fù)電力物聯(lián)網(wǎng)缺失電能數(shù)據(jù)，修復(fù)性能穩(wěn)定，電力物聯(lián)網(wǎng)缺失電能數(shù)據(jù)修復(fù)的應(yīng)用性較高。

3 結(jié)論

對電力物聯(lián)網(wǎng)感知層的電能數(shù)據(jù)采集終端，采集電能數(shù)據(jù)過程中的缺失數(shù)據(jù)進(jìn)行修復(fù)，對于提升電力物聯(lián)網(wǎng)的數(shù)據(jù)完整度，以及服務(wù)質(zhì)量具有重要意義。選取某電力企業(yè)的電力物聯(lián)網(wǎng)作為研究對象，驗證不同缺失率情況下，該方法均可以有效修復(fù)電力物聯(lián)網(wǎng)的缺失電能數(shù)據(jù)，修復(fù)效果良好。該方法充分考慮了電力物聯(lián)網(wǎng)電能數(shù)據(jù)的波動特性，不僅可以有效描述電力物聯(lián)網(wǎng)內(nèi)電能數(shù)據(jù)的短期變化，同時可以描述電力物聯(lián)網(wǎng)電能數(shù)據(jù)的長期變化規(guī)律，對于短期與長期的缺失電能數(shù)據(jù)，均可以精準(zhǔn)修復(fù)，提升電力物聯(lián)網(wǎng)的電能數(shù)據(jù)質(zhì)量。