宋鐵維, 施偉鋒,畢宗
(上海海事大學電力自動化系,上海市 201306)
隨著電力系統規模不斷擴大,電力系統運行特性日趨復雜,為實現電力系統狀態估計、評估電力設備運行狀態,需獲取海量數據[1-2]。 然而,電力系統數據在采集、測量、傳輸等環節都可能受到干擾,出現數據缺失,導致數據質量下降,影響參數辨識與決策分析的準確性,威脅電網安全穩定運行[3]。
電力系統數據具備時序特性,量測點之間存在空間相關性,因此量測數據表現出時空分布特性[4]。為描述電力系統數據量測點之間的相關性,圖模型被廣泛地應用于電力系統拓撲描述上,用于承載空間拓撲信息[5]。 電力系統中相鄰節點的數據相似度較高,趨勢較一致,合理利用其時空分布特性可以較準確地重建缺失數據。
傳統的缺失數據重建技術大多基于數理統計構建數學模型,忽略了電力系統數據的時空特性,不能完全擬合電力系統數據,因此對缺失數據的重建效果并不理想[6]。 隨著數據驅動技術的發展,目前已有基于深度學習的模型運用于電力系統缺失數據重建。 文獻[7] 提出結合卷積神經網絡(convolution neural network,CNN)和長短期記憶網絡(long short-term memory,LSTM)的模型實現了電力系統缺失電量的預測,但未考慮空域信息的作用。 文獻[8]提出使用淺層自動編碼器學習電力系統數據的特征,實現缺失數據重建。 但淺層自動編碼器難以實現對復雜時空關系的學習。 文獻[9]提出使用LSTM 預測后續狀態值來重建輸變電設備采集數據,利用了時間序列的歷史信息,但未考慮未來信息的作用。 文獻[10]提出基于雙層全連接的LSTM 用于提取電力系統時序規律,實現了已知數據到缺失數據的映射,但未充分考慮電力系統節點數據之間的相關性。 文獻[4]提出基于改進生成式對抗網絡的電力系統缺失數據重建模型,通過生成器與判別器的相互博弈促使生成器學習數據之間的相關性,生成高精度重建數據,但模型較復雜,難以應用。
電網拓撲是典型的非歐氏結構,傳統的卷積操作無法在非歐氏數據集上實現,故可引入圖卷積方法來提取數據特征。 目前圖卷積已經在多個領域上被證明了其在圖狀數據結構分析中的優越性,包括交通網絡流量的時空預測以及社交網絡消息傳播建模[11-12],但目前在電力系統領域應用還較少。 文獻[13]提出基于譜圖論與圖卷積神經網絡的直流電網節點電壓估計模型,實現了時域電氣量信息與網架結構空域信息之間的融合。 文獻[14]通過鄰接矩陣表征配電網節點間的拓撲信息,使用圖卷積網絡實現配電網的無功優化,有效挖掘了節點負荷之間的相關性。 根據上述研究,圖卷積能夠實現電力系統數據的空間信息的聚合與提取,因此可用于電力系統缺失數據的重建任務上。
本文結合圖卷積層與長短時記憶單元構造時空信息提取單元,并基于此提出一種具備編碼-解碼結構的電力系統缺失數據重建模型(spatial-temporal seg2seg imputation model, ST-SSIM)。 編碼器由時空信息提取單元組成,用于融合時空特征并映射至高維空間,其中圖卷積層用于聚合數據的空間信息,前向與后向LSTM 單元分別用于提取數據的歷史與未來信息;解碼器由LSTM 單元與全連接層(fully connected layer,FC)組成,輸出目標序列。 算例表明所提模型能有效地聚合電力系統數據時序信息與空間信息,提高缺失數據的重建精度,且具備較好的穩定性。
海量運行數據對電力系統狀態估計、事故分析等具有指導意義。 然而電力系統數據采集、量測、傳輸和存儲等環節中的噪聲干擾、通信延遲都可能導致數據缺失,影響系統穩定運行。 電力系統數據具備時間、空間、節點特征3 個維度,故可用一個三維張量表示,張量的3 個維度分別代表時間跨度、節點數目、特征數目,具體如圖1 所示。

圖1 電力系統數據張量圖Fig.1 Power system data tensor diagram
圖1 為電力系統數據張量圖,圖中陰影部分表示該部分數據缺失。T為時間跨度,也即時間序列長度;N為節點數量;F為特征數。 因此,電力系統數據可表示為XT×N×F。 本文中,電力系統節點數據的特征為電壓幅值、電壓相角、節點注入有功功率、節點注入無功功率,即F=4。
為便于評估所提缺失數據重建方法的有效性,使用電力系統完整數據與掩碼矩陣的乘積模擬缺失數據,即式(1)—(3):

式中:X為電力系統完整數據張量;為缺失數據張量;M為掩碼矩陣,規模與X一致; ⊙表示按位相乘;NaN 表示當前位置數據缺失。 式(1)表示電力系統數據張量發生缺失的位置使用0 代替;式(2)表示電力系統數據張量在t時刻缺失n節點的特征f時,掩碼矩陣相應位置元素為1,否則為0。
電力系統缺失數據重建模型的目標本質上是以最小的誤差,建立一個從張量到張量X的映射G,具體見式(4)—(5):

式(5)表示重建電力系統數據由缺失數據重建結果與原始數據中未缺失部分組成。
本節介紹電力系統數據的空間信息聚合與時序信息聚合,提出考慮時空特性的缺失數據重建模型。
電力系統各節點之間存在空間相關性,聚合節點的空間特性能指導缺失數據的重建。 相較于傳統卷積神經網絡,圖卷積神經網絡不僅能通過圖卷積層自動提取輸入變量的特征,還能考慮各個節點之間的拓撲連接,適合處理復雜的圖數據[15]。 空域圖卷積算法復雜度上具備一定優勢,得到了廣泛應用。 電網拓撲為典型圖結構,故可采用空域圖卷積聚合空間信息[16],具體模型見圖2。

圖2 圖卷積結構Fig.2 Structure of GCN
由圖2 可知,圖卷積層在輸入的電力網絡拓撲上對鄰接節點的信息進行聚合更新,不改變輸出的形狀。 圖卷積層的輸入為時刻t的電力系統數據張量Xt與一個描述節點關系的鄰接矩陣A。 其中,Xt規模為| N| ×| F|,A規模為| N| ×| N|。 圖卷積層按式(6)—(8)聚合空間信息[17]:


式中:σ為非線性激活函數;W(i)為待學習的權重;H(i)為第i個圖卷積層的輸出;為考慮自環的鄰接矩陣;I為單位矩陣。 式(6)表示第i與i+1 個圖卷積層之間的空間信息聚合;式(7)表示與鄰接矩陣相比,考慮了自身信息;式(8)用于計算度矩陣,度矩陣為對角矩陣,表示節點的重要程度。
電力系統中節點數據的變化趨勢往往與其鄰接節點相似,因此鄰接節點信息可用于指導數據重建。圖卷積層類似于一個濾波器,將數據缺失節點自身信息與其一階鄰接節點信息聚合,多個卷積層堆積可聚合多階鄰接節點的信息,用于重建缺失數據。
電力系統數據為時間序列,挖掘其時序特性能提高缺失數據的重建精度。 LSTM 獨特的門結構使得梯度在反向傳播時可經過較長的距離,能緩解梯度消失;LSTM 的遺忘門可有選擇地篩選并遺忘前面序列中的某些信息以減少對后續序列的影響。 目前,許多研究將LSTM 用于電力數據時序特性挖掘任務中,并取得了顯著的效果[18-20]。 因此,LSTM 可用于電力數據時序信息提取,指導缺失數據重建。
圖3 為LSTM 單元結構,其中Ct為t時刻的單元狀態,保存序列長期特征;pt、qt、ot分別為遺忘門、輸入門與輸出門,用于實現消息的傳遞控制;ht為t時刻的單元輸出。 LSTM 單元的輸入包括當前時刻與歷史時段的電力系統數據,因此能充分挖掘數據的時序依賴性,提高缺失數據重建精度。

圖3 長短時記憶網絡單元結構Fig.3 Structure of LSTM cell
結合圖卷積層與雙向LSTM,構造時空信息提取單元,單元結構如圖4 所示,提出基于編碼-解碼結構[21]的ST-SSIM,模型框架見圖5。

圖5 ST-SSIM 結構Fig.5 Structure of ST-SSIM
觀察圖4,時空信息提取單元包含圖卷積層、前向LSTM 單元與后向LSTM 單元,3 個圖卷積層之間通過跳躍連接,避免由于多個圖卷積層連接導致的過平滑,同時3 個圖卷積層的級聯也能增強網絡表達能力。 前向LSTM 單元與后向LSTM 單元分別用于提取歷史信息與未來信息用于指導缺失數據重建。 圖4 中,與表示t與t-1 時刻前向LSTM 單元的輸出與狀態;與分別為t與t-1 時刻后向LSTM 單元的輸出與狀態。

圖4 時空信息提取單元結構Fig.4 Structure of ST unit
為實現電力系統時空信息的提取,圖卷積層與前向LSTM 單元、后向LSTM 單元被集成在一個ST-單元中,作用在輸入數據的每個時間戳上,圖4所示的ST-單元公式化表達如下:


電力系統缺失數據重建任務的目標本質是將含缺失數據的序列映射到原始序列,是一個序列到序列模型,故可使用編碼-解碼結構。 編碼器用于融合電力系統數據信息并編碼,提取高維特征,解碼器將高維特征解碼,恢復至原始數據的規模。 本文ST-SSIM模型的編碼器使用ST-單元,解碼器使用LSTM 與全連接層。
假設電力系統數據輸入規模為[B,T,N,F] ,則t時刻的輸入xt規模為[B,N,F] ,B為批尺寸。xt經過圖卷積層聚合空間信息得到規模為[B,N,F′]的輸出,F′為空間信息聚合后的特征維度,由圖卷積層的參數決定,故總時間序列經過圖卷積層得到規模為[B,T,N,F′]的輸出h0,同時將h0的規模修改為[B,T,N×F′]。 隨后h0經過前向與后向LSTM 單元聚合歷史與未來的時序信息,分別得到兩個規模為[B,T,H]的輸出h1,并將兩者拼接得到規模為[B,T,2×H]的輸出h2,其中,H為LSTM 的輸出特征維度,其值與選取的LSTM 結構參數有關,特征維度乘以2 表示輸出包含歷史與未來信息。 此時,h2表示包含電力系統數據時空特性的高維特征,隨后將h2送入LSTM 進行解碼得到規模為[B,T,H′]的輸出h3,H′為特征維度,取值與LSTM 單元的參數有關;h3經過全連接層轉化為[B,T,N×F]的輸出h4;最終將h4的規模修改為[B,T,N,F],得到與原始數據規模一致的輸出y∧。
電力系統缺失數據在重建時不僅要使重建的數據盡可能接近真實情況,還要確保重建數據與未缺失數據具有相同的數據規律。 故將缺失數據重建模型的損失函數定義為一個多目標函數:

為評價ST-SSIM 模型的重建效果,使用平均絕對誤差(mean absolute error,MAE)與平均絕對百分比誤差(mean absolute percentage error,MAPE)對模型進行評估[22]。

式(19)為特征f的MAE,表示重建值與實際值誤差絕對值的平均值,可用于衡量電力系統缺失數據的重建效果,MAE 衡量的是實際值與重建值偏離的絕對大小情況,具備量綱,MAE 的值越小代表模型的重建效果越好。 式(20)為特征f的MAPE,衡量的是實際值與重建值偏離的相對大小,無量綱。 MAPE 為0 表示完美模型,MAPE 大于1 則表示劣質模型。 觀察式(20)可知,MAPE 計算公式分母不能為0,即實際值不能為0,因此MAPE 不適用于電壓相角重建效果評估。 本文使用MAE 與MAPE 作為電壓幅值、有功功率、無功功率重建效果評價指標。 使用MAE 作為電壓相角重建效果評價指標。
本文使用16 GB Tesla P100 顯卡運算,編程語言為Python 3.8,深度學習框架為Pytorch 0.4.1。
為驗證模型在電力系統缺失數據重建任務上的有效性,在IEEE 39 節點標準算例進行驗證,網絡拓撲結構見圖6。 假定正常運行情況下39 個節點的電壓幅值、相角、注入有功功率、無功功率數據都已知。為獲取足夠多組數據,用于模型訓練與測試,將比利時電網2019年7月1日至9月31日共3 個月的負荷數據(采樣間隔15 min,共8832 組)進行縮放,作為負荷曲線。 在每條負荷曲線下,計算最優潮流,得到電壓幅值、相角、節點注入有功功率與無功功率作為電力系統節點數據的4 個特征。

圖6 IEEE 39 節點標準算例拓撲結構Fig.6 IEEE 39-node standard case
為獲取多組數據用于所提模型的訓練,將仿真得到的電力系統數據按9∶1 劃分為訓練集與測試集,時間窗的長度設置為128。 此時,訓練集規模為(7835,128,39,4),測試集的規模為(870,128,39,4)。 假設某節點出現數據缺失時,該節點的電壓幅值、相角、有功功率與無功功率均丟失。
本文模型在訓練時,批尺寸設置為64,優化求解器使用Adam,學習率設置為0.01,總迭代次數設置為200 次。 經大量仿真測試,所提ST-SSIM 模型網絡結構參數見表1。

表1 ST-SSIM 模型參數表Table 1 Parameters of ST-SSIM
表1 中,參數元組第1 個元素表示輸入特征數,第2 個元素表示輸出特征數。 例如,圖卷積層1 的參數為(4,8),表示輸入4 個特征,輸出8 個特征,序列長度均為128。
本節假設IEEE 39 節點系統中奇數序號節點均出現數據缺失,且缺失時間跨度為64(在原始數據里隨機選擇一段長為64 的序列作為缺失序列),并在此基礎上分析ST-SSIM 在電力系統缺失數據任務上的重建效果,對應的重建結果見圖7。
圖7 為節點15 的電壓幅值、電壓相角、節點注入有功功率與節點注入無功功率4 個指標的恢復結果。圖中紅色線段為缺失數據重建結果,藍色線段為實際數據,總體上,重建后的數據與實際數據變化趨勢基本一致,誤差較小。 重建電壓幅值與實際電壓幅值差距基本維持在10-3量級,絕對誤差較小;電壓相角重建數據與原始數據的波動基本一致;有功功率重建值與原始值的誤差維持在2 MW 之內;無功功率恢復數據與實際數據誤差維持在0.5 MV·A 之內。觀察電力系統數據的波峰波谷處,特別是有功功率重建結果,發現重建數據與實際數據的變化趨勢基本一致,但是在數值大小上重建模型較為保守,這種情況是由于歷史數據中突變樣本較少導致的。 由上述分析可知,基于ST-SSIM 的電力系統缺失數據重建模型能學習到數據之間的相關性,較好地還原實際數據。

圖7 缺失數據重建結果Fig.7 Reconstruct results of missing data
為突出所提方法的優越性,使用4 種模型重建電力系統缺失數據,并對結果進行比較分析。 所使用的4 種模型為:LSTM 模型、SSIM 模型、CNN-LSTM 模型以及所提ST-SSIM 模型,對照模型參數見附錄A。以下對比均在IEEE 39 節點系統奇數節點缺失,缺失時間跨度為64 的情況下進行。
圖8 給出了4 種模型分別在重建電壓幅值、相角、有功功率與無功功率時的MAE 與MAPE。 觀察圖8,所提模型重建的電壓幅值、相角、有功功率、無功功率誤差均比其他3 種方法低。 電網電壓幅值變化較小,因此4 種模型的重建誤差均很小。 由于只考慮了單向時序特性,LSTM 模型重建效果最差。SSIM 模型考慮了雙向時序特性,利用了歷史信息與未來信息,相較LSTM 重建誤差較低。 CNN-LSTM模型通過CNN 先獲取高維特征,能提高重建精度,但同樣未考慮空域信息,因此仍存在較大誤差。 STSSIM 考慮了數據的時序特性與節點間的空域特性,故4 種特征的重建誤差均較小。

圖8 不同模型重建誤差對比Fig.8 Reconstruction error comparison of different models
為測試ST-SSIM 在不同規模電網上的效果,假設電網各節點均缺失時間跨度為64 的數據,分別在39、57、118 節點的IEEE 標準電力系統上進行重建測試,不同模型的重建效果見表2。
表2 中,大部分情況下,ST-SSIM 模型的MAE與MAPE 均低于其余3 種缺失數據重建方法。 且隨著電網規模的增大,電壓幅值、相角以及有功功率和無功功率的MAE 與MAPE 均增大,但ST-SSIM 的MAE 與MAPE 增量最小,這是由于隨著網架的增大,若融合每個節點的數據信息用于缺失數據重建,會摻雜無效信息,影響重建精度。 圖卷積層只聚集缺失節點附近節點的信息,而無需對所有節點信息融合,規避無效信息,因此提高了重建精度。

表2 各模型重建誤差Table 2 Reconstruction error of each model
ST-SSIM 在大規模電網架構下依然能取得較好的重建精度,說明了圖卷積層的空間信息聚合作用指導了缺失數據的重建,且重建效果優越。
電力系統數據缺失節點越多,數據重建時能獲取的空間信息越少;丟失時間跨度越大,重建時能獲取的時序信息越少。 本節分析缺失數據重建效果與缺失節點數以及缺失時間跨度的關系,設置數據缺失節點數目為5、10、15、20 四個場景,缺失時間跨度為8、16、32、64 四個場景,兩者組合共16 種場景,各場景下重建數據的MAE 見圖9。

圖9 重建結果平均絕對誤差Fig.9 MAE of reconstruction results
圖9 中,隨著數據缺失節點的增加,4 類指標的MAE 均增大,柱狀圖呈現階梯狀。 數據缺失時間跨度為8 和16 時,數據缺失節點數目增大導致MAE 增大,但是從圖9 中可看出,增量較小,這說明盡管獲取的空間信息越來越少,但足夠的時序信息能將短時間缺失數據準確重建。 數據缺失節點數目為5 和10時,缺失時間跨度增大導致MAE 的增大,但增量同樣較少,說明時序信息較少時,憑借足夠的空間信息能夠將缺失數據準確重建。 但數據缺失節點數與時間跨度均較大時,重建誤差增幅較大,這是因為時序信息與空間信息均減少,因此重建精度降低。 盡管缺失節點數目與缺失跨度增加時,電力系統數據重建精度降低,但誤差仍相對較小,說明所提方法具有一定的穩定性。 上述現象表明ST-SSIM 能充分挖掘電力系統數據的時空特性進行缺失數據重建,得到精度較高且穩定的重建結果。
本節研究了多節點單段數據缺失情況下的數據重建問題,盡管未考慮多段數據缺失的情況,但討論了單段缺失數據占原始數據長度比由12.5% ~50.0%變化的情況。 單段數據缺失比例較高時,在一定程度上能體現多段數據缺失的特性,故3.5 節的結果對多段數據缺失情況下的數據重建也具備一定參考性。
本文針對電力系統數據缺失問題,提出基于STSSIM 的數據重建方法,并在電力系統仿真數據上進行驗證,得到了如下結論:
1)ST-SSIM 性能優于文中對照算法,特別是優于LSTM 算法。 這是因為構建的時空信息提取單元不僅使用雙向LSTM 單元獲取電力系統數據的時序特性,同時還使用圖卷積層融合了鄰接節點的相關信息,從而提升了缺失數據重建的精度。
2)隨著電網規模的增大,ST-SSIM 依然保持較高的數據重建精度,說明所提模型具備一定穩定性。
3)電網結構發生變化時,鄰接矩陣也會發生相應變化,因此未來研究會改進所提模型以適應變化的電網拓撲結構。
附錄A

表A1 SSIM 模型參數表Table A1 Parameters of ST-SSIM

表A2 LSTM 模型參數表Table A2 Parameters of LSTM

表A3 CNN-LSTM 模型參數表Table A3 Parameters of ST-SSIM