李建芳,紀 鑫,張海峰,趙曉龍,陳潤東
(1.國家電網有限公司大數據中心,北京 100052;2.北京國網信通埃森哲信息技術有限公司,北京 100052)
由于工業、農業以及人們日常生活中使用的電器數量增加,電力系統產生的電力負荷隨之增加[1]。為了向生產和生活提供可靠、安全的電力能源,有必要對短期電力負荷進行預測,并根據預測結果調整電力系統的發電量,盡量達到收支平衡。
電網的運行特性、容量決策、自然條件、社會影響等都是影響電網負荷預測結果的重要指標。準確的負荷預報數據,不但可以提高電網的運行安全,而且可以極大地減少電網的運行費用,節省能源。現階段發展較為成熟的短期負荷預測方法應用了注意力機制、神經網絡等算法,然而傳統方法在實際應用過程中,預測準確率較低,影響了預報的可信性。為了解決上述傳統預測方法存在的問題,文中引入LSTM 與seq2seq 模型。通過LSTM 和seq2seq 算法的融合構建模型,并將其應用到短期電力負荷預測方法的優化設計工作中,以期提高電力負荷的預測精度以及應用價值。
電力短期負荷預測是將歷史負荷資料向未來時間進行預測,運用統計學、人工智能、經驗分析等量化手段,揭示電網的負荷變化,并對其進行預測[2]。負荷的變化具有隨機性,受環境、人為、天氣、經濟等因素的影響而實時發生變化。所以,在對電網的短期負荷進行預報時,必須充分地綜合以上各種影響因子和歷史負荷的變化情況。
短期電力負荷數據的構成具有時間特性,可以將任意時刻的電力負荷表示為:
式中,Ln為基礎負荷,Lw為天氣影響系數,Ls為經濟影響系數,Lr為發電噪聲值。其中,Ln的量化計算公式如下:
式中,κ(t) 為負荷分量與時間之間的線性變化系數,Z(t) 為負荷的周期變化系數。根據式(1)的結構,在電力管理系統數據庫中,采用數據挖掘技術提取預測時間前三個月的電力負荷數據作為歷史數據[3]。在數據補全、異常處理和標準化處理等步驟的實施下,確保了電網的短期負荷預報準確率[4]。采用線性差分法來解決小間距的數據丟失問題。線性差分數據處理過程可以表示為:
式中,xn和xn+1分別為n和n+1 時刻的電力負荷,xn+k表示中間缺失負荷數據的補充結果,i表示負荷數據集長度。標準化的輸入數據主要用于衡量各種指標的比例,而在輸出數據上則是使其能夠更好地反映負載的變化趨勢[5-6]。歷史負荷數據的歸一化計算式如下:
式中,ximin和ximax分別為歷史負荷數據集i的最大值和最小值,xi為歷史負荷數據的采集值,為數據的歸一化處理結果[7]。根據以上步驟處理初始數據,得到精確的歷史電力負荷數據。
1.2.1 構建LSTM與seq2seq模型
LSTM 的基礎架構包括輸入門、輸出門和遺忘門三個部分,三個門控制進出單元的信息。LSTM 單元結構原理如圖1 所示。

圖1 LSTM單元結構原理
LSTM 把各個記憶單元連在一起,確保每一個記憶單元的數據都能在不改變的情況下進行傳輸[9]。利用LSTM 的三種門控結構對數據的選擇性轉移進行控制,Sigmoid 函數的輸出是[0,1]區間內的數字。遺忘門負責在ct中刪除并保存前一時間的有效信息,遺忘門的計算處理過程可以表示為:
式中,σ()?表示Sigmoid 激活函數,ωf為權重值,ht-1和xt分別為上一時刻LSTM 的輸出值以及當前LSTM 的輸入值,bf表示偏置項。輸入門將當前時刻有效的信息存放在狀態單元中,決定了細胞狀態的更新,輸出門的細胞狀態更新過程可以表示為:
式中,tanh()?為記憶單元更新函數,ωc、xt和bc分別對應輸出門的權重值、輸入值以及偏置值。輸出層確定了LSTM 神經單元所需的信息,并在此基礎上,利用所保存的遺忘門和輸入門的信息,生成新的單元,并將新的單元傳送到tanh 函數,由Sigmoid 確定當前時間隱藏層的輸出值,最后LSTM 模型的輸出結果如下:
式中,變量ot和it分別表示輸入門和輸出門的輸出結果。
seq2seq 模型解碼端接收到編碼部分的最后狀態,將每個步驟的輸出值作為下一階段的輸入值。通過LSTM 模型與seq2seq 模型的構建與組合,完成模型的構建[10]。seq2seq 模型的運行以LSTM 模型隱含層狀態的輸出結果作為輸入序列,在此基礎上通過編碼與譯碼處理,得出最終的特征提取結果。
1.2.2 提取電力負荷變化特征
將收集的歷史電力負荷數據代入到構建的LSTM 與seq2seq 模型中,分別從負荷峰值、負荷谷值、負荷均值等方面,提取歷史電力負荷的變化特征。以負荷峰值為例,模型輸出的特征提取結果可以表示為:
式中,變量xi和y分別為負荷影響因子和電力負荷分量,X(xi,y)為收集的歷史電力負荷數據集,J為歷史數據量[11]。同理可以迭代計算得出歷史電力負荷數據其他特征的提取結果。通過對單位時間內電力負荷數據變化特征的提取與分析,確定該區域內電力負荷的周期性浮動規律。
影響短期用電負荷的因素包括氣候、電價等,氣候因素具體包括溫度、濕度、風速等。在夏季大量使用大功率的制冷設備,造成了一定時期內的負載迅速增長,從而產生了較高的負載高峰[12-13]。以溫度影響因素為例,其影響機理可以表示為:
式中,λT為溫度影響系數,ΔT表示溫度浮動值,Lt0和Ltn分別對應t0和tn時刻的電力負荷值。通過對歷史電力負荷以及溫度數據的分析,確定λT的具體取值[14]。同理可以得出電價因素以及其他因素對電力負荷數據的影響關系。
綜合短期電力負荷的周期性變化規律以及預測時間節點的影響因素,得出短期電力負荷的預測結果為:
式中,變量λ為綜合影響系數,tforecast和tcurrent分別對應電力負荷的預測時間節點和當前時間節點,χ為歷史電力負荷的變化規律系數[15-16],該系數的具體取值由LSTM 與seq2seq 模型的特征提取結果決定。按照上述方式,可以得出電力系統任意時刻的短期電力負荷的預測結果。
以Inteli52.70 GHz CPU、NvidiaGeforce2080Ti*4和256 GB 內存的服務器進行模型構建和負荷數據預測,并設計預測性能測試實驗。在實驗環境中安裝Keras 工具,該工具支持LSTM 與seq2seq 算法的直接調用。為了體現出優化設計短期電力負荷預測方法的性能優勢,實驗設置了傳統的基于自組織特征神經網絡和最小二乘支持向量機的短期電力負荷預測方法(方法一)作為對比方法。通過相關數據的統計與對比,體現出優化設計方法的預測性能優勢[17]。
此次實驗選擇了三個數據集用作負荷預測的訓練和測試。分別從某省三個地區電力公司官網下載負荷數據,實驗選擇2022 年3 月1 日-3 月15 日的數據,數據的采樣周期為1 小時,共計6 000 個樣本。負荷數據樣本中包括工作時間負荷和休息時間負荷。在神經網絡算法中,數據經過處理后,要對數據進行分割,然后再將其輸入到模型中進行訓練。若將所有的樣本數據都投入到模型中,會導致模型與整體數據的擬合過度,從而影響到預測結果的準確性,所以將數據按8∶2 的比例劃分為兩個數據子集。
由于優化設計的短期電力負荷預測方法應用了LSTM 與seq2seq 模型,為保證優化設計的預測方法能夠在實驗環境中正常運行,分別針對LSTM 模型和seq2seq 模型的運行參數進行設置。LSTM 的基本參數分為基本參數和超參數兩種。基本參數的初始權重被設定為[0,1]之間的任意分布,將隱藏層的層數設定為5、超參數中的批次尺寸設定為64,模型設置學習率的初始值為0.000 1,并在訓練期間根據數據的收斂性來調整。選用枚舉法逐層選取seq2seq 模型中的隱藏單元參數。
實驗設置預測誤差來反映預測方法的運行性能,其中預測誤差的數值結果為:
式中,Lactual_t和Lforecast_t分別為t時刻的實際電荷值和預測電荷結果,參數T為預測目標時段。計算得出ε的值越大,證明短期電力負荷預測性能越優。
選擇2022 年4 月1 日和2 日電力負荷作為短期電力負荷的預測目標,預測時間分別為工作日和休息日,通過LSTM 與seq2seq模型以及短期電力負荷預測方法的運行,得出電荷預測精度結果如表1 所示。

表1 短期電力負荷預測精度測試數據表
將表1 中的數據代入式(11)中,得出傳統預測方法的工作日和休息日電力負荷的平均預測誤差分別為6.18 kW·h 和4.01 kW·h,而優化設計預測方法在兩個工況中的電力負荷平均預測誤差分別為0.54 kW·h 和0.48 kW·h。由此可見,綜合工作日和休息日兩種情況,優化設計的基于LSTM 與seq2seq模型的短期電力負荷預測方法的預測誤差更低,證明該方法的預測性能更優。
短期電力負荷的預測可以為今后電網的建設和資源的最優配置提供了理論依據。文中方法通過LSTM 與seq2seq 模型在電力負荷預測中的應用,有效提高了預測性能,以及學習效率和預測能力。