王榮茂, 謝 寧, 于海洋, 禹 加, 蔣 蕾, 楊宏宇
(1.國網遼寧省電力有限公司,沈陽 110006;2.上海交通大學電子信息與電氣工程學院,上海 200240;3.上海博英信息科技有限公司,上海 200241)
由于電能難以大量存儲以及電力需求時刻變化,電力系統發電與負荷的變化難以實現動態平衡。電力系統的經濟穩定運行要求以最少的能源消耗和運行成本保證供電的可靠性和用戶的滿意度。精確的臺區負荷預測有利于經濟調度和提高電力系統自動化水平。按照預測時間的長短,臺區負荷預測可分為超短期負荷預測(1 h以內)、短期負荷預測(以d、w為單位)、中期負荷預測(以m、a為單位)和長期負荷預測(10 a以上)[1]。其中,臺區負荷短期預測對電網調度人員合理安排開、停機計劃以及制定機組最優組合的影響尤為顯著。提高臺區負荷短期預測的精確度對電網安全穩定運行十分重要。
短期臺區負荷是綜合考慮氣象因素、增容策略、節假日以及地理位置等影響因素,構建合理的數學模型,預測下一天整個供電臺區的用電量。為充分分析負荷周期性增長和負荷爬坡的規律,近年來,國內外已有不少學者對臺區負荷短期預測技術進行了研究。臺區負荷預測的方法也從原本的常規技術[2]和統計學方法[3-4]發展到以機器學習算法(如神經網絡[5-6],支持向量機[7-8])和概率圖模型[9-10]為主的方法。依托智能電表和遠程終端提供的海量數據,機器學習算法是目前電力負荷預測的主流。直接采用人工智能算法學習負荷的波動規律,會因為數據存在噪聲、模型陷入局部最優等問題在精確度和魯棒性上得不到保證[11]。
為提高基于機器學習算法的負荷預測的精確度和魯棒性,部分文獻從提高數據樣本質量出發,采用非監督學習算法將負荷數據按照用電習慣聚類,作為預測模型的前驅[12];有些研究從優化預測算法出發,提出具有更精確預測非線性時序序列的方法[13-14];也有文獻從負荷的影響因素出發,將地理因素、溫度熱累積效應和濕度累積效應等考慮進預測模型中[15-16]。臺區負荷包含多種類型的負荷分量,不同負荷分量的主要影響因素存在差異。例如:居民負荷的波動主要來源于空調負荷,因此很大程度上受到溫度、濕度這類與人體舒適度有關的因素影響;工業、政府機構以及商場負荷主要受到日類型(工作日、節假日)影響等等。大多數機器學習模型通過建立統一的模型預測臺區負荷,缺少物理層面上的邏輯擬合,導致模型往往缺乏可解釋性。并且,隨著智能電網的不斷發展,臺區負荷的構成愈發復雜,亟需一種針對臺區負荷多樣性的短期預測方法。
為解決上述問題,本文采用先將臺區負荷進行經驗模態分解(empirical mode decomposition,EMD),再配合長短記憶神經網絡(Long short-term memory,LSTM)算法的預測策略。首先采用EMD方法將原始負荷分解為多個負荷分量,每個分量獨立代表一類負荷;生成盡可能大的負荷預測模型特征集,依據相關性分析自適應的為每類負荷選擇對應的特征子集,作為LSTM的輸入。用EMD從邏輯層面分解負荷,以相關性分析完成模型的特征工程,最后結合LSTM算法學習各類負荷在時序上的波動規律。實驗結果表明,預測方法相較于現有臺區負荷預測模型,不僅具有良好的可解釋性,且具有較高的精確度和計算效率。
在特征工程中,與預測目標相關性較低的特征被稱為冗余特征,帶入冗余特征的預測模型不僅在精確度上難以提高,并且計算效率會因為數據維度增加而降低。基于這一理念,首先將臺區負荷數據進行頻域分解,獲得具有不同波動規律的負荷分量。常見的頻域變換方法有兩種,一種是小波變換(wavelet transform,WT),另一種是經驗模態分解。小波變換雖然具有表征時頻兩域信號局部特征的能力,但需要人為設定小波基和分解尺度這些超參數,因此不適用于自適應匹配特征子集的場景。EMD方法由Huang教授提出[17],其顯著貢獻在于克服了基函數無自適應性的問題。對于一段未知序列,EMD無需做預先的分析與研究即可直接分解,免去了不必要的人為設置和干預。對于構成復雜且變化多樣的臺區負荷,EMD能夠將非平穩序列轉化為多個不同頻率相對平穩的數據,這對于充分挖掘臺區負荷與影響因素間的非線性關系具有極大的輔助作用。
LSTM是Sepp Hochreiter設計的一種循環神經網絡的改進結構[18],可以很好地解決以往神經網絡在預測時間序列時出現的梯度消失和梯度爆炸等問題。LSTM改進了普通循環網絡的隱藏層單元,改進后的網絡隱藏層由多個LSMT單元構成,單個LSTM單元的結構如圖1所示。

圖1 LSTM結構
LSTM單元中的輸入、輸出節點均通過具有非線性的激活函數的閥門壓縮控制。
LSTM單元在t時刻的狀態:

式中:ut為自循環狀態;ct為候選狀態;ft為輸入節點上遺忘門輸出;ht-1為隱層層上一時刻的狀態。

式中:σ為自循環函數;g為遺忘函數;W、R、b分別為網絡的輸入權重、循環權重以及網絡偏置。LSTM單元在t時刻的輸出:

式中:g2(ht)為輸出節點上遺忘門的輸出;ot=σ(Woxt+Royt-1+bo)為輸出閥門的輸出。通過在循環神經網絡單元上加入閥門,LSTM能夠判斷模型網絡的記憶態(之前網絡的狀態)在該層輸出的結果是否達到閾值,來決定是否將以往信息加入到當前該層的計算中。時間序列的長期依賴關系經過閥門控制后得以保存,這種決定歷史信息遺忘保留結構被證明是高效而科學的[19]。
綜上,本文首先通過EMD算法將負荷序列分解為多個分量,再利用特征工程選擇每一個分量對應的特征子集,以特征子集和負荷分量歷史數據為LSTM模型的輸入,對分量負荷分別進行預測,最終疊加各分量得到預測結果。構建臺區負荷短期預測方案如圖2所示。

圖2 基于EMD-LSTM模型的臺區負荷短期預測方案
與傅里葉變換和小波變換不同,EMD分解過程是一個有限次濾波過程,無須預先設定任何基函數,是一種自適應分解方法[20]。使用EMD分解將含有多個波動分量的負荷分解為多個頻率的固有模態函數(intrinsic mode function,IMF)。每個IMF都需要滿足以下2個條件。
(1)各IMF分量的跨零點個數必須與波峰波谷個數之和最多相差1。
(2)各IMF分量的極大值包絡線與極小值包絡線之和的平均值為0。
分解得到的IMF分量與原始負荷數據相比,具有更好的平穩性和更有規律的波動特性。因此,以各個IMF為預測目標減小了模型受到數據噪聲而發生梯度爆炸的可能。采用EMD分解臺區負荷的主要計算步驟如下:
步驟1 找出原始臺區負荷數據l(t)中所有局部極大值和極小值點,依據各個極值點利用樣條插值法構造出臺區負荷數據的上、下包絡線,原始臺區負荷數據被上下包絡線所包絡。
步驟2 求出上、下包絡線的均值曲線m1(t),再用原始數據l(t)減去均值曲線得到新的序列,即

步驟3 判斷N1(t)是否滿足IMF的兩個條件,如果滿足,將N1(t)從原始臺區負荷序列中分離,剩余的信號為殘差分量,即

N1(t)如果不滿足要求,將N1(t)作為新的信號,重復步驟1~2,直到得到的第1個滿足條件的N1(t)。
步驟4 檢查r1(t)是否為單調函數,若不是,則將r1(t)作為新的信號回到步驟1。
步驟5 不斷重復篩選步驟,得到最后的殘余分量,即

若殘余分量rm(t)為單調函數,則EMD分解完成。原始信號l(t)可由m個IMF和rm(t)表示:

以江蘇省某地市臺區負荷為例,將臺區負荷進行EMD分解的結果如圖3所示。

圖3 基于EMD算法的臺區負荷分解
經驗模態分解的自適應特性靈活的分解能力使其在處理具有隨波二象性的時間序列上具有明顯的優勢。
學習或訓練LSTM模型的過程是為了從數據集中學得匹配的“假設”更加逼近數據潛在的規律。數據驅動理念中,負荷預測過程并非算法至上,數據的質量以及特征選擇決定了監督學習模型的上限。如果特征選擇不當,使用再好的模型也無法突破特征工程決定的上限。下面將介紹本文在特征工程以及數據處理方面采用的方法。
為從各維度找出臺區短期負荷的影響因素,本文采用Pearson相關系數分析法分析各潛在影響因素與負荷的關系:

式中:ρX,Y為2個變量的相關系數;cov(X,Y)為2個變量間的協方差;σX、σY分別為2個變量的標準差。Pearson相關系數的取值范圍為-1~1之間,如果2個變量升降一致,則Pearson系數為正,如果2個變量升降相反,Pearson系數為負。Pearson系數的數學特征是不隨變量的位置或大小的變化而變化,它消除了2個變量變化幅度的影響,而只是單純反應2個變量每單位變化時的相似程度。Pearson系數的絕對值越大,則2個變量間的相關程度越高。
短期臺區負荷的一個特點是:明顯受到各種環境因素的影響,如季節更替、天氣突然變化。臺區負荷由于用電性質不同,還可能受到日類型(節假日、工作日),需求側響應策略(電價調控)等因素影響,這些因素都會直接或間接影響臺區負荷序列。本文采取的特征選擇策略是首先挑選出一個足夠大的特征向量,確保預測模型過配,在此基礎上,依據每一個IMF挑選出特征向量的子集作為LSTM的輸入。需要說明的是雖然短期臺區負荷的數據采集頻率為15/min,但一些特征的頻率是以天為單位的(如最高、最低溫度、日類型等)。針對這些特征,采取宏觀上分析每個特征與日均負荷序列lave(t)的相關性的方式進行特征選擇。選取跨度為1年的臺區負荷(日均值)序列,負荷向量的表達式如下。

通過式(8)求得特征向量以及它們與臺區負荷序列的Pearson相關系數見表1。

表1 各影響因素與臺區負荷相關性分析
表1中,Pearson相關系數越接近1,代表影響因素與臺區負荷升降一致性越高。日電價一欄中的Pearson數為小于0,代表日電價與臺區負荷呈接近負相關的關系。
使用深度神經網絡進行本征模函數預測主要可以分為如下幾個步驟:
步驟1 從特征集合中提取本征模函數的特征。
步驟2 定義網絡超參數,例如網絡層數、每層隱藏層神經元個數。
步驟3 將特征輸入模型,經過前向傳播和反向傳播完成模型的訓練。
步驟4 利用訓練好的模型對本征模函數進行預測。
特征提取采用上1節提出的相關性分析法,除前一天本征模函數值外,在剩余7個特征中選擇相關系數排名前5的特征作為模型的輸入,防止模型的過擬合和冗余特征導致預測精確度的下降。
深度神經網絡是由多個單層非線性網絡疊加而成,理論證明,2層神經網絡可以無限逼近任意連續函數。也就是說,面對復雜的非線性分類任務,2層(帶1個隱藏層)神經網絡可以分類得很好。網絡每層隱藏層LSTM單元個數依據訓練樣本的大小決定,為保證模型的泛化能力,一般網絡連接權數為訓練樣本數的1/3~1/10。最終構建的LSTM本征模函數結構如圖4所示。

圖4 基于LSTM的本征模函數預測模型
為驗證本文提出的考慮臺區負荷構成多樣性的EMD-LSTM臺區短期負荷預測模型,使用某地區10 kV配變臺區每15 min采集一次的實際負荷數據、地區氣象數據以及電價數據對模型的精確度進行測試。采用未經過經驗模態分解的LSTM網絡、循環神經網絡(Recurrent neural network,RNN)以及普通前饋神經網絡(Feedforward neural network,FNN)這3種深度學習算法作為參照。采用均方根誤差(root mean square error,RMSE)作為衡量精確度的標準。

式中:yp為臺區負荷預測值;yt為臺區負荷真實值;Nd為預測序列的長度,在本文中取值為96。負荷預測算法的精確度

實驗中構建深度學習模型的平臺是Python第3方神經網絡庫PyBrain。歷史數據的時間跨度為2018年6月6~2019年6月,將預處理后的歷史數據分為訓練集(90%)和測試集(10%)。使用EMD算法對整個負荷序列進行分解后,各深度學習模型通過訓練后完成臺區負荷的日前預測。
選擇重載、中載和輕載的典型臺區,利用不同模型預測這些供電臺區在2019年6月30日的負荷,各預測曲線和實際負荷曲線如圖5(a)~(c)所示。

圖5 不同深度學習模型臺區短期負荷預測結果
由圖中預測曲線與實際曲線的貼近性可見,本文提出的方法較目前各主流深度學習模型具有較高的預測精確度。其中輕載配變由于波動率較高,各深度學習模型的預測誤差在預測輕載配變時的誤差均比重載、中載配變負荷的預測誤差要大。以各供電臺區短期負荷預測測試集的誤差平均值衡量各模型的預測精確度,EMD-LSTM的預測精確度為90.72%,普通LSTM的預測精確度為86.38%,RNN的預測精確度為84.17%,FNN的預測精確度為83.95%,實驗結果證明了,本文提出的方法可以更好的擬合負荷曲線。
神經網絡的訓練時間是衡量模型實用性的重要標準之一,本文統計了不同深度學習模型在臺區負荷預測時訓練單個網絡所花的時間,結果見表2。

表2 不同算法單個模型平均訓練時間
表2表明,將臺區負荷分解為IMF分別預測,由于各IMF預測模型的特征維度減小,單個模型的訓練時間較普通LSTM要小很多。
隨著分布式電源、儲能裝置等各類終端在配電網的滲透率不斷提高,臺區負荷的構成愈發復雜,與天氣情況等影響因素的耦合度也越來越高。為避免構建統一臺區短期負荷預測模型帶來的特征冗余和過擬合,利用EMD算法將臺區負荷分解為多個本征模函數,以相關系數作為特征選擇的基準,將LSTM網絡用于預測各本征模函數。通過實驗分析,EMD-LSTM短期臺區負荷預測方案相較于FNN、RNN和LSTM算法優勢如下:
(1)將臺區負荷分解為多個波動頻率的分量,對每個分量分別進行特征選擇,避免了特征冗余帶來的訓練速度降低和精確度下降。
(2)使用2層LSTM網絡對各負荷分量分別預測,減少單一特征出現噪聲或劇烈波動對預測結果帶來的影響,提高模型的泛化能力。
(3)EMD-LSTM預測技術既具有一定的可解釋性,又符合數據驅動的理念,在臺區短期負荷預測方面,與傳統的深度學習算法相比具有更好的表現。