(上海電力大學 自動化工程學院,上海 200090)
隨著全球能源需求的不斷增長,化石能源日益短缺[1]。為緩解能源危機,減小環境污染帶來的影響,新能源發電越來越受關注。2011 年,美國學者杰里米·里夫金(Jeremy Rifkin)在其著作《第三次工業革命》中,以新能源技術和信息技術的深入結合為特征,首次提出能源互聯網的概念[2]。能源互聯網包括廣域能源互聯網和區域能源互聯網,廣域能源互聯網一般承擔遠距離的大型輸電,連接兩地大型能源基地;區域能源互聯網作為能源互聯網的重要表現形式,主要進行近距離輸配電,多用于經濟開發區、工業園區、電動汽車充放電等[3]。能源互聯網主要由天然氣、風電、光伏、儲能提供電熱,因此推進了多種能源形式協同運行,通過燃氣內燃機、燃氣輪機、風光發電以及生物質能發電,實現了能源的梯級利用和優勢互補,符合“融合”“統一”“高效”“清潔”的理念[4]。能源互聯網以其強大的耦合性為可再生能源產業發展提供保障,同時也成為智能電網的重要組成部分。
針對電網的可靠運行問題,很多學者進行了相關研究。文獻[5]介紹了神經網絡的特點,說明了能夠有效處理電力短期負荷預測數據的非線性變化問題。文獻[6]能夠達到較高的精度,但其優化尋優算法考慮的因素較多,模型復雜,訓練時間長,給實際應用帶來困難。文獻[7-8]采用人工神經網絡對負荷參數模型進行預測,但是精度不夠理想。文獻[9]采用改進的遺傳算法搜索全局最優值,以優化極限學習機算法等建立負荷預測的模型,預測結果基本可以滿足精度要求,但預測模型考慮了較多因素,模型構建復雜。文獻[10]對配電網進行負荷預測,并對不同層數的神經網絡模型進行了對比,結果顯示對于差異性較大的模型尚不能達到最優效果。文獻[11-12]闡述深度學習在電力負荷預測中的應用,列舉了常用的深度學習算法,對比分析之后驗證出LSTM(長短期記憶神經網絡)算法具有較高的精度,能夠較好地預測負荷的短期功率,因此本文算例分析中采用LSTM 算法進行建模。文獻[13]提出了一種改進的最小二乘向量機負荷預測模型,但模型預測結果依然存在較大誤差,無法保證整體相對平穩的預測精度。
與大電網相比,區域能源互聯網負荷隨機性很強,歷史負荷曲線相似度低,基本沒有規律可循;并且用戶容量有限,各用戶間負荷特征不夠明顯。本文算例分析中采用EEMD(集合經驗模態分解)方法對原始數據進行分解,能夠有效避免模態混疊現象[14];同時基于LSTM 較精準的預測效果,利用LSTM 對EEMD 方法得到的每個分量分別進行預測,以獲得更好的預測結果。
EEMD 由EMD(經驗模態分解)加入白噪聲后改進得出。對于非平穩數據,不需要考慮其他因素影響,可以使用EMD 方法得到一組能夠表現信號特征的數據。與小波變換等方法相比,這種方法是直觀的和自適應的。因為分解是基于信號序列時間尺度的局部特征,而EEMD 作為一種白噪聲輔助分析方法,在原始信號中加入多組隨機的白噪聲信號,能夠更有效地降低原始序列的波動性,其分解過程如圖1 所示。利用EEMD 方法可以將能源互聯網負荷序列分解成數個相對平穩的分量。相比于小波分析,EEMD 不需要對信號進行預先分析和研究,而是直接進行分解。

圖1 EEMD 過程
在本次模型建立中,將能源互聯網原始負荷序列x(t)中加入隨機白噪聲序列nm(t),得到加入噪聲信號后的待處理序列:

式中:N 為EMD 總體平均次數。
運用EMD 方法加入100 組有差別的隨機白噪聲序列,標準差取0.2。將區域能源互聯網原始負荷序列分解一次之后再加入均方根相等的白噪聲序列,經過N 次EMD,使信號重構達到較好的效果。通過此次分解,原始數據68 個典型日的采樣點共得到了7 個IMF 分量和1 個剩余分量,也就是區域能源互聯網原始負荷序列的EEMD結果。EEMD 能夠克服基函數無自適應的問題,把時間序列分解成若干個IMF 分量和殘余項R(t),即某個時刻采樣點的數值等于對應的各個IMF分量與殘余項相加。
為了解決RNN(循環神經網絡)在處理長期依賴性時產生的梯度消失問題,提出了在RNN 基礎上的改進算法LSTM,該算法在每個隱藏層中引入柵極和存儲單元的概念。一個LSTM 內存塊主要由輸入門、遺忘門、輸出門和自連接存儲單元4 個部分組成。輸入門控制對存儲單元的激活輸入,能夠學習如何過濾和輸出到連續網絡的激活單元。遺忘門幫助網絡忘記過去的輸入數據并重新設置記憶細胞,由sigmoid 單元將權重設置為0 和1 之間的值:當權重為0 時,表示將上一狀態的信息全部舍棄;當權重為1 時,表示將上一狀態的信息全部保留。此外,應用乘法門使存儲單元可以長時間訪問和存儲信息,每個單元中都包含存儲前一時刻信息的記憶細胞。因此,LSTM 作為一種深度神經網絡,具有更多的隱藏層,增加了計算的精度優勢。LSTM 的典型結構如圖2 所示,單個LSTM 神經元的預測結構如圖3 所示。LSTM 記憶細胞的運算過程為:

候選時刻記憶單元狀態:

當前時刻記憶單元狀態:

式中:Wf,Wi,Wc,Wo分別為遺忘門、輸入門、細胞狀態、輸出 門的權重矩陣;bf,bi,bc,bo分別為對應的偏置矢量;xt為輸入值;σ 為sigmoid函數;下標t 表示當前時刻,t-1 表示前一時刻。

圖2 LSTM 典型結構
從圖3 中可以看出,LSTM 包括各個向量的交互,使得結構相比于單一的神經網絡具有更多的層級。圖中“+”表示矩陣相加,“×”表示矩陣相乘。在進行負荷預測時,結合當前時刻的負荷輸入值與前一時刻的負荷輸出值賦予不同的權重矩陣和偏置矢量,使用tanh 函數和sigmoid 單元進行細胞狀態的更新。本次試驗設置隱藏層數為2,采用前48 個時刻預測后24 個時刻,訓練集和測試集設置比例為7:3。首先利用EEMD 方法對原始負荷數據進行分解,得出一組具有不同特征的分量;然后將分解后的各個分量分別送入LSTM 進行預測;最后將各個分量值累加,得到預測結果。

圖3 單個LSTM 神經元的預測結構
本文提出基于EEMD-LSTM 的區域能源互聯網系統日前小時負荷預測模型,對應流程如圖4所示。對于歷史區域能源互聯網小時出力序列,首先采用EEMD 方法分解得到一組分量,每個分量數據歸一化到[0,1]范圍內,然后建立對應的LSTM 模型進行預測,將結果進行反歸一化,并疊加各個分量即日前區域能源互聯網系統小時負荷預測值,最后將輸出的預測結果與原始負荷數據進行對比,并進行誤差分析。
為了更直觀地對比預測結果,本次算例選用預測結果誤差分析常用的APE(相對百分比誤差,量符號為EAP)進行作圖分析,對比各個算法的誤差結果。使用MAPE(平均絕對百分比誤差,量符號為EMAP)、MSE(均方誤差,量符號為EMS)和RMSE(均方根誤差,量符號為ERMS)分別對預測結果進行評估,各個誤差的表達式分別為:


圖4 EEMD-LSTM 流程

式中:n 為數據總個數;Yi為第i 個實際值;yi為第i 個預測值。
本文以某區域能源互聯網系統各單元總負荷數據為研究對象,選取2017 年1 月1 日00:00 至2017 年3 月9 日24:00,共計68 個典型日,采樣時間間隔為1 h,共計1 632 個點。LSTM 的迭代次數設置為100 次,隱藏層數為2,訓練集和測試集設置比例為7:3。尋找最優的預測模型之后,把預測樣本作為輸入值代入最優模型中并得到2017 年3 月9 日的預測值。采用EEMD 方法對原始負荷序列進行分解,結果如圖5 所示。
通過圖5 各個分量圖可以更直觀地看出,所有IMF 分量均反映出頻率從高到低的不同尺度的系統負荷序列波動特性。IMF1 的平均振幅小,在所有分量中頻率最高,并且規律性不明顯,可以判斷為負荷序列中的隨機分量;IMF2—IMF4具有較好的規律性,周期性較為明顯,而且曲線的幅值隨著時間的推移有所增長,可以反映出負荷序列的局部波動情況,因此這些IMF 分量可判定為負荷序列的細節分量;其余的IMF 分量和余量R(t)的平均振幅大,具有很好的周期性和規律性,尤其是余項反映了負荷曲線的全局變化趨勢,因此IMF5—IMF7 以及余量R(t)為負荷序列的趨勢分量。

圖5 原始負荷數據的EEMD 結果
為了驗證本文預測模型的可行性,選取了另外3 種模型與其進行對比,其中一個模型采用單一的LSTM,另一個模型采用EMD-LSTM 算法,最后一個為其他的單一神經網絡模型——Elman神經網絡。選取2017-01-01 T 00:00—03-09 T 24:00 期間,時間間隔1 h 的采樣點,共計1 632個點。對后24 個采樣點進行預測,即對3 月9 日00:00 —24:00 采樣點數據進行對比分析。預測結果如圖6 所示,預測相對誤差如圖7 所示,預測誤差數據對比見表1。

圖6 系統3 月9 日負荷預測結果(采樣間隔1 h)

圖7 系統3 月9 日負荷預測相對誤差對比(采樣間隔1 h)
由圖7 可以看出,EEMD-LSTM 算法的相對誤差波動性較小。由表1 可以看出,采用EEMDLSTM 模型的預測精度最高,其MAPE 和MSE 比其他模型的值都要小,驗證了LSTM 算法的可行性,同時證明了EEMD 方法能降低原始序列的非平穩性對預測精度的影響。

表1 系統負荷預測誤差數據對比(采樣間隔1 h)
由表1 可以看出,單一神經網絡進行比較時,LSTM 的預測精度比Elman 要高,加入白噪聲運用EEMD 方法進行原始負荷數據分解后,能夠克服EMD 方法分解的不足,預測精度有明顯提高。從整體來看,基于EEMD-LSTM 算法的預測結果很少出現相對誤差極大的點。而另外兩種模型的預測結果中,往往會出現較多相對誤差極大的“失真點”。采用MAPE,MSE 和RMSE 作為評價指標,算例分析得出的值越小,說明模型的預測精度越高。
為了驗證本文提出算法的有效性和適用性,使用間隔15 min 采樣點進行預測對比。現仍采用2017-01-01 T 00:00—03-09 T 24:00 期間,時間間隔為15 min 的采樣點,共計6 528 個點。對后24 個采樣點進行預測,即對3 月9 日19:00—24:00采樣點數據進行對比分析。預測結果如圖8 所示,為便于與前例對比分析,誤差預測結果如圖9 所示,預測誤差數據對比見表2。
由表1 和表2 對比分析可以得出,數據量由1 632 個采樣點增大到6 528 個采樣點時,EEMDLSTM 構造的預測模型的精度最高。同時,驗證了在單一算法中LSTM 相對于Elman 的優越性。在組合預測中,EEMD-LSTM 能夠比EMD-LSTM取得更好的效果,算法對比表明了EEMD-LSTM的優越性。
使用同時段的數據,采樣時間間隔15 min,共計6 528 個采樣點,預測3 月9 日全天的負荷預測值,結果如圖10 所示。訓練集與測試集比例不變,將迭代次數增加至150 次,EEMD-LSTM模型的MAPE 維持在3.5%左右,進一步驗證了數據量增大時EEMD-LSTM 算法的優越性。由于預測點增多,需要擴大預測的維度及增加迭代次數。當需要預測的點增加時,精度會有所下降,計算時間也會增長。但相比于原始數據采樣點較少時的預測結果來說,當數據量增大時,EEMDLSTM 的預測結果能夠達到更精準的效果。

圖8 系統3 月9 日19:00—24:00 負荷預測結果(采樣間隔15 min)

圖9 系統3 月9 日19:00—24:00 負荷預測相對誤差對比(采樣間隔15 min)

表2 預測誤差數據對比(采樣間隔15 min)

圖10 系統3 月9 日全天負荷預測結果(采樣間隔15 min)
針對區域能源互聯網發電短期負荷功率預測的準確性問題,本文提出了一種基于EEMDLSTM 算法的區域能源互聯網系統小時負荷預測模型。EEMD-LSTM 模型能夠有效克服原始信號中的不確定因素,并且利用LSTM 存儲單元長時間學習和保留電力負荷歷史數據中的有用信息,并使用遺忘門將無用信息去除,然后將EEMD 得出的每一個分量送入LSTM 算法中進行預測,對結果進行疊加處理后得出最終的預測結果。
為便于對比分析,本文使用傳統的Elman 算法、單一的LSTM 算法以及EMD-LSTM 構建模型,使用相同的數據采樣點建模,對比各個模型預測結果曲線的擬合情況,并對結果進行了誤差分析。針對區域能源互聯網系統短期負荷序列的無規律波動特性,與EMD 相比,EEMD 能更有效地降低對預測結果的影響,EEMD-LSTM 能夠更準確地對負荷進行預測。當需要預測的數據增多時,預測模型的運算時間會稍有延長。當原始數據量增大而需要預測的采樣點不增加時,EEMD-LSTM 體現出了精度更高的優越性。因此,EEMD-LSTM 基本能夠滿足區域能源互聯網短期負荷預測的要求,為能源互聯網電力系統的平穩運行提供一定參考。