王雪菲, 李 勇, 余國曉, 程 晨, 楊輝軍
(1.安徽國際商務職業學院 信息工程學院, 合肥 231131; 2.安徽財經大學 統計與應用數學學院, 蚌埠 233030;3.安徽大學 電子信息工程學院, 合肥 230601)
當今時代,電力系統安全、高效地運行是經濟社會發展的基本支撐,而持續保障電力系統平穩有序運營的重要途徑之一就是對電力負荷在不同時間跨度上進行針對性的有效預測[1]。根據預測的時間跨度,負荷預測被分為短期、中期和長期預測,而電力系統配件的檢測維修、電網發電機組等設備的啟動和關停以及不同地域之間的供需平衡是決定電網運行效益、降低成本和提高效率的關鍵,精確的短期預測對以上工作大有裨益[2]。
目前,常用的短期電力負荷預測方法主要分為時間序列方法和機器學習方法兩大類[3]。其中時間序列方法包括多元線性回歸法[4-5]、指數平滑模型法[6]和自回歸積分移動平均模型法[7-8]等。這些方法考慮了負荷數據的時序性特點,根據歷史負荷值來預測未來負荷值,建模簡單,但反映負荷序列的非線性行為能力較弱,且在預測精度上關注度不夠。機器學習方法主要包括模糊系統、神經網絡和支持向量機(Support vector machine,SVM)等。文獻[9]將支持向量機與計量經濟學中的協整檢驗以及Granger因果檢驗結合起來預測經過季節分解的電力負荷。文獻[10-11]使用BP神經網絡(Back propagation,BP)對相應的負荷數據進行預測,文獻[12-13]則針對短期用電負荷建立了人工神經網絡模型進行處理預測。文獻[14]以相關性數據作為電力負荷日預測的基礎,通過相關性分析方法在模糊推理和灰色關聯分析的基礎上得出。機器學習方法能夠較好地逼近非線性負荷曲線,但是缺少對負荷數據時序相關性的考慮,需要人為選擇時間特征來保證預測的精度。為了充分評估負荷序列隨時間波動的特性,含外部輸入的NARX被逐漸運用在負荷預測領域[15-17]。NARX網絡是一種有效用于時間序列預測的非線性動態循環神經網絡,該網絡當前時刻的輸出不僅與當前時刻的輸入有關,還與之前的輸入輸出有關,所以在數據非線性和時序性的處理上有所加強,但是在識別負荷序列潛在變化趨勢上依然有所欠缺,無法充分提取出短期負荷數據之間蘊含的有效信息。
針對上述問題,提出一種基于DMD-NARX模型的短期電力負荷預測方法,有效提高了短期負荷預測精度。首先,運用ACF分析歷史負荷數據獲取相應日期內基于相應短期負荷波動時間規律特性的輸入特征集合。其次,將該集合做歸一化處理,然后運用Hankel把現有的單變量輸入特征序列轉換為多維數據矩陣,同時通過DMD模型將矩陣特征分解并取得動態模態估計。最后,將DMD方法得出的動態模態作為NARX神經網絡的外部輸入特征,并運用此模型推導出相應日期內各時段負荷的分布。
由于相鄰時刻之間的負荷波動相對較小,同時短期內電力負荷的變化與時間存在內在聯系,因此要分析出非連續負荷數據之間的潛在聯系,本文須把目標時刻負荷作為參照,同時分析過去時刻負荷對目標負荷的影響[18]。同時,ACF標準的大量推廣,就是為了能夠選擇出適宜的輸入特征集合,并推導出負荷數據中的潛在聯系[19]。假設一天的負荷序列表示為p=[pt:t∈T],則t時刻與t-k時刻負荷間的自相關系數如式(1)所示:
(1)

在已有歷史數據的基礎上,結合ACF分析可以推導出3個最強相關性的滯后變量:上周同一日同時刻的值、t時刻前一時刻的值和前兩日同時刻的值。基于以上分析,同時考慮到雙休日的用電負荷普遍比工作日的用電負荷低,預測輸入特征包括上周同一日的負荷數據、上周前一日的負荷數據以及前兩日的負荷數據,因此本文取得的星期一、星期二和雙休日輸入特征集合需要分別表示[20]。星期一和星期二都是工作日,考慮到工作日之間的用電負荷相比較而言波動不大,所以其對應的輸入特征集合分別由上周星期一到星期四的用電負荷、星期一和上周星期一到星期三的用電負荷構成;雙休日兩天的輸入特征集合分別由星期五、上周星期五、上周星期六和上上周星期六的用電負荷和星期六、上周星期六、上周星期天和上上周星期天的用電負荷構成。不同預測日期的具體輸入特征集合如表1所示,其中,Pset表示預測日期的輸入特征集合,pD-d(d=1,2,4,5,6,7,8,14)表示預測日期之前d天所對應的日負荷。

表1 不同預測日期輸入特征集合
短期負荷序列是一組非線性時間信號,可由多個影響因素疊加組成,為了進一步提高短期負荷預測精度,需要精準獲取負荷序列的動態特征,但是負荷序列的動態特征往往受到多種因素影響。通過將一維矩陣轉為多維矩陣負荷序列轉換的過程,有效提升后期DMD方法對電力負荷數據的變化趨勢和底層多尺度動態的抓取能力,其中也包括對負荷數據矩陣進行特征分解和動態模態估計能力的提升。
首先,將預測日期輸入特征集合Pset構建為輸入特征序列Pis=[p1,p2,…,pk,…,pM],并對Pis進行歸一化處理,歸一化形式為:
(2)
式中:xi為歸一化后的輸入特征;pmax和pmin分別表示序列Pis的最大和最小值。

(3)
DMD方法是圍繞線性Koopman算子概念發展的數據驅動的矩陣分解技術[22],通常應用于流體分析、復雜系統構建以及數據挖掘等方面。將空間維度上的主成分分析結合時間維度上的功率譜分析是DMD方法的創新點所在[23],這種方法和只能提取一種模態的方法相比,由于可以在兩者結合的基礎上再提取出數據的時間和空間模態,DMD可以更加精確地感知到數據中存在的潛在趨勢性。
假設X1和X2是由Hankel矩陣X創建的觀察矩陣,數據按照Δt時間間隔開,并且隨時間重疊。
X1=[x1,x2,…,xL-1]
(4)
X2=[x2,x3,…,xL]
(5)
在 Koopman 算子線性映射的運算策略基礎上,一個與系統矩陣A實現相鄰時刻狀態的投影關聯也可推導出,即xj+1=Axj,基于上述分析,式(4)和式(5)可進一步轉換為:
X1=[x1,Ax1,…,AL-2x1]
(6)
X2=AX1
(7)
當前,觀察矩陣X2的系統特性可通過矩陣A的屬性,如特征值和特征向量等反映出來。需要指出的是,當動態系統變化逐漸變緩,線性依賴關系將在各個數據之間逐漸形成[24],即X2中的觀測值xL可以由前一時刻X1中L-1個觀測值的加權線性組合表示:
xL=a1x1+a2x2+…+aL-1xL-1+r=X1a+r
(8)
式中:a1,a2,…,aL-1是L-1個觀測值的權重;r是長度為S的殘差向量。基于此,可推導出以下公式:
(9)

X2=AUΣVH=UΣVHB
(10)
B=VΣ?UHX2
(11)
(12)
式中:?是偽逆操作。對式(12)進行特征分解可得:
(13)

Ψ=UW
(14)
Ψ的每一列是對應于Λ中特征值λi的DMD模態。結合式(14),Ψ推導出最終估計的模態如下:
(15)
式中:C=Ψ?x1表示DMD模態的初始幅度;Ω=ln(Λ)/Δt;t是一天中的時刻點。
NARX神經網絡是一種動態循環網絡,這種網絡可以通過輸入和反饋連接同時采用時間延遲的條件下獲得,并且能夠在下一次的迭代訓練中在輸入端使用輸出信號,同時由于其本身的記憶體系較強,所以在對復雜映射關系的時變系統的描述上具備更強的能力,這也是該體系在非線性時間序列預測領域被廣泛應用的原因[25]。與傳統的循環神經網絡(Recurrent neural network,RNN)綜合比較,NARX在學習能力、收斂速度、泛化性能以及預測精度等方面表現出了更好的效果[26]。NARX的數學表達式為:
(16)

典型的NARX神經網絡主要包括輸入層、隱含層、輸出層及輸入和輸出延時層幾個部分,其基本結構如圖1所示。圖中,wih、who和wjh表示各層鏈接之間的權重;b0和bh均表示閾值;fh(·)和fo(·)分別是隱含層和輸出層的功能函數;z-1表示一個步長的延遲。

圖1 NARX神經網絡結構圖
NARX隱含層的作用是剔除不重要的信息,并在此基礎上存儲重要的信息。原則上隱含層層數與模型的非線性映射能力成正比,即層數越多,擬合效果越好。但是層數的增加也會導致訓練時間的增長,所以一般會綜合考慮,選擇相對用時較少、性價比較高的方案。根據Kolmogorov定理,任意的非線性特性最多只需兩層隱含層便可辨識出[27],因此,模型只需選取一個隱含層即可,在此條件下既可以保障模型預測結果的匹配度,又可以節約大量的時間[28]。同時,按照以下的經驗公式選取隱含層節點數,劃定隱含層節點范圍:
(17)
式中:h為隱含層節點個數;mi為輸入層的節點個數;mo為輸出層的節點個數。
基于DMD-NARX模型的短期電力負荷預測模型的主體結構由兩塊構成,DMD部分主要用于特征提取,NARX網絡主要負責電力數據負荷的預測。負荷數據集因系統故障等原因,可能存在個別數據異常情況,異常數據往往和正常數值偏離較大,可采用模糊聚類[29]、神經網絡和基于最大閾值法[30]等方法修正異常數據。模型流程圖和模型整體程序偽代碼分別如圖2和表2所示。

圖2 短期負荷預測模型流程圖

表2 整體程序偽代碼
(1)對以往的歷史實際數據進行收集,并將數據進行一系列預處理,即對異常值進行修正,將其分為訓練集和測試集;
(2)根據ACF分析結果,構建訓練集和測試集的輸入特征集合;
(3)先進行輸入特征集合到輸入特征序列的轉換,并在成功完成歸一化運算處理后將處理結果轉換為多維特征Hankel矩陣,其滑窗的長度一般為一維特征序列總長度的四分之一;
(4)以Hankel矩陣為基礎創建DMD的觀察矩陣,然后通過DMD方法估計出負荷系統的動態模態;
(5)經過(4)的推導運算可得到NARX神經網絡的外部輸入特征,與動態模態對應時刻的歷史負荷作為網絡輸出;
(6)在確定了延遲階數和隱含層節點數之后,可以基于神經網絡進行相應訓練,在訓練所得精度達到規定標準后可使用模型對測試集進行相應預測。
為驗證本文所提方法的有效性和普適性,使用兩個負荷數據集對模型進行驗證,并將本文所提方法和NARX模型、傳統RNN模型以及SVM模型方法的預測結果進行對比分析,為保證測試的嚴謹性,每種模型的輸入輸出特征以及預測時間點必須保持一致。兩個負荷數據集分別是澳大利亞新南威爾士州公開數據集和中國安徽省合肥市的實際電力負荷數據集。新南威爾士州公開數據集提供了2006年1月1日至2010年12月31日共5年的電力負荷數據,每天取48個采樣值,即采樣頻率是30分鐘。合肥市的實際電力負荷數據集包括2016年1月1日至2017年12月31日共2年的電力負荷數據,每天取24個采樣值,即采樣頻率是60分鐘。
本文選取的各種模型預測精度評價指標為平均絕對百分比誤差(Mean absolute percentage error,MAPE)和均方根誤差(Root mean square error,RMSE)。MAPE取值越小,模型的預測性能越好,其結果可以評價模型的優良性。而RMSE同樣是取值越小越好,同時由于其對極大或極小誤差的敏感度較高,其運算結果也可用以評價模型的預測精度。兩個評價指標表達式為:
(18)
(19)

由于電力需求數據的變化與不同季節氣候的變化息息相關,因此若要充分驗證模型識別氣候和季節特征變化的能力,就必須通過對4個不同季節中負荷預測的結果進行分析,對比凸顯本文所建模型的預測能力。對比測試中使用相同地區不同季節的前10周作為訓練集(春季9月~11月、夏季12月~2月、秋季3月~5月、冬季6月~8月),在此基礎上同時對后一周電力負荷數據進行預測。圖(3)所示是對相同地區不同季節中的某一天的預測結果進行對比。
根據圖3觀察得出,對比分析不同季節負荷數據的預測結果,與其對比方法相比,本文所提出的基于DMD-NARX模型方法,對原始負荷曲線具有更好的擬合能力,同時,由于電力負荷數據底層的變化趨勢能夠被DMD有效識別,因此,本文所建立的模型在負荷曲線波動較大的位置上亦可表現出更高的擬合度,從而驗證了本文所提方法對提高短期負荷預測精度的有效性。

圖3 不同季節日負荷預測結果對比
表3為不同方法對4個季節中某一天負荷預測的精度結果。由此可見,本文所提方法預測精度的平均值高于其他3種方法,其中eMAPE誤差的平均值為0.57%,相比NARX模型、RNN模型和SVM模型方法精度分別提高了46.73%、60.14%和57.46%;eRMSE誤差的平均值為66.38 MW,相比NARX模型、RNN模型和SVM模型方法,誤差分別降低了69.52、92.09和82.34 MW。結合不同季節相應日期預測結果可以看出,NARX模型對時序預測的問題也取得了良好的效果,說明該模型對歷史負荷信息的利用效率較高。下一步將DMD分解導入NARX神經網絡模型中,通過這種方法在增強預測模型對負荷數據之間潛在關聯和底層變化發掘能力的基礎上,進一步增強了模型預測精度。

表3 不同季節預測日期負荷預測精度對比
表4為2007年2月17日部分時刻的負荷預測結果。從eMAPE誤差的平均值可以看出,本文所提出的DMD-NARX模型和NARX對比模型各時刻點的eMAPE誤差平均值為0.50%和1.42%,相比于SVM模型和RNN模型精度分別提高了75.73%和31.07%以及76.53%和33.33%。在NARX模型中,雖然個別時刻點預測精度接近99.95%,預測結果相對準確,但由于整體預測結果偏差較大,誤差最大值達到9.82%,降低了模型整體的預測性能。而引入了DMD方法的NARX模型很好地解決了預測結果波動較大的問題,誤差范圍基本穩定在0.50%左右,既提高了負荷預測精度,又保證了預測結果穩定性。

表4 2007年2月17日部分時刻負荷預測結果
將合肥市數據劃分為兩種數據集,神經網絡常用訓練集占總樣本數據的2/3以上,為了保證預測模型的有效性,訓練集是前10周的數據,測試集為后1周的數據,使用各類模型方法預測測試集的日負荷。圖4為測試集在各類模型運行下的結果對比。

圖4 各模型預測日期負荷結果對比
從幾種不同方法預測結果的比較中可以看出,與原始負荷曲線擬合度相對較高的是DMD-NARX模型方法,即使在負荷變化較大的區域,DMD-NARX模型方法同樣能進行較為準確的預測,且預測效果優于其它方法,這與對新南威爾士州負荷預測結果的分析是相同的,在負荷序列潛在變化趨勢的抓取能力上,本文所使用的DMD方法具有一定優勢,因此在電力負荷曲線出現較大范圍波動時也表現出較高的擬合度。
表5為不同方法對2017年6月某周五的負荷預測精度對比。從表中可知,本文所提出的DMD-NARX模型方法的預測效果優于其他3種方法,eMAPE和eRMSE指標的精度分別是0.56%和98.78 MW,比其它3種方法精度平均提高了56.38%和59.93%,驗證了所提模型對提高負荷預測精度的有效性及普適性。

表5 各模型預測日期負荷精度對比
提出一種基于DMD-NARX模型的短期電力負荷預測方法,得出以下結論:
(1)通過考慮負荷序列的時序變化規律和數據潛在的變化趨勢,將DMD方法引入NARX模型中,既加大了對負荷序列潛在變化趨勢的發掘深度,又提高了對負荷序列非線性變化的模型識別水平,同時針對負荷曲線波動較大的情況具備了更強的擬合能力,提升了預測模型的整體性能。
(2)與單一模型和其組合模型相比,本文所提出的DMD-NARX模型能夠在預測精度高的同時保證模型的普適性能,符合負荷預測的實際需求。
(3)后續將結合注意力機制、殘差網絡等技術,充分挖掘更多可表征的預測特征,進一步提升預測精度。