洪小林
(河海大學(xué) 理學(xué)院,江蘇 南京 210098)
電力需求預(yù)測是智能電網(wǎng)的重要組成部分。通過應(yīng)用智能電網(wǎng)系統(tǒng)可以有效地管理電能并提高經(jīng)濟(jì)效益,智能電網(wǎng)中的電能調(diào)度管理要求預(yù)測不同設(shè)施的電力需求。電力需求波動性評估與智能需求響應(yīng)相互作用,實(shí)時監(jiān)測電能并管理電能需求[1]。預(yù)測電能使用量以確保充足的電能供應(yīng)與提高電能效率密切相關(guān),準(zhǔn)確預(yù)測電能需求可以減少能源浪費(fèi),提高能源利用的可持續(xù)性。
文獻(xiàn)[2]使用支持向量機(jī)(SVM)和用電數(shù)據(jù)對電力需求進(jìn)行了預(yù)測。然而,僅使用機(jī)器學(xué)習(xí)算法無法識別特定時區(qū)的變化,因此僅從歷史用電數(shù)據(jù)很難準(zhǔn)確預(yù)測電力需求。文獻(xiàn)[3]通過預(yù)測每個時區(qū)電力需求波動來提高準(zhǔn)確性。同時,電力需求預(yù)測系統(tǒng)還需進(jìn)行數(shù)據(jù)采集、預(yù)處理、特征提取等各個環(huán)節(jié),因此電力需求預(yù)測系統(tǒng)需要耗費(fèi)大量的時間和計(jì)算[4]。由于每個用電設(shè)施都有各自的使用模式,而且用電量、詳細(xì)用電量和額定容量各不相同[5],因此,還需通過深度學(xué)習(xí)對電力需求波動性進(jìn)行分析。文獻(xiàn)[6]按季節(jié)、日、月和小時對數(shù)據(jù)進(jìn)行分析后發(fā)現(xiàn)電力需求的波動模式。
本文基于深度學(xué)習(xí)對每個用電設(shè)施進(jìn)行了電力需求預(yù)測,以長短期記憶網(wǎng)絡(luò)(LSTM)深度學(xué)習(xí)方法為基礎(chǔ),利用混合數(shù)據(jù)抽樣(MIDAS)方法對自回歸分布滯后(ARDL)進(jìn)行改進(jìn),提出了LSTM+MIDAS模型的電力需求預(yù)測方法。通過收集住宅、工廠、醫(yī)院和市政廳等4個設(shè)施的電力需求來計(jì)算每種電力需求使用模式的預(yù)測精度。該模型能夠與實(shí)際使用情況相比較以此確定不合格的波動性,并提供高精度的預(yù)測結(jié)果,通過數(shù)值計(jì)算估計(jì)影響電力需求的不同數(shù)據(jù)形式。
ARDL利用分析時間序列數(shù)據(jù)的動態(tài)回歸分析,可實(shí)現(xiàn)預(yù)測電力需求誤差修正和協(xié)整。在電力需求預(yù)測中,ARDL方法假設(shè)月電力需求影響幾年前的電力需求并包含自回歸階數(shù),采暖度日和降溫度日包含在上月的自變量中。統(tǒng)計(jì)顯著性水平可以根據(jù)使用情況采用不同的模型來確定。因此,從周數(shù)據(jù)(xt)可以預(yù)測第t月第j周的月數(shù)據(jù)(yt),則因變量Ay和自變量Ax的自回歸度ARDL(Ay,Ax)模型為:
(1)
式中,μ為固定參數(shù);αi和βj分別為月數(shù)據(jù)和周數(shù)據(jù)的系數(shù);ut為滯后項(xiàng)。
假設(shè)月份固定為4周:j=1,2,3,4。由于用電需求的特點(diǎn),電力需求預(yù)測對溫度和季節(jié)因素非常敏感,歷史數(shù)據(jù)越早,對預(yù)測數(shù)據(jù)的影響就越小[7]。因此,應(yīng)為每個歷史數(shù)據(jù)分配不同的權(quán)重,進(jìn)而更準(zhǔn)確地預(yù)測電力需求[8]。如果為式(1)中的周數(shù)據(jù)賦予不同的權(quán)重,則可以導(dǎo)出:
(2)
式中,a為固定參數(shù);w為1周;bt為滯后項(xiàng);βw,t-j為權(quán)重為w的周數(shù)據(jù)xw,t-j的系數(shù)。
利用式(2)計(jì)算ARDL(1,2)時,x的估計(jì)系數(shù)數(shù)量為8(2×4)。本文中使用的數(shù)據(jù)是日數(shù)據(jù),因此假設(shè)每月30 d,則估計(jì)系數(shù)數(shù)量為60(2×30)。在這種情況下,由于自由度損失,模型本身的估計(jì)變得困難,結(jié)果的可靠性也很低。
與ARDL方法類似,使用MIDAS方法的電力需求預(yù)測系統(tǒng)通過回歸模型對用電需求進(jìn)行預(yù)測。MIDAS最大的優(yōu)點(diǎn)是權(quán)重函數(shù)自動分配:
(3)
式中,θ為權(quán)重函數(shù)的參數(shù)向量;Nw為周數(shù);Dy和Dx分別為每月和每周的天數(shù)。
式(3)中的MIDAS與式(1)中的ARDL相似,但包含函數(shù)φ(j;θ),該函數(shù)對高頻(滯后)施加不同的權(quán)重[9]。因此,當(dāng)通過MIDAS逼近法預(yù)測電力需求時,可以通過考慮電力需求數(shù)據(jù)之外的各種外部因素來進(jìn)行預(yù)測,而無需調(diào)整權(quán)重函數(shù)的參數(shù)。
為了根據(jù)頻率分配不同的權(quán)重,采用MIDAS方法中的權(quán)重函數(shù),通過將溫度、工作日數(shù)設(shè)置為自變量,可以提高短期電力需求預(yù)測的準(zhǔn)確性[10]。周六設(shè)置為半天,不包括節(jié)假日和周日,并將工作日數(shù)相加[11]。另外,由于可以通過分離工作日和周末電力需求數(shù)據(jù)來分析電力需求的波動模式。因此,可以在工作日和周末之間電力需求差異較大的設(shè)施進(jìn)行預(yù)測。
本文的數(shù)據(jù)集和LSTM電力需求預(yù)測模型框架結(jié)構(gòu),如圖1所示。

圖1 預(yù)測方法的框架結(jié)構(gòu)
為了識別預(yù)測模式,本文將數(shù)據(jù)分為短期數(shù)據(jù)和長期數(shù)據(jù)。根據(jù)電力需求,通過收集每個設(shè)施的數(shù)據(jù)進(jìn)行實(shí)驗(yàn)。通過測量3種實(shí)驗(yàn)方法的預(yù)測誤差率,對不同時期(短期和長期)的數(shù)據(jù)來評估預(yù)測模型:①現(xiàn)有的電力需求預(yù)測MIDAS算法;②現(xiàn)有的LSTM模型;③本文提出的LSTM+MIDAS模型。利用這3種方法對短期數(shù)據(jù)和長期數(shù)據(jù)進(jìn)行實(shí)驗(yàn),從而比較預(yù)測精度的差異。對于具有較大變化電力需求模式的住宅設(shè)施,還需從季節(jié)、天氣和假日等方面進(jìn)行分析。最后,本文將LSTM+MIDAS模型的性能與其他現(xiàn)有研究進(jìn)行比較。
不同設(shè)施的平均最大電力需求數(shù)據(jù)集如圖2所示。

圖2 不同設(shè)施的平均最大電力需求
在圖2中,以住宅和市政廳為例,夏季(6月—8月)平均最大電力需求呈上升趨勢,但市政廳平均最大電力需求較高,并且冬季(11月至次年1月)與夏季無差異。雖然各設(shè)施的電力需求差異較大,但工廠的平均最大電力需求最為相似,每年的用電量在600~700 kWh。醫(yī)院的最大用電需求在4個設(shè)施中最高,在5月—9月氣溫上升期間,表現(xiàn)出最高的電力需求。然而,住宅在夏季和冬季的最大電力需求差異最大,在除夏季以外的其他季節(jié)中,最大電力需求表現(xiàn)出相似的模式。因此,本文對住宅的季節(jié)性電力需求預(yù)測進(jìn)行進(jìn)一步的實(shí)驗(yàn)。
2019年11月至2020年10月,通過安裝在各類設(shè)施(住宅、醫(yī)院、市政廳、工廠)的電力計(jì)量傳感器收集電力需求。利用住宅、工廠、醫(yī)院和市政廳等4個設(shè)施的電力需求來計(jì)算每種電力需求使用模式的預(yù)測精度。收集用電數(shù)據(jù)以每天5 min的頻率共收集288個數(shù)據(jù)組成。數(shù)據(jù)集的輸入和輸出見表1。

表1 數(shù)據(jù)集的輸入和輸出
使用表1中的不同數(shù)據(jù)成分進(jìn)行短期、長期和季節(jié)性預(yù)測。根據(jù)季節(jié)特征,將冬季劃分為2019年11月至2020年1月,夏季為2020年6月—8月。
利用表1給出了輸入和輸出數(shù)據(jù)集的結(jié)構(gòu),在LSTM模塊中,輸入的訓(xùn)練數(shù)據(jù)與測試數(shù)據(jù)的比例為2∶1。由于一周中每天的電力需求模式相似,輸入數(shù)據(jù)(訓(xùn)練數(shù)據(jù)和測試數(shù)據(jù))和輸出數(shù)據(jù)由同一天(7 d滯后)數(shù)據(jù)組成。在短期預(yù)測中,利用前3周的3個7 d滯后數(shù)據(jù)來預(yù)測下一周同一天的數(shù)據(jù)。在長期預(yù)測中,利用前12周的12個7 d滯后數(shù)據(jù)來預(yù)測未來4周內(nèi)同一天的數(shù)據(jù)。例如,在預(yù)測未來4周內(nèi)每周一的電力需求數(shù)據(jù)時,將前12周的數(shù)據(jù)用作訓(xùn)練數(shù)據(jù)和測試數(shù)據(jù)。同樣,在季節(jié)性數(shù)據(jù)預(yù)測中,用前9周的7 d滯后數(shù)據(jù)來預(yù)測未來3周。根據(jù)3個模型的輸入和輸出數(shù)據(jù)提出的LSTM結(jié)構(gòu)流程如圖3所示。

圖3 各LSTM模型流程
在LSTM+MIDAS電力需求預(yù)測模型中,輸入電力需求作為輸入數(shù)據(jù)之前,通過對影響預(yù)測數(shù)據(jù)波動性的輸入數(shù)據(jù)賦予不同的權(quán)重進(jìn)行預(yù)處理。因此,使用MIDAS逼近法的權(quán)重函數(shù)對每天輸入的數(shù)據(jù)進(jìn)行加權(quán),類似于預(yù)測的波動性。

(4)
利用式(4)對數(shù)據(jù)進(jìn)行預(yù)處理:
(5)
式(4)為ALMOD指數(shù)函數(shù),主要用作MIDAS回歸方法的加權(quán)函數(shù)[12]。其中,θ為權(quán)重函數(shù)的參數(shù)向量。權(quán)重函數(shù)的形狀和速度取決于θ值,為了實(shí)現(xiàn)權(quán)重的指數(shù)增加,將θ值設(shè)置在-0.002~0.010。W為W(n;θ)的向量矩陣;b為偏差系數(shù)。如果加權(quán)計(jì)算后的值與原始數(shù)據(jù)相差太大,則通過調(diào)整偏差值進(jìn)行調(diào)整,偏差在-0.03~4.25。
考慮到電力需求的波動性,本文采用能夠反映現(xiàn)有MIDAS中使用的權(quán)重函數(shù)值來建立適合于時間序列預(yù)測的LSTM模型。使用的LSTM+MIDAS電力需求模型的結(jié)構(gòu)如圖4所示。

圖4 LSTM+MIDAS模型的結(jié)構(gòu)
在LSTM+MIDAS模型中,輸入層的輸入數(shù)據(jù)作為參數(shù)輸入到輸入門、遺忘門和輸出門中。輸入?yún)?shù)值通過計(jì)算權(quán)重和偏差值輸入。在每個門處,根據(jù)時間計(jì)算不同的值。圖4的LSTM結(jié)構(gòu)如下:
(6)
(7)
(8)
(9)
(10)
(11)

為了評估LSTM模型的預(yù)測性能,本文使用平均絕對百分比誤差(MAPE)、均方根誤差(RMSE)和R2來測量統(tǒng)計(jì)分析。每個模型的評估公式如下:
(12)
(13)
(14)

R2的正常范圍為[0,1],并且越接近1,模型的預(yù)測能力越強(qiáng)[13]。由于本文中使用的電力需求數(shù)據(jù)在規(guī)模上因設(shè)施而異,因此計(jì)算R2來比較根據(jù)設(shè)施預(yù)測的結(jié)果。
由于深度學(xué)習(xí)4J(DL4J)適合基于深度學(xué)習(xí)的時間序列數(shù)據(jù)預(yù)測,因此,本文使用DL4J構(gòu)建基于LSTM的電力需求預(yù)測模型。DL4J的特點(diǎn)是易于構(gòu)建可以使用圖形處理單元(GPU)的環(huán)境。本文提出了一種基于DL4J方法和MIDAS相結(jié)合的LSTM模型,并用于電力需求預(yù)測的優(yōu)化。
通過設(shè)置合適的參數(shù)可以獲得良好的深度學(xué)習(xí)性能。根據(jù)數(shù)據(jù)的數(shù)量或目的來尋找最優(yōu)的參數(shù)設(shè)置,如,最佳層數(shù)、節(jié)點(diǎn)數(shù)、迭代次數(shù)、激活函數(shù)等參數(shù)設(shè)置,在參數(shù)設(shè)置中總共進(jìn)行了40次設(shè)置,得到了最優(yōu)的結(jié)果。本文將隱藏層數(shù)設(shè)置為3,節(jié)點(diǎn)數(shù)設(shè)置為10,學(xué)習(xí)速率設(shè)置為0.01,并將迭代次數(shù)設(shè)置為180。采用雙曲正切(tanh)和隨機(jī)梯度下降分別作為LSTM層的激活函數(shù)和優(yōu)化算法。在分類LSTM模型中,交叉熵(CE)和誤差平方和(SSE)作為多類別分類進(jìn)行預(yù)測的成本函數(shù),但均方誤差(MSE)主要用于對回歸進(jìn)行預(yù)測[14]。因此,本文使用MSE作為代價函數(shù)來降低預(yù)測誤差。LSTM+MIDAS模型的參數(shù)設(shè)置值見表2。

表2 LSTM+MIDAS模型的參數(shù)設(shè)置值
由表2可見,尋找優(yōu)化參數(shù)實(shí)驗(yàn)中獲得最高準(zhǔn)確率的3個結(jié)果。根據(jù)不同的設(shè)置顯示出不同的預(yù)測結(jié)果,本文使用具有最高精度的設(shè)置3。
短期預(yù)測結(jié)果見表3,長期預(yù)測結(jié)果見表4。在短期預(yù)測情況中,住宅、市政廳、工廠、醫(yī)院用電需求預(yù)測的MAPE分別從21.04%下降到10.44%,從15.6%下降到2.73%,從7.21%下降到1.63%,從7.1%下降到1.96%。在長期預(yù)測情況中,不同預(yù)測方法的誤差率無顯著性差異。

表3 短期預(yù)測結(jié)果的誤差率

表4 長期預(yù)測結(jié)果的誤差率
住宅的季節(jié)性用電需求預(yù)測結(jié)果見表5。

表5 住宅季節(jié)性用電需求預(yù)測結(jié)果的誤差率
由表5可見,與表3和表4中的短期和長期預(yù)測結(jié)果不同,在季節(jié)性用電需求預(yù)測實(shí)驗(yàn)中,不同預(yù)測方法表現(xiàn)出的誤差率差異較大。在冬季實(shí)驗(yàn)中,預(yù)測的數(shù)據(jù)包括假期,這大大減少了電力需求。因此,在MIDAS方法中,本文給假日數(shù)據(jù)賦予更大的權(quán)重。但是,在LSTM方法中,未分配權(quán)重值,因此LSTM的性能最低。
本文使用Friedman檢驗(yàn)作為非參數(shù)統(tǒng)計(jì)檢驗(yàn),將LSTM+MIDAS模型與其他2種方法(LSTM、MIDAS)的短期、長期和季節(jié)性試驗(yàn)結(jié)果進(jìn)行比較[15]。Friedman檢驗(yàn)通常形式是使用秩而不是原始值,其中秩是通過分別對行進(jìn)行彼此獨(dú)立的排序而獲得。所有預(yù)測MAPE結(jié)果的Friedman檢驗(yàn)結(jié)果如下:總體MAPE結(jié)果(短期、長期和季節(jié)性)數(shù)量N為10;卡方為8.6;自由度(DF)為2;p值為0.018。Friedman的臨界值設(shè)置為0.05的顯著性水平。
本文提出了LSTM+MIDAS混合模型只需使用歷史電力需求數(shù)據(jù)的短期數(shù)據(jù)優(yōu)化電力需求預(yù)測模型。電力需求預(yù)測的準(zhǔn)確性取決于數(shù)據(jù)預(yù)處理和權(quán)重函數(shù)。此外,建立一個能夠密切跟蹤電力需求隨時間變化的波動模式。在表4中,證實(shí)了LSTM+MIDAS模型比其他2種方法能夠更好地反映電力需求波動。
綜上所述,本文確定了住宅設(shè)施的預(yù)測性能最低,而工廠和醫(yī)院設(shè)施的預(yù)測精度較高,且誤差率相對較低。短期數(shù)據(jù)的LSTM+MIDAS模型的預(yù)測水平高于其他2種方法。同時,短期數(shù)據(jù)的結(jié)果也相對好于長期數(shù)據(jù)。與短期預(yù)測的最大MAPE相比,LSTM+MIDAS模型在住宅設(shè)施減少10.44%,市政廳下降12.87%,工廠下降5.58%,醫(yī)院下降5.14%;在長期預(yù)測的情況下,住宅設(shè)施只下降了2.11%,市政廳下降了2.8%。長期預(yù)測并沒有改善工廠和醫(yī)院設(shè)施電力需求預(yù)測的錯誤率。利用短期數(shù)據(jù)進(jìn)行電力需求預(yù)測更準(zhǔn)確地反映電力需求的波動性,從而提高短期預(yù)測的準(zhǔn)確性。然而,長期數(shù)據(jù)的預(yù)測受天氣和外部因素的影響較大。因此,盡管由于數(shù)據(jù)集數(shù)量較多,總體精度較高,但該方法的精度沒有太大差異。在長期電力需求預(yù)測中,預(yù)測的準(zhǔn)確度并沒有提高。由于電力需求數(shù)據(jù)與波動性相關(guān),在波動趨勢出現(xiàn)時,長期電力需求數(shù)據(jù)不能很好地預(yù)測。對受天氣、季節(jié)和假日影響的住宅設(shè)施的電力需求預(yù)測,通過考慮特殊情況的權(quán)重對數(shù)據(jù)進(jìn)行季節(jié)分類和預(yù)測,從而獲得更高的精度。以6 h為間隔的3 d內(nèi)住宅季節(jié)性電力需求預(yù)測如圖5所示。

圖5 以6 h為間隔的3 d內(nèi)住宅季節(jié)性電力需求預(yù)測
該文將7月份的數(shù)據(jù)用于夏季預(yù)測,將夏季的住宅用電需求預(yù)測結(jié)果與文獻(xiàn)[16]的LSTM預(yù)測結(jié)果進(jìn)行了比較。本文提出的LSTM+MIDAS模型的MAPE為5.400%,LSTM模型的MAPE為8.935%。與LSTM相比,LSTM+MIDAS的誤差率(MAPE)降低了39.564%。此外,通過Friedman檢驗(yàn),LSTM+MIDAS模型小于a(p<0.05)。因此,通過Friedman檢驗(yàn),LSTM+MIDAS模型的結(jié)果具有統(tǒng)計(jì)學(xué)顯著性。
本文提出了LSTM+MIDAS電力需求預(yù)測模型,只需利用歷史電力需求的短期數(shù)據(jù)即可對電力需求進(jìn)行預(yù)測模型。通過收集住宅、工廠、醫(yī)院和市政廳等4個設(shè)施的電力需求來計(jì)算每種電力需求使用模式的預(yù)測精度,以較低的錯誤率預(yù)測電力需求。住宅受季節(jié)因素的影響較大。由于只考慮電力需求數(shù)據(jù)作為輸入數(shù)據(jù),住宅設(shè)施受天氣影響的預(yù)測誤差率比其他設(shè)施有所增加。同時,該模型能夠確定不合格的波動性,并提供高精度的預(yù)測結(jié)果。