劉 侃 ,何家峰 ,蔡高琰
(1.廣東工業大學 信息工程學院,廣東 廣州 510006;2.廣東浩迪創新科技有限公司,廣東 佛山 528200)
電力能源是與人們日常生活息息相關的,然而由于電力能源的調度存在延時性,導致電力資源沒有進行合理分配,電力浪費與短缺的兩極化現象依然存在。 針對這些問題,發展改革委[1]在2016 年提出電力企業應總結2016 年電力生產運行情況,分析預測2017 年電力供需形勢,提出政策建議,形成分析預測報告以達到合理調配電力資源,提高電力資源的利用率的目的。 國家在《中共中央關于制定國民經濟和社會發展第十四個五年規劃和二〇三五年遠景目標的建議》[2]中提出建設智慧能源系統,優化電力生產和輸送通道布局,提升新能源消納和存儲能力,因此基于歷史的用電量數據對未來的用電趨勢進行預測是十分必要的。區域用電量預測是指通過該地區產生的歷史用電數據時間序列,預測未來該地區的用電量,據相關研究表明,預測誤差增加,將會提高電力預測的成本,因此提升用電量預測的精確度是十分必要的。
目前應用于電量預測的方法主要分為三類,第一類為時間序列分析方法,包括指數平滑法[3]、加權法[4]等,這類方法可以有效地處理線性數據,但是對于非線性數據的擬合效果不佳。 第二類為智能算法,智能算法可分為機器學習方法與深度學習方法,其中應用于預測的機器學習方法有支持向量機算法[5]、隨機森林算法[6]、集成算法[7];深度學習方法有 BP 神經網絡[8]、人工神經網絡[9-11]、卷積神經網絡[12-13]、循環神經網絡[14-15]和遞歸神經網絡[16-19]等。 智能算法能較好地處理非線性問題,但是在計算速度與魯棒性方面仍需進一步改進。 第三類為組合方法,組合方法是指將第一類與第二類方法結合的新方法,組合方法結合了兩類方法的優點,能較好處理非線性問題又能同時提高智能算法的計算速度與魯棒性。
LSTM 是一種循環神經網絡(RNN)的改進方法,它有效避免了神經網絡在運算過程中出現的梯度消失與爆炸問題。LSTM 對于非線性、非平穩的用電數據具有良好的擬合能力。ARIMA 是傳統的時間序列模型,廣泛地應用于各種預測中,取得了較好的效果。 鑒于 LSTM 與ARIMA 在用電量預測領域展現出較強的預測能力,本文提出一種基于LSTM-ARIMA的區域用電量組合預測模型。 LSTM-ARIMA 組合模型較LSTM 模型的 RMSE、MAPE 分別提高了 16.17%、7.56%,比 ARIMA 模型的 RMSE、MAPE 分別提高了67.13%、44.19%。
ARIMA 模型由三個部分組成:自回歸模型AR(Auto Regression)、差分模型 I(Integrated)以及移動平均模型 MA(Moving Average)。 ARIMA 模型是描述時間序列數據隨機過程的一個重要模型,差分模型可以去除數據中趨勢向,使得序列形成平穩狀態以便于后續分析,自回歸模型用于擬合平穩序列的數據,移動平均模型可以構建出系統噪聲的回歸方程。 輸入時間序列數據集后,先進行單位根檢驗(Augmented Dickey-Fuller,ADF)以判別序列平穩性,如果平穩就進行下一步建模,不平穩則通過差分運算至平穩后再進行建模分析, 通過序列的自相關函數(Autocorrelation Function,ACF)與偏自相關函數(Partial Autocorrelation Function,PACF)構建 ARIMA(p,d,q)模 型 ,通過德賓瓦特遜檢驗(Durbin Watson,DW)檢驗殘差是否滿足正態分布, 再通過赤池信息準則 (AIC)與貝葉斯信息量(BIC)值確定最優模型,ARIMA 模型的數學表達式如下所示:

其中,▽代表差分,d 代表差分次數,Φ(B)為 p 階自回歸系數多項式,Θ(B)為q 階移動平均系數多項式,L 為該模型下的最大似然數,n 是數據數量大小,k是模型變量的個數。
LSTM 模型又稱長短期記憶網絡,它具有將上一個狀態的信息進行添加或者刪除并傳送給下一個狀態的能力,其網絡結構圖如圖1 所示,數學表達式如式(7)~式(14)所示。 LSTM 模型由遺忘門、記憶門與輸出門組成。 遺忘門用于減少冗余信息,加快數據處理速度,σ 為 sigmoid 函數,遺忘門的輸入信號 為 ht-1、xt, 其 中 ,ht-1為 LSTM 上 一 期 的 輸 出 信號,xt為當期的輸入值。 Ct-1為上一期 LSTM 的狀態信號,bf是閾值矩陣,wf為權重矩陣,通過 sigmoid 函數后若輸出為 0,表示刪除信息。ft與 Ct-1行列值相同,ft與 Ct-1相乘是對于 Ct-1狀態信息的重新整合。 記憶門的作用是確定信息是否保留,與遺忘門不同的是增加了tanh 網絡層,它的作用是將數值規范到-1~1,通過 sigmoid 函數后若輸出為 1,表示保存信息,記憶門將信息與遺忘門的信息結合作為下一個狀態值 Ct。 輸出門的作用是輸出當前狀態值Ct、隱藏狀態 ht。

圖1 LSTM 網絡結構圖

LSTM-ARIMA 預測模型的預測流程如圖2 所示,具體如下:

圖2 LSTM-ARIMA 組合模型預測流程圖
(1)對用電數據進行數據預處理,將用電數據集的前82 個數據作為訓練集,后 20 個數據作為測試集數據。 (2)用電量數據通過LSTM 模型進行預測分析得到預測模型f1,殘差部分用ARIMA 模型進行預測分析得到預測模型f2,將兩部分相加得到預測模型f。(3)將得到的組合預測模型 f 對測試集預測,得到預測結果并進行模型精度判別分析。
用電量預測值為y^i,用電量真實值為 yi,將分析結果進行對比。 模型預測的評判標準分為平均絕對百分比誤差(MAPE)、均方根誤差(RMSE)。 平均絕對百分比誤差是數據集的真實值與預測值之間絕對值之和的平均值,反映的是模型的偏差水平,百分比值越小,模型預測越準確。 均方根誤差反映的是數據點的離散程度,均方根值越小,證明數據點越密集,預測結果越穩定。 本文基于這兩個標準對模型的準確度進行評判。

數據集是廣東省佛山市某工業園區自2018 年1 月 4 日至 2019 年 12 月 31 日的周度用電量數據集,數據樣本一共102 條數據,每個數據樣本是一周7 天的用電量之和,用電量數據曲線如圖3 所示。實驗平臺為裝有NVIDIA Tesla P100 GPU 的服務器,本文的編程由 Python 實現,LSTM 模型采用的是Keras 框架,ARIMA 模型采用的是 Py-ARIMA 框架。

圖3 用電量曲線圖
某工業園區的入駐企業共122 家,其中以從事信息技術服務以及產品深加工企業為主,大部分企業的員工上班時間為8 小時。 智能電表在電量數據采集中存在無法避免的系統誤差,但誤差影響控制在極小范圍以內,所以認為數據集中的用電量數據是真實可靠的,是可以反映出真實用電規律的。 從圖3 兩年的周用電數據曲線中可以觀察到,2018 年的周用電數據與2019 年的周用電數據的用電規律基本相似,夏季的用電量比其他月份用電量多。
將用電數據集中前82 個數據作為訓練數據,預測后 20 個數據。 LSTM 模型設置為雙隱層結構,確定輸入層為 1,第一個隱含層為 10 層,第二個隱含層為 10 層,輸出層為 1 層。 經過試驗分析,確定最佳迭代次數為2 000 次。 用殘差數據擬合 ARIMA模型,ADF 檢測結果為0.032 67,此值小于顯著值5%,根據檢測標準認為該序列平穩。根據序列的ACF 與PACF 模型確定模型參數 p、q,當 p=2、q=1 時,AIC=-8.236 5,BIC=14.225,根據 AIC 與 BIC 最小原則,認為擬合模型為 ARIMA(2,0,1)。 ARIMA 模型預測曲線如圖 4 所示。

圖4 ARIMA 模型殘差預測曲線
ARIMA、LSTM 和 LSTM-ARIMA 組 合 模 型 對 于用電量序列預測曲線如圖5 所示。 可以觀察到LSTM 對于用電量序列的用電趨勢有很好的預測效果;ARIMA 無法準確地預測到用電量序列的用電規律,預測精度與預測穩定性低,這是由于用電量序列中包含大量的非線性數據影響了ARIMA 模型的預測效果;LSTM-ARIMA 模型在 LSTM 模型的基礎上增強了預測精度與預測穩定性。

圖5 模型預測曲線
由表1 可以得到,LSTM-ARIMA 組合模型較LSTM模型的RMSE、MAPE 提高了 16.17%、7.56%,比 ARIMA模型的 RMSE、MAPE 提高了 67.13%、44.19%。

表1 模型預測精度與穩定度
LSTM 與ARIMA 等機器學習與時間序列模型已經廣泛地應用于電力、水利、航天等多個領域的學術研究中。 本文采用LSTM-ARIMA 組合預測模型,選擇佛山市某工業園區近兩年的周用電數據,通過實驗對用電量數據進行分析預測得到以下結論:
(1)本文基于“序列預測+殘差修正”思想提出的LSTM 與ARIMA 組合模型,經實驗表明組合模型的預測穩定性與預測精度均優于單一模型,因此組合模型相較于單一模型提高了短期用電量預測能力;
(2)本文中ARIMA 模型擬合非線性數據效果不佳;
(3)本文所提出的組合模型將對于區域短期用電量預測有一定的參考意義,也對于電力部門進行優化電力資源配置、減少電力資源浪費具有一定價值。
如何改進組合模型擬合效果提升其預測能力是后續研究內容之一;本模型未將氣候因素納入到考察范圍,只考慮了歷史用電量因素,后續研究中將氣候變化納入到影響用電量變化的因素之一進行預測分析,也是未來優化模型的一個研究方向。