李曉翔,張超群,郝小芳,王大睿,完顏兵
(1. 廣西民族大學電子信息學院,南寧 530006;2. 廣西民族大學人工智能學院,南寧 530006;3. 廣西混雜計算與集成電路設計分析重點實驗室,南寧 530006)
隨著我國在新能源領域的深入發展、電動汽車和智能設備的普及,政府、企業和社會對電力行業的需求進一步提高。但是目前無法對電能進行大量且有效的儲存,因此高精度的短期電力負荷預測是保證電力部門合理制定發電計劃、電力系統安全穩定運行的重要基礎[1]。
目前國內外對負荷預測的研究可分為傳統預測方法和新興的深度學習方法[2]。傳統預測方法包括回歸分析法[3]和時間序列法?;貧w分析法建立方程相對簡單,預測速度快,但是往往缺乏對負荷時間上的規律性變化的分析,因此精確度較低。時間序列法最初由美國學者Box等[4]提出,對時間序列的歷史負荷數據進行數學建模,只需要歷史數據作為模型的輸入,預測時間快[5]。然而該方法只考慮歷史數據的影響,忽略其他影響因素的作用。因此在數據集日益豐富的當下,單一的時間分析方法已經不再適用于預測電力負荷。之后,出現機器學習方法,主要包括支持向量機[6]和人工神經網絡算法[7]等。文獻[8]對歷史數據使用小波分解算法進行重構,再將特征數據輸入卷積神經網絡支持向量回歸及模型,實現較為精確的負荷預測。文獻[9]對人工神經網絡提出一種新的由熵誘導出的具有高魯棒性和平滑性的度量,提高人工神經網絡的負荷預測性能。雖然這些負荷預測方法提高模型訓練效果,但是忽略負荷預測具有非線性和時序性的特點[10]。近年來,深度學習算法在負荷領域的研究逐漸深入。文獻[11]使用蟻群優化算法對遞歸神經網絡進行優化并用于短期負荷預測,提高傳統循環神經網絡負荷預測的精度。文獻[12]提出一種基于最大相關最小冗余和長短期記憶(long short-term memory,LSTM)網絡的用戶電力負荷預測模型,并驗證其有效性。文獻[13]提出一種基于雙向門控循環單元(gate recurrent unit,GRU)網絡和誤差修正的短期負荷預測模型,一定程度解決模型迭代訓練過程中的誤差積累問題。
不同的影響因素會對電力負荷預測的精度產生不同的影響。但是,并不是輸入模型的特征越多,訓練的效果就越好。因此,在選擇科學合理的預測方法的基礎上,研究不同特征對負荷預測精度的影響,進而篩選出高相關性的關鍵特征是提高負荷預測精度的關鍵[14]。隨機森林(random forest,RF)[15]是一種監督學習方法,在學習能力強的同時具有高魯棒性,并且內置衡量不同特征重要程度的方法,能夠分析復雜且相互作用的特征之間的關系,進而對高維特征進行篩選,達到特征降維的目的。文獻[16]將GRU 和卷積神經網絡組合成混合模型,利用CNN 模塊提取不同數據的特征,利用GRU模型提取原始數據時間序列上的特點,提高了短期負荷預測的精確度。文獻[17]提出了一種基于隨機森林和基于自注意力機制深度GRU 相融合的混合模型,解決了在渦扇發動機退化過程中會產生的檢測數據維數過高的問題,以較高的精確度預測了渦扇發動機的剩余使用時長。
針對現階段電力負荷預測中存在的影響因素過多導致模型精度下降問題,本文提出一種基于隨機森林和GRU網絡的混合模型(即RF-GRU)來進行短期電力負荷預測。該模型首先將具有時間因素、氣候因素的高維數據集作為隨機森林模型的輸入,通過計算袋外數據錯誤率對不同特征進行評分,篩選出相對重要的特征,再將這部分特征與歷史負荷數據結合成新的數據集作為GRU 模型的輸入,完成某地的電力負荷預測。實驗結果表明新模型RF-GRU 的預測精度比傳統的未經特征篩選降維的GRU、LSTM 以及BP神經網絡模型更為理想。
隨機森林算法由若干數量的決策樹組成,決策樹的數量越大,該算法的魯棒性就越強,精確度也就越高。此外,隨機森林算法能夠對復雜且相互作用的特征進行分析,其中的變量重要性度量可以作為參考標準對高維特征進行篩選,減少低相關度的特征對模型訓練的影響,增加模型的準確性。
利用隨機森林算法進行特征降維的關鍵是選擇最優的特征個數,本文根據計算袋外錯誤率來解決這個問題。由于隨機森林的生成過程采用的是有放回隨機抽樣,所以在一棵樹的生成過程并不會使用所有的樣本,未使用的樣本被稱為袋外(out_of_bag,oob)樣本。袋外錯誤率是隨機森林泛化誤差的一個無偏估計,其結果近似于需要大量計算的k折交叉驗證。若給某個特征隨機加入噪聲之后,袋外錯誤率大幅度提高,則說明這個特征對于樣本的分類結果影響大,即該特征重要程度高。在隨機森林中,特征X的重要性計算方法如下,其計算流程如圖1所示。

圖1 特征X的重要性計算流程
(1)對于隨機森林中的第n棵決策樹,使用相應的袋外樣本計算這棵樹的袋外誤差,記為En。
(2)隨機地對所有袋外樣本的特征X加入噪聲干擾,以此隨機地改變樣本在特征X處的值,再次計算其袋外誤差,記為。
(3)假設隨機森林中有n棵樹,用公式(1)計算特征X的重要性得分。
在循環神經網絡(recurrent neural network,RNN)的梯度計算方法中,當時間步數較大或者較小時,其梯度較容易出現消失或爆炸,因此RNN 在實際中難以捕捉時間序列中時間步距離較大時的依賴關系[18]。為了彌補這一缺陷,LSTM 在RNN 的基礎上加入記憶單元和門控單元,分別是輸入門、遺忘門和輸出門,通過門單元之間的邏輯控制決定數據是否更新,解決RNN 容易出現梯度消失、梯度爆炸和不能捕捉時間步間隔較大時的依賴關系的問題[19]。
GRU 是LSTM 的一種變體,既保留LSTM 能夠處理長距離時序依賴并且具有高準確率,又簡化了LSTM 的輸入和輸出,將輸入門、遺忘門和輸出門簡化為更新門和重置門。標準的GRU網絡結構如圖2所示。

圖2 GRU網絡結構
GRU 的輸入和輸出結構與普通RNN 是一樣的,輸入是t時刻的輸入xt和t-1 時刻的隱藏層狀態Ht-1,Ht-1包含之前節點的關鍵信息;輸出是t時刻隱藏節點的輸出和傳遞給下一節點的隱狀態Ht。通過上一個傳輸下來的狀態Ht-1和當前節點的輸入xt可獲取重置門和更新門的控制狀態,其計算如公式(2)~(5)所示。
其中:rt和zt分別為t時刻重置門和更新門的輸出;xt為t時刻的輸入;Ht和Ht-1分別為t和t-1時刻的輸出;為候選隱藏層狀態,包含xt的輸入信息和有針對性地保留t-1時刻的隱藏層狀態Ht-1;W、b和⊙分別為矩陣權重、偏置向量和數據對應位置的點乘運算;σ 為sigmoid 激活函數,可以將數據變換為[0,1]范圍內的數值,充當門控信號。當rt趨近于0時,模型會丟棄過去隱藏信息,只保留當前輸入的信息;當rt趨近于1時,模型認為過去的信息都有作用,并將其添加到當前信息中。
本文提出的RF-GRU 模型融合了隨機森林和GRU 網絡用于短期電力負荷預測,其處理流程如圖3所示。

圖3 RF-GRU混合模型預測流程
電力負荷預測結果除了與模型本身有關,合理的特征集也是非常重要的。通過分析研究現狀,負荷預測的主要影響因素包括氣象因素、時間日期因素和歷史負荷因素[20]。但是,用于輸入神經網絡的特征維數與預測結果的精度并非呈現出絕對正相關的特點,輸入特征過多會造成網絡結構復雜,模型計算量增加,降低效率。此外,輸入影響程度評分不高的特征也會降低模型預測的精度。因此,我們在包括氣象和時間因素的高維特征集的基礎上,進一步使用隨機森林對所有特征逐一進行評分篩選。
本文采用2022 年第十屆“泰迪杯”數據挖掘挑戰賽B題所給的某地2018年1月1日到2021年8月31日的氣象條件和電力負荷等共13維特征(見表1)構成初始數據集(可從官網https://www.tipdm.org:10010/#/competition/148115913778099-8144/question下載)來驗證RF-GRU模型的性能。

表1 預測短期電力負荷的初始數據集的特征描述
首先對收集到的時間日期和氣象因素等原始數據集進行預處理。具體采用線性插值法對缺失及異常值進行填補,然后歸一化全部特征數據,使得每個特征數據經過線性變換之后均處于[0,1]的范圍,消除不同特征數值量級不一致對預測模型的影響,使其盡快收斂。對原始數據進行歸一化處理的方法如公式(6)所示。
其中:x為原始值;x*為歸一化之后的值;xmin和xmax分別為特征樣本數據中的最小值和最大值。
其次,除了歷史負荷之外的全部特征(包括氣象和時間因素的12維特征),對每一種特征分別用隨機森林計算袋外錯誤率進行評分,其結果如圖4所示。值得一提的是,本文的所有實驗均在安裝有Intel Core i7-8750H@2.20GHz CPU、16GB RAM、Windows 11 操作系統的一臺服務器上運行,編程語言為Python 3.8.5,采用框架為tensorflow2.2.1。由圖4可知,所屬時段、最高溫度、天氣類型、最低溫度、是否節假日、風力這6 個特征的評分高于設定的閾值0.1,將篩選出的6個高評分的特征與歷史負荷數據組成新的7維特征數據集。

圖4 特征重要性評分
最后,按照8 ∶1 ∶1的比例將數據集劃分為訓練集、測試集和驗證集,構建GRU 網絡模型,訓練得到負荷預測結果Ypred。需要說明的是,經過多次超參數實驗,RF-GRU 模型的GRU 網絡最終采用的神經元數量為65,迭代次數(epochs)為50,批大?。╞atch_size)為128,學習率(learning_rate)為0.01。此外,GRU 采用具有高魯棒性的自適應矩估計(adaptive moment estimation,Adam)優化算法,通過計算梯度的一階矩估計和二階矩估計為不同的超參數設計獨立的自適應學習率。
為了評價模型的性能,我們選擇了文獻中常用的評價指標,即平均絕對誤差(mean absolute error,MAE)[21]、均方根誤差(root mean square error,RMSE)[22]和動態時間歸整(dynamic time warping,DTW)距離[23],可分別按公式(7)~(10)計算得到其值。
其中:EMAE是平均絕對誤差,ERMSE為均方根誤差,n為總預測次數,Yact(i)和Ypred(i)分別為第i次預測所對應的真實負荷值和預測負荷值。
DTW 是一種新的相似性度量方法,它能夠通過動態規劃算法找出兩條時間序列Q(q1,q2,…,qn)和C(c1,c2,…,cm)之間的最佳規劃路徑。首先,對兩條時間序列構建距離矩陣,矩陣中的第i行第j列所對應的元素代表該時間序列中點qi和cj的距離,由公式(9)計算出其最小累加距離D(i,j)。最后可由公式(10)計算兩個序列的DTW距離。
為了驗證RF-GRU 模型對短期電力負荷的預測效果,使用上面獲得的7 維特征數據集對2022 年第十屆“泰迪杯”數據挖掘挑戰賽B 題所給的某地2018 年1 月1 日到2021 年8 月28 日間隔4 小時數據進行未來三天(2021 年8 月29 日到2021 年8 月31 日)的電力負荷預測,并計算MAE 和RMSE 兩個性能評價指標。將RF-GRU模型預測得到的負荷結果與真實負荷值進行對比,其結果如圖5所示。

圖5 RF-GRU模型預測短期電力負荷曲線與實際值對比
由圖5可知,實線表示真實負荷值,虛線表示RF-GRU 模型的預測值。采用DTW 距離度量各模型的預測曲線與真實曲線的相似性,具體結果見表2。由圖5 和表2 可知,RF-GRU 模型表現出色,該模型均優于其他三種對比模型,其預測曲線與實際曲線最為相似。

表2 四種模型預測曲線與真實曲線的DTW距離對比
為了進一步驗證RF-GRU 模型的優越性,在相同的設置條件(最優值、層數、訓練次數和損失函數等參數)下分別使用BP 神經網絡模型、傳統的未經隨機森林特征篩選降維的GRU模型、LSTM 模型與RF-GRU 模型進行短期電力負荷預測對比實驗,其結果如表3和圖6所示。

表3 四種模型預測電力負荷結果評價指標對比

圖6 四種模型預測短期電力負荷曲線與實際值對比
由表3可知,與BP神經網絡相比,RF-GRU模型預測得到的平均絕對誤差值EMAE和均方根誤差值ERMSE分別下降了0.1704 和0.1555。相較于適合長時間時序預測的LSTM 模型,RF-GRU模型的EMAE和ERMSE分別下降了0.0212和0.0118。此外,與沒有經過特征降維而直接使用高維特征集進行預測的GRU模型的結果對比,RF-GRU模型的EMAE和ERMSE分別下降了0.0378 和0.0408。由表3 和圖6 可以看出,BP 神經網絡對短期電力負荷的預測效果最差;傳統的未經隨機森林特征篩選降維的GRU 模型的預測效果要優于BP神經網絡,但不如LSTM 模型;LSTM 模型的預測效果排名第二;本文新提出的RF-GRU 模型對短期電力負荷的預測效果最好,明顯優于其他對比模型。
針對負荷預測特征繁多且復雜,時序性強的問題,本文提出一種基于隨機森林和GRU 網絡的RF-GRU 模型,該模型使用隨機森林對日期因素、氣象因素等高維特征集降維,篩選出高評分的特征集與歷史電力負荷數據作為GRU網絡的輸入,完成對某地的短期電力負荷預測。由于RF-GRU 模型兼具隨機森林和GRU 的優勢,能顯著提升模型的預測性能,通過對比實驗也驗證了RF-GRU 模型具有更高的預測精度,其預測值與真實值接近,預測效果明顯優于BP 神經網絡、LSTM模型和傳統的GRU模型。
需要說明的是,本文獲取的特征集未考慮現實生活中采用階梯電價這一影響因素,未來可以在這個方面對負荷影響因素進行深入探究。此外,可以對將RF-GRU 模型部署在電網中的可行性進行分析,輔助企業實現實時負荷預測,合理規劃發電量。