段 煉,洪海生,鄉 立,林 海,許中平,岳首志
(1. 廣東電網 廣州供電局,廣州 510000;2. 北京國網信通埃森哲信息技術有限公司,北京 100032)
電力負荷預測指的是基于歷史的負荷數據特征,結合地域、環境、時間[1]、天氣[2—3]、經濟[4]等多種外界影響因素輔助完成對未來負荷數據的大小判定。準確高效的電力負荷預測能夠合理的安排當地的運行、調度、檢修等計劃,提供電價制定等參考信息,減少資源浪費和提高經濟效益,對智能電網高效穩定運行具有重要的意義[5]。
根據預測時間可將電力負荷預測分為長期負荷預測、中期負荷預測和短期負荷預測3 種類型。其中長期負荷預測指的是對未來幾年時間長度的電力負荷預測,用于輔助制定電網未來規劃;中期負荷預測指的是對1 年內的電力負荷進行預測,輔助日常運行調度工作;短期負荷預測是當前負荷預測的熱門以及重點內容,主要用于預測未來1 天內或數天內用電負荷數據[6]。
短期負荷預測模型主要分為傳統方法和智能方法2 大類,傳統方法的負荷預測主要基于數據的歷史曲線規律來擬合數據模型,包括時間序列法,統計回歸法,模式識別法等[7],由于考慮的維度單一或較少,而影響負荷變化的隨機因素較多,故使用傳統方法進行電力負荷預測存在一定的局限性[8]。另一類智能方法主要包括專家系統[9],神經網絡[10],隨機森林[11]等方法,由于電力負荷具有非線性,波動大,數據多等特點,人工神經網絡能夠通過自學習來擬合非線性模型,同時可以處理大規模的數據,故使用較為廣泛。
相比于傳統的人工神經網絡,深度學習網絡采用更多的隱藏層,可以更好的擬合和適應數據的非線性特征,由于近年來深度學習領域的高速發展和成功應用,如何將深度學習結合負荷預測逐漸成為了負荷預測方向的研究熱點內容。文獻[12]將深度信念網絡(deep belief network,DBN)應用到到短期負荷預測模型之中,取得到較好的預測精度,但存在人為提取時序特征等問題。文獻[13]使用卷積神經網絡(convolutional neural networks,CNN)提取數據關鍵特征后,輸入到門控循環單元(gated recurrent unit,GRU)模型之中,并結合注意力機制完成負荷預測,但模型計算較為復雜,而且如果數據變化波動較大,則通過CNN無法捕捉到負荷的變化動態變化特征。
由于負荷變化與多個相關因素存在一定的聯系,需要在歷史數據上進行深度挖掘,找出電力負荷與外界各種影響因素之間存在的內在關聯性,進而輔助完成負荷分解。文獻[14]分析并驗證了溫度和用電量之間的聯系,將溫度因素進而考慮進深度學習方法模型之中,提高了預測精度。文獻[15]通過分析得出電價與負荷具有相關性,并將實時電價因素輸入進負荷預測模型,預測效果得到了一定提升。文獻[16]在歷史負荷數據的基礎上,引入天氣、節假日等相關因素變量,有效的提高了預測準確率。文獻[17]在考慮傳統負荷功率特征的同時,額外考慮不同時段的負荷行為特征,將分時段負荷狀態概率因子引入尋優目標函數,有效提高了負荷分解的準確性。
目前負荷預測方法較少考慮到同1天不同時間段的負荷行為以及對應關聯性特征,因此,本文在考慮天氣維度和時間維度的基礎上,增加考慮行為維度,將不同時間段的行為相似度因素引入長短時記憶(long short?term memory,LSTM)網絡模型,最后結合南方電網某臺區負荷數據在Keras 平臺上對網絡進行訓練和驗證,結果證明本文方法的有效性和可行性。
臺區負荷在不同天的相同時間段內的負荷行為習慣具有一定相似度,因此可以根據歷史負荷變化規律來預測未來負荷數據,但在同1 天的不同時間段內臺區負荷的負荷運行規律不同,而且呈現出強關聯性和較弱的關聯性之分,可根據此特征輔助完成負荷預測。將某臺區2周負荷的功率負載率數據映射到同1天內,如圖1所示。
在圖1中,可以清晰看出該臺區負荷的功率負載率在1天內的變化分布情況。在不同天內,該臺區負荷的趨勢和周期大致相同,峰谷出現的位置也比較相近,存在一定的相關性,遵循某種基準負荷規律并呈不同程度的上下波動。其中在0:00—5:00時段,功率負載率呈下降趨勢,且曲線較為密集,關聯度很高,即在不同天較為嚴格的執行同一行為習慣規律,預測時會更為準確一些。但在12:00—16:00時段曲線比較分散,預測時精確度受到較大的影響。因此,各天在此時段會執行較為松散的行為習慣規律。

圖1 某臺區功率負載率日分布圖Fig.1 Daily distribution of power load rate in a certain area
若不區分時段,則各個不同時間段的行為規律會相互影響,且看作相同的關聯密集程度,對最后整體預測的效果產生一定的影響,所以本文接下來分析臺區負荷不同運行規律時間段的行為相似度,并考慮歷史數據的變化趨勢來輔助完成負荷預測。
本文首先通過計算每2天之間目標時間段的皮爾遜相關系數,生成行為矩陣,再進一步計算目標時間段的行為相似度,行為相似度不同則對相同時間段歷史數據的參考程度不同。在考慮天氣維度和時間維度的基礎上,將行為相似度作為新特征考慮加入LSTM 預測模型,利用訓練集數據對模型進行訓練,再根據測試集數據對模型效果進行驗證。
文獻[18]指出電力負荷存在區域性、時間性等特性,雖然整體上具有峰谷的典型現象,但不同地方臺區負荷在不同時間的負荷變化趨勢存在差異,在1 天的各個時間段,負荷也呈現出不同的負荷運行規律。
如何完成負荷行為時段分區成為提升負荷預測準確度的關鍵,分區粗糙可能使得較多的強關聯時段行為特征丟失,分區過細可能會對歷史運行數據的時間噪聲敏感,盲目增加計算量,影響負荷預測效果。本文選取以1 h 為時間段分區單位,計算時間段內不同負荷規律的行為相似度。
假設訓練集包含D天數的電力數據,樣本的采樣頻率為15 min/點。以每日的第t0整時點為初始時間點,第t1整時點為截止時間點,形成包含L=4(t1-t0)+1個連續數據點,將該目標時間段編號記為m,生成第d天臺區負荷在編號m的目標時間段內的狀態序列為

式中:為第d天臺區負荷在編號m的第L個目標時間點的負荷負載率。
則第d天臺區負荷在編號m的目標時間段內的狀態平均值為

對訓練集臺區負荷在編號m的目標時間段內每2 天狀態序列之間的皮爾遜相關系數r進行計算,得出D天臺區負荷在編號m的目標時間段內的相關矩陣Pm為

該臺區負荷在編號m的目標時間段內的行為相似度ωm的計算方法如式(6)所示
傳統的人工神經網絡只能單獨輸入當前時刻的數據,無法聯系到歷史數據之間的變化規律,這樣則損失了具有明顯周期特征的數據變化特點。
LSTM 網絡是循環神經網絡的變形結構[19],廣泛應用于時間序列預測、文本分析預測、自然語言處理等方面。LSTM 網絡與傳統的人工神經網絡相比,具有遺忘門,輸入門和輸出門等多種功能結構,能夠對過去時間的數據進行記憶結合,是一種時間上的深度神經網絡。LSTM 內部一個網絡單元的結構如圖2所示。

圖2 LSTM內部網絡單元圖Fig.2 Diagram of network elements inside LSTM
圖2中ft,it和ot分別為網絡中的遺忘門、輸入門和輸出門,還具有一條代表長期記憶的信息流。c1t為t時刻輸入的狀態,ct和ht分別為t時刻的網絡長期狀態和輸出向量。可以看出在t時刻,該單元輸入變量xt,以及上個時刻即(t-1)時刻的網絡長期狀態ct-1和輸出向量ht-1,在輸出端輸出t時刻的網絡長期狀態ct和輸出向量ht。
首先輸入t時刻的變量xt,結合上個時刻的數據,通過遺忘門對信息進行選擇性遺忘,并保留一部分信息下來,遺忘門函數如式(7)所示

式中:ft為長期記憶的遺忘比例,在0~1內取值;Wf和bf分別為遺忘門的權重系數向量和偏置系數向量。
通過輸入門決定了當前時刻輸入的信息保留的部分,輸入門函數如式(8)所示

式中:it為新輸入信息的保留比例,在0~1 內取值;Wi和bi分別為輸入門的權重系數向量和偏置系數向量。
再用一個tanh層提供要輸入到長期記憶中的候選信息c1t,計算方法如式(9)所示

式中:Wc和bc分別為網絡長期記憶的權重系數向量和偏置系數向量。
在遺忘門決定好遺忘的信息和保留的信息之后,對長期記憶進行更新,并將c1t與it進行點乘,將此信息添加到長期記憶之中,如式(10)所示

接著運行輸出門ot,決定長期記憶輸出到輸出向量ht的比例,同樣也在0~1內取值,如式(11)所示

式中:Wo和bo分別為輸出門的權重系數向量和偏置系數向量。
最后結合ot,對輸出向量進行輸出,如式(12)所示

文獻[16]在歷史負荷數據的基礎上,引入天氣維度和時間維度等相關因素信息,對未來數據進行預測。其中考慮的影響因素中天氣維度包含當日的最低溫度,最高溫度,平均溫度,時間維度包括當前是星期幾,是否放假等信息。負荷預測輸入量如表1 所示,在輸出端則得到預測日t時刻的預測負荷數據。

表1 負荷預測輸入參數Tab1e 1 Load forecast input parameters
本文在文獻[16]考慮天氣維度和時間維度的基礎上,對負荷行為時間段進行細分,增加考慮行為維度,將不同時間段的行為相似度因素引入長短時記憶網絡模型,根據已有的歷史負荷數據對未來的負荷數據進行預測。其中行為相似度的計算方法在上一節有過相關介紹,這里根據此方法對日范圍內每1 h 的行為相似度進行計算,根據當前輸入時刻所屬當日的時段信息來將對應的行為相似度作為特征輸入到LSTM 模型之中,這樣模型能充分準確利用歷史數據的變化趨勢來輔助完成負荷預測,本文方法框架圖如圖3所示。

圖3 本文方法框架圖Fig.3 Framework diagram of this article
由于神經網絡激活函數的特性,模型對[0,1]之間的輸入數值比較敏感,能加快訓練和收斂的速度,提高模型的效率,故將輸入的信息都進行了歸一化處理。不同類型的信息進行的預處理操作不同。將數值量負荷,溫度以及行為相似度進行歸一化,如式(13)所示

式中:X為整個數據樣本;x為樣本X中的某一個數據;xg為x歸一化之后的數據;max(X)為樣本X最大值;min(X)為樣本X最小值。
對于非數值量日類型,用0和1的邏輯量進行表示。對于星期類型因素,為了消除此類數據距離間的影響,即輸入星期三和星期四的不同程度和輸入星期三和星期五的不同程度是一樣的,星期類型特征用one?hot 編碼為一個7 維向量,比如星期六表示為[0,0,0,0,0,0,1,0],而判斷類型因素比如是否節假日或是否周末,是用1表示,不是則用0表示。
本文選取南方電網2個臺區長達1月的日96點功率負載率數據,分別進行2個案例實驗,同時選取文獻[16]方法作為本文的對比算法,驗證本文方法的有效性。2個案例實驗都取前90%的數據作為訓練集對模型進行訓練,后10%的數據作為測試集,對模型預測結果進行評估。模型采用雙隱含層設計,2 個隱含層的神經元數量都設為50,使用表1 中的多維數據作為輸入值,輸出下一時刻的功率負載率,即模型的結構為12-50-50-1,上面4 層網絡結構分別代表LSTM 網絡的輸入層,2 個隱含層,輸出層的神經元數量,迭代次數設為200。模型的損失函數設置為實際值和預測值之間的均方根誤差,并采用Adam優化算法[20]對模型進行優化訓練。
為了評估模型的精度,本文選用平均絕對百分比誤差MAPE和均方根誤差RMSE作為評價標準。

式中:n為樣本量;yi為實際值;為預測值。
對案例1 臺區各個時段的行為相似度進行計算,該臺區各時段行為相似度分布圖如圖4 所示。可以看出在不同的時間段,當前時間段行為規律的執行程度具有一定差異,行為相似度可以作為對歷史負荷軌跡的參照程度,輔助后續添加行為維度因素進行負荷預測。

圖4 案例1各時段行為相似度分布圖Fig.4 Behavior similarity distribution map of each time period in case 1
案例1臺區負荷測試集3天功率負載率的預測結果和典型片段圖如圖5和圖6所示。可以看出本文方法預測值與實際值更為接近,在加入考慮負荷行為相似度因素后,負荷預測的效果具有一定的提升。

圖5 案例1預測結果Fig.5 Forecast results of case 1

圖6 案例1預測結果部分片段圖Fig.6 Segmentation diagram of forecast result for case 1
案例1的預測結果對比如表2所示,可以看出,本文綜合考慮天氣維度,時間維度和行為維度,能取得較好的負荷預測精度。

表2 案例1預測結果對比Table 2 Comparison of prediction results for case 1
案例2 的預測結果圖和典型片段圖如圖7 和圖8 所示。可以看出,在功率負載率下降區段,文獻[16]方法和本文方法都與實際曲線貼合較緊,預測效果較好,但在峰谷的位置可以看出本文方法綜合考慮了負荷行為習慣,并根據不同時段區別對待,預測的更為精準。

圖7 案例2預測結果Fig.7 Forecast results of case 2

圖8 案例2預測結果部分片段圖Fig.8 Segmentation diagram of forecast result for case 2
案例2 的整體預測結果對比如表3 所示,可以看出,在案例2臺區負荷預測中,本文方法同樣取得了較好的預測精度,并驗證了本文方法的有效性和適用性。

表3 案例2預測結果對比Table 3 Comparison of prediction results for case 2
案例2 的預測算法時間對比如表4 所示,可以看出,同樣預測3天時長的功率負載率數據,本文方法由于新增考慮了負荷行為相似度特征,所用時間略有增加。

表4 案例2算法時間對比Table 4 Comparison of algorithm time for case 2 s
綜合考慮表3 和表4 結果,發現本文方法在預測時間相差不大的情況下取得較好的預測精度。
臺區負荷在1天內的各個時間段具有不同的行為規律,且遵守程度不同。本文在歷史負荷數據的基礎上,綜合考慮了天氣維度,時間維度以及行為維度,相比其他預測模型[21—22],介紹了一種計算行為維度的各時段行為相似度的方法,并將此行為相似度引入基于LSTM 的負荷預測模型,提出了一種考慮分時段負荷行為的短期負荷預測方法,在南方電網2 個臺區的實際數據集上進行實驗,結果證明了本文方法的有效性。