孫景釕,胡長洪,項燁鋆,趙 碚,劉津源,陳夢翔,蔡昌春
(1.國網浙江省電力有限公司溫州供電公司,浙江 溫州 325000;2.江蘇省輸配電裝備技術重點實驗室(河海大學),江蘇 常州 213022)
電力系統短期負荷預測是電力系統運行與調度的基礎,預測精度直接影響電力系統運行的安全性和經濟性。影響負荷波動的因素眾多,其中氣象因素尤為重要[1-2],氣象因素直接影響用戶用電習慣從而導致負荷波動。因此,從負荷波動的機理出發,分析氣象因素對負荷變化的影響對于提高短期負荷預測精度具有重要意義。
近年來,國內外學者針對負荷預測及影響因素開展了大量的研究工作。文獻[3]針對通過可視化降維方法解決負荷預測中高維氣象數據的擁擠和結構易變問題,從而提高負荷預測精度。文獻[4-5]利用費歇信息進行氣象因素建模,挖掘負荷-氣象因素關聯性使得負荷預測中氣象因素的處理更加客觀。文獻[6-8]通過分析母線負荷與氣象因素相關特性,創建了基于數值天氣預報和負荷分類預測的母線負荷預測模型,并提出了基于氣象預報的母線負荷預測方法,但是對于氣象因素沒有給出明確的劃分和選擇方法。
為了更加精準描述氣象因素對負荷預測的影響,聚類分析法常常被用來提取數據樣本特征以分析氣象因素的影響[9-12]。文獻[13]針對多類樣本數據提出多核模糊聚類算法,選取子核函數及其參數用于構造多核函數,從而增大不同類別樣本間的差別。文獻[14]提出了一種電力短期負荷場景中改進多核模糊C 均值聚類算法,提升預測聚類能力,但是在核函數各參數選擇偏于經驗。
人工智能、深度學習方法能夠充分挖掘負荷變化的本質特征,其在負荷預測領域的應用越來越廣泛。文獻[15-16]提出了一種GRU-NN(門控循環單元神經網絡)的短期負荷預測方法,通過建模學習負荷數據內部動態變化規律,融合天氣影響因素分析負荷變化的內在聯系。文獻[17-18]提出了在LSTM(長短期記憶)神經網絡中采用Attention 機制進行輸入特征分析,提高歷史訓練數據特征的可辨識性。文獻[19-20]利用改進深度系數自編碼器和極限學習機結合的方法進行短期負荷預測,實現氣象因素的稀疏處理和低維壓縮編碼。然而,傳統LSTM 神經網絡在負荷預測中往往存在誤差累計現象,從而影響預測精度。
本文針對復雜氣象因素下負荷預測困難的問題,分別從負荷數據處理和預測方法兩方面開展工作。提出了基于多核C 均值模糊聚類的負荷影響因素聚類壓縮,利用核函數提取影響負荷波動的氣象因素動態特征;在傳統LSTM結構的基礎上,引入反饋環節,利用正反向計算結合消除LSTM神經網絡訓練過程的累計誤差,提出基于深度學習的多層雙向LSTM 神經網絡負荷預測模型,由此提升負荷預測精度。最后,以歷史負荷的聚類數據為訓練樣本驗證本文方法的有效性和合理性,實驗結果表明本文方法能夠充分考慮歷史負荷數據中的氣象因素特征,提高負荷預測的準確性。
影響負荷波動的氣象因素較多,實際負荷數據和氣象因素間存在強耦合、非線性關系。分析負荷與氣象影響因素的相關性是剖析負荷特征的主要方式。斯皮爾曼相關系數法是分析氣象因素與負荷相關性的常用方法,可以更直觀的看出每一類影響因素對負荷的影響程度,能夠精準的刻畫變量間的關聯程度。斯皮爾曼相關系數法是通過內部重復值來比較內部變量間的單調性,用+1或-1來表示,斯皮爾曼相關系數公式如下所示:

核函數法是數據特征提取的常用方法,可以彌補單一核方法提取負荷數據特性存在特征描述單一的不足。利用多核函數將氣象因素的低維非線性關系轉變為高維線性問題從而提高聚類對多維空間數據的聚合能力。在聚類過程中采用基于模糊準則自動調節不同核函數的權重系數,提升組合核函數的特征學習能力和聚類后系統描述的泛化能力。
假設聚類模型樣本集為{x1,x2,…,xN},xk∈RN,利用非線性映射函數Φ將低維空間的樣本映射到高維特征空間中{Φ(x1),Φ(x2),…,Φ(xN)}。高維特征空間中基本核函數可以用低維空間的點積表示:

在滿足Mercer 條件下將多個核函數構造凸線性組合以提高組合核函數的泛化能力,線性組合關系表示為:

式中:Kk為基本核函數;β為不同核函數的權重系數;M為核函數的個數。
利用核函數將負荷數據樣本中的氣象因素從高維空間向低維空間映射,并提取各種影響因素的特征空間,實現每類樣本特征的劃分和分類。文中多核C均值模糊聚類的目標函數為:


式中:d為第i個樣本聚類數據到第j類聚類中心的Euclid距離,由式(8)計算:

聚類中心Φ(Vi)在特征空間H中表示為:

由上述可知,多核模糊C 均值聚類模型聚類過程中需要明確核函數參數值σ、模糊指數m、收斂閾值ε和聚類簇數c等四個參數。通過初始化中心矩陣及隸屬度矩陣使其滿足歸一化條件,利用迭代計算獲得最終權重和隸屬度,迭代過程的終止條件為隸屬度矩陣||U(t)-U(t-1)||<ε。
傳統單向LSTM 神經網絡模型在短期負荷預測中由于存儲歷史與當前的信息,導致在訓練過程中容易出現累積誤差等問題。如圖1所示,雙向LSTM 神經網絡模型輸出由兩個信息傳遞相反的LSTM 循環層構成,前向層按照時間順序傳遞信息,后向層按時間順序逆向傳遞信息。在神經網絡訓練過程中,分前向訓練和后向訓練兩個LSTM 模塊,前向訓練輸入序列是數據樣本,后向訓練的輸入序列的反向樣本,網絡的輸出由前向輸出和后向輸出共同決定。

圖1 雙向LSTM神經網絡記憶單元結構
前向層從1 時刻到t時刻正向計算得到并保存每個時刻向前隱含層的輸出;后向層逆時間序列反向計算得到并保存每個時刻向后隱含層的輸出。最后融合前向層和后向層對應時刻的輸出結果,雙向LSTM神經網絡的表達式為:

式中:st為t時刻的前向隱藏層狀態;為t時刻的反向隱藏層狀態;ot為t時刻輸出層的值;g和f為激活函數;xt為輸入向量;V、U、W為隱藏層到輸出層、輸入層到隱藏層、隱藏層之間的權重矩陣;V′、U′、W′為對應的反向權重矩陣。
在傳統雙向LSTM 神經網絡的基礎上構建深度化多層機制和反向反饋機制,強化負荷數據本質特征,避免學習過程中訓練記憶的模糊化,減少訓練誤差。本文提出的多層堆疊雙向LSTM 神經網絡結構如圖2所示,相對單層網絡多層堆疊模型能夠對早期預測數據加深記憶,形成正、反記憶網絡雙向訓練,從負荷數據的不同時序提取數據特征。多層堆疊形態的LSTM 神經網絡各層之間的關聯如下所示:

圖2 多層雙向LSTM神經網絡結構

通過對歷史負荷數據進行基于氣象因素的聚類分析,構建多層雙向LSTM 神經網絡的短期負荷預測模型,具體流程如圖3所示,負荷預測過程分兩個階段,分別為負荷訓練樣本數據的聚類分析和負荷預測。

圖3 負荷預測流程
第一階段:負荷訓練數據的多核均值聚類。構建基于高斯核和線性核組合的多核模糊C 均值聚類方法,實現多特征氣象因素樣本數據集的低維非線性空間映射至高維線性空間,通過指標評價構建負荷樣本訓練數據。
第二階段:多層雙向LSTM 神經網絡預測。基于訓練數據構建短期負荷預測模型進行負荷預測,在神經網絡訓練過程中利用預測誤差評價指標優化神經網絡參數,評價指標主要有平均絕對百分比誤差MAPE、平均絕對誤差MAE和均方根誤差RMSE。

式中:yi為實際測量負荷數據;預測模型輸出負荷數據;M為負荷樣本數量。
為了驗證本文方法的合理性和準確性,本文采用配電網變電站實際運行數據和相關氣象數據進行仿真驗證。負荷訓練樣本數據的采樣精度為5 min和15 min兩個時間尺度,負荷訓練數據為一個月的數據量,預測未來一天和星期進行分析。在進行氣象因素聚類時,聚類核函數參數σ=0.005、隸屬度函數模糊指數m=1.08、收斂閾值ε=0.000 1,聚類迭代次數為300 次、聚類簇為c=3。本文采用python 開發LSTM 深度神經網絡,電腦配置為I9-9900k-3.6GHz,16G內存。
利用多核模糊C 均值聚類模型分析負荷訓練數據中的氣象影響因素,利用多核模糊C 均值聚類模型對原始數據集樣本進行聚類處理。樣本數據中影響因素為平均溫度等8種氣象數據。通過多核模糊C 均值算法聚類后的樣本數據分布結果如圖4所示,從圖4中可以看出,聚類模型將多維氣象因素聚類為兩類,兩類子簇之間有邊界清晰,其聚類結果的誤差不超過4%。基于上述8中氣象數據的負荷相關性分析如表1所示,聚類結果的各項指標如表2 所示,多核模糊C 均值聚類較FCM(模糊C 均值)、KFCM(單核模糊C 均值)和DBSCAN(密度聚類算法)在NMI(標準化互信息)、ACC(準確度)、RI(蘭德系數)和ARI(調整蘭德系數)等4 個指標都具有更加合理的聚類效果。

圖4 數據集1三維分布

表1 不同影響因素的斯皮爾曼相關系數

表2 不同聚類算法比較
利用多層堆疊神經網絡進行負荷預測,此時不同層數的神經網絡在不同程度上提取數據特征,神經網絡層數和最終預測精度存在一定的關系。表3給出了神經網絡模型層數與預測誤差之間的關系,本文神經網絡的層數為3層。圖5給出了不同預測方法的結果對比,由圖5 可知多層雙向LSTM 模型的預測結果相較于傳統LSTM 模型、雙向LSTM神經網絡以及BP網絡,預測結果更加接近負荷真實值。

表3 多層堆疊雙向LSTM層數與預測誤差

圖5 不同神經網絡預測的對比
通過聚類分析將影響因素根據其對負荷的影響進行聚類劃分,進一步的對比不同算法的負荷預測結果。經過聚類分析后,將訓練數據的影響因素分為a和b兩類,分別進行基于MBLSTM(多層雙向長短期記憶)神經網絡預測,結果如圖6 所示,圖7 給出了不同LSTM 神經網絡的預測結果對比,預測誤差的定量分析如表4所示。由表4可知在考慮氣象因素并對其進行聚類分析后,誤差從1.44%降低至0.25%。通過氣象因素聚類,能夠有效甄別影響因素相似的負荷數據,由此提高訓練數據的相似性,但是并沒有增加計算負擔,考慮氣象因素比不考慮氣象因素的計算時間增加了0.96 s。

表4 負荷預測誤差對比

圖6 a、b類數據預測結果

圖7 考慮氣象因素聚類前后負荷預測
為進一步驗證本文方法的合理性,利用冬季負荷數據進行仿真分析,此時負荷預測的結果如圖8所示。利用聚類劃分處理訓練樣本數據并以此進行預測大大降低了氣象因素對負荷訓練、預測過程的影響。從表5可以看出,未考慮氣象因素的短期負荷預測模型的MAPE 誤差值在4.15%,由于冬季負荷的敏感性較低,整體上冬季負荷預測的誤差較夏季大,考慮氣象因素分類整體預測誤差為0.65%。

圖8 考慮聚類氣象因素負荷預測結果

表5 負荷預測誤差對比
本文提出了基于多層模糊C 均值聚類和MBLSTM神經網絡的短期負荷預測方法。通過多層模糊C 均值聚類將負荷氣象影響因素進行低維空間映射,實現影響因素的精確分類和聚合,明確負荷氣象因素的耦合關系;進一步的,提出多層堆疊形式的雙向LSTM 神經網絡,通過構建雙向計算機制和多層堆疊形式,提高負荷數據間的前后關聯,挖掘負荷序列數據關聯信息,從而提高負荷預測精度。仿真結果表明,本文所提方法能夠提高負荷影響因素的區分度,有效提高負荷預測精度。