王 運,孫小湘,祁 鑫,張?zhí)祛#?婧
(1.寧夏電力調(diào)度控制中心,寧夏銀川 750001;2.北京清能互聯(lián)科技有限公司,北京 100084)
化石能源的過度消耗所帶來的能源枯竭、環(huán)境污染問題,催生出了新能源技術(shù)。其技術(shù)種類多樣、發(fā)展迅速,并具有較高的滲透率,這對電網(wǎng)的短期負(fù)荷預(yù)測提出了較大挑戰(zhàn)。
目前,常用的負(fù)荷預(yù)測技術(shù)包括時間序列預(yù)測、神經(jīng)網(wǎng)絡(luò)和卡爾曼濾波估計器,具體實現(xiàn)方法包括基于長短期記憶(LSTM)的電器行為學(xué)習(xí)、人工神經(jīng)網(wǎng)絡(luò)、基于遺傳的多層感知以及模糊專家系統(tǒng)等。
該文使用聚類技術(shù),基于卡爾曼濾波技術(shù)與小波神經(jīng)網(wǎng)絡(luò)設(shè)計了短期電網(wǎng)負(fù)荷預(yù)測算法。
電網(wǎng)短期負(fù)荷的消耗特征定義方式種類繁多,因此該文使用聚類技術(shù)[1]在數(shù)據(jù)分析軟件R-studio和Matlab的輔助下,采用統(tǒng)計分析方法定義短期消耗的特征[2],建立具有共同特征的數(shù)據(jù)共同區(qū)域[3]。創(chuàng)建聚類區(qū)域后,將數(shù)據(jù)提供給后續(xù)估計算法進行預(yù)測,進而減少預(yù)測數(shù)據(jù)的誤差[4]。降低誤差的關(guān)鍵因素為數(shù)據(jù)群的大小及數(shù)量。故嘗試使用不同的集群數(shù)量與大小組合,并驗證預(yù)測數(shù)據(jù)及實際數(shù)據(jù)的誤差[5],經(jīng)統(tǒng)計分析后得出結(jié)論。電網(wǎng)負(fù)荷數(shù)據(jù)聚類的最佳選擇,是將其聚類到6 個不同的簇數(shù)[6]。通過多次實驗可知,若簇數(shù)大于8 或小于2,則后續(xù)識別算法無法正常工作,因此數(shù)據(jù)分類簇數(shù)的最佳選擇為6。
基于樸素的K-means 技術(shù)對負(fù)載段進行聚類時,定義Z為具有t個實例的數(shù)據(jù),可將Z分類為K個不相交的聚類S1,S2…,SK[7]。則誤差E可由下式定義:
其中,μ(Si)是簇Si的質(zhì)心。D(y,μ(Si))是數(shù)據(jù)點y與μ(Si)之間的距離,即任何數(shù)據(jù)點的歐幾里德距離。而對于數(shù)據(jù)yi=(yi1,yi2,…,yin)與yj=(yj1,yj2,…,yjn)的歐式距離可通過下式定義:
該文使用多種預(yù)測模型,將聚類數(shù)據(jù)聚合到預(yù)測混合模型中,如圖1 所示。

圖1 輸入輸出聚類預(yù)測聚合模型
如圖1 所示,將數(shù)據(jù)首先送入聚類算法,再把聚類后的數(shù)據(jù)送入不同的預(yù)測模型以選擇最佳預(yù)測模型組合,然后將數(shù)據(jù)聚合為一個模型。
卡爾曼濾波預(yù)測器是使用線性動力系統(tǒng)進行狀態(tài)估計的最常用方法之一,該模型定義如下:
小波神經(jīng)網(wǎng)絡(luò)(WNN)具有與人工神經(jīng)網(wǎng)絡(luò)(ANN)相同的能力,其在隱藏層中具有不同的激活函數(shù)[8]。由于激活函數(shù)為局部小波函數(shù),WNN 具有更緊湊的技術(shù)與學(xué)習(xí)速度,輸出類似于ANN 方式的加權(quán)小波總和[9]。定義wjk為隱藏單元j和輸入單元k之間的權(quán)重[10],則加權(quán)輸入總和定義為fj(n):
式中,xk(n)為第k個輸入。每個隱藏神經(jīng)元的輸出定義為:
其中,ψ為小波函數(shù),aj(n)定義為尺度,bj(n)為隱藏神經(jīng)元中小波函數(shù)的平移系數(shù)。輸出神經(jīng)元的輸入f(n)與輸出y(n),wij是輸出i與隱藏單元j之間的權(quán)重,由以下等式定義[11]:
式中,σ表示輸出與輸入間的映射關(guān)系。
由于特征構(gòu)建和選擇在基于神經(jīng)網(wǎng)絡(luò)的預(yù)測模型中起著重要作用,因此該文深入分析了基于神經(jīng)網(wǎng)絡(luò)中的權(quán)重選擇特征及其重要性[12]。表1 顯示了數(shù)據(jù)集的R2 得分,其用于表征數(shù)據(jù)擬合的優(yōu)度,是預(yù)測任務(wù)的重要特征。

表1 數(shù)據(jù)集的單輸出模型結(jié)果
為了解決特征重要性的表征問題,將不同輸入特征的神經(jīng)網(wǎng)絡(luò)權(quán)重歸一化后進行評估。這提供了特征重要性的定性描述,但沒有準(zhǔn)確的結(jié)果分析[13]。MT1-OP20 實驗中存在代表電力生產(chǎn)周期時間滯后特征的權(quán)重較高(R2 得分為0.6 以上),而MT1-OP10基線數(shù)據(jù)和MT2-OP10 測試集數(shù)據(jù)中存在的其他時間滯后和移動平均特征的歸一化權(quán)重均低于0.151。由此表明,電力生產(chǎn)與非電力生產(chǎn)時間之間的區(qū)別較為重要。因此,預(yù)測模型中需要引入電力生產(chǎn)計劃這一重要特征[14]。
圖2 展示了獨立的超參數(shù)值對預(yù)測性能的影響。文中涉及的超參數(shù)包括特征個數(shù)、不同算子以及隱藏單元數(shù)量[15]。

圖2 各類因素對預(yù)測性能的影響
圖2(a)表明,特征個數(shù)為200 時,訓(xùn)練集誤差顯著變大,因此較大的特征集有明顯的缺點。因此需要針對每個新數(shù)據(jù)集調(diào)整超參數(shù),從而在給定搜索空間內(nèi)找到最佳組合[16]。
經(jīng)過實驗可以發(fā)現(xiàn),訓(xùn)練過少會導(dǎo)致訓(xùn)練集和測試集欠擬合。而訓(xùn)練過多則會導(dǎo)致模型過擬合,從而使得測試集性能不佳。因此,該文使用以下策略防止過擬合的發(fā)生:一旦驗證數(shù)據(jù)集的性能開始下降,則停止模型訓(xùn)練;圖2 的三個超參數(shù)對系統(tǒng)影響表明,無法確定具有一般意義的超參數(shù)設(shè)置規(guī)則,這說明需要針對每個新數(shù)據(jù)集進行超參數(shù)調(diào)整。
為了評估此次的混合模型,采用真實數(shù)據(jù)集進行訓(xùn)練。數(shù)據(jù)運行環(huán)境采用了運行在Intel i3-2370MCPU 和2 GB RAM 上的Matlab 計算軟件,并使用2020 年1-12 月的電力負(fù)載值來訓(xùn)練WNN。同時,采用了2021 年1-12 月的數(shù)據(jù)來測試WNN。每小時的預(yù)測結(jié)果如圖3 所示,Y表示模型輸出的百分比誤差。基于雙層預(yù)測模型的百分比誤差分別為3.8%和3.81%,ANN 預(yù)測模型的百分比誤差分別為2.2%和2.23%,基于混合預(yù)測模型的誤差百分比均為1.24%。

圖3 每小時預(yù)測誤差實驗
每日的預(yù)測結(jié)果如表2 所示。從表中能夠清楚地看到,基于ANN 的預(yù)測模型預(yù)測未來負(fù)荷時偏差最大。與其他兩個現(xiàn)有模型相比,所提出的混合預(yù)測模型預(yù)測未來負(fù)荷時偏差最小。基于混合預(yù)測模型的短期負(fù)載預(yù)測算法相比其他兩種模型更為準(zhǔn)確。

表2 每日預(yù)測誤差實驗
預(yù)測策略的準(zhǔn)確性與其收斂速度之間存在取舍,雙層預(yù)測模型提高了預(yù)測模型的準(zhǔn)確性,但導(dǎo)致收斂速度相對較慢。混合預(yù)測模型由于采用并行的結(jié)構(gòu),在提高預(yù)測精度的同時,在執(zhí)行時間方面并未付出較多的成本。圖4 為訓(xùn)練數(shù)據(jù)樣本的數(shù)量對預(yù)測模型誤差性能與執(zhí)行時間的影響。

圖4 訓(xùn)練數(shù)據(jù)樣本數(shù)量對模型性能的影響實驗
通過圖4(a)可知,當(dāng)輸入樣本的數(shù)量從30 增加到120 時,能夠改善所有模型的誤差性能。當(dāng)訓(xùn)練樣本數(shù)量從60 增加到120 時,對于預(yù)測模型的改進效果并不顯著。圖4(b)顯示了樣本數(shù)量對于執(zhí)行時間的影響,由于訓(xùn)練樣本的數(shù)量增加,人工神經(jīng)網(wǎng)絡(luò)的訓(xùn)練也需要更多時間。從圖4 中可以看出,與其他兩個模型相比,所提出的混合預(yù)測模型更具可擴展性,即擁有相對更高的穩(wěn)定性。
表3 顯示了在兩組數(shù)據(jù)集上的平均絕對百分比誤差(MAPE)與3 個預(yù)測模型的迭代次數(shù)之間的關(guān)系。收斂特性(即迭代次數(shù))表明,基于混合模型和雙層模型在幾乎相同的迭代次數(shù)中收斂至最優(yōu)值。而基于ANN 的預(yù)測模型只需20-23 次迭代即可收斂至最佳目標(biāo)值,但這種最小的計算負(fù)擔(dān)是通過付出高昂的預(yù)測準(zhǔn)確性成本來實現(xiàn)的。因此,基于混合模型的預(yù)測算法實現(xiàn)了比ANN 模型和雙層預(yù)測模型略高的運算性能。

表3 MAPE與模型迭代次數(shù)關(guān)系統(tǒng)計
可再生能源供需側(cè)均存在波動性和不確定性,因此負(fù)荷預(yù)測是智能電網(wǎng)的關(guān)鍵一環(huán)。該文針對基于聚類技術(shù)的短期負(fù)荷預(yù)測提出了混合模型,為了提高短期預(yù)測的效果,使用基于卡爾曼濾波與小波神經(jīng)網(wǎng)絡(luò)的混合模型對電網(wǎng)負(fù)荷進行了短期預(yù)測。
智能電網(wǎng)區(qū)別于傳統(tǒng)的電網(wǎng)技術(shù),具有較高的動態(tài)性,這為管理帶來了挑戰(zhàn)。此時,智能電網(wǎng)的信息傳輸更加高效,能為管控提供更多的參考信息。而如何在時變系統(tǒng)下研究電網(wǎng)負(fù)荷的短期預(yù)測問題,將是該研究下一步的重點。