鄭云飛, 趙紅生, 王博, 潘笑, 潘興亞
(1. 國網湖北省電力有限公司經濟技術研究院,湖北 武漢 430077;2. 國網湖北省電力有限公司,湖北 武漢 430077;3. 武漢大學 電氣與自動化學院,湖北 武漢 430072)
電能無法大量儲存,因此在發電廠運行以及電能調度的過程中,要求發電廠出力與系統負荷的波動保持動態平衡。對電力負荷進行精準預測不僅可以提高電網運行的可靠性與經濟性,而且影響著配電網的科學規劃與發展[1-2]。因此如何提高全網短期負荷的預測精度成為配電網運行與規劃的關鍵技術。
為了提升負荷預測結果的可信度及可觀測性,負荷聚類算法在短期負荷預測領域得到了廣泛的應用。文獻[3]對歷史負荷數據進行分析,基于不同聚類算法尋找最優的典型日負荷曲線。文獻[4]利用聚類模型對負荷信息進行特征提取,尋找與預測日相似的歷史數據作為預測樣本,可以有效地提升預測精度和速度。然而上述方法直接對全網負荷進行預測,無法實現在負荷預測過程中的可視化。文獻[5-6]基于不同的負荷數據的特征參量集合,對相應的聚類算法進行改進,對不同用電習慣的用戶終端進行分類,得到更為精細化的分類結果。
上述方法主要集中于對短期負荷預測模型精度和速度的改進,無法通過負荷曲線提取用戶的用電習慣,阻礙了售電側對信息的理解。針對上述方法的缺陷,本文首先考慮不同的用電習慣,利用自組織映射網絡(self-organizing feature map,SOM)實現負荷分類,然后利用遺傳算法(genetic algorithm,GA)優化的Elman神經網絡對全網負荷進行差異化預測,最后基于負荷綜合穩定度得到全網負荷預測結果。本文提出的SOM-GA-Elman模型不僅可以有效提升全網短期負荷預測的精度,而且適用于部分子網數據缺失的情況,為電網負荷的精細化管理提供參考。
電網負荷是量大、高維和多數據類型混雜的大數據集,這一特點使得從電網數據中挖掘出不同類型的負荷特性成為一個難點。本文通過SOM網絡實現電網負荷數據的降維處理并將其投影到二維空間,將復雜的電網數據進行簡化以實現可視化,從而獲得不同類型的用戶用電習慣。二維SOM網絡的結構如圖1所示。

圖1 二維SOM網絡的結構圖
由圖1可知:二維SOM網絡由輸入層和輸出層(競爭層)連接構成,網絡的輸出層神經元與鄰域其他神經元之間廣泛相連,可以實現兩者的相互激勵,輸入神經元與輸出神經元則基于權向量實現兩者的全連接?;赟OM聚類方法對電網負荷歷史數據進行分析,將具有相似負荷特性的終端進行聚類,獲得具有不同負荷特性的子網系統。
Elman神經網絡在負荷預測領域具有廣泛的應用[7]。本文在利用Elman 神經網絡對各子網負荷分別進行預測時,引入GA對網絡的權重以及閾值進行差異性優化,克服了尋優過程中的盲目性,同時避免出現局部收斂現象,從而大幅改善網絡的尋優性能。本文提出的GA-Elman預測模型如圖2所示。

圖2 GA-Elman預測模型
目前,針對全網短期負荷的預測需求,常見的方法是首先對負荷特性進行聚類分析,將全網劃分為多個子網,然后對各個子網的負荷分別進行預測,再將各個子網的負荷預測結果直接進行累加求和,最終得到全網負荷預測結果。但由于各個子網的負荷波動程度差異較大,預測的難度各不相同,上述的“子網累加法”需要獲得所有子網的預測結果,對于缺少一個或幾個子網預測值的情況無能為力。
各子網的實時負荷占比在每個時間節點是大致穩定的,因此全網負荷預測值可用式(1)表示。
(1)
式中:load(i,t)為第i個子網在t時刻點的負荷預測結果,由Elman神經網絡模型預測得出;P(i,t)為第i個子網在t時刻點的負荷占比,可取歷史數據的平均值;L(i,t)為第i個子網在t時刻點的全網系統負荷預測結果。
由式(1)可知,每個子網負荷預測值都可以映射獲得一個相應的全網負荷預測值。由于各子網負荷占全網負荷的比例不同,各子網的穩定性在預測全網負荷時的影響程度也不同,為了衡量子網負荷的穩定性,引入負荷綜合穩定度指標STA。
(2)

為了避免極端誤差的出現,一般挑選STA指標較小的r個子網來獲得較為準確的全網負荷。設這r個子網分別為1,2,…,r,則t時刻點的全網負荷預測結果可表示為:
(3)
式中:α(i,t)為由第i個子網映射得到的全網負荷預測值在t時刻的權重。
為了得到各個子網的權重矩陣,本文以歷史樣本空間內t時刻點的預測殘差平方和最小為目標,構建如下非線性優化模型。
(4)
式中:n為歷史樣本的天數;L(i,t,j)為第j天t時刻由第i個子網映射出的全網負荷預測值;Lreal(t,j)為第j天t時刻的實際全網負荷結果。
求解上述優化問題,求解各個時刻點的權重系數值后,即可根據式(3)獲得預測日各時刻點的全網負荷預測結果。
為了對全網負荷預測結果的精準程度進行量化分析,本文采用預測結果的均方根誤差(mean square error, MSE)對預測模型的精度進行表征。計算公式如式(5)所示。
(5)

本文提取某市電網系統中專變用戶的負荷有功功率作為測試數據集,數據集中包含743個樣本數據。智能電表以15 min為間隔對負荷有功功率進行采樣,得到采樣頻率為96點/d的負荷曲線。通過用戶用電信息采集系統提取2019年10月10日—10月29日的用戶日負荷曲線。
2.1.1 負荷數據預處理
本文以日有功功率最大值為基準對用戶日負荷曲線數據進行預處理,主要包括空缺值填充、異常值剔除和數據歸一化,具體過程本文不再贅述。為了更直觀地對負荷數據進行分析,本文選取了5個特征指標。
(1)日平均負荷:預測日內全部負荷點的平均值。
(2)日負荷率=日平均負荷/日最大負荷。
(3)峰時耗電率=高峰時段負荷量/待預測日總負荷量。
(4)日峰谷差率=日峰谷差/日最大負荷。
(5)平段的用電量百分比。
2.1.2 非負荷樣本數據預處理
在對各子網負荷進行預測時,還需要綜合考慮天氣和節假日等影響因素對負荷變化的影響。對當地溫度以及濕度進行等時刻采樣,可以得到天氣數據集,同時還需要對節假日信息進行關聯分析。影響因素的具體指標如表1所示。

表1 非負荷樣本的影響指標
本文選取2.1.1節中的5個特征指標建立短期負荷的聚類模型。為了易于理解聚類所要傳遞的信息,一般設置競爭層的節點數略大于輸入樣本的個數,本文將SOM網絡競爭層節點數設定為12×12,將最大迭代次數設置為100,從而保證得到的聚類結果具有較好的收斂效果。圖3是網絡聚簇分布圖。觀察該圖可知,有四簇顏色較淺,代表每簇節點距離較近,每簇間都有較深的顏色節點將其分開,故該數據集聚為四類。神經元分類情況如圖4所示,深色正方形表示勝利的神經元,其中數字“n”表示有n個輸入神經元被相應競爭層神經元激發,白色表示沒有神經元被激發,相同的數字代表被聚為一類,總體被聚為四簇。

圖3 聚簇分布特征圖

圖4 神經元分類情況
本文以2019年10月10日—10月29日的預處理數據作為訓練樣本,每7 d的負荷及天氣、節假日數據作為輸入向量,第8 d的負荷作為目標向量,從而得到13組訓練樣本,以10月30日的負荷數據作為網絡的測試樣本。
本文采用GA-Elman對各類子網的負荷分別進行預測,迭代次數設為500次,迭代目標設為0.01,適應度函數為MSE。遺傳算法初始種群數設為500,交叉概率設為0.4,變異概率設為0.1,遺傳代數設為100代。預測結果如圖5~圖8所示。


為了驗證GA-Elman模型對各子網負荷的預測精度,本文基于傳統的Elman神經網絡對各子網負荷進行預測。將預測結果進行對比,如表2所示。
由表2可知,相比于傳統的Elman神經網絡,本文采用的GA-Elman具有更好的適用性,對各個子網均具有更高的預測精度。
將本文方法與傳統的“子網累加法”的預測結果進行對比,通過對式(5)中的MSE進行分析計算,得到如圖9所示的預測誤差曲線。

圖9 預測結果對比
由圖9可知,相比于常見的"子網累加法",基于子網負荷綜合穩定度得到的預測結果具有更高的精確度。本文提出的全網負荷模型不僅能夠提高負荷預測的精度,而且預測過程不依賴全部負荷數據,適用于存在數據缺失的配網負荷預測,具有較強的適用性。
本文提出了一種基于SOM-GA-Elman的全網短期負荷預測模型,該模型能夠盡可能地保留負荷數據的潛在特征,得到不同特性的負荷曲線,有利于分析用戶用電習慣,從而提高預測精度。對實際算例的分析證明了該集成預測方法具有較高的預測精度。該預測模型同樣適用于部分子網數據缺失而需要得到全網結果的情況,在實際電網規劃應用中,具有較強的適用性,滿足智能配電網發展的內在要求。