鄧燕國, 王冰, 曹智杰, 張秋橋
(1. 河海大學能源與電氣學院,江蘇 南京 211100;2. 南京豪慶信息科技有限公司,江蘇 南京 210006)
20世紀80年代初,文獻[1]首次提出空間負荷預測概念,即在規劃用電區域內,將用地按照一定規則劃分為相同大小或不同大小的小區(也可稱為元胞),通過對小區歷史負荷以及土地利用特征、發展規律的分析,預測小區的電力負荷情況[2]。空間負荷預測結果關系配電網規劃的合理性,預測值過大或過小都會帶來不利影響,因此對空間負荷預測結果的精度有著較高的要求[3]。
目前,空間負荷預測方法主要有用地仿真法、趨勢法、多元變量法和負荷密度指標法[2]。用地仿真法采用大小相同的網格劃分小區,故僅能得到小區的理論負荷值,無法得到實際負荷值,對預測結果檢驗造成一定困難[4—5]。趨勢法簡單方便,數據需求量小,但其受負荷數據波動和外部環境變化的影響較大[6—7]。多元變量法對數據的質量和數量都有較高要求,且有效預測期較短[8]。負荷密度指標法在用地性質較為明確的規劃區域,具有較好的預測精度和較強的適應性[9—11],在國內應用較為廣泛。
近年來,采用負荷密度指標法的空間負荷預測不斷發展,預測精度有所提高,但仍需完善。文獻[12]提出基于最小二乘支持向量機(least square sup port vector machine,LS-SVM)的負荷密度指標法。該方法采用聚類后與待預測小區負荷密度指標較為接近的一類小區負荷密度指標作為LS-SVM模型的訓練樣本,訓練樣本中夾雜部分相似度較低的樣本,且可能會漏掉部分較好的樣本。文獻[13—14]引入灰色關聯分析(grey relational a na ly sis,GRA),選取與待預測小區負荷密度指標關聯度較高的樣本作為LS-SVM模型的訓練樣本,進一步提高了預測精度,但未考慮各影響因素指標對負荷密度影響程度不一的問題,且LS-SVM模型計算相對復雜,影響預測模型的整體運行速度。
文中針對以上問題,提出一種基于負荷密度指標優化與GRA-ELM的空間負荷預測方法。應用熵權法優化負荷密度指標的影響權重,引入極限學習機(extreme learning machine,ELM)降低算法復雜度,提高模型運算速度,并應用GRA為ELM選取訓練樣本。通過實例分析可知,文中所提方法空間負荷預測精度較其他方法有所提高。
熵權法根據被評價對象指標值構成的判斷矩陣確定指標權重,是一種客觀賦權法,能有效避免專家意見主觀性的影響[15]。當樣本中某項指標值變化較大時,其熵值較小,說明該指標提供的有效信息量大,權重相應較大;反之,指標的熵值較大,則該指標的權重較小。一組數據的信息熵定義為:
(1)
式中:n為樣本總數;pij為樣本i的第j個指標信息量在n個樣本總指標信息量中的比例。
(2)
式中:Yij為樣本數據標準化值。
對各指標進行信息熵計算,假設評價對象的指標共有k個,則各指標對評價對象影響權值為:
(3)
利用熵權法可以確定負荷密度指標體系中不同類型負荷各指標的影響程度,并以權重分配的形式表現出來。
GRA算法的基本思路是根據序列曲線幾何形狀的相似程度判斷其聯系是否緊密[15]。曲線相似度越高,則相應序列之間關聯度越大;反之,曲線相似度越低,則相應序列之間關聯度越小。
根據關聯度定義,已知序列Y和其相關序列Zi在第j項的關聯系數為:
(4)
Δij=|Yj-Zij|
(5)
式中:λ為分辨系數,取值為[0,1];Δij為Y和Zi在第j項的絕對差;min Δij,max Δij分別為第j項絕對差值的最小和最大值。
則Yj和Zi的關聯度為:
(6)
ELM算法是一種單隱含層前饋神經網絡學習算法[16],該算法隨機產生輸入層與隱含層間的連接權值及隱含層神經元的閾值,且在訓練過程中無需調整,通過求解廣義逆矩陣得出輸出權重矩陣。與LS-SVM相比,該算法無需選取核函數,且計算相對簡單,因而訓練速度較快[16]。
假設共有N組訓練樣本(Xj,tj),其中Xj=[xj1xj2…xjn]T∈Rn,tj=[tj1tj2…tjm]T∈Rm,j=1,2,…,N, ELM隱含層含L個神經元,則ELM的輸出為:
(7)
式中:e(·)為激勵函數;Wi=[wi1wi2…win]為隱含層第i個神經元與各個輸入層神經元間的連接權值;βi=[βi1βi2…βim]T為隱含層第i個神經元與各個輸出層神經元間的連接權值;bi為隱含層第i個神經元的閾值。ELM結構如圖1所示,其中M為輸出層節點數。

圖1 ELM結構Fig.1 Structure of ELM
為使單隱含層的輸出誤差達到最小學習目標,式(7)可表示為:
Hβ=T
(8)
式中:B為隱含層與輸出層的連接權值矩陣;T為期望輸出;H為神經網絡的隱含層輸出矩陣,如式(9)所示。
(9)
(10)
式中:W為輸入層與隱含層之間的連接值;b為隱含層神經元閾值。


(11)
通常L (12) 式中:H+為H的廣義逆。 考慮到ELM中,W和b均為隨機給定,對未知輸入參數識別能力差,無法保證預測精度為模型最優。因此引入粒子群優化(particle swarm op ti mi za tion,PSO)算法對ELM的輸入參數尋優,提高模型預測精度。 PSO算法中每個粒子就是d維空間的一個潛在解,記為Qi=[qi1qi2…qid],第i個粒子的速度記為Vi=[vi1vi2…vid]。在迭代過程中,第i個粒子搜索到的最佳位置為Piopt=[pi1pi2…pid],所有粒子搜索到的最佳位置為Pg=[pg1pg2…pgd]。粒子按式(13)更新速度和位置。 (13) 式中:i=1,2,…,I,I為粒子總數;t為迭代次數;ω0為慣性權重因子;非負常數c1,c2為學習因子;r1,r2為[0,1]之間的隨機數。 GRA-ELM建模步驟為:首先,利用GRA計算所有樣本與待預測小區指標值之間的灰色關聯度,選取灰色關聯度較高的樣本作為訓練樣本;然后,將挑選后的訓練樣本輸入到ELM模型,并采用PSO算法對ELM模型的W和b進行尋優;最后,由模型輸出預測值。 基于熵權法與GRA-ELM的空間負荷預測方法,利用熵權法對負荷密度指標進行權重分配,應用GRA為ELM挑選訓練樣本,并采用PSO算法對ELM的參數進行尋優,主要步驟如下。 在規劃區域內,根據實際用地情況劃分小區,搜集小區的歷史負荷、面積、經濟、人口等基礎數據,為空間負荷預測奠定基礎。 建立負荷密度指標體系是為了確定不同類型負荷的影響因素和這些影響因素組成的樣本庫,為空間負荷預測提供參考依據及有效的數據基礎,避免因數據收集不足、輸入模型雜亂無序而降低預測精度[14]。 根據《城市用地分類與規劃建設用地標準》[17]給定的小區用地、用電性質,將規劃區域內的負荷劃分為4~10類(具體可按實際情況確定),即商業負荷、居民負荷、工業負荷、物流負荷、教育科研負荷、公共負荷等。通過搜集到的數據,統計分析不同類型負荷的相關影響因素。建立負荷密度指標體系,得到不同類型負荷的密度值和影響因素數據庫。不同類型負荷的影響因素如圖2所示。 圖2 不同類型負荷的影響因素Fig.2 Influencing factors of different types of loads 應用熵權法對3.2節中的負荷密度指標進行權重分配,使得負荷密度指標體系更好地反映各因素對負荷密度值的影響。將權重分配結果具體應用在樣本挑選和ELM中的數據輸入上。若直接采用影響因素樣本信息作為熵權法的輸入,可能會掩蓋影響因素信息與負荷密度值之間的某些聯系。因此,利用GRA獲取影響因素與負荷密度值之間的關聯系數矩陣,作為熵權法的輸入。 根據關聯系數矩陣,應用熵權法獲得負荷密度指標之間的權重分配。按式(1)計算關聯系數矩陣的信息熵Ej,而后按式(3)計算各負荷密度指標權重wj。 為給ELM模型提供準確有效的訓練樣本,利用GRA對樣本進行精選。以待預測小區的負荷密度指標為已知序列Y,樣本的負荷密度指標為相關序列Xi,則二者之間的關聯度為: (14) 需要注意的是,在負荷密度指標權重分配中,GRA是用來獲取影響因素與負荷密度的關聯系數矩陣,為熵權法確定指標權重提供可靠的數據。在GRA-ELM模型中,GRA是用來挑選與待測小區負荷密度指標較為相近的樣本,為ELM提供有效的訓練數據,二者的使用方式和作用皆不相同。 將GRA挑選的樣本數據進行如式(15)所示的歸一化處理,并將負荷密度指標數據乘上相應的指標權重wj,作為ELM模型的輸入x′i。 (15) 式中:xi為第i個樣本數據;xmax為各指標屬性值中對應的最大值。 利用PSO算法優化ELM模型的W,b。將參數W,b編碼為粒子,按式(14)迭代獲取粒子最優位置,并解碼得到最優解。將處理后的訓練樣本數據和優化后的參數輸入到ELM中,得到待測區域的負荷密度預測值。 根據獲得的小區負荷密度預測值yi和收集的小區面積si,可求得小區負荷預測值Pi。 Pi=yisi (16) 對不同類型負荷的小區求取負荷預測值,得到分類負荷預測值。將分類負荷預測值相加,則可得規劃區域內的總負荷預測值。空間負荷預測流程如圖3所示。 圖3 空間負荷預測流程Fig.3 Process of spatial load forecasting 以居民類小區為例,搜集上海市某居民類小區的負荷及影響因素數據,分析基于熵權法與GRA-ELM的空間負荷預測實際效果。在居民負荷中,選取的負荷密度指標為人口密度A1,人均月收入A2,人均負荷用電量預期A3,電價A4。整理各指標數據,并計算小區負荷密度C,作為空間負荷預測模型的輸入樣本。小區樣本總數為163,樣本具體指標數據如表1所示。 表1 樣本的各指標數據Table 1 Each indicator data of the sample 將上述樣本輸入GRA中,得到各指標與負荷密度值的關聯系數矩陣,再將關聯系數矩陣輸入到熵權法模型中,得到各影響因素指標對負荷密度值的影響權重,結果如表2所示。 由表2可知,在居民負荷中,人口因素對小區負荷密度值的影響程度較高,電價因素對小區負荷密度值的影響程度較低。這與居民負荷中人口密度增大時用電需求隨之增加,以及居家用電剛性需求受電價影響相對較小的實際情況相符。 表2 影響因素對負荷密度值的影響權重Table 2 The influence weight of influencing factors on the load density value 計算待預測小區負荷密度指標數據與樣本的灰色關聯度,選取關聯度大于0.9的樣本進行訓練。表3為待預測小區指標數據與樣本的灰色關聯度。 表3 待預測小區指標與樣本的灰色關聯度Table 3 The gray correlation degree between the index of the community to be predicted and samples 將訓練樣本輸入ELM模型,輸出待預測小區的負荷密度值,并根據式(16)計算小區負荷預測值。不同方法得到的預測值對比如表4所示,負荷實際值為15.60 MW,相對誤差為預測值相對實際值的誤差大小。 表4 不同方法的負荷預測結果Table 4 Load forecasting results of different methods 由表4可知,文中方法預測值的相對誤差為1.73%,精度較高;未引入熵權法進行負荷密度指標權重分配的方法預測精度稍低,相對誤差為2.88%;未使用GRA挑選訓練樣本的方法預測精度較低,相對誤差為8.01%。由此表明,訓練樣本的選擇對模型的預測結果有重要影響。同時,負荷密度指標權重的合理分配,有助于提高預測精度。 進一步與文獻[12]、文獻[13]的負荷預測結果進行對比,結果見表5。文獻[12]采用模糊C-均值(fuzzy C-means,FCM)聚類算法挑選訓練樣本,利用LS-SVM得到預測結果。文獻[13]采用GRA挑選訓練樣本,利用LS-SVM得到預測結果。 表5 3種方法的負荷預測結果Table 5 Load forecasting results of three methods 由表5可知,文中方法預測精度最高,其次為文獻[13]采用GRA挑選樣本的LS-SVM方法,最后為文獻[12]采用FCM挑選樣本的LS-SVM方法。對比不同方法的運行時間(6次運行時間的平均值),文中方法耗時最短。由此表明,文中所提方法預測精度較高,且具有較快的運行速度。 文中提出了基于熵權法與GRA-ELM的空間負荷預測方法,先引入熵權法對負荷密度指標進行了客觀權重分配,而后利用ELM學習能力強、速度快的優勢,采用GRA為ELM挑選高質量訓練樣本,并使用PSO算法對ELM參數進行優化,提高預測精度。實例分析表明,與未引入熵權法、未引入GRA或采用LS-SVM的方法相比,文中方法的空間負荷預測精度較高。2.3 GRA-ELM建模步驟
3 空間負荷預測實施方法
3.1 數據搜集
3.2 建立負荷密度指標體系

3.3 求取負荷密度指標權重
3.4 基于GRA挑選訓練樣本
3.5 ELM模型輸出負荷密度值
3.6 負荷值計算

4 實例分析





5 結語