黃媛玉,毛弋
(湖南大學信息科學與工程學院,中國長沙 410082;湖南大學電氣工程與科學學院,中國長沙 410082)
基于主成分分析法的遺傳神經網絡模型對電力系統的短期負荷預測
黃媛玉,毛弋*
(湖南大學信息科學與工程學院,中國長沙 410082;湖南大學電氣工程與科學學院,中國長沙 410082)
針對BP神經網絡的兩個主要缺點,網絡訓練速度慢,對初始權值閾值敏感,容易陷入局部極小點,本文利用多元統計分析的主成分分析方法(Principal components analysis,PCA),在不損失原始負荷數據主要信息的前提下提取負荷數據的主成分,有效地減少了預測模型的輸入量.同時將遺傳算法(GA)與BP神經網絡結合,利用GA的全局搜索優化BP網絡的結構參數,有效克服BP算法的局部收斂等問題.實驗結果表明,該方法提高了預測精度,得到了較好的預測結果.
電力系統;負荷預測;主成分分析;遺傳算法;BP神經網絡
電力系統短期負荷預測是電力生產部門的重要工作之一,它主要用于預報未來幾小時、一天至幾天的電力負荷.通過準確的負荷預測,可以經濟合理地安排機組啟停,減少旋轉備用容量,合理安排檢修計劃,降低發電成本,提高經濟效益,是電力系統運行的安全性、經滬生和供電質量的重要保障.
BP神經網絡已廣泛應用于短期負荷預測中,其最主要的特點是有很強的非線性擬合能力,可映射任意復雜的非線性關系.具有高度的容錯性和魯棒性以及強大的白組織、自學習能力.
短期負荷預測中輸入變量的選擇直接影響神經網絡的學習速度、網絡結構的復雜性和網絡泛化的精度.通常,為了提高負荷預測精度,輸入變量必須包括盡可能多的影響因素,如當天的溫度、濕度、風速、當天是否為工作日、休息日、節假日等,從而導致BP神經網絡的輸入節點數量過多,網絡的復雜度增大,進而使得訓練次數多,學習效率低,收斂速度慢.若初始權值閾值選取不當,又易形成局部極小而得不到全局最優.目前,為保證短期負荷預測預測精度,解決BP神經網絡輸入參數以及初始權值閾值的確定問題,國內外學者已做了大量的研究[1-5].文獻[4]提出了一種結合數據挖掘技術和神經網絡的短期負荷預測模型,利剛數據挖掘中的聚類技術將歷史負荷數據進行聚類,根據聚類后的分類信息對定性屬性利用粗糙集進行屬性約簡,由約簡結果進一步生成決策規則樹,然后利用自適應神經網絡進行預測.文獻[5]提出了一種模糊神經網絡模型,利用模糊理論處理非線性問題的能力以及從大量數據中抽取相似性的功能,賦予神經網絡模糊的輸入變量和模糊的權值閾值,通過訓練不斷調整神經網絡權值閾值來適應環境變化,從而提高系統性能.
為解決這一系列問題,本文利用主成分分析方法對原始負荷數據進行適當的處理,去除數據間的相關性,刪除其中的部分冗余信息,以降低數據的維數,得到主成分分量,然后再對這些主成分分量用GA-BP神經網絡建模進行預測.由于采用了GA對BP神經網絡的連接權進行優化,有效克服了BP算法的局部收斂等問題.通過算例結果分析,證明了該模型的有效性.
1.1 主成分分析的基本原理
主成分分析方法是一種將多個指標化為少數幾個不相關的綜合指標的多元統計分析方法.它是通過矩陣的特征分析來對原始數據進行線性空間投影,從而達到降低數據維數的目的,其優點在于它既保留了原數據的大部分信息,又去除了原始數據的相關性,減少了數據量,很好地實現了數據的降維和簡化.利用主成分分析得到的主成分與原始變量之間的基本關系如下:(1)每個主成分都是各原始變量的線性組合;(2)主成分的數目大大少于原始變量的數目;(3)主成分保留了原始變量絕大多數信息;(4)各個主成分之間互不相關.
設對某一事物的研究涉及P個指標,分別用x1,x2,…,xP表示,這P個指標構成P維隨機向量為X=(x1,x2,…,xP)′.對X進行線性變換,形成新的綜合變量,用Y表示,即新的綜合變量可以由原來的變量線性表示為下式:

式中滿足ui′ui=1,Yi與Yj相互無關,Y1,Y2,…,YP的方差依次減小.則稱Y1,Y2,…,YP為原始變量的第一、第二、…、第P個主成分.
1.2 主成分分析步驟
具體的計算步驟如下:(1)根據研究問題選取初始分析變量;(2)根據初始變量特性判斷由協方差矩陣求主成分還是由相關矩陣求主成分;(3)求協方差矩陣或相關矩陣的特征根與相應標準特征向量;(4)得到主成分的表達式,計算各個主成分的方差貢獻率及累計方差貢獻率,從而選取主成分;(5)結合主成分對研究問題進行分析并深入研究.
2.1 BP神經網絡的基本原理
BP神經網絡是一種多層前饋神經網絡,由輸入層、隱含層和輸出層組成,含有一個隱含層的神經網絡結構如圖1所示.
圖1中,P代表輸入層有P個分量的輸入向量,n為樣本數,X為輸入矩陣,W1,W2,b1,b2,a1,a2,S1,S2,n1,n2分別為隱含層和輸出層神經元的權重矩陣、閾值向量、輸出向量、神經元數及加權和向量.

圖13 層BP神經網絡結構圖
BP神經網絡預測前首先要訓練網絡,通過訓練使網絡具有聯想記憶和預測能力.BP神經網絡訓練過程包括以下幾個步驟:
(1)網絡初始化,把所有權值閾值都設置成較小的隨機數.
(2)提供訓練樣本集,計算隱含層和輸出層的輸出.對于圖1來說,隱含層的輸出為a1=f1(W1X+b1)輸出層的輸出為a2=f2(W2a1+b2).
(3)計算誤差,調整權值閾值.
(4)反復進行步驟(2)~(3),直到誤差滿足精度為止.
2.2 遺傳BP神經網絡模型[6-7]
BP神經網絡的學習就是對網絡的權值和閾值進行學習和調整.為了避免因為初始權值閾值的選取不當,而造成網絡在訓練時陷入局部最小,本文引入遺傳算法對網絡初始參數進行優化.所謂網絡參數的優化,就是尋找良好的網絡權值和閾值.使得網絡全局誤差極小化.
具體的實現步驟如下:
(1)參數編碼:將BP網絡的權值和閾值作為基因,采用二進制編碼方式進行編碼,每個基因編碼代表解空間的一個解.
(2)在編碼的解空間中,隨機生成一個初始群體(不要求一定是可行解).
(3)對群體中的每一個個體進行適應度評價,本文采用BP神經網絡訓練得到的誤差作為適應度函數.
(4)選擇操作:按輪盤賭法將當前解群體中適應度最高的個體結構完整地復制到下一代群體中.

計算自適應交叉概率,對個體進行交叉.
(6)變異操作:將個體按照適應度大小進行排序,計算自適應變異概率,對個體進行變異操作.
(7)反復進行步驟(3)~(6),每進行一次循環稱為群體進化了一代,直至進化了K代(K為預置的進化代數).
(8)從第K代群體中選出適應度值最大的個體,該個體對應的就是BP神經網絡訓練時的權值和閾值的最佳初始解.
(9)利用訓練好的神經網絡進行預測.
將PCA、GA算法和BP神經網絡三者結合,建立預測模型,利用PCA先對原始數據進行適當的處理,篩選出主成分,從而確定BP神經網絡的拓撲結構,然后再利用GA算法從初始權值閾值的解群中選取出一組優秀的初始權值閾值.目的是為了克服傳統神經網絡的兩大主要缺點:(1)輸入變量過多時,網絡結構復雜,訓練速度慢,學習速度急劇下降;(2)初始權值閾值選取的盲目性,使得訓練容易陷入局部極小點.對傳統BP神經網絡進行改進后,由于相對穩定了訓練次數和最終權值閾值,大大加快了訓練速度.
由于短期負荷預測中的輸入變量中,常常涉及到負荷、溫度、天氣因素等不同的指標,同時本文BP網絡每層神經元節點的激活函數采用sigmoid函數,必須:降輸入量處理為區間[0,1]之間的數據,所以從相關系數矩陣出發進行主成分分析.具體步驟如下:

歸一化方法有很多種形式,這里采用公式:

n為樣本數,每個樣本為P維;xij為第i個樣本的第j維的取值;x1,x2,…,xp表示X的各列向量;xi.max,xi.min分別為第i個樣本中的最大、最小值.在實際應用中,xi.max一般取實際最大值的1.1倍;xi.min一般取實際最小輸入量得0.9倍.若為溫度值,一般取xi.min=-50℃,xi.max=50℃.
(2)計算樣本各維間相關系數矩陣R(rij)P×P.

式中Cov(xi,xj)表示數據矩陣中第i列和第j列之間的協方差;Var(xi),Var(xj)為xi、xj的方差,計算公式為

(3)求相關系數矩陣只的特征值和特征向量.
求得R的p個特征值λ1,λ2,…,λp(特征值均大于等于零)及相應的特征向量e1,e2,…,ep.
(4)求各個主成分的方差貢獻率.
第k個主成分Yk的方差貢獻率為

(5)篩選主成分.
將各主成分的方差貢獻率由高到低排列,計算累計方差貢獻率

當前m個主成分的累計方差貢獻率達薊桔息反映精凌的要求,即滿足M≥85%時,求出λ1,λ2,…,λm對應的特征向量e1,e2,…,em,利用公式:

求得m個主成分(Y1,Y2,…,Ym)作為遺傳BP神經網絡的輸入變量.
顯然,第k個主成分Yk=e'kX,k=1,2,…,m,將第i個樣本的值(xi1,xi2,…,xip)代入Yk的表達式,經計算得到的值稱為第i個樣本在第k個主成分的得分,記為Yik=e'k(xi1,xi2,…,xip).
主成分分析的遺傳神經網絡示意圖如圖2所示.

圖2 主成分分析的遺傳神經網絡示意圖
為了驗證所述主成分分析的遺傳神經網絡的可行性和有效性[8],以南方某市的2004年7月10日到7月20日的12個整點有功負荷值以及2004年7月11日到7月21日的最高氣溫、最低氣溫和天氣特征值(晴天、陰天還是雨天)為原始數據,對7月21日的日負荷進行預測建模為例進行討論.日負荷預測的影響因素集見表1.

表1 日負荷預測的影響因素集
故有15個輸入變量.本文將獲得的原始數據預處理之后,利用公式(3)將其進行歸一化處理,然后求出相關系數矩陣,利用公式(6)計算累計方差貢獻率,見表2.

表2 特征值及累計方差貢獻率
由表2可確定前4個特征值的累積方差貢獻率已經大于85%,所以選擇4個主成分.選定4個主成分后,利用公式(7)計算出新的輸入變量.將得到的輸入變量輸入遺傳神經網絡中進行預測.
運用matlab編程并進行仿真訓練,對未經過主成分分析的數據,建立BP神經網絡模型和GABP遺傳神經網絡模型.輸入層有工5個神經元,輸出層有工2個神經元,隱含層節點的選取采用反復試驗的方法,確定為31個.對經過主成分分析的數據,同樣建立BP神經網絡模型和GABP遺傳神經網絡模型.輸入層有4個神經元,輸出層有土2個神經元,反復試驗后,確定隱含層節點為24個.神經網絡隱含層節點轉移函數選用tansig函數,輸出層節點轉移函數選用pure帆函數.表3是在4組不同的神經網絡性能及預測誤差比較.圖3為4組不同的神經網絡預測的相對誤差曲線.

表34 組不同的神經網絡性能及預測誤差比較
從表3可以看出,主成分分析的遺傳神經網絡消除了網絡輸入因子間的相關性,減少了輸入變量,簡化了網絡結構,提高了預測精度.從圖3可以得出PCA-GABP網絡預測各個點的相對誤差較小,各點的可靠性大.
利用PCA對樣本集進行篩選,選出新的訓練和測試樣本集,從而減少了BP神經網絡建模時的輸入個數,同時消除了輸入因子的相關性并簡化網絡結構,大大提高網絡的學習速率.用GA的全局搜索能力來優化BP網絡的結構參數,有效地克服BP算法易陷入局部收斂等問題,并將基于主成分分析的遺傳神經網絡的數學模型成功地應用于短期負荷預測研究中[9-11].得到的PCA-GABP神經網絡模型能達到較高的精度,為影響因素多且機理尚不清楚的電力市場提供了一個有效的方法和手段.

圖34 組不同的神經網絡預測相對誤差曲線
[1]高山,單淵達.神經網絡短期負荷預測輸入變量選擇新方法[J].電力系統自動化,2001,25(20):41-44.
[2]尹成群,康麗峰,孫偉,等.基于粗糙集和主成分分析結合的短期負荷預測[J].華北電力大學學報,2007,34(1):1-4.
[3]張曉星,周淙,任海軍,等.基于增量約簡算法確定電力負荷預測模型輸入參數的研究[J].電力系統自動化,2005,29(13):40-44.
[4]牛東曉,王建軍,李莉,等.基于粗糙集和決策樹的自適應神經網絡短期負荷預測方法[J].電力自動化設備,2009,29(10):30-34.
[5]胡越黎,計慧杰.短期電力負荷預測的模糊神經網絡方法[J].應用科學學報,2009,27(1):79-83.
[6]謝宏,程浩忠,張國立,等.基于粗糙集理論建立短期電力負荷神經網絡預測模型[J].中國電機工程學報,2003,23 (11):1-4.
[7]雷紹蘭,孫才新,周湶,等.基于徑向基神經網絡和自適應神經模糊系統的電力短期負荷預測方法[J].中國電機工程學報,2005,25(22):78-82.
[8]程其云,王有元,陳偉根.基于改進主成分分析的短期負荷預測方法[J].電網技術,2005,29(3):64-67.
[9]杜鵑,改進的TSK型動態模糊神經網絡在短期負荷預測的應用[J].電網技術,2010,34(4):69-75.
[10]梁海峰,涂光瑜,唐紅衛.遺傳神經網絡在電力系統短期負荷預測中的應用[J].2001,25(1):49-53.
[11]高海龍,張國立.改進遺傳神經網絡及其在負荷預測中的應用[J].華北電力大學學報,2009,36(5):37-40.
Power System Short-term Loading Forecasting by Genetic Neutral Network Based on Principal Components Analysis
HUANG Yuan-yu,MAO Yi*
(School of Information and Science,Hunan University,Changsha 410082,China;
School of Electrical Engineering and Science,Hunan University,Changsha 410082,China)
The principal components analysis was used in order to solve two main weaknesses of BP neural network such as the speed of network′s training is slow,sensitive to the initial weight and threshold,and easy to fall into the partial minimal point.The main component of load data can be obtained without losing initial load data of the main information so that the input quantity of the prediction model can be decreased.At the same time,the local convergence and other problems of BP algorithm can be effectively overcome based on the combination of genetic algorithm(GA)with BP neural network,and using GA′s global searching function to optimize BP network′s structure parameters.This model is applied in the power system short-term load forecasting simulation process.The results show that it can improve the performance of network and the accuracy of predictions.
power system;load forecasting;principal components analysis;genetic algorithm;BP neural network
TM743
A
1000-2537(2011)05-0026-06
2011-05-01
湖南省自然科學基金資助項目(10JJ5055)
*通訊作者,E-mail:breeze_hs@yahoo.cn
(編輯陳笑梅)