熊高峰,韓 鵬,聶坤凱
(湖南大學電氣與信息工程學院,長沙 410082)
在電力市場中,準確的電價預測不僅有助于發電企業構造最優報價策略,實現自身利益最大化,而且有助于用戶降低使用成本。因此,電價的分析和預測是電力系統中的一個重要研究領域。
到目前為止,電價預測的方法大致可以分為兩類[1]:一類是基于實際物理仿真模型的預測方法;另一類是基于數學建模的預測方法。前者通過對電力系統和定價過程進行詳細模擬來預測電價。該方法有助于對電價曲線進行詳細了解,但是,它需要大量的系統參數和市場信息,因此,在大型電力系統中,該方法較難實施。后者主要通過分析影響電價的主要因素、建立合適的數學模型來對電價進行預測。相對于前者而言,該類方法具有建模簡單和易于實施的特點,因此,成為電價預測研究的主要方法。目前已提出的數學模型主要有時間序列法(自回歸模型和差分自回歸滑動平均模型等)[2,3]和神經網絡法[4~6]等。但是,由于電價不僅受到負荷需求和發電機組的影響,而且也受到網絡結構、發電廠商報價策略及天氣狀況等的影響,因此,電價時間序列的演化過程十分復雜,存在很強的隨機波動性。這使得采用傳統的時間序列法或人工神經網絡法來對電價進行預測時效果往往不是很理想,有必要進一步改進預測方法、提高預測精度。
本文從電價時間序列的特點出發,采用數學方法將電價時間序列分解成趨勢分量、周期分量和隨機分量三個組成部分,并且,分別建立合適的預測模型來進行預測,將所得的三個預測結果相加得到最終的電價預測值。對美國PJM電力市場中日前電價進行的仿真測試結果表明,該方法能明顯提高預測精度。
在本質上,電價時間序列是一個非平穩隨機時間序列,它在不同時間范圍內的均值和方差是不同的,具有異方差特性,其外在表現為波動性大、跳躍點多、價格尖峰明顯、離散程度高[7]。由于難以準確預測出跳躍點和價格尖峰出現的時間和高度,因此,很難用數學方法直接對這種時間序列作準確預測。但是,從電價時間序列的演化過程來看,在一定時間內波動的電價具有一定的趨勢性。并且,由于電價主要受到具有強烈周期性(又稱季節性)的電力負荷的影響,因此,電價的波動中又表現出一定的周期性。從非平穩的電價時間序列中分離出趨勢分量和周期分量后得到的隨機分量是一個平穩隨機時間序列[2,8],相對于非平穩時間序列而言,其分析和預測變得相對容易。
一般而言,在電價時間序列中,工作日(周一至周五)電價與周末(周六至周日)電價相差幅度很大,呈現出不同的特點。因此,本文首先將電價時間序列分解成工作日電價和周末電價兩個時間序列,然后,分別從中分離出趨勢分量、周期性分量和隨機分量三個組成部分。
從時間序列中分離出變化緩慢的趨勢分量的方法主要有移動平均法、指數平滑法和多項式擬合等方法[8]。本文采用移動平均法來分離電價時間序列中的趨勢分量。
移動平均法MA(moving average method)是通過移動平均來消除時間序列中的不規則變動和其他變動,從而揭示出時間序列的趨勢性,得出趨勢分量。根據其利用歷史數據的權重不同,可以分為簡單移動平均法和加權移動平均法。本文采用簡單移動平均法,其計算公式如下

其中f(t)為移動平均值,即下一期的預測值;y(i)為i時刻時間序列的值;n為用于移動平均的時期個數。由移動平均法得到的各時刻的移動平均值所構成的序列即為趨勢分量。
為了揭示電價時間序列中所隱含的周期信息和頻域特征,本文采用離散傅里葉變換DFT(discrete fourier transform)及離散傅里葉逆變換IDFT(inverse discrete fourier transform)來從電價時間序列中分離出周期分量。
離散傅里葉變換[9,10]可以將離散時間序列變換為一組不同振幅、不同相位和不同頻率的正弦信號的疊加。它是時間序列由時域分析轉換到頻域分析的重要工具,在工程中有著廣泛的應用。
一個具有N個序列值的離散時間信號x(n)(n=1,2,…,N),其離散傅里葉變換定義為[9,10]:

相應地,離散傅里葉逆變換定義為

如果離散時間序列的采樣周期為T,采樣頻率為f(=1∕T),則對應的幅頻圖的橫坐標軸上具有N個頻率點,并且,前后頻率點之間的頻率間隔為Δf(=f∕N)。頻率軸上的第k個頻率點所對應的時域周期信號的周期Tk為

將分離出趨勢分量后的電價時間序列進行離散傅里葉變換,得到對應的幅頻圖,從該圖上提取幅值較大的頻率點,然后進行離散傅里葉逆變換,就可以得到電價時間序列中所隱含的周期分量。
從電價時間序列中分離出趨勢分量和周期分量后,就得到電價時間序列中的隨機分量。通常,該隨機分量是一個平穩時間序列,不含明顯的趨勢性與周期性。
從上述電價時間序列的分解和分離過程可知,分離出來的趨勢分量、周期分量和隨機分量具有不同的變化特點,因此,需要采取不同的預測方法進行預測。在得到各個分量的預測值后,對其進行相加即可得到原電價時間序列的預測值。整個電價時間序列的預測過程如圖1所示。

圖1 電價預測流程Fig.1 Flow chart of electricity price forecasting
趨勢分量變化緩慢,波動性小,相對而言容易預測,預測方法也較為簡單。由于本文采用簡單移動平均法(見式(1))來從電價時間序列中分離趨勢分量,因此,可將某一時刻的移動平均值作為其下一時刻的趨勢分量的預測值,即下一期的預測值。
從電價時間序列中分離出來的周期分量是由一組不同頻率、不同相位和不同振幅的正弦信號疊加而成,呈周期性變化。因此,在確定其變化周期后,由下式可以得到任意時刻t的周期分量的預測值。

式中:m為周期分量的變化周期;k為整數。
由于隨機分量波動較大,跳躍點較多,存在價格尖峰,因此,本文采用泛化能力較強、能夠在較少學習樣本下建模的最小二乘支持向量機LS-SVM(least square support vector machine)來進行隨機分量的預測。
1)最小二乘支持向量機
支持向量機SVM(support vector machine)[11~13]是在統計學習理論的基礎上發展起來的新一代機器學習方法。該算法的核心思想是通過非線性變換將輸入向量映射到高維特征空間,然后在高維空間內利用結構風險最小化準則構造最優決策函數,并利用滿足mercer條件的核函數來代替高維特征空間中的點積運算。最小二乘支持向量機是支持向量機的一種改進形式,它通過求解一組線性方程來取代支持向量機中凸二次規劃問題的求解,減少了計算量并提高了收斂速度。
假設N個訓練樣本集合為{(x1,y1),(x2,y2),…,(xN,yN)}∈RD×R,D為R空間的維數,xi(i=1,2,…,N)和y=(y1,y2,…,yN)分別為輸入向量和輸出向量。用非線性映射Φ(x)將樣本從原空間映射到高維特征空間H中,H為W維空間。在這個空間中構造如下最優線性回歸函數

其中w為權向量,w∈RW;b∈R。根據結構風險最小化準則,該最優線性回歸問題可以描述為以下約束優化問題。
目標函數

約束條件

其中θi為松弛變量,θi≥0;C為正則化參數,C>0。
為了將上述約束化問題的求解轉變成無約束優化問題的求解,建立Lagrange函數

其中a=[a1,a2,…,aN],ai為Lagrange乘子。最優的a和b取值可以通過庫恩-塔克KKT(karushkuhn-tucker)最優條件得到,即取最優函數對w,b,θ,a偏導數為零,可得:

消去w和θ得到如下的線性方程組:

其中X=[Φ(x1),Φ(x2),…,Φ(xN)],G=[1,1,…,1],E為單位矩陣。
根據Mercer條件,定義核函數

利用上式可以將高維空間中的點積運算轉化為求解低維空間中的核函數的值,這將大大減少計算量。在實際應用中,常采用徑向基核函數:

這樣,經過上述演化過程后,原最優線性回歸問題可以通過最小二乘法求解,所求得的最優線性回歸函數為


其中M為序列點的個數。
對隨機分量的時間序列{x1,x2,…,xM}而言,計算任意t時刻序列值xt最鄰近點xnbt={xnb1,xnb2,…,xnb(M-1)},然后將這些最鄰近點作為樣本的輸入,樣本的輸出則由這些最鄰近點的下一時刻的序列值所組成。
2)參數的選取
由于參數C和δ2的取值直接決定最小二乘支持向量機的訓練和泛化性能,因此,本文采用交叉驗證算法[13]來尋求C和δ2的最優值。
3)選擇訓練樣本的輸入與輸出
最鄰近點法原理[14]表明相互之間最接近的對象具有相似的預測值,因此,本文使用最鄰近點法選擇訓練樣本的輸入與輸出。通過計算兩點之間的歐幾里德距離,選擇距離最近的點作為最鄰近點
為了驗證本文所提出的電價預測方法的有效性,在真實電價數據上進行了測試。并且,與采用傳統三層BP人工神經網絡的預測方法進行了比較。
1)測試數據
選取美國PJM電力市場western hub地區2007-04-23至2007-05-20的日前電價[15]作為訓練和預測數據,其中2007-04-23至2007-05-13共計504個數據作為訓練數據(圖2),預測數據為2007-05-14至2007-05-20一周的日前電價。
2)比較對象
構建了24個傳統的三層BP人工神經網絡來預測每天24 h的電價。各神經網絡的輸入層、隱含層和輸出層的神經元數目均分別為7、18和1。輸出為預測日某時刻的日前電價,輸入為該時刻前三小時的日前電價、以及預測日前三天和前一周同時刻的日前電價。各預測時刻的訓練數據采用滾動方法進行訓練與預測。

圖2 電價時間序列Fig.2 Time series of electricity prices
3)性能評估指標
選取絕對百分比誤差APE(absolute percentage error)和平均絕對百分比誤差MAPE(mean absolute percentage error)作為電價預測方法的性能評估指標。
令Pactual為電價的真實值,Pf為電價的預測值,則

4)預測結果
首先,將原始電價時間序列分解成工作日電價和周末電價兩個時間序列,然后,采用簡單移動平均法(n=24)分別從這兩個時間序列中分離趨勢分量。圖3給出了工作日電價時間序列和其趨勢分量。
其次,對分離出趨勢分量后的電價時間序列進行離散傅里葉變換,得到對應的幅頻圖。圖4給出工作日電價時間序列在分離出趨勢分量后經過DFT得到的幅頻圖。圖中,橫坐標為頻率點,縱坐標為幅值。
圖5給出工作日電價時間序列中的周期分量。從電價時間序列中進一步分離出周期分量后,剩余的電價時間序列就為隨機分量。圖6給出工作日電價時間序列中的隨機分量。
最后,采用本文提出的預測方法分別對工作日電價和周末電價兩個時間序列中的三個分量進行預測。在采用LS-SVM對工作日電價中的隨機分量進行預測時,C和δ2經過交叉驗證法取值分別為64.30和12.87;而在預測周末電價中的隨機分量時,其取值分別為5.95和1.67。

圖3 工作日電價時間序列與趨勢分量Fig.3 Weekday time series of electricity prices and trend component

圖4 幅度-頻率點圖Fig.4 Amplitude-frequency diagram

圖5 周期分量Fig.5 Periodic component

圖6 隨機分量Fig.6 Random component
圖7給出分別采用本文提出的預測方法和采用傳統三層BP人工神經網絡預測方法來預測2007-05-14至2007-05-20一周的日前電價的預測結果。表1給出周五(2007-05-18)一天24 h的電價預測值和其真實值,以及兩種預測方法的絕對百分比誤差。表2比較了兩種預測方法每天的平均絕對百分比誤差。

圖7 兩種方法的電價預測結果和真實值Fig.7 Forecasted electricity prices by two methods and their actual prices
從圖7、表1和表2的結果可知,相對于傳統的三層BP人工神經網絡預測方法而言,本文提出的電價預測方法在預測精度上有了較大改善,其平均絕對百分比誤差在7%以內,而BP神經網絡預測方法的平均絕對百分比誤差在10%左右。同時,本文所提出的電價預測方法還減小了最大絕對百分比誤差,增加了最大絕對百分比誤差在10%以內的預測點的個數。因此,該方法是有效可行的。

表1 兩種預測方法的預測誤差比較Tab.1 Comparison of forecasting errors on Friday(2007-5-18)by two methods

表2 兩種預測方法的平均絕對百分比誤差比較Tab.2 Comparison of the mean absolute percentage errors by two methods %
本文在電價時間序列的分解和分離基礎上,對從電價中分離出來的趨勢分量、周期分量和隨機分量采用不同的預測方法,來實現對原電價時間序列的預測。在隨機分量的預測中,采用了泛化能力較強的最小二乘支持向量機方法。在真實電價數據上進行的仿真測試結果表明,本文提出的基于時間序列分解的電價分析和預測方法是有效的,能夠顯著提高電價預測的精度。
[1] Lo K L,Wu Y K.Analysis of relationships between hourly electricity price and load in deregulated realtime power markets[J].IEE Proceedings-Generation,Transmission and Distribution,2004,151(4):441-452.
[2] 周明,嚴正,倪以信,等(Zhou Ming,Yan Zheng,Ni Yixin,et al).含誤差預測校正的ARIMA電價預測新方法(A novel ARIMA approach on electricity price forecasting with the improvement of predicted error)[J].中國電機工程學報(Proceedings of the CSEE),2004,24(12):63-68.
[3] Contreras J,Espinola R,Nogales F J,et al.ARIMA models to predict next-day electricity prices[J].IEEE Trans on Power Systems,2003,18(3):1014-1020.
[4] Amjady N.Day-ahead price forecasting of electricity markets by a new fuzzy neural network[J].IEEE Trans on Power Systems,2006,21(2):887-896.
[5] Li Zhang,Luh P B.Neural network-based market clearing price prediction and confidence interval estimation with an improved extended Kalman filter method[J].IEEE Trans on Power Systems,2005,20(1):59-66.
[6] Fan S,Mao C,Chen L.Next-day electricity-price forecasting using a hybrid network[J].IET Generation,Transmission &Distribution,2007,1(1):176-182.
[7] 張顯,王錫凡(Zhang Xian,Wang Xifan).短期電價預測綜述(Review of the short-term electricity price forecasting)[J].電力系統自動化(Automation of E-lectric Power Systems),2006,30(3):92-101.
[8] Peter J B,Richard A D.Introduction to Time Series and Forecasting[M].New York:Springer-Verlag,2002.
[9] 鄭君里,應啟行,楊為理.信號與系統[M].北京:高等教育出版社,2000.
[10]康重慶,夏清,劉梅.電力系統負荷預測[M].北京:中國電力出版社,2007.
[11]Vapnik V N.An overview of statistical learning theory[J].IEEE Trans on Neural networks,1999,10(5):988-999.
[12]肖先勇,葛嘉,何德勝(Xiao Xianyong,Ge Jia,He Desheng).基于支持向量機的中長期電力負荷組合預測(Combination method of mid-long term load forecasting based on support vector machine)[J].電力系統及其自動化學報(Proceeding of the CSU-EPSA),2008,20(1):84-88.
[13]閻威武(Yan Weiwu).支持向量機理論、方法和應用研究(Study of Support Vector Machines Theory,Algorithm and Application)[D].上海:上海交通大學電子信息與電氣工程學院(Shanghai:School of electronic,information and electrical engineering,Shanghai Jiao Tong University),2003.
[14]梁循.數據挖掘算法與應用[M].北京:北京大學出版社,2006.
[15]PJM Market.Day-Ahead LMP Data[EB/OL].http://www.pjm.com/markets-and-operations/energy/day-ahead/lmpda.aspx,2009-05-08.