蔡 寧,孟 濬,顏文俊
(浙江大學 電氣工程學院,杭州 310027)
基于模糊Box-Jenkins方法的電價建模與短期預測
蔡 寧,孟 濬,顏文俊
(浙江大學 電氣工程學院,杭州 310027)
由于單一的AR、MA和ARMA模型不能很好地匹配復雜的電價時間序列數據,因此傳統的Box-Jenkins方法不能很好地進行電價預測。文章提出了基于模糊Box-Jenkins的電價建模和短期預測方法。引入模糊策略,生成分別對應Box-Jenkins方法中的AR,MA,ARMA三個模型的模糊因子,再通過模糊因子對三個模型進行模糊綜合。對浙江省電力市場電價數據的仿真表明,在電價序列不能較好地匹配Box-Jenkins方法中各模型的情況下,模糊Box-Jenkins方法能取得更好的預測效果。
建模;短期預測;模糊;Box-Jenkins;電價
電價預測是指在考慮市場供求關系、市場參與者的市場力、電力成本、電力市場體制結構以及社會經濟形勢等重要因素影響的條件下,利用數學工具對歷史數據進行分析和研究,探索事物之間的內在聯系和發展變化規律,在滿足一定精度和速度的情況下,對未來電力市場中的電力交易價格進行預測。隨著全球電力市場化的不斷發展,電價在電力市場中的重要地位受到越來越多的重視。近年來學者們開始對電價進行比較深入的研究,提出了不少電價預測方法[1-4]。
Box-Jenkins方法[5]是由美國統計學家Box和英國統計學家Jenkins提出,并在社會、經濟預測等領域取得了廣泛的應用[6-10]。
在現實生活中,電價受諸多因素影響,例如政府政策和經濟水平等,所以從本質上來說,電價預測問題是一個經濟預測問題。傳統的Box-Jenkins方法,利用時間序列的自相關函數和偏相關函數的特征,采用AR、MA和ARMA三種模型對時間序列進行建模識別。但電價數據往往是高度復雜,并且具有非線性、強耦合性,因此無法將現實數據采用某種線性模型進行精確描述。針對這一問題,本文采用模糊Box-Jenkins的方法,對電價序列進行建模和短期預測。采用模糊策略,對AR、MA和ARMA模型進行模糊綜合。通過對浙江省電力市場電價數據進行仿真,結果表明,在電價序列不能較好地匹配Box-Jenkins方法中各模型的情況下,模糊Box-Jenkins方法能取得較好的效果。

表1 Box-Jenkins方法中模型選擇
Box-Jenkins法是通過分析現象隨時間推移而變化的特征,以現象的歷史統計資料為基礎去建立時間模型,并進行外推預測。它以自相關函數、偏自相關函數的統計特性為依據,確定模型的類型(AR、MA和ARMA),進而對模型進行定階、參數估計、適應性檢驗并建立適應序列模型。
Box-Jenkins建模方法的步驟:
(1)數據處理:檢驗時間序列是否為平穩時間序列。若時間序列為非平穩時間序列。通過對序列進行差分和零均值的方法使序列平穩化。若{Yt}為非平穩時間序列,則進行差分處理:

其中n為樣本數,s為周期。
進而進行零均值處理:

形成新序列Wt:

檢驗Wt是否為平穩序列。若不是,則繼續進行差分和零均值處理,直至得到新的平穩時間序列。一般來說,差分迭代不會多于3次。
(2)模型選擇:計算平穩時間序列的偏相關函數和自相關函數。例如偏相關函數是截尾的,而自相關函數是拖尾的,則該序列適合AR模型,模型選擇方法如表1所示。




(3)參數估計:模型定階主要依據F-判據準則對殘差平方和進行比較,可以由低階到高階擬合模型,直到模型殘差平方和的變化不顯著為止。模型參數估計的方法有很多,其中有效的方法為最小二乘估計和極大似然估計。
(4)模型的檢驗:通過對殘差序列的隨機性進行檢驗,如果殘差序列具有隨機性,則說明試用模型是合適的,否則需要進一步改進。
(5)模型的預測:運用獲得的模型進行相應預測,若時間序列的特性發生變化,需要對模型進行修改,甚至需要重新建模。
從上述步驟可以看出,Box-Jenkins法通過對時間序列進行平穩化處理來降低時間序列的復雜度。但對于復雜時間序列來說,平穩化處理之后,時間序列的復雜度依然較高,無法采用Box-Jenkins法獲得較為精確的預測結果。因此,本文利用模糊Box-Jenkins法去解決上述相關問題。
為了克服Box-Jenkins預測方法存在的不足,使模型更加符合實際情況,本文在Box-Jenkins預測模型的基礎上,加入模糊策略參數調整,通過自相關函數和偏相關函數的相關變化,對模型進行模糊整合。模糊Box-Jenkins預測系統結構見圖1。模糊調節器的輸入為平穩時間序列的自相關函數和偏相關函數,輸出是對應AR模型、MA模型和ARMA模型的柔化系數。
首先,檢驗時間序列是否為平穩時間序列,一般需要消除時間序列的趨勢因素和周期因素。根據公式1,先取s=1,進行一次差分和零均值處理,消除時間序列的趨勢因素;再取s=T(T為時間序列的周期),消除時間序列的周期因素。通過對自相關函數和偏相關函數的“截尾”和“拖尾”顯著性檢驗,來對模型的類別進行判斷。采用F-判據準則和最小二乘估計方法對模型進行定階和參數估計。
同時將自相關函數和偏相關函數作為模型的模糊輸入,通過模糊規則的運算,得到AR模型、MA模型和ARMA模型的柔化系數,然后對三個模型進行模糊整合。
最后對模型進行殘差序列檢驗,若檢驗成功,則可通過該模型進行預測,否則要繼續對模型進行進一步改進。
由于平穩時間序列相應的自相關函數和偏相關函數決定了系統的模型類別和模型階數,因此自相關函數和偏相關函數分布反映了各個模型在實際模型中所占的比重。將自相關函數ρk和偏相關函數φkk進行模糊化處理,轉換到模糊論域[-6,6],同時定義 7 個模糊語言變量:“正大”(PB),“正中”(PM),“正小”(PS),“零”(0),“負小”(NS),“負中”(NM),“負大”(NB)。輸入隸屬度函數如圖2所示。
將輸出量wAR,wMA,wARMA進行模糊劃分,模糊論域為[-6,6],同時定義 7 個模糊語言變量:“正大”(PB),“正中”(PM),“正小”(PS),“零”(0),“負小”(NS),“負中”(NM),“負大”(NB)。輸出的隸屬度函數如圖3所示。
相應模糊規則為:

其中Ri是第i條模糊規則,φkk是序列的偏相關函數,ρk是序列的自相關函數wAR,wMA和wARMA分別是AR模型,MA模型,ARMA模型的柔化系數。
為了驗證算法的有效性,本文采用浙江電力市場2001年2月的電價數據進行仿真驗證。電價數據采樣間隔為半小時,電價的分布情況如圖4所示。
首先采用2001年2月16日到2001年2月18日的電價序列進行仿真,研究電價序列的自相關函數和偏相關函數,發現其收斂速度較慢,因此可以判斷該序列不是平穩時間序列,需要對該序列進行差分和平穩化處理。首先為了消除周期項對時間序列的影響,以周期長度作差分和零均值化處理;其次為了消除趨勢項對時間序列的影響,對前后項進行差分和零均值化處理。原始序列的自相關函數如圖5(a)所示,原始序列的偏相關函數如圖5(b)所示,平穩化后的自相關函數如圖5(c)所示,平穩化后的偏相關函數如圖5(d)所示。從圖中可以判定時間序列已經平穩。
分別運用傳統Box-Jenkins方法和模糊Box-Jenkins方法對2001年2月16日到2001年2月18日的數據進行建模,然后對2001年2月19日的電價進行預測。預測結果如圖6所示。

圖5 平穩化前后的自相關函數和偏相關函數

圖6 Box-Jenkins建模預測和模糊Box-Jenkins建模預測的對比

圖7 Box-Jenkins建模預測和模糊Box-Jenkins建模預測的對比
運用同樣的方法,取2001年2月23日到2001年2月25日的電價數據,分別進行Box-Jenkins預測建模和模糊Box-Jenkins預測建模,然后對2001年2月26日的電價進行預測,結果如圖7所示。
仿真結果表明,模糊Box-Jenkins預測建模方法的結果要優于傳統Box-Jenkins預測建模方法。由圖6可以看出,當現實電價序列能夠較好地匹配傳統Box-Jenkins方法中的模型時,傳統Box-Jenkins方法和模糊Box-Jenkins方法都能較好地對電價進行預測,通過誤差計算,傳統Box-Jenkins方法的誤差約為3.5%,模糊Box-Jenkins方法的誤差約為2.6%;由圖7可以看出,當現實電價序列較為復雜,Box-Jenkins方法中的模型不能完全對其進行描述時,通過誤差計算,傳統Box-Jenkins方法的誤差約為14%,模糊Box-Jenkins方法的誤差約為4.3%。
本文對傳統Box-Jenkins方法進行了深入研究,針對其預測復雜電價序列能力不足的問題,進行了相應的改進,提出了模糊Box-Jenkins方法。新方法克服了傳統Box-Jenkins方法對復雜非線性序列的模型選用問題,通過加入模糊策略層,對傳統模型進行模糊綜合。仿真結果表明,模糊Box-Jenkins方法的預測精度較傳統的Box-Jenkins方法高。模糊Box-Jenkins方法目前還是對Box-Jenkins方法進行算法結構上的改進,沒有考慮到現實中的各種因素對模型的影響,以后的研究中可考慮在模型中引入外界因素擾動,對模型進行修改,進一步提高模型的預測精度。
[1]X.Lu,Z.Dong,X.Li.Electricity Market Price Spike Forecast with Data Mining Techniques[J].Electric Power Systems Research,2005,(1).
[2]R.Pino,J.Parreno,A.Gomez,P.Priore.Forecasting Next-day Price of Electricity in the Spanish Energy Market Using Artificial Neural Networks[J].Engineering Applications of Artificial Intelligence,2008,1(21).
[3]姜巍,王富忠,沈祖志.基于多智能體的短期電價智能預測方法[J].電力系統及其自動化,2007,31(4).
[4]張春輝,閔勇,丁仁杰等.級聯相關的神經網絡模型在邊際電價預測中的應用[J].電力系統及其自動化,2003,27(3).
[5]B.George,G.M.Jenkins.Time Series Analysis,Forecasting and Control,Revised Edition[M].Oakland,CA:Holden-Day,1997.
[6]J.Gillberg,L.Ljung.Frequency-domain Identification of Continuous-time ARMA Models from Sampled Data[J].Automatica,2009,6(45).
[7]R.Pintelon,J.Schoukens.Box–Jenkins Identification Revisited—Part I:Theory[J].Automatica,2006,1(42).
[8]R.Pintelon,Y.Rolain,J.Schoukens.Box-Jenkins Identification Revisited—Part II:Applications[J].Automatica,2006,1(42).
[9]B.H.Goh,H.P.Teo.Forecasting Construction Industry Demand,Price and Productivity in Singapore:the Box-Jenkins Approach[J].Construction Management and Economics,2000,5(18).
[10]Y.Lu,S.M.Abou Rizk.Automated Box–Jenkins Forecasting Modeling[J].Automation in Construction,2009,5(18).
(責任編輯/浩 天)
TP271
A
1002-6487(2011)03-0167-03
國家高技術研究發展計劃(863)(2007AA05Z232);浙江省科技計劃項目(2007C21180)
蔡 寧(1986-),男,浙江三門人,碩士研究生,研究方向:復雜系統的智能建模、控制。