李巖巖(重慶工商大學(xué)數(shù)學(xué)與統(tǒng)計(jì)學(xué)院,重慶400067)
ARIMA模型在重慶市能源消耗量預(yù)測(cè)中的應(yīng)用*
李巖巖
(重慶工商大學(xué)數(shù)學(xué)與統(tǒng)計(jì)學(xué)院,重慶400067)
摘要:能源是人類賴以生存和發(fā)展的重要物質(zhì)基礎(chǔ),對(duì)經(jīng)濟(jì)的快速發(fā)展和人們生活水平的大幅度提高起著無可取代的作用,隨著經(jīng)濟(jì)的發(fā)展人們對(duì)能源的需求日益增多,由于地球上的資源是有限的,對(duì)未來能源消耗量的準(zhǔn)確預(yù)測(cè)顯得尤為重要;運(yùn)用ARIMA模型對(duì)《2013重慶市統(tǒng)計(jì)年鑒》中重慶市1981-2012年能源消耗量數(shù)據(jù)進(jìn)行分析,結(jié)果顯示:ARIMA(2,3,2)模型預(yù)測(cè)未來的結(jié)果較為準(zhǔn)確,為重慶市資源消耗量提供了可靠的依據(jù)。
關(guān)鍵詞:ARIMA模型;時(shí)間序列;能源消耗;預(yù)測(cè)
重慶市是中國(guó)面積最大的城市,轄區(qū)總面積為8.24萬km2,為北京、天津、上海三市面積的2.39倍。改革開放以來,經(jīng)濟(jì)取得了突飛猛進(jìn)的增長(zhǎng)。2013年,工業(yè)增加值5 249.65億元,比2012年增長(zhǎng)13.1%,占重慶市地區(qū)生產(chǎn)總值的41.5%。伴隨著工業(yè)化的快速發(fā)展,能源處于高耗階段,能源資源短缺已成為重慶市經(jīng)濟(jì)發(fā)展的一大瓶頸。國(guó)內(nèi)外不同的機(jī)構(gòu)和許多學(xué)者針對(duì)能源消耗問題也運(yùn)用不同的方法做了大量的研究,國(guó)家統(tǒng)計(jì)局和能源辦常會(huì)采用定性預(yù)測(cè)方法對(duì)能源問題做一些研究然后制定合理的政策;當(dāng)然對(duì)此問題的研究比較深入的還是廣大學(xué)者們,他們常用的預(yù)測(cè)的方法有:回歸預(yù)測(cè)方法、自適應(yīng)預(yù)測(cè)、投入產(chǎn)出法、灰色關(guān)聯(lián)法、生長(zhǎng)理論、指數(shù)平滑法及神經(jīng)網(wǎng)絡(luò)預(yù)測(cè)法等,這些方法都能從一定的方面反映問題,但是由于沒有考慮數(shù)據(jù)的平穩(wěn)性及數(shù)據(jù)間的關(guān)聯(lián)性,預(yù)測(cè)結(jié)果往往準(zhǔn)確度不高,ARIMA模型克服這方面的局限性,它可以很好的擬合非平穩(wěn)時(shí)間序列,能大大提高預(yù)測(cè)的精度。
國(guó)內(nèi)學(xué)者運(yùn)用ARIMA模型做了很多研究,其中有劉勇[1]針對(duì)我國(guó)的能源消費(fèi)預(yù)測(cè)和池啟水[2]針對(duì)我國(guó)煤炭消費(fèi)的預(yù)測(cè);還有一些地方性的預(yù)測(cè),蔣燕[2]對(duì)廣西全社會(huì)固定資產(chǎn)投資的預(yù)測(cè)及龔國(guó)勇[4]對(duì)深圳GDP的預(yù)測(cè),李偉[4]對(duì)重慶市GDP的預(yù)測(cè)也用到了ARIMA模型,但是針對(duì)重慶市能源消耗問題還沒有學(xué)者專門運(yùn)用ARIMA方法進(jìn)行過預(yù)測(cè),現(xiàn)今要求整個(gè)社會(huì)都要以降低能源消耗為目標(biāo),為了盡快全面的掌握重慶市資源消耗狀況,為重慶市節(jié)能降耗提供科學(xué)、有效的統(tǒng)計(jì)數(shù)據(jù)支撐,現(xiàn)通過收集、分析時(shí)間序列數(shù)據(jù),運(yùn)用ARIMA數(shù)學(xué)模型,科學(xué)分析重慶市能源消費(fèi)量,估計(jì)模型以預(yù)測(cè)未來能源消耗量,為相關(guān)部門制訂節(jié)能降耗措施和對(duì)策提供科學(xué)合理的依據(jù)。
1.1ARIMA模型理論
ARIMA模型全稱為差分自回歸移動(dòng)平均模型(Auto Regression Integrated Moving Average Model,簡(jiǎn)記ARIMA),是一類常用的時(shí)間序列預(yù)測(cè)模型,是由博克思(Box)和詹金斯(Jenkins)于20世紀(jì)70年代初提出一著名時(shí)間序列預(yù)測(cè)方法,所以又稱為Box-Jenkins模型、博克思-詹金斯法。其中ARIMA(p,d,q)稱為差分自回歸移動(dòng)平均模型,AR是自回歸,p為自回歸項(xiàng); MA為移動(dòng)平均,q為移動(dòng)平均項(xiàng)數(shù),d為時(shí)間序列成為平穩(wěn)時(shí)所做的差分次數(shù)。ARIMA模型通常借助時(shí)間序列的隨機(jī)特性來描述事物的發(fā)展變化規(guī)律,指將非平穩(wěn)時(shí)間序列轉(zhuǎn)化為平穩(wěn)時(shí)間序列,然后運(yùn)用時(shí)間序列的過去值、當(dāng)期值以及滯后隨機(jī)擾動(dòng)項(xiàng)的加權(quán)來建立模型,從而解釋并預(yù)測(cè)時(shí)間序列的變化發(fā)展規(guī)律。ARIMA模型根據(jù)原序列是否平穩(wěn)以及回歸中所含部分的不同,包括自回歸移動(dòng)平均過程(ARMA(p,q):Auto Regression Moving Average)及差分自回歸移動(dòng)平均(ARIMA(p,d,q):Auto Regression Integrated Moving Average)過程。
1.2ARIMA模型結(jié)構(gòu)
ARIMA模型實(shí)際就是非平穩(wěn)時(shí)間序列經(jīng)過差分處理后的ARMA模型,ARMA模型是目前最常用的擬合平穩(wěn)序列的模型。ARMA模型又可以細(xì)分為AR模型、MA模型和ARMA模型三大類。
1.2.1ARMA模型
具有如下的模型稱為p階自回歸(auto regression)模型,簡(jiǎn)記為AR(p):

其中,模型的最高階數(shù)為p,隨機(jī)干擾項(xiàng){εt}為零均值白噪聲序列即εt~WN(0,σ2ε)。
具有如下結(jié)構(gòu)的模型稱為q階移動(dòng)平均(moving average)模型,簡(jiǎn)記為MA(q):

其中,模型的最高階數(shù)為q,隨機(jī)干擾項(xiàng){εt}為零均值白噪聲序列即εt~WN(0,σ2ε)。
把具有如下結(jié)構(gòu)的模型稱為自回歸移動(dòng)平均(auto regression moving average)模型,簡(jiǎn)記為ARMA(p,q):

限制條件與AR(p)、MA(q)相同,ARMA(p,q)模型實(shí)際上就是AR(p)與MA(q)的結(jié)合。
1.2.2ARIMA模型具體結(jié)構(gòu)
具有如下結(jié)構(gòu)的模型稱為求和自回歸移動(dòng)平均(auto regression integrated moving average)模型,簡(jiǎn)記為ARIMA(p,d,q)模型[6]:

式(4)中:▽d=(1-B)d,d為差分次數(shù);Φ(B) = 1-φ1B-…-φpBp,為平穩(wěn)可逆ARMA(p,q)模型的自回歸系數(shù)多項(xiàng)式;Θ(B) = 1-θ1B-…-θqBq,為平穩(wěn)可逆ARMA(p,q)模型的移動(dòng)平滑系數(shù)多項(xiàng)式式(4)可以簡(jiǎn)記為

式(5)中{εt}為零均值白噪聲序列。
1.3ARIMA模型擬合基本步驟
(1)檢驗(yàn)時(shí)間序列的平穩(wěn)性,一般采用觀察時(shí)序圖和單位根檢驗(yàn)的方法。能夠用ARMA模型擬合的序列都是平穩(wěn)時(shí)間序列,對(duì)于非平穩(wěn)時(shí)間序列,需要先對(duì)原始序列進(jìn)行若干次差分運(yùn)算使其轉(zhuǎn)化為平穩(wěn)時(shí)間序列,這個(gè)差分轉(zhuǎn)換次數(shù)就是d,然后再用ARMA模型擬合。
(2)根據(jù)時(shí)間序列模型的識(shí)別理論選取相應(yīng)的模型。這需要借助與序列的相關(guān)圖,AR過程的AC(自相關(guān)函數(shù))和PAC(偏自相關(guān)函數(shù)),與MA過程的AC和PAC相比較,有相反的變化理論模式。對(duì)于AR模型,其AC從圖形上表現(xiàn)為“拖尾性”,而PAC表現(xiàn)為“截尾性”。MA模型,其AC表現(xiàn)為“截尾性”,PAC表現(xiàn)為“拖尾性”。若序列的AC和PAC均表現(xiàn)為“拖尾性”,則適合于ARMA模型。此時(shí)可以初步確定p、q的值。
(3)模型參數(shù)估計(jì)。根據(jù)前面確定的d及初步確定的p和q,運(yùn)用AIC和SC最小法則以及擬合優(yōu)度最大等綜合指標(biāo),選取最優(yōu)的p和q,確定最終模型的參數(shù)。
(4)對(duì)擬合后的模型進(jìn)行白噪聲檢驗(yàn)。檢驗(yàn)殘差是否為純隨機(jī)序列,如果為白噪聲序列證明模型還不是最優(yōu)的需要進(jìn)一步改進(jìn)。
(5)利用已經(jīng)通過檢驗(yàn)的模型進(jìn)行預(yù)測(cè)分析。
2.1數(shù)據(jù)描述
從《2013年重慶市統(tǒng)計(jì)年鑒》獲得1981-2012年重慶市能源消耗量的數(shù)據(jù)。參照《EViews統(tǒng)計(jì)分析與應(yīng)用》[7]完成下面的操作,首先由原始數(shù)據(jù)可以繪制出1981-2012年重慶市能源消耗量的折線圖,圖1所示。其中X表示能源消耗量,單位是萬噸標(biāo)準(zhǔn)煤。由圖1可知,重慶市能源消耗量呈現(xiàn)指數(shù)上升的趨勢(shì),增長(zhǎng)勢(shì)頭顯著,可知時(shí)間序列{Xt}為非平穩(wěn)時(shí)間序列。
2.2對(duì)數(shù)據(jù)進(jìn)行平穩(wěn)化處理
一般來說對(duì)于呈現(xiàn)指數(shù)趨勢(shì)的時(shí)間序列,需要通過取對(duì)數(shù)的形式將其轉(zhuǎn)化為線性趨勢(shì),然后再進(jìn)行差分處理。通常來講線性趨勢(shì)可以通過一階差分消除,二次曲線趨勢(shì)可以通過二階差分消除。針對(duì)本次時(shí)間序列數(shù)據(jù),經(jīng)過取對(duì)數(shù)Y=lnX以后,經(jīng)過三次差分運(yùn)算,序列達(dá)到平穩(wěn)。三次差分后的序列用Z表示,其折線圖用圖2表示。對(duì)Z進(jìn)行ADF單位根檢驗(yàn)結(jié)果如表1所示。

圖1 X拆線圖

圖2 三次差分折線圖

表1 ADF單位根檢驗(yàn)
在表1中,ADF檢驗(yàn)t統(tǒng)計(jì)量為-4.555 388,其相應(yīng)的概率值為0.001 5,在1%、5%、10%的檢驗(yàn)水平下t統(tǒng)計(jì)量的臨界值分別為-3.737 853、-2.991 878、-2.635 542。序列Y三階差分的ADF檢驗(yàn)的t統(tǒng)計(jì)量都比1%、5%、10%檢驗(yàn)水平下的臨界值小,因此可以拒絕原假設(shè),即可認(rèn)為序列Y的三階差分(即Z)沒有單位根,也即序列X取對(duì)數(shù)后的三階差分平穩(wěn)I(3)的。
2.3ARMA模型識(shí)別和階數(shù)確定
由于檢驗(yàn)出序列{ Zt}是平穩(wěn)的,因此可以建立相應(yīng)的模型,在建模之前需要識(shí)別模型的類別,即需要確定是AR(p)模型或MA(q)模型或ARMA(p,q)模型。模型的確定通常借助序列的相關(guān)圖,即序列的自相關(guān)函數(shù)(AC)和偏自相關(guān)函數(shù)(PAC)。

圖3 Z的AC與PAC圖
由圖3可以看出自相關(guān)和偏自相關(guān)圖均表現(xiàn)出“拖尾性”,因此序列{ Zt}適合用ARMA(p,q)模型,初步估計(jì)有4種模型形式:ARMA(1,1)、ARMA(1,2)、ARMA(2,1)及ARMA(2,2)。
識(shí)別ARMA模型的形式后,可以運(yùn)用最佳準(zhǔn)則定價(jià)函數(shù)法,即Akaike提出的AIC準(zhǔn)則,準(zhǔn)則是在模型參數(shù)極大似然估計(jì)的基礎(chǔ)上,對(duì)模型的階數(shù)和相應(yīng)的參數(shù)同時(shí)給出一組最佳估計(jì)。一般來講,在給出不同模型的AIC計(jì)算公式的基礎(chǔ)上,選取使AIC達(dá)到最小的那一組階數(shù)為理想階數(shù)。運(yùn)用Eviews軟件完成本過程,需要注意的是,對(duì)參數(shù)估計(jì)量的t檢驗(yàn)顯著性水平并不像簡(jiǎn)單回歸方程那么嚴(yán)格,更多的是考慮模型的整體擬合效果。AIC準(zhǔn)則及SC準(zhǔn)則和調(diào)整后的可決系數(shù)都是選擇模型的重要標(biāo)準(zhǔn)。
通過表2比較4個(gè)模型的AIC及其他各項(xiàng)指標(biāo),雖說ARMA(1,1)和ARMA(1,2)的各項(xiàng)指標(biāo)都比ARMA(2,1)和ARMA(2,2)的擬合效果好,但是ARMA(1,1)和ARMA(1,2)的MA(q)擬合過程不可逆,所以只需比較ARMA(2,1)和ARMA(2,2),最終可以確定p=2,q=2為最佳模型的階數(shù),建立ARIMA(2,3,2)模型:
Zt=-0.000 208-1.080 346Zt-1-0.126 364Zt-2+εt+ 0.009 58εt-1+ 0.922 219εt-2
其中Z =Δ3Y,Y = lnX

表2 模型指標(biāo)結(jié)果比較

續(xù)表2
2.4模型檢驗(yàn)
模型檢驗(yàn)也即對(duì)模型的殘差序列進(jìn)行白噪聲檢驗(yàn),如果殘差序列不是純隨機(jī)序列則意味著殘差序列中還有信息未被提取,模型需要進(jìn)一步改進(jìn)。由圖4知?dú)埐钚蛄械臄M合效果還是比較好的,但這還需要通過相關(guān)圖進(jìn)一步檢驗(yàn)。對(duì)ARIMA(2,3,2)模型的殘差進(jìn)行白噪聲檢驗(yàn)(圖5),可以看出殘差序列的自相關(guān)函數(shù)都在95%的置信區(qū)間內(nèi),由此可以得出殘差序列相互獨(dú)立即為白噪聲的概率很大,故不能拒絕序列為白噪聲序列的原假設(shè),即可認(rèn)為模型ARIMA(2,3,2)估計(jì)結(jié)果的殘差序列不存在自相關(guān)。

圖5 ARIMA(2,3,2)模型的殘差相關(guān)圖及Q檢驗(yàn)
根據(jù)時(shí)間序列{ Zt}的ARIMA(2,3,2)模型:

可以推出時(shí)間序列{Yt}的ARIMA(2,3,2)模型的預(yù)測(cè)方程為

進(jìn)而推出時(shí)間序列{ Xt}的預(yù)測(cè)方程為

對(duì)重慶市2009-2012年的能源消耗量做預(yù)測(cè)(單位:萬噸標(biāo)準(zhǔn)煤),并與實(shí)際值做比較(表3)。

表3 預(yù)測(cè)結(jié)果
(1)從{ Xt}的預(yù)測(cè)方程可以看出,重慶市資源消耗量與序列本身滯后一期值和滯后三期值以及殘差項(xiàng)一期和二期有著密切的關(guān)系。由于參數(shù)估計(jì)的時(shí)候系數(shù)均為負(fù)值,這就意味著滯后一期值和滯后三期值以及殘差項(xiàng)一期和二期對(duì)當(dāng)期值成負(fù)相關(guān)關(guān)系。也就是說:t-1期資源消耗量增加則t期消耗量就會(huì)減少。因此,重慶市政府在安排每年資源消耗量時(shí)應(yīng)注意這一點(diǎn),不要寅吃卯糧,合理計(jì)劃每年的資源消耗量,使社會(huì)經(jīng)濟(jì)更加穩(wěn)定健康的發(fā)展。
(2)圖6中虛線是預(yù)測(cè)置信區(qū)間,可以看到隨著向后預(yù)測(cè)期的增加,預(yù)測(cè)置信區(qū)間也變大,從而表明預(yù)測(cè)期越往后,模型預(yù)測(cè)的精度越差。表3所列的是2009-2012年序列{ Xt}的預(yù)測(cè)值、實(shí)際值及預(yù)測(cè)相對(duì)誤差。從表3中可以看出,序列{ Xt}的預(yù)測(cè)值與實(shí)際值的相對(duì)誤差比較小,預(yù)測(cè)的平均相對(duì)百分誤差為4.921%,一般認(rèn)為平均相對(duì)百分誤差在10%以內(nèi)模型的預(yù)測(cè)效果比較好[8](易丹輝,2005),可以用來預(yù)測(cè)。但是也要看到,隨著預(yù)測(cè)期的增加,模型預(yù)測(cè)的相對(duì)誤差也變大。這是ARIMA模型的一個(gè)缺陷,盡管如此它在短期預(yù)測(cè)方面相比其他的預(yù)測(cè)方法,預(yù)測(cè)的準(zhǔn)確度還是比較高的,可以為重慶市能源消耗量短期預(yù)測(cè)提供借鑒。

圖6 2009-2012預(yù)測(cè)圖
參考文獻(xiàn):
[1]劉勇,汪旭暉.ARIMA模型在我國(guó)能源消費(fèi)預(yù)測(cè)中的應(yīng)用[J].經(jīng)濟(jì)經(jīng)緯,2007(5):11-13
[2]池啟水,劉曉雪.ARIMA模型在煤炭消費(fèi)預(yù)測(cè)中的應(yīng)用分析[J].能源研究與信息,2007,23(2):117-123
[3]蔣燕.ARIMA模型在廣西全社會(huì)固定資產(chǎn)投資預(yù)測(cè)中的應(yīng)用[J].數(shù)理統(tǒng)計(jì)與管理,2006,25(5):588-592
[4]龔國(guó)勇.ARIMA模型在深圳GDP預(yù)測(cè)中的應(yīng)用[J].數(shù)學(xué)的實(shí)踐與認(rèn)識(shí),2008,38(4):53-57
[5]李偉,羅澤舉.基于線性神經(jīng)網(wǎng)絡(luò)的重慶市GDP發(fā)展研究[J].重慶工商大學(xué)學(xué)報(bào):自然科學(xué)版,2014,31(2):37-42
[6]王燕.應(yīng)用時(shí)間序列分析[M].北京:中國(guó)人民大學(xué)出版社,2005
[7]樊歡歡,張凌云.EViews統(tǒng)計(jì)分析與應(yīng)用[M].北京:機(jī)械工業(yè)出版社,2009
[8]易丹輝.數(shù)據(jù)分析與Eviews的應(yīng)用[M].北京:中國(guó)統(tǒng)計(jì)出版社,2005
Application of ARIMA Model in the Prediction of Energy
Consumption of Chongqing
LI Yan-yan
(School of Mathematics and Statistics,Chongqing Technology and Business University,Chongqing 400067,China)
Abstract:Resource is important basic material for human survival and development.It plays an irreplaceable role in the rapid development of economy and greatly improving people's living standards.With the development of economy,people's demand for energy is increasing,because the resources are limited on earth,therefore,it is particularly important to accurately predict future energy consumption.This paper uses ARIMA model to analyze 1981-2012 annual energy consumption data of Chongqing based on Chongqing Statistical Yearbook 2013.The result shows that the predict of future energy consumption by ARIMA (2,3,2) model is more accurate,which provides reliable basis for resource consumption of Chongqing.
Keywords:ARIMA model; time series; energy consumption; prediction
中圖分類號(hào):O224
文獻(xiàn)標(biāo)志碼:A
文章編號(hào):1672-058X(2015) 08-0054-07
doi:10.16055/j.issn.1672-058X.2015.0008.012
收稿日期:2014-10-01;修回日期:2014-12-09.
*基金項(xiàng)目:重慶市教委科技項(xiàng)目(KJ1400613).
作者簡(jiǎn)介:李巖巖(1988-),女,河南開封人,碩士研究生,從事統(tǒng)計(jì)學(xué)經(jīng)濟(jì)社會(huì)統(tǒng)計(jì)研究.