段寶娜
(鄭州財稅金融職業學院 基礎部,河南 鄭州 450048)
基于RBF-ARIMA模型對煤炭消費量的預測研究
段寶娜
(鄭州財稅金融職業學院 基礎部,河南 鄭州 450048)
摘要:為了對河南省煤炭消費量進行較為準確的預測,先利用ARIMA模型對河南省煤炭消費量進行初步預測,捕捉線性趨勢,然后利用RBF神經網絡算法對河南省煤炭消費量預測誤差進行修正. 仿真結果表明:組合模型更全面地刻畫了煤炭消費量的變化規律,提高了預測精度.
關鍵詞:ARIMA模型;時間序列;煤炭消費量;RBF神經網絡
煤炭作為河南省最重要的能源資源,其消費量占全省能源消費總量的80%以上.所以,預測與分析河南省煤炭的消費量顯得尤為重要,可為合理安排煤炭生產、科學制定能源規劃等提供依據.
本文采用自回歸求和滑動平均(ARIMA)與RBF神經網絡的組合模型研究和預測河南省煤炭消費問題,充分發揮這兩種模型的優勢以提高預測的精度.
1模型原理
1.1ARIMA模型簡介
ARIMA(p,d,q)模型又稱求和自回歸移動平均模型. 其實質是差分運算與ARMA模型的組合. 也即任何非平穩序列只要通過適當階數的差分運算實現差分后平穩,就可以對差分后序列進行ARMA模型的擬合.
1.1.1ARIMA模型結構
ARIMA(p,d,q)模型為:

式中,B為后移算子,d是差分階數,φp為自回歸算子(p為自回歸的階數),θq為移動平均算子(q是移動平均的階數),αt為零均值白噪聲序列.
1.1.2ARIMA模型建模關鍵步驟
首先對樣本數據進行平穩性檢驗,若序列不滿足平穩,可通過差分變換或對數差分變換使其平穩;然后借助AIC原則進行模型的識別,即確定模型的類型及階數;最后進行參數的估計和模型的適用性檢驗與修正.
1.2RBF神經網絡
徑向基函數(RBF)神經網絡是一種新穎有效的前饋式神經網絡,包含輸入層、隱層、輸出層共3層,它具有最佳逼近和全局最優的性能,同時訓練方法快速易行,優于BP神經網絡,所以本文選用RBF神經網絡作為預測模型,徑向基函數選用高斯函數.
1.3組合預測模型

2組合預測實證分析
2.1數據來源
數據來源于《2014年河南省統計年鑒》[1],選取1978~2013年河南省煤炭消費量作為訓練集,對其進行建模. 每年煤炭消費量用yt表示,如圖1所示,采用SAS軟件處理.

圖1 1978-2013年的煤炭消費量變化圖
2.2歷年煤炭消費量的線性變化規律預測
2.2.1數據平穩化處理
從圖1觀察到歷年消費量呈指數增長的趨勢,是非平穩序列. 一般而言,對原序列數據取對數,將指數趨勢轉化為線性趨勢,再對對數數據進行差分處理,消除線性趨勢. 經多次嘗試,差分階數d=3時序列才能達到平穩,記序列為Δ3lnyt. 檢驗結果見圖2(SAS軟件處理),序列Δ3lnyt的Tau統計量的p值小于0.01,即在99%的顯著水平下不存在單位根,為平穩序列,可以進行ARIMA模型的識別.
對平穩序列還需要進行純隨機性檢驗,又稱白噪聲檢驗. 顯示如圖3(SAS軟件處理).用QLB統計量作的χ2檢驗結果表明:{Δ3lnyt}的QLB統計量的p值為0.0208,因此拒絕序列是白噪聲的假設,可以繼續建模.

圖2 {Δ3lnyt}的單位根檢驗

圖3 {Δ3lnyt}的隨機性檢驗
2.2.2ARIMA模型的識別
避免主觀經驗不足導致的模型識別問題,在此直接調用PROC ARIMA過程的IDENTIFY語句對對數差分序列定階,選用SAS系統的MINIC命令,用最佳準則函數AIC進行最終模型的選定.
經過對p,q多次取不同的值擬合,比較其AIC后發現ARMA(3,0)模型的AIC最小,所以用該模型擬合序列,參數估計如圖4(SAS軟件處理)所示,顯然參數檢驗顯著. 由圖5(SAS軟件處理)得知:殘差序列為白噪聲序列,可用此模型預測.

圖4 參數估計

圖5 殘差序列的白噪聲檢驗
2.2.3模型的擬合與預測
在SAS軟件中使用forecast語句對河南省煤炭未來三年的消費量進行預測,圖6是對預測結果繪制的時序圖,圖中帶*號的是原時間序列數據,帶Δ號的光滑曲線是預測結果,最上面和最下面的折線是95%的置信上限和下限.

圖6 擬合與預測圖
2.3煤炭消費量的非線性變化規律預測
根據ARIMA(3,3,0)預測結果與實際結果計算出殘差序列,然后利用RBF神經網絡對河南省煤炭消費量的預測殘差進行了修正,從而得到最終預測結果. RBF算法對殘差的預測只需在SPSS中進行相關操作即可.
本文用此組合模型預測了河南省2014~2016年煤炭消費量,其結果如下表1:

表1 河南省2014~2016年煤炭消費量預測值(單位:萬噸標準煤)
2.4模型預測性能對比分析
本文選用均方誤差

和平均相對誤差

作為模型性能的評價指標.
單一ARIMA模型、ARIMA-RBF模型對煤炭消費量的預測結果MSE和MAPE如表2所示.

表2 不同模型的預測性能對比
從表2的對比結果可知,ARIMA-RBF煤炭消費量預測精度要高于單一的ARIMA模型預測的精度,預測誤差降低.
3結論
仿真數據的對比結果顯示ARIMA-RBF綜合利用了ARIMA和RBF神經網絡的優勢,既描述了歷史數據中的線性規律,又描述了數據中的非線性趨勢,能較好地刻畫了煤炭消費量的變化規律. 根據預測結果可知2015年河南省的能源消費總量將達到22 187.3萬噸標準煤.在環境保護和節能減排等因素的制約下,河南省也將面臨較大的能源壓力.因此政府一方面應采取措施提高傳統能源的利用效率,另一方面應鼓勵企業生產開發新能源,以達到經濟的可持續發展.
參考文獻:
[1]河南省統計局.河南省統計年鑒2014[M].北京:中國統計出版社,2014.
[2]高惠璇,耿直,李貴斌,等.SAS系統.SAS/ETS軟件使用手冊[M].北京:中國統計出版社,1998:66.
[3]楊偉傳.中國能源消費的ARIMA模型預測分析[J].統計與決策,2009(11):71—72.
On Predicting of Coal Consumption Based on RBF-ARIMA Model
DUAN Bao-na
(TheBaseDepartmentofZhengzhouVocationalCollegeFinanceandTaxation,Zhengzhou450048,China)
Abstract:In this paper, a combined model of the ARIMA model and RBF neural network algorithm is used in order to make more accurate prediction in coal consumption of Henan Province. First, the ARIMA model is used in prediction and a linear trend graph is obtained, then modifications are made by using RBF neural network algorithm. The simulation results show that this combined model can describe coal consumption more comprehensively and accurately.
Key words:ARIMA model; time serial; coal consumption; RBF neural network
責任編輯:周倫
中圖分類號:O212
文獻標識碼:A
文章編號:1671-9824(2015)02-0023-04
作者簡介:段寶娜 (1987—) ,女,河南新鄉人,助教,碩士,研究方向:統計推斷.
收稿日期:2015-01-02