曹昱東,王 浩
(北京師范大學珠海分校,廣東珠海,519085)
隨著經(jīng)濟的不斷發(fā)展,城市生活垃圾產(chǎn)生量也越來越多,這些生活垃圾嚴重阻礙了城市的發(fā)展,帶來了一系列經(jīng)濟、社會、環(huán)境問題。全國大部分城市都面臨著垃圾快速增長而處理垃圾的設(shè)施多年不變的局面。幾乎2/3的城市已經(jīng)被垃圾所包圍,而且這種情況日益嚴峻。城市生活垃圾問題也受到政府的強烈關(guān)注,準確的預(yù)測未來城市生活垃圾產(chǎn)生量是解決城市生活垃圾問題的第一步,也是關(guān)鍵一步。
ARIMA模型的全稱是求和自回歸移動平均模型,ARIMA(p,d,q)模型。使用 ARIMA 模型去做預(yù)測,通俗的講,就是將需要預(yù)測的對象隨時間變化的數(shù)據(jù)作為一個隨機序列,然后分析出這個序列的特點與性質(zhì),從而通過時間序列過去的數(shù)值來推測未來的走勢。ARIMA(p,d,q)模型具有以下三條性質(zhì):


在獲取一個觀察值序列之后,首先是判斷它的平穩(wěn)性,通過平穩(wěn)性檢驗,可以把序列分為平穩(wěn)序列和非平穩(wěn)序列兩種,要用ARIMA模型進行數(shù)據(jù)分析,所分析的序列必須是平穩(wěn)序列,而非平穩(wěn)的序列則不能直接通過ARIMA模型計算,需要將非平穩(wěn)序列轉(zhuǎn)化為平穩(wěn)序列。這里轉(zhuǎn)化的過程就是一種有效提取序列中蘊含的確定性信息的過程。對序列進行差分運算則是一種常用的轉(zhuǎn)化過程。差分運算的實質(zhì)是使用自回歸的方式提取確定性信息。由于差分運算的這種強大提取信息的能力,許多非平穩(wěn)序列差分之后會顯示出平穩(wěn)序列的性質(zhì),對差分后平穩(wěn)序列可以使用ARIMA模型進行擬合,從而去分析序列的特點。
而具體進行ARIMA模型分析的時候,通過計算ACF,PACF可以有效的確定出ARIMA(p,d,q)中各參數(shù)p,d,q的具體數(shù)值,從而最終擬合序列并進行預(yù)測。具體的ARIMA建模流程圖如圖1.
根據(jù)上海市綠化和市容管理局提供的數(shù)據(jù),做出1978年到2011年上海市生活垃圾產(chǎn)生量表1。

1978到2011年上海市生活垃圾產(chǎn)生量表(單位:萬噸)
在SAS軟件中,繪制出該序列的時序圖圖2

圖2:上海市生活垃圾產(chǎn)生量時序圖
由圖2可看出,隨著經(jīng)濟的發(fā)展與人口的增加,自1978年來,上海市垃圾產(chǎn)生量大體上呈遞增趨勢,除了2000年到2002年有一個短暫的回落。垃圾產(chǎn)生量從開始的100萬增長到700萬,增長的幅度比較塊,平均每年增長幅度超過20%。整個圖像具有顯著的趨勢,站在時間序列的角度來說,該序列是典型的非平穩(wěn)序列。
因為時序圖明顯非平穩(wěn),所以對數(shù)據(jù)進行一階差分處理,一階差分后自相關(guān)圖和白噪聲檢驗圖見圖3.

圖3:一階差分自相關(guān)、白噪聲檢驗圖
由圖3可以看出,原序列進過差分運算后,已經(jīng)向平穩(wěn)序列方向發(fā)展,但是p=0.0341 還是大于標準值0.005,所以我們對該序列繼續(xù)做差分運算。
進過二階差分,序列在均值附近比較穩(wěn)定的波動,白噪聲檢驗如圖3。

圖3:二階差分后的白噪聲檢驗圖
圖3 顯示,差分后序列在均值附近比較穩(wěn)定的波動,p值<0.005,可以認為序列平穩(wěn)。所以對二階差分后的數(shù)列進行分析。
由偏自相關(guān)系數(shù)圖4可得在延遲期數(shù)大于等于4后,偏自相關(guān)系數(shù)就基本保持在兩倍標準差之內(nèi)。對序列進行相對最優(yōu)定階,得到最小信息量結(jié)果為圖5.

圖4:二階差分后偏自相關(guān)圖

圖5:相對最優(yōu)定價圖
圖5 顯示,在自相關(guān)系數(shù)小于等于5,移動平均延遲系數(shù)小于等于5的所有ARMA(p,q)模型中,BIC信息量相對最小的是 ARMA(2,1)模型,也就是 ARIMA(2,2,1)模型。
對2階差分后的序列進行殘差自相關(guān)分析,殘差自相關(guān)檢驗結(jié)果如圖6:

圖6:殘差白噪聲檢驗圖
由于p顯然大于0.05,所以殘差序列為白噪聲序列,擬合模型顯著成立,模型檢驗通過。
所以擬合模型為: 1 + 0.72298B + 0.65197,具體預(yù)測數(shù)值表2

表2:上海市生活垃圾產(chǎn)生量7期預(yù)測(單位:萬噸)
最終得到上海市垃圾產(chǎn)生量走勢預(yù)測圖7:

圖7:上海市生活垃圾產(chǎn)生量走勢預(yù)測圖
運用ARIMA模型對序列進行預(yù)測時,預(yù)測的準確度隨著時間的推移呈發(fā)散的趨勢,所以ARIMA模型只適合短期預(yù)測。而且由于ARIMA模型基本使用純數(shù)學方法來提取序列中的有效因素,不能從機理上來解釋生活垃圾產(chǎn)生量快速增加的原因,從而不利于對垃圾產(chǎn)生做出具體分析,從源頭上解決垃圾產(chǎn)生問題。
但是ARIMA模型在預(yù)測分析中,理論比較成熟,而且垃圾產(chǎn)生量常常是自相關(guān)非平穩(wěn)的,所以運用ARIMA模型比較合理,且得出的結(jié)論可信度較高。
垃圾治理問題關(guān)系到城市發(fā)展的方方面面,是重要的城市建設(shè)問題之一。本文通過分析過去幾十年的數(shù)據(jù),運用ARIMA(2,2,1)模型對上海市未來7年的生活垃圾產(chǎn)生量做了具體的預(yù)測,具有一定的應(yīng)用價值。
[1]徐禮來,崔勝輝,閆禎,等.城市生活垃圾產(chǎn)生預(yù)測的核心問題探討[J].環(huán)境科學與技術(shù),2013,36(002):184-190.
[2]芮少權(quán),匡安樂.高速公路月度交通量 ARIMA 預(yù)測模型[J].長安大學學報:自然科學版,2010,30(4):82-85.
[3]王燕.應(yīng)用時間序列分析[M].中國人民大學出版社,2008.
[4]上海統(tǒng)計年鑒:2012[M].中國統(tǒng)計出版社, 2012.
[5]趙鑫,郭嘉,吳建川.ARIMA 模型和 GM (1,1)與 ARMA(p, q)組合模型在滑坡短期預(yù)報中的對比分析[J].安全與環(huán)境工程,2012,19(3):24-28.