牛艷飛
(鶴壁職業技術學院,河南 鶴壁 458000)
隨著工業化的不斷發展,各種空氣污染問題日益凸顯,比如,霧霾、全球變暖以及空氣中的光化學污染等問題已經成為全球關注的熱點。為了預防和治理城市空氣污染問題,人們需要了解空氣污染的原因并掌握其變化趨勢。因此,準確預測空氣質量具有一定的現實意義。
在時間序列分析中,最常用于擬合平穩序列的模型是ARMA模型。ARMA模型對時間序列的自相關結構進行描述時,使用的是有限參數線性模型,它的擬合精度能達到實際工程的要求,并且由其可推導出適用的線性預報理論。利用ARMA模型描述的時間序列預報理論在經濟、環境工程等領域均有著重要的理論意義[1]。目前,很多學者基于時間序列分析法對空氣質量指數進行研究,比如王建書[2]、王賽蘭[3]和張歡[4]等。本文將利用時間序列分析結合鶴壁市2021年6月1日—2021年12月31日的AQI數據建立新的預測模型。并運用該模型對鶴壁市未來10天的空氣指數進行預測。希望可以對市民出行活動給出參考意見,并且可以提高市民環境保護意識。
本文建模思路:首先,對數據進行處理,檢驗是否為平穩序列;其次,根據系數相關圖確定擬合模型及其階數;最后,可以根據AIC和SC準則判斷模型的優劣,以此確定最優模型,根據模型畫出預測圖并得出預測結果,以此來進一步判斷模型的好壞,并根據預測結果給出市民出行活動的參考意見。
時間序列模型預測方法的基本思想:通過研究現象的歷史數據來找出其中所蘊含的變化規律,進而通過這種規律來預測未來的數據。ARMA模型有三種基本類型:自回歸(AR:Auto-Regressive)模型、移動平均(MA:Moving-Average)模型以及混合(ARMA:Auto-Regressive Moving-Average)模型[5]。
其中,AR(p)模型的預測方式是通過過去的觀測值和現在的干擾值的線性組合進行預測;MA(q)模型則通過過去的干擾值和現在的干擾值的線性組合進行預測;ARMA(p,q)模型是AR(p)模型和MA(q)模型的組合形式。三個模型的具體公式如下所示[5]:
AR(p)模型的公式為(1)式:

以2021年6月1日-2021年12月31日的鶴壁市AQI數據作為樣本,其中每天的AQI數據來源于中國空氣質量在線監測平臺。基于上述數據運用時間序列分析法及Eviews軟件進行分析并建立預測模型。
為了建立合適的預測模型,首先需要檢驗數據的平穩性。畫出AQI原始數據的時間序列圖,如圖2.1所示,并使用單位根檢(ADF:Augmented Dickey-Fuller test)法,給出ADF檢驗結果如表2.1所示。

圖2.1 AQI時間序列圖

表2.1 ADF檢驗結果
根據圖2.1可知數據具有一定的平穩性。根據表2.1可知單位根統計量為-7.007 610,小于-3.461 030和-2.573 985,所以拒絕原假設。綜合判定,該數據為平穩序列,并且大部分數據處在50~100之間。
我們可以根據自相關系數和偏相關系數來確定模型的階數,鶴壁市AQI數據的系數相關圖,如圖2.2所示。

圖2.2 鶴壁市AQI數據的系數相關圖
根據圖2.2,自相關和偏自相關均沒有明顯的截尾性,所以考慮ARMA模型。自相關在六步之后落入兩倍誤差范圍之內,所以q可能取6;偏自相關系數在k=2和k=4處靠近邊緣,所以p可能取2或者4;我們可以初步考慮用ARMA(2,6),ARMA(4,6)這兩個模型來進行擬合。

圖2.2 ARMA(2,2)模型參數估計結果
2.3.1 ARMA(2,2)模型的參數估計及檢驗
對ARMA(2,6)模型進行參數估計,通過在參數估計過程中不斷剔除不顯著的項來調整模型階數,最終確定模型為ARMA(2,2)模型,參數估計結果如表2.2所示,并畫出殘差圖,如圖2.3所示。

圖2.3 ARMA(2,2)殘差圖
根據圖2.3可知P值均大于0.05,該模型通過白噪聲檢驗。因此,參數估計過程平穩,此模型合理。模型的表達式:

2.3.2 ARMA(4,6)模型的參數估計及檢驗
用ARMA(4,6)模型對時間序列Xt進行參數估計,逐步剔除不顯著的移動平均項和滯后項,最終確定為ARMA(4,6)模型,參數估計所得結果見表2.3。

表2.3 ARMA(4,6)模型參數估計結果
對該模型做殘差檢驗,殘差檢驗圖如圖2.4所示。

圖2.4 ARMA(4,6)殘差圖
由圖2.4可知P值均大于0.05,該模型通過白噪聲檢驗。因此,參數估計過程平穩,此模型合理。模型的表達式:


2.3.3 兩個模型的對比分析
根據表2.2和 表2.6可 知ARMA(2,2) 模型及ARMA(4,6)兩個模型的AIC和SC值,具體如表2.4所示。

表2.4 兩個模型AIC和SC值
根據表2.4可知 ARMA(4,6)模型比ARMA(2,2)模型的AIC值及SC值小,并且ARMA(4,6)模型也并不復雜,所以ARMA(4,6)模型較優。
ARMA(4,6)模型擬合效果圖如圖2.5所示。

圖2.5 模型擬合效果圖
ARMA(4,6)模型動態預測圖及相關參數如圖2.6所示,靜態預測圖及相關參數如圖2.7所示。

圖2.6 ARMA(4,6)模型動態預測圖及相關參數

圖2.7 ARMA(4,6)模型靜態預測圖及相關參數
從動態預測圖中可以看出它的預測值接近一條直線,所以預測結果并不理想。而從靜態預測效果圖(圖2.8)中可以看出預測值和真實值非常接近,所以選擇靜態預測對此模型進行預測。

圖2.8 靜態預測效果圖
對鶴壁市2022年1月1日—2022年1月10日共10天的AQI數據進行預測,預測結果如表2.5所示。

表2.5 AQI預測值
AQI值的高低代表著空氣質量的好壞,根據國家生態環境部對空氣質量的等級劃分,將AQI從0—500分為六個等級[6],具體等級劃分如表2.6所示。
由表2.5可知,鶴壁市未來10天的空氣質量指數預測值均在100上下范圍內,又通過對照空氣質量級別表2.6可知,鶴壁市未來10天的空氣質量大部分屬于空氣質量三級,為輕度污染,對絕大多數市民的日常出行沒有太大的影響。

表2.6 空氣質量級別表
本文基于鶴壁市2021年6月1日—2021年12月31日的AQI數據,運用時間序列分析法建立多個模型,對比分析得出較優的ARMA (4,6)預測模型,通過模型預測結果顯示,鶴壁市未來十天的空氣質量為三至四級,空氣質量指數級別較低,相對于前幾年,空氣質量有所下降,需要引起人們的重視。與實際數據對比發現,時間序列分析法具有短期預測較為準確的特點。如果一次性預測多天AQI數據,會發現最后幾天的預測效果較差。因此,可以通過持續更新數據,以確保預測值的準確性。時間序列分析法還可以對城市的空氣濕度、降水量等多個指標進行預測。對一個城市多個指標規律的預測及掌握,可以讓我們更加全面地預測一個城市未來一段時間內的空氣質量變化。