黃 蕓,姜 國,徐治欠
(湖北師范大學數學與統計學院,湖北 黃石 435002)
ARIMA模型在黃石市PM 2.5濃度預測中的應用
黃 蕓,姜 國,徐治欠
(湖北師范大學數學與統計學院,湖北 黃石 435002)
PM2.5的精確預測對空氣質量評估和大氣污染防治工作起著關鍵性作用 .由于PM2.5濃度受多種因素影響,不同時間段內變化模式存在較大差異,將序列分時段可以提高預測精確度。根據2015年黃石市市區PM2.5日均濃度變化特征,建立了分時段ARIMA模型,進而對黃石市PM2.5濃度進行深入分析及可靠預測。
PM2.5;ARIMA模型;時間序列
目前,PM 2.5污染已經成為社會的熱議話題。PM 2.5是指大氣中的細顆粒物通過對太陽光的吸收,反射或散射降低大氣能見度,使太陽輻射強度降低,是霧霾制造者之一。這種微小顆粒被吸入肺部后,對身體健康危害極大。PM 2.5的準確預測有利于人們采取必要的防護措施。因此建立有效的PM 2.5濃度預測模型具有重要的現實意義。許多專家對PM 2.5污染進行了相關研究,并且提出了其存在的問題以及改進的方法。孫柏峰[1]根據吉林省某市 2001~2010[3~5]年的空氣質量監測情況,結合數學模型對該市的空氣質量進行了評價與預測 ;邵銀念[2]等運用模糊數學方法,通過計算污染因子權重值和隸屬度對烏魯木齊市 2007年度大氣環境質量就進行了綜合評價;國外對大氣污染的統計預測做了廣泛研究,主要運用多元統計分析理論、灰色預測模型、神經網絡預測模型等。其中,用法最廣的是神經網絡預測模型[7],它在非線性模型上有較好的擬合效果,但存在難已確定網絡結構等問題,影響預測模型的泛化能力。
本文根據相關部門提供的實時數據,運用時間序列方法,建立了 ARIMA模型[6]。對黃石市市區 2015年 PM 2.5日均濃度進行短期預測,探討了黃石市空氣質量發展趨勢。
1.1 ARIMA模型的結構
建立 ARIMA模型,是研究時間序列的重要方法,它是由自回歸模型 ( AR模型 )和滑動平均模型 ( MA模型 )構成,簡記為 ARIMA (p,d,q)模型:
1.2 ARIMA模型的建模過程
非平穩時間序列可以利用差分轉化為平穩時間序列來進行ARMA(p,q)的擬合。根據時序圖和自相關圖判斷序列是否具有平穩性。若數據是非平穩的,則可以通過差分對數據進行處理后再重復以上步驟使序列平穩。在對序列進行白噪聲檢驗時,若為非白噪聲序列,則要對平穩的非白噪聲序列進行ARMA(p,q)擬合。
數據平穩性處理后,應用SAS的PROC ARIMA功能分析序列的自相關系數(ACF)和偏自相關系數(PACF)變化趨勢,估計自相關階數(p)和滑動階數(q)的值。用最小二乘估計檢驗每個參數是否顯著不為零,如果有不顯著的參數要剔除其對應的自變量進行新的擬合。
檢驗擬合后的模型是否提取了足夠充分的信息,也就是殘差的白噪聲檢驗。是白噪聲,則擬合有效;反之,需重新擬合模型。模型的有效性檢驗是LB統計量對殘差進行2檢驗 。在SAS程序中的調用 FORECAST程序,可以對未來的情況進行預測和進行趨勢分析。
收集到黃石市2015年城區 PM 2.5日均濃度的相關數據 (來自黃石市有關部門實時數據 ),選取時間段為 2015年 1月 1日~12月 31日,除因停電以及設備故障等偶然性因素所缺失的 1個數據外,共有 364個有效數據。
2.1 繪制序列時序圖
根據空氣質量數據繪制時序圖如下:

圖1 全年PM 2.5日均濃度時序圖
由圖1可以看出全年PM 2.5日均濃度序列為非平穩序列,不同時間段污染物均值呈現的差異較大,因此選擇分時間段模型進行預測。對不同時間段時間序列進行平穩化處理,以 1~3月份為例,對這段時間的PM 2.5日均濃度序列作一階差分后繪制時序圖(圖2)。分時間段后的 PM 2.5日均濃度序列波動平穩,初步判斷變化后的序列為平穩序列 。

圖2 1~3月份PM 2.5日均濃度差分時序圖
2.2 模型定階
觀察差分后序列的自相關圖和偏自相關圖的性質,進一步確定平穩性判斷以及擬合模型階數。

圖1 程序運行1差分后1~3月份PM 2.5日均濃度序列自相關圖

圖2 程序運行2差分后1~3月份PM 2.5日均濃度序列偏自相關圖
自相關圖(程序運行 1)顯示, 2階之后自相關系數都在零值附近波動??梢哉J為自相關系數具有短期相關性,差分后的序列類似平穩。2階自相關系數顯著大于 2倍標準差范圍。觀察偏自相關圖(程序運行 2)得到的結論和上述基本一致。
2.3 參數估計


圖3 程序運行 3參數估計
運用最小二乘法,確定擬合模型(程序 3)。1~3月份選用ARIMA(2,1,1)模型,其估計結果為: (1-0.65085B+0.31979B2)△PM2.5= (1-0.74408B)εt.
同理可得其他不同時段序列的估計結果: 4~6月份選用ARIMA(1,1,2)模型,估計結果為:(1-0.57605B)△PM2.5= 0.000118+ (1-0.67346B-0.32654B2)εt;7~9月選用ARIMA(1,1,1)模型,估計結果為:(1-0.61804B)△PM2.5= (1-0.96232B)εt;10~12月份選用ARIMA(1,1,1)模型,估計值為:(1-0.53976B)△PM2.5 = (1- 0.90985B)εt. 式中:B為延遲算子;εt(t=0,1,2,…) 為白噪聲序列 。
2.4 假設檢驗

圖4 程序運行4模型的參數檢驗
以1~3月為例,由殘差白噪聲檢驗結果得到檢驗統計量的P值都顯著大于 0.05(程序運行 4),則可認為殘差序列為白噪聲序列,系數顯著性檢驗顯示兩系數均顯著。這就證明 ARIMA(2,1,1)模型對該序列建模成功。
2.5 模型預測

表1 兩種模型各季度最后一天的PM 2.5日均濃度預測表
由表1可以看出:分時短PM 2.5日均濃度序列模型預測的相對誤差小于全年PM 2.5日均濃度序列模型的相對誤差,且相對誤差不超過12%,預測效果較好;分時段PM 2.5日均濃度序列模型 3~6月以及 6~9月PM 2.5濃度值較低,屬于污染相對較輕的輕度污染;而 1~3月及10~12月濃度值較大,屬于污染較重的中度污染與重度污染。
本文利用黃石市實時數據,對黃石市2015年大氣PM 2.5日均濃度數據進行相關分析,根據不同時間段污染濃度的分布特征,建立了分時間段ARIMA (p,d,q)預測模型;并預測了不同季度最后一天的污染濃度值,通過將其與全年時間序列模型的結構進行比較驗證。結果顯示分時間短預測結果與實值相對誤差更小,分時間段預測的結果相對更好。
ARIMA模型是一種較好擬合PM 2.5日均濃度序列的方法,該模型便于數據處理,變化靈活,方便推廣到其他城市的大氣污染數據觀測中。但由于PM 2.5濃度受排放源和氣象條件影響及模型自身的限制因素,只能進行短期預測。在未來,可以結合空間預測模型與非線性動力學為大氣污染預測提供評價、預警和治理方法。
[1]孫柏峰 .吉林省某市空氣質量評價及預測[D].長春:吉林大學 ,2013.
[2]廖銀念 ,蘇玉紅 ,艾尼瓦爾 買買提 .城市空氣質量的模糊綜合評價——以烏魯木齊市為例 [J].北方環境,2011,11:143~144.
[3]Reilly P. Time series modeling of global mean temperature for managerial decision-making[J]. Journal of Environment Management, 2005, 76(1):61~70.
[4]Huber P J.Robust Statitics[M]. New York: Wiley, 1981.
[5]Han Jiawei, Kamber M. Data mining: concepts and techniques[M].Morgan Kaufmann Publishers,2000: 7~9.
[6]王 燕 .應用時間序列分析 (第三版 )[M].北京:中國人民大學出版社, 2005.
[7]Grivas G A. Chaloulakou. Artificial neural network models for prediction of PM 2.5 hourly concentrations, in the Greater Area of Athens[J]. Atmospheric Environment, 2006.40(7): 1216~1229.
ARIMA model of Huangshi’s PM 2.5 and its application
HUANG Yun,JIANG Guo,XU Zhi-qian
(College of Mathematics and Statistics,Hubei Normal University,Huangshi 435002,China)
The accurate prediction of PM 2.5 plays a key role in atmospheric pollutant and management. Since there are exist many factors that effect PM 2.5 and the models are various in different time interval, the segmented time series can improve the prediction of PM 2.5.According to the characteristics of time series of concentration variation of PM 2.5 , this article build a new segmented ARIMAmodel. Moreover, we give a deeply analysis and reliably forecast of PM 2.5 in Huangshi.
PM 2.5; ARIMA model; time series
2016—10—11
湖北省科技廳自然科學基金項目( 2016CFB526),湖北省大學生創新創業項目( 201410513022)
黃蕓(1990— ),女,湖北黃石人,碩士研究生,主要研究方向為隨機過程及其交叉領域.
O163
A
2096-3149(2017)02- 0038-05
10.3969/j.issn.2096-3149.2017.02.009