席小雅?鄭旭峰?李小鴨



摘? 要:隨著經濟的發展,空氣質量問題日漸顯露,霧霾天氣不斷增加,而霧霾形成的主要原因是細微顆粒物,細微顆粒物能夠較長時間懸浮于空氣中,其濃度越高危害越大。PM2.5作為直徑小于等于2.5微米的顆粒物,被吸入體內后會引發哮喘、支氣管炎以及心血管病等疾病,引起人們的廣泛關注。因此,文章對西安市2013年12月到2021年3月的PM2.5濃度值共計88條數據進行了實證研究,分別采用灰色系統預測模型GM(1,1)、時間序列模型AR(2)以及二者的組合模型對西安市的PM2.5進行預測,研究結果表明組合模型的相對誤差最小,預測效果最優。
關鍵詞:PM2.5;灰色系統預測模型;ARMA(p,q)組合模型
中圖分類號:TP391? ? ? ? ?文獻標識碼:A文章編號:2096-4706(2022)06-0015-05
PM2.5 Concentration Prediction under GM(1,1)-ARMA(p,q)Combined Model
—Take Xian City as an Example
XI Xiaoya, ZHENG Xufeng, LI Xiaoya
(Xian Eurasia University, Xian? 710065, China)
Abstract: With the development of economy, air quality problems are increasingly exposed, and haze weather is increasing. The main reason for the formation of haze is fine particles. Fine particles can be suspended in the air for a long time, and the higher their concentration, the greater the harm. As particles with a diameter of less than or equal to 2.5 microns, PM2.5s inhalation will lead to asthma, bronchitis, cardiovascular disease and other diseases, which has attracted extensive attention. Therefore, this paper studies a total of 88 data of PM2.5 concentration values from December 2013 to March 2021 in Xian. The grey system prediction model GM(1,1), time series model AR (2) and their combination model are used to predict the PM2.5 in Xian. The study results show that the relative error of the combined model is the smallest and the prediction effect is the best.
Keywords: PM2.5; grey system prediction model; ARMA(p,q) combined model
0? 引? 言
近年來,隨著工業化和城市化的迅速發展,人們的生活質量逐漸提高,能源的大量消耗以及污染物排放造成的空氣污染問題也越來越嚴重。由空氣污染引發的“霧霾”漸漸成為人們比較關心的話題。霧霾天氣形成的主要原因是人為的環境污染,與此同時受自然條件的影響,污染物不易擴散。根據歐盟國家的不完全統計,PM2.5或將導致人們的平均壽命減少8.6個月,PM2.5還可能成為病毒和細菌的載體,導致呼吸道感染性疾病的傳播,因此PM2.5已成為環境檢測的重要指標。胡偉、胡敏、唐倩、郭松、閆才青(2013)在廣州地區采樣,從PM2.5的化學成分角度分析2010年廣州亞運會期間顆粒物的污染特征。由于細顆粒物污染具有明顯的空間時效性,因此PM2.5濃度的相關研究一般是在一定區域或一定時間內進行的。王勖之、曾沛、劉永輝(2017)利用PAGE檢驗和分析了上海市近年來PM2.5濃度的變化趨勢,然后建立ARIMA時間序列模型對日PM2.5濃度數據進行擬合和預測。何承香、曾波、楊樂彬(2021)對GM(1,1)模型中的3個參數進行了優化,提出了新型GM(1,1,CSZ,ξ,γ)模型,通過模擬預測得出該模型的性能優良。上述文獻中所提到的方法均有值得參考的地方,但也存在些許不足,如灰色模型適合預測近期數據,且對無規律數據的預測效果較差;ARIMA模型要求數據差分后是平穩的。
本文嘗試建立灰色系統預測模型GM(1,1)和時間序列模型ARMA(p,q)的組合模型,對西安市的PM2.5進行預測,旨在為相關部門提供技術支持。
1? 數據來源
本文數據來源于西安市空氣質量在線監測分析平臺,表1展示了從2013年12月到2021年3月,共計88條西安市PM2.5濃度值數據。
2? GM(1,1)模型預測
設原始序列,對其做一次累加生成新序列,其中有:
對新序列進行平滑處理得到,其中α為權重。由此建立GM(1,1)微分方程:
由最小二乘法可以得到參數, 的估計值,帶入GM(1,1)微分方程得到序列的通解:3571FA44-9630-49C3-98A3-DB0897DBA874
還原成原始數列得到預測函數:
使用EXCEL軟件可得估計值a=0.005 6、b=63.293 6,則GM(1,1)模型為:
其時間響應式為:
運用GM(1,1)模型計算擬合值,并將擬合值與真實值做差后的絕對值的平均值作為平均相對誤差,表2展示了擬合后數據以及平均相對誤差值。
根據表1及表2繪制擬合圖,由圖1可以看出GM(1,1)的擬合效果欠佳。
3? ARMA(p,q)模型預測
3.1? 平穩性檢驗
為了確保沒有隨機趨勢或確定趨勢以防出現“偽回歸”問題,需要進行序列平穩性檢驗。首先可以畫出數據時間序列圖,觀察數據序列的趨勢。通過觀察圖2,初步認為時序波動具有平穩性。
為進一步確認該序列的平穩性,需要對該數據進行ADF檢驗。ADF檢驗的原假設是序列PM2.5存在單位根,由表3可以看出,ADF檢驗的t統計量值為-5.06,小于1%顯著性水平臨界值-3.45。因此,在99%的置信水平下,可以拒絕原假設,判斷出序列PM2.5不存在單位根,即序列是平穩的。
3.2? 數據的白噪聲檢驗
由圖3可以看出,Q統計量的P值小于顯著性水平0.05,序列為非白噪聲,可以對序列建立ARMA(p,q)模型。
3.3? 模型的識別
觀察自相關及偏自相關圖,自相關拖尾,偏自相關三階后截尾,因此可以嘗試建立AR(2)、AR(3)、ARMA(2,1)模型。
對三個模型的殘差做進一步的白噪聲檢驗。當檢驗出殘差序列不是白噪聲序列時,說明在殘差序列中還有少量的重要信息沒有被提取出來,這時需要對整個模型進行改進。模型的檢驗一般著重于檢驗殘差序列是否具有隨機性,圖4、圖5、圖6分別為AR(2)、AR(3)、ARMA(2,1)殘差序列的白噪聲檢驗圖。根據殘差序列的自相關、偏自相關圖以及P值,AR(2)、AR(3)模型的殘差序列基本上可以視為白噪聲序列。
分別計算AR(2)、AR(3)模型的AIC值與SC值,AIC值與SC值越小模型的效果越好。由表4可以看出AR(2)的AIC值和SC值在兩個模型中最低,故選擇AR(2)模型。
3.4? 模型的構建
利用EViews7.2軟件,采用非線性最小二乘法對AR(2)模型的參數進行估計,得到模型擬合結果,如表5所示。
根據結果得到AR(2)模型的方程:
3.5? 模型的預測
同理,利用AR(2)模型進行預測,計算每一個預測數據與實際數據差的絕對值得到相對誤差,對相對誤差數據求平均后得到平均相對誤差。經計算得到AR(2)模型的平均相對誤差為0.448。使用AR(2)模型對原始序列進行預測,結果如圖7所示。
4? GM(1,1)-ARMA(p,q)模型預測
通過對GM(1,1)模型和AR(2)模型進行線性組合,建立GM(1,1)-AR(2)組合模型,其基本形式為:
其中,ut和vt分別為GM(1,1)模型和ARMA(p,q)模型,w1和w2為組合權重,運用方差倒數法來確定組合權重,即,其中ci為第i個模型的誤差平方和,k為模型個數。
經計算GM(1,1)-AR(2)組合預測模型為:
運用GM(1,1)-AR(2)組合模型對原始序列進行靜態預測。由圖8可得,GM(1,1)-AR(2)組合預測模型不僅保留了原始數據列的整體趨勢,同時也體現出數據列的隨機波動性。利用預測數據及實際數據計算得到組合模型的平均相對誤差為0.323。
比較組合模型的預測效果,結果如表6所示。由表6可知,組合模型GM(1,1)-AR(2)的相對誤差值最小,這說明組合模型的預測更加精準。
5? 結? 論
目前,對空氣質量的研究主要集中于對各氣體污染物濃度的預測,其中PM2.5濃度是主要的研究對象。本文通過對比GM(1,1)模型、AR(2)模型、以及GM(1,1)-AR(2)組合模型,發現組合模型的平均相對誤差較小,預測效果更加優良。
參考文獻:
[1] 胡偉,胡敏,唐倩,等.珠江三角洲地區亞運期間顆粒物污染特征 [J].環境科學學報,2013,33(7):1815-1823.
[2] 王勖之,曾沛,劉永輝.上海市PM2.5濃度的分析與預測 [J].數學的實踐與認識,2017,47(15):210-217.
[3] 何承香,曾波,楊樂彬.基于灰色參數組合優化模型的重慶PM_(2.5)濃度預測與對比分析 [J].系統科學與數學,2021,41(10):2855-2867.
[4] 王賽蘭.基于多元方法和時間序列的PM2.5濃度分析與預測 [D].長沙:湖南師范大學,2019.
[5] 李佳旭.成都市PM_(2.5)濃度的影響因素分析及預測 [D].蘭州:蘭州大學,2020.
作者簡介:席小雅(1996.12—),女,漢族,河南開封人,助教,碩士,研究方向:市場調研及商業數據分析。
收稿日期:2022-01-28
基金項目:西安歐亞學院2018年度校級重點課程建設項目(2018KC022)3571FA44-9630-49C3-98A3-DB0897DBA874