劉文軍 鄭國義 田學 郎廣名 馮倩



摘要 為了探索空氣污染的主要因素,對空氣污染監測指標PM2.5與AQI中其他監測指標進行相關性分析, 得到PM2.5與SO2、NO2、CO呈正相關, 與O3和溫度呈負相關, 同時利用多元回歸模型得到PM2.5與主因子的數量關系, 給西安市PM2.5防控提供參考意見.
關鍵詞 PM2.5; AQI; 主成分分析; 多元回歸模型
中圖分類號 O213; X501 文獻標識碼 A
Abstract
To explore the main reason of air pollution, we analyzed the correlation between monitoring index of air pollution PM2.5 and other monitoring indexes of AQI, and found that PM2.5 was associated positively with SO2, NO2, CO, and negatively with O3 and the temperature. Then we got the numerical relationship between PM2.5 and the main factor according to multiple regression model. The results offers some references to the control of PM2.5 in Xi'an.
Key wordsPM2.5; AQI; principal component analysis; multivariate regression model
1引言
PM2.5導致的霧霾天氣日益嚴重, 影響人們的身體健康及出行, 其引起社會的廣泛關注1. 西安是典型的北方城市, 它被聯合國開發計劃署選列為大氣顆粒物污染研究示范性城市2, 由于西安特殊的地理位置, 被稱為“污染天井”, 并且冬季燃煤取暖、人口密集, 因此本文以西安市為研究對象.
大氣污染的兩個基本要素是大氣氣溶膠和氣態大氣污染物3. 周順武等4利用SO2、NO2、PM10三項指標, 分析了污染物濃度的分布特征.
李偉等5利用AQI指標的六項監測數據得到PM2.5與其他五項之間的關系. 通過已經公布的歷史數據可以發現PM2.5影響因素具有不確定性, 所以本文采用統計學的多元回歸模型探究PM2.5與AQI其他監測指標及溫度因素的關系得到精確的統計模型, 發現PM2.5的測量值在春季、冬季相對較高, 在夏季、秋季較低6, 本文對溫度因素與AQI監測指標進行相關分析, 得到PM2.5與其他監測指標的數量關系, 為西安市環保部門防治空氣污染提供參考意見.
2數據來源及指標選擇
通過西安市環保監測站查找了2013年1月1日~2013年12月31日的AQI監測數據, 溫度數據來源于中國天氣網的西安市天氣歷史數據. 選取的9個指標, 分別是PM2.5(PM2.5日平均濃度值, 單位μg/m3)、SO2(SO2日平均濃度值, 單位μg/m3)、NO2(NO2日平均濃度值, 單位μg/m3)、CO(CO日平均濃度值, 單位μg/m3)、O3-1(臭氧1個小時平均濃度值, 單位μg/m3)、O3-8(臭氧8個小時平均濃度值, 單位μg/m3)、PM10(可吸入顆粒物PM10日平均濃度值, 單位μg/m3)、Tmax(日溫度最高值, 單位℃)、Tmin(日溫度最低值, 單位℃).
3數據預處理
為了保證數據的完整性, 需要對數據進行缺失值查找和填補, 利用SPSS 21.0 統計軟件7對各個變量進行變量的基本統計分析, 發現2013年3月25日O3-8指標缺失, 因此本文采用回歸的方法對該數據進行填補, 保證了數據的完整性. 為了消除數據變量在數量級和量綱上的不同, 將填補缺失值后的完整數據進行標準化處理. 本文采用的是Z標準化, 即數據處理后的均值為0, 方差為1.標準化公式為: x*=x-μσ, 其中μ為樣本數據的均值, σ為樣本數據的標準差.
4PM2.5與其他指標的多元回歸分析
對AQI的7個基本監測指標及每日最高溫度、最低溫度的相關性進行定量分析, 尤其是對PM2.5含量與其他8項分指標數量的相關性及其數量關系進行分析, 可以從兩個方面進行考慮: 第一, PM2.5與其他8項指標之間的相關性; 第二,PM2.5與其他指標間存在的數量關系.
4.1PM2.5相關因素相關性分析
復相關分析法能夠反映各要素的綜合影響, 幾個要素與某一個要素之間的復相關程度, 用復相關系數來測定. 復相關系數可以利用相關系數和偏相關系數求得, 其假設檢驗與多元回歸的方差分析結果一致, 因而表示回歸貢獻的百分比值. 復相關系數的取值介于-1與+1之間, 用其絕對值的大小來判斷相關的密切程度, 絕對值越大, 相關性越大; 反之, 相關性越小. 本文利用復相關分析方法, 并利用SPSS 21.0軟件進行數據分析. 具體步驟如下:
1)利用SPSS 軟件對SO2、NO2、PM10、CO、O3-1、O3-8、Tmax、Tmin和PM2.5這9個指標進行相關分析, 采用Pearson相關分析法得到表2的數據. 數據結果顯示PM2.5與SO2、NO2、PM10、CO、O3都是相關的, 并且存在較高的相關系數, 尤其與PM10的相關性最大.
2)利用SPSS 21.0軟件先固定PM2.5, 再對其余指標進行偏相關分析, 得到表1.
3) 計算復相關系數為0.996 0.
通過以上分析, 可以得到以下結論, PM2.5與PM10的相關系數最高, 相關系數為0.887, 說明PM10對于PM2.5的影響最大; 其次PM2.5與CO的相關系數為0.821, 也說明了它們相關性較高; 再次NO2、SO2與PM2.5的相關系數也是比較大的, 說明已有的研究結論是合理的, 即二氧化硫(SO2), 二氧化氮(NO2), 一氧化碳(CO)是在一定環境條件下形成PM2.5的主要氣態物質; 但是O3-1與PM2.5的相關系數為-0.235, O3-8與PM2.5的相關系數為-0.274, Tmax與PM2.5的相關系數為-0.530, Tmin與PM2.5的相關系數為-0.523, 呈現負相關, 說明O3與溫度對PM2.5可能有一定的抑制作用.
4.2PM2.5與其他指標的多元回歸分析
多元回歸分析7是一種處理一個因變量與多個自變量關系的方法, 通過多元回歸分析, 能夠得到因變量與自變量的數量關系. 根據表2(Pearson相關分析), 可以發現這9項指標存在不同程度的相關性, 其中PM10與PM2.5, CO與PM2.5, SO2與PM2.5, SO2與NO2, NO2與PM10, NO2與PM2.5之間都具有較大的相關性, 但是建立多元回歸模型需要保證指標間的獨立性, 本文采用主成分分析法對9個指標進行分析, 然后再建立PM2.5與主成分之間的多元回歸模型. 對SO2、CO等指標進行主成分分析結果見表2.
5總結與建議
本文利用數學建模的思想研究西安PM2.5的污染問題, 收集并整理了西安市2013年AQI和溫
度的監測數據, 對西安市2013年的PM2.5與AQI其它監測指標和溫度進行相關性分析, 發現PM2.5與PM10、NO2、SO2、CO呈正相關, 與O3-1、O3-8和溫度呈負相關, 探索了PM2.5與其他變量的數量關系,但通過前面的討論,較高的相關性不適合進行多元回歸建模,因此本文利用主成分分析消除變量間的相關性, 得到兩主成分, 最后利用多元回歸模型, 得到了PM2.5與主成分的關系, 可以發現PM2.5與O3-1、O3-8和溫度仍然呈現負相關, 而與PM10、NO2、SO2、CO呈正相關是一致的, 并且可以得到較為精確的統計模型, PM2.5與AQI和溫度數據關系提供一定的參考依據, 并且對西安市PM2.5防控具有指導意義.
因此, 要加強對建筑工地揚塵工作的管理; 加大城市建設管理力度; 加強城市綠化, 增加植被覆蓋; 政府要推行多舉措, 多污染物聯合防治, 改變經濟發展模式和能源結構方式, 達到長期減排減少污染的目的.
參考文獻
1陶燕, 劉亞夢, 米生權, 等. 大氣細顆粒物的污染特征及對人類健康的影響J. 環境科學學報, 2014, 34(3): 592-597.
2戴樹桂. 環境化學(第二版)M. 北京: 高等教育出版社, 2001: 227-239.
3王瑋, 湯大鋼, 劉紅杰. 中國PM2. 5污染狀況和污染特征的研究J. 環境科學研究, 2000, 13(1): 1-5.
4周順武, 黃瓊中. 拉薩市空氣污染物濃度的統計分析及其可能的天氣原因J. 西藏科技, 2002, 109(5):39-42.
5李偉, 姜志平, 李俊坡, 等. PM2.5相關因素分析及其演變預測J. 現代電子技術, 2014, 37(18): 63-69.
6林啟才, 張振文, 杜利勞, 等. 2013年西安市大氣污染物變化特征及成因分析研究J. 環境科學與管理, 2014, 39(10): 52-55.
7薛薇. 統計分析與SPSS 的應用(第二版)M. 北京: 中國人民大學出版社, 2008.