叢琳+孫德山+鄒存利+張蕾
摘 要 選取2016年北京市空氣質量指數數據,簡述了北京市空氣的現狀,并根據頻率得出PM2.5已經成為北京市空氣中的首要污染物的結論.通過計算PM2.5與AQI所監測的其余指標之間的相關程度,進行PM2.5與PM10,CO和NO2的多元回歸分析,得到線性回歸方程.同時對模型給予改進,建立基于2個主成分的、更為精準的多元回歸模型.得出PM10是空氣中PM2.5的最主要成因的結論,CO和NO2對PM2.5的影響也不容忽視的結論,對北京市霧霾天氣預防提供參考意見.
關鍵詞 PM2.5; AQI; 相關系數;多元回歸分析;主成分分析
中圖分類號 O213 文獻標識碼 A
Abstract We selected the Beijing air quality index data in 2006, clarified the current situation of Beijing air, and based on the frequency we got a conclusion that the PM2.5 has already become the primary pollutant.The calculated correlation between PM2.5 and AQIs remaining indicators, multiple regression analysis of PM2.5 and PM10, CO and NO2, we got the linear regression equation. By improving the model at the same time, a more accurate multivariate regression model based on two principal components was established. It can be concluded that PM10 is the main cause of PM2.5 in the air, and the effect of CO and NO2 on PM2.5 cannot be ignored, the suggestion was provided on the prevention of haze weather in Beijing.
Key words PM2.5; air quality index; correlation index; multivariate regression analysis;principal component analysis;principal component analysis
1 引 言
空氣是地球上大氣層中的氣體混合,作為人類賴以生存的物質,空氣的質量變化直接影響著人類的生活.空氣質量是依據空氣中污染物的濃度來反映空氣受污染的程度的一項指標.現今,空氣質量問題已經成為環境質量中的重點,空氣質量每況愈下,隨之而來的對空氣問題進行分析以及提出相應的解決措施也成為了人類生存環境保護的重中之重.
我國從20世紀80年代開始了大氣中顆粒物的研究工作.黃鸝鳴等[1]對大氣顆粒物的污染在5個典型的城市功能區進行了分析,結果表明PM2.5與PM10的比例占到68%左右.宋宇等[2]對北京市1999年和2000年的空氣污染物的消光系數以及粒徑大小不同的顆粒物的質量濃度進行監測,得出能見度下降的首要原因是大氣顆粒物的消光.魏玉香等[3]對南京市2007年度PM2.5進行了日變化、月季變化的特征分析,并利用同期氣象資料分析氣象與PM2.5的關系.美國國家環境保護局也曾對與PM2.5相關的健康效應予以定量的評價,其中由死亡引起的經濟損失比重達到89%之高.
PM2.5是直徑小于等于2.5微米的細顆粒物,它在空氣中的含量濃度與空氣污染程度有著密不可分的關系.盡管,這種細顆粒物是空氣中很少的一個組成部分,但其粒徑小、面積大、在大氣中能長時間停留且能遠距離輸送等特點使其對空氣環境質量以及人類身體健康有著重大影響.事實證明,PM2.5所能攜帶的有害物質多于PM10等其他污染物質,并且對人類呼吸系統有極強的穿透力,更易于被呼吸道黏膜所吸附,并永久留于體內.由于PM2.5等空氣污染物導致的空氣質量破壞正在蔓延,每年約有300萬人死于肺部相關疾病.因此,隨著全球大氣的污染情況日益加重,作為首都的北京則更應該予以重視研究,以便為相關部門的針對性治理提供一定的參考信息與建議.
2 數據來源及北京空氣質量基本狀況
本文所采用的數據來源于中華人民共和國環境保護部的數據中心[4]和中國空氣質量在線分析平臺[5].其中2016年4月16日及2016年9月6日的數據有所缺失,采用平均值法進行插補處理.同時采用標準化的方法對數據進行處理,以減除量綱對分析的影響.
據歷史天氣狀況紀錄,2016年北京市平均輕度霧霾以上的天氣達到55天,大多數出現在秋冬季節.2016年11月5日出現能見度不足200米的強濃霧霾,造成494架飛機航班取消,所導致的交通事故更是不計其數.同年12月19日~12月21日,北京市紅色預警霧霾天氣,對中小學生采取“停課不停學”措施.霧霾天氣主要由城市工業化、機動車數量以及綠地覆蓋程度和人口規模等因素影響.日常生活所產生的廢氣排放無疑成為了空氣的一種負擔.
從數據中得出,北京市2016年366天中優良天氣所占比例為52.1%,重度及嚴重污染的比例達到10.7%.表明北京市總體空氣質量不容樂觀.具體數據如表1所示.根據所收錄的2016年北京市每日空氣首要污染物數據得知,北京市空氣中首要污染物有NO2,O3-8,PM10,PM2.5,并對其出現頻率進行統計分析.其中PM2.5出現156天,所占百分比為42.6%,遠超其他污染物所占比例.詳見表2.因此,PM2.5成為北京市空氣中首要的污染物.endprint
3 AQI指數介紹
AQI是空氣污染指數,是用不同級別來描述空氣污染成都和質量情況.參與評價的指標主要有細微顆粒物(PM2.5)、可吸入顆粒物(PM10)、二氧化硫、一氧化碳、二氧化氮、臭氧六項.空氣污染指數分為五個級別,取值范圍在0至500之間,本文所采用的數據中每天空氣污染程度就是由此指數評價得到的.當AQI達到300以上,則可判定當日空氣狀況屬于嚴重污染,2016年北京市一共出現了9天嚴重污染情況,這對兒童、老人和病人的身體有著極大傷害.
4 PM2.5的相關系數計算
4.1 相關系數介紹
相關系數是一種反應變量之間相關關系密切程度的統計指標,是用以研究變量間線性相關程度的量.皮爾遜相關系數計算公式為:
相關系數r的取值在-1和+1之間,r值的正負表示變量間相關關系的正負,r的絕對值越大則說明兩變量的相關性越強.皮爾遜相關系數是最常見的計算方法,但并不是唯一的.肯德爾秩相關系數定義了n個同類別的統計對象按照特定的屬性進行排序,若二者屬性的排名相同,則系數為1,這也表明兩個屬性是正相關的;反之,若排名相反則系數-1代表負相關;若排名完全獨立則不相關.Kendall秩相關系數計算公式為:
斯皮爾曼等級相關系數對未知類型的數據類型使用積矩陣相關系數來描述相關性,它對原始數據是沒有要求的,屬于非參數統計方法.
4.2 相關系數計算
運用SPSS 20.0[6],采用上述3種相關系數計算方法進行指標間的相關性分析,得到結果如表3所示.
Pearson相關系數中,PM2.5與PM10的相關系數為0.894,與CO的相關系數為0.868,與NO2的相關系數為0.824,相對前兩者來說其相關性有所減弱;而PM2.5與其余指標間的相關性相對較低.同時,Kendall相關系數與Spearman相關系數的結果大致相同.所以,與PM2.5相關性較強的分別為PM10、CO和NO2.
由北京市2016年全年空氣質量數據,以及數據間的相關性分析,可以初步得出PM2.5與PM10、CO和NO2具有較強的相關關系.并且通過控制這些污染物的形成與排放,對PM2.5的形成也可以起到抑制作用.因此,需要研究分析指標間具體的變動趨勢關系.
5 PM2.5與主要指標的多元回歸分析
多元回歸分析是用于處理一個因變量與多個自變量間數量關系的方法.運用EViews 8.0[7]對與PM2.5相關性比較強的3個指標PM10、CO和NO2,運用最小二乘法進行多元回歸分析,得到結果如表4所示.
由于NO2的參數檢驗0.388 8遠遠大于0.05,說明此變量并不顯著,所以做刪除處理.同時參數C的檢驗也不顯著.所以再將PM2.5對PM10和CO重新做二元回歸分析,得到結果如表5所示.各個統計指標都是顯著的,參數檢驗也均通過.
為了改進模型以更準確的描述監測指標之間的關系,采用主成分分析方法對除PM2.5以外的其余5個變量進行分析,然后建立主成分間的多元回歸.運用R 3.4.0[8],得到主成分分析結果以及相應載荷矩陣如表6和表7所示.由此可以得到前2個主成分的貢獻率達到83.4%,超過80%,這表明前兩個主成分所包含的信息足夠充分.
由于主成分分析操作中已經保證兩個主成分間的獨立性,因此對PM2.5與兩個主成分做二元回歸分析,得到回歸結果如表8所示.
通過回歸方程,可以表明PM2.5與兩個主成分間關系.由此表明,當主成分E1保持不變時,主成分E2每變化一個單位會導致PM2.5變化1.758個單位;同時當主成分E2保持不變時,主成分E1每變化一個單位PM2.5會變化0.596個單位.同時也間接的反映出PM10含量變化對PM2.5的影響最大.
6 總結與建議
本文通過收集2016年北京市空氣質量監測的各項指標,研究北京市霧霾形成的主要因素PM2.5的污染問題,整理了北京市2016年AQI及其具體監測指標的具體數值,對366天的具體情況進行了整理分析,得出PM2.5是北京市2016年首要污染物.進而對PM2.5和其他監測指標進行相關分析及多元回歸分析,得到相應的回歸方程.由于變量間相關性,采用主成分分析得到2個主成分,得到一個較為精準的統計模型.并得出結論:在除PM2.5外的五個監測指標中,PM10對PM2.5的影響程度最大,所以優先控制空氣中塵土的含量可以達到控制PM2.5的目的,同時CO與NO2對PM2.5的影響也不容小覷.因此,要通過控制建筑工地揚塵工作塵土飛揚、加大城市綠化面積和汽車尾氣排放及化工氣體不完全燃燒的排放等從根源解決問題,以改善人們賴以生存的環境.
參考文獻
[1] 黃鸝鳴,王格慧,王薈,等.南京市空氣中顆粒物PM10、PM2.5污染水平[J].中國環境科學,2002.22(4):334-337.
[2] 宋宇,唐孝炎,方晨,等.北京市能見度下降去顆粒物污染的關系[J].環境科學學報,2003.23(4):468-471.
[3] 魏玉香,銀燕,楊衛芬,等.南京地區PM2.5污染特征及其影響因素分析[J].環境科學與管理,2004.5(3):327-311.
[4] 中華人民共和國環境保護部.中華人民共和國環境保護部數據中心,[EB/OL].(2017-06-01)[2017-06-01].http://datacenter.mep.gov.cn/index.
[5] 真氣網.中國空氣質量在線監測分析平臺[EB/OL]. https://www.aqistudy.cn.
[6] 薛薇.基于SPSS的數據分析[M].北京:中國人民大學出版社,2006.
[7] 張大維,劉博,劉琪.EVIEWS數據統計與分析教程[M].北京:清華大學出版社,2010.
[8] 肖枝洪,朱強,蘇理云,等.多元數據分析及其R實現[M].北京:科學出版社,2013.endprint