馮 娟,冀 松,王 艷
(保定理工學院,河北 保定 071000)
保定市空氣污染問題受到保定市政府的高度重視,近年來保定市政府一直致力于治理嚴重的空氣污染。因AQI評價的6中污染物濃度限值各有不同,采用AQI評價空氣質量,需要將不同污染物濃度限值折算成空氣質量分指數AQI。當碰到嚴重污染天氣時,AQI值就會超過500的最高限值,出現“爆表”現象,因此需要在AQI評價基礎上進行改進。
空氣質量指數(AQI)是定量描述空氣質量狀況的無量綱指數,其數值越大、級別和類別越高說明空氣污染狀況越嚴重,對人體的健康危害也就越大[1]。針對單項污染物還規定了空氣質量分指數。空氣質量分指數(IAQI),是指根據單項污染物計算得出的空氣質量指數。從各項污染物的IAQI中選擇最大值確定為AQI,首要污染物即IAQI最大的污染物,當污染物濃度超過最高上限,就會發生“爆表”。
通過中國環境空氣在線監測分析平臺,收集保定市2018年全年每天空氣質量監測指標數據[2],因數據量龐大,僅附全年各污染物質量濃度月均值數據,見表1。從表1統計結果可以發現,空氣污染季節性特征明顯,每年的夏、秋季污染物質量濃度都較低,曲線呈“V”字型,最低值在夏季,而冬季到春季濃度值都較高,曲線呈倒“V”字型,最嚴重污染季節為冬季。

表1 2018年各污染物質量濃度月均值數據
因子分析法是指從研究指標相關矩陣內部的依賴關系出發,把一些信息重疊、具有錯綜復雜關系的變量歸結為少數幾個不相關的綜合因子的一種多元統計分析方法[2]。基本思想是:根據相關性大小把變量分組,使得同組內的變量之間相關性較高,但不同組的變量不相關或相關性較低,每組變量代表一個基本結構一即公共因子。
對空氣中的主要污染物(細顆粒物(PM2.5)、可吸入顆粒物(PM1O)、一氧化碳(CO)、二氧化氮(NO2)和二氧化硫(SO2)和臭氧(O3)進行了因子分析。其中KMO的值為0.652,大于閾值0.5,說明變量之間是存在相關性;Bartlett球形檢驗的結果,Sig.這一項值為0.000,小于0.05,說明因子分析是有效的[3]。
公因子方差結果見表2。從表中可以看出,每一個變量提取值均大于0.7,說明每一個變量都可以用公因子表示。

表2 公因子方差
解釋的總方差結果見表3。解釋的總方差代表因子對于變量解釋的貢獻率。從表中可以看出,選取三個代表因子就可以將變量表達到了97.60%。

表3 解釋的總方差
成分矩陣見表4,得到三個綜合評價因子。根據因子分析結果,也可以看出,空氣污染的主要污染物為 PM2.5,NO2,CO。

表4 成份矩陣
多元逐步回歸分析方法[4,5],首先建立因變量和自變量之間的總回歸方程,再對總的方程及每一個自變量進行假設檢驗。當總的方程不顯著時,表明該多元回歸方程線性關系不成立;而當某一個自變量對因變量的影響不顯著時,應該剔除該變量,重新建立不包含該因子的多元回歸方程,篩選出有顯著影響的因子作為自變量,并建立“最優”回歸方程。多元回歸模型的數學形式見公式1:

式中,y為因變量,影響因變量的k個自變量分別為 xk,β0,β1,β2…βk,為回歸參數。
本文中對保定市2018年每天的環境空氣質量指數(AQI)和二氧化硫(SO2)、二氧化氮(NO2)、可吸入顆粒物(PM10)、一氧化碳(CO)、臭氧(O3)、細顆粒 物(PM2.5)六項指標濃度數據進行多元逐步回歸分析,結果見表5,表6,表7。從表5中可以看出,三個模型的R方值即判定系數依次為0.867,0.960,0.984。其中,模型3是最好的。Anova表格,見表6,是對回歸分析過程所做的方差分析。模型中F值均大于3.84,說明回歸方程具有很好的影響力,能夠很好的表達AQI指數。三個模型整體的sig.值均為0,表明在對回歸分析進行方差分析時,當自變量的取值發生變化時,其對因變量的取值都有很大的影響。從表7的系數表格可以得出,回歸模型見公式2:

式中,x1為 PM2.5,x2為 o3,x3為 NO2。模型中這組數量對應的sig.值依次為0.049,0.000,0.000,0.020,都小于0.05,說明4個變量對因變量均有很好的影響力。

表5 模型匯總

表6 Anovad

表7 系數a
對保定市2018年空氣污染質量濃度數據進行整理分析,發現保定市空氣污染問題比較嚴重。文中采用因子分析法,確定了各污染源對污染的貢獻率,找出了最主要的污染物為PM2.5,NO2,CO。在此基礎上利用數理統計分析工具,進行多元逐步回歸分析,建立了回歸模型,模型效果較好。