孫明明 程路明 張 杰
(鄭州大學 水利與環境學院,河南 鄭州450001)
在鄭州市九個監測點中,市監測站離市中心近,人口密度大,污染嚴重,故選取市監測站作為研究對象。以2014年3月01日到5月31日共92天數據為例,每天0點到22點共12組偶數點的AQI六個指標值(數據來自國家環境保護部)。針對指標單位的不統一,首先對數據進行無量綱化和歸一化。對于一個參考數據x0,比較數列的為xi,可用下列關系表示各比較曲線與參考曲線在各點的差[1]:

式中,ξi(k)是第k個時刻比較曲線xi與參考曲線x0的相對差值,這種形式的相對差值為xi對x0在k時刻的關聯系數。ζ為分辨系數,ζ∈[0,1],取ζ=0.5。92組相關系數的分析如表1所示。

表1 關聯系數分析表
由表中分析得到,O3與PM2.5的相關性最低,可認為O3與PM2.5低度相關,其余皆為中度相關。除O3外,其余指標相關度較高,因此剔除O3后,可以使用多元線性回歸作為PM2.5分析模型,建立PM2.5關于SO2、NO2、CO、PM10的多元線性回歸模型。
鄭州市PM2.5數據是從2013年11月份開始,選取2013年10月29日到2014年5月31日217組鄭州市每天的PM2.5、SO2、NO2、CO、PM10值作為數據,進行線性回歸分析(數據來自國家環監總站)。擬合出PM2.5與其它4個指標的回歸方程(置信水平取為:1-0.05)。
第一次進行擬合時,存在殘差置信區間未經過0點的數據,視為異常點,剔除這些數據后再進行線性回歸分析。以此反復,直到不再出現異常點為止,得到線性回歸方程:
PM2.5=-26.330+0.6633PM10+25.0695CO-0.6103NO2-0.0603SO2
由圖可知沒有異常點,置信區間皆經過0點。計算回歸方程的相關系數r2為0.957 2,接近于1,表示方程的回歸程度較為顯著。F為843.727 4,F>F1-α(k,n-k-1)=F1-0.05(4,151),其對應的概率為0,小于顯著性水平α0.05,說明回歸模型較為顯著,模型成立[2]。

圖1 線性回歸殘差分析圖
取鄭州市2014年6月1日到6月26日30天PM2.5數值作為模型反演數據,對比PM2.5模型計算數值和真值。由圖中可以看出,回歸模型能夠很好地反映出真值的變化規律,但在某些點差距較大,為檢驗擬合效果,對30組模型計算值和真值的誤差絕對值進行統計,得到表2。

表2 30組模型計算值和真值的誤差絕對值統計
由表中得到:6月份作為檢驗對象的30天數據中,誤差小于15的有22天,占全月的73.33%。因為AQI的危害等級劃分中相鄰等級之間數值相差50,而且每個等級的波動范圍為50[3],所以回歸模型計算結果能夠滿足空氣質量等級劃分的準確性。

圖2 PM2.5真值與回歸模型對比圖
通過對鄭州市2014年市監測站3月1號至5月31號AQI指標的相關性分析,得出與PM2.5相關性最高的是PM10,說明鄭州市近一年內主要污染物是大顆粒物質。而在2013年至2014年鄭州市先后進行了修建地鐵、整修文化路等工程,所以為改善空氣質量,減少施工污染是首要任務。
排除與PM2.5相關性低的O3后,對PM2.5進行了線性回歸擬合,擬合結果能較好地反映PM2.5的變化規律,滿足空氣質量等級的劃分要求,PM2.5多元回歸模型可適用于空氣質量等級的預測。該模型同時表明PM2.5的形成與AQI指標因素變化有關系,在研究PM2.5成因的問題時,可考慮PM2.5由AQI指標因素轉化而來這個途徑。
[1]杜棟,龐慶華,吳炎.現代綜合評價方法與案例精選(第二版)[M].北京:清華大學出版社,2008.
[2]江世宏.MATLAB語言與數學實驗[M].北京:科學出版社,2007.
[3]GB3095-2012.環境空氣質量標準[S].中華人民共和國國家標準.