盧亞靈,蔣洪強*,黃季夏,徐麗芬
1. 環境保護部環境規劃院 國家環境保護環境規劃與政策模擬重點實驗室,北京 100012;2. 中國科學院地理科學與資源研究所 資源與環境信息系統國家重點實驗室,北京 100101;3. 北京大學城市與環境學院 地表過程分析與模擬教育部重點實驗室,北京 100871
基于GWR的中國地級城市SO2年均質量濃度模擬
盧亞靈1,蔣洪強1*,黃季夏2,徐麗芬3
1. 環境保護部環境規劃院 國家環境保護環境規劃與政策模擬重點實驗室,北京 100012;2. 中國科學院地理科學與資源研究所 資源與環境信息系統國家重點實驗室,北京 100101;3. 北京大學城市與環境學院 地表過程分析與模擬教育部重點實驗室,北京 100871
中國城市空氣污染問題已經引起廣泛關注。目前相關研究很多,但是以空間位置為擬合參數,對空氣質量進行回歸模擬的研究較少。以2010年中國地級以上城市SO2年均質量濃度為因變量,分別應用普通線性回歸和地理加權回歸(GWR)模型模擬SO2年均質量濃度,其中地理加權回歸方法考慮了空間位置的影響并以此作為回歸參數。回歸的自變量指標體系包括氣象要素(多年平均溫度、光照、降水)、植被覆蓋(NDVI)、地形要素(坡度、坡向、起伏度)、人為因素(GDP、能源消費)幾個方面。由于各指標之間存在較強的相關性,用主成分分析方法計算得到溫度、日照、降水、NDVI表征的氣象植被綜合指標,高程、坡度、起伏度表征的地形綜合指標,和GDP、能源消費表征的人為因素綜合指標。用3個綜合指標值作為自變量進行回歸模擬。普通回歸結果較差,其r2為0.11,矯正的r2為0.10;GWR模型模擬結果相對較好,其擬合優度顯著提高,r2為0.66,矯正的r2為0.47。因此,地理加權回歸適合進行此類擬合,普通線性回歸不適合。通過對比地理加權回歸模擬的各個城市的擬合優度,發現年均質量濃度數值較高的地區擬合效果較差,這些地區主要集中在中國華北和南部部分地區。與基于機理的模型相比,GWR模型和其各具優缺點,GWR的優勢主要表現在數據及其格式化要求低,計算機軟硬件條件要求低,運算速度快等。
地級以上城市;地理加權回歸(GWR);SO2;年均質量濃度
隨著城鎮化、工業化水平的快速提高,大氣污染已經成為中國突出的城市環境問題(孟曉艷等, 2012),直接影響居民身體健康、經濟生產和社會活動,甚至影響植物生長和文物古跡的保護(KAN和CHEN, 2004;JEONG等, 2005)。因此嚴重的大氣污染可以造成嚴重的健康損害和經濟損失(ZHANG等, 2007; ZHANG等, 2006)。目前中國大氣工業污染形勢嚴峻,城市空氣質量總體變差的趨勢尚未得到有效遏制;隨著交通運輸現代化的迅速發展,中國區域氣態污染物的排放量較大(WU等, 2007; 柴發合等, 2013),導致部分地區復合型污染加劇和區域性大氣霧霾天氣的頻繁發生(LANG等, 2012)。2013年春季中國華北地區嚴重的霧霾天氣已經引起社會高度關注。根據空氣質量標準GB3095-2012的限值,中國目前有超過2/3的城市空氣質量不達標(柴發合等, 2013)。受經濟發展和城鎮化進程的驅動,未來中國化石能源特別是煤炭消費量將持續增長(LANG等, 2012; 呂連宏和羅宏, 2012),大氣污染的巨大壓力將持續較長時間。研究中國空氣質量及其與相關因素的關系,可以為有效控制大氣污染、改善空氣質量提供必要的科學依據(李小飛等, 2012)。
目前,空氣質量相關的時空特征研究主要集中在以下幾個方面:基于機理模型的污染物質量濃度模擬(RAINHAM等, 2005),基于GIS和遙感的空氣質量時空特征分布研究(張寶春等, 2011; 吳兌, 2012),污染物柱濃度研究(姚凌等, 2012; DING等, 2009),基于地統計學的污染物質量濃度時空變異性研究(趙文慧等, 2010),基于模糊理論的大氣環境質量預測與評價(ONKAK-ENGIN等, 2004; SOWLAT等, 2011),基于時間序列理論(如小波變換、濃度譜)的城市空氣質量分析(孟曉艷等, 2012; 黃進和張金池, 2009; 王海鵬等, 2011; OSOWSKI和GARANTY, 2007);污染物質量濃度與相關因素的統計相關性研究(朱李華等, 2010),污染物質量濃度與氣象因子的回歸擬合(毛敏娟等, 2013; DAVIS和KALKSTEIN, 1990),空氣污染指數的神經網絡預報(JIANG等, 2004)等。總結以上可知,應用時間與空間模型分析空氣環境質量的研究越來越多。從中還可以看出,除去應用CMAQ等機理性模型模擬空氣質量外,也有學者關注基于統計方法的空氣質量預測與模擬,但是大多數研究對空間位置的影響考慮不足。地理加權回歸模型(GWR)以空間位置為擬合參數,是一種相對簡單而又有效的探測空間非平穩性的新方法,屬于局域空間分析范疇(BRUNSDON等, 1996)。本文以2010年全國地級城市SO2年均質量濃度為例,研究GWR在大氣污染物質量濃度模擬的可能性。
對于空間現象而言,傳統的統計分析大多忽視了空間數據之間的相互依賴性,因而其結果說服力不夠(蘇方林, 2005)。某些情況下,空間上的依賴性比時間上更復雜,因此在傳統的計量方法基礎上引入空間因素成為空間計量方法的熱點。GWR模型源于空間計量經濟學,是考慮了距離因素影響的回歸模型,也是研究地理空間異質性現象的方法。其特定區位的回歸系數不再是利用全局信息獲得,而是在考慮了臨近空間要素影響的情況下利用鄰近觀測值的子樣本信息進行局部回歸得到(LESAGE, 2004)。GWR在普通線性回歸模型的基礎上,把位置因素作為回歸參數(如果回歸樣本存在空間異質性)。GWR方法可以看做是普通線性回歸模型的改進。
1.1 普通線性回歸
設隨機變量y與確定性變量x1,x2,…,xβ的普通線性回歸模型為:

β0,β1,…,βp是p+1個未知參數,β0為回歸常數,β1,…,βp為回歸系數,y稱為因變量,x1,x2,…,xp稱為自變量,ε是隨機誤差,滿足以下假定則可求解:

多元線性回歸方程未知參數的估計一般采用普通最小二乘法。
1.2 地理加權回歸
地理加權回歸模型是對普通線性回歸公式(1)的擴展,將數據的地理位置嵌入到回歸參數之中(BRUNSDON等, 1998),即:

這里(ui,vi)為第 i個采樣點的坐標(如經緯度);是第i個采樣點上的第k個回歸參數,是地理位置的函數;,為了表述方便,我們將上式簡寫為:

若β1k= β2k=…βnk,則地理加權回歸模型就退變為前述的普通線性回歸模型。
本研究的因變量為 2010年全國地級城市 SO2年均質量濃度;自變量選取對SO2質量濃度分布有影響的氣象、植被、地形、人為因素等9個指標進行回歸。指標體系如圖1所示,氣象因素包括各個城市所在點位多年平均溫度、日照、降水3個指標,植被因素用NDVI表示,地形因素包括高程、坡度、起伏度,人為因素選擇各個城市的 GDP和能源消費總量。

圖1 回歸分析指標體系Fig. 1 Index system of the regression analysis
全國地級城市 SO2年均質量濃度數據來自《2006─2010中國環境質量報告》;溫度、日照、降水等氣象數據來自中國氣象臺站,為全國700多個氣象站點的數據平均并插值的結果;NDVI數據來自中科院地理所資源數據中心,通過2008年1─7月份的SPOT VGT旬數據平均得到;高程、坡度、起伏度數據通過中科院地理所資源數據中心全國1:25萬DEM提取;GDP和能源消費原始數據來自2011年國家和地方統計年鑒(2010年度數據)。
由于各指標間可能存在較強的相關性,所以先進行相關分析,發現溫度、日照、降水、NDVI之間的相關系數比較大,高程、坡度、起伏度之間的相關系數較大,GDP和能源消費之間的相關系數也較大。所以用主成分分析的方法對溫度、日照、降水、NDVI進行計算,得到氣象植被綜合指數,對高程、坡度、起伏度進行主成分計算得到地形綜合指數,對GDP、能源消費進行主成分計算得到人為因素綜合指數。用3個綜合指數進行回歸模擬。
2010年,中國大多數地級以上城市SO2年均質量濃度在0.02~0.06 mg·m-3之間,屬于空氣質量標準GB3095—1996的二級標準(2010年全國仍實施1996年標準);一級標準的城市數量也較多;少量城市SO2污染嚴重,為三級標準。如圖2所示,SO2污染嚴重的城市主要分布在2個區域,一個區域為京津冀、山西、陜西和內蒙古一帶,另一個區域為西南部的云貴、四川一帶;SO2污染較輕的城市主要分布東南沿海、東北三省和西藏、新疆部分地區。
3.1 普通線性回歸
通過普通線性回歸擬合中國 2010年地級城市SO2年均質量濃度,擬合結果如圖 3(a)所示。擬合的 SO2年均質量濃度在三級標準以上(>=0.06 mg·m-3)和質量濃度較低(<=0.01 mg·m-3)的城市數量較少,質量濃度為0.01~0.02 mg·m-3之間的城市數量也較少,絕大多數城市的質量濃度在0.02~0.06 mg·m-3之間,屬于二級標準。與圖2進行對比,發現普通線性回歸擬合結果較差。

圖2 2010年中國地級以上城市SO2年均質量濃度Fig. 2 Annual average concentration of SO2of prefecture-level cities in 2010
從圖3(b)中可以看出,大部分城市普通線性回歸結果殘差較大(圖中紫色和紅色部分),這些城市主要在華北及其北部一帶和四川盆地、云貴高原地區分布;殘差較小的城市主要位于長三角和東南沿海地區(綠色部分)。通過與圖 2比較發現,回歸殘差較大的城市與SO2年均質量濃度數值較大的城市分布有一定的重合。
3.2 GWR回歸
應用ARCInfo工具的GWR擬合結果如圖4所示。擬合結果中有7個城市SO2年均質量濃度超過三級標準(≥0.06 mg·m-3),用紅色表示;質量濃度較低的城市有9個(<0.01 mg·m-3),用深綠色表示;質量濃度在 0.01~0.02 mg·m-3之間的城市個數較多,用淺綠色表示;質量濃度在 0.02~0.06 mg·m-3之間的城市個數最多,用黃色表示。通過與圖2對比發現,各城市的擬合結果分布規律與實測值較相似,即京津冀地區和四川盆地、云貴高原地區部分城市SO2質量濃度較高,質量濃度較低的城市多分布在東南沿海。

圖3 2010年中國地級以上城市SO2年均質量濃度普通線性回歸結果及其誤差Fig. 3 Ordinary regression results and residuals of annual average concentration of SO2of prefecture-level cities in 2010

圖4 2010年中國地級以上城市SO2年均質量濃度GWR回歸結果及其擬合優度Fig. 4 GWR results and residuals of annual average concentration of SO2of prefecture-level cities in 2010
回歸擬合優度用于檢驗模型對樣本觀測值的擬合程度,擬合優度越高,模型模擬效果越好;反之,模擬效果越差。當解釋變量為多元時,要使用調整的擬合優度,以解決變量元素增加對擬合優度的影響。圖4(b)表明長三角、湖北湖南到廣東一帶城市的擬合優度較高,模型擬合效果較好;京津冀及周邊地區、東南和西南部分地區擬合優度較低,擬合效果較差。
3.3 普通線性回歸與地理加權回歸結果比較
通過圖3和圖4對比,發現地理加權回歸擬合效果比普通線性回歸要好很多。定量評估擬合模型性能的參數有r2、校正的r2等。r2是擬合度的一種度量,其值在0.0到1.0范圍內變化,值越大擬合效果越好。此值可解釋為回歸模型所涵蓋的因變量方差的比例。表1為普通線性回歸和GWR的擬合優度比較,普通線性回歸的r2為0.1144,校正的r2為0.1070,擬合效果很差;GWR的r2為0.6595,校正的r2為0.4742,比普通線性回歸的精度有很大提高。

表1 普通線性回歸與GWR擬合優度Table 1 The superiority of the ordinary regression and GWR
4.1 討論
通過研究發現,2010年中國地級城市的 SO2年均質量濃度存在一定程度的空間聚集特性(盧亞靈等, 2012),這說明在用統計方法對其進行模擬時,應該考慮地理位置與區域差異的影響。通過普通線性回歸與GWR擬合結果對比發現,對于中國SO2空氣質量,GWR的回歸結果確實要明顯好于前者。但是就本研究數據來看,GWR對質量濃度數值較高城市的擬合效果較差(普通線性回歸亦是)。本研究數據表明,中國SO2年均質量濃度較高的地區主要集中在華北和南部偏西地區,這也是擬合效果較差的城市所在區域;擬合效果較好的地區主要集中在長江流域和珠三角地區,這些地區SO2質量在全國相對較好。普通線性回歸擬合效果很差,不適合進行此類擬合。
本研究存在一定的不足,導致GWR擬合優度下降。由于數據可得性限制,在氣象要素中,缺少風速、風向等數據,雖然通過日照、溫度、降水計算得出的綜合指數可以在一定程度上反映不同城市的氣象特征,但是與基于機理的空氣質量模型有出入;在人為因素中,采用 GDP和能源消費表征經濟、人口活動的影響,沒有采用污染物排放量(部分城市的數據不可得),但是GDP和能源消費與污染物排放量具有很大程度的正相關,因此可以用這2個指標代替污染排放量。
本研究的結果表明,對于具有空間屬性且相互之間因距離存在相互影響的空氣環境質量,也可以采用GWR進行擬合。根據以往經驗,相對CMAQ等基于機理的模擬模型,基于統計的GWR擬合模型與之各有優缺點。前者在對數據獲取及其規范化方面要求很高,軟硬件條件要求也很高,模型運行時間很長;后者對數據及其規范化及軟硬件的要求較低,模擬時間也非常短。
4.2 結論
2010年,中國大多數地級以上城市SO2年均質量濃度屬于GB3095—1996空氣質量標準的二級。SO2污染嚴重的城市主要分布在華北平原及其附近和西南部的云貴、四川一帶;空氣質量較好的城市在南部沿海分布較為集中。中國地級以上城市空氣質量分布具有空間聚集性。以地級以上城市SO2年均質量濃度為自變量,以年均溫度、日照、降水、植被、地形、GDP和能源消費總量等為因變量,分別采用普通線性回歸和GWR進行模擬。普通線性回歸的結果很差,與現狀數據對比,基本反映不出不同城市SO2年均質量濃度分布規律;GWR結果相比普通線性回歸要好很多,基本能夠反映不同城市SO2年均質量濃度的區域分布特征。通過對比2種模擬方法的 r2,前者為 0.1144(校正的 r2為0.1070),后者為 0.6595(校正的 r2為 0.4742),表明普通線性回歸在此類模擬中不可用,GWR結果相對較好。通過分析GWR擬合優度的空間分布發現,SO2年均質量濃度數值高的地區擬合結果較差,質量濃度低的地區擬合結果相對較好。通過討論基于GWR和基于機理的空氣質量模擬模型,發現兩者各有優缺點,可根據具體情況適當選擇。
BRUNSDON C, FOTHERINGHAM A S, CHARLTON M E. 1996. Geographically weighted regression: a method for exploring spatial nonstationarity[J]. Geographical analysis, 28(4): 281-298.
BRUNSDON C, FOTHERINGHAM S, CHARLTON M. 1998. Geographically weighted regression[J]. Journal of the Royal Statistical Society: Series D (The Statistician), 47(3): 431-443.
DAVIS R E, KALKSTEIN L S. 1990. Using a spatial synoptic climatological classification to assess changes in atmospheric pollution concentration[J]. Physical Geography, 11(4): 320-342.
DING A, WANG T, XUE L, et al. 2009. Transport of north China air pollution by midlatitude cyclones: Case study of aircraft measurements in summer 2007[J]. Journal of Geophysical Research, 114(D8): D08304.
JEONG S L, YOUNG J K, BONGJAE K, et al. 2005. Simultaneous measurements of atmospheric pollutants and visibility with a long path DOAS system in urban areas [J]. Environmental Monitoring and Assessment, 104(1): 281-293.
JIANG D, ZHANG Y, HU X, et al. 2004. Progress in developing an ANN model for air pollution index forecast [J]. Atmospheric Environment, 38(40): 7055-7064.
KAN H D, CHEN B H. 2004. Particulate air pollution in urban areas of Shanghai China: health-based economic assessment[J]. Science of the Total Environment, 322(1): 71-79.
LANG J L, CHENG S Y, WEI W, et al. 2012. A Study on the Trends of Vehicular Emissions in the Beijing-Tianjin-Hebei (BTH) region, China [J]. Atmospheric Environment, 41(62): 605-614.
LESAGE J P. 2004. A family of geographically weighted regression models[M]//Advances in spatial econometrics. Berlin: Springer Berlin Heidelberg: 241-264.
ONKAL-ENGIN G, DEMIR I, HIZ H. 2004. Assessment of urban air quality in Istanbul using fuzzy synthetic evaluation[J]. Atmospheric Environment, 38(23): 3809-3815.
OSOWSKI S, GARANTY K. 2007. Forecasting of the daily meteorological pollution using wavelets and support vector machine[J]. Engineering Applications of Artificial Intelligence, 20(6): 745-755.
RAINHAM D G C, SMOYER-TOMIC K E, SHERIDAN S C, et al. 2005. Synoptic weather patterns and modification of the association between air pollution and human mortality[J]. International Journal of Environmental Health Research, 15(5): 347-360.
SOWLAT M H, GHARIBI H, YUNESIAN M, et al. 2011. A novel, fuzzy-based air quality index (FAQI) for air quality assessment[J]. Atmospheric Environment, 45(12): 2050-2059.
WU D, BI X Y, DENG X J, et al. 2007. Effect of atmospheric haze on the deterioration of visibility over the Pearl River Delta[J]. Acta Meteorologica Sinica, 21(2): 215-223.
ZHANG M, SONG Y, CAI X. 2007. A health based assessment of particulate air pollution in urban areas of Beijing in 2000-2004[J]. Science of the Total Environment, 376(1-3): 100-108.
ZHANG Y H, CHEN C H, CHEN G H, et al. 2006. Application of DALYs in measuring health effect of ambient air pollution: a case study in Shanghai, China[J]. Biomedical and Environmental Sciences, 19(4): 268-272.
柴發合, 李艷萍, 喬琦, 等. 2013. 我國大氣污染聯防聯控環境監管模式的戰略轉型[J]. 環境保護, 5: 22-24.
黃進, 張金池. 2009. 蘇州市空氣質量的時間序列變化過程研究[J]. 環境科學與技術, 32(6): 49-52.
李小飛, 張明軍, 王圣杰,等. 2012. 中國空氣污染指數變化特征及影響因素分析[J]. 環境科學, 33(6): 1936-1943.
盧亞靈, 蔣洪強, 張靜. 2012. 中國地級以上城市SO2年均質量濃度時空特征分析[J]. 生態環境學報, 21(12): 1971-1974.
呂連宏, 羅宏. 2012. 中國大氣環境質量概況與污染防治新思路[J]. 中國能源, 34(1): 18-21.
毛敏娟, 劉厚通, 徐宏輝, 等. 2013. 多元觀測資料融合應用的灰霾天氣關鍵成因研究[J]. 環境科學學報, 33(3): 806-813.
孟曉艷, 王瑞斌, 張欣, 等. 2012. 2006-2010年環保重點城市主要污染物濃度變化特征[J]. 環境科學研究, 25(6): 622-627.
蘇方林. 2005. 中國R&D與經濟增長的空間統計分析[D]. 上海: 華東師范大學: 20-21.
王海鵬, 張斌, 劉祖涵, 等. 2011. 基于小波變換的蘭州市近十年空氣污染指數變化[J]. 環境科學學報, 31(5): 1070-1076.
吳兌, 廖碧婷, 吳晟, 等. 2012. 2010年廣州亞運會期間灰霾天氣分析[J].環境科學學報, 32(3): 521-527.
姚凌, 呂寧, 師華定. 2012. 利用SCIAMACHY遙感資料研究我國NO2柱濃度及其時空分布[J]. 環境科學研究, 25(4): 419-424.
張寶春, 陳彥軍, 李偉鏗, 等. 2011. 基于GIS的珠三角區域空氣質量時空特征研究[J]. 生態環境學報, 20(4): 600-605.
趙文慧, 宮輝力, 趙文吉, 等. 2010. 基于地統計學的北京市可吸入顆粒物時空變異性及氣象因素分析[J]. 環境科學學報, 30(11): 2154-2163.
朱李華, 陶俊, 張仁健, 等. 2010. 冬夏季廣州城區碳氣溶膠特征及其與O3和氣象條件的關聯[J]. 環境科學學報, 30(10): 1942-1949.
Simulation of Annual Average SO2Concentration of the Prefecture-level Cities in China Based on GWR Mode
LU Yaling1, JIANG Hongqiang1*, HUANG Jixia2, XU Lifen3
1. State Environmental Protection Key Laboratory of Environmental Planning and Policy Simulation, Chinese Academy for Environmental Planning, Beijing 100012, China;
2. State Key Laboratory of Resources and Environmental Information System, Institute of Geographic Sciences and Natural Resources Research, Beijing 100101, China;
3. Key Laboratory of Analysis and Simulation of Earth Surface Processes, Ministry of Education, College of Urban and Environmental Sciences, Peking University, Beijing 100871, China
The problems of city air pollution have attracted worldwide attention. There’re various kinds of researches on air pollution, while very few of them are on the air quality regression considering the space location as the fitting parameter. This research respectively applies ordinary linear regression and geographically weighted regression model (GWR) to simulate the annual average SO2concentration of the prefecture-level cities in 2010 in China, with annual average SO2concentration as the dependent variable. The effect of spatial location is considered and taken as a regression parameter in the GWR. The indicator system of independent variables in the research includes meteorological factors (annual average temperature, sunlight, rainfall), vegetation cover (NDVI), topography (slope, slope aspect e, relief) and human factors (GDP, energy consumption). As there is a strong correlation among the indicators, the principal component analysis method is adopted to calculate these comprehensive indexes: the meteorological & vegetation index represented by temperature, sunlight, precipitation and NDVI; the topographic index represented by the elevation, slope and relief; and the human factors index represented by GDP and energy consumption. The regression simulation is conducted with these three comprehensive indexes as independent variables. Compared with the ordinary regression model, whose r2is 0.11 and corrected r2is 0.10, the simulation result of GWR model is better with much improved fitting. Its r2is 0.66, and corrected r2is 0.47. Therefore, geographically weighted regression is suitable for this kind of fitting, while the ordinary linear regression is not. By comparing the fitting in each city, we found the cities with higher annual average SO2concentration had poor fitting effects, which were mainly concentrated in North China and South China. Compared with the models based on the mechanism, the GWR model has its own advantages, such as lower requirements of data and formatting, low requirements of computer software and hardware conditions, and faster speed of operation, and so on.
prefecture-level city; geographically weighted regression (GWR); SO2; annual average concentration
X51
:A
:1674-5906(2014)08-1305-06
盧亞靈,蔣洪強,黃季夏,徐麗芬. 基于GWR的中國地級城市SO2年均質量濃度模擬[J]. 生態環境學報, 2014, 23(8): 1305-1310.
LU Yaling, JIANG Hongqiang, HUANG Jixia, XU Lifen. Simulation of Annual Average SO2Concentration of the Prefecture-level Cities in China Based on GWR Mode [J]. Ecology and Environmental Sciences, 2014, 23(8): 1305-1310.
環保公益性行業科研專項經費(201209037);環境規劃院青年科技創新基金項目“環境規劃時空數據挖掘技術及其應用研究”
盧亞靈(1984年生),女,助理研究員,碩士,主要從事大氣環境相關研究。E-mail: luyl@caep.org.cn
*通訊作者:jianghq@caep.org.cn
2013-12-01