杜寶強 楊明亮 張金潤






【摘要】通過北京市34個國控監測站點,建立0.5、1、1.5、2、3、4、5km的緩沖區,應用土地利用回歸模型(Land UseRegression,LUR)對北京市采暖季與非采暖季PM2.5濃度進行空間分布模擬,并采用留一交叉互驗法驗證模型精度。結果表明:采暖季LUR模型調整R2為0.799,模擬精度為0.7992,均方根誤差(Root Mean Square Error,RMSE)為6.66μg·m-3;非采暖季LUR模型調整R2為0.807,模擬精度為0.8198,均方根誤差為5.91μg·m-3,模型表現良好。從模擬結果來看,北京市PM2.5主要分布在東南部人口、交通密集的平原區域,整體呈現南高北低的狀態。
【關鍵詞】PM2.5;空間分布;土地利用回歸模型;北京市
〔中圖分類號]X513 〔文獻標識碼〕A 〔文章編號〕1674-3229(2021)04-0051-05
0 引言
隨著經濟的快速發展,環境污染問題也隨之而來。空氣動力學直徑小于等于2.5微米的顆粒物PM2.5是造成霧霾天氣的主要原因[1]。對PM2.5濃度進行空間分布模擬有助于推進我國大氣污染治理。
目前國內外對大氣污染物濃度模擬的方法主要有空間插值、氣溶膠反演、土地利用回歸模型等[2]。其中土地利用回歸模型(Land Use Regres-sion,LUR)的特點是基于多種可能對大氣污染物產生影響的變量進行回歸訓練,可以用來確定大氣污染物與影響變量之間的關系,從而模擬城市地區大氣污染物的空間分布,并在一定程度上識別大氣污染物的成因,而且還具有模擬精度高、考慮因素廣、數據易獲取等優點,已在歐美、日本等國家得到了廣泛應用[3-4]。國內對PM2.5濃度的研究主要集中在來源分析、化學特征、環境危害及健康影響等方面[2,5],對LUR模型應用處于起步階段,國內吳健生等[6]、許剛等[7]、漢瑞英等[8]運用LUR模型模擬了研究區內年均PM2.5濃度,但卻少有學者對不同時間段PM2.5濃度以及影響因素進行研究。
本研究基于采暖季與非采暖季兩個時間段建立回歸預測模型,分析PM2.5濃度在采暖季與非采暖季的空間分布,進一步驗證了LUR模型的適用性,揭示了PM2.5濃度相關影響因素。為大氣污染防治、城市土地及道路規劃、公共衛生管理提供了科學依據。
1 材料與方法
1.1 數據來源及預處理
1.1.1 PM2.5濃度與氣象數據
PM2.5數據來自北京市范圍內34個國控站點2018年11月-2019年10月空氣質量日值數據(數據來源中國環境監測總站http://www.cnemc.cn/)。對數據進行統計計算,得到34個監測站點的采暖季(11月-3月)與非采暖季(4月-10月)PM2.5濃度。氣象數據來自于國家氣象科學數據中心的中國地面氣候資料日值數據(http://data.cma.cn/),采集了北京市20個氣象站點2018年11月-2019年10月觀測數據,包括氣壓、風速、氣溫、相對濕度、降水量5類,對數據進行計算統計得到采暖季與非采暖季的氣象數據,并通過Kriging插值法對采暖季與非采暖季的氣象數據進行插值模擬,提取監測站點所在位置的氣象數據作為氣象因子。
1.1.2 高程與人口數據
高程數據來自Earth Data的中國區域30m分辨率的數字高程模型(Digital Elevation Model,DEM)數據,人口數據來自WorldPop全球高分辨率人口計劃項目(www.worldpop.org),提取監測站點所在位置的高程及人口數量作為高程因子和人口因子。
1.1.3 土地利用與路網數據
土地利用數據來自清華大學宮鵬等2017全球10m分辨率土地利用數據,將北京市土地利用類型分成農田、森林、草地、灌木、濕地、水域、不透水面、裸地8類,路網數據來自于OpenStreetMap,提取數據中的高速公路、干道、一級公路、二級公路4類作為北京市的路網數據。本研究參考已有的LUR模型緩沖半徑設置[9-10],以監測站點為中心,設置0.5、1、1.5、2、3、4、5km為緩沖半徑,以緩沖區內各類土地的面積及各類道路長度作為土地因子和路網因子。北京市土地利用及路網分布如圖1所示。
1.2 研究方法
1.2.1 LUR模型構建
本研究采用的LUR模型是基于監測站的大氣污染物濃度對周圍多種可能對大氣污染物產生影響的變量,進行多元線性回歸的模型。LUR模型的基本形式如式(1):
y=α0+α1x1+α2x2+…+αnxn+β(1)
式中y為因變量,即本研究中采暖季與非采暖季PM2.5濃度值,x1,x2,…,xn為自變量,即本研究各類影響因子,α1,α2,…,αn為待定系數,β為隨機變量。構建模型分為以下3步:(1)在SPSS中將PM2.5濃度與各影響因子進行雙變量相關性分析,去除與PM2.5濃度相關性不顯著(p>0.05)的變量。(2)在剩余變量中去除與同類相關性最高影響因子相關(皮爾森系數r>0.6)的變量。(3)以PM2.5濃度為因變量,剩余的變量為自變量進行逐步線性回歸,得到的回歸方程就是LUR模型。
1.2.2 模型驗證
模型的驗證采用留一交叉互驗(leave-one-outcross validation)[11],將34個監測站點劃分為訓練集(33個)和驗證集(1個),通過對訓練集(33個)站點進行多元線性回歸,得到驗證集(1個)站點的預測值,對比預測值和實測值,重復34次。這種方法雖然繁瑣,但可以有效驗證模型精度。最后通過調整R2、均方根誤差(Root Mean Square Error,RMSE)、模擬精度3項指標來驗證模型。
1.2.3 PM2.5濃度模擬
在ArcGIS中通過創建漁網把北京市劃分成1km×1km規則格網點,通過LUR模型計算出各格網點PM2.5濃度預測值,再利用Kriging插值法就可以得到北京市的PM2.5濃度空間分布。
2 結果與討論
2.1 PM2.5濃度統計
根據圖2可以看出北京市2018年11月-2019年10月PM2.5濃度變化趨勢,采暖季(11月-3月)PM2.5整體濃度偏高,計算可得采暖季PM2.5濃度為58pμg·m-3,嚴重超出國家二級標準。非采暖季(4月-10月)PM2.5濃度為37μg·m-3,相對采暖季有所下降,但也只有8月份滿足了國家二級標準,遠達不到世衛組織標準。
2.2 雙變量相關性分析
在SPSS中將PM2.5濃度與各影響因子進行雙變量相關性分析,去除與PM2.5濃度相關性不顯著(p>0.05)的變量(如不透水面、溫度、三級公路等),剩余變量中去除與同類相關性最高影響因子相關(皮爾森系數r>0.6)的變量(如森林_1000m,灌木_1500m等),最后滿足多元線性回歸的變量如表1所示。從表1可以看出影響因子在采暖季與非采暖季下呈現的相關性不同,采暖季PM2.5濃度與農田、氣壓、高速公路、二級公路呈正相關;與濕地、水體、森林、灌木、風速、降水量、相對濕度呈負相關。非采暖季PM2.5濃度與氣壓、人口、干道、高速公路呈正相關;與水體、森林、灌木、風速、降水量、相對濕度、DEM呈負相關。其中水體、森林、灌木、風速、降水量、氣壓、相對濕度、高速公路與采暖季和非采暖季PM2.5都呈現很高的相關性,說明北京市PM2.5濃度受這些因素影響很大。
2.3 LUR模型構建及精度驗證
將滿足多元線性回歸的變量與PM2.5濃度進行逐步線性回歸,逐步線性回歸可以有效避免自變量共線性的可能。由于PM2.5濃度在采暖季出現較高的情況,為了分析其原因,本文建立了采暖季與非采暖季LUR模型。從表2可以看出,進入采暖季LUR模型的變量有風速、相對濕度、森林、濕地;進人非采暖季LUR模型的變量有風速、降水量、氣壓、干道、一級公路。其中風速均參與了兩個模型的建立,且與PM2.5濃度呈負相關性,原因是大風可以使空氣中的細顆粒物稀釋和擴散,顆粒物不容易堆積,從而降低了濃度[12]。相對濕度、森林、濕地參與了采暖季LUR模型的建立,且均呈現負相關性,原因是相對濕度高使得PM2.5顆粒物吸濕變大,加速顆粒物沉降,森林、濕地的植物具有凈化和吸附PM2.5的功能[13-14]。降水量、氣壓、干道、一級公路參與了非采暖季LUR模型的建立,其中降水呈現負相關性,原因是降水對PM2.5顆粒具有清除作用[15];氣壓、干道、一級公路呈現正相關性,原因是高氣壓時,天氣系統穩定,PM2.5顆粒物擴散條件不好,以及機動車駕駛排放的尾氣以及揚塵[16-17]。
為了進一步驗證模型精度,本研究采用留一交叉互驗法,從圖3可知采暖季LUR模型的模擬精度為0.7992,非采暖季LUR模型的模擬精度為0.8198,模型的模擬精度整體表現良好。經過對PM2.5的監測值和預測值進行計算,得到采暖季均方根誤差為6.66μg·m-3,非采暖季均方根誤差為5.91μg·m-3。
表2 PM2.5多元線性回歸結果吳健生等[6]利用LUR模型模擬重慶市PM2.5濃度的調整R2為0.800;Wu等[18]利用LUR模擬北京市PM2.5濃度的精度的調整Rz為0.58,均方根誤差為9.31μg·m-3。與文獻[6]、[18]相比,本研究的LUR模型誤差更小、解釋度更高。
2.4 采暖與非采暖季PM2.5模擬
通過ArcGIS創建漁網把北京市劃分成1km×1km規格網點,利用LUR模型計算出各格網點PM2.5濃度預測值,再用Kriging插值法就可以得到北京市的PM2.5濃度空間分布。北京市的采暖季與非采暖季PM2.5濃度模擬如圖4所示,可以看出北京市的PM2.5污染主要集中在東南部人口、交通密集的平原區域。通過對比采暖季與非采暖季PM2.5濃度,發現采暖季的PM2.5污染尤其嚴重。
3 討論
(1)采暖季的逆溫天氣以及人口密集區污染物排放對PM2.5濃度的影響很大,但本研究沒有加入研究區內重點廢氣排污企業,未來可以考慮加入研究區重點廢氣排污企業等因素,進一步探索PM2.5的相關影響因素。
(2)本研究是基于國控監測站點,通過LUR模型進行北京市的PM2.5濃度空間分布模擬,但由于國控監測站點主要分布在城市區,在一定程度上限制了模型精度,未來可以考慮加入分布在偏遠地區的省控、縣控監測站點進行模擬。同時本研究采用的LUR模型是通過線性回歸的方法,對于復雜的大氣污染物,模型解釋力度還遠遠不夠,未來可以考慮使用非線性回歸的方法,或者加入深度學習算法改進LUR模型來進一步提升模型的解釋性。
4 結論
(1)2018年11月-2019年10月北京市PM2.5濃度整體偏高,采暖季(11月-3月)PM2.5濃度為58μg·m-3,非采暖季(4月-10月)PM2.5濃度為37μg·m-3,嚴重超出國家二級標準和世衛組織標準。PM2.5濃度整體呈現采暖季高、非采暖季低的現象,這與采暖季處于逆溫天氣多發季節有很大關系。
(2)采暖季PM2.5濃度與農田、氣壓、高速公路、二級公路呈正相關;與濕地、水體、森林、灌木、風速、降水量、相對濕度呈負相關。非采暖季PM2.5濃度與氣壓、人口、干道、高速公路呈正相關;與水體、森林、灌木、風速、降水量、相對濕度、DEM呈負相關。采暖季LUR模型的變量有風速、相對濕度、森林、濕地;非采暖季LUR模型的變量有風速、降水量、氣壓、干道、一級公路。
(3)采暖季LUR模型調整R2為0.799,模擬精度為0.7992,均方根誤差為6.66μg·m-3:非采暖季LUR模型調整R2為0.807,模擬精度為0.8198,均方根誤差為5.91μg·m-3,模型表現良好。
(4)北京市PM2.5濃度主要分布在東南部人口、交通密集的平原區域,整體呈現南高北低的狀態,PM2.5濃度受地形地貌、人口活動、機動車駕駛、污染物排放的影響很大。
[參考文獻]
[1]常彥君,王進,許明,等.河北地區霧霾天氣下大學生健康路徑研究lJ].廊坊師范學院學報(自然科學版),2019,19(4):87-90.
[2]劉炳杰,彭曉敏,李繼紅.基于LUR模型的中國PM2.5時空變化分析[J].環境科學,2018,39(12):5296-5307.
[3]HOEK G,BEELEN R,HOOGH K D,et al.A Review ofLand-Use Regression Models to Assess Spatial Variation ofOutdoor Air Pollution[J].Atmospheric Environment,2008,42(33):7561-7578.
[4]TANG R,BLANGIARDO M,GULLIVER J.Using BuildingHeights and Street Configuration to Enhance Intra UrbanPM10,NOx,and N02 Land Use Regression Models[J].En-vironmental Science&Technology,2013,47(20):11643-11650.
[5]江笑薇,任志遠,孫藝杰.基于LUR和GIS的西安市PM2.5的空間分布模擬及影響因素[J].陜西師范大學學報(自然科學版),2017,45(3):80-87+106
[6]吳健生,廖星,彭建,等.重慶市PM2.5濃度空間分異模擬及影響因子[J].環境科學,2015,36(3):759-767
[7]許剛,焦利民,肖豐濤,等.土地利用回歸模型模擬京津冀PM2.5濃度空間分布[J].干旱區資源與環境,2016,30(10):116-120.
[8]漢瑞英,陳健,王彬.利用LUR模型模擬杭州市PM2.5質量濃度空間分布[J].環境科學學報2016,36 (9):3379-3385.
[9]陽海鷗,陳文波,梁照鳳.LUR模型模擬的南昌市PM2.5濃度與土地利用類型的關系[J].農業工程學報,2017,33(6):232-239.
[10]彭霞,佘倩楠,龍凌波,等.基于移動監測和土地利用回歸模型的上海市近地面黑碳濃度空間模擬[J].環境科學,2017,38(11):4454-4462.
[11]王睿哲,胡榮明,李朋飛,等.基于 LUR模型的PM2.5度空間分布監測及分析[J].環境工程學報,2020,14(10):2843-2852.
[12]張南,熊黑鋼,葛秀秀,等.北京市冬季霧霾天人體呼吸高度PM2.5變化特征對氣象因素的響應[J].環境科學,2016,37(7):2419-2427.
[13]高振翔,葉劍,周紅根,等.江蘇省PM2.5和PM10時空變化特征及其與氣象因子的關系[J].環境科學與技術,2020,43(7):51-58.
[14]康曉明,崔麗娟,趙欣勝,等.北京市濕地削減大氣細顆粒物PM2.5功能[J].生態學雜志,2015,34 (10):2807-2813.
[15]欒天,郭學良,張天航,等.不同降水強度對PM2.5的清除作用及影響因素[J].應用氣象學報,2019,30(3):279-291.
[16]王嫣然,張學霞,趙靜瑤,等.北京地區不同季節PM2.5和PM10濃度對地面氣象因素的響應[J].中國環境監測,2017,33(2):34-41,
[17]袁小燕,葉芝祥,楊懷金,等.成都市道路細顆粒物污染特征[J].環境工程學報,2015,9(9):4598-4602.
[18]Wu J,Li J,Peng J,et al.Applying Land Use RegressionModel to Estimate Spatial Variation of PM2.5 in Beijing,China[J].Environmental science and pollution researchinternational,2015,22(9):7045-7061.
[收稿日期]2021-06-02
[基金項目]空間天氣學國家重點實驗室開發課題(201909);安徽省高校自然科學基金重點項目(KJ2019A0103)
[作者簡介]杜寶強(1972-),男,中國電子技術標準研究院高級工程師,研究方向:能源與環境污染防治。
[通訊作者]楊明亮(1995-),男,安徽理工大學電氣與信息工程學院碩士研究生,研究方向:能源與環境污染防治。