付宏臣,孫艷玲,景 悅
(天津師范大學地理與環境科學學院,天津 300387)
PM2.5是指環境中空氣動力學直徑小于等于2.5 μm的細顆粒物[1].隨著城市化和工業化進程的加快,PM2.5成為空氣污染的主要污染物之一[2].PM2.5中含有大量有毒有害物質,這些物質通過呼吸道進入人體,并對人體造成嚴重影響,因此獲取地面PM2.5濃度的空間分布具有重要意義[3].通過地面環境監測可以獲取站點位置處連續的高精度PM2.5濃度,但由于監測站點分布不均,無法覆蓋整個區域,故難以掌握大尺度區域內PM2.5的空間分布情況.衛星遙感具有監測范圍廣且空間連續的優點,彌補了地面監測站點離散分布的缺點.利用衛星遙感反演氣溶膠光學厚度數據(aerosol optical depth,AOD)成為估算地面PM2.5濃度的一種有效方法[4-6].AOD是大氣氣溶膠最基本的光學特性之一,是表征大氣渾濁度和推算大氣中氣溶膠含量的重要物理量[7-8].AOD數據產品多種多樣,MODIS AOD是目前應用最多的氣溶膠光學厚度數據[9].該數據產品中包含深藍算法和暗像元算法兩類算法[10],其中深藍算法適用于沙漠和工業裸地等地表反射率較高的地區[9,11].
近年來,基于AOD數據進行PM2.5濃度估算已有大量研究,先后出現了多元線性回歸模型[12]、人工神經網絡模型[13]、混合效應模型[14]、地理加權回歸模型[10]和土地利用回歸模型[1]等多種模型.1996年,Fotheringham等[15]基于前人局部回歸的思想提出了地理加權回歸(geographically weighted regression,GWR)模型.該模型在處理數據時充分考慮到空間中不同變量間具有各自的局部特征、不同空間位置和不同性質的特點,將數據的空間特性納入模型中,可以有效處理回歸關系的空間非平穩性[16].Hu[17]最先利用此方法建立了美國地區AOD與PM2.5的關系模型,相關系數R2達到0.6.此后,相關研究對此模型加以改進,加入了相對濕度和邊界層高度等影響因子,進一步提高了模型精度[18].2016年,陳輝等[19]將此模型應用于冬季PM2.5研究,取得了良好的反演效果.此后,張天琪[10]應用該模型反演了2015年中國區域PM2.5濃度,相關系數達到0.76.
新疆位于亞歐大陸中部,因具有干旱多風的氣候特征,使其成為沙塵的高發區[20].2016年國際環保組織聯合發布的全國366個城市PM2.5濃度排行榜中,濃度最高的5座城市有3個位于新疆地區.由2015—2017年新疆維吾爾自治區環境狀況公報[21]中公布的PM2.5數據可以看出,2016年新疆地區PM2.5濃度處于較高水平.現階段新疆地區利用AOD數據估算近地面PM2.5濃度的研究較少,且多僅針對烏魯木齊市進行研究[22].本研究基于2016年深藍算法的MODIS/Terra衛星10 km AOD數據,結合氣象數據和地面PM2.5觀測數據,利用地理加權回歸模型反演得到2016年新疆區域PM2.5濃度時空分布情況,為該地區大氣環境治理提供科學依據.
1.1.1 氣溶膠光學厚度數據
氣溶膠光學厚度數據來源于美國國家航空航天局(national aeronautics and space administration,NASA)官網(https://ladsweb.nascom.nasa.gov/),搭載在 Terra衛星上的MODIS傳感器獲取所得C6版本MOD04氣溶膠二級產品的空間分辨率為10 km,時間序列為2016年1月1日—2016年12月31日,時間分辨率為1 d,去除缺失的15 d數據,共獲取有效AOD數據351 d.國內外學者通過大量實驗驗證了MODIS AOD數據與地面太陽光度計測量所得AOD數據具有一致性[23-24].Hsu等[25]發現利用深藍波段可以實現沙漠和城市等地表反射率較高地區的AOD反演,并將此算法加入到C6版本的AOD產品中.Sayer等[26]對此產品進行了全球性驗證,證明其反演效果顯著.因此,本研究采用深藍算法反演的MODIS AOD產品.
首先,采用IDL語言進行幾何校正,利用ENVI 5.3無縫拼接工具“seamless Mosaic”對2016年351 d的AOD數據進行無縫拼接,并將每日AOD數據加和平均得到月AOD數據,投影方式統一采用WGS 84(World Geodetic System 1984)坐標系統.為了消除變量間的量綱關系,便于不同單位和量級的數據能夠進行比較和計算,本研究利用z-score標準化法對AOD數據進行標準化:

式(1)中:μ為所有樣本數據的算術平均值;σ為所有樣本數據的標準差;z-score為標準化后變量值;x為實際變量值.
1.1.2 氣象數據
新疆氣象數據來源于國家氣象科學數據共享服務平臺(http://data.cma.cn/),包括2016年66個氣象站點的每日平均氣溫T、氣壓P、相對濕度U、降水量R和風速W,通過計算得出2016年每月各氣象要素數據.2016年每日邊界層高度H數據由WRF模型模擬得到,通過加和平均得到每月邊界層高度.以上所有數據均通過克里格插值的方法生成與MODIS AOD投影和空間分辨率均一致的空間連續分布的柵格圖層,并對圖層進行裁剪和z-score標準化.
1.1.3 PM2.5地面監測數據
2016年新疆PM2.5濃度地面監測站和氣象站的空間分布情況如圖1所示.

圖1 2016年新疆PM2.5監測站和氣象站空間分布圖Fig.1 Distribution of PM2.5concentration monitoring stations and meteorological stations in 2016
圖1中42個環境監測站點PM2.5濃度的小時數據來源于中國環境監測總站(http://113.108.142.147:20035/emcpublish/).由于MODIS/Terra衛星在每日地方時10∶30 am左右過境,因此取各環境監測站點10∶00 am和11∶00 am監測的PM2.5濃度數據平均值作為該站點衛星過境時PM2.5濃度監測數據,并通過加和平均得到PM2.5月濃度數據.
1.2.1 模型構建
本研究基于中國新疆區域月尺度數據進行建模,并將經過上述處理的PM2.5月濃度數據與對應月份消除量綱后的AOD和各氣象要素數據進行匹配,分別構建了2016年12個月的AOD-PM2.5模型

式(2)中:PM2.5K為監測 K 點在位置(μK,νK)處 PM2.5濃度;β0為特定位置(μK,νK)處的截距;AODK、PK、RK、UK、WK、TK和 HK為位置(μK,νK)處的建模變量值;β1~β7分別為特定位置(μK,νK)處氣溶膠光學厚度AOD、氣壓P、降水量R、相對濕度U、風速W、氣溫T和邊界層高度H的斜率.
在模型構建過程中利用自適應型(ADAPTIVE)Gauss函數按照相關要素分布的疏密創建核表面,并采用1979年Cleveland[27]提出的交叉驗證法(cross validation,CV)確定最佳帶寬,當CV值達到最小時,對應的b即為最佳帶寬.

1.2.2 回歸映射
利用所構建的模型對新疆地區PM2.5濃度時空分布進行模擬的過程稱為回歸映射[28].通過回歸方程估算PM2.5濃度通常存在異常值,即回歸映射所得PM2.5濃度存在著負值或過高的情況.基于已有研究[29-30],本研究對回歸映射所得PM2.5濃度進行如下處理:當回歸映射所得PM2.5濃度高于所有監測站點所得PM2.5濃度最大值的20%時,將回歸映射所得PM2.5濃度賦值為監測站點PM2.5濃度最大值的120%;當回歸映射所得PM2.5濃度低于所有監測站點所得PM2.5濃度最小值的60%時,將回歸映射所得PM2.5濃度賦值為監測站點PM2.5濃度最小值的60%.
為判斷自變量是否符合建模要求,本研究對模型中的自變量進行描述性統計分析,各變量基本服從正態分布規律,滿足地理加權回歸模型的建模要求,各變量的統計特征如表1所示,各變量頻率分布直方圖如圖2所示.

表1 建模變量描述性統計結果Tab.1 Descriptive statistical results of modeling variables
由表1和圖2統計結果可知,2016年中國新疆區域 PM2.5濃度 CPM2.5范圍主要集中在 3.90~200.00 μg/m3,最大值達到617.86μg/m3,平均質量濃度為53.38μg/m3;AOD平均值為0.09,最大值為0.60,主要分布在0~0.20范圍內;氣壓P平均值為920.21 hPa,最大值和最小值分別為1 242.31 hPa和809.45 hPa;降水量R主要集中在0~40mm,平均值為21.64mm,最大值為73.94mm,最小值為0 mm;相對濕度U平均值為52.87%,最大值為80.77%,最小值為22.58%,主要集中在40~60%的范圍內;氣溫T平均值為12.01℃,最高氣溫為28.10℃,最低氣溫為-12.68℃;風速W平均值為2.21 m/s,最大值和最小值分別為3.40 m/s和1.23 m/s;邊界層高度H主要分布在100~300 m,最大邊界層高度為538.38 m,最小為47.92 m,平均值為184.37 m.
將研究區內42個站點PM2.5濃度監測數據與對應站點處模型反演值進行匹配,共獲取2016年12個月有效數據410對,將地面監測站點PM2.5濃度值與地理加權回歸模型反演所得PM2.5濃度值進行線性相關分析,分別計算相關系數R2、均方根誤差RMSE和平均相對誤差絕對值MAPE,其中相關系數R2為0.87,均方根誤差為22.42 μg/m3,平均相對誤差絕對值為0.35.為了對比預測模型精度,本研究同時選取多元線性回歸(multiple linear regression, MLR)模型[18-19],對近地面 PM2.5濃度進行估算,該模型通過全局回歸的方法探究自變量與因變量之間的關系,是地理學中常用的擬合估算方法.地面監測站點PM2.5濃度值與模型反演所得PM2.5濃度值的相關系數R2為0.78,均方根誤差為29.14 μg/m3,平均相對誤差絕對值為0.49.圖3為2種模型PM2.5濃度擬合散點圖,由圖3可以看出,地理加權回歸模型所得匹配點分布更集中,說明地理加權回歸模型預測值更接近真實值,優于多元線性回歸模型.

圖2 變量分布直方圖Fig.2 Histogram variable distribution

圖3 GWR和MLR模型反演所得PM2.5濃度與地面監測PM2.5濃度擬合散點圖Fig.3 Fitling scatler plot of PM2.5concentration inverting by GWR and MLR model and observed PM2.5concentration
為了更加詳細地驗證預測模型的精度,分別計算12個月的相關系數、均方根誤差和平均相對誤差絕對值,結果如表2所示.

表2 地理加權回歸和多元線性回歸擬合統計指標Tab.2 Fitting statistical index of geographical weighted regression and multivariate linear regression
由表2可以看出,基于地理加權回歸模型和多元線性回歸模型反演所得PM2.5濃度值整體保持一致,具有相同的變化趨勢.地理加權模型和多元線性回歸模型12個月的模型擬合度分別為0.46~0.89和0.20~0.82,地理加權模型相關系數R2明顯高于對應月份多元線性回歸模型相關系數,其中5月份地理加權模型相關系數最高,可達0.89,最低為1月份的0.46;多元線性回歸模型相關系數在5月份和7月份均達到最高值0.82,最低出現在12月,相關系數R2為0.20.對比2個模型的均方根誤差可以明顯看出,地理加權模型均方根誤差為9.51~45.95 μg/m3,普遍低于多元線性回歸模型的11.12~61.30 μg/m3,地理加權模型均方根誤差最低出現在8月,值為9.51 μg/m3,多元線性回歸模型均方根誤差最低出現在9月,值為11.12 μg/m3,最高值均出現在 3 月,前者為 45.95 μg/m3,后者為 61.30 μg/m3.多元線性回歸的平均相對誤差絕對值為0.27~0.87,誤差明顯高于地理加權回歸模型的0.20~0.49,2種模型所得平均相對誤差絕對值均在2月份最低,5月份最高,即地理加權最低為0.20,最高為0.49;多元線性回歸最低為0.27,最高為0.87.
基于上述地理加權回歸模型分別計算2016年12個月的PM2.5空間分布情況及月均濃度值,所得結果如圖4所示.

圖4 新疆地區PM2.5月均濃度變化情況Fig.4 Change of monthly PM2.5concentration of Xinjiang
由圖4可知,一年內PM2.5月濃度變化呈現多峰多谷結構,春季(3—5月)和冬季(12—2月)PM2.5濃度較高,1月份達到132.07μg/m3的峰值,3月份次之,值為113.22μg/m3.春季多大風,沙塵天氣頻發,是造成空氣中PM2.5濃度驟增的主要因素.冬季多出現逆溫現象,空氣的垂直對流運動減少,不利于近地面PM2.5的擴散,采暖原因造成污染物排放量增加,卻不能及時得到擴散,導致近地面PM2.5濃度增加.夏季(6—8月)和秋季(9—11月)PM2.5濃度較低,其中9月份PM2.5月濃度最低,為28.55 μg/m3,夏季的氣象條件有利于PM2.5的遷移和擴散,因此PM2.5濃度較低.而農業活動對地表的擾動所造成的揚塵現象是秋季PM2.5濃度升高的主要因素.
新疆地區一般把1月、2月、3月、11月和12月劃分為采暖季,6月、7月和8月為非采暖季,3月、4月、5月、9月、10月和11月為風沙季.風沙源是造成PM2.5濃度升高的主要原因[31].新疆位于中國西北部,沙漠總面積為4.29×104km2,占其總面積的26.12%[32].因此受風沙季影響3月、4月、5月、10月和11月南疆區域PM2.5濃度較高,受采暖季影響1月、2月和12月北疆區域烏魯木齊市附近PM2.5濃度較其他時間明顯升高.
基于地理加權回歸模型反演所得PM2.5月濃度空間分布如圖5所示.由圖5可以看出,1月份北疆區域AOD缺值嚴重,南疆區域PM2.5濃度分布呈現出東高西低的現象,東南部由于受到昆侖山脈和阿爾金山阻隔,污染物無法擴散,導致污染物邊界與阿爾金山北側一致,吐魯番和哈密地區氣候相對干燥,易受沙塵影響.2月份PM2.5向西擴散,高值區主要集中在塔里木盆地邊緣區域,新疆東部區域PM2.5濃度較1月份呈現明顯下降趨勢,南部延阿爾金山走向呈現AOD缺值帶,阿爾金山南側呈現條狀性高值區.3月份受風沙季影響PM2.5主要集中在南疆區域,以塔里木盆地西側最為集中,出現西部高值區,塔里木盆地中心反而略低于四周區域,新疆北部AOD覆蓋范圍明顯擴大,北疆較南疆相對濕潤,PM2.5濃度相對較低.4月份較前3個月PM2.5污染范圍明顯縮小,以塔里木盆地為高值中心區域,并向四周輻射,北疆區域PM2.5呈現低污染水平.5月份PM2.5污染范圍有擴大趨勢,但基本保持在天山山脈南側,以天山山脈為分界線,南北兩側PM2.5濃度差異顯著.3—5月為沙塵高發期,為此南疆和田和喀什地區PM2.5濃度較高.6月份PM2.5濃度明顯下降,南疆區域呈現中度污染水平,以塔里木盆地為高值中心,四周輻射狀分布.7月份PM2.5濃度較6月份呈現微弱上升趨勢,高值區域向東擴散,這可能與新疆7月強對流天氣頻發有關.8月份和9月份的PM2.5濃度是一年中相對較低的2個月,低值覆蓋范圍明顯擴大,PM2.5高值分布范圍也較為集中,且分布區域較小,主要在塔里木盆地東側的羅布泊附近.10月份PM2.5濃度總體而言也不是很高,呈現中等污染水平,PM2.5分布界限基本與昆侖山脈走向一致,主要集中在天山山脈與昆侖山脈間.11月份PM2.5濃度呈現上升趨勢,高值區亦主要集中在塔里木盆地區域.12月份PM2.5濃度明顯升高,高值區出現在羅布泊和吐魯番盆地附近,即塔里木盆地東北部,新疆東南部區域延阿爾金山呈現條狀低值區.對比2016年12個月PM2.5空間分布明顯看出,冬季AOD覆蓋較少,導致反演所得PM2.5缺值嚴重,缺值區主要集中在北疆區域.

圖5 GWR模型反演所得新疆2016年PM2.5月濃度分布圖Fig.5 Distribution of monthly PM2.5concentration of Xinjiang inverting by GWR model in 2016
為了進一步分析2016年新疆地區PM2.5空間分布情況,利用地理加權回歸模型構建了2016年地面PM2.5濃度反演模型,結果如圖6所示.

圖6 2016年新疆區域PM2.5年均濃度空間分布情況Fig.6 Distribution of PM2.5annual average concentration of Xinjiang in 2016
由圖6可以看出,PM2.5高值區主要位于新疆南部區域和烏魯木齊市附近,其中喀什市、和田市和庫爾勒市PM2.5濃度較高,新疆北部和南部邊緣區域PM2.5濃度相對較低.PM2.5較高的3個地區屬于典型的暖溫帶荒漠干旱氣候特征,降水稀少,蒸發量大,土質疏松,地表缺少植被覆蓋,為揚塵天氣的形成提供了客觀條件.有研究表明,在沙塵高發期,大風將地面的沙塵吹起,使其懸浮在空中,由于降水稀少,揚塵過后會持續幾天浮塵天氣,導致PM2.5濃度升高[31].喀什位于天山南脈與昆侖山交界處,且地形西高東低,形成三面環山的半封閉地形,不利于PM2.5擴散,造成PM2.5污染嚴重.特殊的地形和冬季大面積采暖是導致庫爾勒市PM2.5濃度較高的客觀因素,市政建設的快速發展也是導致PM2.5濃度升高的原因之一[33].有研究表明,沙塵天氣是造成和田PM2.5污染的主要原因[34].烏魯木齊市PM2.5濃度較高可能與冬季燃煤消耗,污染物排放增多,逆溫層厚導致PM2.5難以擴散,濃度增加[35].新疆北部以及南部邊緣區域多為山地,植被覆蓋良好且人類活動較少,表現為PM2.5濃度低值區域.
總體而言,研究區PM2.5濃度呈現出南高北低的現象,PM2.5高值區域以塔里木盆地為高值中心區向四周輻射狀,其中塔里木盆地擁有中國最大的沙漠塔克拉瑪干沙漠,加之新疆特殊的地理環境,盆地相對閉塞,塔里木盆地北側橫亙天山山脈,南側橫亙昆侖山脈,導致PM2.5擴散受到阻隔,造成PM2.5污染物粒子聚集,使得天山山脈南側以塔里木盆地為中心的區域成為PM2.5濃度高值中心區.
本研究利用站點匹配的AOD、氣象要素和地面站點監測數據對2016年逐月AOD-PM2.5進行建模,得到新疆區域每月PM2.5質量濃度的估算值.通過對比地理加權回歸模型和多元線性回歸模型擬合結果,明顯看出地理加權回歸模型較多元線性回歸模型更能體現出PM2.5濃度空間分異的特征,充分體現了地理加權回歸模型的優勢.但新疆區域環境監測站點數據較少,且主要集中在北疆區域,對于南疆塔克拉瑪干沙漠區域基本沒有環境監測站點,導致可匹配的有效數據對較少,影響模型精度.回歸映射所得PM2.5濃度在新疆邊緣區域,尤其是東南部存在著較多的異常值,本研究利用監測站點最小值將這些異常值進行修正,因此新疆東南部區域PM2.5濃度每月的估算值差異較小.
本次研究選用MODIS/Terra 10 km AOD數據,未考慮分辨率較高的MODIS/Terra 3 km AOD數據,原因在于目前MODIS 3 km AOD數據尚未發布深藍算法(DB)產品,考慮到新疆區域多沙漠覆蓋,屬于亮地表類型,深藍算法反演效果更好[9-11],故選擇此算法.此外,本研究選用MODIS上午過境Terra衛星AOD數據,未用下午過境Aqua衛星AOD數據,導致研究可能存在局限性.因此未來在提高反演精度方面,還可以考慮雙星協同數據、地表覆蓋類型和人口密度等影響因素.
針對新疆地區沙漠面積覆蓋廣泛的特殊地理環境,本研究采用深藍算法的氣溶膠光學厚度數據、氣象要素數據和地面監測站點數據,利用地理加權回歸模型和多元線性回歸模型分別構建2016年12個月的PM2.5遙感反演模型,得到以下結果:
(1)基于地理加權回歸模型反演的地面PM2.5濃度相關系數R2=0.87,均方根誤差為22.42 μg/m3,平均相對誤差絕對值為0.35,基于多元線性回歸模型反演的地面PM2.5濃度相關系數R2=0.78,均方根誤差為29.14 μg/m3,平均相對誤差絕對值為0.49,綜合各種擬合指標來看,地理加權回歸模型均優于多元線性回歸模型.
(2)基于地理加權回歸模型反演所得2016年新疆地區一年12個月地面PM2.5濃度呈現波浪狀多峰多谷型變化趨勢,其中峰值主要出現在1月、3月、5月、7月和12月,其中1月PM2.5濃度最高,為132.07μg/m3,谷值出現在2月、4月、6月和9月,其中9月PM2.5濃度最低,為 28.55 μg/m3.
(3)2016年全年新疆地區PM2.5濃度空間分布呈現出南高北低的現象,高值主要集中在塔克拉瑪干沙漠區域.喀什、和田和庫爾勒的北部區域濃度最高,冬季烏魯木齊市附近PM2.5濃度較其他月份表現出較高水平.