葉深,王鵬*,折遠洋,丁明軍
1.江西師范大學地理與環境學院
2.江西師范大學, 鄱陽湖濕地與流域研究教育部重點實驗室
京津冀、長三角和珠三角城市群作為國務院最早批復的國家級城市群,城市化水平位于全國前列,而過于頻繁的人為活動、高耗能產業及不合理的工業區位為大氣污染提供了潛在污染源[1-2]。隨著產業結構升級,社會經濟活動的調整和政府部門相關法律法規的執行,三大城市群空氣質量得到明顯改善,但臭氧問題仍然存在[3]。臭氧問題不僅是全球氣候變化中急需解決的關鍵問題,還影響著生態系統[4]與人類健康[5-6]。因此,從地理視角了解三大城市群臭氧的時空變化特征及成因,對進一步推動自然與社會的和諧發展至關重要。
探明臭氧濃度時空變化背后成因已成為大氣污染防治的重要環節。臭氧濃度的時間變化和空間變化特征共同影響了大氣污染物的時空分布格局[7-9]。臭氧濃度的時間變化特征受自然環境因素和季節影響在年內表現出峰谷值循環交替的演變特征[10-11];在年際變化上則由社會經濟因素占主導,如GDP 和能源消耗[12]。研究不同空間尺度下的臭氧空間變化特征可以客觀解釋市、省以及區域內部臭氧空間分布特征背后的形成機制[13-14]。有研究表明,以京津冀為首的中國重點城市群臭氧濃度的空間變化特征整體呈上升趨勢[15-16]。但Liu 等[17]指出2020年新型冠狀病毒感染疫情防控政策實施后,部分地區由于人類活動強度的降低導致臭氧濃度出現了下降現象。對于臭氧濃度時空變化特征及成因仍存在爭議的現狀,探究三大城市群臭氧濃度時空變化特征背后的成因對今后大氣污染防控治理至關重要。
隨著臭氧濃度時空變化特征研究的不斷深入,傳統的線性模型往往受限于變量選擇及自變量間的共線性問題,已不能滿足當前對于臭氧污染的研究需求。隨機森林模型對于自變量選擇及模型構建條件具有較強的包容性[18-19]。因此,學者們開始引入隨機森林模型來解釋臭氧濃度時空變化背后的潛在影響機制。Ketu[20]指出隨機森林模型與傳統模型相比擁有更高的精確度和解釋率;蔡清楠等[21]指出隨機森林模型在運行過程中預測數據整體符合實測數據,是大氣環境研究領域中對重要因子進行篩選的一種重要方法。地理探測器通過對比探測力度(q)對因變量進行解釋的方法,已被廣大專家學者運用于環境治理與保護領域[22-23]。
鑒于此,筆者通過大數據搜集了2015—2020年三大城市群地級市臭氧污染濃度實時監測數據、自然環境與社會經濟數據,基于隨機森林模型定量研究了三大城市群臭氧濃度時間變化的主要影響因子,探究主要影響因子與臭氧濃度間是否存在閾值效應,并在此基礎上通過地理探測器揭示城市群內部因子交互作用對臭氧濃度空間變化的影響,以期為制定空氣污染防控及治理政策提供科學依據。
京津冀、長三角和珠三角城市群作為“十三五”規劃綱要中重點建設的城市群,其內部各不相同的自然環境和社會經濟狀況與南北方向空間分布的特征為研究城市群臭氧濃度的時空分布提供了必要條件。故選取京津冀(北京市、天津市和石家莊市等)、長三角(上海市、南京市和杭州市等)及珠三角(廣州市、珠海市和肇慶市等)共計50 余個地級市臭氧污染物濃度作為研究對象,研究區域如圖1 所示。

圖1 三大城市群的研究區域Fig.1 Map of the study area of the three major urban agglomerations
根據全國城市空氣質量實時發布平臺(https://air.cnemc.cn:18007/)發布的2015—2020年臭氧日尺度歷史數據,按照GB 3095—2012《環境空氣質量標準》選取三大城市群中50 余個城市的臭氧濃度年均值作為因變量。其中,部分缺失數據按照反距離加權插值(IDW)法進行填補。鑒于三大城市群的臭氧濃度與自然環境和社會經濟要素存在緊密聯系,參考其他文獻[24-25]選取了溫度、降水量、相對濕度和風速 4 個與臭氧濃度升高和擴散相關的自然環境要素進行研究。其數據分別來自國家氣象科學數據中心(http://data.cma.cn/) 2015—2020年每小時監測數據。考慮到臭氧的成因機制,選取了代表前體物NOx和VOCs 主要排放源的私家車保有量和工廠排放廢氣作為能源消耗[26]指標;另外還選取了人均GDP 和產業結構作為衡量經濟指數指標[27]。各項經濟數據均來自2016—2021年國家統計局公布的《中國城市統計年鑒》。
1.3.1 隨機森林模型
通過基于R 語言機器學習的隨機森林(Random Forest)分類與回歸分析模型來量化三大城市群臭氧濃度年際變化與影響因子間的關系[28]。選取臭氧濃度與各因子進行500 次機械學習作為有效監督機器學習的結果,并通過計算均方誤差和節點純度增加量來確定各因子對三大城市群臭氧濃度年際變化的影響(圖2)。

圖2 三大城市群臭氧濃度隨機森林模型示意Fig.2 Schematic diagram of ozone random forest model in the three major urban agglomerations
1.3.2 地理探測器
因子探測通過計算q對三大城市群臭氧濃度空間變化進行探究[29]。具體公式如下:
式中:q為三大城市群臭氧濃度的探測力度,其取值一般為[0,1],q越大,說明該因子有更高的解釋性;n為總格網數量;L為臭氧或者影響因子的分層;i為L層內三大城市群地級市樣本數; σ2為三大城市群間臭氧濃度的方差。
交互探測器可辨識自然因子與社會經濟因子之間交互作用,即在x1和x2共同作用下對三大城市群臭氧的空間特征進行影響評價。評估方法如表1 所示。

表1 地理探測器交互探測Table 1 Geographical detector interactive detection
2015—2020年三大城市群臭氧濃度整體呈上升趨勢(圖3)。從三大城市群臭氧年均濃度角度分析,京津冀城市群臭氧濃度由2015年的89.4 μg/m3增至2020年的105.6 μg/m3,長三角和珠三角城市群5年內臭氧濃度分別上升了13.6 和15.2 μg/m3。從三大城市群年均濃度變化率看,長三角城市群臭氧年均濃度上升最明顯,為3.4%,大于京津冀城市群(2.9%)和珠三角城市群(2.1%)。

圖3 2015—2020年三大城市群臭氧濃度時間變化Fig.3 Temporal changes of ozone in the three major urban agglomerations from 2015 to 2020
從2015—2020年三大城市群臭氧濃度年均值空間分布(圖4)來看,京津冀城市群是臭氧濃度年均值最高的城市群(98.4 μg/m3),其次為長三角城市群(96.7 μg/m3),珠三角城市群臭氧濃度年均值僅為90.5 μg/m3。2015—2020年城市群內部臭氧濃度在空間分異的影響下表現出不同的變化特征。其中,長三角城市群臭氧濃度變化值空間分布差異最明顯,自東向西逐漸升高;珠三角城市群臭氧濃度變化值整體表現出由北向南升高,中間過渡的變化特征;京津冀城市群臭氧濃度變化值呈西南向東北遞減的空間演變格局。秦皇島市、滁州市以及中山市分別是三大城市群中臭氧濃度變化值最高的城市。

圖4 2015—2020年三大城市群臭氧濃度空間變化Fig.4 Spatial changes of ozone in the three major urban agglomerations from 2015 to 2020
2.3.1 三大城市群臭氧隨機森林模型適用性評估
將三大城市群臭氧濃度及影響因子設置為訓練集和測試集分別進行500 次運算,結果如圖5 所示。三大城市群隨機森林模型最終運算擬合結果R2均高于普通最小二乘(OLS)線性回歸模型;此外,隨機森林模型擬合系數最好的是京津冀城市群(0.941),其次是珠三角城市群(0.932)與長三角城市群(0.918)。因此,隨機森林模型與普通OLS 回歸模型相比,其運算和擬合結果均較高,更適合用于三大城市群臭氧濃度時間變化分析。

圖5 多元線性回歸與隨機森林回歸擬合Fig.5 Fitting with multiple linear regression and random forest regression
2.3.2 基于隨機森林的三大城市群臭氧濃度重要影響因子篩選
將自然環境與社會經濟因子作為解釋變量,臭氧濃度作為被解釋變量構建隨機森林分類模型。通過隨機森林模型的均方誤差增加量和節點純度增加量判斷臭氧濃度隨時間變化的主要影響因子,結果如圖6 所示。能源消耗量和人均GDP 是三大城市群臭氧濃度年際變化的最主要影響因子(綜合2 種方式,影響因子重要性排序均靠前),其次為溫度和風速,產業結構和相對濕度則是對模型解釋最低的2 種因子。

圖6 三大城市群臭氧濃度時間變化影響因子重要性排序Fig.6 Ranking of the importance of ozone impact factors in the three major urban agglomerations
2.3.3 三大城市群臭氧濃度時間變化主要影響因子的閾值效應
使用均方誤差增加量篩選結果構建隨機森林回歸模型并進行回歸分析,結果如圖7 所示。溫度與京津冀城市群臭氧濃度整體呈正相關,而風速與臭氧濃度則表現出先上升后下降的非線性波動關系。其中,長三角城市群臭氧濃度在風速為1 m/s 時首次出現了下降,隨后在1~2 m/s 時轉為隨著風速上升而上升;風速為2~3 m/s 時出現第二次下降;風速超過4 m/s 時,臭氧濃度與風速變化存在拐點。在珠三角和長三角城市群中,社會經濟因子的人均GDP 與臭氧濃度關系經過快速上升后變化速率逐漸轉為平緩。珠三角城市群能源消耗量超過4 500 t 時,臭氧濃度變化速率變緩。而京津冀城市群能源消耗量對臭氧濃度影響的拐點則為65 000 t。

圖7 三大城市群臭氧濃度時間變化影響因子閾值分析Fig.7 Threshold analysis of ozone concentration influencing factors in the three major urban agglomerations
2.4.1 三大城市群臭氧濃度空間變化因子探測
通過地理探測器模型計算結果q(p<0.001***)來確定各因子對臭氧濃度的最終解釋率(表2)。人均GDP 和能源消耗量是三大城市群臭氧濃度空間變化的主要影響因子。在京津冀和珠三角城市群中,人均GDP 是對臭氧濃度空間變化最大的影響因子,其解釋率分別為0.546 和0.589。能源消耗量對長三角城市群臭氧濃度空間變化解釋率最高,為0.506。而產業結構綜合解釋率在三大城市群中均排名最低,是對臭氧濃度空間變化影響最小的因子。

表2 三大城市群臭氧濃度空間變化因子探測Table 2 Factor detection analysis of spatial ozone changes in the three major urban agglomerations
2.4.2 三大城市群臭氧濃度空間變化因子交互作用
使用交互探測器量化自然環境及社會經濟因子與臭氧濃度空間變化間的交互作用,結果如表3 所示。在京津冀城市群,能源消耗量與產業結構對臭氧濃度空間變化的交互作用最高,最終交互組合的解釋率為0.983。在長三角地區中,人均GDP 和相對濕度、能源消耗量和相對濕度這2 組交互因子的組合對長三角城市群臭氧濃度空間變化的影響較強,其解釋率分別為0.950 和0.941。珠三角城市群臭氧濃度空間變化的交互作用整體較弱,除產業結構和相對濕度外,其余交互因子解釋率均未超過0.9。

表3 三大城市群臭氧濃度空間變化因子交互作用探測Table 3 Detection of the interaction of spatial ozone changes in the three major urban agglomerations
進一步分析發現,各因子的交互作用會增強對三大城市群臭氧濃度空間變化的解釋作用,增強類型分別包括互相增強和非線性增強2 類(表4)。由于人均GDP 是影響京津冀城市群臭氧濃度空間分布的最重要影響因子,故在城市群內部與相對濕度(0.955)組合形成對京津冀臭氧濃度空間變化解釋最高的雙因子組合。相比較而言,人均GDP 和降水量(0.884)的雙因子交互組合對珠三角城市群臭氧濃度空間分布的影響要大于其他交互組合。能源消耗量和人均GDP(0.865)則是對長三角城市群臭氧濃度空間變化解釋率最高的交互組合。

表4 三大城市群臭氧濃度空間變化主要影響因子交互機制Table 4 Interaction mechanism of main influencing factors of ozone spatial changes in the three major urban agglomerations
過高的人均GDP 和能源消耗量導致了三大城市群臭氧濃度逐年上升。臭氧的產生依賴于前體物NOx與VOCs[30]。Huang 等[31]指出能源消耗產生的NOx占中國NOx排放總量的32.6%。在2020年新型冠狀病毒感染疫情背景下,部分地區實施的防控措施減弱了當地的能源消耗強度,導致該地區出現了臭氧濃度削弱現象[17]。以上兩點證明了本研究關于能源消耗量是影響臭氧濃度的主要原因的結論。Fu 等[32]指出人均GDP 高的城市群與單一城市、鄉村相比工業部門更加密集,這導致了發達城市群臭氧污染事件的頻發。在人均GDP 與大氣污染物關系的進一步研究中發現,人均GDP 在22 471~63 709 元會促使污染物濃度系數增大0.978,而污染物濃度超出拐點后上升速率將放緩[33]。因此,在經濟發展同時控制高耗能源排放,推廣清潔型能源將有助于城市群臭氧污染問題的改善。
長三角和珠三角城市群人均GDP 和臭氧濃度的空間差異驗證了二者的閾值效應。人均GDP 是衡量城市群經濟發展水平的重要指標,城市群間經濟發展水平的不同必然會導致污染物排放形成差異,進而影響臭氧濃度[34]。這與本研究發現人均GDP 與臭氧濃度存在正相關的結論有相似性。已有研究表明,人均GDP 一定程度上反映了城市化和工業化的水平[35]。城市在城市化和工業化的過程中,將產生大氣污染物[36]。這和本研究中發現珠三角和長三角城市群人均GDP 分別低于15 000 和20 000 元/人時,人均GDP 與臭氧濃度保持著正相關的結論存在一致性。但是這種類似環境庫茲涅茨曲線(EKC 曲線)的關聯性會隨著環境治理資金的投入逐漸從正相關轉為負相關。即大氣環境治理資金的不斷投入,會引起大氣的臭氧前體物排放量減少,最終導致臭氧濃度上升速率減緩[37]。雖然在本研究中三大城市群中的人均GDP 與臭氧濃度之間關系并未完全體現這一點,但在對京津冀城市群的研究中發現能源消耗超過65 000 t 時會出現類似前文中提到的EKC 曲線拐點。未來研究中,有待對這一問題通過機器學習模型進行深入挖掘,以期為區域臭氧防治提供建設性意見。
城市群內部社會經濟因素的交互作用增強了臭氧濃度的空間變化。地理探測器結果顯示,人均GDP 和能源消耗量是三大城市群中解釋力排序靠前的經濟因子。Xu 等[38]的研究指出,人均GDP 的增高會導致更多的資金投入于環境治理并減輕污染物濃度,從而影響城市群臭氧污染的現狀。社會經濟因素對城市群臭氧濃度空間變化的重要性隨著人均GDP 對人口密度、經濟發展水平和產業結構的影響程度加深而增加[39]。能源消耗對污染物生成和聚集發揮著重要作用[40]。Li 等[41]指出,能源消耗通過調節污染源活動強弱來調節臭氧污染物空間變化特征。這與本文中發現在京津冀城市群中,能源消耗量和人均GDP 的交互組合對臭氧濃度空間變化特征解釋率最高的結論存在一致性。同時,地理探測器因子的交互作用可以提高被解釋變量的解釋率[42]。因此,能源消耗量和人均GDP 的交互作用解釋率越高,說明該地區越容易出現臭氧污染現象。雖然地理探測器交互機制定量分析了臭氧在城市群內部的空間變化,但在空間分異的影響下,目前還無法判斷本文空間變化的研究結果是否適用于自然區、經濟區以及全國范圍。在今后的研究中,會通過擴大研究尺度重新劃分研究區進一步對臭氧濃度空間變化特征成因進行定量研究。
(1)2015—2020年三大城市群臭氧濃度整體呈上升趨勢。在時間變化上,臭氧年均濃度變化率由長三角向南北遞減,即長三角(3.4%)>京津冀(2.9%)>珠三角(2.1%);在空間變化上,臭氧濃度年均值自北向南遞減,即京津冀(98.3 μg/m3)>長三角(96.7μg/m3)>珠三角(90.5 μg/m3)。
(2)能源消耗量與人均GDP 是影響三城市群臭氧濃度時間變化的最主要因子。它們與臭氧濃度間存在著非線性的閾值效應。在長三角和珠三角城市群中,隨著人均GDP 和能源消耗量的增加,它們對臭氧濃度上升速率的影響會出現減弱,京津冀城市群能源消耗量對臭氧濃度影響的拐點為65 000 t。
(3)能源消耗量和人均GDP 是影響三大城市群臭氧濃度空間變化特征的主要影響因子,且各因子的交互作用增強了城市群內部臭氧濃度的空間變化特征。