盧盛棟,李 芬*,蔡兆鑫,李 強,牛永波,陳 玲,賀潔穎
(1.山西省氣象災害防御技術中心,山西 太原 030012;2.山西省氣象科學研究所,山西太原 030002)
隨著城市化的發展及工業進程的加快,環境污染已成為人們關注的焦點。空氣質量較好的環境下適宜人們出游活動,較差的空氣質量不僅不適合人們外出,還會誘發諸多疾病[1]。空氣質量影響因素復雜,不僅與當地污染物[2-4]排放有關,還受當地地形地貌[5]、氣象條件[6-9]的影響,近年來,空氣質量變化特征及其影響因素受到廣大學者的廣泛研究[10-16]。朱紅蕊等[12]分析了氣象因子對哈爾濱空氣質量的影響,發現空氣質量與降水、風速為負相關,與氣壓以正相關為主,后半年相關性比較顯著,相對濕度對空氣質量的影響秋冬季表現為正相關,5—9月表現為負相關。毛卓成等[13]分析了上海地區空氣質量與氣象條件的關系,結果表明在冬季平均風速減小、逆溫強度增強和次數增多條件下易導致PM2.5濃度顯著上升。熊世為等[14]分析了滁州市空氣質量與氣象要素的關系,發現降水量與污染物濃度呈負相關,降水對污染物的濕沉降作用顯著,但弱降水也能使空氣質量變差,可能原因是弱降水能使空氣濕潤,大氣中的霧滴容易吸附污染物,使得污染物在空氣中長時間滯留[15-16]。
氣象因子與空氣質量指數的定量關系研究,諸多學者多采用逐步回歸分析方法[17-20]。白雪等[20]利用逐步回歸的方法,以氣溫、風速、氣壓等氣象要素和前一時段空氣質量構建了錦州市空氣質量預報方程。姚清晨等[21]利用相關分析、小波分析方法研究了空氣質量變化特征及與氣象因子的關系。該模型都有一定的適用性,但此類模型都為固定參數模型,而氣象因子對空氣質量的影響具有雙重性,即同一個氣象因子對空氣質量指數的影響在不同時間尺度上可表現為顯著正相關,也可表現為顯著負相關,因此固定參數模型準確率明顯下降,誤差增大。神經網絡方法具有良好的容錯性,在氣象預報領域已經有了廣泛應用[22-24],本文引進神經網絡方法,對逐步回歸方法構建的模型具有一定的修正能力。
太原是山西省會,華北地區重工業城市之一,污染物排放較大。近年來廣大學者對太原地區空氣質量進行了研究[25-28]。馬杰[25]利用2014年空氣質量與氣象數據,分析了山西省11個地級市空氣質量變化特征及氣象要素對空氣質量的影響;閆世明等[26]研究得出太原市秋冬季大氣污染特征和輸送路徑;趙瑩等[27]研究了太原市空氣質量空間分布特點;戴燕燕等[28]分析了空氣質量與污染物濃度的相關性。以上關于太原地區空氣質量的研究大都采用2013—2016年空氣質量指數及氣象因子日平均數據,然而,近幾年山西轉型發展步伐加快,城市擴容,特別是南部小店區,與周圍的晉中市同城化發展,空氣質量及其影響因子也發生了顯著變化。本文利用2017—2019年太原小店區空氣質量指數及氣象逐時觀測數據,較日平均數據更精準、全面,分析了氣象因子對空氣質量的影響,利用神經網絡方法構建了氣象因子與空氣質量指數的關系模型,并進行檢驗。與逐步回歸固定參數模型相比,該模型誤差較小、準確率高,為太原地區空氣質量預報提供科學參考。
文章使用了2017—2020年太原小店區氣象、空氣質量逐時觀測數據(去掉奇異值),時間為北京時間。其中,氣象數據由山西省氣象信息中心提供,空氣質量數據由山西省環境質量監測中心提供。
空氣質量指數(Air Quality Index,AQI)是根據2012年環保部門頒布實施的《環境空氣質量指數技術規定》(HJ633-2012)[29]提出的,即對某一時段PM2.5、PM10、O3、NO2、SO2、CO 6種污染物濃度經過換算,最大值計為空氣質量指數,當空氣質量指數>50時,對應的污染物為首要污染物[29]。空氣質量等級見表1。

表1 空氣質量等級
使用神經網絡方法構建了氣象因子與AQI的關系模型。神經網絡是一種前饋性神經網絡,有信號前向傳遞、誤差反向傳播的特點[23]。輸入信號從輸入層、隱含層逐層處理直至輸出層,隱含層設10個節點,根據預測誤差調整網絡權值和閾值,使預測輸出不斷逼近期望輸出。
在模型檢驗時,用到平均絕對誤差(公式1)和準確率,定義如下:

其中,Fi為空氣質量指數模擬值,Oi為空氣質量指數實況值,n為樣本個數。準確率采用了中國氣象局減災司空氣質量預報評分規定:為滿分100;25<≤50為50分,>50為0分。因此,準確率指標值為25。
2017—2019年太原空氣質量6個等級均出現過,其中,良占比最大,為51.9%;其次為輕度污染占24.31%,優占12.1%;嚴重污染最少,占1.9%。圖1給出12個月空氣質量不同等級分布,1和12月空氣質量較差,嚴重污染等級分別高達10.94%、5.03%,1月優等級為6.6%,12月僅為3.26%。2—5月及10—11月,空氣質量逐漸轉好,優等級在10%左右,嚴重污染較低,為2%左右。6—9月是太原地區空氣質量較好的月份,沒有出現嚴重污染等級,其中8月最好,優等級占25.21%,最差為中度污染,僅為0.56%,沒有出現重度污染及嚴重污染等級。

圖1 太原市逐月空氣質量指數各等級占比分布
為進一步了解太原地區各月首要污染物成分,文章統計了2017—2019年太原各月份逐時段首要污染物及所占比例(圖2)。由圖2可知,太原首要污染物均為顆粒物,1—2月以PM2.5為主,3—12月以PM10為主。4—10月出現臭氧污染,其中,6—7月臭氧污染較多,SO2和NO2作為首要污染物較少。可見,太原地區首要污染物以顆粒物污染為主。

圖2 太原市逐月首要污染物占比分布
圖3給出了2017—2019年AQI及主要氣象因子月均值分布。其中,由于降水不具有連續性,降水數據采取了逐月降水總和的年均值。由圖3可知,太原地區1—2月AQI均值在100以上,1月空氣質量最差;從3月開始,空氣質量逐漸好轉,AQI均值在100以下,為優良等級。分析原因可能是3月開始太原地區大風逐漸增多,驅使污染物擴散。7—8月為全年空氣質量較好的月份,其中8月最好。7—8月太原地區降水增多,相對濕度較大,對污染物濕沉降作用顯著,且氣溫較高、氣壓較低,空氣活躍,有助于污染物的垂直對流。11月太原地區供暖開始,AQI月均值上升到100以上,污染較明顯。11月—次年2月,空氣質量較差,均值在100以上,為全年易污染月份。

圖3 太原空氣質量指數(a)、氣溫(b)、相對濕度(c)、風速(d)、降水(e)、氣壓(f)月分布
AQI與首要污染物隨時間變化特征明顯,表明AQI受同時段氣象因子變化影響較大。表2給出近3 a太原地區逐月AQI與主要氣象因子的相關系數。9月—次年2月氣溫與AQI呈顯著負相關,可能原因是氣溫越低,空氣活動減弱,容易形成穩定層,不利于污染物擴散。由表2也可看出,5—8月,太原地區氣溫與AQI呈正相關,且通過0.01的顯著性檢驗,可能原因是這幾個月氣溫較高,往往伴有雨水,對污染物進行沖洗,空氣質量好轉。

表2 太原地區逐月空氣質量指數與氣象因子的相關系數
相對濕度與AQI主要表現為正相關、強相關,尤其在8月—次年3月呈顯著相關,可能原因是濕度越大,空氣中霧滴容易吸附污染物,使得污染物長期在空中滯留。但6—7月相對濕度與AQI呈顯著負相關,原因可能是相對濕度較低,并常伴有大風天氣,大風容易引發沙塵天氣,使空氣質量變差、AQI偏高。該時段首要污染物主要為PM10,也說明大風使顆粒物濃度升高。
風速與AQI主要表現為負相關,8月—次年3月呈顯著強相關,這是因為風促使污染物水平擴散,降低污染物濃度。5—7月,風速與AQI表現為正相關,且在6月通過了0.05的顯著性檢驗。可能是因為在該時段,風速較大易引起沙塵天氣,使空氣質量變差,且該時段恰好與相對濕度和AQI呈負相關的時段吻合。
降水與AQI主要為負相關,且在5—11月顯著,通過了0.01的顯著性檢驗。因為降水對空氣具有凈化作用,使污染物沉降明顯[12]。但12月—次年2月表現為正相關,相關系數較小,為極弱相關,可能原因是太原處于供暖期,污染物排放較多,降水較少,少量的降水不但不能沖刷污染物,反而增加空氣濕度,使得大氣中的水汽吸附污染物長期滯留在空中,加劇空氣質量惡化。這也與蒲維維[15]、張夏琨[16]等的研究結論一致。
氣壓與AQI主要表現為負相關,并在7月—次年4月顯著,可能原因是近地面氣壓大,容易造成污染物水平擴散,降低了污染物濃度,使空氣質量變好。5月表現為弱正相關,可能原因是地面氣壓小,容易造成污染物在垂直方向擴散,使空氣質量變好。朱紅蕊等[12]研究哈爾濱空氣質量與氣象要素的關系,發現哈爾濱地區氣壓與空氣質量主要表現為正相關,這與太原地區正好相反,這可能與太原三面環山,同時氣壓升高,促使污染物水平流動有關。
綜上所述,氣象因子對空氣質量指數的影響具有雙重性,在不同時間尺度上基本表現為顯著的正相關或負相關。
由圖3a可知,太原11月—次年2月,AQI均值在100以上,統一稱為易污染月。研究易污染月空氣質量對該地區具有重要的意義。分析2017—2019年太原易污染月不同等級下空氣質量指數和各氣象因子的均值及不同等級出現頻率(表3),由于降水不具有連續性,降水數據為易污染月各污染等級累加年平均所得。由表3可知,易污染月空氣質量以良為主,占比為40.65%;嚴重污染的發生頻率最少,為4.59%。
隨著空氣污染加重,氣溫、風速、氣壓逐漸降低,相對濕度逐漸升高,特別在嚴重污染時段,相對濕度達70.69%,且風速降至1 m/s以下,相對濕度、風速變化顯著。由表2可知,在易污染月,相對濕度、風速與空氣質量指數相關系數較大,呈強相關,氣溫、氣壓相關系數較低,呈弱相關。由表3可知,在易污染月,空氣質量受相對濕度、風速影響較大。
在易污染月,降水和AQI呈極弱正相關(表2),降水數據變化不明顯(表3),所以在易污染月降水不是主要影響因子。在易污染月,太原地區降水偏少,降水樣本數據也較少,在以后的研究中,將增加資料時段,以得到更準確的分析結果。

表3 2017—2019年易污染月不同等級下的空氣質量指數及氣象因子
為進一步驗證易污染月太原地區空氣質量主要受相對濕度、風速的影響,選取典型個例加以分析。2019年1月5日09時—1月8日13時太原出現一次典型的空氣污染過程,空氣質量指數最高達362,屬于空氣質量嚴重污染級別。由于該時段沒有降水,所以分析過程沒有降水數據變化。
由圖4可知,1月5日09時,空氣質量指數為68,屬于二級良,但隨著風速急劇降低,空氣質量不斷惡化。5日21時,風速降為0,AQI上升到279,之后隨著相對濕度不斷增大,空氣質量持續惡化。6日07時,空氣質量高達317,此時相對濕度達89%,風速為0,氣壓較低,為933.6 hPa,氣溫為一日中最低,為-14℃,之后隨著相對濕度降低,風速逐漸增大,空氣質量逐漸好轉。6日11時,風速處于波峰,為2.2 m/s,此時相對濕度持續降低,AQI出現短暫波谷,為247,之后風速降低,相對濕度升高,空氣質量又出現惡化。7日03時,AQI出現波峰,為362,此時相對濕度處于波峰88%,風速為0,之后相對濕度降低,風速增大,氣壓升高,空氣質量逐漸好轉。8日13時,相對濕度為20%,風速達2.9 m/s,AQI為56,在15時空氣質量指數為46,屬于一級優,此次空氣污染過程結束。整個過程,空氣質量指數的波峰(谷)與相對濕度的波峰(谷)及風速的波谷(峰)較為一致,說明,相對濕度、風速對空氣質量指數影響顯著。

圖4 2019年1月5日9時—1月8日13時空氣污染過程空氣質量指數、相對濕度、氣壓(a)以及氣溫、風速(b)的變化特征
逐步回歸是將變量逐個引入,如果原變量由于新變量的引入不再顯著則將其刪除,直到沒有顯著變量引入回歸方程,也沒有不顯著變量刪除為止。相關研究表明[18-19],上一時段空氣質量指數對下一時段空氣質量指數具有顯著影響,使用氣溫、相對濕度、降水、風速、氣壓、上一時段空氣質量指數及同一時段空氣質量指數逐時數據,利用逐步回歸方法構建AQI與氣象因子的關系模型為:y=7.671+0.935X1+0.03X2-1.586X3,其中,X1、X2、X3分別代表上一時段空氣質量、相對濕度、風速。
同一個氣象因子在不同時間尺度對空氣質量指數的影響具有雙重性,固定參數模型易產生誤差。神經網絡具有良好的容錯性,現在以氣溫、相對濕度、降水、風速、氣壓、上一時段空氣質量指數為自變量,空氣質量指數為因變量,以2017年1月—2019年10月數據為訓練模型,以2019年11—12月數據為模擬期,構建神經網絡模型。
圖5給出了兩種不同模擬方法的擬合結果,兩種模型都有一定的模擬效果,但相比逐步回歸分析,神經網絡模擬值更趨向對角線集中,決定系數R2由0.9提高到0.94,相關系數由0.92提高到0.97,模擬準確率由91%提高到94%,平均絕對誤差由11.08降到8.63,神經網絡模型模擬效果更佳。

圖5 逐步回歸分析模型(a)和神經網絡模型(b)的擬合結果
兩種不同模擬結果,誤差均呈正態分布(圖6),兩種模擬結果誤差主要集中在20以內,其中逐步回歸分析模擬結果誤差<20的概率為90%,神經網絡模擬結果誤差概率提高到93%,說明神經網絡方法構建的氣象因子與空氣質量指數關系模型的誤差更集中。

圖6 逐步回歸分析模型和神經網絡模型誤差分布的正態曲線
選取太原市2020年1月空氣質量及氣象逐時數據,對兩種模型進行分級檢驗。2020年1月太原市出現多次空氣污染,輕度級以上污染占全月的68%。以空氣質量指數實況值及模擬值100為分界線(輕度污染指數閾值),將模擬結果散點圖分成4個區域(圖7),分別為Ⅰ、Ⅱ、Ⅲ、Ⅳ,對應的散點落在各自區域的點數分別計為a、b、c、d,利用對應公式,分別計算TS評分、漏報率和空報率,結果見表4。由表4可知,兩種模型的TS評分都在0.9以上,漏報率都在10%以下,都有一定的模擬效果,但相比逐步回歸模型,神經網絡模型TS評分由0.92提高到0.94,漏報率由8%降到5%,空報率由17%降到13%,神經網絡模型模擬效果更佳,為太原地區治理大氣污染提供決策依據。

圖7 對于2020年1月兩種不同模型的擬合結果

表4 兩種不同模型的分級檢驗
(1)2017—2019年,太原地區空氣質量6個等級均出現過,其中,良占比最大,為51.9%,輕度污染占24.3%,優占12.1%,嚴重污染出現次數最少,為1.9%。1、12月空氣質量較差,嚴重污染等級分別高達10.9%、5.1%,8月空氣質量最好,優等級占25.2%。1—2月太原地區首要污染物為PM2.5,其它月以PM10為主。太原地區11月—次年2月為空氣質量易污染月,AQI均值在100以上。
(2)氣象因子AQI的影響具有雙重性,在不同時間尺度上表現為顯著的正相關或負相關。氣溫和AQI在1—2月,9月—次年2月表現為顯著負相關,5—8月呈顯著正相關。相對濕度和AQI在8月—次年3月表現為顯著正相關且相關系數較大,6—7月呈顯著負相關。風速和AQI在8月—次年3月表現為顯著負相關且為強相關,5—7月為正相關。降水與AQI主要表現為負相關,5—11月通過-0.01的顯著性檢驗,每年12月—次年2月為極弱正相關。氣壓和AQI主要表現為顯著負相關。
(3)在易污染月,太原地區空氣質量以良為主,占比為40.7%;其次為輕度污染,占比為24.8%;嚴重污染最少,為4.6%。隨著空氣質量的惡化,平均氣溫、風速、氣壓逐漸降低,相對濕度均值升高。在易污染月,相對濕度、風速與AQI的相關系數較高,分別為0.724、-0.622,表現為強相關,選取個例也表明AQI受相對濕度、風速影響較大。
(4)利用逐步回歸和神經網絡構建氣象因子與空氣質量指數關系模型,與逐步回歸模型相比,神經網絡模型相關系數由0.92提高到0.97,準確率由91%提高到94%,TS評分由0.92提高到0.94,神經網絡模型模擬效果更佳,為太原地區治理大氣污染提供重要的決策依據。