陳 強,梅 琨,朱慧敏,蔡賢雷,張明華,2
1.溫州醫科大學水環境應用技術研究所,浙江 溫州 325035
2.加州大學戴維斯分校陸地、大氣與水資源系,美國戴維斯 CA 95616
顆粒物泛指以固態或液態懸浮在氣體中的氣溶膠粒子。當顆粒物的空氣動力學當量直徑小于或等于 2.5 μm時,則被定義為細顆粒物,即PM2.5,也稱可入肺顆粒物。細顆粒物在地球大氣成分中組分很少,但由于其對人體健康、大氣環境可能帶來的嚴重危害,已引起政府和公眾的極大關注。流行病學研究證實,顆粒物會對呼吸系統和心血管系統造成傷害,導致肺癌、心血管疾病、出生缺陷甚至過早死亡[1-2]。當大氣中PM2.5濃度每增加10 μg/m3時,人的總死亡風險會上升4%[3]。大氣環境科學領域研究發現,細顆粒物是大氣能見度下降的主要原因,在部分地區對消光系數的貢獻可達80%以上[4]。此外,PM2.5還會給氣候變化、植物生長和生態系統帶來一定影響[5]。
國外20世紀80年代初便已系統開展了對細顆粒物的研究[6-7],并制定了嚴格的國家空氣質量標準對污染源加以控制。中國相關研究起步較晚,大多數研究側重PM2.5的化學組成[8-9]、來源解析[10-11]以及其與氣象因子之間的關系[12]。胡偉等[13]通過在廣州地區采樣,從 PM2.5的化學構成角度分析了廣州2010年亞運會期間顆粒物的污染特征。由于細顆粒物污染具有明顯空間性和時效性,針對某一地區或某一時段進行的PM2.5濃度相關研究,并不能簡單套用到另一區域。Shi等[14]在研究香港地區PM2.5變化特征時發現,觀測期間PM2.5濃度在早晚人行高峰期呈顯著的雙峰模式,且工作日污染比周末更為嚴重,證明局部PM2.5濃度受人類活動影響較大。而在黃鶴等[15]對天津市顆粒物污染的研究中,發現天津地區工作日與周末期間污染物并未出現顯著差別。
此外,傳統研究普遍通過大氣環境定點監測的方式獲取城市PM2.5濃度,然而各監測點觀察結果只能表征其周圍一定半徑范圍內的PM2.5分布情況,難以直觀反映整個區域的污染特征,為此需要借助空間插值方法和模型對城市連續空間曲面PM2.5濃度進行模擬與預測。關于空間插值,常用方法有反距離權重、趨勢面、克里格插值等[16-17]。關于PM2.5的預測模型,目前主要有數值模型和統計模型兩種。翟崇治[18]利用Calpuff模型,結合地形數據、氣象數據、污染源數據,對重慶主城區的灰霾進行了模擬和預測,得到較為可靠的結果。同類模型如多尺度空氣質量模型(Models-3/CMAQ)在國外也得到良好應用。由于數值模型復雜,對數據要求嚴格,在一些基礎資料缺乏地區的應用往往受限。統計模型則體現了自身的經濟易用性。在新興的BP神經網絡模型(BP-ANN)應用中,孫德智[19]選取氣象因子對北京城區夏季O3濃度進行短期預測,取得較好的預測結果。同類文獻[20-23]亦表明,以氣象因子等為參數的 BP神經網絡模型在大氣抽樣預測中,容易實現精準預測,且精度優于回歸模型等其他統計預測方法。
為此,本研究以中西部重工業城市鄭州為研究對象,利用統計學原理和地理信息系統(GIS)技術,分析了鄭州市PM2.5的時空分布特征,并結合氣象因子建立BP-ANN模型,對鄭州市PM2.5濃度污染進行短期預測模擬,為公眾更好地了解鄭州地區顆粒物污染現狀及職責部門制定針對性防治措施提供理論依據。
鄭州市位于河南省中北部,地理區域范圍為東經 112°42'~114°14'、北緯 34°16'~34°58',北臨黃河,西依嵩山,東、南接黃淮平原。鄭州市市區位于平原地帶,地表起伏平緩。目前該市共設有9個大氣監測站,包括市監測中心、河醫大、煙廠、鄭紡機、銀行學校、供水公司、經開區管委、四十七中,以及1個對比監測站崗里水庫。2012年12月市環保局正式對公眾發布9個監測站點數據。本研究中,所用PM2.5數據采集自國家環保部推出的“全國城市空氣質量實時發布平臺”,記錄時段為2013年8月17日—12月31日,每天連續24 h監測,所采集數據為每小時平均值。同期地面溫度、相對濕度、平均海平面氣壓、風速、降雨量等氣象資料來自美國Weather Underground公司網站存檔數據和中國氣象科學數據共享中心。此外,基礎地理數據主要包括各測站經緯度坐標、鄭州市基礎地圖(ArcGIS Online數據)等。
由各測站PM2.5小時濃度計算對應時段鄭州市總體污染水平,利用單變量方差分析方法[24],對鄭州市PM2.5濃度日變化特征和周末效應進行研究。為降低缺失數據的干擾,對每天觀測數據量少于12組的予以舍去。
結合地理數據,利用GIS空間分析中的反距離權重(IDW)算法[25]對各監測站PM2.5濃度進行插值,模擬出該市細顆粒物污染空間分布等級,并在GIS系統(ArcGIS 10.0)中進行可視化表達。

式中:zp是未知點p的估計值;zi是控制點i的z值,具體在本研究中即各測站的PM2.5濃度;di是控制點i與點p間的距離;n是在估算中用到的控制點數目;k是確定的冪。
2.2.1 訓練數據準備
選擇鄭州市每日的平均氣溫、相對濕度、風速、平均海平面氣壓、日照時數5項因子,考慮到降雨對PM2.5污染的沖刷作用及兩日間的關聯效應,添加了五日內降雨量、前一日的PM2.5濃度均值2個變量共7項指標作為BP-ANN預測模型的輸入因子,由各測站小時實測數據計算整個鄭州市日平均PM2.5濃度,作為輸出因子。
所有輸入/輸出數據采集自2013年8—12月,以日為單位共得到137組樣本。隨機抽取80%(N=106)作為訓練數據,用于構建BP-ANN預測模型;將剩余20%(N=31)作為模型的驗證數據。對所有數據進行歸一化,限定在[-1,1]區間內,以消除各維數據間的數量級差別。
2.2.2 預測模型的構建與訓練
Robert Hecht-Nielsen證明,在不限制隱含層節點數的情況下,含有一個隱含層的3層BP網絡可以實現任意非線性映射[26]。本研究即采用此種結構,通過模型自動尋優確定隱含層最佳節點數為14,構建PM2.5濃度BP神經網絡預測模型結構,其中傳遞函數、學習算法等具體網絡參數設置見表1。所有過程均通過Matlab編程實現。IDW插值是GIS中常用的精確插值方法,基本原理是假設未知值的點受近距離控制點的影響比遠距離控制點的影響更大,其通用方程為

表1 BP-ANN預測模型的結構參數
2.2.3 模型評價與驗證
對所構建的BP-ANN模型,通過擬合一致性指標(D)[27]、相關系數(r)、平均偏差(MBE)、平均絕對誤差(MAE)、均方根誤差(RMSE)共5項因子(各自計算公式見式(2)~式(6))進行模型評價。同時采用逐步回歸方法,構建一個多元線性模型用于比較。利用驗證數據分別檢驗兩模型的擬合度和穩定性。

式(2)~ 式(6)中:Oi為 PM2.5濃度實測值,為PM2.5濃度實測值的平均值,Pi為PM2.5濃度預測值,為PM2.5預測值的平均值。
圖1給出了周末、工作日與國慶節不同時期PM2.5濃度的日變化趨勢。從相似性角度分析,各時期細顆粒物污染日變化均具有明顯單峰分布特征,日平均波動幅度為37%,變化顯著。從早晨開始,隨著人類活動的加劇,機動車燃料不完全燃燒,PM2.5濃度逐漸積累并于上午11:00左右出現峰值;此外,觀測期間以秋冬兩季為主,水平方向上靜風現象及垂直方向上逆溫現象經常發生,亦加重了清晨后污染物的累積。隨著白天太陽輻射逐漸增強,近地面大氣混合層高度增加,為顆粒物的擴散提供了有利條件,導致下午13:00—17:00污染逐步減輕。夜間23:00、0:00時PM2.5濃度較高,可能與夜間行駛的機動車多為柴油重型車有關。

圖1 鄭州市總體PM2.5濃度日變化趨勢及周末效應研究
從差異性角度分析,國慶節期間鄭州市整體細顆粒物污染日變化顯著,高出周末和工作日平均污染濃度的32.8%,這可能與長假出行車輛增多關系密切。據不完全統計,2013年國慶節期間鄭州主要高速收費站車流量達230萬輛以上,共接待游客995萬人次,遠高于平日。通過單變量方差分析和成對比較(表2),可以認為周末、工作日均與國慶節時期的PM2.5濃度均值有顯著差異(P<0.01),國慶節期間空氣污染更為嚴重。工作日與周末兩個時期在圖1中相比,PM2.5濃度表現出前者高后者低的現象,這可能是由于工作日交通流量大、市民出行頻繁,周末人類活動程度相對較低所致;然而從統計學角度分析,兩者總體均值無顯著差異(P=0.146>0.05),尚不能認為鄭州地區PM2.5濃度存在明顯“周末效應[28]”。出現該結果的原因則可能是抽樣誤差的偶然性,導致犯了統計學中的“取偽”錯誤[29],后期可通過延長觀測時期來增加樣本量加以改善。

表2 成對比較
采用IDW算法,通過ArcGIS軟件中的空間分析模塊對已知監測站進行插值,生成鄭州地區PM2.5濃度連續曲面,進行符號化處理后得到鄭州市細顆粒物污染空間分布圖(圖2),并對9個測站數據進行統計分析(表3)。
分析圖2、表3可知,觀測期間鄭州市以金水區、管城回族區為兩個污染中心,其中鄭紡機、經開區管委兩測站 PM2.5平均濃度最高,分別達(138.3±92.0)μg/m3、(130.3 ± 76.8)μg/m3,與2012年國家制定的《環境空氣質量標準》(GB 3095—2012)日均二級濃度限值75 μg/m3相比,兩者的超標天數均為102 d,占74.5%;二七區(河醫大測站附近)污染程度較低,超標率為37.2%;位于遠郊的對比監測點崗里水庫,其平均PM2.5濃度并未隨距市中心的距離增大而降低,反而基本持平于觀測期間鄭州市109.4 μg/m3的總體污染水平。

圖2 觀測期間鄭州市PM2.5污染分布圖

表3 鄭州市各測站觀測期間PM2.5日均濃度描述統計
結合本研究觀測時期特點,城郊及北部農村谷類、豆類農作物在夏秋兩季正值收獲時節,秸稈焚燒現象時有發生[30],且崗里水庫附近戶外燒烤成風,均對該地區PM2.5濃度存在重要貢獻;市中心地帶受11月開始的燃煤供暖、密集交通、其他點源污染影響,污染物排放增加,且觀測期間鄭州市大氣環境經常性處于穩定狀態,湍流運動不明顯,空氣對流運動弱,不易于污染物的擴散稀釋,以及由此生成的二次硫酸鹽、二次硝酸鹽等粒子增多,造成了更為嚴重的二次污染。此外,觀測期間,鄭州城區多處進行的地鐵施工、大型建筑施工等建設所產生的揚塵、水泥塵對PM2.5濃度貢獻也不容忽視。根據鄭州市環保局統計數據,鄭州市燃煤對霧霾的平均貢獻率為41%,其次為揚塵、機動車尾氣,分別占28%、24%。
表4給出了構建BP-ANN模型的輸入因子與輸出因子間的Pearson相關系數,除五日內降雨量因子外,其余因子均通過了顯著性檢驗(P<0.05)。結合具體氣象數據,所有測站最大的PM2.5濃度值均出現在風速低于1 m/s、能見度低于1 km、持續濃霧的天氣中,而最小的PM2.5濃度值則出現在降雨過后的1—4 d內、風速大于3.3 m/s、能見度大于15 km的晴天,表明PM2.5濃度在一定程度上受氣象條件影響,驗證了通過氣象數據預測細顆粒物污染程度的合理性。

表4 預測因子與目標值間的相關系數
為了更好驗證所構建BP-ANN模型的優劣,采用逐步回歸方法,在SPSS中構建多元線性回歸模型用于比較,其最優方程為

式中:x1為由各測站計算出的整個鄭州市前一日PM2.5平均濃度(μg/m3),x2為風速(km/h),x3為平均海平面氣壓(hPa)。
分別將31組驗證數據帶入BP-ANN模型和逐步回歸模型,對各模型的預測值和實際監測值進行對比,結果如圖3、圖4所示。
通過計算兩模型的評價指標發現(見表5),在建模階段,BP-ANN模型的擬合一致性指標取值(D=0.944)更接近于1,表明在建模階段該取值更好地學習了樣本規律;在驗證階段,兩模型與觀測值的Pearson系數相近,但多元線性回歸模型的一致性指標(D=0.794)低于 BP-ANN模型(D=0.854),且其平均偏差和均方根誤差均高于后者;分析整個過程(圖5),所構建的BP-ANN模型的預測結果與實際監測值的線性擬合能力(R2=0.759)優于回歸模型(R2=0.667)。綜上,所構建的BP神經網絡預測結果能更為精確地模擬鄭州市細顆粒物污染濃度的分布,擬合效果更好。
從圖3、圖4亦可看出,在驗證樣本觀測日期為2013年12月18、26日處,兩模型預測結果擬合度較差。結合同期氣象數據,發現12月16—25日均為濃霧天氣,18、26日前3日平均風速分別為1.3、1 m/s,PM2.5平均濃度分別為259.7、357.4 μg/m3。而18日當天,鄭州地區出現了降雪,平均風速為3.5 m/s,26日為晴天,風速達4.2 m/s,兩日 PM2.5濃度驟降至 75 μg/m3以下。這表明氣象因素是兩日PM2.5迅速下降的主要原因,同時也反映出在處理變異點問題上,所構建的BP-ANN模型的準確度尚待改進,這也是本研究今后所需開展的方向。

圖3 BP-ANN模型PM2.5濃度預測值與實測值對比

圖4 多元線性回歸模型PM2.5濃度預測值與實測值對比

表5 BP-ANN預測模型的評價指標

圖5 BP-ANN模型(左)和多元線性回歸模型(右)建模與驗證階段預測值與實測值散點圖
通過對觀測期間鄭州市PM2.5濃度進行統計,結合氣象數據、基礎地理數據進行綜合分析,得到如下結論:
1)觀測期間鄭州市PM2.5平均濃度為109.4 μg/m3,按PM2.5日二級標準評價,鄭州市PM2.5日均值超標天數88 d,超標率為64.2%。其中,中度以上污染占污染日的33.1%,污染情況不容樂觀。
2)鄭州市PM2.5濃度日變化呈單峰模式,受逆溫現象和污染累積影響于上午11:00出現峰值,下午13:00—17:00逐漸下降。國慶節期間顆粒物污染程度顯著高于平日,表明人為活動的加劇影響PM2.5的排放;周末效應則不明顯。鄭州市PM2.5濃度空間變化中,金水區、管城回族區污染最為嚴重,工業燃煤、地鐵施工等源排放是造成其污染的主要原因;位于遠郊的崗里水庫,受秸稈焚燒和市區污染輸送等影響,亦造成PM2.5濃度的居高不下。
3)在氣象因素中,風速、相對濕度、平均海平面氣壓是影響鄭州市PM2.5濃度的主要因子,驗證了通過氣象數據預測細顆粒物污染程度的科學性。相對于傳統回歸模型,BP-ANN模型在用于鄭州市PM2.5濃度擬合驗證中擬合一致性指標達0.854,具備更好的短期預測能力。
[1]Ostro B,Feng W Y,Broadwin R,et al.The impact of components of fine particular matter on cardiovascular mortality in susceptible subpopulations [J].Occupational and Environ Medicine,2008,65,750-756.
[2]Rich D Q,Kipen H M,Huang W,et al.Association between Changes in Air Pollution Levels during the Beijing Olympics and biomarkers of inflammation and thrombosis in healthy young adults[J].Journal of the American Medical Association,2012,307(19):2 068-2 078.
[3]Pope C A 3rd,Burnett R T,Thun M J,et al.Lung cancer, cardiopulmonary mortality, and long-term exposure to fine particulate air pollution[J].Journal of the American Medical Association,2002,287(9):1 132-1 141.
[4]Zhang Y H,Hu M,Zhong L J,et al.Regional integrated experiments on air quality over Pearl River Delta 2004(PRIDEPRD2004):Overview [J].Atmospheric Environment,2008,42(25):6 155-6 156.
[5]美國環境保護局,聯邦環境評估中心辦公室,美國環境保護局研究和發展辦公室.顆粒物環境空氣質量USEPA基準[M].北京市環境保護局,北京市環境保護科學研究院,北京市環境保護監測中心,譯.北京:中國環境科學出版社,2008:365-380.
[6]楊洪斌,鄒旭東,汪宏宇,等.大氣環境中PM2.5的研究進展與展望[J].氣象與環境學報,2012,28(3):77-82.
[7]Liu Y,Paciorek C J,Koutrakis P.Estimating regional spatial and temporal variability of PM2.5concentrations using satellite data,meteorology, and land use information [J].Environmental Health Perspectives,2009,117(6):886-892.
[8]楊復沫,段鳳魁,賀克斌.PM2.5的化學物種采樣與分析方法[J].中國環境監測,2004,20(5):14-20.
[9]姜偉,董海燕,陳魁,等.天津市PM2.5中水溶性離子組分特征[J].中國環境監測,2013,29(3):39-43.
[10]董海燕,古金霞,陳魁,等.天津市區PM2.5中碳組分污染特征及來源解析[J].中國環境監測,2013,29(1):34-38.
[11]汪偉峰,俞杰,許丹丹,等.寧波市區冬季大氣顆粒物及其主要組分的污染特征分析[J].中國環境監測,2013,29(5):43-46.
[12]朱倩茹,劉永紅,徐偉嘉,等.廣州PM2.5污染特征及影響因素分析[J].中國環境監測,2013,29(2):15-21.
[13]胡偉,胡敏,唐倩,等.珠江三角洲地區亞運期間顆粒物污染特征[J].環境科學學報,2013,33(7):1 815-1 823.
[14]Shi W,Wong M S,Wang J,et al.Analysis of airborne particulate matter(PM2.5)over Hong Kong using remote sensing and GIS[J].Sensors,2012,12:6 825-6 836.
[15]黃鶴,蔡子穎,韓素芹,等.天津市 PM10,PM2.5和PM1連續在線觀測分析[J].環境科學研究,2011,8:897-903.
[16]Chang K T.地理信息系統導論[M].陳健飛,譯.北京:清華大學出版社,2009:310-330.
[17]李海濤,賈增輝.基于地理信息系統的空間插值算法研究[J].計算機光盤軟件與應用,2013,49-51.
[18]翟崇治.城市灰霾監測與研究初探:以重慶市主城區為例[M].重慶:西南師范大學出版社,2012:111-130.
[19]孫德智.城市交通道路環境空氣質量監測與評價[M].北京:中國環境科學出版社,2010:295-330.
[20]Grivas G,Chaloulakou A.Artificial Neural network models for prediction of PM10hourly concentrations,in the Greater Area of Athens,Greece [J].Atmospheric Environment,2006,40(7):1 216-1 229.
[21]Saleh M,Sabah A,Charles S.Combining principal component regression and artificial neural networks for more accurate predictions of ground-level ozone[J].Environmental Modelling & Software,2008,23(4):396-403.
[22]沈路路,王聿絢,段雷.神經網絡模型在O3濃度預測中的應用[J].環境科學,2011,32(8):2 231-2 235.
[23]張靜,李旭祥,許先意,等.大氣環境數據分析預測方法對比研究[J].中國環境監測,2010,26(6):66-69.
[24]李志輝,羅平.PASW/SPSS Statistics中文版統計分析教程[M].3版.北京:電子工業出版社,2010:206-236.
[25]許民,王雁,周兆葉,等.長江流域逐月氣溫空間插值方法的探討[J].長江流域資源與環境,2012:327-334.
[26]傅薈璇,趙紅.MATLAB神經網絡應用設計[M].北京:機械工業出版社,2010:90-91.
[27]Wang Z Q,Chen Y S,Qi B,et al.Prediction of daytime variations of HO2radical concentrations in the marine boundary layer using BP network[J].Science China(Chemistry),2010:2 616-2 621.
[28]鄭秋萍,王宏,林長城,等.海峽西岸沿海城市群大氣污染物濃度特征及其與天氣形勢的關系[J].環境科學學報,2013,33(2):356-363.
[29]劉春英.應用統計學[M].北京:中國金融出版社,2007:145-152.
[30]鄭有飛,田宏偉,陳懷亮,等.河南省夏季秸稈焚燒污染物排放量的估算與分析[J].農業環境科學學報,2010,8:1 590-1 594.