曲 凱 王林林 吳 雪 游家慧(.山東省環(huán)境信息與監(jiān)控中心,山東 濟南 500;.濱州學院建筑工程學院,山東 濱州 56600;.南京恩瑞特實業(yè)有限公司,江蘇 南京 06)
山東省環(huán)境空氣質量動力統(tǒng)計預報系統(tǒng)
曲 凱1王林林2吳 雪3游家慧3
(1.山東省環(huán)境信息與監(jiān)控中心,山東 濟南 250101;
2.濱州學院建筑工程學院,山東 濱州 256600;3.南京恩瑞特實業(yè)有限公司,江蘇 南京 211106)
以山東省17個城市2014年至2015年環(huán)境空氣質量監(jiān)測指標和同步的氣象觀測數(shù)據(jù)為基礎,采用線性回歸和神經網絡方法建立統(tǒng)計預報模型,構建山東省環(huán)境空氣質量動力統(tǒng)計預報系統(tǒng)。該系統(tǒng)實現(xiàn)了業(yè)務化自動運行,對山東省17城市的6項污染物指標(PM2.5、PM10、NO2、SO2、CO日均濃度和O3日最大 8小時滑動平均濃度)和AQI指數(shù)進行逐日預報。預報結果能較好的反應各市空氣質量的變化趨勢,為預報業(yè)務提供參考。
環(huán)境空氣質量;統(tǒng)計預報;線性回歸;神經網絡;山東省
環(huán)境空氣質量的預報和發(fā)布,為環(huán)境管理和決策部門提供科學依據(jù),尤其能在重污染天氣到來前及時發(fā)出預警并采取限制措施,減輕對市民健康的危害。因此受到各地政府和大氣環(huán)境部門重視。
空氣污染預報是一項復雜的系統(tǒng)工程,目前國際上對空氣污染物濃度預報的方法有兩種:統(tǒng)計預報和數(shù)值預報。統(tǒng)計預報是指利用空氣質量和氣象參數(shù)等歷史觀測資料建立大氣污染物濃度與氣象條件或非氣象條件間的相關性、趨勢性、延續(xù)性等統(tǒng)計關系,建立擬合方程或統(tǒng)計模型,從而外推得到對未來空氣質量的預報結果[1]。數(shù)值預報依賴于源清單、大氣動力過程和化學機制等,相比數(shù)值預報模式,統(tǒng)計預報方法比較簡便、經濟,易于實現(xiàn)。孫峰[2]、王建鵬等}、魏璐等[4]、劉閩等[5]分別研究建立了北京、西安、鄭州、沈陽等地的城市空氣質量統(tǒng)計預報系統(tǒng),就統(tǒng)計預報技術方法、預報結果檢驗、預報技術改進等方面進行了探討。目前的統(tǒng)計預報業(yè)務系統(tǒng)多使用回歸方法建立模型,神經網絡模型的業(yè)務應用有待進一步研究開展。
環(huán)境空氣質量與氣象因素緊密相關,環(huán)境空氣質量的好壞從一定程度上取決于大氣擴散條件的優(yōu)劣。當某種污染物排放到空氣中后,污染物在空氣中的濃度由污染源的排放量和大氣的稀釋擴散條件兩個因素決定。在一段時間內,整個城市污染物的排放總量是相對穩(wěn)定的,視污染源為“準定常”,那么污染物濃度的高低主要取決于當時的氣象條件,當氣象條件有利于污染物擴散時,污染濃度低;反之則濃度高[6]。
山東省環(huán)境空氣質量統(tǒng)計預報將污染物排放視為相對恒定不變的,通過累積2014年至2015年的空氣污染物濃度監(jiān)測值和同步的氣象觀測資料,分別使用多元線性回歸和人工神經網絡的方法,建立兩者相關關系模型,通過這些定量關系,根據(jù)天氣預報的預測結果和空氣質量現(xiàn)狀來預測未來空氣質量,包括PM2.5、PM10、NO2、SO2、CO日均濃度和O3日最大 8小時滑動平均濃度等六項污染指標。該統(tǒng)計預報系統(tǒng)假設污染源是不變的或者變化很小,污染水平受氣象條件控制。但污染源顯然會發(fā)生變化,故采用動態(tài)的方法建立預報模型,及時剔除失效的數(shù)據(jù)、加入新生的數(shù)據(jù),是減小預報誤差的重要因素。
山東省空氣質量動力統(tǒng)計預報系統(tǒng)采用多元線性回歸和神經網絡相結合的動力統(tǒng)計預報技術,包括兩大功能模塊:統(tǒng)計預報模型建立和動態(tài)更新模塊,以及統(tǒng)計預報業(yè)務預報模塊,如圖 1。

圖1 山東省環(huán)境空氣質量動力統(tǒng)計預報系統(tǒng)
統(tǒng)計預報模型建立和動態(tài)更新模塊,負責收集歷史環(huán)境監(jiān)測和氣象觀測數(shù)據(jù),經過預處理,使用不同統(tǒng)計預報方法建立預報模型;將新生的污染樣本及氣象樣本及時加入到預報數(shù)據(jù)集,使模式系統(tǒng)能夠反映變化中的污染狀況;同時通過對模式預報結果準確性的檢驗,對預報系統(tǒng)做出調整,實現(xiàn)對預報模型進行動態(tài)更新。
統(tǒng)計預報業(yè)務預報模塊,負責收集預報前一天和當天的環(huán)境監(jiān)測實況數(shù)據(jù)和氣象數(shù)值預報數(shù)據(jù),經過預處理,代入統(tǒng)計預報模型建立和動態(tài)更新模塊所建立的統(tǒng)計預報模型,實現(xiàn)動力和統(tǒng)計預報相結合的動力統(tǒng)計預報;并對預報結果進行分析和檢驗,同時將檢驗結果反饋給統(tǒng)計預報模型建立和動態(tài)更新模塊。統(tǒng)計預報結果作為客觀預報參考產品之一在山東省空氣質量預報預警系統(tǒng)平臺上進行展示,為業(yè)務預報提供參考。
2.1 資料來源
山東省144個國控和省控環(huán)境監(jiān)測站點監(jiān)測數(shù)據(jù),包括2014年至今的PM2.5、PM10、SO2、O3、NO2和CO等6項污染物的逐小時濃度值。數(shù)據(jù)用于統(tǒng)計預報模式建立和動態(tài)更新,以及每日的業(yè)務預報。
山東省123個氣象地面站觀測數(shù)據(jù),包括2014年至今的地面氣壓、氣溫、風速、風向、相對濕度、能見度、降水量等要素的逐小時觀測值。該數(shù)據(jù)用于統(tǒng)計預報模式建立和動態(tài)更新。
NCEP再分析資料,包括2014年至今的云量、地表粗糙度、向下太陽輻射通量,及各等壓面的氣溫、相對濕度、風場UV分量、垂直速度等變量的逐6小時再分析數(shù)據(jù)。該數(shù)據(jù)用以彌補高空氣象觀測數(shù)據(jù)及氣象地面站觀測數(shù)據(jù)變量的不足,用于統(tǒng)計預報模式建立和動態(tài)更新。
山東省空氣質量預報預警系統(tǒng)獲取的中國環(huán)境檢測總站下發(fā)的WRF模式氣象預報數(shù)據(jù),山東區(qū)域水平分辨率15km,包括10米風場UV分量、2米溫度、2米相對濕度、降水量、海平面氣壓、邊界層高度、地面向下太陽輻射,以及4個高度層的風場UV分量、垂直速度、氣溫、氣壓、高度和相對濕度等變量的逐小時數(shù)據(jù)。該數(shù)據(jù)用于每日的業(yè)務預報。
2.2 資料預處理
資料預處理包括數(shù)據(jù)規(guī)整、異常值處理、格點數(shù)據(jù)處理、數(shù)據(jù)格式轉換、城市數(shù)據(jù)計算、日值計算等。數(shù)據(jù)規(guī)整是指將收集到的站點數(shù)據(jù)進行整理,以缺省值補全缺測時次;異常值處理指去除數(shù)據(jù)中的負值和異常大值,以缺省值代替;格點數(shù)據(jù)處理值將NCEP再分析數(shù)據(jù)和WRF預報數(shù)據(jù)等格點數(shù)據(jù)提取到相應站點;數(shù)據(jù)格式轉換指將所有觀測數(shù)據(jù)和實況數(shù)據(jù)、站點數(shù)據(jù)和格點數(shù)據(jù)轉換為統(tǒng)一格式;城市數(shù)據(jù)計算指根據(jù)統(tǒng)計預報城市預報需要,將山東省所有監(jiān)測站分別按所屬城市計算城市平均值;日數(shù)據(jù)計算指根據(jù)統(tǒng)計預報逐日預報的需要,計算2014年至2015年逐日數(shù)據(jù),PM2.5、PM10、SO2、NO2和CO計算日均值,O3逐日取8小時滑動平均值的最大值。
2.3 氣象因子及相關性分析
空氣污染是一個非常復雜的系統(tǒng),從污染源排放到擴散輸送、大氣中的轉化,再到沉降,影響因素眾多,包括前期污染場分布、同期污染源排放和同期氣象場作用。在一定時期內污染源排放量相對穩(wěn)定,而氣象條件對污染物濃度的短期變化的影響更為顯著,因此統(tǒng)計預報方法忽略污染源排放變化的影響,主要考慮未來天氣形勢和氣象條件等因素對空氣質量變化趨勢的影響。因此,氣象影響因子的選擇對統(tǒng)計預報模型的建立和預報準確性至關重要。
為了廣泛尋找氣象因子,選擇以下37個因子與空氣質量進行相關性分析:日均總云量、日主導風向、日均風速、日均海平面氣壓、日低云量、日均露點、日均溫度、日均相對濕度、日最大風向、日最大風速、日最大溫度、日最低溫度、日累計降水、08時總云量、08時風向、08時風速、08時海平面氣壓、08時3小時變壓、08時低云量、08時露點溫度、08時溫度、08時相對濕度、08時溫度露點差、08時24小時變壓、08時24小時變溫、14時總有能量、14時風向、14時風速、14時海平面氣壓、14時3小時變壓、14時低云量、14時露點、14時溫度、14時相對濕度、14時低云高、14時穩(wěn)定度和14時混合層高度。經計算可知,山東省空氣質量和海平面氣壓、變壓、云量、云底高、濕度、溫度、降水、穩(wěn)定度和混合層高度等因子具有較顯著的相關性。
3.1 多元線性回歸模型構建
線性預報模型是基礎模型,是了解氣象條件和污染水平之間關系的重要方法。多元線性回歸針對某一預報量(某一種污染物濃度),研究多個因子與它的定量統(tǒng)計關系。山東省環(huán)境空氣質量統(tǒng)計預報系統(tǒng)采用逐步回歸算法,從上述影響污染物濃度的因子中選取顯著的影響因子,即根據(jù)一定的顯著性標準,每步引入一個變量進入回歸方程,逐步回歸時,由于新變量的引進,可使已進入回歸方程的變量變得不顯著,在下一步給以剔除,從而最終建立污染物濃度的“最優(yōu)”回歸方程。
使用逐步回歸算法,根據(jù)α=0.01顯著水平的F檢驗,按分城市、分季節(jié)(春季3-5月、夏季6-8月、秋季9-11月、冬季12-2月)、分污染物建立了山東省17地市的408個回歸方程。
例如,濟南冬半年PM2.5濃度的回歸方程為:
PM2.5jn-win=45.1887+0.5176PM2.5-1d-5.369Tdif+


濟南夏半年O3日最大8小時滑動平均濃度的回歸方程為:
O3jn-sum=0.2299+0.4015O3-1d-2.037DH08+7.3395Tmax+0.0075815Pd24-4.8211T08
式中,O3jn-sum為預報日O3日最大8小時滑動平均濃度,O3-1d為前一日O3日最大8小時滑動平均濃度,DH08為08時逆溫層高度,Tmax為日最高溫度,Td24為日變壓,T08為08時溫度。
山東省環(huán)境空氣質量統(tǒng)計預報系統(tǒng)具有動態(tài)的特性。逐日新生的污染樣本及氣象樣本會及時地自動加入到系統(tǒng)數(shù)據(jù)集中,重新運行回歸方程建立模塊,對預報系統(tǒng)進行調整,使其能夠反映變化中的污染狀況;另一個途徑是通過對模型預報結果準確性的檢驗,發(fā)現(xiàn)模型系統(tǒng)存在的問題,對模型系統(tǒng)做出調整。
3.2 神經網絡模型構建
為了建立更加準確的統(tǒng)計預報模型,預報系統(tǒng)采用人工神經網絡等非線性方法進行了補充。BP神經網絡是針對非線性的動力系統(tǒng)的統(tǒng)計預報方法,它通過使用預測因子和預測對象(污染物濃度)以前的歷史資料,求解預測因子與預測對象之間的關系,從而構建預報模型[6-13]。BP神經網絡的輸入層接收來自外界的輸入信息(污染物的影響因子),并傳遞給中間層各神經元;中間層負責信息變換;最后傳遞到輸出層向外界輸出信息處理結果(輸出污染物濃度);當實際輸出與期望輸出(實際污染物濃度)不符時,進入誤差的反向傳播階段,修正各層權值,逐層反傳,此過程一直進行到網絡輸出的誤差減少到可以接受的程度,或者預先設定的學習次數(shù)為止。
山東省環(huán)境空氣質量統(tǒng)計預報系統(tǒng)使用MATLAB構建BP Adaboost神經網絡,即把BP神經網絡作為多個弱分類器,反復訓練BP神經網絡預測樣本輸出,通過Adaboost算法得到多個BP神經網絡分類器組成的強分類器。具體處理步驟包括:(1)輸入歷史數(shù)據(jù)(38個預報因子和1個輸出因子,樣本量為2014-2015年共六百余天日數(shù)據(jù));(2)網絡初始化;(3)弱分類器預測(該系統(tǒng)設置了15個弱分類器);(4)計算預測序列權重;(5)測試數(shù)據(jù)權重調整;(6)強分類函數(shù)生成。

與多元線性回歸方法相似,逐日新生的污染樣本及氣象樣本會及時地自動加入到系統(tǒng)數(shù)據(jù)集中,重新運行預報模型訓練模塊,對預報系統(tǒng)進行調整,使其能夠反映變化中的污染狀況;同時也通過對模型預報結果準確性的檢驗,發(fā)現(xiàn)模型系統(tǒng)存在的問題,對模型系統(tǒng)做出調整。
4.1 預報和實況對比
經過223天逐步回歸預報和55天神經網絡預報,以山東省濟南市為例,對比主要污染物PM2.5日平均濃度、O3日最大8小時滑動平均濃度,及根據(jù)污染物濃度計算而得的空氣質量指數(shù)AQI的預報值和實測值,經計算分析對比結論如下:
(1)逐步回歸模型和神經網絡模型對濟南市PM2.5日平均濃度的統(tǒng)計預報結果和實況比較一致,預報結果與實測值的變化趨勢相類似,能反映出PM2.5日平均濃度的變化規(guī)律。但預報值曲線較實況值曲線更平滑,對極值的預報效果不好。
(2)逐步回歸模型和神經網絡模型對濟南市O3日最大8小時滑動平均濃度的統(tǒng)計預報結果和實況比較一致,預報結果與實測值的變化趨勢相類似,能反映出O3日最大8小時滑動平均濃度的變化規(guī)律,但預報值曲線較實況值曲線更平滑,且較實況偏大,對小值的預報效果不好。
(3)根據(jù)逐步回歸模型和神經網絡模型對濟南市各污染物濃度計算空氣質量指數(shù)AQI,統(tǒng)計預報結果的AQI和實況比較一致,預報結果與實測值的變化趨勢相類似,能反映出AQI的變化規(guī)律。
4.2 預報準確率分析
分別計算逐步回歸模型和神經網絡模型對山東省17地市的主要污染物PM2.5、PM10、O3和AQI的預報結果和實況的平均絕對誤差、平均相對誤差、級別準確率及相關系數(shù)。

相關系數(shù)
其中,P為預測值,O為觀測值,n為總預報天數(shù),m為污染物濃度或AQI實況值和預報值屬于同一IAQI等級或AQI等級的天數(shù)。
經計算可知,逐步回歸模型和神經網絡模型對山東省17地市的主要污染物PM2.5、PM10、O3和AQI的預報均能達到一定的準確性,可以為預報制作提供參考。PM2.5和PM10的預報準確率高于O3,逐步回歸模型預報準確率高于神經網絡模型。
使用2014-2015年山東省17城市的空氣質量監(jiān)測數(shù)據(jù)和同步的氣象觀測數(shù)據(jù),利用線性回歸和神經網絡方法建立了統(tǒng)計預報模型,構建了山東省環(huán)境空氣質量動力統(tǒng)計預報系統(tǒng)。該系統(tǒng)實現(xiàn)了業(yè)務化自動運行,對山東省17城市的6項污染物指標(PM2.5、PM10、NO2、SO2、CO日均濃度和O3日最大 8小時滑動平均濃度)和AQI指數(shù)進行逐日預報。預報結果能較好的反應各市空氣質量的變化趨勢,為預報業(yè)務提供參考。
受歷史數(shù)據(jù)長度有限、環(huán)境監(jiān)測站和氣象地面觀測站點不統(tǒng)一、環(huán)境監(jiān)測站點集中于城區(qū)、數(shù)值天氣預報開展時間晚導致建模和預報使用氣象數(shù)據(jù)不一致等因素,以及統(tǒng)計預報自身的特點和局限性,統(tǒng)計預報系統(tǒng)對極值預報效果較差,O3預報準確率較低,且統(tǒng)計預報系統(tǒng)不穩(wěn)定,還需要進一步改進:
(1)統(tǒng)計預報模型使用數(shù)值天氣預報數(shù)據(jù)計算預報因子,目前使用中國環(huán)境監(jiān)測總站WRF模式預報數(shù)據(jù)。受該數(shù)據(jù)穩(wěn)定性影響,統(tǒng)計預報穩(wěn)定性較差。系統(tǒng)將改善數(shù)據(jù)獲取途徑,或者使用更為穩(wěn)定且分辨率更高的GFS數(shù)據(jù)或本地運行的數(shù)值天氣預報數(shù)據(jù),改善統(tǒng)計預報體統(tǒng)穩(wěn)定性。同時隨著預報天氣數(shù)據(jù)不斷積累,使用氣象預報數(shù)據(jù)進行建模,保證建模和預報數(shù)據(jù)一致。
(2)同一污染物在不同天氣形勢下有不同的相關性好的氣象因子,可以考慮按天氣類型分類分別建立統(tǒng)計預報模型。同時還應對影響空氣質量的直接及間接氣象要素進行研究,深入分析空氣質量變化中物理化學區(qū)域特征及其與氣象要素尤其是大氣邊界層要素的關聯(lián),增強統(tǒng)計因子的大氣物理化學機理認識,更全面考慮空氣質量統(tǒng)計預報因子及其特征[14]。
(3)目前統(tǒng)計預報方法選取預報因子,沒有考慮預報因子之間的相關性,挑選出的預報因子由于非正交,使計算結果不穩(wěn)定,給預報帶來一定誤差。統(tǒng)計預報模型可結合自然正交分解方法選取少數(shù)幾個正交的預報因子,即可獲得要素場空間和時間基本特征信息,改善預報模型[15]。
(4)在預報數(shù)據(jù)不斷積累的基礎之上,分析線性回歸和神經網絡模型的預報特征,使用動態(tài)加權技術對二者預報結果進行融合,提供更加準確的統(tǒng)計預報結果。
[1]中國環(huán)境監(jiān)測總站.環(huán)境空氣質量預報預警方法技術指南[M].北京:中國環(huán)境出版社,2014.23-42.
[2]孫峰.北京市空氣質量動態(tài)統(tǒng)計預報系統(tǒng)[J].環(huán)境科學研究,2004,17(1):70-73.
[3]王建鵬.西安城市空氣質量預報統(tǒng)計方法及業(yè)務化應用[J].陜西氣象,2001,(6):1-3.
[4]魏璐,朱偉軍,陳海山.鄭州市空氣質量統(tǒng)計預報方法探討[J].南京氣象學院學報,2009,32(2):314-320.
[5]劉閩,王帥,林宏,許榮.沈陽市冬季環(huán)境空氣質量統(tǒng)計預報模型建立及應用[J].中國環(huán)境監(jiān)測,2014,30(4):10-15.
[6]Dahe Jiang,Yang Zhang,Xiang Hu,et al.Progress in deceloping an ANN model for an air pollution index forecast [J].Atmospheric Environment,2004,38:7055-7064.
[7]Sang Hyun sohn,etc.Prediction of Ozone Formation Based on Neural Network [J].Envir.Engrg.ASCE,2000,8:688-696.
[8]Jeong-Sook Heo,Dong-Sool Kim.A new method of ozone forecasting using fuzzy expert and neural network systems [J].Science of the Total Environment,2004,325:221-237.
[9]王儉,胡筱敏,鄭龍熙等.基于BP模型的大氣污染預報方法研究[J].環(huán)境科學研究,2002,15(5):62-64.
[10]張宏偉,連鵬,閆曉強.最優(yōu)化權值組合法用于大氣質量中長期預測的研究[J].天津工業(yè)大學學報,2005,24(3):54-57,61.
[11]金龍,陳寧,林振山.基于人工神經網絡的集成預報方法研究和比較[J].氣象學報,1999,57(4):198-207.
[12]金龍,況雪源,黃海洪等.人工神經網絡預報模型的過擬合研究[J].氣象學報,2004,62(1):62-69.
[13]李祥泳,鄧新民.環(huán)境污染預測的人工神經網絡模型[J].成都氣象學院學報,1997,12(4):279-283.
[14]Breiman L,F(xiàn)riedman J H,Olshen R A,et al.Classification and regression trees [M],Monterey CA:Wadsworth and Brookes/Cole,1984.
[15]佟彥超.中國重點城市空氣污染預報及其進展[J].中國環(huán)境監(jiān)測,2006,22(2):69-71.
Statistical Forecast System of Environmental Air Quality in Shandong Province
QU Kai1WANG Linlin2WU Xue3YOU Jiahui3
(1.Shandong Province Environmental Information and Monitoring Center,Jinan 250101,China; 2.Architectural engineering institute of Binzhou University ,Binzhou 256600,China; 3.Nanjing Nriet Industrial Co.,Ltd,Nanjing 211106,China)
Based on the correlation of the 17 cities and its historical environment change of air quality with meteorological factors in Shandong Province,the environmental air quality dynamic statistical forecast system is build by linear regression and neural network method,using meteorological data and air pollution history data. The automatic operation of the business system is accomplished through using observation data of air pollutant concentration and numerical weather prediction data,and provides Daily forecast of 6 pollutant concentration (daily average concentration of PM2.5,PM10,NO2,SO2,CO and daily maximum concentration of O38 hours moving average concentration) and AQI index of 17 cities. The prediction can indicate the trend of the air quality change,and provides a reference for the operation forecast.
environmental air quality,statistical forecasting,linear regression,neural network,Shandong Province
曲 凱,碩士,工程師,主要從事空氣質量監(jiān)測與預報預警工作
X87
A
1673-288X(2017)01-0054-04
項目資助:山東省重點研發(fā)計劃項目(2015GGB01135)
引用文獻格式:曲 凱 等.山東省環(huán)境空氣質量動力統(tǒng)計預報系統(tǒng)[J].環(huán)境與可持續(xù)發(fā)展,2017,42(1):54-57.