999精品在线视频,手机成人午夜在线视频,久久不卡国产精品无码,中日无码在线观看,成人av手机在线观看,日韩精品亚洲一区中文字幕,亚洲av无码人妻,四虎国产在线观看 ?

兩種空氣質(zhì)量數(shù)值模式的應(yīng)用評(píng)估與集合改進(jìn)研究

2023-10-27 09:05:08孫弦孫磊聶會(huì)文梁秀姬蘇燁康王靜夏冬
熱帶氣象學(xué)報(bào) 2023年3期
關(guān)鍵詞:方法模型

孫弦,孫磊,聶會(huì)文,梁秀姬,蘇燁康,王靜,夏冬

(珠海市公共氣象服務(wù)中心,廣東珠海 519000)

1 引 言

隨著城市化和工業(yè)化的不斷發(fā)展,近些年來我國區(qū)域大氣污染事件頻發(fā)[1],其中以臭氧為代表的光化學(xué)污染事件[2]和以細(xì)顆粒物為代表的灰霾污染[3]最為突出,給人體健康、生態(tài)環(huán)境和氣候等方面造成很大威脅[4-6]。作為我國城市化進(jìn)程最高的城市集群之一,珠三角地區(qū)的空氣污染呈現(xiàn)出明顯的區(qū)域性和復(fù)合型特點(diǎn)[7-8]。其中,廣東珠海作為粵港澳大灣區(qū)核心城市,社會(huì)經(jīng)濟(jì)的飛速發(fā)展和人口的快速增長給空氣質(zhì)量帶來嚴(yán)峻考驗(yàn)。近幾年來一次污染防治雖有所成效,但以臭氧為代表的二次污染仍有加重趨勢(shì)[9]。因此,空氣質(zhì)量的準(zhǔn)確預(yù)報(bào)作為聯(lián)防聯(lián)控工作的基礎(chǔ),對(duì)切實(shí)有效改善空氣質(zhì)量具有重要意義。

目前,空氣質(zhì)量預(yù)報(bào)方法主要分為人工研判、統(tǒng)計(jì)模型和數(shù)值模式三種[10]。其中人工研判依賴觀測(cè)數(shù)據(jù)和主觀判斷,在時(shí)間精度和空間尺度存在局限性,且不具備繼承性。統(tǒng)計(jì)模型雖運(yùn)行操作簡單,整體預(yù)測(cè)精度較高[11-14],但對(duì)一些極端污染事件的捕捉能力較差[15-16],并缺乏可解釋性。另一方面,空氣質(zhì)量數(shù)值模式利用數(shù)學(xué)方法定量描述污染物從排放、平流輸送、湍流擴(kuò)散、化學(xué)反應(yīng)到清除的完備過程,精細(xì)化模擬區(qū)域內(nèi)污染物的時(shí)空分布特征與未來演變趨勢(shì),已成為當(dāng)前預(yù)報(bào)最主流的方法[17-20]。CMAQ、CAMx、WRF-CHEM和NAQPMS 等第三代空氣質(zhì)量數(shù)值預(yù)報(bào)模式,自身基于“一個(gè)大氣”理念,將各類大氣問題、物理化學(xué)機(jī)制和相互作用統(tǒng)一考慮,已成為大氣污染科學(xué)研究的主要工具,并得到廣泛業(yè)務(wù)應(yīng)用[21-24]。目前,分別基于CMAQ 和CAMx建立的華南區(qū)域大氣成分?jǐn)?shù)值預(yù)報(bào)系統(tǒng),通過使用我國自主研發(fā)的區(qū)域天氣模式作為氣象驅(qū)動(dòng)場,并充分融合多套排放源,已經(jīng)順利業(yè)務(wù)運(yùn)行多年[21,25]。李婷苑等[26]評(píng)估了CMAQ 業(yè)務(wù)模式在廣東的模擬能力,但只重點(diǎn)關(guān)注PM2.5、O3及其前體物NO2(其他三種主要污染物PM10、SO2和CO 未評(píng)估),且模式在珠海的局地表現(xiàn)尚不清楚。此外,CAMx 作為平行運(yùn)作的另一套模式,未有公開研究對(duì)其進(jìn)行詳細(xì)評(píng)估。

不同數(shù)值模式對(duì)于不同空氣污染物在不同地區(qū)的預(yù)報(bào)效果存在明顯的差異[27-28],因此,開展本地預(yù)報(bào)效果系統(tǒng)評(píng)估是業(yè)務(wù)應(yīng)用的前提。空氣質(zhì)量模式構(gòu)成復(fù)雜,外部和內(nèi)部皆具有較大不確定性[23,29],外部主要包括模型運(yùn)行所需的氣象初始場(包括土壤、地面和高空)、側(cè)邊界強(qiáng)迫和不同污染源排放清單等[30-31],內(nèi)部主要源自物理和化學(xué)過程參數(shù)化方案的不確定性[32-33],使得預(yù)報(bào)結(jié)果必然存在一定程度的偏差。因此,利用數(shù)學(xué)統(tǒng)計(jì)方法對(duì)多個(gè)預(yù)報(bào)結(jié)果進(jìn)行集合預(yù)報(bào),對(duì)于衡量模式不確定性和提高預(yù)報(bào)能力具有關(guān)鍵作用[34-36]。

集合方法通常分為線性與非線性兩大類。其中,多元線性回歸因其構(gòu)造簡單且考慮不同模式的權(quán)重,在研究應(yīng)用中取得明顯改進(jìn)效果。例如,潘錦秀等[37]利用多元線性回歸方法將CMAQ、CAMx 和NAQPMS 等三個(gè)模式進(jìn)行集成,消除了單個(gè)模式系統(tǒng)性偏差,顯著提高了北京市2016 年P(guān)M2.5日均預(yù)報(bào)準(zhǔn)確率。另一方面,以機(jī)器學(xué)習(xí)(例如BP 神經(jīng)網(wǎng)絡(luò)、隨機(jī)森林和支持向量機(jī)等)為代表的非線性算法日益得到關(guān)注,但在空氣質(zhì)量集合預(yù)報(bào)方面的應(yīng)用卻不足。楊關(guān)盈等[38]綜合評(píng)估了多種集合方法對(duì)安徽地區(qū)PM2.5預(yù)報(bào)的改進(jìn),發(fā)現(xiàn)BP 神經(jīng)網(wǎng)絡(luò)雖有一定訂正效果,但其效果卻不如多元回歸。但最近李娟等[39]卻揭示出相較于線性回歸,隨機(jī)森林和支持向量機(jī)方法對(duì)西安市O3和PM2.5預(yù)報(bào)的改進(jìn)。湯靜等[40]采用主成分分析結(jié)合機(jī)器學(xué)習(xí)算法K 近鄰方法,有效地改進(jìn)了CMAQ 模式對(duì)于廣州市PM2.5的預(yù)報(bào)水平。但需要說明的是,以上研究是針對(duì)單一預(yù)報(bào)模式,通過引入驅(qū)動(dòng)氣象場進(jìn)行回歸改進(jìn)或者直接對(duì)模式預(yù)報(bào)進(jìn)行后訂正,與多模式集合優(yōu)化的思路有所區(qū)別。因此,評(píng)估檢驗(yàn)以隨機(jī)森林為代表的機(jī)器學(xué)習(xí)方法在多模式集合方面的應(yīng)用存在較高必要性。此外,以往研究多關(guān)注1~2 種污染物,并未實(shí)現(xiàn)對(duì)6項(xiàng)主要污染物的全面覆蓋。

綜上所述,本研究選取珠海市為研究對(duì)象,基于CAMx 和CMAQ 模型兩套獨(dú)立運(yùn)行的空氣質(zhì)量業(yè)務(wù)預(yù)報(bào)系統(tǒng)和國控點(diǎn)觀測(cè)數(shù)據(jù),首先檢驗(yàn)評(píng)估兩者對(duì)六項(xiàng)主要污染物的時(shí)空分布和演變特征的模擬能力,然后分別利用線性和非線性方法(即多元線性回歸和隨機(jī)森林方法)進(jìn)行多模式集合,探究不同方法的改進(jìn)能力,以期提高珠海市空氣質(zhì)量預(yù)報(bào)水平,并為今后空氣質(zhì)量多模式集合的研究與業(yè)務(wù)應(yīng)用提供重要參考。

2 資料與方法

2.1 觀測(cè)與模式

本文選取珠海市四個(gè)國控站(環(huán)境空氣質(zhì)量國控自動(dòng)監(jiān)測(cè)站,唐家、吉大、前山和斗門,圖1)為研究站點(diǎn),收集2018—2019 年CO、PM2.5、PM10、O3、SO2和NO2等六種主要空氣污染物逐小時(shí)濃度觀測(cè)數(shù)據(jù)(缺測(cè)率約為20%),并在此基礎(chǔ)上計(jì)算不同時(shí)間尺度(日-月)的均值。需要說明的是,依據(jù)《環(huán)境空氣質(zhì)量評(píng)價(jià)技術(shù)規(guī)范(試行)》(HJ663-2013)要求,O3日均值為當(dāng)天8 小時(shí)滑動(dòng)平均最大值(記為O3_8 h)。此外,珠海市平均污染物濃度近似認(rèn)為是四個(gè)站點(diǎn)的平均。最后,2018—2019年珠海市空氣質(zhì)量持續(xù)下行(年AQI 達(dá)標(biāo)率均低于90%),所以被選為具體研究時(shí)段。

圖1 珠海市地形高度空間分布 其中紅星代表四個(gè)國控站(分別為唐家、吉大、前山和斗門)所在位置。

目前,中國氣象局廣州熱帶海洋氣象研究所和廣東省生態(tài)氣象中心分別基于CMAQ 和CAMx空氣質(zhì)量模型,在華南區(qū)域構(gòu)建了兩套大氣成分業(yè)務(wù)數(shù)值預(yù)報(bào)系統(tǒng)[21],于每日08 時(shí)和20 時(shí)開始起報(bào),預(yù)報(bào)未來72 小時(shí)逐小時(shí)空氣質(zhì)量產(chǎn)品。兩者區(qū)域設(shè)置保持一致,水平為三重(27-9-3 km)單向嵌套,垂直分層數(shù)為25,并都使用國產(chǎn)自主高精度區(qū)域氣象模式CMA-GD(自身已同化多種實(shí)時(shí)氣象觀測(cè))預(yù)報(bào)產(chǎn)品作為氣象輸入。對(duì)于排放清單,CMAQ 充分應(yīng)用了清華大學(xué)的源清單、廣東EPA的珠三角排放源清單與中山大學(xué)的廣東交通排放源清單,并使用大氣成分衛(wèi)星遙感資料和本地區(qū)地面站點(diǎn)觀測(cè)資料,對(duì)排放源分布和量級(jí)進(jìn)行優(yōu)化[21]。CAMx 的源清單也來自于多套源清單的融合,但并未進(jìn)行觀測(cè)同化與人工訂正。兩個(gè)模式使用的物理化學(xué)方案也存在異同,主要設(shè)置詳見表1。

表1 CMAQ與CAMx模式設(shè)置

本文選取研究時(shí)段內(nèi)(2018—2019年)兩套模式每日20 時(shí)起報(bào)的未來24 小時(shí)逐小時(shí)最內(nèi)層(3 km)污染物濃度預(yù)報(bào)數(shù)據(jù),并使用最臨近插值方法將模式格點(diǎn)數(shù)據(jù)插值到四個(gè)國控站點(diǎn)(圖1)以方便比較。

2.2 集合方法與實(shí)驗(yàn)設(shè)計(jì)

(1)多元線性回歸。

多元線性回歸(multiple linear regression,MLR)方法通過將因變量Y(即集合預(yù)報(bào))與多個(gè)自變量X1,X2,...,Xn(即多個(gè)模式預(yù)報(bào))聯(lián)系起來,構(gòu)建如下線性數(shù)學(xué)關(guān)系:

其中ai和b分別為回歸系數(shù)(可認(rèn)為是第i個(gè)模式的權(quán)重系數(shù))和回歸常數(shù),可通過使用最小二乘估計(jì)進(jìn)行求解。

(2)隨機(jī)森林。

隨機(jī)森林(random forest,RF)是一種監(jiān)督學(xué)習(xí)算法[41],由多個(gè)決策樹{y(x,θn),n= 1,2,……,N}組成的統(tǒng)計(jì)模型,其中θ為隨機(jī)變量(服從獨(dú)立分布),x為自變量,N為決策樹的數(shù)量。每一棵決策樹包含根節(jié)點(diǎn)、中間節(jié)點(diǎn)和葉節(jié)點(diǎn),構(gòu)建時(shí)首先在根節(jié)點(diǎn)進(jìn)行分裂成各個(gè)分支,分裂過程需經(jīng)過多個(gè)中間節(jié)點(diǎn),最終達(dá)到樹的末端(即葉節(jié)點(diǎn))為止。隨機(jī)森林里的每棵樹都利用訓(xùn)練數(shù)據(jù)的子集(隨機(jī)選取樣本和特征)開展訓(xùn)練,對(duì)于某一輸出規(guī)則,其輸出值是唯一的,最終輸出結(jié)果由各決策樹共同確定,因此具有不易過擬合、對(duì)異常值不敏感、解釋性強(qiáng)(可追溯),結(jié)果較為穩(wěn)健等優(yōu)點(diǎn),因此廣泛應(yīng)用于分類與回歸問題分析。對(duì)于在模式集合方面的應(yīng)用,預(yù)測(cè)結(jié)果由各決策樹輸出值均值所確定,即:

其中,表示集合預(yù)報(bào)結(jié)果,y表示某一決策樹基于x和θ的輸出。此外,隨機(jī)森林是一種非參數(shù)算法,可以對(duì)每個(gè)輸入特征(即模型結(jié)果)相對(duì)于預(yù)測(cè)結(jié)果(即集合結(jié)果)的重要性(PIM,也稱為貢獻(xiàn)度)進(jìn)行計(jì)算和排序。重要性基于袋外數(shù)據(jù)(outof-bag,OOB)計(jì)算,對(duì)于某一輸入特征,通過隨機(jī)置換(permute)輸入特征來計(jì)算該變化引起的平均準(zhǔn)確度的下降(變化越大則該特征越重要),具體表達(dá)如下:

其中,i表示某一輸入特征,N為構(gòu)造決策樹的數(shù)量,p表示置換后特征,MSE(mean square error)為均方誤差。

(3)實(shí)驗(yàn)設(shè)計(jì)。

本文選取研究時(shí)段內(nèi)模式預(yù)報(bào)與觀測(cè)分別作為兩種集合方法的輸入和輸出。為更好驗(yàn)證集合方法的可靠性和泛化能力,本文采用5折交叉驗(yàn)證法(5-fold cross validation)去開展模型訓(xùn)練與測(cè)試。首先將2 年樣本劃分成5 個(gè)長度相等的樣本子集,然后依次遍歷5 個(gè)子集,每次選取其余所有樣本進(jìn)行模型訓(xùn)練,當(dāng)前子集則作為測(cè)試集進(jìn)行輸入驗(yàn)證,最后合并5組驗(yàn)證結(jié)果進(jìn)行后續(xù)分析評(píng)估。集合模型基于不同污染物而獨(dú)立構(gòu)建,并默認(rèn)使用全部站點(diǎn)作為樣本數(shù)據(jù)。

2.3 評(píng)價(jià)指標(biāo)

為定量評(píng)估兩個(gè)空氣質(zhì)量模式及其集合方法的預(yù)報(bào)結(jié)果,本研究選取均方根誤差(Root Mean Square Error,RMSE)、相 關(guān) 系 數(shù)(Correlation Coefficient,R)和標(biāo)準(zhǔn)化平均偏差(Normalized Mean Bias,NMB)這三個(gè)統(tǒng)計(jì)檢驗(yàn),計(jì)算公式如下:

上式中,O代表觀測(cè)值,P代表預(yù)報(bào)值,N為樣本總數(shù),為觀測(cè)值樣本平均,為預(yù)報(bào)值樣本平均。具體利用RMSE 來衡量預(yù)報(bào)準(zhǔn)確程度,利用R來表明預(yù)報(bào)與觀測(cè)之間線性相關(guān)程度,以及利用NMB來反映預(yù)報(bào)系統(tǒng)偏差情況。

3 結(jié)果與分析

3.1 季節(jié)變化

首先,各污染物(除O3外)均呈現(xiàn)出明顯的冬高夏低特征(圖2),這與冬季化石燃料的加劇燃燒有關(guān),而O3的產(chǎn)生主要依賴于光化學(xué)反應(yīng),因此高值出現(xiàn)在8—10 月。總體而言,CMAQ 模式較為合理地還原了各污染物季節(jié)變化,相關(guān)系數(shù)R介于0.72~0.84 之間,但存在明顯系統(tǒng)偏差,CO、PM2.5、PM10、SO2、O3和NO2的NMB 分 別 達(dá) 到-0.58、-0.18、-0.30、1.52,-0.16 和-0.20。CAMx 模式整體表現(xiàn)為顯著降低,各污染物相關(guān)系數(shù)均低于CMAQ(SO2甚至未通過0.05顯著性檢驗(yàn)),低估了CO、PM10和NO2濃度(NMB 分別為-0.49、-0.53和-0.87),而對(duì)SO2則明顯高估(NMB為1.99)。需要注意的是,模式RMSE 和NMB 數(shù)值差異較大(特別是臭氧),這主要是NMB 在計(jì)算時(shí)進(jìn)行了標(biāo)準(zhǔn)化(公式(6)),但正負(fù)偏差的相互抵消也對(duì)其NMB 的表現(xiàn)有所提升。例如,CAMx 整體低估了臭氧的平均濃度,但在2018 年11 月—2019 年2 月期間卻存在高估。

圖2 兩種數(shù)值模式(CAMx和CMAQ)及其集合方法(MLR和RF)2018—2019年珠海市六種空氣污染物濃度月均值變化與觀測(cè)(OBS)對(duì)比

通過多元線性回歸進(jìn)行集合優(yōu)化,CO、PM2.5、PM10、SO2、和NO2等污染要素的系統(tǒng)偏差得到有效糾正,NMB 降低到0.01~0.04,RMSE 分別降低到0.08 mg/m3、6.42、10.86、1.75和9.93 μg/m3,但在CMAQ 較好還原季節(jié)變化的基礎(chǔ)上,相關(guān)系數(shù)R無明顯改進(jìn),其中SO2相關(guān)性下降到0.71。更為重要的是,O3作為近幾年影響珠三角乃至全國最主要的污染物[8-9],該方法對(duì)其季節(jié)變化的預(yù)報(bào)能力并未產(chǎn)生改進(jìn),RMSE 相較于CMAQ 模型,反而有所增加,這體現(xiàn)出線性方法的局限性。另一方面,非線性方法隨機(jī)森林表現(xiàn)明顯更為出色(表2),在其基礎(chǔ)上將各污染物(包括O3)的預(yù)報(bào)誤差RMSE進(jìn)一步縮小到0.08 mg/m3、5.17、8.68、1.57、22.44和9.37 μg/m3,相關(guān)系數(shù)R提高到0.81、0.93、0.90、0.78、0.76 和0.78,這歸功于該方法基于集合算法(即基于多個(gè)獨(dú)立決策樹平均結(jié)果),準(zhǔn)確性較單一算法(如多元線性回歸)有所提高[42]。另外,其在樣本和特征選擇時(shí)的雙隨機(jī)性,降低了模型產(chǎn)生過擬合的風(fēng)險(xiǎn),使得研究時(shí)間段內(nèi)表現(xiàn)均較為穩(wěn)定。但是,包括隨機(jī)森林在內(nèi)的兩種集合方法仍有缺陷,比如對(duì)O3和PM2.5高值月份的還原存在低估,這主要是因?yàn)闃颖緮?shù)量有限,未根據(jù)不同季節(jié)(或不同月份)對(duì)模型進(jìn)行訓(xùn)練所導(dǎo)致的,隨著模式和觀測(cè)數(shù)據(jù)的不斷積累,可在后續(xù)應(yīng)用中得到優(yōu)化。

表2 珠海市六種污染物季節(jié)變化統(tǒng)計(jì)參數(shù)

3.2 逐日變化

總體而言,CMAQ 對(duì)多數(shù)污染物日變化的預(yù)報(bào)能力都明顯優(yōu)于CAMx(圖3)。對(duì)于CO,兩者表現(xiàn)接近,均可較好還原CO 的逐日變化趨勢(shì)(R為0.7 左右),但卻存在明顯系統(tǒng)性低估(NMB 分別 為-0.51 和-0.53)。CMAQ 不 但 有 效 減 輕 了CAMx對(duì)顆粒物的低估,PM2.5和PM10的NMB分別降低至-0.06 和-0.21,而且提高了年初污染天氣(即PM2.5日均值>75或PM10日均值>150)的捕捉能力,從而降低了預(yù)報(bào)誤差(RMSE分別降低了12.19和6.08 μg/m3),相關(guān)系數(shù)也得到提升。對(duì)于SO2,兩者表現(xiàn)均不理想,存在上述指出的嚴(yán)重正偏差,CMAQ 表現(xiàn)稍好,體現(xiàn)在演變趨勢(shì)的合理還原(R為0.55)。對(duì)于NO2,CMAQ 大幅糾正了CAMx 預(yù)報(bào)負(fù)偏差,NMB 從-0.88 提升至-0.12,但預(yù)報(bào)偏差仍較為明顯,RMSE 高達(dá)16.84 μg/m3。此外,NO2作為O3生成的前體物,CMAQ 對(duì)其模擬能力的改進(jìn),間接提高了O3的預(yù)報(bào)能力,O3相關(guān)性提高至0.56,預(yù)報(bào)偏差也降低了4.93 μg/m3,但對(duì)夏秋季易發(fā)的O3污染事件(即O3_8 h>160 μg/m3)的捕捉能力仍有待加強(qiáng)[26]。

圖3 兩種數(shù)值模式(CAMx和CMAQ)及其集合方法(MLR和RF)2018年珠海市六種空氣污染物濃度日均值變化與觀測(cè)(OBS)對(duì)比

對(duì)于存在明顯系統(tǒng)偏差的污染物(即CO、SO2和NO2),多元線性回歸大幅糾正偏差,NMB 分別緩解至0.05、-0.09 和0.01,但SO2的相關(guān)性出現(xiàn)小幅降低。此外,該方法雖有效地提高了顆粒物統(tǒng)計(jì)評(píng)分,但對(duì)極端污染情況的還原能力卻不如CMAQ,這是由于顆粒物濃度在冬季明顯偏高,而模型基于所有時(shí)間段進(jìn)行訓(xùn)練,因此在該種情況下的表現(xiàn)受到了限制。最后,該方法對(duì)O3日變化的模擬未有改進(jìn),表現(xiàn)與CMAQ 基本相當(dāng)。相較于線性回歸,隨機(jī)森林方法進(jìn)一步提高了各污染物模擬的整體表現(xiàn),各污染物的多項(xiàng)統(tǒng)計(jì)指標(biāo)幾乎均為最優(yōu)。另外,隨機(jī)森林同樣對(duì)冬季顆粒物污染事件還原能力有限,進(jìn)一步驗(yàn)證了利用所有季節(jié)樣本進(jìn)行訓(xùn)練的局限性。需要注意的是,臭氧作為近些年來珠三角空氣污染的首要威脅,隨機(jī)森林一定程度上彌補(bǔ)了線性方法的缺陷,不僅提高了其各項(xiàng)預(yù)報(bào)指標(biāo),而且加強(qiáng)了對(duì)極端污染事件的捕捉能力。

圖4 進(jìn)一步給出了各要素逐日觀測(cè)與不同模式和集合方法的散點(diǎn)分布。CMAQ 雖明顯優(yōu)于CAMx,但同樣對(duì)包括SO2、NO2在內(nèi)的一些污染物存在明顯偏差,因此擬合斜率k距完美值1 差距較大。兩種集合方法明顯提高了各要素預(yù)報(bào)能力,尤其是隨機(jī)森林方法,各要素的擬合斜率k和決定系數(shù)R2都與完美值1 最為接近,展示出該模式優(yōu)秀的集合預(yù)報(bào)能力。

圖4 兩種數(shù)值模式(CAMx和CMAQ)及其集合方法(MLR和RF)2018—2019年珠海市六種空氣污染物(a~f)濃度日均值(x軸)與對(duì)應(yīng)觀測(cè)(y軸)對(duì)比散點(diǎn)圖(不同顏色代表不同模式或方法) 其中k和R2分別為擬合線的斜率和決定系數(shù)(兩者越接近于1,模擬效果越好,顏色與點(diǎn)相對(duì)應(yīng))。

3.3 晝夜變化

人為活動(dòng)作為主要排放源,排放強(qiáng)度和類型具有明顯晝夜變化特征。并且,污染物的擴(kuò)散活動(dòng)主要受到大氣邊界層湍流活動(dòng)的支配,而大氣邊界層高度也存在明顯晝夜變化[43]。因此,各污染要素也存在明顯的晝夜變化[44]。圖5 給出了模式和不同集合方法預(yù)報(bào)的各要素濃度晝夜變化(已減去自身均值)對(duì)比。據(jù)觀測(cè),NO2晝夜變化為雙峰型外,其他污染物的日變化均為單峰型。總體而言,CAMx 模式幾乎無法還原各污染物的晝夜變化,出現(xiàn)明顯偏差,其中顆粒物和NO2的相關(guān)系數(shù)甚至為負(fù),且CO、PM 和SO2均表現(xiàn)出類似的晝夜變化,揭示出排放清單的明顯缺陷。CMAQ 能較為準(zhǔn)確還原O3晝夜變化(相關(guān)系數(shù)達(dá)到0.96),并大致表現(xiàn)出NO2的雙峰型特征,但對(duì)其他污染物的表現(xiàn)也不太理想,例如顯著高估了PM10和SO2的晝夜變化幅度,誤差分別達(dá)到13.18和9.5 μg/m3。另一方面,兩種集合模型對(duì)多數(shù)污染物(除CO 和SO2)晝夜變化并無明顯改進(jìn)。這主要是由于集合方法均以減小誤差(如最小二乘法)為單一訓(xùn)練目標(biāo),雖能有效減小模式的系統(tǒng)偏差,但未能對(duì)晝夜變化的還原產(chǎn)生附加價(jià)值。因此,污染物晝夜變化預(yù)報(bào)能力的改進(jìn)主要在于模型自身的提高,并可嘗試在非線形算法中引入多目標(biāo)函數(shù)進(jìn)行多模式集合優(yōu)化。

圖5 觀測(cè)(OBS)、兩種數(shù)值模式(CAMx和CMAQ)及其集合方法(MLR和RF)給出的珠海市2018—2019年六種空氣污染物濃度(已減去自身均值)晝夜變化對(duì)比

3.4 空間變化

排放源與氣象要素的空間差異,在擴(kuò)散條件進(jìn)一步作用下,各污染物要素呈現(xiàn)明顯的空間變化(圖6)。對(duì)于多數(shù)站點(diǎn),PM 異常的符號(hào)與O3相反,這體現(xiàn)出兩者之間的“蹺蹺板”效應(yīng),即較高的PM 濃度削弱了太陽輻射,從而抑制了臭氧生成依賴的光化學(xué)反應(yīng)。但PM10和O3在唐家站同為正異常,揭示了珠三角頻發(fā)的復(fù)合型污染[45]。總體而言,兩個(gè)模式合理還原珠海O3“東多西少”的空間特征,但對(duì)PM 和NO2空間差異的模擬卻存在明顯缺陷,這主要是由于氣象驅(qū)動(dòng)模型GRAPES 能真實(shí)地模擬氣象條件(尤其是太陽輻射)的空間差異,為O3的生成與擴(kuò)散提供了良好基礎(chǔ),但排放清單由于空間分辨率和較大不確定性的限制,嚴(yán)重制約了PM 和NO2空間變化的模擬能力。同樣,基于所有站點(diǎn)樣本進(jìn)行訓(xùn)練的集合模型未能對(duì)空間差異的模擬產(chǎn)生效果。但以隨機(jī)森林方法為例,當(dāng)基于不同站點(diǎn)構(gòu)建模型,大幅改進(jìn)了各污染物空間變化的預(yù)報(bào)水平。但是,空間技巧的提升也部分抑制了多尺度時(shí)間變化的還原能力(圖未展示),這同樣是由于訓(xùn)練樣本長度不夠充分,因此無法支持模式基于不同維度(如不同季節(jié)和站點(diǎn))開展優(yōu)化。

圖6 兩種數(shù)值模式(CAMx和CMAQ)及其集合方法(MLR、RF和RF-sta)預(yù)報(bào)的吉大站(第1列)、斗門站(第2列)、前山站(第3列)、唐家站(第4列)2018—2019年四種主要空氣污染物年日濃度均值(減去站點(diǎn)平均,柱狀線,對(duì)應(yīng)左側(cè)縱坐標(biāo),單位為μg/m3)、標(biāo)準(zhǔn)差(除以站點(diǎn)平均,三角形,對(duì)應(yīng)右側(cè)縱坐標(biāo),單位為μg/m3)與實(shí)測(cè)對(duì)比

3.5 模式重要性

圖7進(jìn)一步利用隨機(jī)森林模型的算法特點(diǎn),展現(xiàn)了兩個(gè)模型對(duì)于不同要素重要性。以上分析表明CMAQ對(duì)于多數(shù)污染物的預(yù)報(bào)水平雖明顯優(yōu)于CAMx,但兩者對(duì)于多數(shù)污染物的重要性未存在明顯差異,CMAQ 僅在O3方面展現(xiàn)出60%左右的較大優(yōu)勢(shì),而CAMx卻在CO預(yù)報(bào)方面占據(jù)明顯優(yōu)勢(shì),重要性達(dá)到64.6%。該結(jié)果揭示出模型自身的線性偏差對(duì)于隨機(jī)森林算法的結(jié)果并不產(chǎn)生影響[46],另外的測(cè)試首先利用線性回歸對(duì)兩個(gè)模型進(jìn)行誤差訂正,然后通過隨機(jī)森林進(jìn)行訓(xùn)練,其預(yù)報(bào)結(jié)果與未訂正相比也幾乎沒有差異。本研究僅使用兩個(gè)數(shù)值模型進(jìn)行集成,因此,進(jìn)一步提高集合預(yù)報(bào)結(jié)果的關(guān)鍵在于代表性集合成員的增加,而隨機(jī)森林多個(gè)獨(dú)立決策樹對(duì)特征的隨機(jī)選取,也極大程度上避免了過擬合發(fā)生,從而無需考慮集合成員過多對(duì)模擬結(jié)果產(chǎn)生負(fù)面影響。

圖7 隨機(jī)森林集合方法中CAMx和CMAQ模型對(duì)于各空氣污染物的重要性

4 結(jié)論與討論

本研究利用2018—2019 年國控站觀測(cè)資料,評(píng)估CAMx 和CMAQ 模式對(duì)珠海主要污染物時(shí)空分布與演變特征的預(yù)報(bào)能力,并引入多元線性回歸和隨機(jī)森林方法對(duì)預(yù)報(bào)結(jié)果進(jìn)行集成,探究不同集合方法的改進(jìn)能力。得出如下結(jié)論。

CMAQ 表現(xiàn)明顯優(yōu)于CAMx,合理地還原了CO、PM2.5、PM10、SO2、O3和NO2的季節(jié)變化,相關(guān)系數(shù)介于0.72~0.84,但存在明顯系統(tǒng)偏差,NMB分別達(dá)到-0.58、-0.18、-0.30、1.52,-0.16 和-0.20,RMSE 分 別達(dá) 到0.40 mg/m3、6.86、16.02、10.71、25.05 和10.21 μg/m3。對(duì)于日變化,兩者對(duì)CO 和SO2技巧相當(dāng),但CMAQ 大幅修正了CAMx 模擬PM 和NO2的負(fù)偏差,提高了對(duì)冬季PM 污染事件的捕捉能力。由于對(duì)NO2預(yù)報(bào)的改進(jìn),CAMQ 提高了O3日變化的預(yù)報(bào)能力,相關(guān)性提升至0.56,預(yù)報(bào)偏差降低了4.93 μg/m3,但對(duì)夏秋季O3污染事件的預(yù)報(bào)能力存在不足。對(duì)于晝夜變化,CAMx 模式幾乎無法再現(xiàn),而CMAQ 較為合理地還原了O3的晝夜變化(相關(guān)系數(shù)達(dá)到0.96),同時(shí)再現(xiàn)了NO2的雙峰型特征,但對(duì)其余污染要素存在明顯不足。并且,兩者對(duì)多數(shù)污染物(除O3之外)的晝夜和空間變化的模擬能力仍存在明顯缺陷,這主要來自于排放清單和氣象條件兩者的不確定性[23,29]。關(guān)于模式表現(xiàn)的差異,可以部分歸因于兩者基本架構(gòu)和所使用參數(shù)化方案(如干沉降、氣象化學(xué)機(jī)理)[47]。此外,空氣質(zhì)量模式的準(zhǔn)確性依賴于合理精確的排放源清單數(shù)據(jù)[26]。CMAQ 所使用的排放清單在融合多種源清單的基礎(chǔ)上,進(jìn)一步結(jié)合衛(wèi)星遙感和觀測(cè)進(jìn)行優(yōu)化[21],而CAMx 使用的的源清單則未經(jīng)觀測(cè)同化和人工訂正,因此可以合理解釋CMAQ較優(yōu)的預(yù)報(bào)能力。

基于不同污染物構(gòu)建的兩種集合方法,均有效提高了季節(jié)-日尺度上的預(yù)報(bào)水平,其中隨機(jī)森林表現(xiàn)更優(yōu),對(duì)于各污染物的多項(xiàng)技巧評(píng)分幾乎均為最佳,但均對(duì)模式缺陷無明顯改進(jìn)。這主要是由于線性模型為單個(gè)(或多個(gè))輸入自變量和輸出因變量創(chuàng)建線性關(guān)系,但不同模型的結(jié)果通常是復(fù)雜的且具有高度非線性的關(guān)系。另一方面,隨機(jī)森林在解析非線性問題方面的優(yōu)勢(shì),配合在樣本和特征選擇時(shí)的雙隨機(jī)性,降低了模型產(chǎn)生過擬合的風(fēng)險(xiǎn),因此展現(xiàn)出更為優(yōu)秀的預(yù)報(bào)能力。但是,集合方法對(duì)污染物的晝夜與空間變化并無明顯改進(jìn),這表明集合預(yù)報(bào)雖具備優(yōu)秀的附加價(jià)值,但預(yù)報(bào)水平受到集合成員預(yù)報(bào)能力制約。進(jìn)一步基于不同地點(diǎn)對(duì)模型進(jìn)行訓(xùn)練,顯著提升了各污染物空間差異的還原能力,但其他方面表現(xiàn)受限于樣本長度而有所下降,這體現(xiàn)出集合方法對(duì)數(shù)據(jù)量的依賴性。隨著預(yù)報(bào)數(shù)據(jù)和觀測(cè)的積累,集合方法的實(shí)際應(yīng)用中基于多維度(如季節(jié)和地點(diǎn))展開較為必要。此外,隨機(jī)森林算法中CMAQ 與CAMx 的重要性基本相當(dāng),表明集合方法的預(yù)報(bào)能力與集合成員的線性偏差無關(guān),主要取決于不同成員的代表性。

綜上所述,本研究揭示以隨機(jī)森林為代表的集合方法雖有效改進(jìn)了污染物的預(yù)報(bào)能力,但提高數(shù)值模式自身能力和增加具有代表性的集合成員對(duì)預(yù)報(bào)水平的進(jìn)一步提升非常關(guān)鍵。后續(xù)研究可以綜合利用多種機(jī)器學(xué)習(xí)算法(如卷積神經(jīng)網(wǎng)絡(luò)),構(gòu)建以多氣象要素為主要自變量的空氣質(zhì)量統(tǒng)計(jì)預(yù)報(bào)模型,在評(píng)估其預(yù)報(bào)能力的基礎(chǔ)上,將其作為成員進(jìn)行集合預(yù)報(bào),以期進(jìn)一步提高珠海市(乃至大灣區(qū))污染物預(yù)報(bào)能力。

猜你喜歡
方法模型
一半模型
重要模型『一線三等角』
重尾非線性自回歸模型自加權(quán)M-估計(jì)的漸近分布
學(xué)習(xí)方法
3D打印中的模型分割與打包
用對(duì)方法才能瘦
Coco薇(2016年2期)2016-03-22 02:42:52
FLUKA幾何模型到CAD幾何模型轉(zhuǎn)換方法初步研究
四大方法 教你不再“坐以待病”!
Coco薇(2015年1期)2015-08-13 02:47:34
賺錢方法
捕魚
主站蜘蛛池模板: 久久人搡人人玩人妻精品| 午夜三级在线| 国产丰满大乳无码免费播放| 亚洲国产精品日韩专区AV| 国产精品精品视频| 亚洲永久色| 日韩成人高清无码| 国产精品亚洲а∨天堂免下载| 91精品啪在线观看国产60岁| 91久久天天躁狠狠躁夜夜| 亚洲精品老司机| 亚洲一区二区视频在线观看| 成年人免费国产视频| 亚洲日韩精品欧美中文字幕 | 婷婷综合缴情亚洲五月伊| 日韩福利视频导航| 无码日韩人妻精品久久蜜桃| 中文字幕在线欧美| 91精品国产一区| 22sihu国产精品视频影视资讯| 99视频在线免费观看| 欧美成人午夜视频免看| 免费高清毛片| 毛片网站在线播放| 在线观看免费黄色网址| 日本免费高清一区| 欧美日韩中文国产va另类| 亚洲最新地址| 十八禁美女裸体网站| 久久精品无码中文字幕| 欧美日韩va| 91小视频在线观看| 啪啪国产视频| 乱人伦中文视频在线观看免费| 毛片免费视频| 波多野结衣无码AV在线| 夜夜拍夜夜爽| 亚洲AV无码乱码在线观看裸奔| 久久久久国产一级毛片高清板| 国产乱子精品一区二区在线观看| 久久亚洲天堂| 国内精品久久九九国产精品| 国产福利一区在线| 婷婷伊人久久| 狠狠色香婷婷久久亚洲精品| 精品自窥自偷在线看| 波多野结衣中文字幕久久| 精品丝袜美腿国产一区| jizz国产视频| 国产精品原创不卡在线| 久久久久免费精品国产| 一级全黄毛片| 国产噜噜在线视频观看| 亚洲国产无码有码| 欧美中文字幕在线二区| 九九热精品视频在线| 91毛片网| 亚洲日韩在线满18点击进入| 国产精品密蕾丝视频| 亚洲第一成年网| 91网站国产| 狠狠干综合| 亚洲人成高清| 国产高清不卡视频| 福利姬国产精品一区在线| 国产91在线|中文| 91网红精品在线观看| 99尹人香蕉国产免费天天拍| 亚洲欧洲国产成人综合不卡| 国产99在线| 99视频精品在线观看| 热九九精品| 18禁黄无遮挡网站| 中国国产高清免费AV片| 日本国产精品一区久久久| 中文字幕2区| 日韩a级片视频| 欧美日韩亚洲国产| 国产欧美视频综合二区| 中文字幕欧美成人免费| 中文字幕人妻av一区二区| 无码网站免费观看|