馬宗禾,駱哲文,孫 鐸,劉子炎,楊睿誠(chéng)
(武漢理工大學(xué),湖北 武漢 430070)
野火通常發(fā)生在農(nóng)村地區(qū)或山區(qū),監(jiān)測(cè)站點(diǎn)數(shù)量有限且分布不均,因而難以實(shí)現(xiàn)整個(gè)火災(zāi)區(qū)域PM2.5的擴(kuò)散方式和傳輸特性等研究。基于仿真的大氣空氣質(zhì)量模式預(yù)報(bào)在空間上具有連續(xù)覆蓋性,但分辨率較低,結(jié)果誤差較大。另外,野火PM2.5有高濃度高度變化的特點(diǎn),現(xiàn)有的統(tǒng)計(jì)模型對(duì)于PM2.5-AOD的關(guān)系在時(shí)間和空間上無法完全解釋變化。
為解決現(xiàn)有野火PM2.5測(cè)算野火熱輻射高、易受風(fēng)影響的難點(diǎn),引入哨兵二號(hào)影像、風(fēng)向等新變量;另一方面,采用機(jī)器學(xué)習(xí)算法,使用高分辨率AOD數(shù)據(jù),對(duì)野火PM2.5進(jìn)行遙感反演,以期來填補(bǔ)高濃度PM2.5的估算領(lǐng)域的空白并嘗試提高最終PM2.5反演結(jié)果的精度。
2019年9月以來澳大利亞東海岸森林火災(zāi)引起國(guó)際社會(huì)廣泛關(guān)注,其產(chǎn)生的大量野火煙霧已環(huán)繞地球半周。因此,亟需高分辨率野火PM2.5濃度數(shù)據(jù)為環(huán)境科學(xué)、生態(tài)經(jīng)濟(jì)發(fā)展提供數(shù)據(jù)支撐,同時(shí)對(duì)公共衛(wèi)生和流行病學(xué)的研究也有重要意義。

圖1
2.2.1 數(shù)據(jù)處理
由于各類數(shù)據(jù)的來源、數(shù)據(jù)類型、空間分辨率不盡相同,要對(duì)各類數(shù)據(jù)進(jìn)行預(yù)處理。模型的時(shí)間分辨率是24h,所搜集的數(shù)據(jù)大多為每日均值,對(duì)于非標(biāo)準(zhǔn)格式的數(shù)據(jù)按照數(shù)學(xué)與統(tǒng)計(jì)方法進(jìn)行處理與驗(yàn)證。
(1)填補(bǔ)AOD缺失:檢查AOD缺失,將Aqua和Terra AOD進(jìn)行融合,再以AO據(jù)為基準(zhǔn)建立一公里格網(wǎng)。
(2)對(duì)哨兵2號(hào)數(shù)據(jù),計(jì)算改進(jìn)歸一化燃燒指數(shù)(NBRT),分離燃燒區(qū)和非燃燒區(qū)。

式中,NIR波段范圍0.76-0.9μm;SWIR波段范圍2.08-2.35μm;Thermal波段10.4~12.5μm。
接著采用雙線性內(nèi)插方法對(duì)其做降尺度處理,再用1*1km格網(wǎng)對(duì)其重采樣。
(3)對(duì)于MODIS NDVI數(shù)據(jù),因其分辨率比較低,用Aggregation函數(shù)對(duì)其進(jìn)行數(shù)據(jù)整合,保證計(jì)算過程是一公里格網(wǎng)的均值。
(4)對(duì)每個(gè)MODIS火點(diǎn)數(shù)據(jù)創(chuàng)建多級(jí)緩沖區(qū),計(jì)算每個(gè)網(wǎng)格單元MODIS的火點(diǎn)數(shù),以15km緩沖區(qū)進(jìn)行火點(diǎn)統(tǒng)計(jì)。
(5)使用最鄰近分類算法為每個(gè)氣象監(jiān)測(cè)站點(diǎn)分配氣象字段,從而獲取區(qū)域內(nèi)氣象要素的連續(xù)表面,然后使用反距離加權(quán)方法插值到1*1km網(wǎng)格中。
(6)對(duì)于土地利用數(shù)據(jù),以每個(gè)PM2.5監(jiān)測(cè)站點(diǎn)為中心,建立1*1km的緩沖區(qū),平均森林覆蓋率、高程值、道路長(zhǎng)度到緩沖區(qū),并計(jì)算每個(gè)緩沖區(qū)的人口密度。
(7)對(duì)于PM2.5數(shù)據(jù),將某一網(wǎng)格單元內(nèi)所有PM2.5站點(diǎn)同一天的數(shù)據(jù)進(jìn)行平均后賦值給該網(wǎng)格單元。
(8)對(duì)各因子與PM2.5濃度做多變量相關(guān)分析,并計(jì)算相關(guān)系數(shù),移除會(huì)造成顯著共線性的變量,選取最優(yōu)預(yù)測(cè)變量。
2.2.2 模型構(gòu)建
剔除了數(shù)據(jù)的缺失值及異常值后,將數(shù)據(jù)集按照7:3的比例隨機(jī)劃分為訓(xùn)練集和測(cè)試集。訓(xùn)練集用于建立模型,測(cè)試集用于精度評(píng)價(jià)。
我們使用隨機(jī)森林對(duì)訓(xùn)練集進(jìn)行構(gòu)建模型。隨機(jī)森林具有以下優(yōu)點(diǎn):運(yùn)算量小,但預(yù)測(cè)精度高;可以高效的處理非線性過程;預(yù)測(cè)結(jié)果對(duì)非平衡數(shù)據(jù)和缺失數(shù)據(jù)較穩(wěn)健。我們將預(yù)處理后的相關(guān)因子作為模型的特征,監(jiān)測(cè)站點(diǎn)的PM2.5濃度作為監(jiān)督值,使用Python的Scikit-Learn模塊的算法訓(xùn)練。同時(shí)幫助我們判斷本研究加入的哨兵2號(hào)數(shù)據(jù)、風(fēng)向數(shù)據(jù)等是否真的提高了模型精度。
2.2.3 模型驗(yàn)證
用先前劃分的測(cè)試集對(duì)建立的模型進(jìn)行驗(yàn)證,在此階段中,我們采用了模型預(yù)測(cè)值與地面觀測(cè)值之間的決定系0數(shù)(R2)、平均預(yù)測(cè)誤差(MPE)、均方根預(yù)測(cè)誤差(RMSE)、相對(duì)預(yù)測(cè)誤差(RPE)等統(tǒng)計(jì)指標(biāo)來對(duì)模型擬合與交叉驗(yàn)證結(jié)果進(jìn)行比較,從而對(duì)模型表現(xiàn)和過度擬合現(xiàn)象進(jìn)行評(píng)估。
2.2.4 模型應(yīng)用
(1)澳大利亞野火煙霧PM2.5時(shí)空特征分析。因?yàn)榈孛姹O(jiān)測(cè)站點(diǎn)的稀疏性,所以僅靠地面監(jiān)測(cè)站的數(shù)據(jù)無法得知澳洲森林火災(zāi)中煙霧PM2.5的整體變化。而我們建立的模型可以反演澳洲野火日均尺度PM2.5的濃度,研究澳洲野火PM2.5濃度的空間分布特征,并對(duì)其形成原因進(jìn)行探討;同時(shí)會(huì)研究時(shí)間變化特征,并基于日時(shí)間序列和月均時(shí)間序列,分析澳洲野火期間PM2.5污染的時(shí)間變化趨勢(shì)。
(2)人口野火煙霧PM2.5暴露風(fēng)險(xiǎn)評(píng)估。基于建立的模型對(duì)火災(zāi)期間的居民健康風(fēng)險(xiǎn)進(jìn)行評(píng)估。我們將研究期分為以下三個(gè)子階段:“火災(zāi)前”時(shí)期,即研究區(qū)域的PM2.5水平正常;“火災(zāi)中”時(shí)期,即研究區(qū)域內(nèi)大多數(shù)AQ站中PM2.5的濃度急劇增加時(shí);“火災(zāi)后”時(shí)期,即PM2.5濃度恢復(fù)到正常水平。在不同的時(shí)期內(nèi),我們將分別用空氣質(zhì)量濃度、人口暴露強(qiáng)度、人口加權(quán)濃度3種指標(biāo)來對(duì)人口PM2.5暴露風(fēng)險(xiǎn)進(jìn)行評(píng)估。
(3)野火顆粒物與相關(guān)疾病致死率關(guān)系研究。我們將澳大利亞全境范圍的AOD與PM2.5濃度時(shí)空分布情況與WHO提供的相關(guān)疾病的致死率健康數(shù)據(jù)結(jié)合,通過反距離權(quán)重(IDW)插值與提取等方法得到澳大利亞森林火災(zāi)野火顆粒物與相關(guān)疾病致死率關(guān)系,從而對(duì)二者的關(guān)系進(jìn)行分析與研究,為環(huán)境科學(xué)、生態(tài)經(jīng)濟(jì)發(fā)展提供數(shù)據(jù)支撐,對(duì)公共衛(wèi)生和流行病學(xué)的研究與決策提供有價(jià)值的建議。
由于野火PM2.5相對(duì)于城市PM2.5更難估算,傳統(tǒng)的建模變量不夠,本文采用多源數(shù)據(jù)進(jìn)行PM2.5濃度空間估算,除常用的AOD數(shù)據(jù)、氣象數(shù)據(jù)(相對(duì)濕度、風(fēng)速和行星邊界層)、土地利用數(shù)據(jù)外,引入火點(diǎn)數(shù)據(jù)、哨兵二號(hào)數(shù)據(jù)和風(fēng)向數(shù)據(jù)等輔助數(shù)據(jù)。既利用了AOD數(shù)據(jù)對(duì)于PM2.5良好相關(guān)關(guān)系,同時(shí)又考慮了野火煙霧所產(chǎn)生的高濃度高度變化的PM2.5難以被有效估算的問題。已有研究表明,風(fēng)向?qū)τ赑M2.5的分布有重要影響,但由于風(fēng)向數(shù)據(jù)分析的復(fù)雜性,多數(shù)PM2.5濃度估算的研究沒有將其考慮在內(nèi),因此,為了提高結(jié)果數(shù)據(jù)的準(zhǔn)確性,加入風(fēng)向數(shù)據(jù),結(jié)合其他多源數(shù)據(jù)對(duì)PM2.5濃度估算的結(jié)果進(jìn)行對(duì)比驗(yàn)證。
采用1km分辨率的AOD數(shù)據(jù)作為基礎(chǔ),將其他因素?cái)?shù)據(jù)進(jìn)行重采樣配準(zhǔn)到該數(shù)據(jù)上,保證高空間分辨率。MAIAC算法使用時(shí)間序列分析并同時(shí)處理固定的25*25 km2塊中的像素組,以得出表面雙向反射率分布函數(shù)和氣溶膠參數(shù),顯示出增強(qiáng)的對(duì)比局部尺度氣溶膠變化的能力,并提高了云雪探測(cè)和氣溶膠檢索的質(zhì)量。
我們對(duì)隨機(jī)森林算法進(jìn)行優(yōu)化,解決PM2.5-AOD關(guān)系的時(shí)空異質(zhì)性問題,以提高模型的估算精度。對(duì)PM2.5人口暴露風(fēng)險(xiǎn),我們利用隨機(jī)森林優(yōu)化模型估算的高精度PM2.5濃度空間分布數(shù)據(jù)進(jìn)行評(píng)估,且利用多指標(biāo)評(píng)價(jià)方法從多個(gè)角度對(duì)澳大利亞的PM2.5人口暴露風(fēng)險(xiǎn)進(jìn)行評(píng)估。該評(píng)估方式的可信度高。
2020年7月28日,世界自然基金會(huì)(WWF)發(fā)布一份報(bào)告,顯示2019年到2020年發(fā)生的澳大利亞叢林大火,造成了近30億只動(dòng)物死亡或流離失所。面對(duì)自19世紀(jì)中葉以來最嚴(yán)重的火災(zāi),數(shù)據(jù)監(jiān)測(cè)方法與管理體系在不斷蔓延的火勢(shì)面前也顯得不盡人意。因此,針對(duì)本次火災(zāi)的研究不僅具有深刻的現(xiàn)實(shí)意義,更是對(duì)于澳大利亞與整個(gè)國(guó)際社會(huì)的火災(zāi)監(jiān)管體系有著深遠(yuǎn)影響。我們的研究模型旨在為解決監(jiān)測(cè)與反演方法中現(xiàn)存部分缺陷并設(shè)法為相關(guān)監(jiān)管提出輔助決策與分析建議,而研究成果的應(yīng)用則深化現(xiàn)實(shí)意義,在澳大利亞野火煙霧PM2.5時(shí)空特征分析、人口野火煙霧PM2.5暴露風(fēng)險(xiǎn)評(píng)估、野火顆粒物與相關(guān)疾病致死率關(guān)系研究等方面孵化研究成果。