999精品在线视频,手机成人午夜在线视频,久久不卡国产精品无码,中日无码在线观看,成人av手机在线观看,日韩精品亚洲一区中文字幕,亚洲av无码人妻,四虎国产在线观看 ?

基于隨機(jī)森林的EC氣溫預(yù)報(bào)訂正研究

2022-08-29 03:29:34李月英石美亮
農(nóng)業(yè)災(zāi)害研究 2022年6期
關(guān)鍵詞:模型

李 韜,王 磊,李月英,石美亮

衡水市氣象局,河北衡水 053000

氣象要素預(yù)報(bào)是以動(dòng)力氣象學(xué)、天氣學(xué)、統(tǒng)計(jì)學(xué)以及氣象觀測(cè)資料等原理與數(shù)據(jù)為參考依據(jù),根據(jù)某一區(qū)域的天氣演變規(guī)律和氣候背景,對(duì)這一區(qū)域未來(lái)一定時(shí)段內(nèi)的天氣狀態(tài)做出定性或者定量的預(yù)測(cè)。而精細(xì)化格點(diǎn)氣象要素預(yù)報(bào)是一種將地區(qū)按既定范圍劃分成格點(diǎn)狀,以格點(diǎn)為單位做超精細(xì)化的格點(diǎn)氣象要素預(yù)報(bào)。精細(xì)化格點(diǎn)氣象要素預(yù)報(bào)是在所預(yù)報(bào)的地域生成所設(shè)定大小的分辨率格點(diǎn),每個(gè)格點(diǎn)代表了一定區(qū)域范圍內(nèi)的實(shí)時(shí)風(fēng)速、比濕、高度、溫度等各類氣象要素預(yù)報(bào)值,與傳統(tǒng)數(shù)值預(yù)報(bào)相比,精細(xì)化程度明顯提升。精細(xì)化格點(diǎn)氣象要素預(yù)報(bào)是未來(lái)天氣預(yù)報(bào)發(fā)展的主要方向。隨著國(guó)內(nèi)外氣象學(xué)者對(duì)機(jī)器學(xué)習(xí)技術(shù)的不斷深入研究,段文廣[1]等提出BP神經(jīng)網(wǎng)絡(luò)進(jìn)行精細(xì)化溫度預(yù)報(bào)的方法,該方法基于時(shí)序分析技術(shù),通過(guò)在歷史序列的溫度樣本進(jìn)行迭代學(xué)習(xí)來(lái)建立預(yù)測(cè)模型。門曉磊[2]等基于機(jī)器學(xué)習(xí)的3種后處理模型和4個(gè)數(shù)值天氣預(yù)報(bào)模式對(duì)氣溫預(yù)報(bào)進(jìn)行了多模式集合預(yù)報(bào)分析,效果表現(xiàn)較好。郭瀚陽(yáng)[3]等通過(guò)深度學(xué)習(xí)對(duì)強(qiáng)對(duì)流高分辨率臨近預(yù)報(bào)進(jìn)行試驗(yàn),發(fā)現(xiàn)相較傳統(tǒng)外推臨近預(yù)報(bào)方法,在強(qiáng)對(duì)流回波臨近預(yù)報(bào)準(zhǔn)確率上有較明顯的提高。方穎等[4-7]將機(jī)器學(xué)習(xí)技術(shù)應(yīng)用與氣象因子的預(yù)報(bào)訂和正領(lǐng)域,具有明顯的提升效果。

本文采用目前較為常用的隨機(jī)森林方法,對(duì)ECMWF數(shù)值天氣預(yù)報(bào)模式預(yù)測(cè)的2 m溫度進(jìn)行訂正。首先基于ECMWF模式計(jì)算所得的各種要素特征進(jìn)行特征選擇,即通過(guò)隨機(jī)森林算法獲得相關(guān)要素特征集,再以選擇的特征集進(jìn)行隨機(jī)森林建模,對(duì)ECMWF預(yù)測(cè)的未來(lái)3~24 h逐3 h溫度進(jìn)行訂正。為實(shí)現(xiàn)溫度的精細(xì)化預(yù)報(bào)提供新的方法和思路。

1 資料與方法

1.1 模式資料與實(shí)況資料

選取衡水站、石家莊站、邢臺(tái)站3個(gè)國(guó)家氣象觀測(cè)站。

模式資料來(lái)源于歐洲中期天氣預(yù)報(bào)中心,包含ECMWF數(shù)值天氣預(yù)報(bào)模式的各標(biāo)準(zhǔn)等壓面的溫濕度和近地面的風(fēng)、溫度、露點(diǎn)溫度、3 h降水量、海平面氣壓、地表溫度、總云覆蓋等歷史資料,資料時(shí)間序列為2015—2016年。模式起報(bào)時(shí)間均為20:00(北京時(shí)間),分辨率均為0.125°(緯度)×0.125°(經(jīng)度)。選取模式預(yù)報(bào)時(shí)效為03:00~24:00,時(shí)間間隔為3 h。實(shí)況數(shù)據(jù)是地面觀測(cè)站的1.5 m實(shí)況氣溫?cái)?shù)據(jù)。

1.2 資料處理

從原始模式數(shù)據(jù)中提取出格點(diǎn)的各標(biāo)準(zhǔn)等壓面的溫、濕度和近地面的風(fēng)、溫度、露點(diǎn)溫度、3 h降水量、海平面氣壓、地表溫度、總云覆蓋等資料。所使用方法為線性插值,3個(gè)站點(diǎn)插值坐標(biāo)為石家莊、衡水和邢臺(tái)。

1.3 數(shù)據(jù)清洗

為排除因系統(tǒng)故障或者數(shù)據(jù)存儲(chǔ)等原因造成的數(shù)據(jù)丟失、重復(fù)、錯(cuò)誤等問(wèn)題,需要對(duì)模式預(yù)報(bào)格點(diǎn)數(shù)據(jù)進(jìn)行清洗。同時(shí)為了滿足特殊網(wǎng)絡(luò)模型結(jié)構(gòu)的需要,還要對(duì)數(shù)據(jù)進(jìn)行轉(zhuǎn)換、重構(gòu)等預(yù)處理。在進(jìn)行數(shù)據(jù)清洗時(shí),重復(fù)值只獲取一次,缺失值則直接刪除。

1.4 數(shù)據(jù)標(biāo)準(zhǔn)化

因收集的數(shù)據(jù)較大,使得模型訓(xùn)練時(shí)間過(guò)長(zhǎng),同時(shí)各個(gè)氣象要素的單位不統(tǒng)一,不用要素間的數(shù)值之間可能幾個(gè)數(shù)量級(jí)的差別,因此還需要對(duì)數(shù)據(jù)進(jìn)行標(biāo)準(zhǔn)的歸一化的預(yù)處理。本文使用Z-Score算法,計(jì)算公式如下:

將原始數(shù)據(jù)按比例放縮到同一數(shù)量級(jí),其中,x為觀測(cè)值,y是氣象要素的總體數(shù)據(jù)均值,σ是總體數(shù)據(jù)的標(biāo)準(zhǔn)差。

1.5 氣象關(guān)鍵要素選擇及數(shù)據(jù)集構(gòu)成

基于數(shù)據(jù)驅(qū)動(dòng)的訂正方法需要從大量模式預(yù)報(bào)數(shù)據(jù)和實(shí)況數(shù)據(jù)中擬合出預(yù)報(bào)與實(shí)況之間的偏差關(guān)系,而模式預(yù)報(bào)數(shù)據(jù)包含要素較多,會(huì)影響到模型訓(xùn)練的效果,如何從眾多要素中獲取那些對(duì)溫度訂正最有效的關(guān)鍵要素,從而對(duì)特征空間維數(shù)進(jìn)行壓縮,即獲取一組“少而精”且回歸誤差小的要素集變得至關(guān)重要。為此,本文在EC預(yù)報(bào)要素與站點(diǎn)實(shí)況溫度基礎(chǔ)上,基于隨機(jī)森林對(duì)各氣象要素的重要性進(jìn)行重要性評(píng)估,比較特征之間的貢獻(xiàn)大小(在0~1之間數(shù)值越大代表相關(guān)性越大),篩選出與實(shí)況氣溫相關(guān)性較大的關(guān)鍵要素,進(jìn)行下一步處理。

將EC預(yù)報(bào)的2 m溫度、2 m露點(diǎn)溫度、10 m風(fēng)速等多種要素(表1)進(jìn)行隨機(jī)森林相關(guān)性評(píng)估,結(jié)果顯示1 000 hPa溫度相關(guān)系數(shù)為0.525、2 m溫度相關(guān)系數(shù)為0.349、925 hPa氣溫相關(guān)系數(shù)為0.074、850 hPa溫度相關(guān)系數(shù)為0.031、海平面氣壓和地表溫度相關(guān)系數(shù)為0.003、其他要素的重要性均在0.002以下。因此將EC預(yù)報(bào)的1 000 hPa溫度、2 m溫度、925 hPa溫度、850 hPa溫度、海平面氣壓和地表溫度等6個(gè)特征量與1個(gè)標(biāo)簽(與模式數(shù)據(jù)時(shí)間對(duì)應(yīng)的站點(diǎn)實(shí)際觀測(cè)1.5 m溫度)整合為數(shù)據(jù)集,即數(shù)據(jù)集包含6個(gè)特征和1個(gè)標(biāo)簽,再將資料(整體數(shù)據(jù)集)隨機(jī)分為訓(xùn)練集合和測(cè)試集。測(cè)試集為隨機(jī)選取3個(gè)站點(diǎn)的各1 000組數(shù)據(jù),剩余數(shù)據(jù)為訓(xùn)練集。

表1 EC預(yù)報(bào)要素

1.6 訂正結(jié)果評(píng)價(jià)指標(biāo)

評(píng)價(jià)指標(biāo)用于分析模型的訂正值和真實(shí)值之間存在的差異,數(shù)值越小說(shuō)明模型的訂正效果越好。本文選擇用RMSE(Root Mean Squared Error, 均方根誤差)作為衡量訂正模型優(yōu)劣的指標(biāo),RMSE是氣溫頂正值與氣溫實(shí)況值之差的平方和與觀測(cè)次數(shù)比值的平方根,其數(shù)學(xué)公式為:

2 隨機(jī)森林模型

隨機(jī)森林是Breiman提出的一種基于決策樹(shù)組合的可用于分類、回歸以及多維數(shù)據(jù)處理的機(jī)器學(xué)習(xí)算法,其基本組成單元為決策樹(shù),基本思想是二分遞歸分割法,在計(jì)算過(guò)程中充分利用二叉樹(shù),在一定的分割規(guī)則下將當(dāng)前樣本分割為2個(gè)子樣本集,使得生成的決策樹(shù)的每個(gè)非葉節(jié)點(diǎn)都有2個(gè)分枝,這個(gè)過(guò)程又在子樣本集上重復(fù)進(jìn)行,直至不可再分為葉節(jié)點(diǎn)為止,由于單棵決策樹(shù)模型往往精度不高,并且容易出現(xiàn)過(guò)擬合現(xiàn)象,因此需要通過(guò)聚集多個(gè)模型來(lái)提高預(yù)測(cè)精度。較傳統(tǒng)決策樹(shù)算法而言,該算法能夠平衡分布不均勻樣本的誤差,分類精度高,對(duì)異常值和噪聲有很好的容忍度[7]。

隨機(jī)森林訂正模型的構(gòu)建和優(yōu)化基于Python語(yǔ)言的scikit-learn類庫(kù)實(shí)現(xiàn)。主要工作流程為:(1)有放回的隨機(jī)抽取樣本數(shù)據(jù),形成新樣本集,且大小與原始樣本集保持一致。假設(shè)輸入N 個(gè)樣本數(shù)據(jù),那么新的樣本集也是N個(gè),此方法下得到的樣本集可能會(huì)有重復(fù)的樣本;(2)無(wú)放回隨機(jī)抽取特征。假設(shè)特征數(shù)為m,則中隨機(jī)抽取無(wú)重復(fù)的n個(gè)特征,作為該決策樹(shù)的輸入特征。正是因?yàn)殡S機(jī)森林遵循這兩點(diǎn),才使得隨機(jī)森林在不剪枝的情況下不容易出現(xiàn)過(guò)擬合現(xiàn)象。針對(duì)本文所研究的訂正問(wèn)題,將選定的6個(gè)EC預(yù)報(bào)要素作為特征輸入隨機(jī)森林訂正模型,建立多個(gè)決策樹(shù)“森林”(圖1)。本文通過(guò)網(wǎng)格搜索算法,從參數(shù)組合中尋找最佳超參數(shù)配置。

圖1 隨機(jī)森林結(jié)構(gòu)示意圖

3 訂正結(jié)果分析

3.1 總體訂正能力分析

通過(guò)模型對(duì)3個(gè)站點(diǎn)的EC預(yù)報(bào)2 m溫度進(jìn)行訂正后,發(fā)現(xiàn)訂正后溫度誤差基本都處于正負(fù)2℃范圍內(nèi)(圖2),因此也具有參考性。從表2可知,模型對(duì)衡水、石家莊、邢臺(tái)的正確訂正率分別為52%、65%、71%,訂正后的3個(gè)站點(diǎn)均方跟誤差均減小,也說(shuō)明模型具有正向訂正能力。邢臺(tái)站的均方根誤差從2.27℃降至1.62℃,訂正能力最強(qiáng);石家莊站均方根誤差從2.01℃降至1.58℃,訂正能力略低于邢臺(tái)站;衡水站的均方根誤差從1.61℃降至1.55℃,模型對(duì)衡水站的訂正能力有限,原因是EC對(duì)衡水站的溫度預(yù)報(bào)較為準(zhǔn)確,導(dǎo)致模型較難使訂正溫度準(zhǔn)確率有所提升。

圖2 RF訂正效果散點(diǎn)圖

表2 RF模型結(jié)果

3.2 不同溫度區(qū)間訂正能力分析

通過(guò)對(duì)3個(gè)站點(diǎn)不同溫度區(qū)間均方根誤差分析發(fā)現(xiàn)(圖3),在衡水站,對(duì)0℃~29.9℃范圍的氣溫實(shí)現(xiàn)了有效訂正,且對(duì)0℃~9.9℃范圍的訂正能力最強(qiáng),均方根誤差減少了0.3℃,對(duì)30℃以上和0℃以下的氣溫?zé)o訂正能力。在對(duì)石家莊站的訂正中發(fā)現(xiàn),除30℃以上氣溫訂正為無(wú)效訂正外,其他溫度范圍訂正均為有效訂正,且對(duì)0℃~9.9℃范圍的訂正能力最強(qiáng),均方根誤差減少了0.7℃,對(duì)0℃以下的氣溫訂正能力較弱。在對(duì)邢臺(tái)站的訂正中,對(duì)所有溫度區(qū)間的訂正能力均為正技巧,且對(duì)0℃~9.9℃范圍的訂正能力最強(qiáng),均方根誤差減少了0.8℃,對(duì)30℃以上和0℃以下的氣溫訂正能力較弱。

圖3 不同溫度區(qū)間的均方根誤差

4 結(jié)論

(1)模型總體而言對(duì)3個(gè)站點(diǎn)的基本實(shí)現(xiàn)了有效訂正值,因此訂正結(jié)果具有一定的可參考性,且訂正能力最強(qiáng)為邢臺(tái)站,石家莊站次之,對(duì)衡水站訂正能力有限。

(2)總體而言模型對(duì)衡水站的訂正能相對(duì)有限,可能原因是衡水地處平原地區(qū),氣象要素變化相對(duì)而言簡(jiǎn)單,EC對(duì)該站的預(yù)報(bào)能力較強(qiáng),導(dǎo)致模型對(duì)該站點(diǎn)的訂正較難。

(3)模型對(duì)0℃~9.9℃區(qū)間內(nèi)的溫度訂正能力最強(qiáng),對(duì)30℃及0℃以下的氣溫訂正能力相對(duì)較弱。

猜你喜歡
模型
一半模型
一種去中心化的域名服務(wù)本地化模型
適用于BDS-3 PPP的隨機(jī)模型
提煉模型 突破難點(diǎn)
函數(shù)模型及應(yīng)用
p150Glued在帕金森病模型中的表達(dá)及分布
函數(shù)模型及應(yīng)用
重要模型『一線三等角』
重尾非線性自回歸模型自加權(quán)M-估計(jì)的漸近分布
3D打印中的模型分割與打包
主站蜘蛛池模板: 国产剧情伊人| 三上悠亚精品二区在线观看| 久久久黄色片| 久久综合九色综合97网| 1769国产精品视频免费观看| 国产96在线 | 亚洲精品第五页| h网址在线观看| 国产免费福利网站| 在线观看亚洲精品福利片| 激情网址在线观看| 热热久久狠狠偷偷色男同| 亚洲妓女综合网995久久| 日韩精品成人在线| 91亚瑟视频| 日韩欧美高清视频| 最新日韩AV网址在线观看| 色偷偷av男人的天堂不卡| 国产欧美另类| 国产无码精品在线| 91一级片| 久久精品中文无码资源站| 欧美一级大片在线观看| 色综合a怡红院怡红院首页| 久久香蕉国产线看精品| 亚洲欧美不卡中文字幕| 57pao国产成视频免费播放| 天天躁狠狠躁| 日韩人妻无码制服丝袜视频| 992tv国产人成在线观看| 三上悠亚精品二区在线观看| 国产第二十一页| 亚洲成人网在线播放| 亚洲精品天堂自在久久77| 亚洲国产AV无码综合原创| 久久久精品久久久久三级| 久久久久国产精品免费免费不卡| 毛片基地视频| 视频二区欧美| 天堂成人av| 91福利国产成人精品导航| 少妇高潮惨叫久久久久久| 99ri国产在线| 亚洲精品无码抽插日韩| 亚洲综合第一区| 国产精品成人免费综合| 视频一区亚洲| 妇女自拍偷自拍亚洲精品| 精品日韩亚洲欧美高清a| 无码综合天天久久综合网| 免费精品一区二区h| 国产日产欧美精品| 国产主播在线一区| 亚洲欧美日韩成人在线| 久草视频精品| 国产va在线观看| 天堂中文在线资源| 国产成人精品在线| 亚亚洲乱码一二三四区| 一区二区三区四区在线| 亚洲第一成年网| 超碰91免费人妻| 国产精品吹潮在线观看中文| 毛片视频网| 无遮挡国产高潮视频免费观看| 第九色区aⅴ天堂久久香| 欧美国产视频| 国产精品成人AⅤ在线一二三四| 亚洲人成在线精品| 91精品专区| 中文纯内无码H| 97色婷婷成人综合在线观看| 国产1区2区在线观看| 国内视频精品| 久青草国产高清在线视频| 国产三区二区| 91无码网站| 久久亚洲中文字幕精品一区| 久久无码免费束人妻| 在线无码九区| 亚洲午夜福利在线| 色噜噜综合网|