999精品在线视频,手机成人午夜在线视频,久久不卡国产精品无码,中日无码在线观看,成人av手机在线观看,日韩精品亚洲一区中文字幕,亚洲av无码人妻,四虎国产在线观看 ?

基于集成學習XGBoost模型的降水客觀預報方法*

2022-10-14 02:55:40王證帥呂巧誼陳德花
海峽科學 2022年8期
關鍵詞:方法模型

王證帥 呂巧誼,2 張 偉,2 鄭 輝,2 陳德花,2

(1.廈門市海峽氣象開放重點實驗室,福建 廈門 361012;2.廈門市氣象臺,福建 廈門 361012)

1 研究背景

數值天氣預報是當前氣象預報最重要的手段之一,它主要以物理模擬來實現對環境大氣趨勢的預測,但數值天氣模式也存在一定的不準確性和一些系統性的偏差,從而導致天氣預測不夠準確。造成偏差的主要原因有經驗化的參數化方案的誤差、模式動力系統的不準確性、初始場的誤差等。為了減少數值模式帶來的誤差,蘇志重等開展了多模式降水融合預報研究,融合產品能夠接近最優確定性預報,但仍存在一定偏差[1]。近年來,人工智能技術越來越多地應用于天氣預報領域。基于數據驅動的機器學習算法,是從大量數據中通過融合多維數據作為特征輸入進行建模,以此來訓練預測模型,與傳統統計學方法具有較大差異,其使用的是算法模型,犧牲了可解釋性,提高預測的準確率。

國內外一些領先的氣象業務科研機構,如歐洲中期天氣數值預報中心、中國氣象科學研究院等,均已開展AI技術在氣象領域的應用,包括觀測數據質量控制、災害性天氣監測和識別、短時臨近預報、資料同化等[2-10]。越來越多的氣象科研工作者開展了一系列基于數值預報的客觀應用方法。例如,譚江紅等利用湖北省氣象站地面觀測溫度與歐洲中心再分析資料,建立了LightGBM模型,較數值預報模式產品提升明顯[11]。任萍等初步研發了一套基于機器學習方法XGBoost且考慮地形特征影響的數值預報多模式集成技術,有效降低模式的系統性誤差[12]。孫全德等基于三種機器學習算法(LASSO回歸、隨機森林和深度學習),對數值天氣預報模式ECMWF預測的華北地區近地面10 m風速進行訂正[13]。馬景奕等提出了一種基于長短期記憶神經網絡的氣象要素預測方法,進一步提升了氣象預測的準確性[14]。蔣薇等通過對比不同機器學習方法對江蘇省夏季降水開展預測試驗,發現深度神經網絡較傳統統計方法和其他機器學習方法有一定優勢[15]。

在氣象大數據的時代背景下,機器學習技術通過足夠多的數據驅動,獲取足夠多的觀測模型的準確性。為進一步在實際的預報業務中挖掘數值模式預報產品信息,提升降水預報的準確性。本文提出一種基于集成學習XGBoost模型的降水客觀預報方法(以下簡稱為客觀預報方法),通過決策專家系統對氣象要素特征進行提取和預處理,使用機器學習的方法對歷史數據進行訓練,從而實現對本地區的降水進行客觀預報。

2 數據選取

2.1 數據資料

本文選取2019年1月1日—2020年12月31日08時和20時(北京時)的ECMWF全球模式的細網格產品(以下簡稱為ECMWF模式資料)和地面實況降水觀測資料,形成機器學習訓練樣本。其中,模式資料包含風、降水、氣溫等產品,預報時效為0~72小時,時間間隔為6小時,空間分辨率為0.125°×0.125°;地面實況降水觀測資料,選取福建省70個國家級自動站(見圖1)相應時段的逐6小時累積降水資料,作為降水實況真實值。同時,在2021年6月1日—2021年10月31日08時和20時(北京時)的實際預報業務中,采用福建省70個國家級自動站的實況資料,檢驗本文客觀預報方法的預報效果。

圖1 福建省70個國家級自動站點分布

2.2 預報因子

選取使用ECMWF模式資料輸出的大尺度降水(LSP)和對流性降水(CRAIN)、不同的天氣形勢、不同的溫度,500hPa位勢高度場、地面2m最高氣溫等,共選擇7個氣象要素場(見表1),并將其作為機器學習算法的輸入,構建基于機器學習的客觀預報模型。

表1 ECMWF高分辨率數值預報因子列表

3 客觀預報方法

3.1 預報方法框架

本文提出了一種基于集成學習XGBoost模型的客觀預報方法,綜合考慮本地預報決策專家系統知識庫和集成學習XGBoost模型相結合,實現了基于ECMWF模式資料的客觀預報方法,實現了對福建省內70個國家級自動站點0~72小時降水預報。首先基于本地預報決策專家系統知識庫,對ECMWF模式資料輸出的各種要素特征進行數據預處理和特征選擇,獲得相關要素特征數據集,再以選擇的特征集進行機器學習建模,最后獲取福建地區70個站點的0~72小時預報結果?;诩蓪W習XGBoost模型的降水客觀預報方法整體架構設計見圖2。

圖2 基于集成學習XGBoost模型的降水客觀預報方法架構示意圖

客觀預報方法主要包含兩個部分:一是決策專家系統,二是集成學習XGBoost模型。決策專家系統主要用來對ECMWF模式資料的輸出進行選擇和預處理,提升資料的可用性和可靠性,經過決策專家系統處理后的數據與地面雨量觀測值共同組成訓練數據集;集成學習XGBoost算法模型是利用訓練數據集,通過不斷訓練獲得的,在后續的預測過程中可以直接調用。

3.1.1 決策專家系統

本方法涉及到的預處理,主要分為降水落區訂正和降水強度訂正,其目的是對現有的模式輸出進行初步訂正,從而進一步提高用于機器學習模型訓練的數據集準確性。

降水落區訂正是基于ECMWF模式資料歷史資料、雷達歷史回波、地面雨量觀測經驗,對降水落區進行調整,主要引入500hPa位勢高度和500hPa的引導氣流方向。將500hPa風向作為引導因子,對降水格點落區進行計算和調整,即增加500hPa風向來向,擴大進入模型的區域。

降水強度訂正是基于本地化氣候學經驗,使用EC自帶的大尺度降水(LSP)和對流性降水(CRAIN),分別選定閾值,進行消空,降低午后強對流的空報率,根據不同的天氣形勢、不同的溫度,選定不同的閾值。

3.1.2 集成學習模型

基于集成學習XGBoost的降水預報模型(見圖3)主要借鑒卷積和梯度提升決策樹的算法思想。該模型主要包含兩個部分:一是依托卷積進行空間特征提取,將格點數據通過卷積計算,獲得不同站點的關于降水預報的特征行向量;二是將卷積后得到的特征行向量,輸入梯度提升決策樹(XGBoost)模型,最后獲得對應時次的降水預報結果。

圖3 基于集成學習XGBoost的降水預報模型示意圖

3.2 預報方法描述

如圖4所示,客觀預報方法主要分為兩個過程,一是訓練過程,二是預測過程。訓練過程是獲取機器學習算法模型的過程,將ECMWF模式資料歷史數據進行決策專家系統訂正后,再與地面雨量觀測值一一對應,獲得訓練機器學習算法模型的數據集;將專家訂正后的ECMWF模式資料數據集作為模型輸入,地面雨量觀測值作為目標值,對預報方法模型進行訓練,最終獲得較優的機器學習算法模型。預測過程是獲取對應時次降水預報值的過程,將當前時次ECMWF模式資料的數據進行決策專家系統訂正后,輸入到機器學習算法模型中,最終獲得對應時次的降水預報值。

(a)訓練過程示意圖 (b)預測過程示意圖圖4 基于集成學習XGBoost模型的降水客觀預報方法流程

訓練過程中,采用格網搜索法(Grid Search)進行參數調優,為了評估模型的性能,對雨量使用平均絕對誤差作為損失函數,用來評估機器學習模型在訓練過程中的預報準確性。其詳細過程如下:

①決策專家系統選取特征值(見表1),并進行數據預處理。本文選取了2019—2020年每日08時和20時(北京時)的預報資料,共計1462個模式預報數據。針對各種模式輸出資料,選取目標站點所在的格點,并取該格點相鄰的格點數據(共9個格點數據);根據500hPa的引導氣流方向,增加拓展區域格點;對數值預報格點中的空值和異常值進行處理。之后對各要素值進行歸一化處理,提升訓練運算速度。

②構造數據集,選用2019—2020年福建省70個國家級自動站相應時段的6小時累積降水資料,作為降水實況,與ECMWF模式資料的輸出一一對應,構造數據集,并按照8∶2比例劃分成訓練數據集和測試數據集。

目前市場環境下,專業培訓機構往往停留在理論和早期項目案例層面,真正對于EPC工程總承包實操層面的培訓機制非常缺失,還需要施工企業有專業化部門和力量來建設人才隊伍、培養并發展人才,而且企業自身要加強經驗總結。

③集成學習模型訓練。將訓練數據集投入降水預報模型進行訓練,采用Adam優化器,其中學習率為10-3,每個訓練周期的迭代次數為10000,獲得降水客觀預報模型。

④集成學習模型迭代驗證。降水預測過程是選取對應時次的模式資料,進行數據預處理(同訓練過程),獲得預測輸入數據;將預測輸入數據集輸入到降水客觀預報模型中,獲得對應時次的降水預報值。最后,使用對應時次的地面雨量觀測值,評估預測模型的準確性。

4 檢驗與評估

本文開展檢驗評估時,將客觀預報方法預報的站點降水量、ECMWF模式預報的降水量,分別與相應觀測站的實況雨量進行對比檢驗。其中,ECMWF模式預報的降水量是通過經緯度選取最近的格點數據,插值到對應的站點上。評估檢驗方法,采用傳統二分類檢驗方法。

檢驗評估分別對08時、20時(北京時)起報的24小時預報時效進行逐6小時降水預報檢驗,48小時和72小時預報時效進行逐24小時降水預報檢驗。對于24小時預報,大雨以25mm為標準;對于6小時預報,以10mm為標準。

4.1 晴雨預報準確率

晴雨預報準確率計算公式為:

(1)

式(1)中,NA為有降水預報正確站(次)數,NB為空報站(次)數、NC為漏報站(次)數,ND為無降水預報正確的站(次)數。EH的值取值范圍為0%~100%,越接近100%,代表預報效果越好。

4.2 大雨以上降水預報TS評分

TS評分的計算公式為:

(2)

式(2)中,NA為有降水預報正確站(次)數,NB為空報站(次)數、NC為漏報站(次)數。同樣,TS的取值范圍為0%~100%,越接近100%,代表預報效果越好。

2021年6—11月,客觀預報方法的晴雨預報準確率對比分析的檢驗評估見圖5??陀^預報方法和ECMWF模式資料預報站點的晴雨準確率結果顯示,客觀預報方法的預報結果明顯優于ECMWF模式資料預報結果。

圖5 晴雨預報準確率對比分析

2021年6—11月,客觀預報方法的大雨以上預報TS評分對比分析見圖6。各預報時次中,預報站點的大雨以上TS評分檢驗情況在24h之內的客觀預報方法效果提升幅度明顯,其他時次客觀預報方法的預報結果相較于ECMWF模式資料預報的結果,也有大幅提升。

圖6 大雨以上預報TS評分對比分析

5 結論

基于集成學習XGBoost模型的降水客觀預報方法與本地預報決策專家系統相結合,利用集成學習XGBoost模型,深度挖掘數值模式ECMWF模式資料的降水產品信息,將多種氣象要素特征應用在降水預報上。結果表明,該方法有效提升了ECMWF模式資料的預報結果,提升降水的預報準確率,在業務應用中取得了良好效果。

該方法在使用過程中也存在一些問題。例如,預測的準確率還有上升空間,數值模式資料及氣象要素特征的選擇,機器學習模型及算法的選擇、參數的調整等,還需要大量實踐分析。建議今后進一步挖掘數值模式預報產品信息,提升客觀預報方法的準確性。

猜你喜歡
方法模型
一半模型
重要模型『一線三等角』
重尾非線性自回歸模型自加權M-估計的漸近分布
學習方法
3D打印中的模型分割與打包
用對方法才能瘦
Coco薇(2016年2期)2016-03-22 02:42:52
FLUKA幾何模型到CAD幾何模型轉換方法初步研究
四大方法 教你不再“坐以待病”!
Coco薇(2015年1期)2015-08-13 02:47:34
賺錢方法
捕魚
主站蜘蛛池模板: 国产精品一区二区在线播放| 久久窝窝国产精品午夜看片| 亚洲一区无码在线| 亚洲网综合| 久久国产乱子| 亚洲天堂伊人| 久久精品日日躁夜夜躁欧美| 亚洲激情99| 青青久视频| 亚洲成人播放| 欧美激情视频一区二区三区免费| 一级做a爰片久久免费| 中文天堂在线视频| 久久成人18免费| 亚洲熟女中文字幕男人总站 | 亚洲成在人线av品善网好看| 国产三区二区| 91麻豆精品视频| 99精品视频在线观看免费播放| 国产综合另类小说色区色噜噜 | 99精品欧美一区| 国产女主播一区| 国产白丝av| 伊人久久精品无码麻豆精品 | 天堂在线亚洲| 国产精品夜夜嗨视频免费视频| 欧美一区二区精品久久久| 一级毛片免费播放视频| 人人91人人澡人人妻人人爽 | 国产香蕉97碰碰视频VA碰碰看| 欧美中文字幕第一页线路一| 亚洲人妖在线| 国产乱人伦偷精品视频AAA| 国产尤物视频在线| 国产丝袜精品| 欧美在线观看不卡| 欧美人与性动交a欧美精品| 国产亚洲欧美在线人成aaaa| 制服丝袜一区二区三区在线| 久热中文字幕在线| 亚洲成人黄色在线观看| 亚洲日本韩在线观看| 天天综合网在线| 97在线公开视频| 欧美日韩久久综合| 亚洲精品国产精品乱码不卞 | 第一区免费在线观看| 看国产一级毛片| 日本一本正道综合久久dvd| 久久鸭综合久久国产| 欧美成人精品在线| 日韩人妻无码制服丝袜视频| 欧美一区二区精品久久久| 欧美69视频在线| 国产亚洲精品在天天在线麻豆 | 97青青青国产在线播放| 91精品网站| AV天堂资源福利在线观看| 精品国产女同疯狂摩擦2| 久久频这里精品99香蕉久网址| 国产综合另类小说色区色噜噜| 欧美亚洲一二三区| 中日韩一区二区三区中文免费视频| 久久综合五月| 国产成人91精品免费网址在线| 亚洲精品第1页| 亚洲va欧美va国产综合下载| 亚洲欧洲日本在线| 国产福利一区二区在线观看| 欧美在线天堂| 青草免费在线观看| 538国产视频| 国产99视频精品免费观看9e| 亚洲欧美综合另类图片小说区| 亚洲欧美日韩成人在线| 亚洲天堂免费在线视频| 狠狠色噜噜狠狠狠狠奇米777| 91久久国产热精品免费| 国产在线观看成人91| 亚洲日本中文字幕天堂网| 久久免费精品琪琪| 精品综合久久久久久97|