毛 波, 楊 昊,, 周世杰, 楊康權(quán), 陳 敏
(1.成都信息工程大學(xué)計(jì)算機(jī)學(xué)院,四川 成都 610225;2.電子科技大學(xué)信息與軟件工程學(xué)院,四川 成都 610054;3.四川省氣象臺(tái),四川 成都 610072;4.四川省氣象局重點(diǎn)實(shí)驗(yàn)室,四川 成都 610072)
風(fēng)能作為一種高效清潔的新能源,其巨大的發(fā)展?jié)摿σ鹆藝鴥?nèi)外廣泛的重視。實(shí)現(xiàn)準(zhǔn)確的風(fēng)速預(yù)測(cè)能夠有效地提高風(fēng)能資源的利用率,降低風(fēng)功率波動(dòng)對(duì)電網(wǎng)穩(wěn)定性的影響,從而提升風(fēng)電場(chǎng)的經(jīng)濟(jì)效益[1]。集合數(shù)值預(yù)報(bào)模式由于提供了關(guān)于天氣預(yù)報(bào)的不確定性信息,相比于單一的確定性數(shù)值預(yù)報(bào)模式,往往能夠得到更準(zhǔn)確的風(fēng)速預(yù)報(bào)結(jié)果,現(xiàn)已在全球多個(gè)國家的天氣業(yè)務(wù)預(yù)報(bào)中心實(shí)現(xiàn)常規(guī)運(yùn)行[2]。但在實(shí)際應(yīng)用中,由于集合預(yù)報(bào)模式設(shè)計(jì)之初的各種不完美以及大氣系統(tǒng)的不確定性,集合預(yù)報(bào)模式一直存在系統(tǒng)性誤差,從而造成風(fēng)速預(yù)報(bào)的結(jié)果出現(xiàn)系統(tǒng)性偏差。為了滿足更加精確和可靠的風(fēng)速預(yù)報(bào)需求,需要對(duì)集合數(shù)值預(yù)報(bào)模式的結(jié)果進(jìn)行偏差訂正,以提升模式對(duì)風(fēng)速的預(yù)報(bào)能力。
目前,受限于風(fēng)場(chǎng)本身所具有的變性特征,國內(nèi)對(duì)風(fēng)場(chǎng)集合預(yù)報(bào)結(jié)果偏差訂正的方法還是多以傳統(tǒng)的統(tǒng)計(jì)訂正方法為主[3],如集合模式輸出統(tǒng)計(jì)法[4]和貝葉斯模型平均法[5]。這類訂正方法均通過建立線性統(tǒng)計(jì)模型來訂正風(fēng)場(chǎng)集合預(yù)報(bào)的誤差,對(duì)于風(fēng)場(chǎng)變化的隨機(jī)特征,傳統(tǒng)的線性統(tǒng)計(jì)模型往往不能很好地捕捉其中的非線性關(guān)系。隨著近年來計(jì)算機(jī)硬件設(shè)備的不斷提升以及人工智能技術(shù)的蓬勃發(fā)展,國內(nèi)外氣象領(lǐng)域的研究人員開始逐步結(jié)合機(jī)器學(xué)習(xí)方法或深度學(xué)習(xí)方法對(duì)數(shù)值預(yù)報(bào)模式結(jié)果進(jìn)行偏差訂正,實(shí)現(xiàn)風(fēng)速的精細(xì)化預(yù)報(bào)。Lahouar A 等[6]使用隨機(jī)森林的機(jī)器學(xué)習(xí)方法,建立了提前一小時(shí)的風(fēng)速預(yù)測(cè)模型。與其他大多數(shù)機(jī)器學(xué)習(xí)方法相比,隨機(jī)森林方法不需要進(jìn)行調(diào)整或優(yōu)化,結(jié)果表明,使用該模型的風(fēng)速預(yù)報(bào)精度有顯著的提高。孫全德等[7]使用常見的幾種機(jī)器學(xué)習(xí)算法(LASSO 回歸、隨機(jī)森林等)對(duì)數(shù)值天氣預(yù)報(bào)模式ECMWF 預(yù)測(cè)的華北地區(qū)近地面10 m風(fēng)速進(jìn)行訂正,將訂正結(jié)果與傳統(tǒng)訂正方法得到的訂正結(jié)果進(jìn)行對(duì)比。結(jié)果表明,基于機(jī)器學(xué)習(xí)算法的風(fēng)速訂正方法效果均好于傳統(tǒng)訂正方法,顯示了機(jī)器學(xué)習(xí)方法提升數(shù)值預(yù)報(bào)風(fēng)速預(yù)報(bào)精度的潛力。但上述機(jī)器學(xué)習(xí)方法僅限于對(duì)確定性數(shù)值預(yù)報(bào)的數(shù)據(jù)進(jìn)行偏差訂正,尚未對(duì)集合數(shù)值預(yù)報(bào)模式進(jìn)行嘗試。且機(jī)器學(xué)習(xí)較依賴于復(fù)雜的特征工程,將機(jī)器學(xué)習(xí)應(yīng)用于模式的偏差訂正時(shí),需要研究人員具備專業(yè)的氣象知識(shí)和大量的時(shí)間,使訓(xùn)練過程成本偏高且十分具有挑戰(zhàn)性。
深度學(xué)習(xí)作為機(jī)器學(xué)習(xí)的一種特定形式,由于不需要進(jìn)行特征工程,因此在對(duì)海量數(shù)據(jù)進(jìn)行非線性建模時(shí)具有更大的優(yōu)勢(shì)。過去十年中,深度學(xué)習(xí)已在計(jì)算機(jī)視覺、語音識(shí)別及自然語言處理等多個(gè)領(lǐng)域取得了豐富的成果,為人類社會(huì)的進(jìn)步和發(fā)展帶來了極大的幫助。對(duì)于大氣系統(tǒng)所具有的特殊的高度非線性特征,深度學(xué)習(xí)現(xiàn)已成為人工智能領(lǐng)域與大氣科學(xué)領(lǐng)域交叉應(yīng)用的研究熱點(diǎn)和主流發(fā)展方向。Stephan Rasp等[8]率先使用深度神經(jīng)網(wǎng)絡(luò)在分布回歸框架中對(duì)集合預(yù)報(bào)預(yù)測(cè)的2 m溫度進(jìn)行偏差訂正實(shí)驗(yàn),將連續(xù)分級(jí)概率評(píng)分(continuous ranked probability score,CRPS)作為其模型的損失函數(shù)。該實(shí)驗(yàn)的局限在于只考慮單一站點(diǎn)位置以及單一天氣變量的偏差訂正,對(duì)目前的數(shù)值預(yù)報(bào)模式生成的二維網(wǎng)格數(shù)據(jù)不具有適用性。對(duì)于二維網(wǎng)格數(shù)據(jù)所具有的空間特性,需考慮使用諸如卷積神經(jīng)網(wǎng)絡(luò)[9]等方法來提取其空間特征。受此啟發(fā), Gr?nquist Peter 等[10]基于Unet 模型搭建了集合預(yù)報(bào)的偏差訂正模型,結(jié)果表明其模型在CRPS 評(píng)分方面相比于傳統(tǒng)訂正方法取得了超過14%的相對(duì)改進(jìn)。L Han 等[11]基于Unet 提出了一個(gè)CU-net(Correction U-net)模型,將格點(diǎn)預(yù)報(bào)數(shù)據(jù)的偏差訂正問題轉(zhuǎn)化為深度學(xué)習(xí)中的圖像識(shí)別問題,對(duì)ECMWF-IFS 模式的格點(diǎn)預(yù)報(bào)數(shù)據(jù)進(jìn)行訂正,也取得了不錯(cuò)的訂正效果。張延彪等[12]為進(jìn)一步加強(qiáng)CU-net 模型對(duì)復(fù)雜的氣象格點(diǎn)數(shù)據(jù)的偏差訂正能力,引入稠密卷積模塊[13](Denseblock)對(duì)CU-net 進(jìn)行改進(jìn),構(gòu)建了Dense-CUnet模型。上述研究雖然都對(duì)格點(diǎn)預(yù)報(bào)數(shù)據(jù)的偏差訂正有較好的效果,但考慮到格點(diǎn)預(yù)報(bào)數(shù)據(jù)的空間特征,仍存在一些不足,主要體現(xiàn)在沒有考慮模型對(duì)格點(diǎn)預(yù)報(bào)數(shù)據(jù)的時(shí)間維度特征的提取融合。
集合數(shù)值預(yù)報(bào)模式預(yù)報(bào)的格點(diǎn)數(shù)據(jù)具有復(fù)雜的空間特征和時(shí)間特征,屬于典型的時(shí)空序列數(shù)據(jù)。對(duì)這類數(shù)據(jù)進(jìn)行偏差訂正的深度學(xué)習(xí)方法,本文引入時(shí)空序列預(yù)測(cè)問題常用到的ConvLSTM 模型[14]對(duì)CMAREPS 預(yù)報(bào)的近地面(10 m)風(fēng)速格點(diǎn)數(shù)據(jù)進(jìn)行偏差訂正,訂正的預(yù)報(bào)時(shí)間為24 h、48 h和72 h。將訂正結(jié)果與CMA-REPS 原始預(yù)報(bào)數(shù)據(jù)和Unet 模型得到的結(jié)果進(jìn)行對(duì)比,結(jié)果表明該模型方法能進(jìn)一步提升集合數(shù)值預(yù)報(bào)模式風(fēng)場(chǎng)格點(diǎn)數(shù)據(jù)的預(yù)報(bào)精度。
CMA-REPS 是中國氣象局自主研發(fā)的新一代區(qū)域集合預(yù)報(bào)系統(tǒng),其前身是GRAPES-REPS(global and regional assimilation and prediction enhanced system-regional ensemble prediction system)區(qū)域集合預(yù)報(bào)系統(tǒng),基于中國自主研究并建立的新一代多尺度通用資料同化與數(shù)值天氣預(yù)報(bào)系統(tǒng)-GRAPES 的區(qū)域模式發(fā)展而來[15-16]。集合預(yù)報(bào)擾動(dòng)方法對(duì)集合預(yù)報(bào)的可靠性提升極為重要,當(dāng)前CMA-REPS 初值擾動(dòng)采用6 h循環(huán)計(jì)算方案的GRAPES 模式面集合變換卡爾曼濾波[17];模式擾動(dòng)采用單一物理過程參數(shù)化方案與隨機(jī)物理過程傾向項(xiàng)(stochastic perturbed parameterization tendencies, SPPT)[18]組合;邊界擾動(dòng)通過提取GRAPESGEPS(global and regional assimilation and prediction enhanced system-global ensemble prediction system)全球集合預(yù)報(bào)系統(tǒng)擾動(dòng)成員相比于自身控制預(yù)報(bào)的擾動(dòng)測(cè)邊界,并疊加在CMA-REPS 的控制預(yù)報(bào)測(cè)邊界上得到[19]。CMA-REPS 參數(shù)配置如表1 所示,其水平分辨率為0.1°,垂直分辨率為50 層,集合預(yù)報(bào)成員數(shù)15個(gè),預(yù)報(bào)區(qū)域?yàn)橹袊鴧^(qū)域,預(yù)報(bào)時(shí)效84 h(00 時(shí),12 時(shí)(協(xié)調(diào)世界時(shí))),6 h(06 時(shí),18 時(shí)(協(xié)調(diào)世界時(shí)))。CMA-REPS 中的控制預(yù)報(bào)初值和側(cè)邊界來源于NCEPGFS(national centers for environmental prediction-global forecast system)全球模式的預(yù)報(bào)場(chǎng);并且CMA-REPS加入了云分析同化技術(shù)與條件性臺(tái)風(fēng)渦旋重定位技術(shù)[20],以期提高短臨降水和臺(tái)風(fēng)預(yù)報(bào)能力。CMAREPS 具體參數(shù)配置見表1。

表1 CMA-REPS 具體參數(shù)配置
集合數(shù)值預(yù)報(bào)模式的格點(diǎn)預(yù)報(bào)數(shù)據(jù)是在時(shí)間上連續(xù)分布的空間數(shù)據(jù)[21],具有典型的時(shí)空特征。僅靠單一的基于CNN 的深度學(xué)習(xí)模型如Unet,雖然可以有效地提取格點(diǎn)預(yù)報(bào)數(shù)據(jù)復(fù)雜的空間分布特征,但無法捕捉數(shù)據(jù)的時(shí)間序列信息。隨著深度學(xué)習(xí)的發(fā)展,LSTM(long short-term memory)對(duì)于氣象要素站點(diǎn)數(shù)據(jù)的序列預(yù)測(cè)能力得到了驗(yàn)證。因此,考慮將時(shí)間成分納入深度學(xué)習(xí)模型(例如通過使用LSTM),可以進(jìn)一步提高深度學(xué)習(xí)模型對(duì)集合數(shù)值預(yù)報(bào)模式格點(diǎn)預(yù)報(bào)數(shù)據(jù)的偏差訂正能力。但是,傳統(tǒng)的長短期記憶單元無法實(shí)現(xiàn)對(duì)空間特征的提取。基于此,引入ConvLSTM 模型,嘗試對(duì)CMA-REPS 預(yù)報(bào)的近地面(10 m)風(fēng)速格點(diǎn)數(shù)據(jù)進(jìn)行偏差訂正。ConvLSTM 模型是Shi 等[14]為解決時(shí)空序列預(yù)測(cè)問題,結(jié)合卷積神經(jīng)網(wǎng)絡(luò)對(duì)數(shù)據(jù)空間特征的提取與編碼能力及長短期記憶網(wǎng)絡(luò)的序列特征編碼特性而提出的。
ConvLSTM 的單元結(jié)構(gòu)圖如圖1 所示。由圖1 可以看到,ConvLSTM 是LSTM 結(jié)構(gòu)的一種變體,通過遺忘門(ft)、輸入門(it)和輸出門(ot)控制數(shù)據(jù)在細(xì)胞內(nèi)部的交流。各個(gè)門控制數(shù)據(jù)參與到細(xì)胞狀態(tài)的更新,通過門來選擇性地保留或舍棄信息。ConvLSTM 與LSTM 的區(qū)別在于ConvLSTM 在“輸入到狀態(tài)”和“狀態(tài)到狀態(tài)”兩部分都采用卷積運(yùn)算來代替矩陣乘法,并且其所有的輸入X1,…,Xt,細(xì)胞輸出C1,…,Ct,隱藏狀態(tài)H1,…,Ht,和遺忘門(ft)、輸入門(it)和輸出門(ot)都是3 維張量,這樣做的好處是在提取序列的空間信息同時(shí),可以去除大量空間冗余特征并且解決數(shù)據(jù)的時(shí)間依賴問題。

圖1 ConvLSTM 單元結(jié)構(gòu)圖
ConvLSTM 門之間的傳遞關(guān)系如下:
式中it為輸入門,ft為遺忘門,Ct為細(xì)胞狀態(tài),ot為輸出門,Ht為隱藏層輸出,*表示卷積運(yùn)算符, 表示Hadamard 乘積,σ為sigmoid 激活函數(shù)。遺忘門可以控制信息的遺忘,丟棄被認(rèn)為冗余的信息,保留有用的信息并將其向后傳遞;繼續(xù)傳遞的信息進(jìn)到輸入門,通過sigmoid 層確定需要更新的信息,并通過tanh 層得到新的細(xì)胞信息對(duì)細(xì)胞進(jìn)行更新。最后通過輸出門中的sigmoid 的信息乘以通過tanh 的記憶細(xì)胞的信息得到模型的最終輸出。
對(duì)于本文的集合數(shù)值預(yù)報(bào)模式風(fēng)場(chǎng)格點(diǎn)預(yù)報(bào)數(shù)據(jù)的偏差訂正問題,通過堆疊多個(gè)ConvLSTM 網(wǎng)絡(luò)層搭建偏差訂正模型,模型結(jié)構(gòu)如圖2 所示。模型輸入由Yt和Pt+△t組成,其中Yt是2t、10u、10v和10w這4 個(gè)要素在t時(shí)刻的實(shí)況數(shù)據(jù),Pt+△t是2t、10u、10v及10w在t時(shí)刻的△t小時(shí)集合平均預(yù)報(bào)數(shù)據(jù),△t可取的值有24、48 和72。將實(shí)況數(shù)據(jù)Yt與預(yù)報(bào)數(shù)據(jù)Pt+△t拼接在一起,得到的模型輸入數(shù)據(jù)大小為101×101×8。輸入數(shù)據(jù)經(jīng)過最小最大值歸一化后進(jìn)入兩個(gè)ConvLSTM2D網(wǎng)絡(luò)層,最后經(jīng)過一層全連接層輸出偏差訂正后的CMA-REPS 的△t預(yù)報(bào)數(shù)據(jù)。兩層ConvLSTM-2D 網(wǎng)絡(luò)層卷積核數(shù)目均為10,考慮數(shù)據(jù)本身的特征分布和網(wǎng)格分辨率大小,選用3×3 大小的卷積核以避免丟失局部特征,并且卷積過程中使用填充設(shè)置使中間過程生成的特征圖大小一致。輸出層(全連接層)的神經(jīng)元個(gè)數(shù)為1,其激活函數(shù)為ReLu,用以提高模型的非線性表達(dá)能力。在每個(gè)ConvLSTM-2D 網(wǎng)絡(luò)層后加入批標(biāo)準(zhǔn)化層,通過對(duì)每層的輸出進(jìn)行批標(biāo)準(zhǔn)化處理,防止模型出現(xiàn)訓(xùn)練過擬合的同時(shí)加速模型訓(xùn)練的收斂過程。

圖2 基于ConvLSTM 的風(fēng)速訂正模型結(jié)構(gòu)圖
在模型訓(xùn)練過程中,使用Adam[22]作為模型的優(yōu)化器,其學(xué)習(xí)率設(shè)為0.001,一階矩估計(jì)的指數(shù)衰減率設(shè)為0.9,二階矩估計(jì)的指數(shù)衰減率設(shè)為0.999。Adam算法相比于傳統(tǒng)的隨機(jī)梯度下降算法,可以通過計(jì)算梯度的階矩為不同的參數(shù)設(shè)計(jì)獨(dú)立的自適應(yīng)性學(xué)習(xí)率,并且擁有更高效的計(jì)算效率。訓(xùn)練的每一批數(shù)據(jù)大小batchsize 設(shè)為10,并選取均方誤差(MSE)作為模型的損失函數(shù):
式中yi和分別代表訓(xùn)練集中的觀測(cè)值和經(jīng)模型訓(xùn)練后的訂正值,n代表訓(xùn)練集樣本數(shù)量。
選取CMA-REPS 預(yù)報(bào)的格點(diǎn)數(shù)據(jù)作為預(yù)報(bào)數(shù)據(jù),采用第五代ECMWF 全球再分析產(chǎn)品(ERA5)數(shù)據(jù)作為格點(diǎn)“實(shí)況”數(shù)據(jù)。其中,CMA-REPS 的格點(diǎn)預(yù)報(bào)數(shù)據(jù)的空間分辨率為0.1°×0.1°,網(wǎng)格數(shù)為751×501,空間范圍為10 °N ~60 °N、70 °E ~145 °E(2022年6月7日之前的空間范圍為15 °N ~65 °N、70 °E ~145 °E),起報(bào)時(shí)間為00UTC 和12UTC,預(yù)報(bào)時(shí)效為0-84 h(逐小時(shí)),成員數(shù)為15。ERA5 數(shù)據(jù)的空間分辨率為0.1°×0.1°,網(wǎng)格數(shù)為101×101,空間范圍為32 °N~42 °N、110 °E ~120 °E。對(duì)CMA-REPS 預(yù)報(bào)的華北地區(qū)近地面10 m風(fēng)速格點(diǎn)數(shù)據(jù)進(jìn)行偏差訂正,因此需要將CMA-REPS 的格點(diǎn)預(yù)報(bào)數(shù)據(jù)裁剪成網(wǎng)格數(shù)為101×101,空間范圍為華北地區(qū)(32 °N ~42 °N、110 °E ~120 °E),并選取預(yù)報(bào)時(shí)效為24 h、48 h以及72 h的2 m氣溫(2t)、10 m風(fēng)速(10u:東西風(fēng);10v:南北風(fēng))的預(yù)報(bào)數(shù)據(jù)。兩套數(shù)據(jù)的時(shí)間范圍均為2019年10月20日至2022年5月1日。
首先將10 m 緯向風(fēng)分量(u)和10 m經(jīng)向風(fēng)分量(v)合成為10 m風(fēng)速(w),合成公式:
現(xiàn)在選取的CMA-REPS 預(yù)報(bào)數(shù)據(jù)和ERA5 數(shù)據(jù)包含的氣象要素有2t、10u、10v和10w,然后對(duì)兩套數(shù)據(jù)進(jìn)行質(zhì)量控制,檢測(cè)數(shù)據(jù)中是否存在缺失值或異常值。經(jīng)檢測(cè),ERA5 4 個(gè)要素的數(shù)據(jù)均存在缺失值。這是由于ECMWF 數(shù)值模式預(yù)報(bào)資料數(shù)量大,存儲(chǔ)空間占比高,導(dǎo)致資料在存儲(chǔ)過程中出現(xiàn)數(shù)據(jù)缺失。針對(duì)格點(diǎn)預(yù)報(bào)數(shù)據(jù)空間上存在連續(xù)性的特點(diǎn),ERA5 缺失值采用相鄰非缺失值線性插值方法進(jìn)行補(bǔ)缺。
為了防止模型訓(xùn)練出現(xiàn)過擬合的現(xiàn)象,提升模型的泛化能力,還需要將所選數(shù)據(jù)分為訓(xùn)練集、驗(yàn)證集和測(cè)試集。由于實(shí)驗(yàn)訂正的預(yù)報(bào)時(shí)間為24 h、48 h 和72 h,因此將數(shù)據(jù)分為3 組,每組選取2019年10月20日至2021年4月30日的對(duì)應(yīng)預(yù)報(bào)時(shí)效的數(shù)據(jù)為訓(xùn)練集,2021年5月1日至2021年10月31日對(duì)應(yīng)預(yù)報(bào)時(shí)效的數(shù)據(jù)為驗(yàn)證集,2021年11月1日至2022年5月1日對(duì)應(yīng)預(yù)報(bào)時(shí)效的數(shù)據(jù)為測(cè)試集。在單個(gè)訓(xùn)練數(shù)據(jù)集合中,以訂正24 h預(yù)報(bào)數(shù)據(jù)為例,模型輸入數(shù)據(jù)為起報(bào)時(shí)間t的ERA5 實(shí)況格點(diǎn)數(shù)據(jù)和CMA-REPS 的24 h預(yù)報(bào)數(shù)據(jù),訓(xùn)練標(biāo)簽為t+24 h的ERA5 實(shí)況格點(diǎn)數(shù)據(jù)。
采用ConvLSTM 深度學(xué)習(xí)模型對(duì)CMA-REPS 模式預(yù)報(bào)的華北地區(qū)近地面10 m 風(fēng)場(chǎng)數(shù)據(jù)(10u、10v和10w)進(jìn)行偏差訂正,訂正的預(yù)報(bào)時(shí)效為24 h、48 h和72 h,并將訂正結(jié)果分別與CMA-REPS 原始預(yù)報(bào)結(jié)果、EMOS 方法訂正結(jié)果和Unet 模型訂正結(jié)果進(jìn)行比較,同時(shí)結(jié)合ERA5 再分析場(chǎng)對(duì)模型的訂正能力進(jìn)行客觀檢驗(yàn)。對(duì)于模型訂正性能的衡量,使用均方根誤差(RMSE)來評(píng)估模型的訂正效果。RMSE 的計(jì)算公式如下:
式中n代表測(cè)試集樣本數(shù)量,yi和?yi分別代表測(cè)試集的觀測(cè)值和模型訂正值。
圖3 顯示了CMA-REPS、Unet 模型和ConvLSTM模型對(duì)測(cè)試集24 h、48 h及72 h預(yù)報(bào)的10u數(shù)據(jù)進(jìn)行偏差訂正的RMSE 對(duì)比結(jié)果。由圖3 可以看出,使用ConvLSTM 模型訂正的預(yù)報(bào)結(jié)果相比CMA-REPS 原始預(yù)報(bào)數(shù)據(jù)和Unet 模型的訂正結(jié)果要更貼近于實(shí)況數(shù)據(jù)。尤其對(duì)24 h預(yù)報(bào)的10u數(shù)據(jù)的訂正效果最好,ConvLSTM 模型的RMSE 比CMA-REPS 降低36.57%,比Unet 模型降低15.73%。訂正效果其次的是對(duì)72 h預(yù)報(bào)的10u數(shù)據(jù)的訂正,RMSE 比CMA-REPS 和Unet 模型分別降低了14.83%和4.91%。對(duì)于48 h預(yù)報(bào)的10u數(shù)據(jù)的訂正,ConvLSTM 模型相比于Unet 模型提升效果微乎其微,RMSE 僅降低0.54%,但相比CMA-REPS原始預(yù)報(bào)數(shù)據(jù),RMSE 降低了6.46%,依舊取得不錯(cuò)的偏差訂正效果。

圖3 24 h、48 h 及72 h 預(yù)報(bào)10u 訂正前后RMSE 對(duì)比圖
圖4 顯示了2022年4月4日00 時(shí)24 h預(yù)報(bào)的10u訂正結(jié)果,可見CMA-REPS(圖4b)原始預(yù)報(bào)數(shù)據(jù)整體誤差較大,經(jīng)過Unet 模型(圖4c)和ConvLSTM 模型(圖4d)訂正后誤差有明顯的改善,并且ConvLSTM 模型訂正的結(jié)果從整體上更趨近于ERA5(圖4a),著重體現(xiàn)在研究區(qū)域的東部沿海和北部地區(qū)。

圖4 2022年4月4日00 時(shí)24 h 預(yù)報(bào)10u 訂正結(jié)果
圖5 顯示了CMA-REPS、Unet 模型和ConvLSTM 模型對(duì)測(cè)試集24 h、48 h及72 h預(yù)報(bào)的10v數(shù)據(jù)進(jìn)行偏差訂正的RMSE 對(duì)比結(jié)果。可以看出,ConvLSTM 模型得到的預(yù)報(bào)數(shù)據(jù)效果更好。其中效果最好的是48 h預(yù)報(bào)的10v數(shù)據(jù),與CMA-REPS 和Unet 模型相比,ConvLSTM 的RMSE 分別下降了38.45%和20.56%。其次是24 h預(yù)報(bào)的10v數(shù)據(jù),RMSE 比CMA-REPS 和Unet 模型分別降低25.16%和12.75%。對(duì)于72 h預(yù)報(bào)的10v偏差訂正,Unet模型和ConvLSTM 模型訂正的效果提升幅度不大,但總體上偏差訂正的結(jié)果更趨近于ERA5。

圖5 24 h、48 h 及72 h 預(yù)報(bào)10v 訂正前后RMSE 對(duì)比圖
從2022年3月25日00 時(shí)24 h預(yù)報(bào)的10v訂正結(jié)果(圖6)可以看出,在CMA-REPS 原始預(yù)報(bào)數(shù)據(jù)整體偏小的情況下,Unet 模型對(duì)研究區(qū)域北部地區(qū)的偏差訂正效果欠佳,而ConvLSTM 模型對(duì)其進(jìn)行偏差訂正的結(jié)果整體上都具有明顯的改善,著重表現(xiàn)在研究區(qū)域的中部和北部地區(qū),在東部沿海地區(qū)也取得了不錯(cuò)的訂正效果。

圖6 2022年3月25日00 時(shí)24 h 預(yù)報(bào)10u 訂正結(jié)果
圖7 顯示了CMA-REPS、Unet 模型和ConvLSTM模型對(duì)測(cè)試集24 h、48 h及72 h預(yù)報(bào)的10w數(shù)據(jù)進(jìn)行偏差訂正的RMSE 對(duì)比結(jié)果。從圖7 可以看出,ConvLSTM 模型對(duì)不同預(yù)報(bào)時(shí)效的10 m風(fēng)速的訂正均有明顯的提升,尤其是對(duì)48 h預(yù)報(bào)的10w訂正,ConvLSTM 的RMSE 相比CMA-REPS 原始預(yù)報(bào)數(shù)據(jù)和Unet 模型降低了28.37%與11.21%。24 h預(yù)報(bào)的10w經(jīng)ConvLSTM訂正后,相比CMA-REPS 和Unet 模型RMSE 分別降低了19.42%和6.01%。對(duì)于72 h預(yù)報(bào)的10w,經(jīng)ConvLSTM 訂正后的RMSE 比CMA-REPS 降低18.52%,比Unet 模型降低8.19%,整體改善效果與24 h 預(yù)報(bào)的10w相比相差不大。

圖7 24 h、48 h 及72 h 預(yù)報(bào)的10w 訂正前后RMSE 對(duì)比
圖8 顯示了2022年2月7日00 時(shí)的48 h預(yù)報(bào)的10w訂正結(jié)果。可以看出,該時(shí)刻的CMA-REPS 原始預(yù)報(bào)數(shù)據(jù)整體上數(shù)值偏大,經(jīng)Unet 模型偏差訂正得到的預(yù)報(bào)結(jié)果雖有所改善,但整體數(shù)值上相比于ERA5依舊稍微偏大。融合了時(shí)間序列特征編碼特性和空間特征提取功能的ConvLSTM 模型偏差訂正的結(jié)果在整體上與ERA5 更加一致,說明本文提出的ConvLSTM模型可以有效改善CMA-REPS 對(duì)10 m風(fēng)速預(yù)測(cè)值偏高的情況。

圖8 2022年2月7日00 時(shí)48 h 預(yù)報(bào)10w 訂正結(jié)果
基于深度學(xué)習(xí)方法對(duì)中國自主研制的CMA-REPS預(yù)測(cè)的近地面10 m風(fēng)場(chǎng)格點(diǎn)數(shù)據(jù)進(jìn)行了偏差訂正。針對(duì)格點(diǎn)預(yù)報(bào)數(shù)據(jù)具有的空間和時(shí)間雙重特征,構(gòu)建了一種融合時(shí)間序列特征編碼特性和空間特征提取功能的ConvLSTM 訂正模型,并將其訂正結(jié)果與僅考慮空間特征提取的Unet 模型的訂正結(jié)果和CMA-REPS原始預(yù)報(bào)數(shù)據(jù)進(jìn)行對(duì)比。實(shí)驗(yàn)結(jié)果表明,ConvLSTM對(duì)CMA-REPS 3 個(gè)預(yù)報(bào)時(shí)效(24 h、48 h和72 h)的近地面10 m風(fēng)場(chǎng)預(yù)報(bào)數(shù)據(jù)均有明顯的正向訂正作用,且訂正效果均要優(yōu)于Unet 模型的訂正效果,這說明融合格點(diǎn)預(yù)報(bào)數(shù)據(jù)的時(shí)間序列特性可以幫助深度學(xué)習(xí)模型進(jìn)一步提升對(duì)格點(diǎn)預(yù)報(bào)數(shù)據(jù)的偏差訂正能力。另外從3 個(gè)個(gè)例分析可以看出,在CMA-REPS 原始預(yù)報(bào)數(shù)據(jù)整體較離散的情況下,ConvLSTM 可以減小預(yù)報(bào)數(shù)據(jù)與實(shí)況數(shù)據(jù)間的誤差,有效提升CMA-REPS 對(duì)近地面10 m風(fēng)場(chǎng)數(shù)據(jù)的預(yù)報(bào)能力。
隨著深度學(xué)習(xí)技術(shù)的不斷進(jìn)步,注意力機(jī)制[20]已被證明可以有效提升模型對(duì)序列數(shù)據(jù)的特征提取能力,考慮將注意力機(jī)制與ConvLSTM 模型結(jié)合可以進(jìn)一步提升模型的偏差訂正效果。另外,將傳統(tǒng)集合數(shù)值預(yù)報(bào)模式訂正方法如集合模式輸出統(tǒng)計(jì)(EMOS)與深度學(xué)習(xí)模型方法融合,也是未來集合數(shù)值預(yù)報(bào)模式偏差訂正值得嘗試的研究方向。