摘" 要:隨著人工智能技術的快速發展,深度學習的技術應用已日漸成熟,并逐步在各個領域投入實際業務使用。提升短臨降水預報的精確度是當前天氣預報領域最為艱巨的任務,傳統預報方式已無法應對當前急劇變化的天氣狀況。基于深度學習的神經網絡模型能夠充分彌補傳統預報方式的缺陷,它利用復雜的網絡來學習輸入和輸出數據之間復雜的非線性關系,能夠有效處理天氣數據中的復雜模式。該文詳細介紹幾種實用性較強的模型方法,闡述在短臨降水預報方面的應用情況,對深度學習在氣象領域的發展有重要的借鑒意義。
關鍵詞:深度學習;短臨降水預報;神經網絡;ConvLSTM;數據集
中圖分類號:P457.6""""" 文獻標志碼:A""""""""" 文章編號:2095-2945(2025)04-0164-05
Abstract: With the rapid development of artificial intelligence technology, the technical application of deep learning has become increasingly mature, and has gradually been put into actual business use in various fields." Improving the accuracy of short-term and imminent precipitation forecasts is the most arduous task in the current field of weather forecasting. Traditional forecasting methods are no longer able to cope with the current rapidly changing weather conditions. The neural network model based on deep learning can fully make up for the shortcomings of traditional forecasting methods. It uses complex networks to learn complex nonlinear relationships between input and output data, and can effectively process complex patterns in weather data. This paper introduces in detail several practical model methods and expounds their application in short-term and imminent precipitation prediction, which is of important reference significance for the development of deep learning in the meteorological field.
Keywords: deep learning; short-term and imminent precipitation forecast; neural network; ConvLSTM; dataset
提高短臨降水預報的準確性一直是天氣預報領域最為迫切的任務。短臨降水預報的有效應用極大地影響著社會的生產生活,同時精確的預報結果在氣象災害防御方面具有重要的導向作用。
降水預報是一個復雜的過程,由于在不同的時間尺度上受到各種氣象因素和條件的影響,所以短臨降水預報的準確率一直是預報領域的痛點。近年來,人們對奇異譜分析和經驗模態分解等先進技術進行了探索,然而這些方法在預報準確性方面只能產生有限的改進[1]。深度學習的出現,提供了一種更加靈活、適應性更強的方法,它利用復雜的網絡來學習輸入和輸出數據之間復雜的非線性關系,通過有效處理天氣數據中的復雜模式和捕獲超出傳統數值模擬范圍的未解決過程,在改善天氣預報方面得到了有效的應用[2]。時至今日,人們將深度學習技術應用于天氣預報的興趣日益濃厚。現有的研究成果表明,深度學習方法的應用在氣象領域表現出了優越的性能[3],具有廣闊的應用前景。
1" 傳統預報方法
1.1" 數值天氣預報
數值天氣預報是一種定量的和客觀的預報,早在20世紀70年代,數值天氣預報得以真正實現業務應用。盡管數值預報水平一直不斷提升,但該方法往往不能完全模擬極端天氣情況,由于產生的分辨率過低,無法獲得更加準確的結果,且處于區域性的高分辨率模式下需要過高的計算成本[4]。因此,由于其復雜性、高耗能和不確定性的特征,該方法在小尺度天氣現象(如局部對流事件)的短期預報結論中存在一定的偏差。
1.2" 氣象雷達技術
氣象雷達能夠發射微波脈沖并接收回波,通過雷達回波的強度、速度和方向等信息,可以實時監測降水的強度、類型和范圍,為短時天氣預報提供數據支持[5]。但對于一些微觀氣象現象或復雜天氣系統的預測精度有限,若處于惡劣天氣條件下,雷達的觀測能力可能會受到影響[6],從而降低預報的準確性。
1.3" 統計預報方法
統計預報方法是一種利用歷史觀測數據和統計模型來進行天氣預測的方法。這種方法主要依賴于歷史數據的分析和統計模型的準確性來進行預測[7]。對于短期天氣預測,該方法可以提供一定的參考價值,特別是在穩定氣象條件下。由于氣象系統的復雜性和變化性,該方法往往難以適應氣象條件的突然變化,其準確性和適用性受到諸多限制,因此在實際應用中需要結合其他更為先進的預報技術進行綜合分析和判斷。
2" 深度學習方法及相關天氣模型
2016—2020年間,深度學習模型如CNN、LSTM、ConvLSTM、RNN等由于其預測精度的提高,在降雨時間序列預測領域受到了廣泛的關注。其中,因LSTM及其衍生物具有捕捉時間模式和依賴關系方面的能力,經常被用于短期降雨預測。此外,CNN架構可以捕捉空間局部相關性,而降水數據具有空間結構性[8],因此在降水預測中很有前景。值得注意的是,如RNN和CNN的混合模型也引起了研究人員的關注[9],以此利用各種建模技術的優勢來提高降雨預報的準確性,這些模型為建立復雜的、突變的降雨趨勢和模式提供了強大的助力。
2.1" 卷積神經網絡(CNN)
CNN作為典型的深度學習模型(圖1),其結構包括輸入層、隱藏層和輸出層,而隱藏層包括卷積層、池化層和全連接層,用于提取數據局部特征并進行分類回歸。卷積層由多個卷積核組成,是CNN的核心組成部分,執行卷積運算提取輸入數據的局部特征,并輸出特征映射。池化層降低卷積層輸出的空間維度,減少參數數量,提高計算效率。全連接層將池化層的特征映射連接到分類器,以進行最終的分類操作。因此,CNN能夠捕獲輸入數據的空間維度特征,由于局部相關在天氣降水過程中起著重要的作用,故這一特征對降水過程的建模及數據分析非常有益[10],能夠大大減少計算成本,提高預報分析的效率。
2.2" 長短期記憶網絡(LSTM)
長短期記憶(LSTM)是一種特殊的遞歸神經網絡(RNN)算法[11],能夠捕捉輸入和輸出特征之間的長期依賴關系,同時處理短期和長期依賴關系。LSTM使用稱為“門”的結構來控制信息流,包括輸入門、輸出門和遺忘門(圖2)。輸入門控制信息中使用的新狀態的數量,輸出門決定早期狀態的信息保留,遺忘門調節信息流內部狀態。LSTM擅長于時間序列建模,在降水預測方面已多有應用[12]。Ata等[13]將LSTM用于降水估計和預報,Snderby等[14]基于多個數據源,包括回波強度、地形和衛星圖像,利用ConvLSTM建立了高分辨率降水預測模型。Klocek等[15]將ConvLSTM與數值模型相結合,提高了降水長期預測的精度。
2.3" 遞歸神經網絡(RNN)
RNN是20世紀80年代引入的一種用于時間序列數據建模的神經網絡模型,能夠處理龐大的序列數據。RNN是一種基于過去收集的數據建立預測模型的算法,具有處理順序輸入的能力[16],捕捉數據依賴性,因此在天氣預報、語音識別等多個領域被應用于實際研究工作,并且預測結果顯示出較高的準確性。
2.4 "基于深度學習的天氣預報模型
在過去的幾年里,深度學習技術迅速發展,并與天氣預報方面相融合,產生了許多基于深度學習的天氣預報模型,如MetNet-3、FourCastNet、盤古氣象大模型等。下面簡要介紹這些模型,以深入了解其架構及特點。
FourCastNet是一個基于傅里葉預測的神經網絡模型,由NVIDIA實驗室開發,專門用于大氣科學和氣候研究[17]。FourCastNet采用了時空卷積神經網絡(CNNs),能夠捕獲空間上的模式和時間序列的變化。此外,模型還結合了生成對抗網絡(GANs),可以準確預測高分辨率、快速的時間尺度變量。實驗表明,FourCastNet可以在幾秒鐘內生成對颶風、大氣層河流和極端降水等事件的大規模集合預報,極大地改善了概率天氣預報的效果[18]。
MetNet-3是由Google Research和Google DeepMind 聯合開發的新型人工智能天氣模型。它具有較高的時間和空間分辨率,能夠從密集和稀疏的數據傳感器中學習,并提前24 h預測降水、風、溫度和露點,大大擴展了基于觀察的神經模型可以預測的前置時間范圍和變量[19]。MetNet-3提供了一個時間平滑且高度精細的預報,為基于觀測的神經模型樹立了新的性能里程碑。目前MetNet-3已投入運行,可生成實時12 h降水預報,這些預報現已在與天氣相關的Google產品中提供服務。
盤古氣象大模型由華為云盤古氣象大模型研發團隊開發,作為首個精度超過傳統數值預報方法的AI預測模型,其預測速度也有大幅提升。團隊提出了適應地球坐標系統的三維神經網絡來處理復雜的不均勻3D氣象數據,并且使用層次化時域聚合策略來減少預報迭代次數[20],從而減少迭代誤差。通過在1979—2021年的全球天氣數據深度神經網絡進行訓練,盤古氣象大模型在精度和速度方面超越傳統數值預測方法。
3" 深度學習在短臨降水預報中的應用現狀
從前幾部分的介紹中可以看出,深度學習已經在短臨降水預測方面取得了顯著的應用效果。Rasp等[21]證明深度學習可以演示子網格過程,以提高氣候模型的性能。Chen等[22]提出了具有物理約束的圖神經網絡模型,在中國降水預報方面有顯著增強。相比于傳統的數值預報方式,深度學習方法提高了預測精度,縮短了預測時間,已成為當前領域的一大熱點研究方向。下面將介紹當前短臨降水預報中深度學習方法的開發和應用情況。
Deng等[23]采用U-Net的深度學習方法,將土壤濕度、海平面氣壓等數據作為樣本數據集進行訓練,旨在改善我國汛期降水預測,U-Net作為CNN模型之一,具有強大的小樣本訓練能力。Tu等[24]提出了一種基于氣象研究與預報(WRF)模式和CNN模型相融合的深度學習方法,保留了WRF中的物理特性,同時降低了計算成本,但在計算過程中只有降水這唯一變量,捕捉到的空間特征仍有待增強。Zhou等[25]同樣將CNN模型與數值預報模型結合使用,通過輸入分析大氣環流因子進行降水預測,但對于預測因子的選擇仍需進一步探討。Ruiter[26]做了一個對比實驗,同時使用CNN和邏輯回歸對輸入預測圖像進行分析輸出,結果顯示邏輯回歸的預測性能更優。盡管CNN在某些程度上解決了傳統預報方式的不足,預測因子和數據集的選擇仍對預測結果存在影響,深度神經網絡的有效訓練需要大量的數據和計算,且耗時更長,這可能嚴重限制對模型開發和所有可用數據的利用研究。為了解決這個問題,Samsi等[27]改進了CNN架構,實現數據并行化處理,通過使用多個GPU,訓練時間縮短了50多倍,利用這種方式可以更好地模擬不斷變化的天氣模式。
Aderyani等[28]比較了LSTM和CNN 2種降雨預報方法的性能,分別對提前5 min和15 min的降雨事件進行分析預測,結果表明LSTM方法的性能優于CNN。Gope等[29]提出了一種將CNN和LSTM相結合的方法,以CNN的輸出作為LSTM的輸入。Shi等[30]設計了一個ConvLSTM 模型,通過用卷積層代替完全連接的層。這2種方法在ConvLSTM模型結構中的融合具有強大的空間和時間數據處理能力,證明了該模型在短期降水預報中的巨大潛力[31]。Kim等人[32]將近年來的雷達反射率數據作為輸入數據,采用ConvLSTM預測1~2 h內的降雨信息,結果表明,該方法的預測精度優于線性回歸。Xiao等[33]將NWP與ConvLSTM相結合,提出了具有解構機制和多尺度濾波器的新方法模型——MSD-ConvLSTM,該模型為降水預報提供了一種高效的數據驅動方法。Jihoon等[34]提出了一種基于地面觀測的降水臨近預報的深度學習模型——Attentive Sparse Observation Combiner(ASOC),ASOC結合了LSTM和Transformer,有效地利用了從多個地面氣象站收集的氣象觀測數據,并且捕獲觀測數據的時間動態以及它們之間的密切關系。
4" 結束語
深度學習模型在降雨預報領域的應用具有很大的潛力,且目前已有部分研究成果投入業務使用,但依然存在挑戰,特別是在捕捉區域降雨模式的時空變化方面。雖然訓練后的模型在擬合檢驗方面具有較高的準確性,但訓練后的模型不能很好地捕捉輸入數據與目標數據之間的關系,尤其是面對極端或者突發降雨事件時,仍無法達到預期的結果。此外,數據集的規模和預測因子的選擇對模型的訓練和發展也有著舉足輕重的作用。對于特定區域的小范圍訓練數據,無法適用于更大的通用模型,容易導致性能缺失。因此,擁有大量的公用數據集對模型的訓練極為重要。
參考文獻:
[1] 江銘恒,游立軍,翁彬,等.中短期降水預報的多分支融合卷積神經網絡[J].福建電腦,2024,40(1):1-8.
[2] HARILAL G T, DIXIT A, QUATTRONE G. Establishing hybrid deep learning models for regional daily rainfall time series forecasting in the United Kingdom[J].Engineering Applications of Artificial Intelligence, 2024:133.
[3] 陳生,黃啟橋,譚金凱,等.基于多尺度特征深度學習的短臨降水預報[J].熱帶氣象學報,2023,39(6):799-806.
[4] ZHENG C, TAO Y, ZHANG J, et al. TISE-LSTM: A LSTM model for precipitation nowcasting with temporal interactions and spatial extract blocks[J].Neurocomputing, 2024(Jul.14):590.
[5] CHANG E, LEE D, et al. Advancements in weather radar technology for improved forecasting[J]. Weather and Forecasting Journal,2020.
[6] LIN W, CHAO F Y, JIANG N L. Application of Doppler Radar Data in Numerical Prediction Model[J].Journal of Meteorological Research and Application,2010.
[7] RAMSEY, PHILIP H .Statistical Methods in the Atmospheric Sciences[J].Technometrics, 2006,38(4):402-402.
[8] VAN S P, LE H M, THANH D V, et al. Deep learning convolutional neural network in rainfall-runoff modelling[J].Journal of Hydroinformatics,2020.
[9] PADALA R S, ANEESH M, YESWANTH P V, et al. A combined deep CNN-RNN network for rainfall-runoff modelling in Bardha Watershed, India[C]//Artificial Intelligence in Geosciences, 2024,5,100073. ISSN 2666-5441. https://doi.org/10.1016/j.aiig.2024.100073.
[10] PATEL M, PATEL A, GHOSH R.Precipitation Nowcasting: Leveraging bidirectional LSTM and 1D CNN[J]. 2018.
[11] ELBELTAGI A, SRIVASTAVA A, EHSAN M ,et al. Advanced stacked integration method for forecasting long-term drought severity: CNN with machine learning models[J].Journal of Hydrology: Regional Studies, 2024:53.
[12] CHOWDARY P N , PINGALI S , UNNIKRISHNAN P ,et al. Unleashing the Power of Dynamic Mode Decomposition and Deep Learning for Rainfall Prediction in North-East India[C]//International Conference on Computation of Artificial Intelligence amp; Machine Learning. Springer, Cham, 2025.
[13] ATA A, ASANJAN T T, YANG K L, et al. Short-Term Precipitation Forecast Based on the PERSIANN System and LSTM Recurrent Neural Networks[J].Journal of Geophysical Research, D. Atmospheres: JGR, 2018, 123(22).
[14] SNDERBY C K, ESPEHOLT L, HEEK J, et al. MetNet: A Neural Weather Model for Precipitation Forecasting[J].2020.
[15] KLOCEK S, DONG H, DIXON M, et al.MS-nowcasting: Operational Precipitation Nowcasting with Convolutional LSTMs at Microsoft Weather[J].2021.
[16] AL-SELWI S M , HASSAN M F , ABDULKADIR S J ,et al. RNN-LSTM: From applications to modeling techniques and beyond-Systematic review[J].Journal of King Saud University - Computer and Information Sciences, 2024,36(5).
[17] PATHAK J, SUBRAMANIAN S, HARRINGTON P ,et al. FourCastNet: A Global Data-driven High-resolution Weather Model using Adaptive Fourier Neural Operators[J]. 2022.
[18]" KURTH T, SUBRAMANIAN S, HARRINGTON P, et al. FourCastNet: Accelerating Global High-Resolution Weather Forecasting Using Adaptive Fourier Neural Operators[J].Proceedings of the Platform for Advanced Scientific Computing Conference, 2022.
[19] ANDRYCHOWICZ" M, ESPEHOLT" L, LI D, et al. Deep Learning for Day Forecasts from Sparse Observations[J]. arXiv preprint arXiv:2306.06079,2023.
[20] BI K, XIE L, ZHANG H, et al. Accurate medium-range global weather forecasting with 3D neural networks[J].Nature, 2023(619):533-538.
[21] RASP S, PRITCHARD MS, GENTINE P. Deep learning to represent subgrid processes in climate models[J]. Proc Natl Acad Sci U S A. 2018 Sep 25;115(39):9684-9689.
[22] CHEN, Y, WANG, Y, HUANG, G, et al. Coupling physical factors for precipitation forecast in China with graph neural network[J]. Geophysical Research Letters, 2024:51.
[23] DENG Q M, LU P R, ZHAO S Y, et al. U-Net: A deep-learning method for improving summer precipitation forecasts in China[J].大氣和海洋科學快報:英文版, 2023,16(4):8-14.
[24] TU T, ISHIDA K, ERCAN A, et al. Hybrid precipitation downscaling over coastal watersheds in Japan using WRF and CNN[J].2021. Journal of Hydrology: Regional Studies, 2021, 37.
[25] ZHOU J H, LIU F. Improving subseasonal forecasting of East Asian" monsoon precipitation with deep learning[J].Atmospheric and Oceanic Science Letters.
[26] RUITER B D .Post-processing Multi-Model Medium-Term Precipitation Forecasts Using Convolutional Neural Networks[J]. 2021.
[27] SAMSI S, MATTIOLI C J, VEILLETTE M S. Distributed Deep Learning for Precipitation Nowcasting[C]//2019.
[28] ADARYANI F R, MOUSAVI S J, JAFARI F. Short-term rainfall forecasting using machine learning-based approaches of PSO-SVR, LSTM and CNN[J].Journal of Hydrology, 2022, 614(Pt.A).
[29] GOPE P M S, SARKAR S. Prediction of extreme rainfall using hybrid convolutional long short term memory networks[J].Proceedings of the 6th International Workshop on Climate Informatics:CI 2016.
[30] SHI X, CHEN Z, WANG H,et al. Convolutional LSTM Network: A Machine Learning Approach for Precipitation Nowcasting[J].MIT Press, 2015.
[31] DEMETRAKOPOULOS, P. Short-term Precipitation Forecasting in The Netherlands: An Application of Convolutional LSTM neural networks to weather radar data[J]. arXiv preprint arXiv:2312.01197,2023.
[32] KIM S, HONG S, JOH M, et al. DeepRain: ConvLSTM Network for Precipitation Prediction using Multichannel Radar Data[J]. 2017.
[33] XIAO X, KUANG Q, XIANG S, et al. Precipitation Forecasting via Multi-Scale Deconstructed ConvLSTM[J]. 2019.
[34] JIHOON K, KYUHAN L, HYUNJIN H, et al. Deep-learning-based precipitation nowcasting with ground weather station data and radar data[J]. arXiv preprint arXiv:2210.12853, 2022.