郭亞楠,曹小群,周夢(mèng)鴿,彭柯澄
(1.國(guó)防科技大學(xué) 氣象海洋學(xué)院,湖南 長(zhǎng)沙 410073;2.海軍航空大學(xué),遼寧 葫蘆島 125001)
大氣系統(tǒng)是一個(gè)高度復(fù)雜的系統(tǒng),包括大氣運(yùn)動(dòng)、輻射傳輸、湍流等多個(gè)物理過(guò)程的相互作用,數(shù)值模式成為深入理解和研究這些復(fù)雜過(guò)程的有效工具。通過(guò)模型的建立和改進(jìn),可以揭示天氣系統(tǒng)中的非線性、時(shí)空耦合、不確定性等特征,為深入研究氣候變化、氣象災(zāi)害等提供基礎(chǔ)。數(shù)值天氣預(yù)報(bào)從20世紀(jì)50年代進(jìn)行了首次成功嘗試以來(lái),經(jīng)過(guò)七十多年的發(fā)展,已經(jīng)成為一個(gè)跨學(xué)科的復(fù)雜系統(tǒng)性工程,使得天氣預(yù)報(bào)從傳統(tǒng)的以統(tǒng)計(jì)和經(jīng)驗(yàn)為主的天氣圖方法轉(zhuǎn)變成為客觀定量的科學(xué)[1-3]。
近年來(lái),大數(shù)據(jù)技術(shù)的出現(xiàn),深刻改變了現(xiàn)代科學(xué)技術(shù)的發(fā)展,極有可能引起新一輪的技術(shù)變革[4-7]。在地球科學(xué)領(lǐng)域,新一代地球觀測(cè)系統(tǒng)的不斷完善,對(duì)地觀測(cè)數(shù)據(jù)迅速增加,正逐漸積累形成獨(dú)具特色的地球大數(shù)據(jù)。對(duì)數(shù)值天氣預(yù)報(bào)研究而言,如何高效合理地利用氣象海洋大數(shù)據(jù),對(duì)于提高預(yù)報(bào)的精度有重要意義。隨著大數(shù)據(jù)的出現(xiàn)以及算力的提升,以深度學(xué)習(xí)為代表的人工智能技術(shù)蓬勃發(fā)展,成為了聯(lián)系氣象海洋大數(shù)據(jù)與數(shù)值天氣預(yù)報(bào)模式的關(guān)鍵技術(shù)。隨著大模型技術(shù)的興起,大數(shù)據(jù)驅(qū)動(dòng)的天氣預(yù)報(bào)快速發(fā)展,涌現(xiàn)出大量氣象預(yù)報(bào)大模型。其中,針對(duì)部分預(yù)報(bào)任務(wù),華為盤古氣象大模型的預(yù)報(bào)精度已超過(guò)傳統(tǒng)數(shù)值預(yù)報(bào)方法,并且其預(yù)報(bào)速度相比傳統(tǒng)數(shù)值預(yù)報(bào)提速10 000倍以上。目前,盤古氣象大模型能夠提供全球尺度的天氣要素預(yù)報(bào),其時(shí)間精度可達(dá)秒級(jí),其氣象要素預(yù)報(bào)產(chǎn)品包括溫度、海平面氣壓、濕度、風(fēng)速、位勢(shì)等,可以直接服務(wù)于天氣預(yù)報(bào)業(yè)務(wù),并且已被歐洲中期預(yù)報(bào)中心所應(yīng)用。
本文從論述氣象海洋大數(shù)據(jù)的起源、概念和本質(zhì)開(kāi)始,介紹了氣象海洋大數(shù)據(jù)的分類,闡述了氣象海洋觀測(cè)數(shù)據(jù)、模式數(shù)據(jù)以及再分析數(shù)據(jù)特點(diǎn),針對(duì)氣象海洋大數(shù)據(jù)與數(shù)值天氣預(yù)報(bào)融合發(fā)展中面臨的關(guān)鍵問(wèn)題,其中包括大氣海洋資料同化、物理過(guò)程參數(shù)化、數(shù)值預(yù)報(bào)產(chǎn)品訂正以及機(jī)理與數(shù)據(jù)融合的模式開(kāi)發(fā)等前沿方向,對(duì)相關(guān)研究進(jìn)行了深入探討和展望,以期為氣象海洋大數(shù)據(jù)與數(shù)值天氣預(yù)報(bào)的融合發(fā)展提供參考依據(jù)。
地球大氣與海洋系統(tǒng)是一個(gè)極其復(fù)雜的非線性系統(tǒng),涉及大氣物理、大氣化學(xué)、大氣探測(cè)學(xué)、物理海洋學(xué)等諸多學(xué)科。目前,氣象海洋大數(shù)據(jù)可以定義為基于多源觀測(cè)手段,其中包括衛(wèi)星、飛機(jī)、船舶浮標(biāo)等方式,對(duì)大氣和海要素進(jìn)行觀測(cè)得到的一類大數(shù)據(jù)[8-10]。
傳統(tǒng)大數(shù)據(jù)特征主要表現(xiàn)為海量性、快速性、多樣性的特點(diǎn),具有高維度以及動(dòng)態(tài)性的特征。根據(jù)來(lái)源不同,氣象海洋大數(shù)據(jù)可以分為觀測(cè)大數(shù)據(jù)、模式大數(shù)據(jù)以及再分析大數(shù)據(jù)等。氣象海洋觀測(cè)大數(shù)據(jù)是指基于衛(wèi)星、飛機(jī)、雷達(dá)、浮標(biāo)、氣象站、氣球等觀測(cè)手段獲取的海量數(shù)據(jù),目前一體化的地球觀測(cè)體系如圖1所示。

圖1 一體化的地球觀測(cè)系統(tǒng)
數(shù)值預(yù)報(bào)模式產(chǎn)生了模擬數(shù)據(jù)產(chǎn)品,在氣象海洋大數(shù)據(jù)占據(jù)重要位置,成為氣象海洋大數(shù)據(jù)的基礎(chǔ)來(lái)源之一。與地面觀測(cè)、雷達(dá)探測(cè)以及衛(wèi)星探測(cè)等觀測(cè)手段相比,數(shù)值模擬產(chǎn)品具有時(shí)空連續(xù)性的優(yōu)勢(shì),圖2給出了2019年9月1日在巴哈馬登陸的颶風(fēng)“多利安”的數(shù)值模擬信息(云層結(jié)構(gòu))。

圖2 颶風(fēng)“多利安”的數(shù)值模擬結(jié)果(云層結(jié)構(gòu))
再分析數(shù)據(jù)是利用數(shù)據(jù)同化等技術(shù),將不同來(lái)源及不同結(jié)構(gòu)的觀測(cè)數(shù)據(jù)與數(shù)值模擬數(shù)據(jù)進(jìn)行融合,從而得到滿足時(shí)間與空間上連續(xù)的數(shù)據(jù)集。再分析數(shù)據(jù)在地球科學(xué)研究中具有重要的價(jià)值和地位,圖3給出了一類再分析產(chǎn)品(地表空氣溫度)的可視化結(jié)果。

圖3 再分析產(chǎn)品(地表空氣溫度)
通過(guò)分析可以看出,氣象海洋大數(shù)據(jù)具有明顯的異構(gòu)性,一方面表現(xiàn)為觀測(cè)系統(tǒng)異構(gòu),即不同的觀測(cè)系統(tǒng)和觀測(cè)手段具有較大差異,例如衛(wèi)星觀測(cè)與站點(diǎn)觀測(cè)存在明顯不同;另一方面表現(xiàn)為數(shù)據(jù)格式的異構(gòu)性,即不同類型數(shù)據(jù)的存儲(chǔ)形式及結(jié)構(gòu)差異較大,這些特性成為了氣象海洋大數(shù)據(jù)的應(yīng)用巨大挑戰(zhàn)。
目前,數(shù)據(jù)同化方法主要有變分同化方法和集合卡爾曼濾波方法,借助先進(jìn)的數(shù)據(jù)同化技術(shù)能夠?qū)⒏哔|(zhì)量的大氣和海洋觀測(cè)有效地集成到預(yù)報(bào)場(chǎng)(第一猜測(cè)場(chǎng))[11-14],從而提升初始條件的精度,圖4展示了一個(gè)數(shù)據(jù)同化循環(huán)的流程。目前,數(shù)值天氣預(yù)報(bào)系統(tǒng)借助數(shù)據(jù)同化技術(shù)廣泛吸收了地面、衛(wèi)星、船舶等大量觀測(cè)數(shù)據(jù),提供了大氣、海洋和陸地表面的重要信息(例如A-train等衛(wèi)星觀測(cè)的大氣要素信息)。隨著觀測(cè)數(shù)據(jù)質(zhì)量的改善,特別是來(lái)自衛(wèi)星的觀測(cè)數(shù)據(jù)不斷增加,以及地球系統(tǒng)模型和數(shù)據(jù)同化技術(shù)的不斷升級(jí),現(xiàn)代中期天氣預(yù)報(bào)水平得到了大幅提升。然而,隨著高時(shí)空分辨率的地球系統(tǒng)觀測(cè)數(shù)據(jù)呈指數(shù)級(jí)增加,以及物聯(lián)網(wǎng)背景下全新觀測(cè)系統(tǒng)的應(yīng)用,傳統(tǒng)的數(shù)據(jù)處理技術(shù)已經(jīng)捉襟見(jiàn)肘。為應(yīng)對(duì)氣象海洋觀測(cè)大數(shù)據(jù)的挑戰(zhàn),以深度學(xué)習(xí)為代表的數(shù)據(jù)驅(qū)動(dòng)方法成為了資料同化領(lǐng)域研究人員關(guān)注的熱點(diǎn)。

圖4 數(shù)據(jù)同化流程圖
近年來(lái),深度學(xué)習(xí)算法快速發(fā)展,在觀測(cè)數(shù)據(jù)質(zhì)量控制、觀測(cè)偏差校正等方面表現(xiàn)出巨大的潛力,為改善數(shù)據(jù)同化技術(shù)提供了新的途徑和手段[15-17]。相關(guān)研究表明,機(jī)器學(xué)習(xí)和傳統(tǒng)數(shù)據(jù)同化方法在數(shù)學(xué)上具備等價(jià)性,使得神經(jīng)網(wǎng)絡(luò)在數(shù)據(jù)同化領(lǐng)域的應(yīng)用具備了堅(jiān)實(shí)的理論支撐。有關(guān)學(xué)者利用神經(jīng)網(wǎng)絡(luò)模型代替?zhèn)鹘y(tǒng)數(shù)據(jù)同化算法(例如三維變分同化、集合卡爾曼濾波以及粒子濾波),結(jié)果表明,在訓(xùn)練數(shù)據(jù)充足且準(zhǔn)確性高的情況下,基于神經(jīng)網(wǎng)絡(luò)的數(shù)據(jù)同化模型能夠獲得理想的分析場(chǎng),其同化質(zhì)量接近于傳統(tǒng)的同化方法,但其計(jì)算效率更高、實(shí)現(xiàn)過(guò)程更加簡(jiǎn)單。然而,基于神經(jīng)網(wǎng)絡(luò)的數(shù)據(jù)同化模型存在的問(wèn)題也不可忽視,即神經(jīng)網(wǎng)絡(luò)模型對(duì)于觀測(cè)數(shù)據(jù)的質(zhì)量極其敏感,當(dāng)觀測(cè)數(shù)據(jù)存在噪聲干擾以及觀測(cè)數(shù)據(jù)量不足時(shí),同化質(zhì)量將會(huì)明顯降低。因此,如何提高神經(jīng)網(wǎng)絡(luò)模型的魯棒性,高效利用不同程度噪聲干擾的觀測(cè)數(shù)據(jù),提升數(shù)據(jù)同化效果,充分挖掘氣象海洋觀測(cè)大數(shù)據(jù)的潛在價(jià)值、發(fā)揮深度學(xué)習(xí)的優(yōu)勢(shì),仍面臨諸多挑戰(zhàn),需要進(jìn)一步加強(qiáng)理論研究和實(shí)踐探索。
近年來(lái),數(shù)值天氣預(yù)報(bào)模式不斷向著精細(xì)化方向發(fā)展,模式分辨率顯著提高。然而,即使最先進(jìn)的數(shù)值天氣預(yù)報(bào)模式仍然難以描述許多小尺度天氣過(guò)程,圖5展示了地球系統(tǒng)模式中的次網(wǎng)格過(guò)程。目前,為了解決上述小尺度天氣過(guò)程難以描述和預(yù)報(bào)的問(wèn)題,一般采取次網(wǎng)格物理過(guò)程參數(shù)化方法。對(duì)于無(wú)法被模式解析的次網(wǎng)格過(guò)程,例如大氣系統(tǒng)內(nèi)部以及與外界的小尺度輻射、對(duì)流和擴(kuò)散過(guò)程,研究人員開(kāi)發(fā)了各種參數(shù)化方案,通過(guò)這些參數(shù)化方案描述次網(wǎng)格過(guò)程中的熱量和動(dòng)量收支,從而提升數(shù)值預(yù)報(bào)的質(zhì)量。

圖5 地球系統(tǒng)模式中的次網(wǎng)格過(guò)程
相關(guān)研究表明,借助海量的氣象海洋大數(shù)據(jù),深度學(xué)習(xí)能夠顯著改善數(shù)值預(yù)報(bào)模式物理過(guò)程參數(shù)化效果,有效提升計(jì)算效率及精度[19-20]。在訓(xùn)練數(shù)據(jù)充足的情況下,深度神經(jīng)網(wǎng)絡(luò)模型能夠有效地刻畫次網(wǎng)格物理過(guò)程,與傳統(tǒng)的次網(wǎng)格物理過(guò)程參數(shù)化方案相比,大數(shù)據(jù)驅(qū)動(dòng)下的深度神經(jīng)網(wǎng)絡(luò)參數(shù)化方案能夠顯著提升模式預(yù)報(bào)效果,且計(jì)算效率得到顯著提升。然而其劣勢(shì)也不可忽視,由于缺乏物理規(guī)律的約束,基于神經(jīng)網(wǎng)絡(luò)的參數(shù)化方案往往不滿足能量守恒等物理性質(zhì)。盡管存在諸多問(wèn)題,但采用數(shù)據(jù)驅(qū)動(dòng)的神經(jīng)網(wǎng)絡(luò)模型替換傳統(tǒng)的參數(shù)化方法依然方興未艾。
由于大氣系統(tǒng)的混沌特性,數(shù)值天氣預(yù)報(bào)產(chǎn)品質(zhì)量嚴(yán)重依賴于初始場(chǎng)的準(zhǔn)確性。此外,數(shù)值模式中存在對(duì)大氣與海洋系統(tǒng)的近似假設(shè),導(dǎo)致模型預(yù)測(cè)結(jié)果不可避免地存在誤差,因此量化天氣預(yù)報(bào)的誤差及其不確定性是一項(xiàng)極其重要的任務(wù),特別是對(duì)于預(yù)測(cè)極端天氣事件。集合預(yù)報(bào)是目前解決大氣與海洋預(yù)報(bào)不確定性問(wèn)題的重要手段,由于集合預(yù)報(bào)系統(tǒng)由加入不同擾動(dòng)的數(shù)值天氣模式組成,因此計(jì)算量巨大。鑒于集合系統(tǒng)高昂的計(jì)算成本,并且經(jīng)常涉及大量的統(tǒng)計(jì)學(xué)后處理過(guò)程,尋求簡(jiǎn)單且廉價(jià)的數(shù)值產(chǎn)品訂正與后處理方式成為了現(xiàn)階段的重要任務(wù)。
目前,機(jī)器學(xué)習(xí)算法已經(jīng)被廣泛應(yīng)用于預(yù)報(bào)模式產(chǎn)品的校正與后處理[21-23],如基于支持向量機(jī)的海霧預(yù)報(bào)校正、基于深度神經(jīng)網(wǎng)絡(luò)的風(fēng)速預(yù)報(bào)校正、基于對(duì)抗神經(jīng)網(wǎng)絡(luò)的降水位置訂正等。研究表明,深度學(xué)習(xí)方法能夠從數(shù)值天氣預(yù)報(bào)的海量模擬數(shù)據(jù)中挖掘隱藏的高維信息,從而構(gòu)建數(shù)值天氣預(yù)報(bào)產(chǎn)品偏差特征,為數(shù)值天氣預(yù)報(bào)偏差訂正研究和業(yè)務(wù)實(shí)踐開(kāi)辟了新的方向。在足夠多的訓(xùn)練數(shù)據(jù)支撐下,機(jī)器學(xué)習(xí)模型的結(jié)果普遍優(yōu)于傳統(tǒng)的統(tǒng)計(jì)后處理方法。可以預(yù)見(jiàn),在氣象海洋大數(shù)據(jù)的驅(qū)動(dòng)下,通過(guò)不斷改進(jìn)神經(jīng)網(wǎng)絡(luò)模型以及優(yōu)化算法,將顯著提升預(yù)報(bào)產(chǎn)品的質(zhì)量,進(jìn)而提升對(duì)災(zāi)害性天氣氣候的預(yù)警能力。圖6給出了一個(gè)氣象海洋大數(shù)據(jù)驅(qū)動(dòng)下的智能化數(shù)值天氣預(yù)報(bào)產(chǎn)品訂正模型。

圖6 氣象海洋大數(shù)據(jù)驅(qū)動(dòng)下的智能化數(shù)值天氣預(yù)報(bào)產(chǎn)品訂正模型
在天氣預(yù)報(bào)領(lǐng)域,數(shù)據(jù)驅(qū)動(dòng)的深度學(xué)習(xí)模型具有設(shè)計(jì)方法簡(jiǎn)單的優(yōu)勢(shì),且相比于龐大的數(shù)值天氣預(yù)報(bào)模式,其計(jì)算成本大大降低,并且可以利用GPU資源進(jìn)行加速,因此研究人員致力于開(kāi)發(fā)數(shù)據(jù)驅(qū)動(dòng)的天氣預(yù)報(bào)模型[24-26]。基于再分析數(shù)據(jù)或觀測(cè)值進(jìn)行訓(xùn)練,數(shù)據(jù)驅(qū)動(dòng)模型可以避免數(shù)值預(yù)報(bào)模型中存在的限制,例如對(duì)流參數(shù)化方案中的偏差將嚴(yán)重影響降水預(yù)報(bào)。此外,與只能包含少量集合成員的傳統(tǒng)數(shù)值天氣預(yù)報(bào)模型相比,大數(shù)據(jù)驅(qū)動(dòng)的集合可以改善次季節(jié)到季節(jié)的預(yù)測(cè)。大集合有助于改善短期和長(zhǎng)期預(yù)測(cè)中極端天氣事件的預(yù)測(cè)水平。
深度神經(jīng)網(wǎng)絡(luò)代理模型的預(yù)報(bào)水平嚴(yán)重依賴于訓(xùn)練數(shù)據(jù)集的大小以及天氣過(guò)程的時(shí)空尺度。不可忽視的是,純數(shù)據(jù)驅(qū)動(dòng)的預(yù)報(bào)模型的預(yù)報(bào)結(jié)果往往缺乏物理可解釋性。地球系統(tǒng)作為一個(gè)復(fù)雜系統(tǒng),受到不同時(shí)空尺度物理規(guī)律的制約。在過(guò)去幾十年里,關(guān)于多尺度物理過(guò)程相互作用的研究取得了巨大進(jìn)展,通過(guò)使用有限差分、有限元以及譜方法數(shù)值求解偏微分方程(PDE),取得巨大成功。如何將物理規(guī)律融合到數(shù)據(jù)驅(qū)動(dòng)的機(jī)器學(xué)習(xí)模型,成為了當(dāng)前數(shù)值天氣預(yù)報(bào)發(fā)展的挑戰(zhàn)與機(jī)遇。圖7給出了預(yù)報(bào)模型對(duì)數(shù)據(jù)及物理規(guī)律的依賴。近年來(lái),內(nèi)嵌物理神經(jīng)網(wǎng)絡(luò)的發(fā)展為機(jī)理與數(shù)據(jù)融合的數(shù)值天氣預(yù)報(bào)研究提供了重要方向[27-29]。圖8給出了基于內(nèi)嵌物理神經(jīng)網(wǎng)絡(luò)求解大氣運(yùn)動(dòng)方程組的示意圖。未來(lái),通過(guò)深入研究?jī)?nèi)嵌物理約束的人工智能框架,發(fā)展出數(shù)據(jù)驅(qū)動(dòng)與物理驅(qū)動(dòng)相互支撐的新一代數(shù)值天氣預(yù)報(bào)系統(tǒng),可以保證數(shù)值預(yù)報(bào)產(chǎn)品的準(zhǔn)確性、實(shí)時(shí)性以及可靠性要求。

圖7 預(yù)報(bào)模型對(duì)數(shù)據(jù)及物理規(guī)律的依賴

圖8 基于內(nèi)嵌物理神經(jīng)網(wǎng)絡(luò)求解大氣運(yùn)動(dòng)方程組的示意圖
隨著大數(shù)據(jù)和新一輪人工智能技術(shù)的興起,數(shù)值天氣預(yù)報(bào)模式正在發(fā)生革命性轉(zhuǎn)變,不斷向以數(shù)據(jù)驅(qū)動(dòng)為核心的新范式發(fā)展。本文針對(duì)氣象海洋大數(shù)據(jù)在數(shù)值天氣預(yù)報(bào)中的應(yīng)用這一重要課題,對(duì)氣象海洋大數(shù)據(jù)的內(nèi)涵、分類及其特征進(jìn)行簡(jiǎn)要介紹和分析,論述了氣象海洋大數(shù)據(jù)在資料同化、物理過(guò)程參數(shù)化、數(shù)值預(yù)報(bào)產(chǎn)品訂正等方面的應(yīng)用現(xiàn)狀及巨大潛力。相信在未來(lái)氣象海洋大數(shù)據(jù)將廣泛應(yīng)用于數(shù)值天氣預(yù)報(bào)領(lǐng)域,人工智能與大數(shù)據(jù)挖掘技術(shù)將成為推動(dòng)數(shù)值天氣預(yù)報(bào)發(fā)展的重要驅(qū)動(dòng)力。最后,仍需要高度重視數(shù)據(jù)驅(qū)動(dòng)模型的可解釋問(wèn)題,深入研究?jī)?nèi)嵌物理約束的人工智能框架,發(fā)展數(shù)據(jù)驅(qū)動(dòng)與物理驅(qū)動(dòng)相互支撐的新一代數(shù)值天氣預(yù)報(bào)系統(tǒng),保證數(shù)值預(yù)報(bào)產(chǎn)品的準(zhǔn)確性、實(shí)時(shí)性以及可靠性。
網(wǎng)絡(luò)安全與數(shù)據(jù)管理2024年1期