耿逍懿, 郝 坤, 史振威
一種基于深度學習的熱帶氣旋路徑集成預報方法
耿逍懿, 郝 坤, 史振威
(北京航空航天大學 宇航學院圖像處理中心, 北京 100083)
本文提出了一種基于深度學習的熱帶氣旋(tropical cyclone, TC)路徑集成預報方法。該方法以長短期記憶深度網絡為模型構架, 利用前4個時刻(24 h, 間隔6 h)及當前時刻的TC路徑記錄, 以及由不同環境因素所計算的方向預報因子作為輸入, 分別直接預報和間接(通過預報移動速度)預報路徑, 集成兩者預報結果實現時效為24 h的TC路徑預報。試驗部分使用不同環境因素所對應方向預報因子進行預報, 進而探究在該模型中影響TC路徑預報的環境因素。結果表明, 經緯向風場所計算的方向預報因子對模型預報性能提升較為明顯, 而海表溫度、高度的方向預報因子對性能提升相對較小。此外, 將不同方向預報因子的預報模型進一步集成, 可以提升預報精度。上述結果驗證了本文所提出的方向預報因子、集成方法在TC路徑預報問題中的有效性。
熱帶氣旋路徑; 集成預報; 深度學習; 長短期記憶網絡; 方向預報因子
熱帶氣旋(tropic cyclone, TC)是一種發生于熱帶和副熱帶洋面上的中尺度天氣系統, 常伴隨著巨浪、風暴潮、強風及暴雨等災害現象, 具有強破壞性, 且影響范圍廣泛, 是地球上最嚴重的氣象災害之一[1]。北印度洋泛指印度洋的北半球部分, 平均每年約有9個TC在其洋面上生成[2]。北印度洋連接太平洋和大西洋, 是“海上絲綢之路”的關鍵通道, 具有重要的地理位置和政治地位。此外, 北印度洋TC也常對我國造成影響[3]。因此, 研究北印度洋TC, 減輕其災害影響, 重點關注“海上絲綢之路”戰略通道的海洋環境安全, 具有重要的實際意義。
減輕TC影響及危害的關鍵問題在于預報能力的提升[4]。TC預報主要包括三個方面: 路徑預報、強度預報以及風雨預報。TC路徑預報是強度、風雨等預報的基礎[5], 準確的路徑預報可以有效提升預報服務水平, 協助受影響地區政府及民眾做好防范措施, 有效減少經濟損失和人員傷亡。近年來, TC數值模式不斷完善, 集合預報和多模式集成預報技術逐步發展, TC路徑預報精度得到了大幅提升[6-7]。其中, 集成預報技術綜合集成多種預報模式, 可以有效提高預報準確率[8-9], 是未來預報技術的主要發展方向之一。
隨著氣象觀測技術的發展, TC記錄及各類氣象資料構成了龐大的數據源, 為了從海量數據中挖掘TC發展機制、探索新的預報方法, 將深度學習方法應用于TC預報逐漸成為專家學者們關注的熱點[10-11]。1991年, Pickle[12]首次使用神經網絡解決TC路徑預報問題。隨后, 混合徑向基網絡、循環神經網絡等結構也被應用于TC預報問題[13-18]。考慮到預報因子對TC發展演變的重要作用, 如動力學因子等, Giffard- Roisin等[19]、郝坤等[20]等使用卷積神經網絡對臺風周圍風場等環境場提取特征, 結合TC歷史記錄, 實現TC路徑、強度的預報。此外, 由于集成預報在數值預報中逐步推廣應用, 基于深度學習的TC集成預報也逐漸受到關注[21]。黃小燕等[22]基于主成分分析和進化遺傳神經網絡, 建立了TC路徑集成預報模型; 朱雷[23]提出了基于貝葉斯神經網絡結合Bagging委員會的TC路徑集成預報模型。研究表明, 基于深度學習的集成預報方法相較于單個神經網絡預報個體可以取得更好更穩定的預報效果。
前人的研究開拓了基于深度學習的集成預報方法在TC預報問題中的應用。本文在前述研究基礎上, 聚焦于北印度洋TC的路徑預報, 提出了一種深度學習TC路徑集成預報方法。鑒于長短期記憶神經網絡(Long Short-Term Memory, LSTM)在時序數據預測問題中的優異表現, 本文以LSTM為基礎網絡結構。整體方法以前4個時刻(24 h, 間隔6 h)及當前時刻(共計5個時刻)的TC路徑記錄為數據驅動, 結合方向預報因子作為模型輸入。方向預報因子的計算過程是首先將TC附近一定范圍內各類環境場劃分不同的方向區域, 再分別求取其各區域的對應環境影響因子。因此, 在預報模型中輸入上述方向預報因子相當于在預報過程中結合環境影響因子, 從而可以利用環境因素輔助預報。考慮到在本方法中對環境因子的使用是按照不同方向劃分區域后分別計算, 再輸入預報模型, 故稱之為方向預報因子。最后, 本文借鑒集成預報的思路, 分別對TC路徑直接預報, 以及通過預報TC移動速度間接預報路徑, 將二者集成得到最終預報結果, 實現預報時效為24小時的路徑預報,并通過試驗驗證了上述方向預報因子、集成方法在TC路徑預報問題中的有效性。
本文所研究范圍為北印度洋TC, 使用了以下兩個數據集:
a) 聯合臺風警報中心(Joint Typhoon Warning Center, JTWC)所記錄整理的北印度洋臺風最佳路徑(North Indian Ocean - Best Track, NIO-BST)數據集[24];
b) 美國國家環境預報中心(National Centers for Environmental Prediction, NCEP)所提供的氣象預報再分析(Climate Forecast System Reanalysis, CFSR)數據集[25-26]的客觀分析場資料。
NIO-BST數據集記錄了從1971年至今, 北印度洋TC的最佳路徑數據。數據內容包括記錄的時間點、TC中心經緯度、TC強度等。該數據集時間分辨率為6 h, 即每天的0時、6時、12時和18時; 其空間分辨率為0.1°×0.1°, 即經緯度坐標值精度為0.1。
CFSR數據集記錄了1979年至今, 全球范圍內與氣象相關的物理量, 如經緯度方向風速、溫度等。CFSR數據是GRIB2格點數據, 其空間分辨率為0.05°× 0.05°。該數據集時間分辨率和記錄時刻與NIO-BST數據集相同, 這方便了后續處理中的時序配準。
對于熱帶氣旋, CFSR數據集可以提供TC附近一定空間范圍內的物理量場, 即環境因素, 如不同等壓面的風場、位勢高度場等。如圖1所示, 是北印度洋區域中關鍵通道——馬六甲海峽于1979年1月1日0時850 hPa等壓面下的風矢量圖。

圖1 1979年1月1日0時馬六甲海峽風矢量圖(850 hPa)
NIO-BST數據集與CFSR數據集在時間、空間范圍上有所不同, 需要將二者在時空上進行匹配。本文選用了1979年至2018年間, 北印度洋TC最佳路徑及CFSR數據。
NIO-BST數據需要進行篩選。由于觀測和分析的技術限制, 較弱TC的記錄精度較低[27], 且其發展時間一般較短, 因此, 對NIO-BST數據記錄長度進行篩選, 刪除發展時間較短的TC(少于3 d, 對應13個記錄點)。此外, NIO-BST數據中包含有時間間隔為3 h的記錄, 為了保持時間步長一致性, 刪除相應記錄。根據篩選后NIO-BST數據中的TC記錄, 整理CFSR數據中所對應的時間點, 實現兩類數據的時間匹配。
本文使用CFSR數據來描述TC周圍的環境因素。TC的發展過程十分復雜, 其路徑發展不僅取決于TC內部動力因素, 還受其周圍環境因素的影響[28]。描述環境因素需要確定合適的空間范圍, 范圍過大影響模型的計算效率, 過小則導致所包含信息不足。本文選擇的空間范圍為經緯度40°E×40°N, 具體選取方式如圖2所示, 藍色曲線為TC路徑, 以當前時刻TC風眼(橙色點)為中心, 劃定窗口(實線紅色矩形區域)即為所選取的當前TC對應的環境范圍。通過上述操作實現了兩類數據的空間匹配。

圖2 TC背景環境的劃分示意圖
注: D0、D1、D2、D3和D4分別代表TC所在區域、東北方向區域、西北方向區域、西南方向區域和東南方向區域
本文中所用到的深度網絡以LSTM為基本架構, 因此需要將TC數據整理為LSTM所適配的輸入形式, 即時序樣本和標簽, 樣本為當前時刻之前4個時刻(24 h, 間隔6 h)及當前時刻的TC數據, 標簽為當前時刻24 h后的TC路徑記錄。
對于NIO-BST數據集中的每條TC記錄, 定義其BST數據為:

其中, 下標代表時間點,為TC長度。NIO-BST數據為多元時序數據, 所包含變量分別為年份()、月份()、日期()、時刻(), TC中心的緯度(Lat)、經度(Long)以及強度(), 如下所示:


對于CFSR數據集, 對應BST的各時間點, 有如下定義:

其中,代表不同等壓面的經緯度風、位勢高度或海平面溫度等物理量, 試驗部分會展示選用不同物理量的預報結果。






圖3 時刻t的輸入樣本和標簽
對于數據集中選用的所有TC, 使用上述方法構造樣本和標簽, 得到全部樣本標簽的集合。
使用深度學習方法預報TC路徑, 其關鍵在于, 根據TC歷史記錄和環境因素, 得到擬合TC路徑演變的深度網絡模型, 并據此進行趨勢外推, 最終得到路徑預報結果, 其本質是時序預測問題。深度學習領域, 常用于解決時序預測問題的網絡結構是循環神經網絡及其改進變體。
Elman[29]于1990年第一次提出循環神經網絡(Recurrent Neural Networks, RNN), 其循環模塊是RNN區別于其他神經網絡的本質, 也是其適用于時序預測問題的關鍵[30], 如圖4所示。
為了擬合長期時序數據, Hochreiter等[31]以RNN為基礎進行改進, 提出了LSTM結構。LSTM與RNN的區別在于循環模塊的結構。RNN的循環模塊非常簡單, 而LSTM的循環結構則復雜得多, 如圖5所示, 通過遺忘門、輸入門和輸出門控制記憶狀態和隱含狀態的更新, 從而實現長期記憶。

圖4 RNN網絡結構

圖5 LSTM循環結構
考慮到LSTM適合于長期時序數據的處理, 以及其優異的性能表現, 本文選用LSTM作為TC路徑預報模型的基本網絡結構, 輸入TC數據得到LSTM的記憶狀態和隱層狀態, 再通過2層全連接層(Fully Connected Layer, FC)進行計算得到預報結果。
上述基于LSTM的TC路徑預報方法僅使用BST, t作為輸入, 尚未使用到TC的環境信息CFSR,t。由于CFSR, t與BST, t的數據形式、維度不同, 無法將二者直接串聯輸入LSTM。因此, 為了充分利用環境信息, 本文引入了方向預報因子以輔助TC路徑的預報。
首先, 將TC的背景環境(圖2中虛線所示)劃分為不同區域。圖中D0代表TC所在區域, 考慮到發展成熟的TC, 其7級風圈半徑一般為300 km左右, 最大能達到近800 km[32], 因此將D0的范圍大小設為經緯度10°E×10°N。如前所述, 圖中紅色實線的區域大小為經緯度40°E×40°N, 其余的主要區域分別命名為東北方向區域(D1)、西北方向區域(D2)、西南方向區域(D3)、東南方向區域(D4)。考慮到D1至D4區域面積大于其間矩形區域的面積, 且認為北方向區域一定程度上可以由東北方向區域和西北方向區域表示, 以此類推; 以及模型輸入維度和模型復雜度、計算量的正相關性, 因此為簡化模型及減少計算量, 本文中僅選用D1—D4區域計算方向預報因子, 即對各區域的環境因素(不同等壓面的經緯度風速、位勢高度值等資料, 具體內容請見試驗設計部分)數值分別求取平均值, 即為方向預報因子, 針對不同的環境因素, 可以分別求得對應的方向預報因子, 如850 hPa經向風D1方向預報因子、850 hPa經向風D2方向預報因子等等。
對應每個時刻, 計算得到的方向預報因子是一個向量, 將其與BST, t串聯, 一起輸入TC路徑預報網絡, 使得在路徑預報的過程中可以利用到TC背景范圍內的環境信息。



中的方向預報因子, t將背景環境劃分為不同的方向,, t中各元素的值與TC移動方向有著直接關聯, 如風場的方向預報因子所代表的不同方向引導風流對TC移動方向起著關鍵性作用。因此, 方向預報因子可以為TC路徑預報, 提供關于TC運動方向的更明確的指導信息。
最后, 將組織為網絡輸入的時序樣本形式, 由–至時刻的組成, 即:

綜上所述, 本文將CFSR中各物理量的背景環境劃分為不同方向的區域, 并求取其方向預報因子, 從而給TC路徑預報提供了充分的背景環境信息以及較為明確的預報方向信息。Giffard-Roisin等[19]、郝坤等[20]使用卷積神經網絡(Convo-lu-tional Neural Network, CNN)提取環境信息的方法, 其得到的環境信息具體含義較為模糊, 不包含確切的方向信息; 而本文的方法既提供了明確的方向信息指導, 又節省了CNN的推理時間, 大大提升了計算效率。
在TC路徑預報的工作中, 不論是數值預報還是深度學習方法, 大多數方法都是根據環境信息或歷史數據直接預報未來路徑, 這樣的方法忽略了TC移動過程中速度具有時間連續性的先驗信息。本文基于這樣的考慮, 使用深度學習方法對TC移動速度進行預報, 再通過預報的移動速度計算, 得到預報路徑。
集成預報方法是目前數值預報的主流發展方向[33-34]。TC的集成預報是采用多種數值預報模式, 建立集合成員共同預報TC[35]。借鑒這種集成預報的思想, 本文聯合TC路徑預報模型(TC-track)和TC移動速度預報模型(TC-velocity), 共同實現TC的路徑集成預報。
TC-track的實現細節如前文所述, TC-velocity與TC-track的主體框架和數據處理方式是一致的, 區別在于TC-velocity的輸入輸出不是TC的路徑位置, 而是相鄰時間TC路徑經緯度之差, 可以稱之為速度。用公式表達如下所示:



TC-track和TC-velocity集成的預報模型示意圖如圖6所示。網絡通過對TC的移動速度進行預報, 引入了移動速度時間連續性的先驗信息, 再與TC路徑預報結果集成, 有助于TC路徑預報精度的提升。

整體來說, 本文的使用深度學習網絡——LSTM對TC路徑進行預報, 并使用方向預報因子為TC路徑提供背景環境信息和方向指導信息, 通過預報移動速度引入了速度連續性的先驗信息, 最后將TC-track和TC-velocity集成起來, 提升預報效果。每間隔6 h實現一次時效為24 h的TC路徑預報。
表1展示了本文所提出的路徑預報方法的整體流程。

表1 TC路徑集成預報實施流程
CFSR數據包括與氣象相關的各種物理量, 為了對比其不同環境場對本文集成預報模型預報性能的提升作用, 并從中選出最優模型, 本文篩選了與TC路徑相關的部分環境場, 分別為850 hPa、700 hPa、500 hPa以及200 hPa等壓面下的緯向風場(u-com-po-nent of wind,Wind)、經向風場(v-component of wind,Wind)、位勢高度場(geopotential height,Geo), 以及海面溫度場(sea surface temperature,SS)、海平面高度場(sea surface heigh,SS)。其中, 考慮到風場由Wind和Wind共同描述, 將二者視為一類變量, 簡寫為Wind。
圖7所展示的是, 1997年9月26日6時, 以強烈氣旋風暴BOB 07風眼為中心, 經緯度40°E×40°N范圍內, 不同等壓面下的緯向風速大小。
利用前述的樣本數據整理方式和方向預報因子計算方式, 整理NIO-BST數據集中所篩選出的TC及其對應時刻、對應位置的CFSR數據, 并對其中CFSR環境場分別計算對應的方向預報因子, 如風場(Wind)方向預報因子、海表溫度(SST)方向預報因子等, 最終得到TC數據樣本和標簽的集合。
此外, 深度網絡的訓練需要將樣本集合劃分為三個獨立的數據集, 即訓練集、驗證集、測試集, 三者比例常為8︰1︰1。考慮到TC具有時間屬性, 且預報性能的評估常以年為單位[36], 因此按照年份劃分, 具體情況如表2所示。
使用訓練集的樣本和標簽對搭建好的TC-track和TC-velocity模型分別訓練, 具體來說, 樣本作為模型輸入, 經過模型參數計算后得到模型輸出, 即預報得到的24 h后TC路徑, 計算其與標簽之間的誤差, 然后通過時間反向傳播多次迭代訓練優化模型參數。在訓練過程中, 將驗證集樣本輸入, 通過計算模型預報值和標簽的差距以評估訓練進程, 并挑選出最優模型作為預報模型。得到訓練完成的模型后, 將TC-track和TC-velocity兩模型集成, 輸入測試集樣本, 得到24 h后的路徑預報結果, 與測試集標簽對比, 評定模型性能。

圖7 不同等壓面緯向風速

表2 TC數據樣本劃分
模型評定所采用的指標為路徑平均距離誤差(mean distance error,MD),pred、real,pred、real分別是預測與真實的緯度、經度, 計算公式如下所示:

對應每個樣本均有預報路徑和標簽(真實路徑), 即可計算相應的路徑預報誤差。對測試集所有樣本(2015—2018年北印度洋TC, 共計16個TC, 整理為280個樣本)的預報誤差求取統計值, 包括平均值、均方根誤差、四分位數等, 并繪制箱型圖, 對比評估所構建模型的性能。此外, 針對路徑預報難點, 與外推法相比較進行模型預報結果分析; 使用穩定度指標[37]進行模型檢驗評估; 并與業務化預報的精度相對比。
本文中的TC路徑預報模型使用python 3.6編程語言、PyTorch學習庫搭建, 并使用GPU(Nvidia GeForce GTX 1080)加速訓練。
預報試驗中所對比的方向預報因子及其對應的TC-track模型、TC-velocity模型以及集成模型在測試集上的24 h路徑預報誤差如表3所示, 其中, 預報誤差使用兩類統計量表示, 為測試集所有樣本24 h路徑預報誤差的平均值和均方根, 簡寫為“平均值±均方根”的形式。預報誤差平均值代表預報模型的總體精度, 數值越小表示預報精度越高; 均方根代表模型的預報穩定性, 數值越小表示對于不同的預報樣本, 模型的預報性能越穩定; 預報精度和穩定性共同描述了模型的預報性能。序號1表示僅使用NIO-BST數據(即路徑記錄)作為輸入而不使用方向預報因子的預報模型性能, 序號2—5分別表示使用了由不同環境場所計算得到的方向預報因子以及NIO- BST數據作為輸入的預報模型性能。表格中對各方向預報因子中所用到的CFSR環境場進行了簡寫, 如850 hPa等壓面的經緯度風場簡寫為Wind850, 以此類推。

表3 各環境因素方向預報因子的預報結果
從表3中可以看出, 各類方向預報因子對路徑預報模型的性能提升有一定的作用。Wind方向預報因子對性能的提升較為明顯, 即表中2號對應的預報誤差最小,Geo方向預報因子次之, 而SS方向預報因子和SS方向預報因子對模型性能提升相對較小。不論對于何種方向預報因子, 集成預報的平均誤差總是小于其對應的TC-track模型和TC-velocity模型預報誤差, 這說明了集成預報方法的有效性, 可以提高模型的路徑預報能力。為了更加直觀地表示不同方向預報因子和集成方法對預報性能的提升, 用箱型圖展示表3中各模型的統計量, 如圖8所示。從圖中可以看出, 使用不同方向預報因子的模型相較于第一組(未使用方向預報因子)均顯示出一定的性能提升, 具體表現在預報誤差上限降低、箱型位置靠下(大部分樣本預報誤差降低); 對于每組方向預報因子模型, 集成預報模型相較于TC-track和TC-velocity也有一定的提升。但是, 預報模型對部分樣本存在誤差較大的情況, 在圖8中體現為誤差最大值較大, 將會在后文章節3.3中進一步分析。

圖8 各環境因素方向預報因子的預報結果箱型圖
此外, 為了充分利用多種環境因素的方向預報因子, 本文以表3中的試驗結果為參考, 將上述多種物理變量的TC- track和TC-velocity預報模型進行集成。
由于在表3中,Wind方向預報因子的集成模型取得了最好的預報結果, 因此, 在使用多個方向預報因子模型的過程中, 首先以Wind集成模型為基礎, 集成其他方向預報因子的不同預報模型, 隨后又組合其他方向預報因子的模型進行集成, 各集成模型的24 h路徑預報誤差如表4所示。

表4 多環境因素方向預報因子的預報結果
序號2至13對應模型的預報結果相較于無方向預報因子的模型(序號1, baseline)預報結果在預報精度、預報穩定性上均有一定的提升。其中, 序號3 (Wind的集成模型與Geo的TC-track模型相集成)取得了最優的預報結果。而一些方向預報因子模型的集成, 如序號12、13對應的模型, 其預報性能較baseline及表3中單個方向預報因子的模型提升較小, 這說明方向預報因子不能隨意組合, 需要根據先驗知識或試驗驗證進行合理的篩選。
本章節進一步對本文方法的路徑預報結果進一步分析。首先考慮到路徑預報的難點所在: 移動速度的變化和移動方向的變化[38]。因此, 主要探究了預報誤差與對應時刻的移動速度、移動方向變化情況之間的關聯。
首先, 本文利用NIO-BST數據對TC移動方向和移動速度的變化做了簡單計算。假定當前時刻為, 上一時刻(6 h前)為1, 預報時刻為24 h, 移動速度變化情況Δ和移動方向變化情況Δ計算公式如下所示:







為直觀展示預報誤差與對應時刻的移動速度、移動方向變化情況之間的相關性, 將移動速度變化和移動方向變化分別作為坐標軸, 使用不同的顏色代表預報誤差大小, 展示測試集中2015—2018年的TC(共計16個TC, 整理為280個樣本)預報結果, 如圖9(a)所示。考慮到外推預報法認為TC相近時刻的移動速度和方向不發生改變, 可以明顯展示出TC預報難度與移動速度、方向變化情況的相關性; 且外推法常作為基準方法檢驗預報方法的有效性, 因此, 同樣對外推法的預報結果進行展示作為對比,如圖9(b)所示。

圖9 預報結果與移動速度、方向變化的相關性
從結果中可以看出, 對于外推法的預報結果, 不同預報誤差的分布情況具有明顯的分層現象, 即移動速度和移動方向變化越快, 預報難度越大; 而對于基于深度學習的集成預報方法, 藍色點(預報誤差小于等于80 km)的分布更加廣泛, 紅色點(預報誤差大于200 km)的數量更少。結果說明相較于外推法這種簡單的基準方法, 本文方法是有效的, 但是在移動速度或方向發生較大變化時[Δ>0.4(°)/6 h, Δ>20°], 即預報難度較大時, 仍存在預報誤差較大的現象。
此外, 引入穩定度指標, 包括距離穩定度和方向穩定度對本文方法進行檢驗評估。距離穩定度表示預報誤差小于規定的距離誤差上限的預報次數與總預報次數的比例, 距離誤差上限選擇有兩個, 分別為表4中號3最優集成模型的平均誤差110 km和圖9中較大誤差范圍的界限200 km; 方向預報誤差表示預報方向與實際方向一致的預報次數所占比例。經過對測試集預報結果的統計, 本方法對應上限為110 km和200 km的距離穩定度分別為0.56和0.91, 方向穩定度為0.81。總體來看, 大部分預報次數的預報距離和方向都是較為穩定可信的。
由于本文的所研究的TC范圍為北印度洋TC, 負責北印度洋TC業務預報的專業機構為印度氣象局(India Meteorological Department, IMD)。因此, 將本文方法的24 h路徑預報結果與IMD所發布的預報結果[39]相對比。其中, IMD僅提供了年度平均誤差, 未提供TC個數或預報次數, 因此, 表5中僅對比了兩種方法的年平均預報誤差, 其中的TC個數和預報次數為本文方法的相關數值。從結果中可以看出, 在部分年份(2015年)本文方法的預報性能接近于IMD的業務預報性能; 但是部分年份(2017年、2018年), 本文方法相較于業務化預報的精度具有一定的差距, 還有相當的發展空間。

表5 本文方法與IMD業務預報精度對比
最后, 從測試集中挑選TC個例進行結果展示, 如圖10所示, 為2018年5月發生的特強氣旋風暴“梅庫納”的預報結果, 各預報時刻的24 h路徑預報平均誤差為86.86 km。本方法起報時刻為2018年5月22日12時, 每間隔6 h預報一次, 預報時效為24 h, 如圖10a, 紅色曲線代表真實路徑, 白色虛線兩端連接預報時刻真實路徑和預報路徑(時效24 h), 點顏色代表預報誤差(與圖9相同)。由于圖10a預報點數過多不易觀察, 從起報時刻開始, 每隔24 h繪制一次預報結果, 展示在圖10b。從結果中可以看出,本文預報方法在TC轉向處存在反應滯后的現象, 如2018年5月24日12時的預報結果, 這與前述的分析是相符合的。但總體來說, 預報結果與真實路徑的總體趨勢相吻合, 預報路徑具有一定的可信性, 說明了本文方法的有效性。

圖10 TC“梅庫納”的真實路徑與預報路徑
針對北印度洋TC路徑預報, 本文提出了一種基于深度學習的TC路徑集成預報方法, 使用前4個時刻(24 h, 間隔6 h)的TC路徑記錄和本文所提出的方向預報因子作為輸入, 使用LSTM網絡作為模型結構, 實現時效為24 h的路徑預報。其主要動機及優勢在于: 1) 對環境因素計算方向預報因子, 簡單高效的提取TC的背景信息, 可以顯式地利用環境因素的方向信息, 2) 使用TC移動速度預報模型, 將其與TC路徑預報模型集成得到最終預報結果, 從而利用了TC速度變化具有時間連續性的先驗信息, 從而提升預報精度。
本文方法使用1979—2010年以及2011—2014年的TC進行訓練驗證, 使用2015—2018年的TC(共計16個TC, 整理為280個樣本)測試性能。從試驗結果分析中得到以下結論:
1) 各類方向預報因子對路徑預報模型的性能均有提升作用,Wind方向預報因子對性能的提升較為明顯,Geo方向預報因子次之, 而SS方向預報因子和SSH方向預報因子對性能提升相對較小;
2) 不論對于何種方向預報因子, 集成預報的平均誤差均小于其對應的TC-track模型和TC-velocity模型預報誤差, 說明在本方法中集成預報的有效性;
3) 對多種方向預報因子模型進行集成時,Wind的集成模型與Geo的TC-track模型相集成的模型取得了最優的預報結果, 方向預報因子的組合需要根據先驗知識或試驗驗證進行合理的篩選;
4) 本文方法一定程度上緩解了路徑預報難點(移動速度、移動方向的變化), 但在移動速度或方向發生較大變化時[Δ>0.4(°)/6 h, Δ>20°], 仍然存在部分預報誤差較大的現象。
上述結論驗證了本文所提出的方向預報因子、集成方法在TC路徑預報問題中的有效性。但在與業務化預報的對比中, 本文方法的預報精度尚未占優, 仍有相當的發展空間。下一步將對本文方法中誤差較大的樣本深入分析, 挖掘預報難點, 如TC強度、下墊面變化等可能的影響因素, 并相應改進本文的TC路徑集成預報模型, 進一步提升預報性能。
[1] 陳聯壽, 丁一匯. 西太平洋臺風概論[M]. 北京: 科學出版社, 1979: 1-10.
CHEN Lianshou, DING Yihui. Introduction to Western Pacific typhoon[M]. Beijing: Science Press, 1979: 1-10.
[2] 梁梅, 林卉嬌, 徐建軍, 等. 1990—2018年北印度洋熱帶氣旋統計特征[J]. 廣東海洋大學學報, 2020, 40(4): 51-59.
LIANG Mei, LIN Huijiao, XU Jianjun, et al. Statistical analysis on the characteristics of tropical cyclone in the Northern Indian Ocean from 1990 to 2018[J]. Journal of Guangdong Ocean University, 2020, 40(4): 51-59.
[3] 張霏. 北印度洋熱帶氣旋對中國降水的影響[D]. 南京: 南京信息工程大學, 2015.
ZHANG Fei. The influence of North Indian Ocean tropical cyclone on precipitation in China[D]. Nanjing: Nanjing University of Information Science & Technology, 2015.
[4] 黃偉, 端義宏, 薛紀善, 等. 熱帶氣旋路徑數值模式業務試驗性能分析[J]. 氣象學報, 2007, 65(4): 578-587.
HUANG Wei, DUAN Yihong, XUE Jishan, et al. Operational experiments and its performance analysis of the tropical cyclone numerical model (GRAPE-TCM)[J]. Acta Meteorologica Sinica, 2007, 65(4): 578-587.
[5] 郭蓉, 余暉, 漆梁波, 等. 臺風路徑多模式集成預報技術研究[J]. 氣象科學, 2019, 39(6): 839-846.
GUO Rong, YU Hui, QI liangbo, et al. A study on multi- model ensemble forecast technique for Typhoon track[J]. Journal of the Meteorological Sciences, 2019, 39(6): 839-846.
[6] 馬鵬輝, 楊燕軍, 劉鐵軍. 臺風數值預報技術研究進展[J]. 海洋氣象學報, 2015, 35(1): 12-17.
MA Penghui, YANG Yanjun, LIU Tiejun. Research pro-gress of typhoon numerical prediction technology[J]. Journal of Marine Meteorology, 2015, 35(1): 12-17.
[7] 危國飛, 劉會軍, 潘寧, 等. 臺風路徑數值預報實時訂正技術及其集成應用[J]. 大氣科學, 2021, 45(1): 195-204.
WEI Guofei, LIU Huijun, PAN Ning, et al. Real-time correction method for numerically modeled typhoon tracks and its integrated application[J]. Chinese Journal of Atmospheric Science, 2021, 45(1): 195-204.
[8] 江應境, 高山紅. 一種動態權重的臺風集成預報方法[J].海岸工程, 2018, 37(3): 1-13.
JIANG Yingjing, GAO Shanhong. A Consensus forecast method for typhoon based on dynamic weights[J]. Coastal Engineering, 2018, 37(3): 1-13.
[9] 張守峰, 高拴柱, 李月安. 集成方法在熱帶氣旋路徑和強度預報中的應用[J]. 氣象科技, 2007, 35(2): 161- 165.
ZHANG Shoufeng, GAO Shuanzhu, LI Yuean. Application of consensus method to forecast of tropical cyclones[J]. Meteorological Science and Technology, 2007, 35(2): 161-165.
[10] 金龍, 黃穎, 姚才, 等. 人工智能技術的熱帶氣旋預報綜述(之一)——BP神經網絡和集成方法的熱帶氣旋預報研究和業務應用[J]. 氣象研究與應用, 2020, 41(2): 1-6.
JIN Long, HUANG Ying, YAO Cai, et al. A review of tropical cyclone forecast based on artificial intelligence (part 1)——BP neural network and ensemble method for tropical cyclone forecast research and operational application[J]. Journal of Meteorological Research and Application, 2020, 41(2): 1-6.
[11] REICHSTEIN M, CAMPS-VALLS G, STEVENS B, et al. Deep learning and process understanding for data- driven Earth system science[J]. Nature, 2019, 566(7743): 195-204.
[12] PICKLE J. Forecasting short-term movement and inten-si-fication of tropical cyclones using pattern-recognition techniques[R]. Phillips Lab Hanscom AFB MA, 1991.
[13] 李祚泳, 鄧新民. 人工神經網絡在臺風預報中的應用初探[J]. 自然災害學報, 1995(2): 86-90.
LI Zuoyong, DENG Xinmin. A primary study on the application of artificial neural network to the forecasting of typhoon[J]. Journal of Natural Disasters, 1995(2): 86-90.
[14] LEE R S T, LIU J N K. Tropical cyclone identification and tracking system using integrated neural oscillatory elastic graph matching and hybrid RBF network track mining techniques[J]. IEEE Transactions on Neural Networks, 2000, 11(3): 680-689.
[15] YANG Y Q, WANG J Z. An integrated decision method for prediction of tropical cyclone movement by using genetic algorithm[J]. Science in China Series D, 2005, 48(3): 429-440.
[16] 張廣平, 張晨曉, 謝忠. 基于T-S模糊神經網絡的模型在臺風災情預測中的應用——以海南為例[J]. 災害學, 2013, 28(2): 86-89.
ZHANG Guangping, ZHANG Chenxiao, XIE Zhong. Typhoon disaster prediction model based on T-S fuzzy neural network and its application—A case study of Hainan Island[J]. Journal of Catastrophology, 2013, 28(2): 86-89.
[17] GAO S, ZHAO P, PAN B, et al. A nowcasting model for the prediction of typhoon tracks based on a long short term memory neural network[J]. Acta Oceanologica Sinica, 2018, 37(5): 12-16.
[18] PAN B, XU X, SHI Z W. Tropical cyclone intensity prediction based on recurrent neural networks[J]. Electronics Letters, 2019, 55(7): 413-415.
[19] GIFFARD-ROISIN S, YANG M, CHARPIAT G, et al. Tropical cyclone track forecasting using fused deep learning from aligned reanalysis data[J]. Frontiers in Big Data, 2020, 3: 1.
[20] 郝坤, 張天坤, 史振威. 基于時空特征的熱帶氣旋強度預測方法[J]. 南京師范大學學報(工程技術版), 2019, 19(3): 1-7.
HAO Kun, ZHANG Tiankun, SHI Zhenwei. A tropical cyclone intensity prediction method based on spatial-temporal features[J]. Journal of Nanjing Normal University (Engineering Technology Edition), 2019, 19(3): 1-7.
[21] JIN L, YAO C, HUANG X Y. A Nonlinear artificial intelligence ensemble prediction model for typhoon intensity[J]. Monthly Weather Review, 2008, 136(12): 4541-4545, 4547-4548, 4550, 4552-4554.
[22] 黃小燕, 金龍. 基于主成分分析的人工智能臺風路徑預報模型[J]. 大氣科學, 2013, 37(5): 1154-1164.
HUANG Xiaoyan, JIN Long. An artificial intelligence prediction model based on principal component analysis for typhoon tracks[J]. Chinese Journal of Atmospheric Sciences, 2013, 37(5): 1154-1164.
[23] 朱雷. 基于神經網絡委員會機器的南中國海臺風路徑預報模型研究[D]. 上海: 華東師范大學, 2017.
ZHU Lei. A study on neural network-based committee machines for typhoon track forecast model in the South China Sea[D]. Shanghai: East China Normal University, 2017.
[24] CHU J H, LEVINE A, DAIDA S, et al. North Indian Ocean best track data[EB/OL]. https://www.metoc.navy. mil/jtwc/jtwc.html?north-indian-ocean.
[25] SAHA S, MOORTHI S, PAN H L, et al. The NCEP climate forecast system reanalysis[J]. Bulletin of the American Meteorological Society, 2010, 91(8): 1015- 1058.
[26] SAHA S, MOORTHI S, WU X R, et al. NCEP Climate Forecast System Version 2 (CFSv2) 6-hourly products. Research data archive at the National Center for Atmos-pheric Research, Computational and Information Syste-ms Laboratory[EB/OL]. https://rda.ucar.edu/datasets/ds094.0/
[27] 王維建. 臺風預警發布系統的設計與實現[D]. 成都: 電子科技大學, 2013.
WANG Weijian. Design and implementation of optical network information management system[D]. Chengdu: University of Electronic Science and Technology of China, 2013.
[28] 馬雷鳴. 國內臺風數值預報模式及其關鍵技術研究進展[J]. 地球物理學進展, 2014, 29(3): 1013-1022.
MA Leiming. Research progress of China typhoon numerical prediction models and associated major techniques[J]. Progress in Geophysics, 2014, 29(3): 1013- 1022.
[29] ELMAN J L. Finding structure in time[J]. Cognitive science, 1990, 14(2): 179-211.
[30] SCHMIDHUBER J. Deep learning in neural networks: An overview[J]. Neural Networks, 2015, 61: 85-117.
[31] HOCHREITER S, SCHMIDHUBER J. Long Short-Term Memory[J]. Neural Computation, 1997, 9(8): 1735-1780.
[32] 郭春迓, 程正泉, 李泳澤, 等. 熱帶氣旋風圈統計及業務應用[J]. 廣東氣象, 2020, 42(4): 56-59.
GUO Chunfu, CHENG Zhengquan, LI Yongze, et al. Tropical cyclone wind circle statistics and operational application[J]. Guangdong Meteorology, 2020, 42(4): 56-59.
[33] RICHARDSON D S. Skill and relative economic value of the ECMWF ensemble prediction system[J]. Quarterly Journal of the Royal Meteorological Society, 2010, 126(563): 649-667.
[34] PALMER T N. The economic value of ensemble forecasts as a tool for risk assessment: From days to decades[J]. Quarterly Journal of the Royal Meteorological Society, 2002, 128(581): 747-774.
[35] 沈越婷, 錢傳海. 全球熱帶氣旋集合預報技術綜述[C]// 中國氣象學會. 創新驅動發展提高氣象災害防御能力——S13熱帶海洋氣象, 2013: 9.
SHEN Yueting, QIAN Chuanhai. Overview of global tropical cyclone ensemble forecasting technology[C]// Chinese Meteorological Society. Innovation driven deve-lopment to improve meteorological disaster prevention capability - S13 Tropical Marine Meteorology, 2013: 9.
[36] 陳國民, 張喜平, 白莉娜, 等. 2017年西北太平洋和南海熱帶氣旋預報精度評定[J]. 氣象, 2019, 45(4): 577-586.
CHEN Guomin, ZHANG Xiping, BAI Lina, et al. Verification on forecasts of tropical cyclones over Western North Pacific and South China Sea in 2017[J]. Meteorological Monthly, 2019, 45(4): 577-586.
[37] 馬雷鳴, 李佳, 黃偉, 等. 2007年國內臺風模式路徑預報效果評估[J]. 氣象, 2008, 34(10): 74-80.
MA Leiming, LI Jia, HUANG Wei, et al. Verification on typhoon track forecast by operational typhoon numerical models of China in 2007[J]. Meteorological Monthly, 2008, 34(10): 74-80.
[38] 楊瓊瓊, 吳立廣. 中國24h臺風路徑預報難點及其大尺度環流分析[J]. 氣象科學, 2015, 35(4): 389-397.
YANG Qiongqiong, WU Liguang. Analysis on difficulty of 24 h typhoon track forecast in China and associated large-scale circulation[J]. Journal of the Meteorological Sciences, 2015. 35(4): 389-397.
[39] MOHAPATRA M, SHARMA M. Cyclone warning services in India during recent years: A review[J]. Mausam, 2019, 70(4): 637.
Consensus forecast method for a tropical cyclone track based on deep learning
GENG Xiao-yi, HAO Kun, SHI Zhen-wei
(Image Processing Center, School of Astronautics, Beihang University, Beijing 100083, China)
This paper proposes a tropical cyclone (TC) track forecast method based on Long Short-Term Memory (LSTM) networks as the backbone. Inputs include the TC historical data (24 h, 6 h interval) and the current track, as well as the direction predictors (DP) calculated by different environmental factors. The model TC-track forecasts the track directly, while the model TC-velocity forecasts the track indirectly by the velocity. The models are integrated based on the consensus model, which forecasts the TC track after 24 hours. Through experiments, this paper compares the models driven by different DPs to explore the influence of the environmental factors on the TC track. The results reveal that the DP of the wind field has a more obvious effect on the forecast model performance, while DPs of the temperature and height fields at the sea surface have a relatively small effect. Moreover, the forecast accuracy can be further improved by integrating the selected forecast models of different DPs. The above results verify the feasibility and effectiveness of the proposed DP and consensus forecast method for the TC track forecast.
tropical cyclone track; consensus forecasts; deep learning; long short-term memory; direction predictor
Feb. 20, 2021
TP391; P71
A
1000-3096(2022)02-0074-13
10.11759/hykx20210220003
2021-02-20;
2021-05-06
國家重點研發計劃項目(2017YFC1405605)
[National Key Research and Development Project of China, No. 2017YFC1405605]
耿逍懿(1997—), 女, 碩士研究生, 研究方向為圖像處理與機器學習, E-mail: gxy0809@buaa.edu.cn; 郝坤(1995—), 女, 共同第一作者, 碩士研究生, 研究方向為圖像處理與機器學習, E-mail: 14151035@buaa.edu.cn; 史振威(1977—),通信作者, 教授/博士生導師, 研究方向: 圖像處理與機器學習, Email: shizhenwei@buaa.edu.cn
(本文編輯: 趙衛紅)