邱婷,肖文軍,何佳瑋,何雯
(國家海洋局東海預報中心,上海 200136)
熱帶氣旋(Tropical Cyclone,TC)是一種強烈的災害性天氣過程,許多研究是針對其路徑和強度預測的[1-8],而尺度方面的預測研究相對較少。我國常以7級、10級和12級大風風圈半徑來度量TC尺度。TC尺度預測是大風、風暴潮和臺風浪預報的基礎,對防臺減災和災害預警報有重要的意義。前人曾嘗試讀取TC等壓線圈半徑[9],或者通過TC風和氣壓場之間的動力平衡關系建立經驗模型估算TC大風風圈[10-11],但因等壓場資料的時效性或缺乏近中心最大風速半徑(Rmax)的預報資料,未能實現對TC大風風圈半徑的預測。美國國家颶風中心(National Hurricane Center,NHC)從2004年開始發布包含TC大風風圈半徑的最佳路徑分析數據及預報數據,主要計算方法有:統計計算,如基于氣候學與持續性特征的統計預報模型(Wind Radii Climatology and Persistence Model,DRCL)[12];數值預報方法,如全球氣象預報系統(Global Forecast System,GFS)與颶風研究與預報系統(Hurricane Weather Research and Forecast system,HWRF);集合預報方法[13]等。中央氣象臺近年來開始發布包含四象限大風風圈半徑的TC分析數據,但目前預報業務中尚未給出TC大風風圈半徑的預報數據。
TC風場預報一般可以通過氣象數值模式或動力平衡風場模型給出,動力平衡風場模型的計算基于不同的氣壓分布模型[14-16],具有精度較高且計算快速的優勢,因此在海洋預報業務中被廣泛應用。隨著觀測手段和預報技術的提高,動力平衡風場模型也由過去的對稱模型改進為四象限不對稱模型,其中大風風圈半徑或Rmax是動力平衡風場模型的關鍵參數,而各國預報機構至今都未給出Rmax的預報。為實現TC四象限大風風圈半徑的預測,本文研究了中央氣象臺發布的西北太平洋2014—2018年364個TC發生過程中的大風風圈半徑、實時位置和強度等資料。我們發現大風風圈半徑變化復雜,與中心氣壓(P)以及近中心最大風速(V)等表征TC的參數間并無明顯的相關關系(見圖1),利用數據擬合難以獲得滿意的結果,因此需要一種新的方法從預報變量中尋找規律實現TC大風風圈半徑的預報。神經網絡模型是處理這種復雜的非線性問題的有效手段,能快速完成訓練的模型計算,滿足預報及時性要求,已在TC強度和風暴潮等預報中得到應用[17-19]。本文利用神經網絡模型對TC非對稱大風風圈半徑進行預測研究,為更精確模擬TC風場提供基礎。

圖1 西北太平洋TC四象限7級風圈半徑與中心氣壓和近中心最大風速的聯合分布
本文所用數據來源于中央氣象臺在西北太平洋TC活動期間發布的實時分析資料和預測資料。本研究將實時分析資料視作實測資料,包括TC等級、中心位置、P、V、移速、移向、R7、R10和R12等,預測資料包括中心位置、P和V。數據更新一般在02時(北京時,下同)、05時、08時、14時、17時和20時,共6個時次,預測時效為5 d,時間分辨率為12 h,TC進入我國24 h警戒線后,資料會變更為逐時更新,分辨率提高到6 h,具體數據發布時效隨TC強度路徑有所變化。
多層前饋(Back Propagation,BP)神經網絡是目前應用最為廣泛的神經網絡學習算法。典型的神經網絡通常由輸入層、隱含層和輸出層3層構成。輸入信號后信號向前傳播到隱含層節點,然后經傳遞函數計算將輸出信號傳播到輸出節點,最后由輸出層輸出結果。BP神經網絡模型可看作從n維到m維的非線性映射,能充分逼近復雜的非線性關系,同時大規模并行協同處理數據,具有“自組織、自學習、自適應”等特點,在無法確切擬合出變量之間合理公式的情況下具有應用意義。
本文選用BP神經網絡模型,經過不同參量的篩選與試驗,確定模型時間延遲為2,即以預測時刻T的大風風圈半徑為輸出層變量,以當前時刻(t)與前一個時刻(t-1)的中心經度(lon)、緯度(lat)、中心氣壓(P)、近中心最大風速(V)、移動速度(Vm)、方向(Dirm)、R7、R10和R12,以及T時刻的lon、lat、P和V作為輸入層變量,選擇10個隱含層神經元,共有6 140組輸入數據,訓練算法為Levenberg-Marquardt方法,最大迭代次數為1 000,輸入層采用正切S型傳遞函數tansig:輸出層為線性函數purelin。具體預測公式如下:


預測R7時,若TC最大風力未達到10級,則式(1)中R10=0。
模型的訓練與檢驗采用了2014年9號TC—2018年29號TC共122個TC過程記錄。我們選取近幾年對我國影響較為顯著的1521號、1718號、1808號和1822號4個超強臺風級TC,以及1510號和1807號兩個臺風級TC用于模型檢驗,將除去上述6個案例以外的116個TC過程的實測數據進行校正和勘誤,再插值成逐3 h的樣本用于神經網絡模型訓練。考慮到研究時段內中央氣象臺發布的預測數據最短時效為6 h,模型的后報時間T設為t+6 h、t+12 h和t+24 h,即后報時效為6 h、12 h和24 h,式(1)—(3)中后報T時刻所用t與t-1時刻的輸入變量均來源于實測數據。
以1808號TC(超強臺風級)為例,表1與圖2a分別給出了臺風主要參數與路徑。臺風移動過程中R7、R10和R12的6 h后報結果見圖2b—d。可以看出,神經網絡模型后報結果能較好地刻畫出TC的非對稱性特征,在四象限內大風風圈半徑接近實測值。1808號TC開始形成的7月5日08時和發展初期的7月7日08時,模型結果較實測值與其他時刻相比稍大,4個象限不同后報時效的大風風圈半徑誤差如圖3所示。圖中每個時刻的中心點對應的為大風風圈半徑在4個象限的平均值,東、北、西、南4個方向的柱長分別為NE、NW、SW、SE象限內的模型絕對誤差。

圖2 1808號TC路徑及大風風圈半徑后報結果示意圖(紅色:實測值,藍色:預測值)

圖3 1808號TC非對稱大風風圈半徑后報誤差(藍色:R7,紅色:R10,黑色:R12)

圖3 (續)

表1 1808號TC逐日要素
圖4顯示了用于檢驗的6個TC在不同象限的大風風圈半徑后報誤差。由于1510號和1807號TC是臺風級,V沒有達到12級,故未對R12進行后報,各臺風平均的誤差結果如表2所示。大風風圈半徑隨著特征風速的增大而減小,對應后報結果的平均絕對誤差(Mean Absolute Error,MAE)也隨之減小。6 h后報結果的MAE中,R7介于15~40 km,R10在5~15 km,R12<10 km。隨著預測時效的增加,MAE逐漸加大,24 h后報R7、R10和R12的MAE分別為58 km、25 km和16 km,但各級大風風圈半徑的后報平均相對誤差(Mean Relative Error,MRE)較為接近,6 h后報在5%~15%之間。對比不同象限的結果發現,西北太平洋熱帶氣旋多呈現NE象限風圈半徑偏大的形態,其風圈半徑的后報誤差相較其他象限偏大。Sampson等[20]的評估分析表明,國外一些預報機構如NHC和歐洲中期天氣預報中心(European Centre for Medium-Range Weather Forecasts)等開發的預報模式對2012—2014年大西洋發生的颶風34節(近7級)風速半徑進行預報,預報結果的MAE為:6 h誤差為28~37 km,12 h誤差為37~55 km,24 h誤差為46~65 km。由此可以看出,本文建立的神經網絡模型后報西北太平洋TC大風風圈半徑與之相比誤差相當,可作為西北太平洋TC大風風圈半徑預測的有效工具。

表2 非對稱大風風圈半徑后報誤差表

圖4 非對稱大風風圈半徑后報絕對誤差圖
對比模型結果與實測大風風圈半徑的變化過程發現,訓練所得的神經網絡未能很好地模擬出TC大風風圈半徑的突變。以1808號TC 6 h后報的R7為例,如圖3a所示,7月9日14—20時,1808號TC NE象限R7實測記錄由500 km突增到600 km,而中心氣壓從925 hPa增大到930 hPa,V由58 m/s減小到55 m/s,臺風強度略有減弱,模型的R7模擬值從538 km減小至486 km,未能模擬到這樣的突變過程,導致在20時有超過100 km的絕對誤差。該神經網絡模型不能模擬TC結構如此的突變,從而產生了較大誤差。
為評估訓練所得的神經網絡模型在實際TC預報業務中對大風風圈半徑的預測能力,改用中央氣象臺發布的T時刻預測參量作為輸入因子。當TC生成時,從中央氣象臺實時發布資料中獲取最近t、t-1時刻的實測記錄以及預測時刻T的預報參量,利用建立的神經網絡模型進行大風風圈半徑預測。
同樣以3.1節6個TC為例,并新增2019年對我國影響較大的1909號臺風“利奇馬”進行預測,圖5是不同象限的大風風圈半徑預測誤差,表3是預測的MAE、均 方根 誤差(Root Mean Square Error,RMSE)和MRE。對比表2,發現預測結果相比后報結果誤差有所增大,主要是由預測時刻T的輸入因子的預報誤差引起,但模型仍獲得較為滿意的結果。結合圖5,R7、R10和R12最近時效的預測結果MAE分別為33 km、20 km和10 km,RMSE分別為49 km、28 km和16 km,總體平均的MRE仍較為接近,在10%~20%之間。同樣地,模型也存在大風風圈半徑突變難以預測的問題。

圖5 非對稱大風風圈半徑預測誤差圖

表3 非對稱大風風圈半徑預測誤差表
利用2014—2018年中央氣象臺發布的西北太平洋TC數據進行神經網絡的訓練與檢驗,建立了熱帶氣旋非對稱大風風圈半徑預測模型。選取1510號、1521號、1718號、1807號、1808號和1822號TC,采用實測記錄進行了未來6 h、12 h和24 h大風風圈半徑的后報模擬,利用預報數據對上述TC以及新增的1909號TC的大風風圈半徑進行預測。結果顯示,R7的6 h后報平均絕對誤差介于15~40 km,R10誤差介于5~15 km,R12誤差<10 km,誤差隨著時效的增加而增大,后報的MRE在5%~15%之間。預測結果中檢驗TC平均的R7、R10和R12最近時效的MAE分別為33 km、20 km和10 km,總體平均MRE在10%~20%之間。預測相比后報結果誤差有所增大。與國外大風風圈半徑預測模型相比,本文建立的神經網絡模型預測誤差略大,但具有輸入參量少且計算量小的優勢,可作為TC大風風圈半徑預報的有效手段,在西北太平洋TC大風風圈半徑預報業務中具有良好的應用前景。熱帶氣旋的尺度特征尤其是尺度突變是一個復雜的問題,受到大氣環流、海洋下墊面及路徑類型等其他因素的影響[21-22]。本文建立的神經網絡模型僅利用了中央氣象臺在TC發生期間給出的有限參量,難以模擬大風風圈半徑的突變;另一方面,模型精度依賴于訓練數據的精度,據分析NHC的最佳路徑34 kt大風風圈半徑資料誤差在10%~40%之間[20]。本文采用的大風風圈半徑數據自身也存在一定誤差,從而影響了模型精度。