999精品在线视频,手机成人午夜在线视频,久久不卡国产精品无码,中日无码在线观看,成人av手机在线观看,日韩精品亚洲一区中文字幕,亚洲av无码人妻,四虎国产在线观看 ?

基于神經網絡集合預報的臺風路徑預報優化

2020-04-21 03:58:24周笑天張豐杜震洪劉仁義
浙江大學學報(理學版) 2020年2期
關鍵詞:模型

周笑天,張豐,杜震洪*,劉仁義

(1.浙江大學浙江省資源與環境信息系統重點實驗室,浙江杭州310028; 2.浙江大學 地理信息科學研究所,浙江 杭州310027)

臺風是一種氣象災害,每年約有20 個臺風直接或間接地影響、威脅我國人民的生命財產安全。臺風破壞力大,為有效控制臺風產生的危害,臺風路徑預報成為當下迫在眉睫的研究熱點之一。近年來,隨著氣象學和計算機軟硬件條件的發展,臺風路徑預報研究漸趨成熟,同時對預報精度的要求也大幅度提高。

臺風路徑預測研究的模型和方法大致可以分為以下4 類:(1)氣象學模型。XU 等[1]提出,使用超低仰角雷達數據有助于預測臺風發展,完善預警系統和臨近預報;俞兆文等[2]采用WRF-ARW 和WRFDA 的3.8 版本進行了云雨條件下AMSR 2 衛星微波成像資料的同化試驗。(2)統計學模型。袁杰穎等[3]在現有集合預報方法的基礎上,基于預估偏差的思想設計了一種新的優化方案,以進一步提高臺風路徑預報的精度和穩定性;WANG[4]利用熱帶氣旋路徑數值模式GRAPES-TCM 對臺風路徑進行了綜合預測實驗,并設計了3 種集成方案;HUO 等[5]采用正交的CNOPs 方法,具有更大的水平分布,能更好地描述預測的不確定性。(3)動力學模型。陳子通等[6]探討耦合方案對預報精度的影響,實現動力過程與物理過程耦合;黃文鋒等[7]根據熱帶氣旋運動的最新軌跡,提出了一種動態預測模型的初始風場調整方法;CHUN 等[8]進行了AMSR2同化,提供了更好的臺風結構,顯著提高了中心海平面氣壓、最大風速和臺風路徑預報。(4)神經網絡模型。王向陽等[9]選取了目前國內外最具代表性的3種西北太平洋熱帶氣旋路徑預報方法對熱帶氣旋路徑預報進行集成,從而提高了熱帶氣旋路徑預報的準確率;黃小燕等[10]以南海海域的臺風樣本為基礎,采用主成分分析的特征提取與逐步回歸計算相結合的預報因子信息數據挖掘技術,以提高預報模型泛化能力;邵利民等[11]利用前饋型BP 神經網絡模型,對發生于中國沿海的熱帶氣旋的移動路徑進行了預報應用研究。

綜上所述,在這幾類臺風路徑預測模型中,氣象學模型最為傳統也最為精確,能將天氣圖、衛星資料等數據轉換為臺風內部分布的各層數據,預報員利用軟件處理分析,提取所需臺風的實時特征,但其本身缺乏長時間序列下對于臺風運行規律和動向的預報能力;統計學模型的出現很好地解決了這一問題,顧及大氣物理量參數的相關性,根據臺風初始擾動的可能性,納入大量樣本進行統計,給出了臺風運行路徑的合理推薦集;動力學模型,綜合考慮環境氣流、地貌分布、下墊面因素,利用臺風移動規律的函數,應用數值模式的分析結果,推算臺風的移動路徑;神經網絡預報模型是當下的研究熱點,該模型以大量歷史臺風數據作為實驗基礎,在反復訓練下自動調整網絡節點間的權重因子,從而達到預報給定臺風路徑信息的目的,具有自適應性強、容錯性高等優點。

本文在前人研究基礎上,將集合預報思想與神經網絡模型相結合,設計并實現了基于集合預報思想的統計學模型和基于BP 算法的神經網絡預報模型,改進了單集合預報的固定性,降低了單神經網絡預報模型的隨機性,構建了一個高可用、細粒度并且符合臺風預報時效性需求的基于混合模式集合的臺風路徑神經網絡預測模型,充分發揮了時序層次優勢和偏差調節能動性,突破了傳統集合預報的線性相關局限,為臺風路徑預報研究開拓了嶄新思路,為氣象災害預警工作提供了決策支持。

1 混合模式集合預報下的臺風路徑神經網絡預測模型

1.1 臺風混合模式集合預報思想

作為動力隨機預測技術的新一代產物,集合預報曾被用于緯度天氣預報系統,現今其體量發生了巨大變化,并被擴展到季節和氣候預測。目前應用的熱點之一是短期集合預報,包括對熱帶氣旋預報的研究。因其預測時間短,短期集合預報比中期預測更復雜,由于預測方法中初始性擾動場受的影響比中期預測的大,因此,選擇好的方法尤為重要,其關鍵在于方法的離散速度和初始數組的離散次數[12]。關于預測的空間規模,除了使用全球大氣模型來預測大規模氣象環境之外,在中尺度預報領域也引入了集合預報法。結果表明,該方法具有明顯的優勢,尤其在極端氣象現象預測上優勢更顯著。

EPSTEIN[13]提出的動力隨機預報和LEITH[14]提出的“蒙特卡羅”預報是經典集合預報思想的基礎。“蒙特卡羅”預報在業務應用上,需要大量高性能計算機集群共同計算,一度陷入瓶頸。近年來,隨著計算機軟硬件水平的突飛猛進,歐美等發達國家氣象界高度重視集合預報,隨后,我國國家氣象中心也開始集合預報嘗試。從科學角度看,集合預報不僅是一種觀點,更是一種革新。

集合預報是一種為了體現初值不確定性并將擾動的隨機性系列化的方法。原先其定義主要在于初值集合,體現在1992 年左右ECMWF[15]和NCEP[16]的預報工作中;而后考慮了模式的不確定性[17],將不同模式的多樣化以集合的方式表達,形成了后來的集合預報發展產物,也就是混合模式集合預報。

KRISHNAMURTI 等[18]基 于AMIP 提 出 了 混合模式集合的預報創意,改善了氣象和季節規模的預測,并將其擴展到颶風預報領域。因超級集合均方根誤差與典型的模型分析較接近,在預測期效果中顯示了其優勢。結果表明,通過混合模式集合預報獲得的信息,在概率和決定性上均比單模型集合預報的誤差小。通過比較選擇的集合預報優化方法,一般稱為PoorMan 法[19]。本質上,PoorMan 集合預報技術屬于多分析多模型集合預報,從一些大型集合預報中心采集,并進行決定性預測,較普通集合預報的開發與維護更簡單。基于PoorMan 法,文獻[20]提出了超級集合預報思想,通過多個模型的預報結果,根據模型的先前性能修正預報結果,獲得最佳的決定性預報。與其他的集合預報方法不同,超級集合預報只提供決定性預報,根據此方法獲得的決定性預報效果,比一般集合預報方法的效果更明顯。集合預報思想的更新推進和廣泛使用,將使數值預報在概念、技術、實踐方面發生巨大轉折。

1.2 基于BP 算法的神經網絡模型

神經網絡是一種依賴神經單元逐級互聯,并具有自我調節、自我適應能力的網絡,能夠模擬動物對外界情況變化的真實反應傳遞。隨著神經網絡研究的進一步發展和更新,其已成為一門多元化、交叉性的前沿學科。神經網絡模型是基于神經網絡和機器學習的,在大數據環境下具有一定的預測能力[21]。

多層網絡的訓練效果雖然顯著優于單層感知機,但需要的訓練學習算法更為復雜。誤差反向傳播(Back-Propagation,簡稱BP)算法是當前最具代表性的神經網絡學習算法[22]。

BP 神經網絡的網絡結構如圖1 所示。

圖1 BP 神經網絡結構Fig.1 Structure of BP neural network

激活函數是神經網絡中重要的一環,將非線性特征引入網絡,并將輸入信號轉換為輸出信號。良好的激活函數能加快訓練速度,提升訓練效果。為解決梯度消失問題,有效提升效率,本文采用ReLU函數,該函數的非線性能力較強,稀疏性良好,與生物神經元中的少量信號選擇性響應特征相符[23]。其數學表達式和一階導數如下:

可見,對于小于零的輸入,神經元在負方向上均為0,有利于減少參數間的相互依存關系,降低過擬合的發生概率;對于大于等于0 的輸入,可大幅減少計算量,提高網絡的訓練速度。

在常規的神經網絡訓練中,只是歸一化處理了輸入層數據,沒有在隱含層中進行歸一化處理。輸入數據在經過σ(WX+b)矩陣計算以及激活函數處理后,隨著神經網絡的多重計算,數據分布的差異性會越來越大,模型訓練得到的參數泛化性能會被削弱,同時會降低實驗效率,因此,需要在網絡中進行歸一化處理。

批 歸 一 化(batch normalization(BN))算 法 由IOFFE 等[24]提出,可改善神經網絡的訓練效果,具體表現為:加快收斂速率,提高訓練效率;省去了一些正則化處理過程,避免了因學習率設置過小發生訓練欠擬合情況;保持網絡的穩定性,提高模型訓練精度。

針對神經網絡訓練中的過擬合問題,Dropout技術是一種簡單高效的訓練策略,有助于提高網絡的泛化能力[25]。其原理為:以p 的概率隨機Dropout神經元,將其值置為0,其他神經元以1-p 的概率被保留,降低了神經元之間的相互依賴性,使網絡中各神經元相互促進又相互制衡。示意圖如圖2 所示。

圖2 Dropout 示意圖Fig.2 Schematic of Dropout

本文以“臺風路徑集合預報優化”核心問題為導向,深入研究了臺風混合模式集合預報思想和基于BP 算法的神經網絡模型;在此基礎上,提出了神經網絡優化訓練算法;更進一步,以臺風路徑預報的實際業務需求為背景,構建了臺風路徑集合預報傾向優化模型,如圖3 所示。

圖3 集合預報神經網絡方法Fig.3 Ensemble prediction neural network method

1.3 臺風路徑集合預報傾向優化模型

基于臺風全球集合預報系統預報數據以及從中央氣象臺網站采集的臺風實況數據,運用批歸一化方法和Dropout 技術,訓練臺風路徑集合預報傾向優化模型(typhoon ensemble-prediction tendency(TEPT))。

基于不同站點集合預報結果數據集中的歷史預報,本模型側重考慮各站點的預報好壞情況,設置了傾向度θ(0 <θ <1)。網絡訓練的輸出并不是直接推算臺風路徑的經緯度,而是推算各個站點的傾向度,表征各站點的預報精度。對于n 個站點,有由于過少的網絡層數會導致非線性能力偏弱,過多的網絡層數需要更加龐大的數據量,因此,最終選定的臺風路徑集合預報傾向神經網絡為4 層,包括1 個輸入層、2 個隱含層和1 個輸出層。輸入層包括前3 時次預報數據和預報時次的集合預報數據,輸出層為各站點預報傾向,使用傾向集合預報誤差來表征loss。神經網絡之間用全連接網絡相連,激活函數選用提高線性分割度的ReLU,將原始數據集劃分為訓練數據集、驗證數據集和測試數據集,使用批歸一化方法和Dropout 技術增強模型的計算能力和表達能力。該網絡的核心訓練參數如表1 所示,實驗思路如圖4 所示。

圖4 集合預報傾向優化模型實驗思路Fig.4 Experimental tack of ensemble prediction tendency optimization model

表1 TEPT 網絡核心訓練參數Table 1 Network training parameters of TEPT

1.4 評價指標

路徑誤差為兩點之間的距離,即在已知兩個點的經緯度情況下,求它們之間的距離。不妨將地球視作一個標準的球體,令其半徑等于地球的平均半徑R,以0 度經線為基準,忽略地形帶來的誤差,就可以計算出兩點之間的地表距離。假設兩點的經度分別為lng1 和lng2,兩點的緯度分別為lat1 和lat2,東經為正,北緯為負,由三角函數,可以得兩點間的距離D:

集合預報產品需要一套定量的誤差檢驗體系[26],對于決定性的均值預報,可用平均誤差和平均絕對誤差來衡量,其表達式分別為:

2 實例驗證與結果分析

2.1 研究區概況

選擇西北太平洋和南海作為主要研究區域,經緯度分別為80°E~180°E,0°N~60°N,基本覆蓋了西北太平洋和南海活動臺風的大部分區域,具有良好的代表性。

受西太平洋副熱帶高壓、東風氣流和季風槽的影響,在該區域的臺風生成后大部分會向中國、日本、韓國、越南等國家行進,造成巨大的經濟損失和人員傷亡。在我國登陸的臺風會給我國帶來嚴重的雨情災害,災情主要表現為大范圍的降水和高強度的暴雨,影響范圍覆蓋20 多個省份[27]。另外臺風造成的洪水使得眾多中小河流水位超過警戒線,給當地人民生活、生產帶來極大困難。

因此,研究西太平洋和南海區域的臺風不僅為該區域氣象學研究打開了通道,而且能為受臺風影響國家的防臺、抗臺工作提供知識服務和決策支持。

2.2 數據預處理

文中用到的臺風數據來源于全球兩大集合預報系統ECMWF 和NCEP 的臺風模式預報數據和中央氣象臺網站提供的2016—2018 年3 a 的臺風數據,總數據達185 萬行。ECMWF 模式數據一天2報,每報50 個站點;NCEP 的GEFS 模式數據一天4報,每報20 個站點;中央氣象臺實況和預報數據(CMA)更新頻率不定,采集頻率最短為每小時1 次。

臺風數據中存在部分無用記錄或空缺記錄,實驗前需進行處理:

(1)經度或緯度數據為0 的記錄,數據本身有誤,需刪除。

(2)風圈半徑可能存在3 種大小不同的數值,本文只取最小風圈半徑所對應的數據記錄。

(3)預報數據中存在跨180°經線的臺風,計算前可將這些經度lng 轉化為(360-lng),輸出時返回正常值。

(4)在神經網絡訓練前,需預先進行數據插值(空缺時間點上的經緯度需補全)和歸一化處理,以提高訓練效率,提升優化效果。

另外,在神經網絡優化訓練前,將Oracle 中的數據按照“年份-臺風標號-起報時間”整理成csv 文件集,以方便數據匹配,提高訓練效率。

臺風數據總記錄達185 萬行,去除無效數據后有141 萬行。本研究中使用的臺風數據涉及5 個表,分別為TYPH_INFO 表、TYPH_MONITOR_WEB表、TYPH_FORCAST_WEB 表、TYPH_MODEL表和TEPO 表。TYPH_INFO 表記錄了臺風的基本信息,包括臺風模型與實況的對應關系以及臺風的中英文名稱;TYPH_MONITOR_WEB 表記錄了臺風實況數據的具體信息,包括臺風實況編號、點時間、緯度、經度等;TYPH_FORCAST_WEB 表記錄了中央氣象臺預報的臺風數據信息,包括臺風實況編號、預報臺、起報時間、預報時次等;TYPH_MODEL 表記錄了兩大全球集合預報系統ECMWF 和NCEP 的臺風集合預報數據,包括臺風模型編號、起報時間、預報時次等;TEPO 表記錄了集合預報多模協同優化預報數據結果,包括位置、臺風模型編號、起報時間、預報時次等。

2.3 結果分析

圖5 列出了訓練集(橙線)和驗證集(藍線)的收斂過程。用2018 年臺風數據做檢驗,表2 列出了臺風路徑集合預報傾向法TEPT(typhoon ensembleprediction tendency)與全球集合預報系統ECMWF和NCEP(NCEP 提供的GEFS 數據)以及中央氣象臺CMA 的誤差對比情況(路徑誤差單位為km)。

圖5 訓練集和驗證集的收斂過程Fig.5 Convergence process of training set and verification set

取TEPT 的平均預報結果,繪制2018 年臺風數據檢驗圖,分別用淺綠、黃、綠、紅標記ECMWF、GEFS、CMA 和TEPT 預 報 結 果,如 圖6 所 示。可見,在 預 報 時 次60 h 內,TEPT 比GEFS 和CMA 的精度稍好;而在預報時次36 h 內,TEPT 的預報精度有明顯提高,較其他預報精度高。在60 h 以外的預報時次范圍,總體表現略差。

表2 TEPT 全體誤差對比情況Table 2 All comparisons of TEPT errors

模型的預報誤差均隨預報時次的增加而增加。在大多數時次上,TEPT 的預報效果波動較大,因此對于TEPT 的預報,可采用集合預報的延伸思想,將其預報結果以集合的形式呈現,包絡面會更加貼近實況臺風的走向,從而大致估計臺風路徑波動范圍。

圖6 2018 年TEPT 對比檢驗結果圖Fig.6 Contrast test result diagram

3 結 語

集合預報充分體現了其優越性,擺脫了傳統混合模式預報解算中的固有限制,充分發揮了時序層次優勢和偏差調節能動性,創新了臺風路徑預報的優化思路,促進了海洋氣象研究和臺風預報業務的發展。另外,本文融合混合模式集合預報思想和神經網絡模型方法,探索了多元可擴融合模型,建立了集合預報神經網絡優化模型,同時解決了單集合預報的固化性和單神經網絡預報模型的隨機性問題,突破了傳統預報的線性相關局限。

受訓練數據量和網絡選型的限制,預測的準確度和穩定性有待增強。后續研究可考慮數據分片集成方法和其他不同結構的學習器,以提高模型的迭代預測能力,增強預測方法的健壯性。

猜你喜歡
模型
一半模型
一種去中心化的域名服務本地化模型
適用于BDS-3 PPP的隨機模型
提煉模型 突破難點
函數模型及應用
p150Glued在帕金森病模型中的表達及分布
函數模型及應用
重要模型『一線三等角』
重尾非線性自回歸模型自加權M-估計的漸近分布
3D打印中的模型分割與打包
主站蜘蛛池模板: 精品无码人妻一区二区| 国产jizz| 黄色成年视频| 狠狠综合久久| 萌白酱国产一区二区| 色屁屁一区二区三区视频国产| 另类重口100页在线播放| 9999在线视频| 精品伊人久久大香线蕉网站| 四虎影视8848永久精品| 亚洲第一成年网| 国产精品美女自慰喷水| 日韩专区欧美| 欧美亚洲国产精品久久蜜芽| 免费国产在线精品一区| 网友自拍视频精品区| 天天综合网色| 国产成人免费视频精品一区二区| 国产日韩精品欧美一区灰| 色综合久久88| 国产精品无码翘臀在线看纯欲| 国产99免费视频| 欧美日韩中文国产| 日本手机在线视频| 在线99视频| 久久77777| 国产高清国内精品福利| 99久久精彩视频| 国产精品欧美激情| 在线视频亚洲色图| 亚洲成人免费看| 青青草国产精品久久久久| 色色中文字幕| 高清无码不卡视频| 天堂在线亚洲| 亚洲久悠悠色悠在线播放| 国产成人超碰无码| 亚洲综合亚洲国产尤物| 久久久无码人妻精品无码| 久久国产高潮流白浆免费观看| 国产精品永久在线| 日韩精品少妇无码受不了| 欧美激情伊人| 国产在线高清一级毛片| 亚洲精品无码专区在线观看| 97国产精品视频自在拍| 无码乱人伦一区二区亚洲一| 欧美色香蕉| 亚洲大学生视频在线播放| 激情综合五月网| 一区二区日韩国产精久久| 人妻丰满熟妇AV无码区| 精品国产成人高清在线| 成人字幕网视频在线观看| 国产精品精品视频| 亚洲不卡影院| 欧美性精品| 国产成人你懂的在线观看| 国产自视频| 2019国产在线| 久久特级毛片| 中国丰满人妻无码束缚啪啪| 在线a视频免费观看| 中文字幕色站| 精品国产免费观看一区| 亚洲精选无码久久久| 亚洲天堂首页| 精品99在线观看| 欧美视频在线观看第一页| 最新无码专区超级碰碰碰| 青草精品视频| 亚亚洲乱码一二三四区| 国产精品伦视频观看免费| 国产乱人激情H在线观看| 玖玖精品在线| 欧美人与牲动交a欧美精品| 国产欧美精品一区aⅴ影院| 91精品专区| 精品少妇人妻无码久久| 国内a级毛片| 免费看美女自慰的网站| 伊人无码视屏|