熊聰聰,潘 璇,趙 奇,吳振玲
(1. 天津科技大學計算機科學與信息工程學院,天津 300222;2. 天津市氣象局,天津 300074)
多模式集成的RBF神經網絡天氣預報
熊聰聰1,潘 璇1,趙 奇1,吳振玲2
(1. 天津科技大學計算機科學與信息工程學院,天津 300222;2. 天津市氣象局,天津 300074)
針對復雜龐大的多模式數值預報數據,提出一種徑向基函數(RBF)神經網絡集成天氣預報模型.根據天津市預報站點采用的WRF模式、RUC模式等數值預報數據的特點,將多種單模式數據作為RBF神經網絡輸入,網絡輸出為集成預報結果.實驗表明:RBF神經網絡集成預報模型降低了單模式預報誤差,更加貼近了真實數據,并且在穩定性和實效性方面均有良好表現.
集成預報;多模式;神經網絡;徑向基函數
20世紀后期,從傳統的單一模式向多模式集成數值預報方向發展成為天氣預報技術發展的熱點問題.集成預報就是通過一種數學模型將多種相互獨立的單模式預報結果或參數進行整合與分析,最終得到最理想預報結果的一種方法[1].常用的集成預報方法有權重集成、回歸集成、概率集成及判別集成等[2].
大氣屬于非線性系統,用一組動力方程來模擬其變化規律是極其困難的;但是可以根據已知樣本數據推斷出可能存在的規律,從而尋找到決定未來數據演化的法則和系統的狀態變量,此時神經網絡算法表現出了明顯的優勢.人工神經網絡(ANN)是由大量的虛擬神經元相互連接進行信息的并行處理和非線性轉換的網絡系統,其算法具有平行分布處理、學習和自適應性、非線性以及數據融合等特性,在大氣科學研究領域越來越受到重視[3].
目前,基于神經網絡方法進行多模式集成預報已有較多成果[4–5],大多采用BP神經網絡[6–7],其缺陷是學習速度較慢、訓練過程可能陷于局部最小及沒有確定隱層神經元數的有效方法[8].氣象預報要求在較短時間內得到較準確的預報結果,所以選取學習速度快、收斂性好、實時性強[9]的徑向基函數(radial basis function,RBF)神經網絡作為預報模型有著很大的優勢.近年來,RBF神經網絡已應用到一些行業的預報中,其中RBF神經網絡輸入層神經元元素的選取,大多采取“結果相關影響因子”或者是根據已知結果序列推測未來數據的形式.
本文采用新的集成預報路線,將低級單模式預報作為RBF神經網絡輸入層,經過網絡優化后從輸出層獲得集成預報結果.首先介紹了RBF神經網絡多模式集成預報模型的構建過程,然后通過實驗對預報模型的效率、誤差等進行分析,并與其他集成方法和單模式預報進行了對比.
RBF神經網絡是于20世紀80年代末提出的一種采取局部接受域來執行函數映射的人工神經網絡結構,是具有單隱層的3層前饋網絡[10],其輸入層由多個神經元節點(感知單元)組成,第2層為網絡中的隱含層,也稱作徑向基層.RBF與其他網絡的最大區別在于,隱含層的作用函數(基函數)并非是全局響應而是局部響應的高斯函數[11],當輸入信號靠近基函數的中央范圍時,隱含層節點會產生較大輸出,故這種網絡具有局部逼近能力.通過神經元連接權值的調整,可以準確地逼近氣象數據變化中反映出來的非線性映射關系.輸出層將隱含層的輸出進行加權求和,最終實現由多個模式的網絡輸入得到目標輸出,即集成預報結果.對于每個訓練樣本,RBF神經網絡只需對少量的權值和閾值進行修正,因此對于求解同一問題,RBF神經網絡的神經元個數會比BP網絡多,但是訓練時間卻比BP網絡的要少.
構建多模式集成預報模型的目標是實現對天津本地氣候的單一氣象要素進行客觀精細化集成預報.本文主要針對的是地面溫度的集成預報;應用范圍為天津市233個鄉鎮預報站點;采用的預報數據為每日4個時刻(2時、8時、14時和20時)的溫度數據.
2.1 輸入層對象的選擇
在應用RBF神經網絡作為預報工具的成果中,如地下水位動態預報[12]以及機械故障的判斷[13]等,輸入層元素與輸出層的關系大多建立在“影響因子與結果”式的因果關系上.而文獻[14]中,網絡輸入層元素與輸出層已不是“影響因子與結果”式的關系,而是一系列低級預報與優化后的高級預報的關系;但其低級預報的空間來源是單一的,僅是時間序列數據加工的結果.
參考上述網絡模型,采用集成多個低級預報模式的方法,即選取幾種穩定性好、誤差相對較小的單模式預報數據作為網絡輸入層,通過RBF神經網絡計算輸出的結果作為高級預報結論的方式,實現多模式集成預報.用于集成預報的數據是多種單模式數值預報結果,在這里初步篩選出4種單模式預報模式,分別是GRAPES、RUC、T639和WRF模式.集成預報模型的目的在于使結果不僅在形式上要比單模式預報簡潔,還要具備更好的準確度和穩定性,其網絡結構圖如圖1所示.

圖1 多模式集成的RBF神經網絡結構圖Fig. 1Structure of RBF neural network based on multimodel integration
2.2 集成算法
RBF神經網絡的輸入層到隱含層的傳遞函數為高斯函數,其表達式為

式中:p為隱含層節點的個數,與訓練樣本個數相同;X為四維輸入向量,代表4種單模式預報;ci∈Rn為徑向基函數的中心,σi是第i個隱含層的感知變量,ci與σi由學習算法確定,采用自組織選取中心算法為歐幾里得范數;φi(X)在ci處有唯一最大值,所以對于輸入向量X,只有在第i個隱節點中心ci周圍的部分區域內有較強的反應.
利用傳遞函數計算隱含層的輸出后,輸出層再將隱含層的輸出進行加權求和,最終得出網絡的輸出.其網絡輸入與輸出的映射關系可以表達為

式中:ijω表示輸出層的第i個神經元在第j個隱含層節點的連接權值,利用最小二乘法計算得到.
集成預報流程為:首先確定待集成數據為單站點單時刻的4種已選單模式的溫度預報值.然后確定訓練樣本的規模,由于模式預報值會隨著氣候的變化呈現出一定規律,過多選取不僅造成計算量大,而且無法準確描述預報規律,從而導致擬合誤差過大.最佳方案為待預報時刻之前最近30,d的歷史數據作為訓練樣本,所以每組待集成數據對應的訓練數據都是動態滾動更新的.每個樣本對應的實況數據作為網絡訓練的輸出,所以輸出層神經元個數為1.模型訓練之前要對數據進行歸一化處理.接著針對訓練數據進行網絡訓練.最后利用訓練好的網絡對待集成數據進行運算得到集成結果,再對其反歸一化即可得到最終結果.預報模型的算法流程如圖2所示.

圖2 RBF神經網絡集成預報算法流程Fig. 2 Flow chart of RBF neural network integration forecast method
圖3給出了2012年7月5日至7日天津靜海站點(站點號54619)的預報結果比較,按照每天2時、8時、14時和20時的順序進行排列分布.

圖3 RBF集成預報與單模式預報的結果比較Fig. 3 Comparison between RBF network integrated forecast and those of four single forecast models
由圖3可見,在4種單模式預報中WRF模式預報效果最好,其與真實值的絕對誤差最小值為0.3℃,最大值為3.1℃;而RBF神經網絡集成結果與真實值的絕對誤差范圍為0.15~1.66℃.表明RBF神經網絡集成預報結果比單模式預報結果更貼近真實值.
選取靜海站點2012年7月份數據(31,d,每天2時、8時、14時和20時4個時刻),分別對比了本文方法、基于遺傳算法和粒子群算法優化權重系數3種集成方法及4種單模式方法的預報效果,結果見表1和表2.遺傳算法和粒子群算法的參數分別參考文獻[15]和文獻[16]選取.

表1 集成預報方法與單模式預報的預報誤差比較Tab. 1Error comparison of the integrated forecast method and the single forecast model

表2 集成預報方法與單模式預報的誤差分布Tab. 2Errors distribution of the integrated forecast method and the single forecast model
表1給出了各種方法的預報結果與實際值的誤差.可以看出,與單模式預報方法相比,3種集成預報方法都在一定程度上降低了誤差;在3種集成預報方法中RBF神經網絡集成方法的誤差最小.
表2給出了各種方法的誤差分布.可以看出,在3種集成預報方法的預報結果中,誤差小于1℃的比例均高于4種單模式預報,而RBF集成算法又高于其他兩種集成算法,RBF集成算法預報誤差大于2℃的比例最小.這證明了RBF神經網絡在擬合訓練數據的能力上優于另外兩種算法,提高了整體預報精確度.
在算法的程序執行時間上,遺傳算法59.23s,粒子群算法52.46s,RBF神經網絡14.43s.RBF神經網絡的執行時間明顯快于其他兩種算法,這是因為它的函數逼近能力能使網絡快速自適應地進行權值系數的調整,比其他兩種算法通過繁瑣的迭代步驟逐漸優化的處理方式要快得多.可見,RBF集成方法可以滿足氣象預報中高時效性的要求,能在盡可能短的時間內提供準確性高的預報結果的效果.
通過動態選取訓練數據,構建適用于解決非線性映射問題的RBF神經網絡,集成多個單模式預報數據,從而實現多模式滾動集成預報.采用多種單模式數值預報數據作為網絡輸入層,網絡輸出為高級集成預報結果的方式構建了預報模型.由于RBF樣本的變動只涉及少量基函數的中心和寬度的調整,網絡權值調整的工作量較小,因此RBF神經網絡的訓練時間短.實驗表明,利用RBF神經網絡進行集成預報的結果誤差小于單模式預報,提高了預報精確度.
由于氣候變化是一個不穩定的動態變化過程,影響因素較多,例如訓練集數量、歷史數據的地域特點等.因此集成預報模型的建立也受到訓練集數量和數據質量等的影響,預報的穩定性和可靠性有待進一步研究,還需要大量數據應用的實踐檢驗.
[1] 周之栩. 短期溫度、降水的多模式集成預報[J]. 科技通報,2010,26(6):832–836.
[2] 燊吳先. 集成預報綜述及判別集成預報[J]. 廣西氣象,1993,14(4):5–7.
[3] 金龍,陳寧,林振山. 基于人工神經網絡的集成預報方法研究和比較[J]. 氣象學報,1999,57(2):198–207.
[4] 李倩,胡邦輝,王學忠,等. 基于BP人工神經網絡的區域溫度多模式集成預報試驗[J]. 干旱氣象,2011,29(2):232–250.
[5] 陳云浩,史培軍,李曉兵. 不同熱力背景對城市降雨(暴雨)的影響(Ⅲ):基于人工神經網絡的集成預報模型[J]. 自然災害學報,2001,10(3):26–31.
[6] 趙聲蓉. 多模式溫度集成預報[J]. 應用氣象學報,2006,17(1):52–58.
[7] 李學明,郭尚坤,王劍柯,等. 新的集成預報及其在短期氣候預測中的應用[J]. 重慶大學學報,2010,33(12):119–126.
[8] 胡潔. BP和RBF神經網絡短時交通流預測結果比較[J]. 長江大學學報:自然科學版,2007,4(3):74–76.
[9] 付世鳳,陳瑞志,王麗麗. BP網絡與RBFNN網絡比較研究[J]. 現代商貿工業,2010(16):312–313.
[10] 孫麗英,葛超,朱藝. RBF神經網絡在函數逼近領域內的研究[J]. 計算機與數字工程,2007,35(8):121–123.
[11] Vakil-Baghmisheh M T,Pavesic N. Training RBF networks with selective backpropagation[J]. Neurocomputing,2004,62(1/2/3/4):39–64.
[12] 邱林,胡慶和,馮麗云,等. 改進RBF 神經網絡在地下水動態預報中的應用[J]. 華北水利水電學院學報,2004,25(2):1–3,31.
[13] 許少華,何新貴. 徑向基過程神經元網絡及其應用研究[J]. 北京航空航天大學學報,2004,30(1):14–17.
[14] 郭鳳儀,郭長娜,王洋洋. 煤礦涌水量的灰色RBF神經網絡預測模型[J]. 計算機測量與控制,2012,20(2):300–302,310.
[15] 熊聰聰,王靜,宋鵬,等. 遺傳算法在多模式集成天氣預報中的應用[J]. 天津科技大學學報,2008,23(4):80–84.
[16] 熊聰聰,祎許淑,徐姝. 基于粒子群算法的天氣滾動預報集成技術[J]. 天津科技大學學報,2012,27(1):75–78.
責任編輯:常濤
RBF Neural Network for Weather Forecast Based on Multi-model Integration
XIONG Congcong1,PAN Xuan1,ZHAO Qi1,WU Zhenling2
(1. College of Computer Science and Information Engineering,Tianjin University of Science & Technology,Tianjin 300222,China;2. Tianjin Meteorological Institute,Tianjin 300074,China)
An integrated forecast model based on radial basis function(RBF)neural network was proposed for large complex multi-model numerical forecasting data. According to the characteristics of the numerical model forecast data of WRF model and RUC model used in Tianjin,numerical data of several models were chosen as the input of the RBF neural network,and the output is the integrated result. Experiments of temperature integration show that the RBF neural network integration method can reduce the error of the single model. The integrated result does good work in simulating real data. The method also has stability and effectiveness.
integrated forecast;multi-model;neural network;radial basis function
TP183;P456.1
A
1672-6510(2014)01-0075-04
10.13364/j.issn.1672-6510.2014.01.015
2013–04–22;
2013–10–31
中國氣象局氣象關鍵技術集成與應用項目(CAMGJ2012M04);天津市科技型中小企業技術創新資金項目(12ZXCXGX33500)
熊聰聰(1961—),女,四川瀘州人,教授,xiongcc@tust.edu.cn.