999精品在线视频,手机成人午夜在线视频,久久不卡国产精品无码,中日无码在线观看,成人av手机在线观看,日韩精品亚洲一区中文字幕,亚洲av无码人妻,四虎国产在线观看 ?

基于遺傳算法-支持向量機模型在熱帶氣旋強度預報中的應用

2011-12-23 08:45:12顧錦榮劉華強劉向陪呂慶平
海洋預報 2011年3期
關鍵詞:方法模型

顧錦榮,劉華強,劉向陪,呂慶平

(1.解放軍理工大學氣象學院,江蘇南京211101;2.94816部隊氣象中心,福建福州 350002)

基于遺傳算法-支持向量機模型在熱帶氣旋強度預報中的應用

顧錦榮1,2,劉華強1,劉向陪1,呂慶平1

(1.解放軍理工大學氣象學院,江蘇南京211101;2.94816部隊氣象中心,福建福州 350002)

利用遺傳算法對支持向量機(SVM)模型參數進行尋優,找到最優參數組合后代入SVM模型中,得到基于遺傳算法的支持向量機模型(GA-SVM),利用此模型對熱帶氣旋強度進行預報實驗。該模型對熱帶氣旋強度12 h、24 h和48 h的預報平均絕對誤差分別為3.01 m/s、4.46 m/s和6.57 m/s;比最小二乘回歸法的預報精度分別提高了12%、11%、14%。

支持向量機;遺傳算法;熱帶氣旋;強度預報

1 引言

當前熱帶氣旋(Tropical Cyclone,簡稱TC)強度的預報方法主要有動力方法、統計方法、動力與統計相結合的方法。動力方法主要基于數值預報,在此基礎上,結合預報員的主觀經驗來做出預報。傳統的統計方法,比如逐步回歸、最優子集回歸、卡爾曼濾波方法等,建立因子與對象之間關系的基礎是它們之間的顯著線性相關,而大氣環流變化中的復雜性和非線性,決定了預報因子與預報對象之間的非線性相關。因此傳統的方法在處理本質上具有非線性關系的問題時,往往難以達到期望的結果。

支持向量機(Support Vector Machine,簡稱SVM)是基于統計學習理論的VC維理論和結構風險最小化原則的新型學習機器[1-2]。國內外專家、學者己逐步將其應用于(超)文本分類、語音識別、生物序列分析和生物數據挖掘、手寫字符識別、人臉識別、指紋識別、遙感圖像分析等諸多方面。國內陳永義、馮漢中等[3-4]首先將該方法應用在氣象領域,取得了良好效果。作為一種新的機器學習方法,SVM還有很多待完善的地方,比如關于其懲罰系數C、核函數以及對應的參數選擇問題,這些在SVM理論上沒有完全解決,傳統的做法都是根據不同的實際問題進行參數試湊。參數試湊法效率低,對不同的實際問題沒有通用性、耗時長。

遺傳算法(Genetic Algorithm,簡稱GA)是模擬生物進化過程中的自然選擇和遺傳變異的一種全局優化算法,具有并行性和很強的搜索能力。本文用遺傳算法對SVM參數尋優,把建立的遺傳算法-支持向量機(GA-SVM)模型應用在TC強度的預測上,實現了SVM模型參數的自動選取,TC強度預測取得了較好的效果。

2 支持向量機和遺傳算法簡介

2.1 SVM回歸算法簡介

SVM方法是基于1909年Mercer核展開定理,通過非線性映射?,把樣本空間映射到一個高維乃至于無窮維的特征空間(Hilbert空間),使在特征空間中可以應用線性學習機的方法解決樣本空間中的高度非線性分類和回歸等問題[1-3]。

對于非線性問題,引入了非線性映射?,在特征空間中用φ(xi)代替樣本空間的xi,得特征空間中的最優線性回歸超平面的解析式:

由于內積實際上是一個Mercer核,將核函數K(x,y)=φ(x)·φ(y)代入上式消去非線性映射的顯式表達式,最后得到:

這就是在特征空間中所求得的基于核方法的非線性支持向量機回歸學習的最后表達式,也就是非線性支持向量學習機的最優回歸函數。雖然用到了特征空間及非線性映像,但實際計算中并不需要知道它們的顯式表達。只需要求出支持向量對應得系數α和b的值,通過核函數的計算,即可得到原來樣本空間中的非線性回歸函數。這樣就通過核函數和線性SVM回歸方法解決了非線性SVM回歸問題。

2.2 GA算法簡介

遺傳算法作為一種高度非線性映射、自適應和自組織功能的人工智能優化方法,它通過仿效生物遺傳和進化過程中選擇、交叉、變異機理,來完成對問題最優解的自適應搜索過程。遺傳算法首先將問題求解表示成基因型(如二進制編碼串),從而構成染色體群。根據適者生存的原則,從中選取適應環境的個體,淘汰較差的個體,并把保留下來的個體通過交叉、變異等遺傳算子產生新一代染色體種群。依據某種收斂條件,一代一代不斷進化,最后收斂到最適應環境個體上,求得問題最優解[5]。

3 資料和方法

3.1 資料來源

本文使用的TC資料取自中國氣象局上海臺風研究所編制出版的《熱帶氣旋年鑒》,主要包括TC的編號、各時刻(資料每6 h輸出一次)TC所在位置的經度、緯度、中心最大風速、中心氣壓、大風半徑以及TC的移動方向、移動速度等要素。以西北太平洋區域影響我國的熱帶氣旋為研究對象,個例的選取標準是1980—1999年間進入115°—140°E,15°—35°N之間的或在上述區域生成的熱帶氣旋,TC強度以近中心最大風速來表示。

3.2 氣候持續性因子的構造

氣候持續法[6]是目前在國內外日常的TC路徑及強度預報中較為常用的方法之一,它是從上世紀60年代末Hope和Neumann設計的HURRAN[7]基礎上發展起來的。氣候持續法的基本原理是根據TC本身前期位置狀態與后期位置狀態的關系,同時結合氣候變化的規律,采用回歸分析預報熱帶氣旋路徑或強度,而不僅僅是外推的問題。因此本文采用氣候持續法構造預報因子。具體構造如下[8]:

起報時刻TC中心最大風速V0,TC中心最大風速前6 h、12 h、18 h變化分別為VC6、VC12、VC18; 類 似 的 有 經 緯 度 因 子 E0、 EC6、 EC12、EC18、NC0、NC6、NC12、NC18(V表示風速,E表示經度,N表示緯度,C為變化量,下標表示前6×i(i=0,1,2,3)小時變化);另外,構造6 h和12 h加速率因子:

上式中下標表示前某個時刻的值。類似的還有TC中心緯度加速率因子,不再贅述。

鑒于氣候性規律,TC強度的變化在不同年的相同月份、季節有類似情況。因此,根據TC一年內發生的頻次規律,把全年分為21個時間段(1—4月為一時間段,5、6、11、12月每半月為一時間段,7、8、9、10月每旬為一時間段),計算每個時間段TC路徑、強度變化規律。具體做法如下:把研究區域(115°—125°E,20°—35°N范圍) 按2.5°×2.5°網格劃分,共劃分為24個網格,然后計算每個網格內不同時間段預報因子的歷史氣候變化平均值。由于TC樣本數在不同區域分布有差異,有的網格內樣本數甚至為0,因此做如下處理:若某時間段進入某網格的TC樣本數少于5個,采用滑動網格統計,按從東到西,由北向南的順序擴大網格范圍,直至進入網格的樣本數滿足要求。本文構造的氣候性因子為TC未來12 h、24 h、36 h和48 h中心最大風速、經緯度歷史氣候變化平均值:Vave、Eave、Nave(其中:V為中心最大風速、E為緯度,N為經度,下標ave表示平均氣候因子)。

根據上述方法,共設計出氣候持續性因子24個,表1列出了部分預報因子與TC強度的相關系數。建模時,利用因子與預報對象間相關系數大小作為挑選標準,挑選出相關系數高的部分因子作為SVM的輸入。

3.3 遺傳算法對支持向量機參數的優化選擇

基本的遺傳算法解決實際問題是從把對象編碼開始,通過某種編碼機制(如二進制碼、浮點碼等)把對象抽象為特定符號按一定順序排成的串。遺傳算法對一個個體(解)的好壞用適應度函數值來評價。適應度函數是遺傳算法進化過程的驅動力,也是進行自然選擇的唯一標準,它的設計結合求解問題本身的要求而定。使用選擇運算來實現對群體中的個體進行優勝劣汰操作:適應度高的個體被遺傳到下一代群體中的概率大,適應度低的個體,被遺傳到下一代群體中的概率小;交叉運算是遺傳算法區別于其他進化算法的重要特征,它在遺傳算法中起關鍵作用,是產生新個體的主要方法,它是指對兩個相互配對的染色體依據交叉概率按某種方式相互交換其部分基因,從而形成兩個新的個體;變異運算是產生新個體的輔助方法,它決定了遺傳算法的局部搜索能力,同時保持種群的多樣性,變異運算是指依據變異概率將個體編碼串中的某些基因值用其它基因值來替換,從而形成一個新的個體。交叉運算和變異運算的相互配合,共同完成對搜索空間的全局搜索和局部搜索。用遺傳算法對支持向量機進行參數優化,就是尋找最優的懲罰因子C和核函數參數的組合。主要的實現步驟如下:

表1 氣候持續性因子與不同預報時效TC強度相關系數

(2)構造適應度函數,這是遺傳算法與SVM的接口,通過判斷適應度函數的大小來決定是否終止參數尋優。如果適應度值滿足了要求,則代表SVM模型中訓練樣本的真實值與預測值之間的的誤差達到要求,此時程序結束,解碼并返回最優的C、g值。用得到的參數訓練SVM模型,并用測試樣本來檢驗;如果適應度值沒有滿足了要求,則轉到第(4)步。對于本文的實際問題,采用均方誤差作為適應度函數:

式中 yi為實際值, y'i為預測值,n為樣本個數。適應度值為訓練SVM模型時預測值與真實值的均方根誤差大小,誤差越小選擇進化的概率越大,即最終的結果為SVM模型訓練出的預測值最接近真實值時對應的SVM參數。

(3)對本文的實際問題,設定種群規模M=20;終止進化代數T=60;交叉概率Pc=0.85;變異概率Pm=0.001。遺傳算子中的選擇運算是根據每個個體的適應度大小來確定的,本文試驗中適應度值小的個體有大的概率被選擇到下一代。

圖1GA-SVM運算流程圖

(4)應用遺傳算子選擇、交叉、變異運算來產生下一代種群,然后轉到(2)來判斷適應度值大小。

整個流程如下圖所示:

4 TC強度預報實驗

4.1TC強度預測GA-SVM模型的建立與檢驗

選取1980—1999年共20年的TC資料,剔除沒有TC強度記錄的樣本,再根據預報對象的不同挑選生命史符合要求的TC個例,例如:預報對象為未來12 h TC強度,則該次TC生命史至少為36 h,這是因為要構造預報起始時刻的前18 h的預報因子加上預報對象未來12 h的時效。同理,預報對象為未來24 h TC強度,TC生命史至少為48 h;預報未來48 h TC強度,TC生命史至少為72 h。根據TC生命史和研究區域,選出預報對象為未來12 h、24 h、48 hTC強度的樣本數分別為5964個、5672個、4859個。

若所有樣本進入程序,計算量很大、機時較長,不利于試驗(樣本越多精度并不一定越高)。以預報對象為12 hTC強度為例,選取5964個樣本中的前1000個樣本作為訓練樣本,剩下的挑選連續的200個樣本作為獨立測試樣本;其他預報時效下樣本挑選做法類似。訓練前首先將數據歸一化到(0,1)之間,保正程序運行收斂加快。表2為尋出的最佳參數及對應的訓練樣本數據歸一化后的均方根誤差mse,需要說明的是,均方根誤差相同時對應的參數組合并不唯一,這里只列出其中一組。

表2 TC不同預報時效對應的SVM最佳參數及訓練時的均方根誤差

圖2 TC強度不同預報時效適應度收斂圖和測試樣本預測結果

4.2 GA-SVM方法與最小二乘回歸方法在TC強度預測上的比較

采用最小二乘回歸建立預測TC強度12 h、24 h、48 h預測模型,使用樣本方法與建立GA-SVM模型時類似,只是訓練樣本個數有所區別且事先不進行歸一化處理,測試樣本與GA-SVM模型使用的完全相同。建立預報方程:Y=α0+α1x1+α2x2+……+αnx8,其中,Y為預報值,x1、x2、……、x8為所選取的因子。經計算,TC強度12 h、24 h、48 h模型的回歸方程系數見表3:

從上述兩種方法建立的12 h、24 h和48 h TC強度預報模型的平均絕對差(見圖3)可以看出:GA-SVM方法較最小二乘回歸法有一定優勢,預報時效較短時不明顯,12 h和24 h的預報誤差分別減小了0.44 m/s和0.56 m/s,12 h的預報水平提高了12%,24 h預報水平提高了11%。隨著預報時效延長,預報效果有明顯提高,48 h的預報誤差減小了1.12 m/s,預報水平提高了14%。

5 小結與討論

(1)SVM方法使用了統計學習理論中的結構風險最小化原則,具有良好的泛化能力和抗過敏能力,在處理非線性特征的氣象問題中有明顯的優勢。利用SVM方法建立TC強度預測模型,是TC強度預測的一種新嘗試,與傳統的統計方法相比,解決非線性及高維模式識別問題能力更強;

表3 回歸方程系數表

圖3 兩種方法的預報平均絕對差對比

(2)SVM的參數選取對模型的建立至關重要,但SVM理論對參數如何選擇并未完全解決,這也是目前SVM理論研究的熱點之一。通過實際問題不斷試驗得來的SVM參數耗時量大,比如本文的C、g兩個參數,假如設范圍均為0—100,如果靠“試湊”,則要進行10000次。用遺傳算法對SVM參數進行尋優,不僅減少SVM模型建立的人為因素而且耗時大大減少;

(3)本文只考慮了氣候持續性因子,沒有考慮大氣環流因子,若考慮,還有提升預報精度的可能;另外還可擴大核函數的選擇范圍(文中只用了徑向基核函數),進行建模效果的比較。

[1]Vapnik V N.Statistical Learning Theory[M].New York:John Wiley&Sons,Inc,1998:375-570.

[2]Vapnik V N.The Nature Of Statistical Learning Theory[M].New York:Springer Verlag,2000:123-266.

[3]陳永義,俞小鼎,高學浩等.處理非線性分類和回歸問題的一種新方法(I)—支持向量機方法簡介[J].應用氣象學報,2004,15(3):345-353.

[4]馮漢中,陳永義.處理非線性分類和回歸問題的一種新方法(II)—支持向量機方法在天氣預報中的應用[J].應用氣象學報,2004,15(3):355-365.

[5]雷英杰,張善文,李續武,等.MATLAB遺傳算法工具箱及應用[M].西安電子科技大學出版社,2004.

[6]Sim D.Aberson and Charles R.Sampson,On the Predictability of Tropical Cyslone Tracks in the Northwest Pacific Basin[J],Monthly Weather Review,2003,131(7):1491-1497.

[7]Charles J,Neumann and wind John R.Hope,Performance analysis of the HURRAN tropical cyclone system[J],Mon.Wea.Rev.,1972,100(4):244-255.

[8]呂慶平,羅堅,朱坤等.基于SVM的氣候持續法在熱帶氣旋路徑預報中的應用試驗[J].海洋預報,2009,26(1):76-83.

[9]姚才,金龍,黃明策等.遺傳算法與神經網絡相結合的熱帶氣旋強度預報方法試驗[J].海洋學報,2007,29(4):11-18.

Application of GeneticAlgorithm-Support Vector Machine model in tropical cyclone intensity forecast

GU Jinrong1,2,LIU Huaqiang1,LIU Xiangpei1,LV Qingping1
(1.Institute of Meteorology,PLA Univ.of Sci.&Tech.,Nanjing 211101,China;2.Meteorology Center,No.94816 Unit of PLA,Fuzhou 350002,China)

Abstract:The parameters for SVM model were pretreated through genetic algorithm to get the optimum parameter values,and these parameter values were used in the SVM model.Genetic algorithm-support vector machine(GA-SVM)model was obtained,which was used to make Tropical Cyclone intensity forecasting.The Mean Absolute Difference of 12 h、24 h、48 h forecasting model is 3.01 m/s、4.46 m/s、6.57 m/s.The results show the superiority of the GA-SVM compare with least square regression method(LS).For example,its forecasting level of 12 hour and 24 hours has improved 12%and 11%than LS,but the number of 48 hour has became 14%.

Support Vector Machine(SVM);GeneticAlgorithm(GA);tropical cyclone; intensity forecast

P457

A

1003-0239(2011)03-0008-07

2010-06-10

顧錦榮(1983-),男,碩士,主要從事熱帶氣旋預測研究。E-mail:comeon_123@163.com

猜你喜歡
方法模型
一半模型
重要模型『一線三等角』
重尾非線性自回歸模型自加權M-估計的漸近分布
學習方法
3D打印中的模型分割與打包
用對方法才能瘦
Coco薇(2016年2期)2016-03-22 02:42:52
FLUKA幾何模型到CAD幾何模型轉換方法初步研究
四大方法 教你不再“坐以待病”!
Coco薇(2015年1期)2015-08-13 02:47:34
賺錢方法
捕魚
主站蜘蛛池模板: 美女裸体18禁网站| 亚洲日韩精品欧美中文字幕 | 国产精品毛片在线直播完整版| 亚洲一欧洲中文字幕在线| 欧美视频在线播放观看免费福利资源| 五月天福利视频| 一级黄色网站在线免费看| 精品人妻无码中字系列| A级全黄试看30分钟小视频| 国产美女一级毛片| 国产精品视频久| 最新国产午夜精品视频成人| 亚洲一道AV无码午夜福利| 午夜老司机永久免费看片| 无码久看视频| 国产剧情国内精品原创| 特级aaaaaaaaa毛片免费视频| 亚洲人成在线免费观看| av一区二区三区高清久久| 亚洲视频二| 国产aaaaa一级毛片| 波多野结衣视频一区二区 | 国产男女免费视频| 婷婷综合在线观看丁香| 激情無極限的亚洲一区免费| 欧洲在线免费视频| 亚洲床戏一区| 久久综合色天堂av| 97视频免费在线观看| 毛片大全免费观看| 福利视频99| 精品一区二区三区无码视频无码| 99久久国产自偷自偷免费一区| 欧美翘臀一区二区三区| 波多野结衣在线se| 一级全免费视频播放| 国产一区二区在线视频观看| 亚洲欧美综合另类图片小说区| 国产精品嫩草影院av| 久久无码高潮喷水| 青青草原国产| 国产乱人免费视频| 亚洲日韩精品综合在线一区二区| 久综合日韩| 无码免费的亚洲视频| 2021国产乱人伦在线播放 | 精品91自产拍在线| 一区二区在线视频免费观看| 久久这里只有精品66| 色AV色 综合网站| 亚洲制服丝袜第一页| 欧美激情视频一区二区三区免费| 亚洲精品卡2卡3卡4卡5卡区| 亚洲精品桃花岛av在线| 精品国产电影久久九九| 欧美综合区自拍亚洲综合天堂| 日韩欧美色综合| 免费福利视频网站| 亚洲妓女综合网995久久| 欧美国产精品拍自| 中文字幕欧美日韩| 亚洲无线观看| 中国国产高清免费AV片| 99久久婷婷国产综合精| 亚洲欧美另类日本| 综合人妻久久一区二区精品 | 国产精品污视频| 欧美黄网在线| 亚洲日本www| 日韩一级二级三级| 成人国产免费| 婷婷开心中文字幕| 国产最爽的乱婬视频国语对白| 老司机久久精品视频| 日韩精品久久无码中文字幕色欲| 九色视频线上播放| 国产精欧美一区二区三区| 精品剧情v国产在线观看| 欧美精品啪啪| 五月天综合婷婷| 国产成人a毛片在线| 无码中文字幕乱码免费2|