王平+黃河+吳瑋
摘要:洪澇農業災情預測在災害管理和應急救災等領域都具有非常重要的研究價值,以支持向量機(SVM)模型為基礎,以1998~2006年湖北省洪澇災情數據為樣本,構建了基于SVM的洪澇農作物損失預測模型。結果表明,基于徑向核函數的SVM模型適合湖北地區洪澇農業損失的預測。
關鍵詞:農作物;洪澇;預測;支持向量機
中圖分類號:X43 文獻標識碼:A 文章編號:0439-8114(2014)18-4437-04
隨著全球環境變化,極端氣候事件不斷發生,自然災害損失明顯上升,對人類生產、安全和發展帶來前所未有的挑戰[1]。我國國土遼闊,自然地理條件復雜,降水在時空分布上十分不均勻,洪澇災害的發生十分頻繁。洪澇災害是我國各種自然災害中發生頻率高、造成經濟損失嚴重的一種自然災害。根據水利部公布的數據,1990年洪澇災害造成的直接經濟損失為239.0億元,1995年增加到1 653.3億元,1999年高達2 550.9億元。進入21世紀后,洪澇災害所造成的直接經濟損失年均超過1 200億元。隨著社會發展的進步,洪澇災害已成為威脅國民經濟持續發展和制約國家可持續發展的主要因素之一。為了便于災情分析及防災減災救災工作,對洪澇災害損失進行預測的研究顯得尤為重要,本研究從我國自然災害風險管理的需求出發,構建了基于支持向量機(Support vector machine, SVM)的洪澇災害農業損失預測模型,為我國洪澇災害風險管理提供參考,研究結果對自然災害管理工作具有重要的指導意義[2]。
1 洪澇災害損失評估預測模型
洪澇災害(包括洪災和澇災)是由于降雨、融雪、冰凌、風暴潮、潰堤等引起洪流和積水而造成的自然災害。我國歷朝歷代對重大災害事件的記載為研究歷史災害留下了寶貴的文獻資料。目前民政部和水利部等部委都開展了洪澇災害造成的損失風險進行評估,其中民政部的《自然災害情況統計制度》主要從受災人口、農作物受災面積、農作物成災面積、倒塌房屋、直接經濟損失等方面統計了包括洪澇在內的自然災害損失信息,而水利部也從農作物受災面積、農作物成災面積、倒塌房屋和直接經濟損失等方面統計洪澇災害損失數據(表1)。
洪澇災害的致災因子、孕災環境和承災體共同組成了洪澇災害復雜系統,而洪澇災情是該復雜系統各組成部分相互作用的結果[3]。洪澇災害災情評估是通過所建立的模型,對因洪澇災害造成的破壞程度進行評價。從廣義上講,洪澇災害損失評估包括孕災環境穩定性分析、致災因子危險性分析、承災體易損性評價和災情損失評估[4];從狹義上講,洪澇災害損失評估是研究在一定時間段內,洪澇災害對可能發生區域帶來的各種損失。目前,對洪澇災害損失評估進行研究,評估方法主要有:遙感和GIS方法[5,6]、抽樣統計方法[7]、基于承災體易損性的評估方法[8,9]和基于歷史災情數據的評估模型[10,11]。基于歷史災情數據的分析方法是依據歷史災情數據,其本身就是洪澇與承災體相互作用的結果,這種“從災害研究災害”的方法避免了從洪澇研究災害的迂回[12]。
2 基于SVM的洪澇農作物災情預測模型
SVM模型是繼人工神經網絡之后新一代的學習算法,是一種先進的非線性統計分析模型。目前,SVM模型逐步被應用到臺風、地震和滑坡等自然災害的災情預測上,并取得了很好的研究成果[13-15]。
2.1 支持向量機模型
SVM是由Vapnik[16]提出的一種非常有發展前景的分類和回歸預測技術,可以替代多層感知器、RBF神經網絡等算法。SVM主要利用核函數將線性不可分的數據轉換為高維空間的線性可分數據。
一般的SVM被設計用于解決分類問題,假設訓練樣本xi(i=1,2,…,n)由兩類構成,即yi=±1。SVM的目標是在n維空間上尋找一個超平面,以最大間距區分訓練樣本中的兩類,同時使分開兩類數據點距離分類面最遠,這里的超平面既可以是平面也可以是曲面。
對于一般線性可分情況[13],超平面通過以下公式獲得:
2.2 基于SVM的洪澇農作物災情預測模型
2.2.1 選擇洪澇災害案例數據作為訓練數據 根據民政部自然災害災情統計報表,選擇了受災人口(a1)、緊急轉移安置人口(a2)、農作物絕收面積(a3)、倒塌房屋間數(a4)、損壞房屋間數(a5)、直接經濟損失(a6)和農作物受災面積(a7)等為洪澇農作物災情案例屬性。選擇1998~2006年湖北省的20個洪澇案例數據(u1~u20)作為訓練樣本[17],具體情況如表2。
2.2.2 構建基于SVM的洪澇農作物災情預測模型 基于SVM的洪澇災害農作物災情預測模型主要包括:①由于洪澇災情數據屬于線性不可分情況,選用公式(2)作為預測的模型基礎;②基于表2中的洪澇災情數據,分別利用線性核函數、多項式核函數、徑向核函數和S形核函數作為核函數,通過對洪澇災情樣本數據訓練,分別得到基于SVM的洪澇農作物災情的預測模型;③通過參數尋優,優化訓練結果,這樣可以得到較好的預測模型,使預測的精度得到進一步改善,提高預測模型的精度,重點主要包括優化SVM中的懲罰參數和核函數參數等。
3 結果與分析
在Matlab平臺上,利用洪澇災害災情農作物預測訓練數據,通過綜合比較分析4種核函數模型,發現基于徑向核函數的SVM預測模型能較好地預測農作物災情,并獲得湖北地區洪澇農作物災情預測模型為:
3.1 洪澇農作物災情預測結果
利用公式(7)對1998~2006年湖北省的農作物絕收面積進行預測。結果表明,農作物絕收面積的整體預測精度為85.67%,整體預測誤差為26.46%,具體的農作物絕收面積預測誤差如圖1所示。
由圖1可知,利用基于徑向核函數的SVM預測模型能有效地預測湖北地區的洪澇農作物絕收面積,預測曲線與樣本曲線變化趨勢基本一致。但預測結果也表明,也存在預測值明顯大于真實值,如樣本2、樣本10、樣本11、樣本16、樣本18和樣本19;也存在預測值明顯小于真實值,如樣本14。整體來說,樣本9至樣本10,預測結果與真實數據基本吻合。本研究所建立的SVM預測模型能預測湖北地區洪澇農作物絕收面積,但對小面積的農作物絕收面積預測效果較差。endprint
同樣利用公式(7)對1998~2006年湖北省的農作物受災面積進行預測。交叉驗證結果表明,農作物受災面積整體預測精度為87.22%,整體預測誤差為23.33%。從整體上來看,洪澇農作物成災面積的預測精度比農作物絕收面積更準確。具體的農作物絕收面積預測誤差如圖2所示。
由圖2可知,本研究所構建模型對農作物受災面積預測曲線與樣本曲線變化趨勢一致。但預測結果也表明,存在預測值明顯大于真實值,如樣本16;存在預測值明顯小于真實值,如樣本1。整體來說,在9至11這個階段本文預測值基本吻合歷史數據,預測的準確度較高。在5至8,12至20這二個階段預測值誤差相對較大,尤其是11至20歷史階段模型所預測的值高于樣本數據。綜上所述,所建立的SVM預測模型能有效預測湖北地區洪澇災害的農作物絕收面積,但對小面積的農作物受災面積預測效果較差。
3.2 預測結果分析
洪澇農作物受災面積比成災面積預測精度高可能的原因主要為:①本研究只是從洪澇損失災情中選擇了7類屬性進行分析,其中受災人口、緊急轉移安置人口和直接經濟損失等屬性與農作物受災面積相關性更強;②本研究選擇的7類屬性在洪澇災害系統之間的相關關系非常復雜。當樣本數據值較小時,本研究所構建的SVM模型對農作物受災面積和絕收面積的預測較差的原因主要包括:①樣本數據自身質量問題,本研究選擇的湖北省洪澇災情數據是針對一次災害過程中不同受災區域的災情匯總數據,在匯總過程中會存在一定的“臟”數據;②洪澇災情在時空上具有非均勻性,如樣本u19中農作物絕收和成災面積分別為18、18 900 hm2,而u14中2個屬性分別為45 200、85 800 hm2,使洪澇災情數據在多維空間上分布呈現不規律的狀態。
綜上所述,提出的基于徑向核函數的SVM模型能對洪澇農作物災情進行有效預測,當受災和絕收面積比較大時預測準確度很高,但對于相對較小的受災面積與絕收面積的樣本預測有一定的偏差,預測值比原始數據要偏大一些。
4 結論
本研究以支持向量機(SVM)模型為基礎,以1998~2006年湖北地區洪澇災情數據為樣本,構建了基于SVM的洪澇農作物損失預測模型。研究結果表明,基于徑向核函數的SVM模型適合湖北地區洪澇農業損失的預測,對農作物受災面積的預測精度高于農作物絕收面積;而且當樣本數據中的農作物災情數據較小時,預測值會高于真實值。在構建SVM農作物災情預測模型時綜合考慮更多的洪澇災情屬性,特別是降雨量、受災時間、災害持續時間和受災區域等信息。
參考文獻:
[1] 袁 藝.自然災害災情評估研究與實踐進展[J].地球科學進展, 2010,25(1):22-32.
[2] 張 弛,宋緒美,李 偉.可變模糊評價法在洪澇災情評價中的應用[J].自然災害學報,2008,17(5):34-39.
[3] 史培軍.四論災害的理論與實踐[J].自然災害學報,2002,11(3):1-9.
[4] 鄒 銘,范一大,楊思全,等.自然災害風險管理與預警體系[M]. 北京:科學出版社,2005.
[5] 高霞霞,蘇 偉,謝伯承,等.基于GIS的湖南洪澇災害農業風險評估[J].安徽農業科學,2011,39(2):1122-1123,1147.
[6] 聶 娟,范一大,鄧 磊,等.山洪災害雷達遙感災情評估技術研究與應用[J].自然災害學報,2010,19(3):105-110.
[7] 胡俊鋒,范春波,楊月巧.基于抽樣統計方法的洪澇災害損失評估[J].自然災害學報,2010,19(6):27-30.
[8] 梁留科.農業災情與抗災能力的定量指標探討[J].災害學,1992,7(1):7-11.
[9] 蒲 淳.關于我國糧食生產的易損性評價[J].自然災害學報,1998,7(4):30-34.
[10] 葉正偉.自然災害對農業經濟影響的態勢分析及對策研究——以蘇浙皖旱澇災害為例[J].安徽農業科學,2006,34(4):772-774,803.
[11] 李柏年.洪澇災害評價的威布爾模型[J].自然災害學報,2005, 14(6):32-36.
[12] 黃大鵬,劉 闖,彭順風.洪災風險評價與區劃研究進展[J].地理科學進展,2007,26(4):11-22.
[13] 許 沖,徐錫偉.基于不同核函數的2010年玉樹地震滑坡空間預測模型研究[J].地球物理學報,2012,55(9):2994-3005.
[14] 張新廠,婁偉平.基于主成分支持向量機的臺風災害房屋倒塌間數評估[J].安徽農業科學,2010(12):6339-6341.
[15] 牛瑞卿,彭 令,葉潤青,等.基于粗糙集的支持向量機滑坡易發性評價[J].吉林大學學報(地球科學版),2012,42(2):430-439.
[16] VAPNIK V. The Nature of Statistical Learning Theory[M]. Germany:Springer-Verlag,2000.
[17] 吳雪蓮,孫丙宇,李文波,等.基于粗糙集和CBR的救災口糧需求預測[J].計算機工程,2012,38(9):158-161.endprint
同樣利用公式(7)對1998~2006年湖北省的農作物受災面積進行預測。交叉驗證結果表明,農作物受災面積整體預測精度為87.22%,整體預測誤差為23.33%。從整體上來看,洪澇農作物成災面積的預測精度比農作物絕收面積更準確。具體的農作物絕收面積預測誤差如圖2所示。
由圖2可知,本研究所構建模型對農作物受災面積預測曲線與樣本曲線變化趨勢一致。但預測結果也表明,存在預測值明顯大于真實值,如樣本16;存在預測值明顯小于真實值,如樣本1。整體來說,在9至11這個階段本文預測值基本吻合歷史數據,預測的準確度較高。在5至8,12至20這二個階段預測值誤差相對較大,尤其是11至20歷史階段模型所預測的值高于樣本數據。綜上所述,所建立的SVM預測模型能有效預測湖北地區洪澇災害的農作物絕收面積,但對小面積的農作物受災面積預測效果較差。
3.2 預測結果分析
洪澇農作物受災面積比成災面積預測精度高可能的原因主要為:①本研究只是從洪澇損失災情中選擇了7類屬性進行分析,其中受災人口、緊急轉移安置人口和直接經濟損失等屬性與農作物受災面積相關性更強;②本研究選擇的7類屬性在洪澇災害系統之間的相關關系非常復雜。當樣本數據值較小時,本研究所構建的SVM模型對農作物受災面積和絕收面積的預測較差的原因主要包括:①樣本數據自身質量問題,本研究選擇的湖北省洪澇災情數據是針對一次災害過程中不同受災區域的災情匯總數據,在匯總過程中會存在一定的“臟”數據;②洪澇災情在時空上具有非均勻性,如樣本u19中農作物絕收和成災面積分別為18、18 900 hm2,而u14中2個屬性分別為45 200、85 800 hm2,使洪澇災情數據在多維空間上分布呈現不規律的狀態。
綜上所述,提出的基于徑向核函數的SVM模型能對洪澇農作物災情進行有效預測,當受災和絕收面積比較大時預測準確度很高,但對于相對較小的受災面積與絕收面積的樣本預測有一定的偏差,預測值比原始數據要偏大一些。
4 結論
本研究以支持向量機(SVM)模型為基礎,以1998~2006年湖北地區洪澇災情數據為樣本,構建了基于SVM的洪澇農作物損失預測模型。研究結果表明,基于徑向核函數的SVM模型適合湖北地區洪澇農業損失的預測,對農作物受災面積的預測精度高于農作物絕收面積;而且當樣本數據中的農作物災情數據較小時,預測值會高于真實值。在構建SVM農作物災情預測模型時綜合考慮更多的洪澇災情屬性,特別是降雨量、受災時間、災害持續時間和受災區域等信息。
參考文獻:
[1] 袁 藝.自然災害災情評估研究與實踐進展[J].地球科學進展, 2010,25(1):22-32.
[2] 張 弛,宋緒美,李 偉.可變模糊評價法在洪澇災情評價中的應用[J].自然災害學報,2008,17(5):34-39.
[3] 史培軍.四論災害的理論與實踐[J].自然災害學報,2002,11(3):1-9.
[4] 鄒 銘,范一大,楊思全,等.自然災害風險管理與預警體系[M]. 北京:科學出版社,2005.
[5] 高霞霞,蘇 偉,謝伯承,等.基于GIS的湖南洪澇災害農業風險評估[J].安徽農業科學,2011,39(2):1122-1123,1147.
[6] 聶 娟,范一大,鄧 磊,等.山洪災害雷達遙感災情評估技術研究與應用[J].自然災害學報,2010,19(3):105-110.
[7] 胡俊鋒,范春波,楊月巧.基于抽樣統計方法的洪澇災害損失評估[J].自然災害學報,2010,19(6):27-30.
[8] 梁留科.農業災情與抗災能力的定量指標探討[J].災害學,1992,7(1):7-11.
[9] 蒲 淳.關于我國糧食生產的易損性評價[J].自然災害學報,1998,7(4):30-34.
[10] 葉正偉.自然災害對農業經濟影響的態勢分析及對策研究——以蘇浙皖旱澇災害為例[J].安徽農業科學,2006,34(4):772-774,803.
[11] 李柏年.洪澇災害評價的威布爾模型[J].自然災害學報,2005, 14(6):32-36.
[12] 黃大鵬,劉 闖,彭順風.洪災風險評價與區劃研究進展[J].地理科學進展,2007,26(4):11-22.
[13] 許 沖,徐錫偉.基于不同核函數的2010年玉樹地震滑坡空間預測模型研究[J].地球物理學報,2012,55(9):2994-3005.
[14] 張新廠,婁偉平.基于主成分支持向量機的臺風災害房屋倒塌間數評估[J].安徽農業科學,2010(12):6339-6341.
[15] 牛瑞卿,彭 令,葉潤青,等.基于粗糙集的支持向量機滑坡易發性評價[J].吉林大學學報(地球科學版),2012,42(2):430-439.
[16] VAPNIK V. The Nature of Statistical Learning Theory[M]. Germany:Springer-Verlag,2000.
[17] 吳雪蓮,孫丙宇,李文波,等.基于粗糙集和CBR的救災口糧需求預測[J].計算機工程,2012,38(9):158-161.endprint
同樣利用公式(7)對1998~2006年湖北省的農作物受災面積進行預測。交叉驗證結果表明,農作物受災面積整體預測精度為87.22%,整體預測誤差為23.33%。從整體上來看,洪澇農作物成災面積的預測精度比農作物絕收面積更準確。具體的農作物絕收面積預測誤差如圖2所示。
由圖2可知,本研究所構建模型對農作物受災面積預測曲線與樣本曲線變化趨勢一致。但預測結果也表明,存在預測值明顯大于真實值,如樣本16;存在預測值明顯小于真實值,如樣本1。整體來說,在9至11這個階段本文預測值基本吻合歷史數據,預測的準確度較高。在5至8,12至20這二個階段預測值誤差相對較大,尤其是11至20歷史階段模型所預測的值高于樣本數據。綜上所述,所建立的SVM預測模型能有效預測湖北地區洪澇災害的農作物絕收面積,但對小面積的農作物受災面積預測效果較差。
3.2 預測結果分析
洪澇農作物受災面積比成災面積預測精度高可能的原因主要為:①本研究只是從洪澇損失災情中選擇了7類屬性進行分析,其中受災人口、緊急轉移安置人口和直接經濟損失等屬性與農作物受災面積相關性更強;②本研究選擇的7類屬性在洪澇災害系統之間的相關關系非常復雜。當樣本數據值較小時,本研究所構建的SVM模型對農作物受災面積和絕收面積的預測較差的原因主要包括:①樣本數據自身質量問題,本研究選擇的湖北省洪澇災情數據是針對一次災害過程中不同受災區域的災情匯總數據,在匯總過程中會存在一定的“臟”數據;②洪澇災情在時空上具有非均勻性,如樣本u19中農作物絕收和成災面積分別為18、18 900 hm2,而u14中2個屬性分別為45 200、85 800 hm2,使洪澇災情數據在多維空間上分布呈現不規律的狀態。
綜上所述,提出的基于徑向核函數的SVM模型能對洪澇農作物災情進行有效預測,當受災和絕收面積比較大時預測準確度很高,但對于相對較小的受災面積與絕收面積的樣本預測有一定的偏差,預測值比原始數據要偏大一些。
4 結論
本研究以支持向量機(SVM)模型為基礎,以1998~2006年湖北地區洪澇災情數據為樣本,構建了基于SVM的洪澇農作物損失預測模型。研究結果表明,基于徑向核函數的SVM模型適合湖北地區洪澇農業損失的預測,對農作物受災面積的預測精度高于農作物絕收面積;而且當樣本數據中的農作物災情數據較小時,預測值會高于真實值。在構建SVM農作物災情預測模型時綜合考慮更多的洪澇災情屬性,特別是降雨量、受災時間、災害持續時間和受災區域等信息。
參考文獻:
[1] 袁 藝.自然災害災情評估研究與實踐進展[J].地球科學進展, 2010,25(1):22-32.
[2] 張 弛,宋緒美,李 偉.可變模糊評價法在洪澇災情評價中的應用[J].自然災害學報,2008,17(5):34-39.
[3] 史培軍.四論災害的理論與實踐[J].自然災害學報,2002,11(3):1-9.
[4] 鄒 銘,范一大,楊思全,等.自然災害風險管理與預警體系[M]. 北京:科學出版社,2005.
[5] 高霞霞,蘇 偉,謝伯承,等.基于GIS的湖南洪澇災害農業風險評估[J].安徽農業科學,2011,39(2):1122-1123,1147.
[6] 聶 娟,范一大,鄧 磊,等.山洪災害雷達遙感災情評估技術研究與應用[J].自然災害學報,2010,19(3):105-110.
[7] 胡俊鋒,范春波,楊月巧.基于抽樣統計方法的洪澇災害損失評估[J].自然災害學報,2010,19(6):27-30.
[8] 梁留科.農業災情與抗災能力的定量指標探討[J].災害學,1992,7(1):7-11.
[9] 蒲 淳.關于我國糧食生產的易損性評價[J].自然災害學報,1998,7(4):30-34.
[10] 葉正偉.自然災害對農業經濟影響的態勢分析及對策研究——以蘇浙皖旱澇災害為例[J].安徽農業科學,2006,34(4):772-774,803.
[11] 李柏年.洪澇災害評價的威布爾模型[J].自然災害學報,2005, 14(6):32-36.
[12] 黃大鵬,劉 闖,彭順風.洪災風險評價與區劃研究進展[J].地理科學進展,2007,26(4):11-22.
[13] 許 沖,徐錫偉.基于不同核函數的2010年玉樹地震滑坡空間預測模型研究[J].地球物理學報,2012,55(9):2994-3005.
[14] 張新廠,婁偉平.基于主成分支持向量機的臺風災害房屋倒塌間數評估[J].安徽農業科學,2010(12):6339-6341.
[15] 牛瑞卿,彭 令,葉潤青,等.基于粗糙集的支持向量機滑坡易發性評價[J].吉林大學學報(地球科學版),2012,42(2):430-439.
[16] VAPNIK V. The Nature of Statistical Learning Theory[M]. Germany:Springer-Verlag,2000.
[17] 吳雪蓮,孫丙宇,李文波,等.基于粗糙集和CBR的救災口糧需求預測[J].計算機工程,2012,38(9):158-161.endprint