符洪恩 高藝桔 馮瑩瑩 黃婕茵 劉祖發



摘要: 為了準確評估暴雨事件對人類社會帶來的影響,需充分考慮暴雨序列的不確定性特征。運用云模型對城市暴雨災害進行危險性評估能夠很好地解決暴雨災害評估中的不確定性問題。選取深圳市4種暴雨致災因子歷史序列(2002~2012年)作為評價指標,運用組合賦權法計算各因子權重,通過云模型算法得到歷史危險性評估結果。使用基于遺傳算法參數優化的支持向量回歸機模型(GA-SVR)預測2013~2016年各致災因子值,并結合云模型(GA-SVR-C)預估預測年份的危險性等級,并與SVR(支持向量回歸機模型)及BP人工神經網絡的預測結果進行對比分析。結果表明:GA-SVR-C模型在評價因子的預測精度上整體要優于其他兩個模型,得到的危險性評估結果與實際結果基本一致,很好地反映了城市暴雨災害的風險水平。
關 鍵 詞: 暴雨洪澇災害; 危險性分析; 云模型; 支持向量機; 遺傳算法
中圖法分類號: ?P333
文獻標志碼: ?A
DOI: 10.16232/j.cnki.1001-4179.2021.08.003
0 引 言
近年來,隨著中國城市化進程不斷加快,以暴雨為典型的極端降雨事件在中國各大城市頻繁發生[1-2],對社會經濟造成了巨大的損失。國內學者對城市暴雨災害事件風險評估做了大量的研究,如張玉華等[3]提出了一種以模糊數學為理論依托的模糊綜合指標評價體系,能夠科學地對風險因素的模糊性進行量化分析;彭健等[4]基于體積淹沒算法,利用CLUE-S等空間模型來模擬不同土地利用以及不同致災因子危險性情境下茅洲河流域的洪澇風險程度。但是這些傳統的暴雨災害評估方法沒有全面考慮暴雨這一自然災害事件的不確定性屬性,往往只是從確定性或者模糊性、隨機性等單一不確定性角度去解決問題,無法較好地對含有多種不確定性的復合系統進行評估。
云模型(Cloud Model,C)算法耦合了概率統計和模糊理論,綜合考慮了隨機性和模糊性,是實現定量數值與定性概念不確定性轉化的有效工具[5]。在暴雨災害評估方面,云模型能夠很好地處理在降水測量過程中出現的系統誤差以及人為誤差等隨機性成分,且在災害等級劃分時可充分考慮災害風險程度界定中亦此亦彼的模糊性。近年部分學者將云模型理論用在了水文氣象災害評估領域,如金菊良等[6]借助云模型對自然序列不確定屬性的優良展現能力,分析了安徽省干旱時空分布均勻性及穩定性特征;萬昔超[7]、石曉靜[8]等均利用云模型算法確定研究區域的洪澇災害風險等級,并使用ArcGIS風險分析功能分析區域風險等級分布以及變化情況;王賀等[9-10]選取了若干影響雨洪災害的指標,并使用云模型構建了城市極端降雨災害風險評價模型,在此基礎上使用云推理算法提出了洪災動態預警模型,研究成果能夠為防洪排澇規劃提供有效參考和依據。
在2004年,馮漢中等[11]首次用支持向量機(Support Vector Machine,SVM)解決氣象問題,此后,大量學者陸續將SVM引入降水預報的研究中[12]。支持向量回歸機(Support Vector Regression,SVR)是SVM用以處理回歸預測問題的拓展模型。為了解決極端降水預測這一隨機性較強的問題,學者們提出了粒子群、遺傳算法(Genetic Algorithm,GA)、模擬退火等智能算法對SVM的參數進行優化選取。GA算法因具有強大的并行運算能力和尋找全局最優值的搜索能力[13],從而能有效提升SVM的泛化能力和預測精度。唐娟[14]、王尋[15]等在極端降水預測研究中采用了遺傳優化算法對支持向量機的參數進行擇優,均取得了良好的預測結果。但目前較少有研究將云模型算法與基于遺傳算法的支持向量回歸機(GA-SVR)模型結合應用于洪澇災害風險評估領域。
致災危險性是風險評估最基本和重要的環節,構建云模型作為暴雨洪澇危險性評估工具,有著適應性強、不受地域限制等優點,具有普遍的參考價值。結合對極端降水有良好預測能力的GA-SVR模型和云模型構建風險預估模型(GA-SVR-C)用以預測深圳市暴雨災害危險性未來走勢,在保證精度良好的前提下,能夠為城市防洪方案的制定、防洪工程的建設提供參考依據。本文首先根據各評價因子歷史數據構建云模型,從而對歷史暴雨洪澇災害危險性進行等級評估;其次,構建GA-SVR預測模型對各個評價因子進行預測;最后,將每個因子的預測值帶入構建好的云模型中即構建GA-SVR-C模型來評估未來暴雨災害危險性等級。
1 基本原理和方法
1.1 云模型
1.1.1 云模型原理
云模型是自然語言值表征的某個定性概念C與其定量數值之間的不確定性轉換模型,也是云的具體實現方法。設U是一個數值論域,C是U上的定性概念,若任意x∈U為對應于概念C的一次隨機實現,且均存在一個具有穩定傾向的隨機數μ(x)∈[0,1]作為x對C的確定度,則稱x在論域U中的分布為云模型,簡稱為云[16]。每個x與其確定度構成的二維數值稱作一個云滴。
云模型中包含3個參數:期望Ex、熵En、超熵He,如圖1所示。這3個參數也稱作云的數字特征,其能夠整體上反映出概念C的定量特性。期望值Ex是最能代表定性概念的數據點,是論域的中心值;熵En是定性概念模糊性和隨機性的度量,En越大,云滴的取值范圍越大,離散程度越大,反之則越小;超熵He是熵的熵,表征熵的不確定性程度,在云圖中是云厚度的反映。
1.1.2 云數字特征的計算方法
設第i(i=1,2,…,n)個評價因子對應第j(j=1,2,…,m)個評語的上下限值為Lijmax和Lijmin,則云模型3個數字特征值計算公式[17]可表示為
Exij=(Lijmax+Lijmin)/2Enij=(Lijmax-Lijmin)/6Heij=k×Enij?? (1)
本文假定En與相應的He存在線性關系,取k=0.1來控制云層的厚度。
1.1.3 云發生器
產生云滴并實現概念C的云分布是通過云發生器(Cloud Generator,CG)來實現的,云發生器是一種產生云的一系列算法。其中正向云發生器和逆向云發生器是云模型最基本的算法,計算方法可見文獻[18]。
在云模型中,還可以根據不同的目的和已知的條件運用不同的云發生器。設有論域U,C為U對應的概念,若給出U中的特定數值x,將其代入云發生器計算得到該數值對于C的確定度,則稱該云發生器為x條件云發生器(見圖2)。
x條件云發生器詳細算法:① 根據已知的云參數En、He生成En′=NORM(En,He);② 根據得到的En′并輸入Ex與特定值x計算出μ=e-(x-Ex)2/2En′2。
1.1.4 云模型搭建方法
本文以4種致災因子數據集作為評價因子集,將評價因子集依照數據大小劃分若干區間,設定“安全”至“高危險”危險性等級作為評語集以表征這些區間所對應的風險狀態并給出評語。圖3展示了云模型的評估流程。
1.2 支持向量回歸機
Vapnik等[19]根據統計學理論提出了支持向量機(Support Vector Machine,SVM)模型,該模型遵循結構風險最小化的原則,在控制訓練誤差和模型結構復雜度之間做出了權衡,使得真實風險達到最小,確保模型訓練誤差較小的同時提升了其泛化推廣能力。
SVM模型最初用來解決模式識別[20]、分類問題等,其能夠將復雜的高維尋優問題轉化為二次規劃求解問題,理論上可以得到全局最優解,而且對處理小樣本、非線性、高維度等問題也有很好的效果[21-22]。隨著ε不敏感損失函數的引入,SVM經過拓展產生了SVR模型可用來解決回歸問題,詳細算法可見文獻[23]。
1.3 遺傳算法對支持向量回歸機的優化
SVR的預測性能會受到懲罰因子C、RBF核參數g以及不敏感損失函數ε這3個參數取值大小的
影響,為了能夠搜索得到這3個參數的最佳組合從而提升SVR的回歸精度以及泛化能力,本文選取了遺傳算法[24]作為SVR參數的優化算法。遺傳算法基于自然選擇和遺傳學原理,是一種模擬生物適者生存優勝劣汰進化演變規律的智能優化算法。該算法能夠快速地找到全局最優解,降低基于經驗選擇的不確定性[25],提高模型的預測精度。利用GA算法對SVR參數尋優的具體步驟如下[26]:
(1) 設定C,g以及ε參數的實際可能取值范圍。
(2) 將這些SVR參數進行二進制編碼,并隨機產生初始種群。
(3) 選定適應度函數來評估個體的適應度大小,本文選取的適應度函數為均方誤差。
(4) 采用輪盤賭法使得適應度較大的個體可以較大概率作為父代進行復制繁衍。
(5) 以一定概率對種群進行交叉、變異操作,產生下一代種群。
(6) 重復以上步驟直到種群滿足給定的優化準則,這里選取最大進化代數作為優化準則,若滿足則輸出最佳的SVR參數組合。
2 歷史暴雨洪澇災害危險性等級評估
本文所用數據為國家氣象中心提供的深圳市1960~2016年57 a間的降雨數據。將該降雨數據集通過整理計算得到暴雨洪澇評價因子數值論域:年降雨量U1、年暴雨日數U2、平均暴雨量U3和最大日降雨量U4。本文將災害危險性等級分為1~5級,V=(V1,V2,V3,V4,V5):安全、趨于安全、趨于危險、危險、高危險。Ui(i=1,2,3,4) 中的各要素值在V中每一危險性等級下的確定度都可以用一朵云來表示。本章將2002~2012年的Ui(i=1,2,3,4)值作為云模型的輸入數據,用以評估這些年份的危險性等級。
2.1 評估等級限值的確立
采用經典水文頻率曲線法來計算評估等級的上下限值。選取水文頻率通用函數P-Ⅲ型分布函數作為理論頻率函數[27],選定與各序列經驗點數據擬合效果最好的理論頻率曲線作為適用曲線,根據設計頻率查詢對應要素限值。參考文獻[28]中的水災害等級設計頻率,表1給出了指定設計頻率下的評價因子各等級限值。
2.2 云數字特征值的計算
通過上文了解到,可以用云定量刻畫各個評價指標對于不同危險性等級的定性概念,而確定云參數是實現云的首要步驟,根據公式(1)求得云參數的結果如表2所列。
2.3 單因子云隸屬度的計算
將2002~2012年的4種致災因子數據代入x條件云發生器中分別計算各個等級下的確定度1 000次,取期望值作為最終隸屬度,得到歷史單因子危險性隸屬度矩陣 F ij(i=1,2,…,55;j=1,2,3,4)。表3展示了2012年暴雨洪澇單因子隸屬度等級分布。
2.4 確定評價指標的權重
為了確保權重對評估結果的影響最小,本研究結合層次分析法與熵權法即主客觀組合賦權的方式來確定權重。計算公式[29]為
wi= di×ei ?4 i=1 (di×ei) ,i=1,2,3,4 (2)
式中: D , E , W 分別為層次分析法、熵權法以及組合賦權法的權重矩陣。
根據式(2)計算得到的最終權重為
W =(0.072 7,0.240 4,0.124 1,0.562 7)T (3)
通過式(4)將單因子隸屬度矩陣 F 與權重矩陣 W 進行模糊變換得到綜合隸屬度矩陣 A 。利用矩陣 A 得到歷史暴雨洪澇災害危險性隸屬度分布如圖4所示。
A = F × W? (4)
2.5 歷史暴雨洪澇災害危險性評估結果分析
從圖4中可見:整體上這11 a中隸屬度較大的災害危險性等級基本位于1~3級,多數年份隸屬于4~5級的確定度較低。2011年的“安全”等級以及2003年的“趨于安全”等級隸屬度屬于中高水平(0.5~1.0),除此之外其他年份各危險等級的確定度為較低水平(<0.5)。
根據最大隸屬度原則,從每一年份的各危險性等級隸屬度中選擇最大隸屬度所對應的等級作為最終的危險性評估等級,深圳市歷史暴雨洪澇災害危險性等級評估結果如圖5所示。
2002~2012年間,暴雨洪澇災害危險性等級為“趨于安全”的年份最多,共有5 a,其次是處于“安全”等級的年份,共有3 a。危險性等級較高的年份均集中在2005~2009年間,其中2005年以及2009年屬于“趨于危險”等級,而2008年的危險
性等級高達第4級“危險”等級,在評估年份中危險性最高。這11 a的危險性評估結果與《深圳市水利志》以及深圳市水務局網站的歷年暴雨洪澇災情
統計信息情況基本符合,等級確定較為合理。如《深圳市水利志》等資料記載:2008年“6·13”特大暴雨事件降雨強度超50 a一遇,深圳多處內澇嚴重,但水庫、堤防防洪成效顯著,無險情,也沒有產生群死群傷等重大損失,所以危險性形勢比較符合該年份第4級“危險”等級。
3 GA-SVR-C模型結果分析
將深圳市1960~2016這57 a的年降雨量U1、年暴雨日數U2、平均暴雨量U3、最大日降雨量U4序列分別構建GA-SVR模型,取前53 a數據作為模型訓練樣本,后4 a數據用以驗證模型預測效果。
3.1 評價因子預測結果分析
為了能夠更加客觀地分析GA-SVR對暴雨洪澇致災因子序列值預報的準確性,根據同樣的輸入樣本構建無參數優化算法的SVR模型以及BP人工神經網絡(BP-network)模型來進行對比驗證,各模型對評價因子預測結果如圖6所示,模型預測效果采用平均相對誤差來衡量,結果如表4所列。
采用灰色關聯度分析方法[30]來比對模型的預測結果與原始值的關聯性大小,計算得到GA-SVR、SVR、BP-network模型評價因子的預測結果與原序列值的平均關聯度為0.685 4,0.635 9,0.577 0,可知GA-SVR的預測序列與原序列的幾何形狀相似程度最高,整體態勢最接近,表明 GA-SVR對于暴雨序列這種復雜的問題仍然具有較強的學習能力以及良好的泛化能力。
從表4中可以看出:3個模型的平均相對誤差都控制在30%以內,其中GA-SVR以及SVR模型的預測誤差均控制在20%以內,而BP-network模型對年降雨量以及年暴雨日數的預測誤差均大于20%,相較于BP-network,SVR模型體現出了其處理小樣本以及非線性等問題的優勢。GA-SVR每個評價因子的平均相對誤差均比其他兩個模型對應誤差低,可見經過參數優選的GA-SVR模型的預測性能相較于未經過參數優選的SVR模型有一定的提升。
3.2 危險性等級預測結果分析
將各模型評價因子預測結果代入云模型評估系統中得到預測年份的危險性等級如表5所列。從表中觀察到2013,2015,2016年暴雨洪澇危險性等級較低,且3個模型對于這些年份的預估等級基本符合深圳市出現暴雨洪澇風險程度較低的真實情況。在2014年深圳市經歷了多場大暴雨,造成大面積的交通受阻以及出現多達200個內澇點,暴雨洪澇災害的危險程度較高,支持向量回歸機-云模型(SVR-C)以及BP人工神經網絡-云模型(BP-network-C)對于該年份的危險性等級預測結果均為“趨于安全”,這顯然不符合實際深圳市的受災情況,而GA-SVR-C的預測結果與原始結果一致,均為“危險”等級,充分反映了該年份災害風險的真實水平,證明了該模型對于暴雨洪澇災害危險性等級預測是精確可靠的。
4 結 語
在深圳市暴雨洪澇災害危險性評估中,本文使用云模型作為歷史災害的評估方法。云模型充分考慮了暴雨這一自然要素序列分布的隨機性以及區間歸屬的模糊性,將暴雨災害危險性這一定性概念與定量數值進行不確定性轉換,得到的評估結果更加客觀合理。為了能夠預測未來災害的危險性走勢,還提出了GA-SVR-C預測模型,實例證明該模型能夠充分學習暴雨致災因子歷史序列并從復雜的非線性問題中挖掘出較多的預測信息,得到的預測效果優于SVR以及BP人工神經網絡模型且與真實情況基本一致,是十分有效可行的危險性預測工具。
云模型中描繪定性概念的3個參數值的計算目前沒有完整的理論依據,往往依靠經驗公式進行確定,難以論證其反映定性概念的程度。如何在保證預測精度良好的情況下將GA-SVR-C模型更簡便地應用在評估結構復雜、評價因子繁多的評估工作中還需要進一步探究。
參考文獻:
[1] ?翁莉,馬林,徐雙鳳.城市暴雨災害風險評估及防御對策研究:以江蘇省南京市為例[J].災害學,2015,30(1):130-134.
[2] 孔鋒.透視變化環境下的中國城市暴雨內澇災害:形勢、原因與政策建議[J].水利水電技術,2019,50(10):42-52.
[3] 張玉華,蔡甜.城市暴雨內澇災害風險模糊綜合評價體系構建研究[J].水利規劃與設計,2019(11):103-107.
[4] 彭建,魏海,武文歡,等.基于土地利用變化情景的城市暴雨洪澇災害風險評估:以深圳市茅洲河流域為例[J].生態學報,2018,38(11):3741-3755.
[5] 蔣嶸,李德毅,陳暉.基于云模型的時間序列預測[J].解放軍理工大學學報(自然科學版),2000(5):13-18.
[6] 金菊良,李輝,李靖,等.基于云模型的安徽省干旱時空分布特征分析[J].水電能源科學,2017,35(4):1-5.
[7] 萬昔超,殷偉量,孫鵬,等.基于云模型的暴雨洪澇災害風險分區評價[J].自然災害學報,2017,26(4):77-83.
[8] 石曉靜,查小春,劉嘉慧,等.基于云模型的漢江上游安康市洪水災害風險評價[J].水利水電科技進展,2017,37(3):29-34.
[9] 王賀,劉高峰,王慧敏.基于云模型的城市極端雨洪災害風險評價[J].水利經濟,2014,32(2):15-18.
[10] ?王賀,劉高峰,王慧敏.基于云模型的城市極端雨洪災害預警研究[J].水利經濟,2014,32(4):59-62.
[11] 馮漢中,陳永義.處理非線性分類和回歸問題的一種新方法(Ⅱ):支持向量機方法在天氣預報中的應用[J].應用氣象學報,2004(3):355-365.
[12] 羅芳瓊.支持向量機在降水預報中的應用綜述[J].廣西科技師范學院學報,2017,32(2):113-116.
[13] ROUSHANGAR K,KOOSHEH A.Evaluation of GA-SVR method for modeling bed load transport in gravel-bed rivers[J].Journal of Hydrology,2015,527:1142-1152.
[14] 唐娟,萬定生,程習鋒.一種極端降水預測方法研究[J].信息技術,2014(4):19-23.
[15] 王尋,萬定生,唐娟.基于組合模型的極端降水預測方法[J].計算機仿真,2015,32(12):354-359.
[16] 劉常昱,李德毅,潘莉莉.基于云模型的不確定性知識表示[J].計算機工程與應用,2004,40(2):32-35.
[17] 徐征捷,張友鵬,蘇宏升.基于云模型的模糊綜合評判法在風險評估中的應用[J].安全與環境學報,2014,14(2):69-72.
[18] 呂輝軍,王曄,李德毅,等.逆向云在定性評價中的應用[J].計算機學報,2003(8):1009-1014.
[19] VAPNIK V.The nature of statistical learning theory[J].Machine Learning,2005,20(1):273-297.
[20] 謝昊伶,彭國華,郭滿才,等.基于改進的SVR模型在年降水量預測中的應用[J].數學的實踐與認識,2017,47(18):154-161.
[21] 杜樹新,吳鐵軍.用于回歸估計的支持向量機方法[J].系統仿真學報,2003,15(11):1580-1585,1633.
[22] 祁亨年.支持向量機及其應用研究綜述[J].計算機工程,2004,30(10):6-9.
[23] 栗然,李廣敏.基于支持向量機回歸的光伏發電出力預測[J].中國電力,2008,41(2):74-78.
[24] HOLLAND J.Adaptation in natural and artificial systems[M].Ann Arbor:The University of Michigan Press,1975.
[25] ZHU X,MA S,XU Q,et al.A WD-GA-LSSVM model for rainfall-triggered landslide displacement prediction[J].Journal of Mountain Science,2018,15(1):156-166.
[26] 吳景龍,楊淑霞,劉承水.基于遺傳算法優化參數的支持向量機短期負荷預測方法[J].中南大學學報(自然科學版),2009,40(1):180-184.
[27] 宋松柏.水文頻率計算研究面臨的挑戰與建議[J].水利與建筑工程學報,2019,17(2):12-18.
[28] 劉登峰,王棟,丁昊,等.城市水災害風險等級的RBF-C評估方法[J].人民黃河,2014,36(1):8-10.
[29] ZHANG S,XIANG M,XU Z,et al.Evaluation of water cycle health status based on a cloud model[J].Journal of Cleaner Production,2019,245(12):118850.
[30] 孫芳芳.淺議灰色關聯度分析方法及其應用[J].科技信息,2010,2(17):780-782.
(編輯:謝玲嫻)
引用本文:
符洪恩,高藝桔,馮瑩瑩,等.
基于GA-SVR-C的城市暴雨洪澇災害危險性預測:以深圳市為例
[J].人民長江,2021,52(8):16-21.
Hazard prediction of urban rainstorm and flood disasters based on
GA-SVR-C model:case study of Shenzhen City
FU Hongen1,GAO Yijie1,FENG Yingying2,HUANG Jieyin2,LIU Zufa1,2
( 1.School of Civil Engineering,Sun Yat-sen University,Zhuhai 519082,China; 2.Department of Resources and the Urban Planning,Sun Yat-sen University,Guangzhou 510520,China )
Abstract:
To accurately assess the impact of rainstorm events on human society,it is significant to consider the uncertainties of the rainstorm sequence.The assessment on urban rainstorm hazards by cloud model can better qualify the uncertainty and is regarded as a more effective assessment tool.The historical series of four kinds of disaster-inducing factors of rainstorm (2002~2012) of Shenzhen City were selected as the evaluation index,and the weight of each factor was calculated by using the combined weighting method,then the assessment results on historical rainstorm hazard were obtained through the cloud model.Support vector regression model based on genetic algorithm parameter optimization (GA-SVR) was used to predict the values of four disaster-inducing factors from 2013 to 2016.The GA-SVR combined with the cloud model (GA-SVR-C) was used to predict the hazard levels in the predicted year.Meanwhile,the prediction results from the SVR and BP-network model were used for comparative analysis.It was proved that the GA-SVR-C model performed better than the other two models in terms of the prediction accuracy.The hazard assessment results of GA-SVR-C model are basically consistent with the real facts,which can reflect the hazard levels of urban rainstorm disaster well.
Key words:
rainstorm and flood disaster;hazard analysis;cloud model;support vector machine;genetic algorithm