












摘要:為探究不同評價單元對區域滑坡易發性評估的影響,基于網格單元與斜坡單元對三峽庫區典型縣域重慶市云陽縣開展了滑坡易發性研究。首先選取高程、坡度、曲率等22個評價因子,根據研究區988個歷史滑坡數據,通過30 m×30 m的柵格數據提取斜坡單元,并基于網格單元及斜坡單元分別建立22個滑坡影響因子地理空間數據庫;然后利用隨機森林與貝葉斯優化算法來構建滑坡易發性模型,對研究區滑坡進行易發性評估;最后結合ROC (受試者工作特征)曲線與混淆矩陣結果檢驗評價單元的易發性模型預測精度。結果表明:易發性評估的結果可劃分為低、較低、中、較高、高5個等級;基于網格單元的滑坡易發性模型中,高程、與道路距離、坡度這3個因子對滑坡發生的貢獻率大,基于斜坡單元的模型中,INDV(歸一化植被指數)、剖面曲率、平面曲率這3個因子對滑坡發生的貢獻率大,并且2個模型的滑坡密度均隨著滑坡易發性等級的升高而變大;與網格單元相比,斜坡單元能更好地解釋地形間的聯系,以斜坡單元(AUC=0.744)為最小評價單元的滑坡易發性模型比網格單元(AUC=0.714)精度更高。
關鍵詞:滑坡;滑坡評價單元;斜坡單元;網格單元;滑坡易發性;隨機森林;三峽庫區;重慶市云陽縣
doi:10.13278/j.cnki.jjuese.20230071
中圖分類號:X43
文獻標志碼:A
安雪蓮,密長林,孫德亮,等.基于不同評價單元的三峽庫區滑坡易發性對比:以重慶市云陽縣為例.吉林大學學報(地球科學版),2024,54(5):16291644. doi:10.13278/j.cnki.jjuese.20230071.
An Xuelian,Mi Changlin,Sun Deliang,et al. Comparison of" Landslide Susceptibility in" Three Gorges Reservoir Area Based on Different Evaluation Units:Take Yunyang County in Chongqing as an Example. Journal of Jilin University (Earth Science Edition),2024,54(5): 16291644. doi:10.13278/j.cnki.jjuese.20230071.
收稿日期:20230318
作者簡介:安雪蓮(1999-),女,碩士研究生,主要從事機器學習、大數據與地災易發性建模及評估方面的研究,E-mail:419496030@qq.com
通信作者:孫德亮(1976-),男,副教授,主要從事機器學習、大數據與地災易發性建模及評估方面的研究, E-mail:sundeliang2002@aliyun.com
基金項目:重慶市自然科學基金項目(CSTB2023NSCQMSX0618);教育部人文社會科學規劃項目(20XJAZH002)
Supported by the Natural Science Foundation of Chongqing (CSTB2023NSCQMSX0618) and the Humanities and Social Science Planning Fund of Ministry of Education (20XJAZH002)
Comparison of" Landslide Susceptibility in Three Gorges Reservoir Area Based on Different Evaluation Units
——Take Yunyang County in Chongqing as an Example
An Xuelian1,Mi Changlin2,Sun Deliang1,Wen Haijia3,Li Xiaoqin2,Gu Qingyu1,Ding Yuekai1
1. Chongqing Key Laboratory of GIS Application" (Chongqing Normal University), Chongqing 401331, China
2." Linyi Natural Resources Development Service Center of" Shandong, Linyi 276000, Shandong," China
3. Key Laboratory of New Technology for Construction of Cities in Mountain Area (Chongqing University), Ministry of Education, ""Chongqing 400045,China
Abstract:
In order to explore the influence of different evaluation units on the assessment of regional landslide susceptibility, the landslide susceptibility of Yunyang County in Chongqing, a typical county in the Three Gorges reservoir area, was studied based on grid units and slope units. Twenty-two evaluation factors such as elevation, slope and curvature were selected. Combined with 988 historical landslide data in the study area, slope units were extracted from 30 m×30 m raster data, and geospatial databases of landslide impact factors were established based on slope units and grid units. The landslide susceptibility model was constructed by random forest and Bayesian optimization algorithm to evaluate the landslide susceptibility in the study area. The results indicate that the susceptibility assessment can be divided into five levels: low, moderately low, medium, moderately high, and high. In the landslide susceptibility model based on the grid units, the three factors of elevation, distance from the road and slope contribute greatly to the landslide occurrence. In the model based on slope units, the three factors of INDV (normalized difference vegetation index ), profile curvature and plane curvature contribute greatly to the landslide occurrence. The landslide density of both models increases with the increase of susceptibility level. Compared with grid units, slope units can better explain the relationship between terrain, and the landslide susceptibility model with slope units (AUC=0.744) as the minimum evaluation unit is more accurate than grid units (AUC=0.714).
Key words:
landslide; landslide evaluation units; slope units; grid units; landslide susceptibility; random forest; Three Gorges reservoir area;Yunyang County in Chongqing
0" 引言
滑坡是常見的地質災害之一,頻繁發生且分布廣,破壞力強[1]。中國是世界上滑坡災害最為嚴重的國家之一[2],根據自然資源部發布的數據,2021年我國共發生地質災害4 772起,造成80人死亡、11人失蹤,導致了32億元的直接經濟損失,其中滑坡2 335起,占地質災害總數的48.93%。滑坡易發性區劃是根據研究區的地形地貌等特征來預測滑坡發生概率的空間分布,對滑坡災害預防以及城市規劃選址有重要意義[3]。
早期對滑坡易發性的研究有定性和定量的方法。定性方法有層次分析法[45]、專家打分法[6]等,但這類方法主觀性較強,對數據缺乏定量的分析;而傳統的定量模型如信息量模型[7]、頻率比模型[8]等則需要大量數據作為支撐,評價精度也不理想。隨著人工智能技術和GIS(地理信息系統)的不斷發展,研究者開始采用機器學習算法進行滑坡易發性的研究。如:閆舉生等[9]采用ANN(人工神經網絡)模型和LR模型(邏輯回歸模型)對遠安縣進行滑坡易發性評價,結果表明ANN模型在該研究區的預測能力更好;劉睿等[10]選取了高程、起伏度、坡度等22個因子作為滑坡易發性的影響因子,利用巫山縣歷史滑坡數據和隨機森林構建滑坡易發性模型進行滑坡易發性評價研究,結果表明隨機森林模型有良好的預測功能,且有較高的穩定性和準確性;Merghadi等[11]以北非米拉盆地為研究區,
對比分析了
5種不同的滑坡易發性模型(邏輯回歸、梯度提升機、隨機森林、神經網絡和支持向量機)的預測能力,結果表明隨機森林模型
的預測能力最好;崔陽陽[12]結合經典的機器學習模型
(樸素貝葉斯分類器、支持向量機、k 近鄰算法分類器、線性判別分析)和集成學習模型(隨機森林、Bagging、Adaptive Boosting),選取了17個滑坡影響因子,利用斜坡單元和30、60 m柵格單元進行滑坡易發性對比研究,結果表明,滑坡評價單元與機器學習算法的最優組合是30 m柵格單元和隨機森林模型的組合。通過以上學者的研究發現,隨機森林模型有較高水平的預測能力,與其他模型相比更適用于進行滑坡易發性的區劃研究。
滑坡評價單元的選取是進行滑坡易發性研究的基礎,目前網格單元和斜坡單元應用較多。例如:王銳[13]基于6種不同大小的網格單元開展滑坡易發性評估,以分析不同大小的網格單元對評估結果的影響,結果表明隨著網格的增大,評估結果的精度基本呈現出先增后減的趨勢;王家柱等[14]基于斜坡單元,對康定市采用證據權模型進行滑坡易發性評估,模型精度達77.8%,較好地反映了康定市滑坡易發性分布情況。然而,大部分學者都是以單一評價單元進行滑坡易發性研究,很少有學者基于不同評價單元利用隨機森林算法構建模型來進行滑坡易發性區劃研究。
三峽庫區地形地貌復雜,地質結構特殊,同時人類工程活動十分頻繁,滑坡等地質災害發育也十分廣泛[1516]。重慶市云陽縣位于三峽庫區腹心,地形起伏較大,受長江蓄水的影響,云陽縣滑坡發生頻繁[17]。本文以云陽縣為研究對象,選取22個滑坡影響因子,利用隨機森林算法,對網格單元和斜坡單元得到的滑坡易發性評估結果進行對比研究,獲取評價單元及隨機森林的最佳組合算法,以期對滑坡災害的預防以及城市的規劃選址提供科學參考。
1" 研究區概況與數據源
1.1" 研究區概況
云陽縣位于重慶市的東北部(圖1),四周分別與奉節縣、萬州區、開縣、巫溪縣和湖北省的利川市相鄰。云陽縣的地理坐標為108°24′32″E—109°14′51″E,30°35′06″N— 31°26′30″N 。地形近似為菱形,地勢南、北高,中部低,海拔高低相差1 670 m。云陽縣位于亞熱帶季風濕潤氣候區,夏冬季節較長,春秋季節短,月平均溫度為7 ℃(1月)~28 ℃(8月和9月)。長江河道從境內穿過,河流水系發育,年降雨量大,但季節分布不均,降水主要集中在5—9月。
云陽縣地處丘陵向山地的過渡地帶,地貌受華鎣山—方斗山弧形褶皺體系和大巴山斷褶帶控制,主要為單斜低山和背斜梳狀低山。云陽縣為喀斯特地貌,除溶蝕作用外,水蝕、雨蝕、風蝕等機械侵蝕作用也加劇了該地區的水土流失。云陽縣內地層主要包括第四系(Q)、侏羅系(J)、三疊系(T)、志留系(S)和奧陶系(O)等,區內地質構造多為褶皺,斷裂規模很小。褶皺形態為向斜背斜相間排列,形成隔檔式構造。由
于云陽縣的地質環境比較脆弱,并且近年來云陽縣的人類工程活動越來越強烈,導致云陽縣內地質災害發育頻繁。根據資料[18]
顯示,云陽縣內共有1 363處地質災害點,其中包括1 312處滑坡(包括不穩定斜坡)災害點、40處崩塌(包括危巖體)災害點和11處泥石流災害點。滑坡災害在云陽縣頻發,其中比較嚴重的有舊縣坪滑坡、西城滑坡和雞扒子滑坡等。
底圖來源于重慶標準地圖服務網,審圖號渝S(2019)055號,下同。
1.2" 數據來源
本研究的數據詳情如表1所示。其中:歷史滑坡數據,共988個,來自于2001—2016年的重慶市地質監測站,包括滑坡名稱、滑坡發生的地理坐標、滑坡發生時間等;DEM(digital elevation model)數據,來自于ASTER(advanced spaceborne thermal emission and reflection radiometer)衛星,空間分辨率為30 m,用于計算坡度、坡向、坡位、微地貌、剖面曲率、地形濕度指數等;地質資料數據,來自國家地質資料數據中心;行政區劃、土地利用、多年平均降雨量數據,來自地理國情監測云平臺;河網和道路數據,由中國科學院資源環境科學數據中心提供,精度為1∶20萬;INDV (歸一化植被指數)數據,利用ENVI 軟件計算Landsat 8下載的衛星影像獲得;POI (point of interest)數據,來自百度地圖服務,通過網絡爬蟲技術從地圖上抓取。
1.3" 評價單元劃分
在滑坡評價研究中,滑坡評價單元的劃分要盡量保證滑坡評價單元內部的均一性和滑坡評價單元之間的差異性[19]。目前,常見的研究區滑坡單元格劃分方法有正方形網格法、地域單元法、子流域單元法和斜坡單元法[20]。本研究采用了網格單元和斜坡單元作為滑坡易發性評價的基本單元。其中:網格單元作為滑坡地質災害的評價單元,具有劃分方便、數據處理速度快等優勢[21],其劃分的本質是將研究區劃分為若干個大小相同的規則網格單元。本研究是通過ArcGIS軟件的面轉柵格工具實現的,共劃分了4 043 641個網格單元。斜坡單元已廣泛應用在滑坡易發性研究中,本文斜坡單元的劃分通過
Alvoli等[2224]提出的
r.slopeunits方法實現,用r.slopeunits方法劃分能夠得到坡向均一性的斜坡單元。具體的劃分流程如圖2所示。
HB. half basin,半流域;HBchild. HB小區域。m和a分別設定為最大和最小面積閾值;c為斜坡單元的圓方差。
進行r.slopeunits劃分時,首先利用GrassGIS中的r.watershed水文模塊對匯流累積量進行分析,將DEM柵格數據劃分為子流域。然后不斷減小匯流累積量設定的閾值,這樣每個子流域會被劃分為左右兩個部分,以此來提取半流域(HB),HB如果存在平地,則去除平地區域。最后在不斷減少設定閾值的過程中,將HB進一步細分為許多小區域(HBchild),分水線或匯水線就在小區域的邊界上。若某個HBchild面積≤a,這個小區域就被作為斜坡單元;若HBchild面積gt;a
就繼續劃分,直到
HBchild面積lt;m,或者
圓方差lt;c時,
則
HBchild作為斜坡單元
。
參考文獻[22],對a和c進行不同的調試,選取不同參數a(50 000、250 000、500 000、750 000、1 000 000 m2)和c(0.1、0.2、0.3、0.4、0.5、0.6)運行r.slopeunits軟件進行斜坡劃分。
通過r.slopeunits方法將研究區劃分為9 640個斜坡單元,結果如圖3所示。
2" 地理空間數據庫
2.1" 影響因子
影響因子與滑坡易發性評價結果的準確性密不可分[8]。滑坡的影響因子眾多,本文在綜合參考了相關文獻和各影響因素[2530]條件下,結合云陽縣自身地理條件,最終選取了地形地貌、地質條件、環境條件、人類活動及降雨等5個方面的22個影響因子,構建滑坡易發性評價指標體系。
2.1.1地形地貌
與地形地貌有關的影響因子包括高程、地形起伏度、坡度、坡向、坡位、曲率、平面曲率、剖面曲率、微地貌、地形濕度指數、地形粗糙度指數、輸沙指數和水流動力指數。
高程是與滑坡發生相關的常見影響因子,人類的工程活動和植被覆蓋程度都和高程密不可分[31]。一般情況下,高程較低的地方,工程活動更多,人類對地表的改造更多,對生態破壞也更多;高程還會影響植被的生長,不同高程地區植被的生長情況和類型也不同,雨水沖刷后,不同高程地區的地表水土流失情況也有所不同。
地形起伏度對滑坡的發生有很大影響[32]。地形起伏度是在一定范圍的區域內,區域最高點與區域最低點之間的高程之差。通過地形起伏度可以看到局部區域的地表切割程度。
坡度是水平面和斜坡之間的夾角,它是影響滑坡發生的重要影響因子[33]。坡度會影響邊坡的入滲過程和應力場的分布,這與滑坡的發生密切相關[34]。坡度大小對邊坡穩定性有一定的影響。
坡向與降水和太陽輻射密切相關。坡向不同,斜坡的溫度和濕度也會存在差異,其會影響植被、土壤條件、土地利用和土壤飽和度等因素,而這些因素與滑坡的形成至關重要[35]。
坡位是指邊坡所處的地貌位置。它主要由3個方面決定,分別是侵蝕地貌的斜坡組合、土地利用和地貌起源的侵蝕特征[36]。在不同的地貌位置上,滑坡發生的概率是不同的。
曲率、平面曲率和剖面曲率是反映邊坡幾何特征的地形因子,主要通過影響地表侵蝕過程和地表徑流來影響滑坡的發生[37]。平面曲率和剖面曲率是地形凹凸程度的體現,其中,平面曲率表示曲面在水平方向上的彎曲程度,剖面曲率表示曲面在垂直方向上的彎曲程度。
微地貌通常由一些風化碎屑物質在重力、水流、風力等作用下被風化、搬運、沉積后形成[38],規模相對較小。
地形濕度指數(ITW)是一個復合地形指數[39],可用來評價土壤水分的空間分布情況,并且可用來描述地形對土壤水分飽和程度的影響。ITW比較高的地方,巖土的含水率較大,孔隙水的壓力也較大。目前,ITW被廣泛應用于水文、土壤和地貌等研究領域中。
地形粗糙度指數(ITR)是描述地表形態的宏觀因子,它表現地表的凹凸情況,通過計算地球表面積與特定區域投影面積的比值得到[40]。ITR較高的地方地表巖石抗風化能力較強,不易發生風化作用,但是地表水流流速變化較大,流水侵蝕作用較強。
輸沙指數(IST)和水流動力指數(ISP)可以定量描述地表水的輸沙能力和侵蝕能力[4142]。這兩個值越大,水流的輸沙
能力和侵蝕能力越強,越容易使鄰近河流的邊坡失去穩定性。
ITW、ITR、IST和ISP的計算公式如下:
ITW=lnAstan β;
ITR=1cos(βπ/180);
IST=As22.130.6sin β0.08961.3;
ISP=Astan β。
式中:As為單位面積的匯流累積量(m2);β為局地坡度(°)。
2.1.2" 地質條件
與地質條件有關的影響因子有巖性、與斷層距離和傾坡類型。
巖性是影響滑坡發生的重要因子,特別是在山區[43]。巖土體是坡體的組成因素,巖性不同意味著巖石的物理化學性質有很大的不同。一般來說,低滲透巖體的地區更容易發生滑坡[42],云陽縣巖性主要包括中侏羅統和上侏羅統的砂巖、頁巖、泥巖等多種類型的沉積巖。
與斷層距離也是評價滑坡易感性的常用地質因子。斷層是指在地應力作用下,地殼巖層發生脆性破裂并且伴隨著明顯位移的地質構造。在一定范圍內,離斷層越近,巖石越不連續,土體越疏松,發生滑坡的概率越高[44]。
傾坡類型是指巖層傾向與斜坡坡向的關系[3]。平疊坡、順向坡和逆向坡是常見的傾坡類型,其中:
平疊坡
穩定性較好;順向坡分為兩種情況,傾角小于坡角的順向坡容易發生順層滑坡,傾角大于坡角的順向坡,則穩定性較好;逆向坡的穩定性一般較好,但如果巖層比較薄,則容易發生彎折。
2.1.3" 環境條件
與環境條件相關的影響因子包括歸一化植被指數、與河流距離和土地利用類型。
歸一化植被指數(INDV)是影響滑坡發生的重要因子,它能反映植被覆蓋情況和生長狀態,INDV對邊坡的滲流、徑流和風化有重要影響[45]。INDV越高的區域,植被覆蓋程度就越高,水土保持情況越好,因此雨水對區域地表的沖刷作就越弱,滑坡發生的概率也就越低。因此,在滑坡易發性區劃研究中,INDV一直被視為代表植被特征的因子,并廣泛應用于以往的研究中[46]。其表達式為
INDV=(RIN-R)/(RIN+R)。
式中:RIN為近紅外波段的反射值;R為紅外波段的反射值。
與河流的距離也是滑坡易發性評估中常用的一個因素[4748]。河流兩岸是滑坡集中發育的場所。河流對河岸具有侵蝕作用,分別是向下和向側方。當斜坡的坡腳被掏空時,會形成臨空面,導致斜坡有向下滑動的趨勢;而且河流還會影響地下水的埋藏深度。長江沿岸滑坡發育廣泛,且支流附近水系發育,受各類水流的長期侵蝕和沖刷,斜坡整體穩定性低[49]。消落帶的形成是由于在河岸兩側河流季節性的升降,降低了邊坡的穩定性[3]。
土地利用類型與滑坡之間有一定的相關性,其背后的機制也得到了進一步的研究[32]。土地覆被一方面是指植被覆蓋的類型,另一方面可以決定人類的工程活動。
2.1.4" 人類活動
與人類活動相關的影響因子有與道路距離和POI核密度。
與道路距離是代表人類工程活動的常用因子[50]。人類活動對地表有重要影響,道路修建時可能會開挖山體,這容易導致巖土體的破碎,開挖路基時會在坡腳產生臨空面,導致坡體穩定性降低。
POI核密度是通過POI數據在ArcGIS中進行核密度分析得到的。POI數據可表現區域內與人類活動密切相關的特征[32],POI核密度可以用來反映人類工程活動的程度。
2.1.5" 降雨
與降雨有關的影響因子有多年平均降雨量。
降雨是重慶山區滑坡的主要觸發因素[32,51],降雨量對表層土壤體積含水量的影響非常顯著[52]。短期高強度降雨會增加孔隙水壓力,降低邊坡的穩定性,滑坡災害更容易發生。然而,從研究區域的氣象站獲得的數據非常有限。因此,本研究采用研究區2001—2016年多年平均降雨量數據進行滑坡易發性評價。
2.2" 數據處理
利用ArcGIS的工具對DEM數據進行處理可得到高程、地形起伏度、坡度、坡向、坡位、曲率等數據,在ArcGIS里對地質圖進行矢量化可以獲得巖性、斷層等數據,通過ENVI軟件處理可得INDV數據,在ArcGIS里進行多重緩沖分析可得到與河流距離、與道路距離和與斷層距離數據,通過核密度計算可以得到POI核密度,多年平均降雨量通過空間內插方法獲得。為降低數據離散性,需對數據進一步做歸一化處理,公式如下:
X*=X-XminXmax-Xmin。
式中:X*為22個滑坡影響因子進行歸一化處理后的結果;X為原始數據;Xmin為滑坡影響因子中的最小值;Xmax為滑坡影響因子中的最大值。
本文以30 m精度的網格單元和斜坡單元作為滑坡評價單元,建立了滑坡影響因子數據庫。圖4為數據庫的部分影響因子。
3" 滑坡易發性區劃
3.1" 隨機森林
Breiman[53]和Cutler等[54]提出的隨機森林(random forest)模型具有較高的泛化能力,并且可以處理高維度、大數據量的數據集,它與傳統方法相比具有一定的優勢[55]。隨機森林是一種無監督學習分類方法,無監督學習是指從現有的訓練集出發,經過訓練得出一定結果[56]。隨機森林本質是先構建多棵決策樹,然后對多個決策樹的判斷結果進行投票,再從投票結果中選擇眾數作為輸出結果。
隨機森林的核心是互不關聯的n棵決策樹組合模型[h(X,θk)(k=1,2,…, n)]建立的分類模型,在模型中,每棵決策樹都單獨進行預測和判斷樣本的類別,判斷樣本屬于哪種類別的決策樹更多,就預測樣本為哪種類別。隨機森林由多棵決策樹進行判斷,可以減小單一的決策樹帶來的不準確性和片面性問題,且操作簡單、易于實現、不易過擬合、計算效率高[57]。隨機森林流程如圖5所示。
隨機森林通過構建不同的訓練集來增加模型之間的差異,從而提高隨機森林模型性能。先通過樣本訓練,得到不同分類模型h1(X),h2(X),…,hk(X),再用這些分類組合隨機森林模型,然后進行投票決策:
H(x)=arg maxZ∑ki=1I(hi(X)=Z)。
式中:H(x)為隨機森林模型的最終輸出結果;Z為輸出變量;
arg maxZ為找到決策樹投票最多的類別Z,即票數總和最大的類別標簽;
hi為單個決策樹模型的輸出結果;k為決策樹的個數;
hi(X)為第i棵決策樹對輸入X進行預測;I(hi(X)=Z)為指示函數,當
hi(X)的預測結果為Z時,
I(hi(X)=Z)取值為1,否則為0。
構建隨機森林主要有以下2個步驟:
1)有放回的抽樣產生訓練集來構建單獨的決策樹。隨機森林采用Bagging技術有放回的抽樣來建立訓練子集(n個),其中訓練子集的數量一般約為總訓練樣本數量的1/3或1/4。
2)生成決策樹(n個),構建隨機森林。基于步驟1)建立的訓練子集為每個子集建立1棵決策樹。在建立決策樹的過程中,本文采用CART(classification and regression trees)算法進行節分裂。CART采用基尼系數(IGini)最小原則來進行,在t節點處,將隨機選擇的對象分配給i類的概率為p(i|t),而實際上隨機選擇的對象是屬于j類的估計概率為p(j|t),在此條件下分類的基尼系數公式為
IGini=∑Ji≠jp(i|t)p(j|t)。
式中,J為類別的總數。
3.2" 模型優化
超參數優化是指根據評價指標來選擇最合適的超參數值[3]。目前模型優化常用的方法是網格搜索法,但是網格搜索法的效率并不高。2012年,Snoek等[58]提出貝葉斯優化算法。和網格搜索法相比,貝葉斯優化算法充分使用了先驗知識,和隨機搜索相比,貝葉斯優化算法具有更強的魯棒性,可以得到最優解;故本文采用貝葉斯算法進行模型優化。
優化過程采用的貝葉斯公式為
P(f|Dx)=PDx|fP(f)P(Dx)。
式中:P(f|Dx)為f的后驗概率分布;f為參數模型中的參數;Dx為觀測集合,
Dx={(a1,b1),(a2,b2),…,(ax,bx)},其中ax為決策向量,bx為觀測值 ,
bx=f(ax)+ε,ε為觀測誤差;P(Dx|f)為在給定f的情況下觀測數據Dx的似然分布;P(f)為f的先驗概率分布;P(Dx)為觀測數據Dx的邊際似然分布。
3.3" 模型訓練
本研究首先使用云陽縣歷史滑坡數據(988個)作為正樣本;然后將研究區內滑坡500 m緩沖區和河流所在的區域剔除,作為非滑坡區,按照滑坡點與非滑坡點1∶1的比例在非滑坡區隨機提取相同數量的非滑坡樣本作為負樣本[59];最后由正負樣本構成全體數據集進行訓練。
3.4" 模型檢驗
3.4.1" 混淆矩陣
在進行滑坡易發性研究時可采用混淆矩陣對模型的預測精度進行分析評價[3]。
在二值分類中,可將實例分成正類(positive)和負類(negative),如樣本點為滑坡,則為正類;樣本點為非滑坡,則為負類。對于分類結果,會出現四種情況;第一種情況是實例為“滑坡”并且也被預測成“滑坡”,記作TP(true positive);第二種情況是實例為“非滑坡”而被預測為“滑坡”,記為FP(1 positive);第三種情況是實例為“非滑坡”且被預測成“非滑坡”,記為TN(true negative);最后一種情況是實例為“滑坡”而被預測成“非滑坡”,記為FN(1 negative)。由于滑坡易發性評價所得到的結果是一個易發性概率,如要得到一個二分類的結果,需要設定一個閾值。參考相關文獻[55]可知,本文的閾值為0.5,即當預測值小于0.5時,預測結果為不發生滑坡,預測值大于0.5時,預測結果為發生滑坡。
混淆矩陣是用來衡量模型分類精度的有效方法,主要以矩陣的形式表示真實情況與模型分類的情況,如表2所示。
基于混淆矩陣,我們選用IACC(accuracy,準確率)、IPRE(precision,精確率)、ISST(sensitivity,敏感度)和If1-score(精確率和敏感度的調和平均數)對其進行精度驗證。計算公式為:
IACC=(Tp+Tn)/(Tp+Fp+Tn+Fn);
IPRE=Tp/(Tp+Fp);
ISST=Tp/(Tp+Fn);
Ifl-score=2IPREISST/(IPRE+ISST)。
式中:Tp為TP的數量;Fp為FP的數量;Fn為FN的數量;Tn 為TN的數量。
IACC、IPRE、ISST和If1-score的取值范圍均為0~1,越接近1表示模型的預測越準確,越接近0表示模型的預測越不準確。
從混淆矩陣評價結果(表3)來看,斜坡單元比網格單元的預測精度高。
3.4.2" 受試者工作特征曲線
模型分類的準確度也可以通過ROC(受試者工作特征)曲線來分析[60]。基于網格單元和斜坡單元的隨機森林模型ROC曲線如圖6所示。
把真陽性率(TP所占比例)作為縱坐標,假陽性率(FP所占的比例)作為橫坐標來繪制曲線,即可得到ROC曲線。曲線越靠近左上方,真陽性率越大,假陽性率越小,模型分類的精確度就越高。AUC(曲線下的面積值)可以定量判斷模型分類的精度大小,當AUC<0.5時,說明模型不具有診斷價值;當AUC在0.5~0.7之間時,模型的預測效果較差;當AUC在0.7~0.9之間時,模型的預測效果較好;當AUC>0.9時,模型的預測效果優秀。AUC值越接近1.0,表明模型的預測效果越優秀[61]。計算結果表明,斜坡單元的AUC值為0.744,網格單元的AUC值為0.714(圖6),說明基于2種評價單元的隨機森林模型滑坡易發性評價結果較好。
使用基于不同評價單元的隨機森林模型對研究區的滑坡易發性進行預測,并利用自然斷點的方法對預測結果進行劃分,將研究區域的易發性等級劃分成低、較低、中、較高和高5個等級。2種評價單元的易發性區劃如圖7所示。從圖7可以看出,滑坡的高易發區多集中于水系附近。統計分析各易發性等級基本數據,計算滑坡的密度,結果如表4所示。從表4可以看出:斜坡單元和網格單元的易發性區劃等級分區面積有所差異,但是隨著滑坡易發性等級的升高,網格單元與斜坡單元的滑坡災害密度均增加,兩者為正相關性;從網格單元來看,低易發區和高易發區的面積相當,而高易發區的滑坡密度(0.793 1個/ km2)是低易發區(0.023 2個/ km2)的34倍。統計結果說明滑坡易發性的結果是可靠的。
4" 討論
4.1" 影響因子重要性排序
探究不同因子對易發性模型預測的貢獻程度可以為滑坡易發性研究和災害管理提供參考。網格單元基于規則網格進行劃分,通常由一個或多個地理位置的均值或代表值來表示;而斜坡單元根據地形特征和地形變化進行劃分,每個斜坡單元的形狀和大小是不規則的,因此可更好地捕捉地形變化和植被狀況。各影響因子相關性排序如圖8所示。
在斜坡評價單元(圖8a)中,INDV、剖面曲率和平面曲率重要性位于前3,其對滑坡發生的貢獻率較大。其中:INDV可以反映地表植被的覆蓋情況,INDV高的地方,水土保持更好,雨水對地表的沖刷程度更低,INDV較低的地方,雨水對地表的沖刷程度高,更容易發生水土流失;剖面曲率對斜坡體的下滑力有影響,剖面曲率越大,地表水的流速越快,對地表的沖刷作用越強,滑坡更易發生;平面曲率表現等高線的彎曲程度,它會影響地表徑流的匯聚和分散。總體來說,凹坡不太容易被外力侵蝕,風化剝蝕穩定性更好,而凸坡容易被外力侵蝕。
在網格評價單元(圖8b)中,高程、與道路距離和坡度的重要性位于前3,說明這三者對滑坡發生的貢獻率較大。其中:高程是影響滑坡發生的常見
因子,高程影響地形的穩定性和氣候條件,同時影響人類活動,如工程建設等;與道路距離因子與人類工程活動密切相關,云陽縣的縣級公路較多,道路修建涉及對地形的改造,會直接影響土體穩定性;坡度是影像滑坡發生的重要因子,它表示地形的陡緩程度,坡度陡峭的地方下滑力大,更易發生滑坡,而坡度較小的地方較穩定。
4.2" 隨機森林模型
已有學者[62]利用隨機森林模型進行滑坡易發性研究,證明了隨機森林模型具良好的預測效果。本研究基于隨機森林模型將斜坡單元和網格單元進行比較分析,結果如圖6所示。由圖6可見,基于斜坡單元
的模型AUC值為0.744,基于網格單元的模型AUC值為0.714;說明這兩種評價單元構建的隨機森林模型均具有一定的合理性。另外從表4可以直觀地看出,研究區內斜坡評價單元在較高—高易發區包含了61.34%的滑坡,網格評價單元在較高—高易發區的包含了74.50%的滑坡,并且2種評價單元滑坡易發性區劃的分級統計的結果均是滑坡密度隨著易發性等級的升高而變大;以上表明基于這兩種評價單元構建的隨機森林模型均具有較好的預測能力。
4.3" 評價單元
斜坡單元和網格單元都是滑坡易發性研究中常用的評價單元。網格單元由于劃分簡單的特點,在滑坡易發性研究中最為常見,而斜坡單元更能夠體現地質環境條件與地勢起伏。本文基于這兩種評價單元構建隨機森林模型進行滑坡易發性評價,根據預測結果得到滑坡易發性分級結果,分級結果表明兩者的滑坡密度均隨易發性等級的升高而變大,說明斜坡單元作為評價單元對山地丘陵地區進行滑坡易發性區劃具有一定的適用性。此外,通過混淆矩陣和AUC值可直觀反映出,斜坡單元進行滑坡易發性評估比網格單元更合理與準確。
5" 結論
本文選取高程、巖性、傾坡類型、曲率等22個因子作為滑坡易發性的影響因子,基于30 m網格單元和斜坡單元,利用隨機森林算法構建模型來進行滑坡易發性研究,對2種評價單元的滑坡易發性結果進行對比分析,主要結論如下:
1)基于斜坡單元和網格單元的隨機森林滑坡易發性區劃模型AUC值分別為0.744和0.714,說明兩種模型均具有較好的預測能力。
2)
斜坡評價單元中,INDV、剖面曲率和平面曲率這3個因子對滑坡發生的貢獻率大;
網格評價單元中,高程、與道路距離和坡度對滑坡發生的貢獻率大。
3)斜坡單元AUC值和混淆矩陣精確度均高于網格單元,這說明基于斜坡單元的隨機森林模型更適用于進行滑坡易發性區劃研究。
參考文獻(References):
[1]" 周超. 集成時間序列InSAR技術的滑坡早期識別與預測研究[D]. 武漢: 中國地質大學, 2018.
Zhou Chao. Landslide Identification and Prediction with the Application of Time Series InSAR[D]. Wuhan: China University of Geosciences, 2018.
[2]" 王濤, 劉甲美. 全國地震滑坡危險性評價研究[J]. 地質力學學報, 2019, 25(3): 453.
Wang Tao, Liu Jiamei. National Earthquake Landslide Risk Assessment Study[J]. Journal of Geomechanics, 2019, 25(3): 453.
[3]" 孫德亮. 基于機器學習的滑坡易發性區劃與降雨誘發滑坡預報預警研究[D]. 上海:華東師范大學, 2019.
Sun Deliang. Mapping Landslide Susceptibility Based on Machine Learning and Forecast Warning of Landslide Induced by Rainfall[D]. Shanghai: East China Normal University, 2019.
[4]" 吳棟哲,姜琦剛,顧宗瑞,等.基于AHP的海峽沿岸地區生態地質環境質量評價:以馬六甲海峽北岸馬來西亞西南沿海地區為例[J].吉林大學學報(地球科學版),2024,54(2):619632.
Wu Dongzhe,Jiang Qigang,Gu Zongrui,et al. Evaluation of Eco-Geological Environment Quality in Strait Coastal Areas Based on AHP:Taking Southwest Coastal Areas of Malaysia of North Coast of Malacca Strait as an Example[J]. Journal of Jilin University (Earth Science Edition),2024,54(2):619632.
[5]" 許嘉慧, 孫德亮, 王月, 等. 基于GIS與改進層次分析法的奉節縣滑坡易發性區劃[J]. 重慶師范大學學報(自然科學版), 2020, 37(2): 3644.
Xu Jiahui, Sun Deliang, Wang Yue, et al. Landslide Susceptibility Mapping in Fengjie County Based on GIS and Improved Analytic Hierarchy Process[J]. Joural of Chongqing Normal University (Natural Science), 2020, 37(2): 3644.
[6]" 祁元, 劉勇, 楊正華, 等. 基于GIS的蘭州滑坡與泥石流災害危險性分析[J]. 冰川凍土, 2012, 34(1): 96104.
Qi Yuan, Liu Yong, Yang Zhenghua, et al. GIS-Based Analysis of Langslide and Debris Flow Hazard in Lanzhou[J]. Journal of Glaciology and Geocryology, 2012,34 (1): 96104.
[7]" 吳常潤, 趙冬梅, 劉澄靜, 等. 基于GIS的華寧縣滑坡災害影響因子分析及易發性評價[J]. 水土保持研究, 2019, 26(6): 212218.
Wu Changrun, Zhao Dongmei, Liu Chengjing, et al. GIS-Based Analysis on Impact Factors and Susceptibility Evaluation of Landslide Hazard in Huaning County[J]. Research of Soil and Water Conservation, 2019, 26(6): 212218.
[8]" 李文彥, 王喜樂. 頻率比與信息量模型在黃土溝壑區滑坡易發性評價中的應用與比較[J]. 自然災害學報, 2020, 29(4): 213220.
Li Wenyan,Wang Xile. Application and Comparison of Frequency Ratio and Information Value Model for Evaluating Landslide Susceptibility of Loess Gully Region[J]. Journal of Natural Disasters, 2020, 29(4): 213220.
[9]" 閆舉生, 譚建民.基于ANN和LR的遠安縣滑坡易發性評價[J]. 山西建筑, 2018, 44(20): 4850.
Yan Jusheng,Tan Jianmin. Landslide Susceptibility Assessment Based on ANN and LR Model in Yuan’an County [J]. Shanxi Architecture, 2018, 44(20): 4850.
[10]" 劉睿, 施婌嫻, 孫德亮, 等. 基于GIS與隨機森林的巫山縣滑坡易發性區劃[J]. 重慶師范大學學報(自然科學版), 2020, 37(3): 8696.
Liu Rui, Shi Shuxian, Sun Deliang, et al. Based on GIS and Random Forest Model for Landslide Susceptibility Mapping in Wushan County[J]. Journal of Chongqing Normal University (Natural Science), 2020, 37 (3): 8696.
[11]" Merghadi A, Abderrahmane B, Bui D T. Landslide Susceptibility Assessment at Mila Basin (Algeria): A Comparative Assessment of Prediction Capability of Advanced Machine Learning Methods[J]. Isprs International Journal of Geo-Information, 2018, 7: 268.
[12]" 崔陽陽. 基于不同評價單元的滑坡易發性評價方法研究:以陜西省洛南縣為例[D]. 西安: 西安科技大學, 2021.
Cui Yangyang. A Comparatives Study on Evaluation Methods of Landslide Susceptibility Based on Different Evaluation Units: A Case Study of Luonan County, Shaanxi Province[D]. Xi’an: Xi’an University of Science and Technology, 2021.
[13]" 王銳. 基于GIS和Logistic回歸模型的降雨型滑坡易發性研究[D].杭州:浙江大學, 2018.
Wang Rui. GIS-Based Logistic Regression Model for Rainfall-Induced Landslide Susceptibility Assessment[D]. Hangzhou: Zhejiang University, 2018.
[14]" 王家柱, 高延超, 鐵永波, 等. 基于斜坡單元的山區城鎮滑坡災害易發性評價:以康定為例[J]. 沉積與特提斯地質, 2023, 43(3): 640650.
Wang Jiazhu, Gao Yanchao, Tie Yongbo, et al. Evaluation of the Susceptibility to Landslide in Mountainous Towns Based on Slope Unit: Taking Kangding as an Example[J]. Sedimentary Geology and Tethyan Geology, 2023, 43(3): 640650.
[15]" 楊何, 湯明高, 許強, 等. 三峽庫區石榴樹包滑坡近期變形特征與機理分析[J]. 中國地質災害與防治學報, 2022, 33(1): 6774.
Yang He,Tang Minggao,Xu Qiang,et al. Recent Deformation Characteristics and Mechanism of the Shiliushubao Landslide in the Three Gorges Reservoir Area[J]. The Chinese Journal of Geological Hazard and Control, 2022, 33(1): 6774.
[16]" 夏輝. 三峽庫區重慶庫段區域滑坡風險評價[D]. 武漢:中國地質大學, 2018.
Xia Hui. Landslide Risk Assessment in Chongqing Section, Three Gorges Reservoir[D]. Wuhan: China University of Geosciences, 2018.
[17]" 王莉芳. 云陽縣自然災害的類型及防災對策[J]. 現代農業科技, 2013(3): 173174.
Wang Lifang. The Types of Natural Disasters and Disaster Prevention Countermeasures in Yunyang County[J]. Modern Agricultural Science and Technology, 2013 (3): 173174.
[18]" 張利芹, 李浩, 顧超, 等. 基于信息量法的重慶云陽縣(三峽庫區)地質災害易發性評價[J]. 礦產勘查, 2020, 11(12): 28092815.
Zhang Liqin, Li Hao, Gu Chao, et al. Geological Hazard Susceptibility Sssessment Based on Weighted Information Value in Yunyang County (the Three Gorges Reservoir Area), Chongqing[J]. Mineral Exploration, 2020, 11 (12): 28092815.
[19]" 趙彬. 基于GIS的汶川地震地質災害危險性評價研究[D]. 北京: 首都師范大學, 2011.
Zhao Bin. Study on Risk Assessment of Wenchuan Earthquake Geological Dsaster Based on GIS[D]. Beijing: Capital Normal University, 2011.
[20]" 唐亞明,張茂省.滑坡風險評價難點及方法綜述[J]. 水文地質工程地質, 2011, 38(2): 130134.
Tang Yaming, Zhang Maosheng. Landslide Risk Assessment Difficulties and Methods:An Review[J]. Hydrogeology & Engineering Geology, 2011, 38(2): 130134.
[21]" 田述軍, 張珊珊, 唐青松,等. 基于不同評價單元的滑坡易發性評價對比研究[J]. 自然災害學報, 2019, 28(6): 137145.
Tian Shujun, Zhang Shanshan, Tang Qingsong, et al. Comparative Study of Landslide Susceptibility Assessment Based on Different Evaluation Units[J]. Journalof Natural Disasters, 2019, 28(6): 137145.
[22]" Alvoli M, Guzzetti F, Rossi M. Scaling Properties of Rainfall Induced Landslides Predicted by a Physically Based Model[J]. Geomorphology, 2014, 213: 3847.
[23]" Alvoli M, Marchesini I, Reichenbach P, et al. Automatic Delineation of Geomorphological Slope-Units and Their Optimization for Landslide Susceptibility Modelling[J]. Geoscientific Model Development Discussions, 2015, 9: 3975.
[24]" Alvoli M, Marchesini I, Reichenbach P, et al. Automatic Delineation of Geomorphological Slope-Units with r.Slope Units V1.0 and Their Optimization for Landslide Susceptibility Modeling[J]. Geoscientific Model Development, 2016, 9(11): 39753991.
[25]" Zhou X Z,Wen H J, Li Z W, et al. An Interpretable Model for the Susceptibility of Rainfall-Induced Shallow Landslides Based on SHAP and XGBoost[J]. Geocarto International, 2022, 37: 1341913450.
[26]" Zhang J Y, Ma X L, Zhang J L, et al. Insights into Geospatial Heterogeneity of Landslide Susceptibility Based on the SHAP-XGBoost Model[J]. Journal of Environmental Management, 2023,332: 117357.
[27]" 文海家, 胡東萍, 王桂林. 汶川縣地震滑坡易發性LR與NN評價比較研究[J]. 土木工程學報, 2014, 47(增刊1): 1723.
Wen Haijia, Hu Dongping, Wang Guilin. A Comparative Study on the Susceptibility Mapping of Earthquake Triggered Landslide by Neural Network and Logistic Regression, Wenchuan County[J]. China Civil Engineering Journal, 2014, 47 (Sup.1): 1723.
[28]" 文海家, 張永興, 柳源. 三峽庫區地質災害防減災戰略關鍵問題[J]. 中國地質災害與防治學報, 2004, 15(2): 2531.
Wen Haijia, Zhang Yongxing, Liu Yuan. Some Crucial Problems of Controlling Geological Hazard in the Section of the Three Gorges Reservior[J]. The Chinese Journal of Geological Hazard and Control, 2004, 15(2): 2531.
[29]" 謝明娟, 蒲瑞, 韓信, 等. 基于多模型的滑坡易發性評價[J]. 測繪與空間地理信息, 2019, 42(10): 8385.
Xie Mingjuan, Pu Rui,Han Xin, et al. Landslide Vuinerability Assessment Based on Multiple Models[J]. Geographic amp; Spatial Information Technology, 2019, 42(10): 8385.
[30]" Kalanter B, Pradhan B, Naghibi S A, et al. Assessment of the Effects of Training Data Selection on the Landslide Susceptibility Mapping:A Comparison Between Support Vector Machine (SVM), Logistic Regression (LR) and Artificial Neural Networks (ANN)[J]. Geomatics, Natural Hazards and Risk, 2018, 9(1): 4969.
[31]" Zhou X Z, Wen H J, Zhang Y L, et al. Landslide Susceptibility Mapping Using Hybrid Random Forest with GeoDetector and RFE for Factor Optimization[J]. Geoscience Frontiers, 2021, 12(5): 101211.
[32]" Wang Y, Sun D L, Wen HJ, et al. Comparison of Random Forest Model and Frequency Ratio Model for Landslide Susceptibility Mapping (LSM) in Yunyang County (Chongqing, China)[J]. International Journal of Environmental Research and Public Health, 2020, 17(12): 4206.
[33]" Gorokhovich Y, Machado E A, Melgar L I G, et al. Improving Landslide Hazard and Risk Mapping in Guatemala Using Terrain Aspect[J]. Natural Hazards, 2016, 81(2): 869886.
[34]" Hong H Y, Pourghasemi H R, Pourtaghi Z S. Landslide Susceptibilit Assessment in Lianhua County (China): A Comparison Between a Random Forest Data Mining Technique and Bivariate and Multivariate Statistical Models[J]. Geomorphology, 2016, 259(15):105118.
[35]" 楊樂, 彭海游, 周莫林, 等. 基于層次分析法的奉節縣城地質環境承載力評價[J]. 重慶交通大學學報(自然科學版), 2014, 33(2): 9599.
Yang Le, Peng Haiyou, Zhou Molin, et al. Assessment of Geological Environment Carrying Capacity of Fengjie County Based on AHP[J]. Journal of Chongqing Jiaotong University (Natural Science), 2014, 33(2):9599.
[36]" Sun D L, Xu J H, Wen H J, et al. Assessment of Landslide Susceptibility Mapping Based on Bayesian Hyperparameter Optimization: A Comparison Between Logistic Regression and Random Forest[J]. Engineering Geology, 2021, 281: 105972.
[37]" Moosavi V, Niazi Y. Development of Hybrid Wavelet Packet-Statistical Models (WPSM) for Landslide Susceptibility Mapping[J]. Landslides, 2016, 13(1): 97114.
[38]" Weiss A. Topographic Position and Landforms Analysis[R]. San Diego, CA: ERSI User Conferece, 2001.
[39]" 于海洋, 羅玲, 馬慧慧, 等. SRTM(1″)DEM在流域水文分析中的適用性研究[J]. 國土資源遙感, 2017, 29(2): 138143.
Yu Haiyang, Luo Ling, Ma Huihui, et al. Application Appraisal in Catchment Hydrological Analysis Based on SRTM 1 Arc-Second DEM[J]. Remote Sensing for Land and Resources, 2017, 29(2): 138143.
[40]" Pham B T, Nguyen-Thoi T, Qi C C, et al. Coupling RBF Neural Network with Ensemble Learning Techniques for Landslide Susceptibility Mapping[J]. Catena, 2020, 195: 104805.
[41]" Moore I D, Wilson J P. Length-Slope Factors for the Revised Universal Soil Loss Equation: Simplified Method of Estimation[J]. Journal of Soil and Water Conservation, 1992, 47(5): 423428.
[42]" Pradhan A M S, Kim Y T. Relative Effect Method of Landslide Susceptibility Zonation in Weathered Granite Soil: A Case Study in Deokjeok-ri Creek, South Korea[J]. Natural Hazards, 2014, 72(2): 11891217.
[43]" Ali S A, Parvin F, Vojtekova J, et al. GIS-Based Landslide Susceptibility Modeling: A Comparison Between Fuzzy Multi-Criteria and Machine Learning Algorithms[J]. Geoscience Frontiers, 2021, 12(2):857876.
[44]" Shirzadi A, Soliamani K, Habibnejhad M, et al. Novel GIS Based Machine Learning Algorithms for Shallow Landslide Susceptibility Mapping[J]. Sensors, 2018, 18(11):3777.
[45]" Zhang S H, Li Z H, Hou X N, et al. Impacts on Watershed-Scale Runoff and Sediment Yield Resulting from Synergetic Changes in Climate and Vegetation[J]. Catena, 2019, 179: 129138.
[46]" Yi Y, Zhang Z J, Zhang W C, et al. Landslide Susceptibility Mapping Using Multiscale Sampling Strategy and Convolutional Neural Network: A Case Study in Jiuzhaigou Region[J]. Catena, 2020, 195: 104851.
[47]" Jebur M N, Pradhan B, Tehrany M S. Optimization of Landslide Conditioning Factors Using Very High-Resolution Airborne Laser Scanning (LiDAR) Data Acatchment Scale[J]. Remote Sensing of Environment, 2014, 152:150165.
[48]" Kavzoglu T, Sahin E K, Colkesen I. Selecting Optimal Conditioning Factors in Shallow Translational Landslide Susceptibility Mapping Using Genetic Algorithm[J]. Engineering Geology, 2015, 192:101112.
[49]" 吳宏陽,周超,梁鑫,等. 基于XGBoost模型的三峽庫區燕山鄉滑坡易發性評價與區劃[J]. 中國地質災害與防治學報,2023,34(5): 141152.
Wu Hongyang,Zhou Chao,Liang Xin,et al. Assessment of Landslide Susceptibility Mapping Based on Xgboost Model: A Case Study of Yanshan Township[J]. The Chinese Journal of Geological Hazard and Control,2023,34(5): 141152.
[50]" Chen W, Chen X, Peng J B, et al. Landslide Susceptibility Modeling Based on ANFIS with Teaching-Learning-Based Optimization and Satin Bowerbird Optimizer[J]. Geoscience Frontiers, 2021, 12:93107.
[51]" Sun D L, Wen H J, Wang D Z, et al. A Random Forest Model of Landslide Susceptibility Mapping Based on Hyperparameter Optimization Using Bayes Algorithm[J]. Geomorphology, 2020, 362: 107201.
[52]" 劉勇,魏良帥,黃安邦,等. 氣候變化下長江源土壤水時空演化及其環境響應[J]. 水文地質工程地質,2023,50(5): 3952.
Liu Yong,Wei Liangshuai,Huang Anbang,et al. Spatial and Temporal Evolution of Soil Water and Its Response to the Environment in the Yangtze River Source Area Under Climate Change[J]. Hydrogeology amp; Engineering Geology, 2023, 50(5): 3952.
[53]" Breiman L. Bagging Predictors[J]. Machine Learning, 1996, 24(2): 123140.
[54]" Cutler A, Cutler D R, Stevens J R. Random Forests[M]. New York: Springer, 2012: 157175.
[55]" 曹正鳳. 隨機森林算法優化研究[D]. 北京:首都經濟貿易大學, 2014.
Cao Zhengfeng. Study on Optimization of Random Forests Algorithm[D]. Beijing:Capital University of Economics and Business, 2014.
[56]" 齊永強,李文鵬,鄭躍軍,等. 地下水機器學習方法研究:水位監測數據驅動的區域補排邊界識別[J]. 水文地質工程地質,2022,49(1): 111.
Qi Yongqiang,Li Wenpeng,Zheng Yuejun,et al. Application of Machine Learning to Aquifer Analyses:Locating Hydrogeological Boundaries with Water Table Monitoring Data[J]. Hydrogeology amp; Engineering Geology, 2022, 49(1): 111.
[57]" 侯賢沐, 王付勇, 宰蕓, 等. 基于機器學習和測井數據的碳酸鹽巖孔隙度與滲透率預測[J]. 吉林大學學報(地球科學版), 2022, 52(2): 644653.
Hou Xianmu, Wang Fuyong, Zai Yun, et al. Prediction of Carbonate Porosity and Permeability Based on Machine Learning and Logging Data[J]. Journal of Jilin University (Earth Science Edition), 2022, 52(2): 644653.
[58]" Snoek J, Larochelle H, Adams R P. Practical Bayesian Optimization of Machine Learning Algorithms[C]//Neural Information Processing Systems(NIPS). Nevada: Lake Tahoe, 2012: 29512959.
[59]" 張虹, 辜慶渝, 孫誠彬, 等. 基于可解釋性機器學習的丘陵緩坡地區滑坡易發性區劃研究[J]. 重慶師范大學學報(自然科學版), 2022, 39(3): 7892.
Zhang Hong, Gu Qingyu, Sun Chengbin, et al. Landslide Susceptibility Mapping Hilly and Gentle Slope Region Based on Interpretable Machine Learing[J]. Journal of Chongqing Normal University (Natural Science), 2022, 39 (3) :7892.
[60]" 方然可. 基于機器學習的四川青川縣區域滑坡災害預警模型研究[D]. 鄭州: 華北水利水電大學, 2021.
Fang Ranke. Research on Regional Landslide Disaster Early Warning Model Based on Machine Learning in Qingchuan County, Sichuan Province[D]. Zhengzhou: North China University of Water Resources and Electric Power, 2021.
[61]" 王冬燕. Logistic回歸與決策樹分類效能的ROC曲線比較[J]. 智能計算機與應用, 2014, 4(5): 3436.
Wang Dongyan. The ROC Curves Comparing of Classification Performance Between Logistic Regression and Decision Tree[J]. Intelligent Computer and Applications, 2014, 4(5): 3436.
[62]" 王雪冬, 張超彪, 王翠, 等. 基于Logistic回歸與隨機森林的和龍市地質災害易發性評價[J]. 吉林大學學報(地球科學版), 2022, 52(6): 19571970.
Wang Xuedong, Zhang Chaobiao, Wang Cui, et al. Geological Disaster Susceptibility in Helong City Based on Regression and Randdom Forest[J]. Journal of Jilin University (Earth Science Edition), 2022, 52(6): 19571970.