申玉松,張 宸,王藝杰,張 迪
1. 河南省第三地質礦產調查院有限公司,河南 信陽 450000;2. 河南省自然資源科技創新中心(信息感知技術應用研究),河南 鄭州 450000
地質災害易發性評價是在對以往地質災害調查基礎上,通過對其發育的地質環境條件分析和判斷,總結有利于地質災害發育的地質環境條件組合,推斷相同條件下地質災害發育的可能性[1],為防災減災工作提供目標靶區. 常用的地質災害易發性評價方法可分為定性評價、定量評價兩種,具體包括專家打分法、層次分析法、信息量法、證據權法、確定性系數法、支持向量機、決策樹、神經網絡等. 這些方法經廣泛應用和驗證,取得了很好的效果[2-4]. 但各方法均存在一定的缺陷,如人為因素影響大、無法比較不同指標間的相對重要性、偏離實際等. 而多方法、多模型的相互耦合,由于能相互驗證、相互補充且評價精度和合理性更高,在近年來被廣泛應用[5-10].
傳統確定性系數(Certainty Factor,CF)模型[11]能客觀反映指標內部不同分級對地質災害易發性的影響值,解決多源數據類型的合并問題,但是忽略了不同指標間的差異性;而邏輯回歸(Logistic Regression,LR)模型基于對大量數據的統計分析,能夠較為精確地反映指標間的相對權重. 兩種方法結合使用[12],即CF-LR 模型,由傳統確定性系數模型提供地質災害與評價指標關系的數據,經邏輯回歸計算得到指標相對權重,能夠大大提高評價的精度和合理性.
信陽市地質災害數量多年保持在250~350 處,尤其是南部山區的縣區,地質災害密度達3~6 處/100 km2,是地質災害多發市,地質災害防治任務艱巨. 本研究通過以往地質災害資料收集和分析,選取研究區內地質災害影響指標,構建評價指標體系,基于ArcGIS 平臺,采用CF-LR 模型,對地質災害易發性進行評價,以期為信陽市防災減災、國土空間規劃等工作提供參考.
信陽市位于河南省東南部,豫皖鄂三省交界,地處中國地理南北分界線、氣候分界線. 整體地勢西南高、東北低,海拔高度19~1 570 m. 氣候溫暖濕潤,年均氣溫6~15 ℃,年均降雨量1 000~1 400 mm. 受大別山造山運動和淮河沖積共同作用,地貌類型自南向北依次為低山、丘陵、崗地和平原,巖性由南部的混合巖、花崗巖,逐漸向北變化為泥巖、砂巖和第四系沖洪積層. 復雜的造山運動對區內巖土體擠壓、抬升和錯斷,形成網格狀構造格局,龜梅斷裂、桐商斷裂和定遠-八里販斷裂等區域斷層縱貫全區. 區內地質災害主要為崩塌、滑坡,多受降雨誘發失穩.
確定性系數模型(CF)以確定性系數來表征地質災害發育的可能性,主要通過衡量現狀條件下地質災害發育情況確定[13]. 通過式(1)可以獲得無量綱的CF值,其以比值形式將不同地質環境條件統一. 通常CF取值為[-1,1],值越大表示地質災害發生的確定性越大.
式中,CF—確定性系數,地質災害發育的概率;Pa—地質災害在地質環境條件a 中發生的概率,通常用地質環境條件a 中的地災數量與地質環境條件a 總面積的比值表示,其取值范圍為[0,1];Ps—地質災害發育的概率,通常用地質災害總數與研究區面積比值表示,同一研究區內為定值.
邏輯回歸模型(LR)是探索眾多數據特征關系的一種常用的統計方法,計算公式見式(2). 在地質災害易發性評價中,地質災害是否發生為因變量(0 為否,1為是),各地質環境條件為自變量,通過自變量與因變量之間關系分析,得到不同自變量組合下的地質災害發生概率.
式中,P—地質災害發生的概率;Y—地質災害與地質環境條件的關系方程;β1,…,βn—邏輯回歸系數,為各地質環境條件對地質災害的作用強度;β0—常數,表示在不受任何因素影響條件下,地質災害發生與不發生概率之比的對數值[14];x1,x2,…,xn—各地質環境條件對應的CF值.
信陽市地質災害數據主要來自2012~2021 年各縣區統計和公布的2022 年地質災害隱患點核查數據,共收集933 處地質災害點(見圖1),其中崩塌、滑坡地質災害點914 處,占比98%,其他為泥石流和地面塌陷.由于泥石流和地面塌陷地質災害占比小,且發育分布受單個因素控制明顯,本次研究選取914 處崩塌、滑坡作為研究對象.
圖1 信陽市地質災害分布圖Fig. 1 Distribution map of geohazards in Xinyang City
研究采用DEM 數據為地理空間數據云平臺獲取的ASTER GDEM 數據,夜間燈光數據源為2021 年NPP/VIIRS 年均夜光遙感數據,植被數據為Landsat8影像波段疊加計算得到的歸一化植被指數(Normalized Differential Vegetation Index,NDVI),地質數據源為1 ∶20 萬地質圖.
影響地質災害發育分布的因素十分復雜[15],各因素的作用方式、強度在不同區域存在差異. 通過對研究區資料分析,選擇坡度、坡向、地形曲率、到水系距離、到斷層距離、夜間燈光指數和NDVI 共7 項指標進行地質災害易發性評價. 地質災害點在各指標圖層中的分布見圖2—8.
圖2 地質災害點在坡度圖層中的分布Fig. 2 Distribution of geohazard sites by slope gradient
坡度:斜坡巖土體是在各種力相互作用下保持平衡的,其中坡度的大小直接影響重力沿斜坡向下的分力,是影響斜坡穩定性的重要因素. 坡度的大小還決定地質災害發生的類型和破壞機制. 通過ArcGIS 中坡度工具,基于DEM,提取得到地形坡度數據,并分類成8 級:≤5°,5~10°,10~15°,15~20°,20~25°,25~30°,30~35°,>35°(圖2).
坡向:不同坡向在接受陽光照射、降雨等方面存在差異,從而間接影響植被覆蓋、風化速率和人口分布等,進而影響地質災害的發育分布. 通常在相同巖土體條件下,陽坡面接受了較多的陽光照射和降雨,巖石風化速率更快,坡表松散的覆蓋層更厚,人類對地質環境條件的改造也更多. 將坡向數據分成東、西、南、北和平地共5 個方向(圖3).
圖3 地質災害點在坡向圖層中的分布Fig. 3 Distribution of geohazard sites by slope aspect
地形曲率:斜坡剖面形態影響了巖土體內的應力分布,凸型坡在坡體前緣形成應力集中,更容易發生失穩. 地形曲率是斜坡剖面形態的定量度量指標,正值表示凸型坡,負值表示凹型坡,曲率越接近0 表示坡面越平坦. 研究區地形曲率為-0.84~0.45,將其分成6級:<-0.5,-0.5~-0.2,-0.2~-0.05,-0.05~+0.05,0.05~0.2,>0.2(圖4).
圖4 地質災害點在地形曲率圖層中的分布Fig. 4 Distribution of geohazard sites by terrain curvature
到水系距離:河流對地質災害的影響主要在于水流對河道兩側岸坡的侵蝕作用,不斷增加的岸坡高度和坡度,為巖土體失穩提供了臨空條件. 區內水系主要為淮河二級及以下支流,結合現場實際,將河流影響劃分成6 級:<100 m,100~200 m,200~300 m,300~400 m,400~500 m,>500 m(圖5).
圖5 地質災害點在到水系距離圖層中的分布Fig. 5 Distribution of geohazard sites by distance to water system
到斷層距離:斷層破壞巖土體的完整性,控制地質災害邊緣,為雨水入滲提供通道. 一般到斷層距離越近,巖土體結構面越發育,結構越破碎,地質災害發育也越集中. 選擇1 km 間隔作斷層緩沖區,研究區共分為6 級:<0.5 km,0.5~1.5 km,1.5~3 km,3~5 km,5~8 km,>8 km(圖6).
圖6 地質災害點在到斷層距離圖層中的分布Fig. 6 Distribution of geohazard sites by distance to faults
夜間燈光指數:為人類活動的一種有效表征形勢,對國民生產總值、人口數量有一定的指示意義. 研究區夜間燈光指數分布相對集中,其中大值主要分布在市區、縣城、經濟活躍鄉鎮以及重要道路周邊,其余位置夜間燈光指數為小值. 將夜間燈光指數劃分成6級:0,0~10,10~20,10~30,30~40,>40(圖7).
圖7 地質災害點在夜間燈光指數圖層中的分布Fig. 7 Distribution of geohazard sites by nighttime light index
NDVI:植被能減少雨水沖刷,減緩水流入滲,對自然斜坡具有一定保護作用,但植被的自重加載和根劈作用又破壞著坡體的穩定性. 研究區NDVI 值在-0.56~+0.79 之間,將其分成6 級:水域(<-0.1)、裸地(-0.1~0)、荒地(0~0.1)、草地(0.1~0.2)、林地(0.2~0.3,>0.3)(圖8).
圖8 地質災害點在NDVI 圖層中的分布Fig. 8 Distribution of geohazard sites by NDVI
為保證各評價指標柵格單元的一致性,首先需要對各評價指標圖層進行統一. 各評價指標圖層按照100 m×100 m 進行重采樣,共計1 892 722 個柵格單元.
根據914 處地質災害點在各指標分類級別中的分布數量和對應面積,利用CF 模型,得到各分類級別對應的CF值,結果見表1.
表1 各評價指標確定性系數CF 計算結果表Table 1 Deterministic coefficient calculation results of each evaluation factor
相關性過大的指標可導致計算結果偏離實際,為保證計算結果的合理性,需要對指標的獨立性進行檢驗. 采用相關性分析法對7 個指標的獨立性進行檢驗,在SPSS 19.0 中得到相關系數矩陣(見表2). 表2中x1、x2、x3、x4、x5、x6、x7分別代表坡度、坡向、地形曲率、到水系距離、到斷層距離、夜間燈光指數、NDVI.
表2 評價指標間的相關性系數矩陣Table 2 Correlation coefficient matrix of evaluation indexes
結果顯示:評價指標之間的相關性系數絕對值最大為0.177,小于0.3,表明所選取的因子之間的相關性小,7 個指標全部可納入分析.
采用LR 模型計算回歸系數,首先需要選擇訓練樣本,確定訓練樣本集. 樣本選擇的合理與否直接影響計算結果的準確性. 本次計算采用隨機選取的方式確定,其中地質災害點隨機選取總數的80%左右,非地質災害點在地質災害點200 m 緩沖區以外的區域內隨機生成. 共選取714 處地質災害點和714 處非地質災害點,形成包含1 428 點的訓練集. 通過點提取,確定各樣本對應的評價指標分類,并替換成各CF值.將CF值作為自變量,是否發生地質災害作為因變量(0為否,1 為是),導入SPSS 軟件進行邏輯回歸,計算結果見表3. 由結果可知,評價指標的顯著性均小于0.05,回歸系數有效,具有統計意義. 回歸系數均為正數表示所有評價指標對模型均起正向作用.
表3 邏輯回歸結果匯總表Table 3 Results of logistic regression
將計算得到的各指標回歸系數代入LR 模型,可得邏輯回歸方程,見式(3).
式中:P—地質災害發生的概率,值為[0,1];x1、x2、x3、x4、x5、x6、x7—坡度、坡向、地形曲率、到水系距離、到斷層距離、夜間燈光指數、NDVI 各分類等級的CF值.
利用ArcGIS 中柵格計算器將各指標圖層的柵格值賦為對應的CF,通過加權疊加計算,得到柵格單元的地質災害發生的概率P.
由計算可知,研究區發生地質災害的概率P 位于0.0043~0.9753 之間.
對得到的概率P 柵格圖按照等間距法確定地質災害易發程度等級(見圖9),共分成4 類:低易發區(<0.25)、中易發區(0.25~0. 5)、高易發區(0.5~0.75)、極高易發區(>0.75).其面積及占比分別為10 337.73 km2(54.90%)、2 674.38 km2(14.20%)、3 673.03 km2(19.51%)和2 145.30 km2(11.39%).
圖9 地質災害易發程度區劃與檢驗樣本分布Fig. 9 Susceptibility zoning and distribution of geohazard test samples
從易發程度分區結果可知:信陽市地質災害易發程度以低為主,分布在東北部,主要為淮河沖積平原,地勢較為平坦,地層巖性為沖洪積粉土、粉砂,構造不發育;其次為中—高易發區,合計占比33.71%,分布在中部,呈帶狀展布,為丘陵地貌區;極高易發區主要分布在南部、西北部,溝道深切,地勢起伏較大,巖性復雜多變,構造發育.
評價結果是否有效,通常進行兩個方面的檢驗,即合理性檢驗和準確性檢驗.
為保持評價模型的穩定性,減少檢驗樣本選擇中的人為影響,本研究選取未參與邏輯回歸計算的200處地質災害點進行合理性檢驗. 由檢驗結果(表4)可知,隨著地質災害易發等級的提高,地質災害在數量、密度上均呈增多的趨勢,占總面積30.9%的極高、高易發區,分布了77.5%的檢驗點地質災害,說明易發程度越高,越易發育地質災害,區劃結果是合理的.
表4 地質災害易發性評價合理性檢驗統計表Table 4 Rationality test results of geohazard susceptibility evaluation
ROC 曲線[16]是一種不受臨界約束的結果評價方法,能有效地對評價結果的準確性進行檢驗[17]. 其以假陽性率(未發生地質災害的單元被正確預測的比例)為橫坐標,真陽性率(發生地質災害的單元被正確預測的比例)為縱坐標繪制的曲線,用于描述敏感性和特異性之間的關系. 曲線下的面積為AUC(Area Under Curve)值,是衡量模型準確性指標[18],取值區間為[0.5,1],值越大表示模型準確性越好.
將914 處地質災害點和714 處隨機生成的非地質災害點全部作為樣本,通過SPSS 19.0 進行ROC 曲線分析(圖10). 結果顯示,本次評價AUC 值為0.828,易發性評價結果準確性較高,表明CF-LR 模型可以較為準確地對信陽市的地質災害易發程度進行評價.
圖10 評價模型ROC 曲線Fig. 10 ROC curve of evaluation model
1)在諸多前人研究中,指標體系的構建均根據經驗人為選定,帶有一定的主觀性[19]. 本研究在指標選取時,斷層、巖性、高程等相關性較大,進行了取舍,存在一定的片面性.
2)對地質災害評價目前趨于風險評價,是在易發性、危險性、易損性基礎上開展的[20],將地質災害發生概率、承載對象易損程度綜合考慮,更客觀、合理. 研究區的風險性將在其他論文中進行闡述.
1)信陽市地質災害易發性影響大小依次是:到水系距離>到斷層距離>坡向>夜間燈光指數>坡度>NDVI>地形曲率.
2)信陽市地質災害易發性以低易發為主,面積10 337.73 km2,占比54.90%,主要分布在東北部淮河沖積平原區,地形起伏較小;極高易發區面積2 145.30 km2,占比11.39%,主要分布在南部、西北部,地勢起伏較大,巖性復雜多變,結構破碎. 中—高易發區分布在中部,帶狀分布.
3)將邏輯回歸模型進行合理性檢驗,地質災害易發程度越高,地質災害分布則越多,評價結果較為合理. 用ROC 曲線對模型的準確性進行檢驗,其AUC 值為0.828,精度較高,說明CF-LR 模型能夠較為客觀準確地對信陽市地質災害進行評價.