梁麗萍, 劉延國, 唐自豪, 鄒 強, 李景吉
(1.成都理工大學 地球科學學院, 四川 成都 610059; 2.成都理工大學 生態環境學院, 四川 成都 610059;3.西南科技大學 環境與資源學院, 四川 綿陽 621010; 4.中科院 山地災害與環境研究所, 四川 成都 610041)
地質災害易發性評價是以基礎地質條件為出發點,考慮致災體內在控制因素從而評估地質災害在區域內某個空間發生的可能性大小[1]。美國數學家Shannon[2]最早提出了“信息量法”的概念,并在概率論知識和邏輯推理方法的基礎上,推導出了信息量的計算公式。隨著信息量法不斷完善,其運用到地質災害易發性評價中被眾多學者接受。隨著3S技術的快速發展,研究者更多的在基于GIS的基礎上對地質災害進行易發性評價,現在已經成為重要的有效工具。眾多研究者在易發性評價中根據研究區的特殊條件,構建了不同的評價體系并且進行了很多模型上的嘗試。目前,主要的方法模型有邏輯回歸法,信息量法,確定性系數法、貢獻權重疊加模型、支持向量機法、BP神經網絡模型、隨機森林模型等[3-11]。近年來,研究者不僅僅注重單一模型的選取,更多的研究者對不同的模型進行對比以及重新組合。其中由于信息量是一種比較可以客觀的統計分析方法,在地質災害易發性的評價中常常和確定系數法、層次分析法以及邏輯回歸方法等方法結合,賦予客觀評價因子不同的權重,從而結合成加權信息量模型[12-13]。本文采用確定性系數法和信息量法結合對研究區進行了地質災害易發性分析。
四川省瀘定縣隸屬甘孜藏族自治州,介于101°46′—102°25′E,北緯29°54′-30°10′N之間,平均海拔在2 000 m左右,最高海拔7 556 m,位于大雪山貢嘎山主峰。研究區地處川西高原與四川盆地的過渡帶,大渡河由北向南將全縣分割為東西兩部分,為典型的高山峽谷地貌。地形上嚴格受構造控制,總體地勢西北高,東南低。構造上瀘定縣地跨揚子陸塊區與羌塘—三江造山系兩大一級構造單元,主要由川滇南北向構造帶、北東向龍門山構造帶、北西向構造帶構成[14]。瀘定縣屬青藏高原亞濕潤氣候,受東南、西南季風和青藏高原冷空氣的雙重影響,氣候垂直差異明顯,大渡河河谷及其支流河谷海拔1 800 m以下地區屬于熱帶季風氣候,年降水量664.4 mm,多集中在6—8月,為典型的干熱河谷區[10]。河流兩岸坡度陡峭,同時受巖性和溫度等因素的影響,多破碎巖體出露地表且廣泛分布。
本文使用的數據主要包括數字高程模型(DEM)、土壤、土地利用、工程巖組、斷裂帶、水系、多年平均溫度、地質災害點等多個數據集。其中,DEM數據來自地理空間數據(http:∥www.gscloud.cn/),研究區坡度、坡向、起伏度均由DEM數據在ArcGIS 10.1中生成;土壤類型來自南京土壤所1∶100萬中國土壤數據庫;土地利用類型基于2018年土地變更調查數據庫并結合《土地利用現狀分類(GB/T21010-2017)》生成;工程巖組、斷裂帶均采用中國地質調查局1∶20萬地質圖;多年平均溫度由四川省氣象數據庫(1986—2016年)數據插值生成。地質災害點類型主要包括滑坡、泥石流和崩塌,基于谷歌衛星影像(2018年)通過目視解譯獲取(圖1),并由實地調查驗證,研究區地質災害點共279處。

圖1 研究區谷歌影像解譯示例圖
地質災害的易發性評價首先要選擇一個合適的評價單元,即制圖單元。“單元”即地質災害評價中最小的地表研究對象,其形狀可以是規則圖形,也可以是不規則多邊形。常用的有以下4種方法:規則格網法即柵格單元、地域條件、獨特條件和斜坡單元。本文采用柵格單元評價法,基于前人[12]的研究經驗以及研究區的實際情況,本文以30 m×30 m柵格單元為最小評價單元。研究區共2 404 481柵格個單元,在此基礎上展開易發性評價。
2.2.1 信息量模型 信息量模型屬于統計分析模型的一種,于其物理意義明確、操作簡單,在地質災害易發性評價的研究和實踐中得到了廣泛的應用[15]。該模型可以比較客觀的反映單個評價因素中在不同分級標準下,對地質災害易發性貢獻的大小。根據研究區地貌、地質、氣象等特征,在復雜的環境中,選取一種“最佳因素組合”,對地質災害發生影響最大。
信息量的表達式為:
(1) 單個因素信息量計算公式:
(1)
式中:Ni——在因素Xi特定類別xi內的地質災害點個數;N——研究區域地質災害發生的災害點總數;Si——研究區域內含有評價因素xi的單元面積;S——研究區域評價單元面積總數。
(2) 單個評價單元內總的信息量,計算公式
(2)
式中:Ij——評價單元總的信息量,也表示該評價單元地質災害的易發性大小。其中Ij的值越大表明越有利于滑坡災害的發生。
2.2.2 確定性系數法 確定性系數模型(CF)是一個概率函數,最早由Shortlifffe和Buchanan(1975年)提出[16],由Heckerman[17]進行了改進。該模型通常用于事物發生不同因素的敏感性分析,也有學者[18-19]著重用于確定因子的權重。劉艷輝等[18]基于CF值代表著各因子對地質災害的貢獻,提出了基于CF的多因子疊加確定權重法。馬玉寬等[19]根據各因子的CF值,通過計算得出各因子權重。確定性系數確定權重的方法為:
(1) CF計算:
(3)
式中:PPa——地質災害在數據a類中發生的條件概率,應用時為因素a類中存在的地質災害個數與因素a類的面積的比值;PPs——地質災害在整個研究區A中發生的先驗概率,可以表示為整個研究區域的地質災害的個數與研究區面積的比值。CF的變化區間為[-1,1],正值代表地質災害發生的確定性高,較易發生地質災害;負值代表地質災害發生的確定性降低,不易發生地質災害;當計算結果接近0表示該因子在分類中不能確定是否容易發生地質災害。
(2) 權重Wi:
Wi=CF(i,max)-CF(i,min)
(4)
式中:CF(i,max)——因子i各分類對地質災害發生的確定系數的最大值; CF(i,min)——因子i各分類對地質災害發生的確定系數的最小值;通過對易發性指數的計算,可以分析各個評價因子對地質災害的影響程度。
2.2.3 加權信息量 由于地質災害發生原因復雜,各因素在整個過程中所起到的作用大小不一,信息量模型未考慮各評價因子在地質災害發生過程中所起作用的大小,不能反映不同因子影響程度的差異。因此為了更加科學合理的進行易發性分析,應考慮對各個影響因子賦予權重與信息量相乘得到加權信息量[12]。本文結合確定系數法和信息量法的優點,最終模型為:
(5)
地質災害的發生具有快速性、突發性和不確定性的特征,影響因素也很多樣。本文將影響因子分為地形地貌、土壤與土地利用/覆被(LULC)、巖性構造、氣象水文4大類來進行分析。具體有坡度、坡向、起伏度、土壤、土地利用、工程巖組、與斷層距離、年均溫度和與河流距離9個指標為本研究區地質災害易發性評價因子(附圖1)。
3.1.1 地形地貌
(1) 坡度。坡度是基本的自然地理要素,坡度的大小決定了地表松散堆積物發生位移并形成地質災害的可能性,是影響地質災害發育的重要因素,對地質災害的發生起著控制性作用。研究區坡度范圍為0°~88.57°,將坡度分為9個等級(圖2)。根據災害統計看出(附圖1),地質災害多發生在30°以上的斜坡上,共發生201處,占總災害點的72.04%。但從信息量而言,除了30°以上研究區較高外,坡度在8~15°的也較高,信息量為0.07。
(2) 坡向。不同的坡向使得其受太陽照射的時間有很大差別,從而影響了地表松散程度。承載體的松散程度是地質災害是否發生的關鍵性因素,陽坡和陰坡由于陽光照射不同,地表破碎程度不一。由瀘定縣地質災害與8個坡向的統計數據來看(附圖1),陽坡發生的災害點明顯多于陰坡,位于東南、南、西南方向共發生179個地質災害,占研究區總災害點個數的70.61%。各個坡向的信息量和發生的地質災害點數量呈現明顯的正相關性,其中東南,南的信息量分別為0.68,0.67。
(3) 起伏度。起伏度在一定程度上也影響著地質災害的發育,其控制著地質災害所聚集的勢能[20]。在高山深切河谷地貌中,起伏度與地質災害尤其是滑坡災害具有良好的相關性。本文通過ArcGIS得到研究區起伏度分布圖(附圖1),將起伏度分為分0~20 m,20~40 m,40~60 m,60~80 m,80~100 m以及>100 m共6個等級。地質災害多集中于起伏度40~60 m之間,共發生99處地質災害,占總災害的35.48%。雖然起伏度在80~100 m區間內地質災害僅發生29處,但由于單位研究區面積小,僅占總研究區的0.08%,故該區段信息量較高,具體值為0.22(圖2)。

注:1為工礦倉儲; 2為特殊用地; 3為交通運輸; 4為水域及水利; 5為住宅用地; 6為耕地; 7為園地; 8為林地; 9為草地; 10為其他用地。
圖2 研究區影響因子災害數量、加權信息量相關性統計
3.1.2 土壤與土地利用/覆被(LULC)
(1) 土壤類型。土壤的質地影響著土壤的滲透性能,土壤的滲透性越好,越有利于泄洪,一般沙性土壤顆粒較粗,不容易產生徑流,或流量較小。相反,黏質土壤透水性差,容易產生徑流。根據1∶100萬中國土壤數據庫,研究區擁有7種土類,15種土壤亞類,土壤類型豐富(附圖1)。據統計(附圖1),瀘定縣地質災害82.08%集中在淋溶土區,該區域面積占總研究區面積的61.02%。淋溶土及指濕潤土壤水分狀況下,石灰充分淋溶,具有明顯黏粒淋溶和淀積的土壤,透水性相對較差,故地質災害發生相對集中。
(2) 土地利用/覆被(LULC)。地質災害的發生與土地利用聯系非常密切[21],不同的土地利用類型發生的地質災害數量差別較大。根據2017年土地利用分類現狀,研究區共有耕地、園地、林地、草地、工礦倉儲用地、住宅用地、特殊用地、交通運輸用地、水域及水利設施用地以及其他用地10種(附圖1)。其中林地是研究區土地利用的主要類型,面積占總面積的65.53%。同時也是地質災害集中的區域,共發生211處地質災害,占總災害的43.37%。
3.1.3 巖性構造
(1) 工程巖組。工程巖性的硬度不同,其抗拉、抗壓等力學性能相差巨大,從而導致災害的難易程度不同[22]。研究區的工程巖組包括硬質巖組(白云巖,灰巖、玄武巖、黑云二長花崗巖等)、軟質巖組(斜長角閃巖、混合片麻巖、變粒巖等)和軟硬互層巖組(泥灰巖、砂巖、粉砂巖等)(附圖1)。可以直接看出硬質巖體是研究區的主要工程巖組類型,面積為1 385.99 km2,占總面積的64.03%。由于其在研究區分布面積大,在硬質巖組統計的地質災害點相對較多,共194處是總災害的69.53%,但硬質巖體并不是信息量最大的工程巖組類型。軟硬互層巖組雖然在研究區所占面積小,僅為95.43 km2,但由于其穩定性差并且在內外力作用下容易發生滑坡等地質災害。軟硬互層巖組信息量高達0.92,可見軟硬互層巖組在該區域內是最容易發生地質災害的區域。
(2) 與斷層距離。研究區內主要斷裂構造有鮮水河斷裂、磨西斷裂、大渡河斷裂、龍門山斷裂、金坪斷裂等。由于斷裂的走向控制著河流、河谷的發育方向,而其兩側又是人類活動的主要區域,地質災害發生率高且危險性大,所以將距斷層距離考慮到易發性評價中。本文將研究區距斷層的距離分為:<2 km,2~4 km,4~6 km,6~8 km,8~10 km以及>10 km共6個等級(附圖1),由統計(附圖1)看出距斷層距離越近地質災害發生率越高的總體趨勢,距斷層2 km以內是地質災害發生的主要區域,共發生130處,占總災害的46.6%,信息量為0.58。
3.1.4 氣象水文
(1) 與水系距離。河流是控制坡面侵蝕的重要原因,瀘定縣境內有大渡河及其支流木角溝、磨河溝、冷磧潘溝、興隆溝等20余條分布于大渡河兩岸的溪溝,流域面積達2 144.1 km2,河流多深切峽谷,具有較好的地質災害點發育臨空面。本文用將研究區距水系的距離(km)分為:<1 km,1~2 km,2~3 km,3~4 km,4~5 km,5~6 km和>6 km共7個等級(附圖1)。通過統計看出(附圖1),總體上距水系距離越近,地質災害發生的概率越高。距水系1 km以內是地質災害發生的重點區域,共發生124處地質災害,占總災害的44.4%,信息量高達0.95。
(2) 年均溫度。年均溫度是區域地形、氣候等多因素綜合影響下的氣象表征。瀘定縣年均氣溫15.5 ℃,但受地形影響瀘定縣溫度差異明顯:在高山地區常年積雪,屬于高原氣候;河谷地區四季分明屬于典型的亞熱帶季風氣候。溫度較高的河谷地區,由于長時間受陽光照射以及河谷風力侵蝕,加速了兩岸坡面的松散程度,為地質災害的發生提供了有利條件。研究區大致分為:8~10 ℃,10~12 ℃,12~14 ℃,14~16 ℃,16~18 ℃共5大區域,年均溫度由東向西遞減(附圖1)。由地質災害點與多年平均溫度的統計來看(附圖1),年均溫度越高,信息量越大,表示越容易發生地質災害。其中年均溫14~16 ℃以及16~18 ℃的區域地質災害分別發生127處和113處,占發生總災害的45.52%,40.5%。
運用公式(3)對各評價因子CF值量化,再運用公式(4)確定各評價因子權重(表1)。運用公式(1)—(2)計算單個評價因子各分類等級信息量值(表2)。通過ArcGIS,所有數據源均投影到2000國家大地坐標系(CGCS2000)坐標系下,并將每個評價因子圖層轉成30 m×30 m的柵格圖層。

表1 地質災害影響因子權重
通過柵格計算器將各個圖層進行疊加,將疊加后圖層用自然斷點法分為5個易發區:極低易發區、低易發區、中易發區、高易發區、極高易發區,得到利用加權信息量模型做出的研究區易發性分區圖。為了驗證加權信息量模型在易發性評價分區中的精確度,通過信息量模型與之對比,運用信息量模型得到易發性分區圖(附圖2)。
工作特征曲線(ROC)是衡量評價模型預測精度的指標,本文以信息量值從高到低的區域累計柵格與總柵格的百分比作為橫軸,以對應信息量區間內地質災害累計點數與地質災害總數百分比作為縱軸,分別將信息量模型和加權的信息量模型所得數值代入,得到兩條過(0,0),(1,1)的曲線(圖3)。ROC曲線越接近左上角模型越理想,曲線下方面積AUC被用來評價模型的精度,信息量模型與加權信息量模型的AUC值分別為0.773,0.793。可見在本研究區構建的加權信息量模型精度高于單一的信息量模型。

表2 地質災害易發性評價各因素狀態信息量
注:Ni表示在因素Xi特定類別xi內的地質災害點個數;Si表示研究區域內含有評價因素xi的單元面積。Ii表示信息量值。

圖3 地質災害易發性評價結果ROC圖
經加權信息量模型分區結果和統計情況(表3)表明,研究區共225處地質災害位于高易發區以及極高易發區,占總地質災害的80.65%。其中高易發區地質災害與總災害比29.75%,高易發區面積與總面積比26.49%;極高易發區地質災害與總災害比50.90%,極高易發區面積與總面積比13.54%。加權信息量模型預測結果較好。

表3 研究區易發性分區結果統計
(1) 根據CF計算各因子權重大小來看,研究區致災評價因子中土壤類型和年均溫度所占比重較大,分別高達1.96和1.93,是地質災害的主控因子。其次為土地利用類型、坡向、與斷層和水系的距離以及工程巖組,坡度和起伏度相對來說所占權重較小。
(2) 地質災害易發性分區表明,研究區40.03%被劃為高易發區以及極高易發區。從各評價要素提供的信息量來看,坡度為31~35°,坡向為東南,起伏度在60~80 m,年均溫度在16~18 ℃且距離水系小于1 km,斷層小于2 km,土壤類型為鐵鋁土,土地利用類型為耕地,軟硬互層的工程地質巖組的范圍和類型內極易發生地質災害。
(3) 運用確定系數法確定評價因子權重大小,結合信息量法,構成加權信息量模型。通過ROC檢驗,加權信息量在研究區劃定的易發性分區更精確,AUC值為0.793。研究區279處地質災害點,225處落在高易發區和極高易發區中,占總災害點的80.65%。與研究區實際情況比較一致,能夠在地質災害危險性評價中起相應作用。