孫小凡, 張 鵬, 黨 超
(1.三峽庫區地質災害教育部重點實驗室, 湖北 宜昌 443002; 2.三峽大學 土木與建筑學院, 湖北 宜昌 443002)
中國山地丘陵地貌分布廣泛,其地質環境非常脆弱,滑坡、崩塌和泥石流等地質災害多發。特別是在三峽庫區沿線,城市均分布于丘陵山地地貌區,地質災害發育更加強烈,對城市建設及居民的生產生活產生了極大的威脅。近年來,對滑坡等地質災害的研究已經從單個災害體的現象描述、分類及治理發展到以定性和定量描述為基礎的區域地質災害定量預測、預報階段[1-2]。以區域滑坡孕育為研究對象,進行易發性評價,是滑坡災害風險評估和預測預防的基礎,有助于潛在滑坡的及時發現和滑坡災害防治防范資源的有效利用,減少損失。隨著遙感(RS)和地理信息系統(GIS)的發展,空間信息處理技術已被廣泛應用到滑坡災害易發性評價中。空間信息處理軟件和統計分析工具的結合,大大提高了數據的獲取、處理與分析的效率,也促進了更多評價模型和方法的應用。區域滑坡災害易發性評價模型可以分為定性、線性定量和非線性定量研究3大類[2]。定性研究,如層次分析法[3],常具有較強的主觀性和經驗性[2-3],評價結果常常因人而異,需要嚴格控制人為誤差。線性定量研究,如統計量模型和Logistic回歸模型等統計方法[4-5],統計量模型來源于信息量模型,屬于二元線性模型;而Logistic回歸模型是一種多元線性回歸模型,應用更為廣泛,其原理簡單、實現方便,可以同時處理離散型和連續型數據[6-7]。非線性定量研究,如信息量模型和人工神經網絡模型等[8-13],信息量模型在目前的地質災害易發性和危險性評價中最為廣泛[8-10],其物理意義明確,操作簡單[11],但對因子的選擇比較嚴格,因子選取及其標志狀態劃分的合理性影響著評價結果的可靠性[2];人工神經網絡是一種典型的非線性模型,目前應用最為廣泛的是基于誤差反向傳播算法(BP算法)的BP神經網絡[12],其具有高速的運行處理能力和自組織學習能力等優點[12-13],但目前的應用還不夠深入成熟,不能充分發揮其優勢。Logistic回歸模型可將滑坡的發生與否用1和0表示,通過建立因變量和多個自變量的多元線性回歸關系,預測某一區域滑坡的發生概率[14]。其不需要獲得大量的滑坡體的物理力學參數[7],通過統計分析方法,選取與滑坡發生有關的關鍵影響因子,即可建立滑坡的易發性評價模型,具有較高的準確性和客觀性,近年來,在滑坡等地質災害的預測預報中得到了廣泛應用。為此,本研究將以宜昌市城區作為研究對象,選取與滑坡發育密切相關的因子,通過似然比法分析因子與滑坡發育的相關性,并將因子參數分類量化,用分類量化值作為Logistic回歸模型的自變量,建立回歸模型,對滑坡的易發性進行分區評價,以期為城市規劃與防災減災工程提供理論依據。
宜昌市位于湖北省西南部,長江中上游分界處,城區面積1 012.13 km2。區域屬鄂西黃陵山地與江漢平原過渡地帶,地勢西高東低,形成自西向東由山地、丘陵向平原過渡的地貌形態;構造上處于黃陵背斜與江漢拗陷間的宜昌單斜凹陷的西緣,受到喜馬拉雅山運動的影響,區內西部上升,東部下降,白堊系地層南東向傾伏,區域內無大斷裂存在,地質構造相對穩定。鄂西地區降雨集中,多暴雨、大雨;河流水系發育,長江自西向東流經該區,流長達14 km,長江支流眾多,流量豐沛。城區內主要出露寒武系、奧陶系、白堊系和第四系地層,巖土體類型以碳酸鹽巖、碎屑巖及全新統松散堆積層為主。近年來,隨著城區開發建設,人類工程活動的日益增強,致使地質環境持續惡化,滑坡災害發生的數量與規模均有所擴大。據2016年的調查統計,區內共發育有滑坡地質災害175處,多分布在海拔為100~200 m地形較平緩的中部及中南部等人類活動較為劇烈的區域,滑坡的易發性與城市的發展建設關系密切。
本研究的基礎數據源包括:比例尺為1:5萬的數字化地形圖、數字化地質圖等矢量數據,和由地理空間數據云平臺下載的Landsat 8OLI影像數據(編號為LC81250392015104LGN00);滑坡數據來源于2016年的滑坡詳細調查數據。在ArcGIS平臺上,將全區劃分成大小為300 m×300 m的共11 804個評價單元網格,其中175處滑坡被劃分到248個單元中。數字化地形圖包含有等高線、水系、道路等信息,利用等高距為20 m的地形等高線插值生成不規則三角網(TIN)地形模型,由TIN轉換生成數字高程模型(DEM),由DEM可得到坡度因子圖層。在ENVI平臺上將Landsat 8OLI影像數據進行輻射定標和大氣校正后,計算可得NDVI(歸一化植被指數)。
根據滑坡的形成條件和誘發因素,選取與滑坡發育密切相關的影響因子,建立易發性評價指標體系。將評價因子區間劃分為若干個連續分類子集,通過似然比法分析單個評價因子的不同分類子集對滑坡發生的影響程度,并將歸一化的似然比值作為自變量,以滑坡的發生與否作為因變量,建立Logistic回歸模型;通過對樣本數據的訓練和驗證,得到可靠、合理的滑坡易發性回歸模型,最后將模型應用于整個區域,完成易發性分級分區評價。
2.2.1 因子選取 滑坡的發生是許多因子共同作用的結果,從滑坡形成的地質環境出發,可分為背景因子和觸發因子兩大類。背景因子是指滑坡發生的基本地質環境條件,主要包括地形地貌、地層巖性、斜坡類型、地質構造、植被覆蓋情況等;觸發因子是指影響和誘發滑坡形成的外界因素,主要包括河流沖刷、降雨、地震、人類工程活動等。雖然滑坡的發生與這些因子間常具有非線性和不確定性等特點;但從統計學的角度考慮,滑坡的發生與否可以看作是基于各種因子綜合影響下的概率事件,具有一定的重復性和隨機性[1],這是進行滑坡易發性評價的前提和基礎。由于宜昌市城區內無大斷裂的存在,地質構造較穩定,地震活動微弱,且區內降雨強度無較大差別,影響滑坡發育的主要是地形地貌、地層巖性、植被覆蓋、河流沖刷和人類工程活動等因子。所以本研究選取高程、坡度、地層巖性和NDVI(歸一化植被指數)作為滑坡的形成背景因子;以道路密度表示人類工程活動強度,和與水系的距離共同作為滑坡發生的觸發因子,以此6個因子建立滑坡易發性評價模型。
2.2.2 似然比法 滑坡因子與滑坡發育的關系主要體現為滑坡因子的不同分類子集對滑坡發育的不同影響程度。通過滑坡因子分析可以直觀地描述因子的不同分類子集對滑坡發育的影響程度大小。目前應用較多的因子分析方法有確定性系數法(CF)[17-18]、信息量法[9-11]、似然比概率模型[19]和二元分析法[20]等。本研究采用似然比法[19,21]作為滑坡因子分析和量化的方法,分析滑坡因子與滑坡發育和形成的關系,并將因子參數分類量化。
結合野外經驗和數據特征,以一定的步長,將連續型的評價因子數據劃分為連續緊密的分類子集;對于地層巖性因子,以其本身的巖性類別作為分類子集。則評價因子Xi的分類子集Zj在滑坡發生條件下的似然比Lij:
(1)
式中:Nij——評價因子Xi的分類子集Zj包含的滑坡單元數;N——整個研究區的所有滑坡單元總數;Sij——評價因子Xi的分類子集Zj包含的評價單元總數;S——整個研究區的所有評價單元總數。
似然比值的大小表示某個評價因子的不同分類子集間滑坡發生的相對可能性大小,似然比值越大,滑坡相對越易發生,可以直觀地反映獨立的單個滑坡因子與滑坡發育的關系。本研究對每個評價因子的似然比值做歸一化處理(公式2),將其轉換到[0,1]區間內,用以表示各評價因子各分類子集參數的量化值,作為Logistic回歸模型的自變量。
(2)
式中:Li——評價因子Xi的所有分類子集的似然比集合。
2.2.3 Logistic回歸模型 Logistic回歸模型是一種基于統計學的多元線性回歸分析模型,其原理是在一個因變量和多個自變量之間建立多元回歸關系,預測某一事件的發生概率[14],概率取值為[0,1]。當模型的因變量為二項分布(0和1)時,即為二分類變量Logistic回歸,用0表示滑坡不發生,1表示滑坡發生,評價因子的參數值作為自變量,即可建立滑坡發生條件下的回歸模型:
(3)
式中:X1,X2,…,Xn——自變量,即各滑坡因子的參數值;β1,β2,…,βn——邏輯回歸系數,是在單個X發生變化時,事件發生與不發生概率之比的對數變化值[14];β0——常數項,表示沒有自變量參與的情況下,事件發生與不發生概率之比的對數值[14-15]。本研究以評價因子分類子集參數的歸一化似然比值作為Logistic回歸模型的自變量,則β1,β2,…,βn表示滑坡因子在評價模型中的權重大小。
將評價因子區間劃分為對滑坡發育的影響具有顯著差別的若干分類子集(附圖7),根據公式(1)計算每個評價因子的分類子集似然比值,并利用公式(2)進行歸一化處理,處理結果詳見表1。
3.1.1 高程 高程在一定程度上決定了某一區域的地貌形態、植被分布、松散物質堆積和人類工程活動強度等因素的差異,從而引起不同高程滑坡發育程度的顯著差異。宜昌市城區的高程總體呈現西高東低的規律,西部最大高程達1 200 m以上,中南部長江沿岸高程僅為40~50 m。近半數以上的滑坡都分布在高程100~200 m的區域,如附圖7所示,這一區域多為由地勢較低的沖洪積扇或河流階地向地勢相對較高的低山丘陵的過渡地帶,堆積層類滑坡異常發育,且由于河流沖刷強烈,極易引起土質類的滑坡。高程大于400 m的區域,巖體完整,殘坡積層普遍較薄,植被覆蓋良好,滑坡的分布密度較低。
3.1.2 坡度 坡度的大小對斜坡的應力分布和破壞的動力學過程等有重要的影響。從附圖7可以看出,坡度<15°的區域滑坡數量較小;但在城區中南部,由于第四系膨脹土的廣泛發育,滑坡發育密度明顯增加。坡度15°~25°的區域,多為牽引式土質滑坡,分布密度最大;隨著坡度的繼續增大,坡度25°~40°的區域,滑坡發育則相對減少;坡度>40°的區域多為完整堅硬的巖體,基本上沒有滑坡災害的發生。
3.1.3 地層巖性 巖性條件是滑坡發育的物質基礎,不同巖性條件下,滑坡的易發性差異顯著。如附圖7,區內寒武系、奧陶系等以石灰巖、白云巖為主的化學巖系,近水平產出,垂向裂隙發育,屬易崩地層,滑坡的易發性較低;而以粉~粗砂巖、泥巖為主的白堊系地層,由于巖體軟弱,易風化,殘坡積層厚度較大,為滑坡的孕育提供了物質基礎;第四系地層中,特別是在城區中南部,由于富含膨脹土夾層,是滑坡分布密度最高的區域,雖然第四系地層僅占全區面積的25%,卻有55%的滑坡分布于該區域。
3.1.4 歸一化植被指數(NDVI) NDVI是指遙感影像中近紅外波段(NIR)的反射值和紅光波段(R)的反射值之差與兩者之和的比值。NDVI值的范圍為[-1,1],負值表示地面為江、河、湖泊等水體或有雪覆蓋,對可見光高反射;0表示為巖石或裸土等,NIR和R近似相等;正值表示有植被覆蓋,數值越大表示植被覆蓋越好[14]。通過統計,宜昌市城區的滑坡主要分布在NDVI為0.2~0.3的區域,如附圖7所示,這些區域為人類工程活動強烈的區域向植被覆蓋良好區域的過渡地帶,植被覆蓋較差,且斜坡常常受到人工開挖等破壞,易發生滑坡災害;NDVI<0.2的區域主要是河流等水體或人口密集的中心城區,NDVI>0.4的區域植被覆蓋良好,這些區域都不利于滑坡的發生。
3.1.5 與水系的距離 距河流水系越近,受河流的沖刷作用、軟化作用和動水壓力作用越強烈,斜坡巖土體的穩定性越差,越易發生滑坡災害。通過統計計算,到水系的距離小于300 m的區域滑坡的密集最為集中(如附圖7所示),距離大于2 000 m的區域受河流的影響較小,滑坡發育較少。
3.1.6 道路密度 以道路密度表示人類工程活動的強度大小。道路密度越大,人類工程活動強度越大,則斜坡受人類活動的影響越大,當有不穩定的斜坡存在時,極易發生滑坡。如附圖7所示,在長江以北的中部區域,人口密集,道路密度相對較大,但缺乏滑坡孕育的基本條件,滑坡發生較少;在城區的南部區域,道路密度普遍較大,在有不穩定斜坡存在的區域,受道路建設過程中開挖土體的影響,有較多滑坡發育。

表1 滑坡災害評價因子分類及量化
將評價因子的分類子集參數用歸一化似然比值量化后,以248個滑坡單元和隨機提取的具有代表性的248個非滑坡單元的數據作為Logistic回歸模型的樣本數據,建立Logistic回歸模型,進行運算和驗證。運算結果顯示,以向前LR法(基于最大似然估計的向前逐步回歸法)作為模型的變量篩選方法時,模型效果最優,所有的因子都通過顯著性檢驗(Sig.<0.05),如表2所示。該方法下的回歸模型預測結果:對已觀測的248例滑坡單元,有195例預測正確,預測準確率為78.6%;對已觀測的248例無滑坡單元,有198例預測正確,預測準確率為79.8%,綜合準確率達到79.2%。

表2 滑坡易發性評價模型方程中的變量
設評價單元的高程、坡度、地層巖性、NDVI、與水系的距離和道路密度的歸一化似然比值分別為X1,X2,X3,X4,X5和X6,則可以寫出滑坡發生條件下的回歸模型:
(4)
該模型計算的結果即為滑坡發生的概率預測值,利用預測值與觀測值做ROC曲線,并以此為基礎判斷模型的優劣:當曲線下面積(AUC)越趨近1,效果越好,達到1時為完全理想的預測;值為0.5時為完全無效的預測;一般認為當值大于0.8時,模型可靠有效[23]。本模型的AUC為0.871,說明模型具有較高的準確性,預測結果可靠。
將通過檢驗的回歸模型公式(4)應用于整個區域,得到所有評價單元的滑坡易發性預測值,根據其大小將其分級,即可完成滑坡易發性分級分區。根據Can等[24]提出的分級原則,采用自然間斷點分級法,將宜昌市城區劃分為極低易發區、低易發區、中易發區、高易發區和極高易發區5個滑坡易發性等級區域(附圖8)。
各分區的評價單元數和滑坡單元數統計結果如表3所示。滑坡高易發區和極高易發區主要集中在中南部,雖然這些區域地形較平坦、坡度較小,但分布有較多第四系膨脹土,導致許多不穩定斜坡的發生,在人類工程活動的影響下極易發生滑坡地質災害;在北部長江沿岸和西部低山區也有零星的高易發區和極高易發區存在,這些區域地形較為陡峭、地層巖性復雜、河流切割強烈,導致許多臨空面廣泛發育,有利于滑坡的孕育;在人口密集、經濟發達的中部區域基本沒有高易發區和極高易發區存在,這些區域地形平坦,分布有密集的居民住房和商業建筑,人類工程活動強烈,很多山體邊坡都得到支護治理,缺少滑坡災害發育的條件;在山谷和長江支流沿線,受降雨和河流沖刷的影響,以及水的動力作用,有利于滑坡的發育。

表3 研究區滑坡災害易發性評價分區信息統計
(1) 根據滑坡發育的基本形成條件和影響因素,選取與滑坡發育有密切關系的高程、坡度、地層巖性、NDVI值、與水系的距離和道路密度等6個因子作為滑坡易發性評價的評價因子,建立評價指標體系,并通過Logistic回歸模型進行顯著性檢驗,結果表明評價因子的選取合理準確。
(2) 將評價因子區間劃分為對滑坡發育的影響具有顯著差別的若干分類子集,計算其似然比值,以歸一化的似然比值作為Logistic回歸模型的自變量。選取樣本數據,建立滑坡發生條件下的Logistic回歸模型,最后將通過檢驗的回歸模型應用于整個區域。回歸模型的預測準確率達到79.2%,ROC曲線下面積(AUC)達到0.871,說明模型的結果準確可靠。
(3) 通過滑坡易發性分析,極低易發區、低易發區、中易發區、高易發區和極高易發區分別占研究區總面積的32.44%,29.15%,20.53%,13.78%和4.10%,滑坡面積分別占各分區面積的3.23%,8.06%,20.16%,39.11%和29.44%,滑坡面積與分區面積的比例隨著易發性等級的增大而增大,在極高易發區達到15.08%,與歷史滑坡災害的發育情況相符。本文的滑坡易發性分區評價與歷史滑坡的發育情況相吻合,合理準確地反映了研究區內滑坡的形成條件、發育規律,揭示了滑坡發育的關鍵影響因子,對當地的滑坡災害防治防范具有一定的借鑒意義。