張帆宇,劉高,諶文武,沈云霞,韓文峰
(1.蘭州大學 西部災害與環境力學教育部重點實驗室,甘肅 蘭州,730000;2.蘭州大學 土木工程與力學學院,甘肅 蘭州,730000)
滑坡已成為山區環境中最具破壞的自然災害之一[1]。在多山地區,區域尺度的滑坡敏感性評價對緩減災害、管理風險和規劃土地很有意義[2?3]。滑坡敏感性評價可分為定性和定量方法[1?2]。定性方法依賴專家主觀經驗對滑坡危害的定性描述,存在很大的主觀性,且缺乏可重復性[1?3];定量方法可采用物理模型和數學模型進行分析。物理模型通常指斜坡穩定性分析模式的確定性模型,盡管被認為是最好的斜坡災害評價方法,但需要單個斜坡或研究區詳細的巖土參數[4],結果受數據的影響較大,只適合小范圍和單個的災害評估[1];數學模型常包括自由分布方法和統計分析方法。自由分布方法不依賴于數據分布假設,而是根據基于某一準則或算法對數據進行分析和智能學習,被認為是一種高度客觀、有效的方法[1],如神經網絡、模糊數學等,但這類方法需要大量高質量的數據和復雜的數據轉換。統計分析方法建立在滑坡和影響要素的分布規律上,主要包括二元分析和多變量分析,已被廣泛用于復雜的區域和中等尺度的滑坡敏感評價[1,2,5?6],盡管二元統計具有很強的穩定性和靈活性,但數據選擇和要素等級劃分的差異能夠較大地影響輸出結果[7]。多變量分析分為判別式和統計式模型,更適合大區域復雜環境下的敏感性評價[2],但要求收集大量可靠的數據和對區域環境的理解[1]。可見,每種方法都不是完美的,為保證評價質量,必須根據研究區特征和評價目的選擇合適的評價方法。滑坡是受時空變化的內、外要素綜合作用的結果,因此,深入和準確理解滑坡分布與空間要素的關系,不但是滑坡敏感性評價的前提[1,5],而且能提高制圖的質量和效率,降低制圖成本[1]。在當前敏感性評價中,受滑坡過程本身復雜性[8?9]和要素非孤立性[1,5]的影響,準確辨別和理解滑坡分布和要素、影響要素間的相互關系很難[1,5,7];同時,在滑坡敏感性評價中,由于要素的選擇也缺少統一的標準和依據[5],成為滑坡敏感性制圖的主要限制[9]。滑坡敏感性評價對于影響要素的選擇、分級和分析模式還沒有一套完全可重復和共同接受的方法,特別是影響要素之間的相互依存,導致影響要素選擇重疊造成評價結果出現偏差或預測精度低,目前尚無有效的解決辦法。為此,本文作者選用“5.12”四川地震中影響較嚴重的隴南震區白龍江流域為研究區,基于影響要素和滑坡空間分布的定性分析確定評價要素,利用統計模式的邏輯回歸模型(LR)繪制滑坡易發性地圖;然后,以判別模式的主成分分析分析法(PCA)分析要素間各自的獨立性和重要程度,解決要素相互依存的共線性問題,再使用邏輯回歸模型,利用反映滑坡空間分布關系的主要要素繪制滑坡易發性地圖;最后利用成功率曲線下方的面積(AUC)和累積面積曲線的下方的累積面積(ACA)對2種評價結果的正確性進行對比檢驗,并對要素選擇和檢驗結果進行分析,以期建立一套合理、可靠且有效的區域尺度的滑坡敏感性評價模式,準確獲得研究區將來的滑坡易發區域,為震后重建、基礎設施建設和土地規劃提供參考。
研究區位于西秦嶺造山帶隴南地區,沿我國南北地震帶展布,在青藏高原東北緣構造帶的作用下,地質構造復雜,發育多條區域性斷裂,且局部小型斷裂和褶皺分布廣泛,新構造運動和地震活動頻繁;地層巖性以千枚巖、砂巖、灰巖、泥巖等變質巖以及第三系紅層軟巖和第四紀的堆積物為主,受構造影響,巖層破碎和風化作用強烈;白龍江及其支流貫穿整個區域,兩岸地形海拔高度范圍為840~3 176 m,相對高差為1 000~1 500 m,表現為明顯的高山峽谷地貌特征[10]。研究區距震中汶川地震最近距離僅200 km,是四川震中地區外受地震影響最嚴重的區域。研究區是連接我國東南(蘭州至海口高速公路)和西南(蘭州至重慶高速鐵路)的重要交通要道,更是我國滑坡災害最發育的地區之一,但是,目前仍然缺乏經濟發展規劃必需的滑坡災害易發性分區地圖,特別是針對該地區分布廣泛的大型歷史滑坡的危險等級評價較少。
任何滑坡敏感性評價都是從滑坡分布資料收集開始的[2,5]。由于可根據不同的目的、資源和方法繪制各種尺度的滑坡分布圖,因此,基于敏感性評價目的和有用資源繪制合理的分布圖是必需的。
在野外和數據處理過程中發現各種規模和類型的滑坡。盡管地震和震后降雨誘發了部分崩塌和小規模滑動,由于研究區處于復雜的地質地貌和活躍的構造山區環境,區內大量存在的大型深層歷史滑坡構成了滑坡災害的主要潛在威脅。汶川地震后,對該區的現場調查發現,除個別歷史滑坡有整體滑動外,歷史上多數已有的大型深層滑坡沒有明顯的滑動和位移產生,但存在地震影響局部的崩塌和滑動,一些滑坡還出現了新的裂縫。可見:地震加劇了大型滑坡對區內的潛在威脅。因此,根據研究區的滑坡類型和威脅特征,以大型滑坡敏感性評價為目的,通過室內解譯公路沿線航空照片和公路兩側的遙感圖片,然后利用比例尺為1:5萬的地形圖在野外進行補充和校核,獲得大型歷史滑坡分布圖,見圖1。

圖1 研究區的滑坡分布圖Fig.1 Inventory map of landslide in the study area
滑坡災害是受控和依賴于大量復雜的自然和人類環境要素,而各種要素往往有著相互關聯的因果關系。對于歷史的大型深層滑坡,將來的發展趨勢可能受到內外要素的綜合作用的影響,但主要受到地層、構造和地貌等內部要素的控制。另外,在當前的滑坡敏感性評價中,盡管降雨和地震等外部觸發要素也被選作評價要素,但這些觸發要素在時空上變換明顯[1],在時間上很不穩定,如何影響區域滑坡分布很難明確[11],導致在滑坡敏感性評價中很難被合理使用[1]。由于滑坡災害預測模型是建立在將來的滑坡發生在導致過去和當前失穩的假設條件下的[1,3,9],在當前的滑坡敏感性評價中,建議使用內在要素作為評價要素繪制研究區的滑坡易發性區域[1?3,5,7?9]。
基于滑坡的地質環境、演化和滑動類型,以及滑坡分布和各種影響要素的相互關系分析發現:區內的地層巖性、地質構造、地貌特征、水文地質條件和土地類型是影響和控制大型深層滑坡發生的主要要素,其他要素的影響較小,或者在整個區域范圍內表現不明顯,因此,整理和數字化已有圖件和資料,建立影響要素的基礎數據很有必要。
2.2.1 地層巖性
地層巖性在滑坡失穩中是一個很重要的因素,滑坡現象通常與構成它的材料結構和強度密切相關。由于研究區跨越多個結構和性質差異明顯的地層,因此,根據地層巖性的性質、結構和質量相似的地層組合成厚層的礫巖、砂礫巖巖組(A),中厚層灰巖、板巖巖組(B),砂卵、礫石巖組(C),千枚巖、板巖、薄層灰巖巖組(D),粉砂巖、泥巖、薄層砂礫巖巖組(E)共 5類地層巖性組合。
2.2.2 地質構造
在斷裂帶影響范圍內,滑坡發生的規模和活動頻率要比斷裂帶外的大很多,這在構造活躍的山區環境中普遍存在[8]。根據滑坡分布和斷層展布的關系,將區內斷裂帶按500 m間距建立了4個等距的緩沖區和1個超過2 000 m的緩沖區,即將斷裂帶分成5個不同的影響區。
2.2.3 地形地貌要素
地形地貌是影響滑坡穩定的重要條件。坡向與土壤濕度、植被蓋度和降雨路徑等有關,從而影響斜坡穩定[8]。坡度和高度也是影響斜坡穩定的重要條件[2,5,8]。在特定區域內,滑坡的坡度和坡高分布都具有一定的規律,通常是在一定范圍內,隨著坡度和高度的增加有增強的趨勢,但當增加到一定程度后,滑坡會明顯減少。在研究區,滑坡主要分布在高度2 500 m以下 20°~40°的斜坡范圍內。已有研究表明:滑坡分布與地形地貌要素等級的關系服從一定的統計分布規律[4?5]。在這個前提下,根據坡度和坡向與滑坡分布關系的現場統計結果[9?11],分別將坡度分為 0°~10°,10°~20°,20°~30°,30°~40°,>40°共 5 個等級,坡向分為Flat(?1°),N(315°~360°),E(45°~135°),S(135°~ 225°)和W(225°~315°)5類;而坡高基于滑坡剪出口與侵蝕基準面現場統計的關系[12]分為840~1 000,1 000~1 400,1 400~1 700,1 700~2 000和2 000~3 176共5級。
2.2.4 河流
河流侵蝕作用嚴重影響滑坡的穩定狀態,主要通過破壞斜坡坡腳和水位變化改變整個或者局部斜坡的應力狀態,從而導致整體或局部失穩。根據區內河流對斜坡的影響范圍和滑坡分布的關系,建立河流對斜坡影響的緩沖帶,分為 0~150,150~300,300~600,600~1 000,1 000~1 500和1 500~2 000 m共6級。
2.2.5 土地利用類型
土地利用類型也是影響滑坡發生的一個關鍵條件,滑坡發生頻率與土地類型密切相關[2]。因為土地利用在很大程度上反映了人類對土地的使用情況,也間接反映了在不同土地類型上斜坡的穩定情況和發展趨勢[8]。根據土地利用特點和滑坡分布關系,將其分為耕地(A)、林地(B)、草地(C)、城鄉工礦居民用地(D)、水域(E)和基巖(F)6類。
午后的太陽偶爾也會唱著火辣辣的歌曲,不減夏日勢頭地炙烤著大地,但這些絲毫不影響我們做運動。同學們似乎變得比平時更認真,個個頭頂著烈日,隨著激昂的音樂做起了廣播體操。倘若來一場秋雨,同學們就會聚集在室內體育館活動。瞧!那幾位女同學還在跳高難度的長繩呢!還有幾位生龍活虎的男同學正在進行如火如荼的羽毛球比賽。這一切,讓秋日的校園增添了勃勃生機!
LR模型是一種常見的統計式多變量分析方法。
LR模型能夠描述一個二元因變量和多個自變量的函數關系,同時自變量可以不服從正態分布,可以是連續的或離散的,也可以是兩者的組合[8],因為它的這些優點已被廣泛用于滑坡的敏感性評價[1,5?6,8]。LR模型將因變量轉成發生(記為 1)和不發生(記為 0)的二元邏輯變量,然后,利用最大似然估計法計算事件發生的概率[9]。LR模型可以描述為:

為了利用LR模型評價滑坡的敏感性,滑坡樣本(記為 1)和非滑坡樣本(記為 0)按 1:2的比例從研究區中隨機抽取建立模型的樣本集;為了測試預測模型的可靠性,隨機樣本集以1:4的比例分成訓練集和測試集;隨后,隨機樣本集被輸入到LR算法中,利用LR模型計算各自變量的系數作為評價滑坡影響要素相應的重要性。最終的Logistic回歸函數的系數表達式為:

依據LR評價結果,基于正態分布原則,研究區的滑坡敏感性被分成很高、高、中等、低和很低共 5級,見圖2。

圖2 初始方案下的滑坡危險等級分布圖Fig.2 Landslide susceptibility levels map generated by LR in original scenario
盡管基于專家經驗判別分析確定的評價要素能在一定程度上正確反映滑坡分布和要素的空間關系,由于受專家個人對問題認識和經驗程度的不同,主觀性較大,特別是在大區域尺度的研究,受區域地質地貌特征空間分布差異和多樣性的影響,完全正確選擇控制整個區域滑坡空間分布的要素,消除所選擇要素之間相互重疊和依存(共線性)的問題,保證要素之間的獨立性是很難的,也是不可避免的。
在本研究中,選擇主成分分析法(PCA)去解決評價要素之間的多元共線性問題。PCA是一種判別式的多變量分析方法,旨在利用降維的思想,用較少的變量去解釋原數據中大部分變量,將原數據中相關性很高的變量轉換成彼此相互獨立或者不相關的變量[13]。為了確定區域上影響和控制著滑坡發生和分布的空間要素,PCA執行的結果表明(表1):前4種影響要素占了所有要素的78.812%。根據PCA使用變異數百分比確定自變量的標準,只要選擇的要素不少于所有要素的50%或者更多就被認為是合理的原則[12],因此,坡度、高程、地層巖性和河流被作為研究區新的滑坡敏感性評價方案。

表1 要素的特征值和變異數Table 1 Eigenvalues and variables of various factors %
為了評價新方案的滑坡敏感性,新的影響要素以及滑坡的隨機樣本集被輸入到Logistic回歸算法中,經計算獲得坡度、高程、地層和河流作為影響滑坡重要程度的系數:

依據LR評價結果,新方案的滑坡敏感性地圖基于正態分布的原則被分為很高、高、中等、低和很低共5級,見圖3。

圖3 新方案下的滑坡危險等級分布圖Fig.3 Landslide susceptibility levels map generated by LR in new scenario
滑坡敏感性地圖的有效性和性能評價是滑坡敏感性評價的重要步驟。一張好的滑坡敏感性地圖必須滿足實際的滑坡盡可能多地位于高敏感性等級中,以及高的敏感性等級覆蓋盡可能小的面積這2個標準[13]。成功率曲線和面積累積曲線被用于驗證和比較LR模型執行的2種方案的差異。在滑坡敏感性結果性能評價中,成功率曲線對于描述模型評價預測的結果是一種有用的方法[7],但該方法只能驗證評價標準中的第一標準。因此,建議采用面積累積曲線驗證評價標準中的第2個標準。
基于2種方案的LR評價結果,將滑坡敏感性等級由高到低等分成數級。對于成功率曲線,利用不同等級下的滑坡面積和實際面積在整個滑坡敏感性地圖的比例關系,繪制并計算曲線下方的面積(AUC)。AUC越大,說明預測精度越高,除了可以評價模型的執行性能外,還主要用于評價模型的預測精度;而累積面積曲線僅需利用不同敏感性等級數(或不同敏感性值)與不同等級下的實際面積在整個滑坡敏感性地圖中的累積比例關系繪制,并可獲得曲線下方的累積面積(ACA)。ACA越小,說明評價性能越好,主要用于分析模型結果整體性能的優越性。
成功率曲線和累積面積曲線見圖4。從圖4可以看出:在2種方案下的滑坡敏感性地圖中,50%左右的實際滑坡具有20%的高滑坡敏感性區,而高的滑坡敏感性區域在整個評價區域中占的范圍都較小。根據滑坡敏感性結果的評價標準[14],說明LR模型執行的2種方案的滑坡敏感性評價結果都是可靠的。

圖4 兩種方案的成功率曲線和累積面積曲線Fig.4 Success rates curve and cumulative area curve of two scenarios
從成功率曲線和累積面積曲線計算的 AUC和ACA可以發現(圖4):LR模型在2種方案下的AUC分別為0.71和0.73,說明這2種方案的對實際滑坡的預測性能基本相同;但ACA分別為0.37和0.26,差別較大,可見由PCA確定的新方案的滑坡敏感性地圖整體性能和預測精度更高。基于滑坡敏感性地圖的 2種評價標準,從2種評價曲線本身也可以發現:由PCA確定的新方案的敏感性評價結果其性能和精度都比初始方案的高。從累積面積曲線可以看出:高滑坡敏感性性等級在研究區中只占有極小的范圍,說明新方案的整體性能更加優越。
(1)在區域尺度的滑坡敏感性評價中,確定控制和影響滑坡區域空間分布的影響要素很難,專家經驗能指導空間要素的選擇和確定,但是,很難保證選擇的要素不相互重疊以及選擇要素的獨立性,難以避免評價要素的共線性問題。
(2)盡管 LR模型中包括了假設檢驗和逐步回歸等選擇主控要素的方法,但在相同要素下,不同方法確定的主控要素有一定差異,說明LR模型沒有能力完全保證要素的獨立性。這可能與LR模型不同的方法有關,也有可能與區域尺度滑坡敏感性評價的要素相互影響的復雜性有關。因此,在區域尺度的滑坡敏感性評價等復雜問題上,為確保選擇要素的獨立性,避免模型評價中的共線性問題,PCA是一種優越的方法。PCA分析法不但能夠很好地避免共線性問題,確定獨立的評價要素,而且可以降低評價的維度,減小計算量。
(3)LR模型執行的2種方案的滑坡敏感性評價結果都是可靠的,但是,由PCA確定的新方案具有更好的預測精度和整體性能。成功率曲線及其 AUC的評價方法能夠很好地反映實際的滑坡在滑坡敏感性等級中的預測結果,但是,不能很好地評價敏感性等級在整個研究區中的分布。本文建議的累積面積曲線和ACA評價方法彌補了這個不足。累積面積曲線還需更多的研究區驗證其實用性。因此,將這2種評價曲線相結合能夠很好地評價不同模型的滑坡敏感性執行結果的預測精度和整體性能。
(4)由于LR執行的PCA確定的新方案的滑坡敏感性地圖具有更高的精度和和更好的性能,因此,建議研究區中的震后重建、基礎設施建設和土地規劃可以參考由新方案繪制的滑坡敏感性地圖。
[1]Aleotti P,Chowdhury R.Landslide hazard assessment:Summary review and new perspectives[J].Bulletin of Engineering Geology and the Environment,1999,58(1):21?44.
[2]Saha A K,Gupta R P,Sarkar I,et al.An approach for GIS-based statistical landslide susceptibility zonation:With a case study in the Himalayas[J].Landslides,2005,2(1):61?69.
[3]Fell R,Corominas J,Bonnard C,et al.Guidelines for landslide susceptibility,hazard and risk zoning for land-use planning[J].Engineering Geology,2008,102(3/4):99?111.
[4]Baeza C,Corominas J.Assessment of shallow landslide susceptibility by means of multivariate statistical techniques[J].Earth Surface Processes and Landforms,2001,26(12):1251?1263.
[5]Ayalew L,Yamagishi H,Marui H,et al.Landslides in Sado Island of Japan:Part Ⅱ.GIS-based susceptibility mapping with comparisons of results from two methods and verifications[J].Engineering Geology,2005,81(4):432?445.
[6]王衛東,陳燕平,鐘晟.應用CF和Logistic回歸模型編制滑坡危險等級區劃圖[J].中南大學學報:自然科學版,2009,40(4):1127?1133.WANG Wei-dong,CHEN Yan-ping,ZHONG Sheng.Landslides susceptibility mapped with CF and logistic regression model[J].Journal of Central South University:Science and Technology,2009,40(4):1127?1133.
[7]van Westen C J,Rengers N,Soeters R.Use of geomorphological information in indirect landslide susceptibility assessment[J].Natural Hazards,2003,30(3):399?419.
[8]Dai F C,Lee C F.Landslide characteristics and slope instability modeling using GIS,Lantau Island,Hong Kong[J].Geomorphology,2002,42(3/4):213?228.
[9]Carrara A,Guzzetti F,Cardinali M,et al.Use of GIS technology in the prediction and monitoring of landslide hazard[J].Natural Hazards,1999,20(2/3):117?135.
[10]張帆宇,劉高.國道 212線福津河段滑坡發育特征及成因分析[J].地質災害與環境保護,2005,16(2):130?134.ZHANG Fan-yu,LIU Gao.Characteristics and mechanism of lanslsides along the Fujin river section on the national Haiway G212[J].Journal of Geological Hazards and Environment Preservation,2005,16(2):130?134.
[11]Glade T,Crozier M J.The nature of landslide hazard impact[M].Wiley,Chichester:Landslide Hazard and Risk,2005:43?74.
[12]諶文武,趙志福,劉高,等.蘭州—海口高速公路甘肅段工程地質問題研究[M].蘭州:蘭州大學出版社,2006:70?73.CHEN Wen-wu,ZHAO Zhi-fu,LIU Gao,et al.Geoengineering question in Gansu province of the highwar form Lanzhou to Haikou[M].Lanzhou:Lanzhou University Press,2006:70?73.
[13]Harlow L L.The Essence of multivariate thinking:Basic themes and methods[M].London:Lawrence Erlbaum Associates,2005:199?207.
[14]Can T,Nefeslioglu H A,Gokceoglu C,et al.Susceptibility assessments of shallow earthflows triggered by heavy rainfall at three catchments by logistic regression analyses[J].Geomorphology,2005,72(1/2/3/4):250?271.