屈新星, 李道安, 何云玲, 余 嵐, 閆文波
(云南大學(xué) 地球科學(xué)學(xué)院, 昆明 650201)
滑坡是巖土體沿滑坡面迅速發(fā)生位移的一種過程,在巖土體變形中規(guī)模大、數(shù)量多、危害嚴(yán)重、性質(zhì)比較復(fù)雜[1]。滑坡易發(fā)性,即滑坡基于當(dāng)?shù)丨h(huán)境條件在一個(gè)地區(qū)發(fā)生滑坡的概率;易發(fā)性不考慮滑坡發(fā)生的時(shí)間或頻率,也不考慮預(yù)期滑坡發(fā)生的破壞程度[2]。構(gòu)建科學(xué)的預(yù)測(cè)模型,即依據(jù)滑坡災(zāi)害潛在區(qū)域內(nèi)各種環(huán)境要素的空間分布,預(yù)測(cè)滑坡的易發(fā)程度,可為滑坡防災(zāi)減災(zāi)提供科學(xué)的參考依據(jù)[3]。
目前國內(nèi)應(yīng)用最為廣泛的滑坡易發(fā)性評(píng)價(jià)方法主要有兩類[4]:一類是定性分析方法,主要依靠主觀經(jīng)驗(yàn)打分確定因子權(quán)重;一類是定量分析方法,通過數(shù)理統(tǒng)計(jì)建立模型。定量分析方法中的信息量模型是通過計(jì)算各個(gè)影響因素對(duì)地質(zhì)災(zāi)害發(fā)生破壞所提供的信息量貢獻(xiàn)值,作為定量分區(qū)的指標(biāo),以信息量的大小來表示各個(gè)影響因素與地質(zhì)災(zāi)害的密切程度,災(zāi)害發(fā)生的概率隨信息量值的增大而變大[5-6];這種方法逐漸成為區(qū)域地質(zhì)災(zāi)害預(yù)測(cè)評(píng)估的常用方法之一[7]。
國外學(xué)者主要是通過概率、二元統(tǒng)計(jì)模型、模糊邏輯、AHP(Analytic Hierarchy Process)模型、熵指數(shù)模型等進(jìn)行滑坡易發(fā)性研究。如:Mokarram等[8]使用了ROC(Receiver Operating Characteristic Curve)和AUC(Area Under Curve)方法對(duì)fuzzy logic(模糊邏輯)和AHP模型產(chǎn)生的滑坡易發(fā)性進(jìn)行驗(yàn)證,最終fuzzy logic模型(89.7%)在研究區(qū)域(伊朗)的表現(xiàn)優(yōu)于AHP(81.1%)模型。Akgun等[9-10]利用Logistic回歸方法建立了磁化率模型對(duì)土耳其西部滑坡易發(fā)性進(jìn)行評(píng)估;并通過似然—頻率比和加權(quán)線性組合模型評(píng)估土耳其東北部滑坡易發(fā)性。Pradhan等[11-12]采用了人工神經(jīng)網(wǎng)絡(luò)法、GIS和頻率比模型、多元回歸模型和模糊邏輯法對(duì)馬來西亞多地進(jìn)行了滑坡易發(fā)性評(píng)估。Lee等[13]對(duì)韓國龍仁山體滑坡采用了概率和邏輯回歸模型進(jìn)行研究。Pourghasemi等[14]利用GIS中的熵指數(shù)和條件概率模型進(jìn)行滑坡易發(fā)性評(píng)估,并在結(jié)果中表示熵指數(shù)(AUC=86.08%)表現(xiàn)略好于條件概率(AUC=82.75%)模型。
maxEnt(maximum Entropy)模型是一個(gè)基于最大熵原理的概率模型,即在滿足已知約束的條件下,利用目標(biāo)的存在分布點(diǎn)和環(huán)境變量,推算目標(biāo)的生態(tài)需求[15];其表現(xiàn)出較好的分辨變量相互作用能力及抽樣偏差處理能力,操作運(yùn)行簡單快捷,對(duì)樣本量要求較低(>5),建立了一個(gè)反映多個(gè)影響因子對(duì)目標(biāo)綜合影響的評(píng)價(jià)指標(biāo),即存在概率[16]。maxEnt模型和上述以往滑坡易發(fā)性研究中常用的信息量模型、熵指數(shù)模型、概率模型在理論上有一致的共同性,但是基于maxEnt模型對(duì)滑坡易發(fā)性的研究鮮有報(bào)道。因此,本研究以攀枝花市為研究區(qū)域,基于maxEnt模型原理,結(jié)合ArcGIS空間分析模塊對(duì)其滑坡易發(fā)性進(jìn)行定量預(yù)測(cè)和分析研究,以期為攀枝花市土地利用規(guī)劃和滑坡防災(zāi)減災(zāi)工作提供科學(xué)參考。
攀枝花市地處四川省西南部,地理位置為26°05′—27°21′N,101°08′—102°15′E;是川西南和滇西北區(qū)域的中心城市和交通樞紐,也是全國著名的重要礦區(qū);市轄東區(qū)、西區(qū)和仁和區(qū)、米易縣和鹽邊縣,總面積7 440 km2。全市屬南亞熱帶季風(fēng)氣候,年降雨量800~1 100 mm,夏季受高溫高濕的西南季風(fēng)影響,92%以上雨量集中于6—10月的雨季;日最低氣溫為4~8℃,日最高氣溫為19~23℃[17]。攀枝花市屬侵蝕、剝蝕中山丘陵、山原峽谷地貌,地形陡峻,強(qiáng)烈的地質(zhì)構(gòu)造活動(dòng)使巖體破碎;加之特殊的干熱河谷及旱、雨季分明的氣候環(huán)境,使巖體物理、化學(xué)風(fēng)化劇烈,由此形成崩塌堆積物和松散的坡積、殘積層穩(wěn)定性差,易形成滑坡[18-19];其滑坡數(shù)量相對(duì)較多,而且發(fā)生的頻率和成災(zāi)概率都很大[20],給該區(qū)的工農(nóng)業(yè)生產(chǎn)、交通運(yùn)輸和人民生命財(cái)產(chǎn)造成了很大的危害。
按照前文滑坡易發(fā)性的定義,結(jié)合滑坡發(fā)生主要受河流沖刷、地下水活動(dòng)、雨水浸泡、地震等自然要素,以及人工切坡等人類活動(dòng)要素的影響。經(jīng)過篩選比對(duì),最終確定高程、坡度、坡向、土地利用類型、歸一化植被指數(shù)(Normalized Difference Vegetation Index,NDVI)和人口密度6項(xiàng)因子作為攀枝花市滑坡易發(fā)性的評(píng)價(jià)指標(biāo)。
滑坡點(diǎn)數(shù)據(jù)來源于2016年、2017年的全國礦山環(huán)境遙感監(jiān)測(cè),是中國地質(zhì)調(diào)查局航空物探遙感中心項(xiàng)目下發(fā)的土地利用多源遙感數(shù)據(jù),分辨率最低為5 m×5 m、最高為1 m×1 m。圖1中的滑坡分布點(diǎn)是前期項(xiàng)目組通過室內(nèi)的遙感影像解譯,再經(jīng)過野外逐一實(shí)地調(diào)查驗(yàn)證后得到的37個(gè)點(diǎn)。高程、坡度、坡向來自于美國國防部國家測(cè)繪局公布的SRTM-DEM數(shù)據(jù)。NDVI數(shù)據(jù)來自于美國國家航空航天局NASA(National Aeronautics and Space Admini-stration)的Terra遙感衛(wèi)星的MOD13Q1數(shù)據(jù)產(chǎn)品。同時(shí)通過中國科學(xué)院資源環(huán)境科學(xué)數(shù)據(jù)中心獲取土地利用類型遙感監(jiān)測(cè)數(shù)據(jù)和人口分布數(shù)據(jù)。
將所獲取的全部數(shù)據(jù)先進(jìn)行地理坐標(biāo)系統(tǒng)和像元大小(30 m×30 m)的統(tǒng)一;然后通過ArcGIS的3D分析模塊進(jìn)行高程、坡度、坡向提取,通過ENVI 5.1軟件對(duì)NDVI進(jìn)行MVC(maximum Value Composite)最大值合成平均值[21]。最后將高程、坡度、坡向、土地利用類型、人口密度和NDVI這6個(gè)影響因子數(shù)據(jù)轉(zhuǎn)化成maxEnt 3.4.1軟件所要求的ASCII格式文件,將滑坡點(diǎn)的地理位置轉(zhuǎn)成.csv格式文件。

圖1 攀枝花市的地理位置及主要滑坡點(diǎn)分布
將滑坡地理位置和各環(huán)境特征變量數(shù)據(jù)導(dǎo)入maxEnt 3.4.1中,隨機(jī)選取65%,70%,75%,80%,85%,90%的滑坡點(diǎn)數(shù)據(jù)作為訓(xùn)練數(shù)據(jù)集用于建立模型,將剩余的滑坡點(diǎn)用于模型驗(yàn)證。為了避免偶然誤差,在模型運(yùn)行中選擇logistic為輸出形式,表示某個(gè)滑坡在整個(gè)模擬區(qū)域(攀枝花市)每個(gè)柵格上的存在概率(P),取值范圍為0~1,勾選隨機(jī)種子,其他參數(shù)不變,在預(yù)試驗(yàn)中運(yùn)行10次,目的是使模擬得到的AUC值較為穩(wěn)定(±0.001),AUC為模型自帶的受試者工作特征曲線ROC下的面積,不同的值代表模型準(zhǔn)確度級(jí)別。通過運(yùn)行模型將環(huán)境因子中貢獻(xiàn)率為0的因子剔除后,再重新輸入模型運(yùn)行10次直至沒有貢獻(xiàn)率為0的影響因子出現(xiàn)。在正式試驗(yàn)中將篩選后的影響因子再運(yùn)行10次以得到一個(gè)穩(wěn)定的預(yù)測(cè)數(shù)值。
在建立模型和運(yùn)行過程中,均采用交叉驗(yàn)證的方式進(jìn)行模型驗(yàn)證。首先,通過模型Jackknife中的AUC評(píng)價(jià)指標(biāo)對(duì)模型模擬的滑坡潛在分布點(diǎn)預(yù)測(cè)效果,這種AUC值的驗(yàn)證是以樣本點(diǎn)的形式對(duì)模型進(jìn)行驗(yàn)證。其次,通過Kappa值從整體上檢驗(yàn)?zāi)M的準(zhǔn)確度,即通過模型模擬完成后的研究區(qū)滑坡易發(fā)性預(yù)測(cè)圖與已發(fā)生的滑坡現(xiàn)狀點(diǎn)圖進(jìn)行Kappa一致性檢驗(yàn)。AUC值和Kappa值的評(píng)估標(biāo)準(zhǔn)見表1[22]。

表1 AUC值和Kappa值及其與模型準(zhǔn)確性的關(guān)系
本文采用AUC標(biāo)準(zhǔn)差來判斷模型模擬值是否穩(wěn)定,在利用maxEnt處理數(shù)據(jù)過程中,每個(gè)測(cè)試百分比數(shù)據(jù)的運(yùn)行處理都有很多次重復(fù),計(jì)算出的多個(gè)AUC值的方差計(jì)算公式為:
(1)

圖2為應(yīng)用maxEnt模型進(jìn)行攀枝花市滑坡點(diǎn)潛在地理分布模擬的特征曲線,可以看出,訓(xùn)練集AUC值為0.960,驗(yàn)證集AUC值為0.966,適用等級(jí)均達(dá)到優(yōu)秀,表明maxEnt模型能夠準(zhǔn)確地對(duì)滑坡點(diǎn)的地理分布與環(huán)境影響因子的關(guān)系進(jìn)行模擬。

圖2 攀枝花市滑坡地理分布模擬結(jié)果的ROC曲線
為了研究maxEnt模型在運(yùn)行中選取不同現(xiàn)狀分布點(diǎn)做樣本隨機(jī)訓(xùn)練比率對(duì)maxEnt模型預(yù)測(cè)擬合準(zhǔn)確度的影響,按照上文描述步驟將不同比率的AUC值采用GraphPad Prism軟件進(jìn)行均方差處理得到圖3??梢园l(fā)現(xiàn)AUC值雖然在隨機(jī)訓(xùn)練比例80%達(dá)到最大值,但是AUC的方差值顯示當(dāng)模型隨機(jī)訓(xùn)練比例75%的時(shí)候方差是最小的,表明這個(gè)時(shí)候的AUC值最穩(wěn)定,模型模擬所得到的數(shù)據(jù)最精確。因此,下文的研究結(jié)果均基于隨機(jī)選取75%訓(xùn)練數(shù)據(jù)比例作為模型運(yùn)行的基礎(chǔ)。
將模型模擬結(jié)果導(dǎo)入到ArcGIS 10.2中,轉(zhuǎn)換成浮點(diǎn)型柵格數(shù)據(jù)。根據(jù)統(tǒng)計(jì)學(xué)上小概率事件不可能發(fā)生的原理,當(dāng)p<0.1時(shí),認(rèn)為該柵格內(nèi)滑坡災(zāi)害不可能發(fā)生;當(dāng)p≥0.1時(shí),認(rèn)為該柵格內(nèi)滑坡災(zāi)害可能在此柵格發(fā)生;將滑坡概率0.1~1依次按照自然斷點(diǎn)法進(jìn)行劃分0~0.100,0.100~0.156,0.156~0.321,0.321~0.556,0.556~0.980共5段,對(duì)應(yīng)易發(fā)性中極低易發(fā)生、低易發(fā)生、中易發(fā)生、高易發(fā)生和極高易發(fā)生5個(gè)等級(jí),空間分布格局見圖4。

圖3 不同訓(xùn)練比例的AUC值及AUC方差

圖4 攀枝花市滑坡易發(fā)性等級(jí)空間分布
Kappa值為整體上檢驗(yàn)?zāi)M的準(zhǔn)確度,將模型模擬完成后的研究區(qū)滑坡易發(fā)性預(yù)測(cè)圖4中滑坡點(diǎn)的潛在地理空間分布,與已發(fā)生的滑坡現(xiàn)狀點(diǎn)圖進(jìn)行Kappa一致性檢驗(yàn),結(jié)果顯示Kappa系數(shù)為0.86,基于maxEnt模型的模型結(jié)果顯示與實(shí)際滑坡災(zāi)害點(diǎn)在空間上的分布十分吻合。從整個(gè)市域范圍來看,攀枝花市滑坡極低易發(fā)生、低易發(fā)生和中易發(fā)生的面積分別為6 381.96,311.36,380.00 km2,分別占研究區(qū)總面積的87.18%,4.25%,5.19%,高易發(fā)生和極易發(fā)生分別占總面積的2.57%,0.80%;其中高易發(fā)生和極易發(fā)生區(qū)域主要分布在人口比較密集的東區(qū)和西區(qū),部分沿著金沙江、雅礱江、巴關(guān)河、安寧河和攀枝花市主要道路兩邊而發(fā)育。此研究結(jié)果和攀枝花市人民政府在網(wǎng)上公布的部分結(jié)論和王喜娜等[20]的研究結(jié)果一致。
表2為滑坡的各影響因子的百分貢獻(xiàn)率和置換重要性,其中百分貢獻(xiàn)率是maxEnt模型在訓(xùn)練過程中給出的各影響因子對(duì)滑坡地理分布的貢獻(xiàn)程度;置換重要性是將訓(xùn)練樣點(diǎn)的影響因子隨機(jī)替換后進(jìn)行模擬得到的maxEnt模型模擬結(jié)果的AUC值減少程度,減少值越大表明模型高度依賴于該變量。由表2可知,NDVI的貢獻(xiàn)百分比和置換重要性都占絕對(duì)優(yōu)勢(shì)。

表2 不同環(huán)境影響因子的貢獻(xiàn)百分比和置換重要性 %
為進(jìn)一步分析滑坡地理分布的各個(gè)環(huán)境特征變量影響的閾值,根據(jù)maxEnt模型模擬結(jié)果得到的攀枝花市滑坡存在概率與各影響因子的關(guān)系(圖5),可以得到不同的滑坡易發(fā)性等級(jí)對(duì)應(yīng)的各影響因子的閾值(表3)。從圖5,表3可知,攀枝花市滑坡易發(fā)性在高程約1 700 m以下隨著高程增加滑坡發(fā)生概率增大,而在高程1 700 m以上則表現(xiàn)為隨著高程增加滑坡發(fā)生概率減小的變化趨勢(shì)。隨著坡度增大滑坡越易發(fā)生,坡度大于12.5°表現(xiàn)為滑坡高易發(fā)生和極高易發(fā)生區(qū)。坡向和人口密度兩個(gè)因子均表現(xiàn)為隨著環(huán)境變量的增大,滑坡存在概率先增加后減少的變化趨勢(shì);其中人口密度在110人/m2及其以上,滑坡災(zāi)害等級(jí)為高易發(fā)生,主要原因?yàn)槿丝诿芏仍酱?,周邊環(huán)境越受人類活動(dòng)的影響。陽坡比陰坡更易發(fā)生滑坡,其可能原因?yàn)殛柶陆邮艿年柟夂徒邓鄬?duì)較為充沛,巖體更易風(fēng)化,形成的松散堆積物比陰坡多?;乱装l(fā)性隨著NDVI值的增大而減小,NDVI小于0.5表現(xiàn)為滑坡高易發(fā)生區(qū);NDVI主要反映植被覆蓋狀態(tài),其值越大表明植被覆蓋度越好,表明植被覆蓋度越好,滑坡越不易發(fā)生。不同的土地利用類型對(duì)滑坡存在概率的影響表現(xiàn)不同,旱地、疏林地、其他林地、其他建設(shè)用地的易發(fā)性等級(jí)為高易發(fā)區(qū),其余為中易發(fā)區(qū)域。

注:縱坐標(biāo)存在概率取值范圍為0~1,地類代碼同表3。

表3 攀枝花市滑坡地理分布不同易發(fā)等級(jí)的影響因子閾值
maxEnt模型本質(zhì)上是生物氣候包絡(luò)模型(Bioclimatic Envelope Models,BEMs)的一種,BEMs利用具有地理參考的環(huán)境變量和物種分布信息之間的相關(guān)性推斷物種的生態(tài)需求,模擬物種的地理分布,目前已被廣泛應(yīng)用于解決保護(hù)生物學(xué)、生物地理學(xué)、生態(tài)學(xué)和分類學(xué)中的問題。本研究嘗試通過maxEnt模型建立環(huán)境影響因子與滑坡易發(fā)性的關(guān)系模型,模擬攀枝花市滑坡地理分布對(duì)影響因子的響應(yīng),同樣取得了較好的模擬效果,這種研究擴(kuò)展了BEMs的應(yīng)用范圍。
maxEnt模型的一個(gè)優(yōu)勢(shì)是可以對(duì)環(huán)境變量的重要性進(jìn)行評(píng)價(jià)。NDVI和坡度貢獻(xiàn)率最高,表明植被覆蓋和坡度是決定攀枝花市滑坡易發(fā)性分布格局最重要的因素。坡向和高程的貢獻(xiàn)率最低,表明攀枝花市滑坡對(duì)坡向和高程的波動(dòng)并不敏感。當(dāng)然,滑坡的發(fā)生還受地震、降雨等因素的影響。在大量前期已有的文獻(xiàn)使用maxEnt模型時(shí),均采用默認(rèn)參數(shù)[23],在默認(rèn)參數(shù)里隨機(jī)種子不參與模型的構(gòu)建,這樣會(huì)導(dǎo)致在不同的隨機(jī)測(cè)試比例,運(yùn)行10次的情況下,每次運(yùn)行后結(jié)果都會(huì)一致,故在構(gòu)建maxEent模型時(shí)應(yīng)盡量避免選擇所有均為默認(rèn)參數(shù)。最后,因數(shù)據(jù)獲取原因,只能解譯并實(shí)地驗(yàn)證現(xiàn)狀37個(gè)滑坡點(diǎn),雖已滿足maxEnt模型樣本量的最低需求,但在未來的研究可進(jìn)一步獲取更多的樣本點(diǎn)以更精確地模擬滑坡易發(fā)點(diǎn)。
在研究中發(fā)現(xiàn)攀枝花市的滑坡沿河谷集中分布;市內(nèi)的金沙江、安寧河河谷兩岸滑坡集中分布,形成滑坡分布密集帶。除地層構(gòu)造原因之外還發(fā)育著第四紀(jì)形成的沖、洪積層組成的各級(jí)階地,松散的沖、洪積層力學(xué)強(qiáng)度低,穩(wěn)定性差,易形成滑坡。另外,滑坡與人類工程活動(dòng)關(guān)系密切,易形成滑坡分布密集帶。其余零星散落的滑坡主要是因一些自然原因,如攀枝花市為特殊的干熱河谷及旱、雨分明的氣候環(huán)境,且雨季大多暴雨;老滑坡蠕動(dòng)的影響;巖體中的破碎帶或組合結(jié)構(gòu)面等原因。
(1) maxEnt模型在研究區(qū)滑坡易發(fā)性方面適用性等級(jí)為優(yōu)秀(AUC=0.96),Kappa系數(shù)為0.86,以37個(gè)滑坡點(diǎn)為樣本數(shù)據(jù),隨機(jī)選取75%(28個(gè))用于訓(xùn)練模型,其余25%(9個(gè))用于驗(yàn)證模型,得到的AUC值最穩(wěn)定且精度最高,模型預(yù)測(cè)可信度最高。
(2) 高易發(fā)生和極易發(fā)生區(qū)分別占研究區(qū)總面積的2.57%,0.80%,主要分布在人口比較密集的東部和西部地區(qū),部分沿著金沙江、雅礱江、巴關(guān)河、安寧河和攀枝花市主要道路兩側(cè)而發(fā)育。
(3) 滑坡易發(fā)性的影響因素中,植被覆蓋和坡度是決定研究區(qū)滑坡易發(fā)性空間分布格局最重要的地理環(huán)境因子;NDVI小于0.5,坡度大于12.5°的地區(qū)表現(xiàn)為滑坡高易發(fā)生區(qū)和極高易發(fā)生區(qū)。