李宇新, 鄧念東, 郭鵬程, 張富榮, 郭亞雷
(1.西安煤航遙感信息有限公司, 西安 710199; 2.中國(guó)煤炭地質(zhì)總局航測(cè)遙感局, 西安 710199;3.西安科技大學(xué)地質(zhì)與環(huán)境學(xué)院, 西安 710054)
地質(zhì)環(huán)境系統(tǒng)是人類生產(chǎn)、生活賴以生存的基礎(chǔ)載體。隨著對(duì)地質(zhì)環(huán)境研究的不斷加深,人們認(rèn)識(shí)到地質(zhì)環(huán)境系統(tǒng)抵抗人為破壞具有一定的承載限度,所能承受人類改造作用的極限即為“地質(zhì)環(huán)境承載力”[1]。
21世紀(jì)初,隨著可持續(xù)發(fā)展理念深入人心,地質(zhì)環(huán)境承載力內(nèi)容與內(nèi)涵不斷延伸,逐漸演變?yōu)椤叭丝?資源-環(huán)境-經(jīng)濟(jì)-社會(huì)”為一體的綜合研究。彭立等[2]分析了汶川地震重災(zāi)區(qū)10個(gè)縣域資源環(huán)境的變化趨勢(shì),確定了與資源環(huán)境承載力相適應(yīng)的人口空間布局。姚治華等[3]從資源、環(huán)境、調(diào)節(jié)和社會(huì)經(jīng)濟(jì)4個(gè)方面建立評(píng)價(jià)指標(biāo)體系,采用基于熵值—層級(jí)分析法的集對(duì)分析模型對(duì)大慶市地質(zhì)環(huán)境承載力進(jìn)行評(píng)價(jià),對(duì)承載狀態(tài)變化趨勢(shì)提出改善策略。倪忠云[4]以西藏曲水-桑日地區(qū)為研究對(duì)象,基于生態(tài)地質(zhì)環(huán)境空間分布和時(shí)間尺度兩個(gè)角度,對(duì)氣象、植被、土地利用等進(jìn)行單因素分析,最終得出該地區(qū)生態(tài)地質(zhì)環(huán)境承載力等級(jí)區(qū)劃。李得立等[5]引入基于決策樹的機(jī)器學(xué)習(xí)算法,對(duì)眉山市彭山區(qū)進(jìn)行區(qū)域地質(zhì)環(huán)境承載力評(píng)價(jià),實(shí)現(xiàn)了評(píng)價(jià)方法的高效化和智能化。王念秦等[6]對(duì)驪山鎮(zhèn)1980—2015年地質(zhì)環(huán)境承載力進(jìn)行動(dòng)態(tài)評(píng)價(jià),進(jìn)一步分析總結(jié)地質(zhì)環(huán)境承載力變化規(guī)律與趨勢(shì)。謝正團(tuán)[7]針對(duì)白龍江流域地質(zhì)災(zāi)害高發(fā)區(qū),選取地質(zhì)災(zāi)害風(fēng)險(xiǎn)性和生態(tài)環(huán)境承載兩個(gè)角度,采用模糊邏輯理論和層次分析法進(jìn)行了地質(zhì)環(huán)境承載力評(píng)價(jià),創(chuàng)新性地利用時(shí)序干涉合成孔徑雷達(dá)(Interferometric synthetic aperture radar, InSAR)的地表變形對(duì)評(píng)價(jià)結(jié)果驗(yàn)證。孫魁等[8]將保水采煤理念與地質(zhì)環(huán)境承載力研究有機(jī)結(jié)合,提出了基于保水采煤的地質(zhì)環(huán)境承載力的內(nèi)涵與評(píng)價(jià)思路,為生態(tài)脆弱區(qū)煤炭開采和水資源保護(hù)提供理論支持。李仁偉[9]分別從滑坡易發(fā)性、水土質(zhì)量評(píng)價(jià)和地質(zhì)遺跡保護(hù)3個(gè)方面,基于GIS采用綜合評(píng)價(jià)模型分析了神木市地質(zhì)環(huán)境承載力。支澤民等[10]通過隨機(jī)森林模型確定權(quán)重,對(duì)川藏鐵路沿線縣域開展地質(zhì)環(huán)境承載力評(píng)價(jià)。
2019年9月,黃河流域生態(tài)環(huán)境保護(hù)與高質(zhì)量發(fā)展上升為重大國(guó)家戰(zhàn)略。府谷縣地處黃河流域中上游、黃土高原為主的水土保持區(qū),生態(tài)地質(zhì)環(huán)境脆弱,礦產(chǎn)資源豐富。近20年來,隨著府谷縣城鎮(zhèn)基礎(chǔ)設(shè)施建設(shè),能源化工基地建設(shè)以及礦產(chǎn)資源的深度開采,在帶動(dòng)社會(huì)經(jīng)濟(jì)高速發(fā)展的同時(shí),致使原本脆弱的地質(zhì)環(huán)境進(jìn)一步惡化,滑坡、崩塌、泥石流、地面塌陷等地質(zhì)災(zāi)害問題突出,誘發(fā)植被景觀破壞、水土流失、土壤鹽堿化等一系列環(huán)境問題[11]。如今,這些地質(zhì)環(huán)境問題已經(jīng)嚴(yán)重制約黃河流域生態(tài)環(huán)境保護(hù)和城鎮(zhèn)化高質(zhì)量發(fā)展,威脅當(dāng)?shù)厝嗣裆詈蜕a(chǎn)的健康安全[12],亟需開展區(qū)域性地質(zhì)環(huán)境承載力專題與綜合評(píng)價(jià),服務(wù)于國(guó)土空間開發(fā)適宜性評(píng)價(jià),以指導(dǎo)城鎮(zhèn)防災(zāi)減災(zāi)和生態(tài)安全建設(shè)[13]。
其中,機(jī)器學(xué)習(xí)方法憑借高效、智能的數(shù)據(jù)處理能力,廣受地質(zhì)環(huán)境評(píng)價(jià)等空間預(yù)測(cè)領(lǐng)域研究學(xué)者的青睞。機(jī)器學(xué)習(xí)監(jiān)督學(xué)習(xí)方法主要通過已知標(biāo)簽樣本進(jìn)行學(xué)習(xí)訓(xùn)練,從而達(dá)到較高準(zhǔn)確率的預(yù)測(cè)效果。而地質(zhì)環(huán)境承載力評(píng)價(jià)的目標(biāo)策略是求解未知標(biāo)簽的學(xué)習(xí)過程,因此引入半監(jiān)督學(xué)習(xí)模型,通過無監(jiān)督學(xué)習(xí)和有監(jiān)督學(xué)習(xí)模型組合形式進(jìn)行地質(zhì)環(huán)境承載力評(píng)價(jià),并進(jìn)一步分析影響因素與承載力潛在聯(lián)系,為黃土高原生態(tài)環(huán)境脆弱區(qū)地質(zhì)環(huán)境承載力評(píng)價(jià)提供參考。
主成分分析(principal component analysis,PCA)是常見的降維算法之一,在數(shù)據(jù)噪音和冗余等領(lǐng)域具有廣泛的應(yīng)用,其本質(zhì)是提煉原始數(shù)據(jù)中部分重要成分,通過特征值分解,有利于計(jì)算和反映原始數(shù)據(jù)的空間關(guān)系特征[14]。主要原理具體如下。
(1)構(gòu)建評(píng)價(jià)指標(biāo)相關(guān)系數(shù)矩陣R。
(1)
(2)

(2)計(jì)算方差百分比Pi與累積方差百分比Ai。
|λi-R|=0
(3)
(4)
(5)
(6)
式中:λi為R矩陣的特征值;uij為特征向量的分量;m為主成分?jǐn)?shù)。
(3)計(jì)算主成分載荷Zij與各因子權(quán)重T。
(7)
(8)
式(8)中:Sm為各因子主成分載荷與方差百分比乘積和。
(9)
反向傳播(back propagation,BP)神經(jīng)網(wǎng)絡(luò)是人工神經(jīng)網(wǎng)絡(luò)中的一種類型,該方法主要解決多層神經(jīng)網(wǎng)絡(luò)的學(xué)習(xí)問題,因此極大地促進(jìn)神經(jīng)網(wǎng)絡(luò)的發(fā)展,被廣泛應(yīng)用于分類識(shí)別、回歸預(yù)測(cè)等領(lǐng)域[15]。它屬于有監(jiān)督學(xué)習(xí)模型,基本思想為梯度下降法,主要可分為信息的前向傳播和誤差的反向傳播兩個(gè)步驟。BP神經(jīng)網(wǎng)絡(luò)由輸入層、隱含層和輸出層構(gòu)成,層與層之間進(jìn)行全連接,而同一層之間的神經(jīng)元節(jié)點(diǎn)無連接(圖1),其基本原理如下。
隱含層第i個(gè)神經(jīng)元的輸入和輸出可分別表示為
(10)
(11)

輸出層第j個(gè)神經(jīng)元的輸入和輸出分別表示為
(12)
(13)
式(13)中:g(·)為線性函數(shù)。
輸出層每個(gè)神經(jīng)元的誤差和總誤差分別表示為
(14)
(15)
(2)接著,根據(jù)最速下降法計(jì)算誤差為ωij的梯度[式(16)]與權(quán)值修正值[式(17)]
(16)
(17)
式中:g′(·)為修正后線性函數(shù);Δωij為權(quán)值修正值;η為修正系數(shù)。
(3)同理,根據(jù)誤差信號(hào)反向傳播來調(diào)整輸入層與隱含層之間的權(quán)值ωmi。
(18)
Δω=ηδv
(19)

府谷縣位于陜西省最北部,地處秦、晉、蒙三省交界。地理坐標(biāo)介于38°42′28″N~39°33′44″N,110°25′40″E~111°15′36″E,總面積約為3 229 km2。研究區(qū)屬于中溫帶干旱大陸性季風(fēng)氣候,溫差較大,四季分明,氣候多變。降雨在空間分布上由西北向東南逐漸增大。月降雨量分布不均,主要集中在7—9月,占全年降雨量的69%。研究區(qū)水系發(fā)育,河流交錯(cuò),主要有黃甫川、孤山川、清水川等,均為黃河支流。
研究區(qū)整體位于向西傾斜的單斜構(gòu)造,新構(gòu)造運(yùn)動(dòng)主要表現(xiàn)為震蕩性上升,形成西北高、東南低的地勢(shì)。西部地勢(shì)相對(duì)平坦,主要為風(fēng)蝕作用形成的剝蝕地貌;而東部溝壑縱橫,以河流切割的侵蝕地貌為主。出露地層由老到新為奧陶系、石炭系、二疊系、三疊系、侏羅系、新近系和第四系。按照含水介質(zhì)與富水條件不同,水文地質(zhì)類型劃分為松散巖類孔隙水、基巖裂隙水和碳酸鹽巖類巖溶裂隙水三類。植被類型主要?jiǎng)澐譃楣鄥差悺⒉菰悺⑨樔~林和栽培植被。
研究區(qū)人類工程活動(dòng)劇烈,主要表現(xiàn)為礦產(chǎn)資源開發(fā)利用、道路工程建設(shè)、城鎮(zhèn)化建設(shè)等,對(duì)原本脆弱的生態(tài)環(huán)境加劇了擾動(dòng)。根據(jù)現(xiàn)場(chǎng)調(diào)查,研究區(qū)共有地質(zhì)災(zāi)害185處,其中崩塌140處、滑坡29處、地面塌陷8處以及泥石流8處,各行政區(qū)劃地災(zāi)數(shù)量與密度統(tǒng)計(jì)如圖2所示。

圖2 各鄉(xiāng)鎮(zhèn)地質(zhì)災(zāi)害密度統(tǒng)計(jì)Fig.2 Geological hazard density statistics of each town
評(píng)價(jià)單元指區(qū)域地質(zhì)環(huán)境評(píng)價(jià)中信息構(gòu)成的基礎(chǔ)單元,它具有內(nèi)部屬性一致、不可分割的特點(diǎn)[16]。由于地質(zhì)環(huán)境承載力評(píng)價(jià)尚屬探索挖掘階段,關(guān)于該領(lǐng)域的評(píng)價(jià)單元未進(jìn)行詳細(xì)對(duì)比與確定。然而,關(guān)于地質(zhì)環(huán)境評(píng)價(jià)的相關(guān)研究值得借鑒,尤其是地質(zhì)災(zāi)害易發(fā)性、風(fēng)險(xiǎn)性評(píng)價(jià),常見的評(píng)價(jià)單元包括行政單元、柵格單元、斜坡單元和流域單元[17]。
斜坡單元是流域單元更細(xì)小的劃分,而斜坡單元又由柵格基礎(chǔ)單元組成。由于斜坡單元、流域單元具有操作繁瑣、更適用于地形分析的局限性,而地質(zhì)環(huán)境承載力內(nèi)容涉及地形地貌、社會(huì)經(jīng)濟(jì)等多個(gè)方面,數(shù)據(jù)類型復(fù)雜,屬性信息量龐大,因此選擇柵格單元作為評(píng)價(jià)基礎(chǔ)單元。結(jié)合數(shù)據(jù)源地質(zhì)圖1∶50 000比例尺,依據(jù)經(jīng)驗(yàn)公式計(jì)算對(duì)應(yīng)柵格單元大小,計(jì)算公式為
G=7.49+0.000 6S-2.01×10-9S2+
2.91×10-15S3
(20)
式(20)中:S為比例尺分母,即50 000;G約為30 m。
最終選擇30 m×30 m柵格單元作為地質(zhì)環(huán)境承載力評(píng)價(jià)單元。
結(jié)合研究區(qū)地質(zhì)環(huán)境背景與地質(zhì)環(huán)境承載力內(nèi)涵范疇,從自然地理、生態(tài)環(huán)境、礦產(chǎn)資源、災(zāi)害地質(zhì)和社會(huì)經(jīng)濟(jì)5個(gè)子系統(tǒng)共選取17類影響因素(圖3),部分專題圖如圖4所示。

圖3 地質(zhì)環(huán)境承載力評(píng)價(jià)體系Fig.3 Evaluation system of geological environment carrying capacity

圖4 主要影響因子專題圖Fig.4 Thematic map of major impact factors
圖4中,①地表切割深度、坡度、曲率因子數(shù)據(jù)通過30 m分辨率數(shù)字高程模型(digital elevation model, DEM)分析提取;②通過矢量化研究區(qū)1∶50 000地質(zhì)圖得到地形地貌、地質(zhì)構(gòu)造和地層巖性類因子圖層;③通過Landsat 8 OLI_TIRS衛(wèi)星數(shù)字產(chǎn)品提取歸一化植被指數(shù)(normalized difference vegetation index,NDVI)數(shù)據(jù);④通過1∶50 000地質(zhì)災(zāi)害風(fēng)險(xiǎn)調(diào)查評(píng)價(jià)獲得各地質(zhì)災(zāi)害易發(fā)性數(shù)據(jù);⑤資源儲(chǔ)量通過搜集各礦區(qū)儲(chǔ)量年報(bào)、采掘工程平面圖資料來計(jì)算。
上述影響因素具有“三不同”的特點(diǎn),即領(lǐng)域不同、來源不同、量綱不同,屬于多源異構(gòu)數(shù)據(jù)。因此,構(gòu)建綜合評(píng)價(jià)體系首先需要對(duì)原始數(shù)據(jù)進(jìn)行預(yù)處理。原始數(shù)據(jù)可分為連續(xù)性數(shù)據(jù)和離散型數(shù)據(jù)。通常對(duì)連續(xù)性數(shù)據(jù)采用標(biāo)準(zhǔn)化來消除量綱、取值范圍差異的影響[18]。一方面,由于各類影響因素中與地質(zhì)環(huán)境承載力既有正相關(guān)的因素,如NDVI、距水系距離、資源可利用量占比等,也存在負(fù)相關(guān)的因素,如地表切割深度、坡度、地質(zhì)災(zāi)害易發(fā)性等;另一方面,各項(xiàng)因素內(nèi)部原始值分布較穩(wěn)定,因此選擇極差法公式式(21)、式(22)進(jìn)行標(biāo)準(zhǔn)化,在將區(qū)間映射到[0,1]的同時(shí),更能表達(dá)影響因素與地質(zhì)環(huán)境承載力之間的正負(fù)關(guān)系。
(21)
(22)
式中:x′為影響因子標(biāo)準(zhǔn)化值;xmax和xmin分別為影響因子最大值和最小值。
將影響因素標(biāo)準(zhǔn)化后的結(jié)果進(jìn)行整合,進(jìn)行多重共線性檢驗(yàn)。方差膨脹因子(variance inflation factor,VIF)和容差(tolerance,TOL)互為倒數(shù),是多重共線性的常見檢驗(yàn)指標(biāo)[19]。一般認(rèn)為,當(dāng)VIF≥10或TOL≤0.1時(shí),說明數(shù)據(jù)存在嚴(yán)重的共線性,不利用構(gòu)建模型進(jìn)行分析。結(jié)果如表1所示,17類影響因子間多重共線性較弱,無需再對(duì)因子屬性進(jìn)行剔除。最終,研究區(qū)數(shù)據(jù)屬性庫規(guī)格確定為3 553 256×17。

表1 影響因素多重共線性Table 1 Multicollinearity of influencing factors
一方面,評(píng)價(jià)模型的確定需要考慮研究對(duì)象與實(shí)際數(shù)據(jù)之間的適用性;另一方面,可以通過模型融合來彌補(bǔ)方法自身的缺陷,起到對(duì)結(jié)果優(yōu)化的作用,常見的模型融合比,如主客觀組合賦權(quán)、機(jī)器學(xué)習(xí)的集成學(xué)習(xí)模型等[20-21]。
由于樣本數(shù)據(jù)量龐大,因子空間特征維度較高,而機(jī)器學(xué)習(xí)模型在處理這類數(shù)據(jù)時(shí)具有高效的辨識(shí)度,為避免主觀賦權(quán)方法對(duì)評(píng)價(jià)結(jié)果的不利影響,引入數(shù)據(jù)挖掘半監(jiān)督學(xué)習(xí)模型進(jìn)行綜合評(píng)價(jià)。所謂半監(jiān)督學(xué)習(xí)模型,指的是無監(jiān)督學(xué)習(xí)模型對(duì)樣本數(shù)據(jù)首先進(jìn)行初步評(píng)價(jià),在其結(jié)果篩選新樣本進(jìn)行有監(jiān)督學(xué)習(xí)模型的構(gòu)建[22]。首先通過PCA模型進(jìn)行客觀賦權(quán),為盡量避免由于忽略含有較重要信息、方差小的主成分造成的影響,再通過BP神經(jīng)網(wǎng)絡(luò)對(duì)綜合指數(shù)疊加的結(jié)果進(jìn)行回歸預(yù)測(cè)。
通過IBM SPSS Statistics 25軟件的因子分析功能進(jìn)行主成分分析。樣本數(shù)據(jù)檢驗(yàn)結(jié)果顯示,凱撒·梅爾·奧爾金(Kaiser-Meyer-Olkin-Measure of Sampling Adequacy, KMO)值為0.564(>0.5),Bartlett顯著性P為0(<0.5),達(dá)到了顯著水平,表明該數(shù)據(jù)適用于主成分分析。通過式(1)~式(6)計(jì)算得到特征值λi、方差百分比Pi和累計(jì)方差百分比Ai(表2)。按照累計(jì)方差百分比達(dá)到80%,提取X1~X11主成分代表原有17個(gè)因子變量,分別根據(jù)式(7)~式(9)計(jì)算得到主成分載荷矩陣Zij和各因子權(quán)重值T。通過在ArcGIS中綜合指數(shù)法疊加,計(jì)算每一個(gè)評(píng)價(jià)單元的權(quán)重乘積和,得到初始地質(zhì)環(huán)境承載力評(píng)價(jià)結(jié)果(圖5)。

表2 總方差解釋Table 2 Total variance interpretation
通過成分矩陣統(tǒng)計(jì),絕對(duì)值大于0.5的影響因素作為該成分的主要貢獻(xiàn)因子,而譬如地表切割深度和距道路距離2個(gè)因子并沒有在任一主成分中具有較大貢獻(xiàn)值,這就可能因特征值分解造成部分因子對(duì)結(jié)果貢獻(xiàn)的缺失[23]。因此,基于PCA疊加的初步評(píng)價(jià)結(jié)果,通過隨機(jī)選擇樣本將目標(biāo)求解轉(zhuǎn)化為回歸預(yù)測(cè)。
依托Rapid Miner Studio軟件來建立BP神經(jīng)網(wǎng)絡(luò)模型,該平臺(tái)的數(shù)據(jù)挖掘任務(wù)涉及廣泛,過程從嵌套的算子中產(chǎn)生,最終表示為流程設(shè)計(jì),界面簡(jiǎn)潔,具有運(yùn)行高效、可視化強(qiáng)的特點(diǎn)[24-25],模型構(gòu)建結(jié)構(gòu)可視化如圖6所示。

inp為輸入;out為輸出;Optimize Parameters為優(yōu)化參數(shù);tra為訓(xùn)練;mod為模型;exa為示例集輸入、輸出;ori為默認(rèn)輸出值;ave為輸出性能矢量;unl為預(yù)測(cè)數(shù)據(jù)輸入端口;par為參數(shù)設(shè)置;thr:輸出端口;lab為添加預(yù)測(cè)屬性;fil為寫入CSV文件;per為最優(yōu)性能矢量;res為目標(biāo)端口的結(jié)果
首先,對(duì)研究區(qū)隨機(jī)提取的樣本數(shù)據(jù)進(jìn)行標(biāo)簽化,將基于PCA模型的初始評(píng)價(jià)結(jié)果作為目標(biāo)值,按照7∶3將樣本數(shù)據(jù)進(jìn)行分割,采用十倍交叉驗(yàn)證得到評(píng)價(jià)性能指標(biāo)。通過進(jìn)化算法對(duì)BP神經(jīng)網(wǎng)絡(luò)進(jìn)行參數(shù)尋優(yōu)(圖6步驟①~④),最優(yōu)參數(shù)如表3所示。通過BP神經(jīng)網(wǎng)絡(luò)訓(xùn)練學(xué)習(xí)(圖6步驟⑤~⑧),隱含層的權(quán)值計(jì)算結(jié)果如表4所示。輸出層權(quán)值為{0.916,-0.369,0.409,-0.949,-0.348,0.445,0.021}。

表3 BP神經(jīng)網(wǎng)絡(luò)主要參數(shù)

表4 隱含層權(quán)值Table 4 Weight of hidden layer
其中,隱含層數(shù)通常依靠包含輸入層和輸出層的經(jīng)驗(yàn)公式來確定;訓(xùn)練周期代表模型將誤差反饋、調(diào)整權(quán)值過程的重復(fù)次數(shù);學(xué)習(xí)率表示每一次權(quán)值改變的大小;動(dòng)量是指將歷史權(quán)值更新的一部分添加至當(dāng)前權(quán)重,來有效避免局部極大值并平滑優(yōu)化方向;終止誤差代表模型達(dá)到該目標(biāo)后停止訓(xùn)練;隨機(jī)種子是指使用局部隨機(jī)種子進(jìn)行隨機(jī)化,來確定初始權(quán)值。
最終對(duì)研究區(qū)數(shù)據(jù)進(jìn)行回歸預(yù)測(cè),將結(jié)果輸出和存儲(chǔ)在格式為.csv文件中,導(dǎo)入ArcGIS Pro中生成地質(zhì)環(huán)境承載力指數(shù)(geological environment carrying capacity index,GECCI),如圖7所示。

圖7 基于BP神經(jīng)網(wǎng)絡(luò)地質(zhì)環(huán)境承載力指數(shù)Fig.7 Geological environment carrying capacity index based on BP neural network
本文半監(jiān)督學(xué)習(xí)評(píng)價(jià)思路是在無監(jiān)督學(xué)習(xí)模型PCA基礎(chǔ)上,建立有監(jiān)督學(xué)習(xí)模型BP神經(jīng)網(wǎng)絡(luò)進(jìn)行的。換言之,是通過有監(jiān)督學(xué)習(xí)模型對(duì)無監(jiān)督學(xué)習(xí)模型初步評(píng)價(jià)結(jié)果的修正與調(diào)整,來彌補(bǔ)無監(jiān)督學(xué)習(xí)在降維過程中對(duì)部分影響因素的“忽視”,來提高數(shù)據(jù)挖掘模型對(duì)地質(zhì)環(huán)境承載力的識(shí)別性。通過性能度量(表5)和結(jié)果描述統(tǒng)計(jì)(表6),研究發(fā)現(xiàn):①半監(jiān)督學(xué)習(xí)模型7項(xiàng)誤差指標(biāo)檢驗(yàn)值較小,表明該模型預(yù)測(cè)精度較高;②GECCI值較無監(jiān)督學(xué)習(xí)模型相比,均值和中值均發(fā)生降低,而標(biāo)準(zhǔn)差提高,證明數(shù)據(jù)分布離散程度更高,并且GECCI降低的區(qū)域主要分布在小于均值的區(qū)域,說明半監(jiān)督學(xué)習(xí)模型PCA-BP神經(jīng)網(wǎng)絡(luò)提高了地質(zhì)環(huán)境承載力評(píng)價(jià)的敏感性,半監(jiān)督學(xué)習(xí)模型對(duì)評(píng)價(jià)結(jié)果的預(yù)測(cè)、修正符合實(shí)際。

表5 模型性能度量指標(biāo)

表6 評(píng)價(jià)結(jié)果描述統(tǒng)計(jì)Table 6 Descriptive statistics of evaluation results
目前,GECCI的定義主要為相對(duì)值而非絕對(duì)值,因此劃分等級(jí)應(yīng)側(cè)重于體現(xiàn)組間性質(zhì)的差異。自然間斷法以方差作為衡量分類的標(biāo)準(zhǔn),充分體現(xiàn)不同分組數(shù)據(jù)之間的差異性,更適合進(jìn)行地質(zhì)環(huán)境承載力區(qū)劃[9,26]。在ArcGIS Pro中對(duì)上述GECCI結(jié)果進(jìn)行區(qū)劃,從低到高劃分為5個(gè)承載力等級(jí)區(qū)域(圖8),在空間分布上呈現(xiàn)出西北部高、中東部低的特點(diǎn)。
(1)地質(zhì)環(huán)境承載力低區(qū)在全區(qū)呈條狀分布,面積約為309.87 km2,占研究區(qū)總面積的9.69%。中部以孤山川、石馬川、新城川為主的河谷地區(qū),地勢(shì)陡峭,巖土體破碎,地質(zhì)災(zāi)害極易發(fā)育,該區(qū)域也是采礦活動(dòng)密集地帶;東部以府谷縣城區(qū)為主,人口密度最為集中,地表破壞強(qiáng)烈,導(dǎo)致沿黃公路一線均為低承載力區(qū);北部呈段狀,零散分布在清水川、石峽溝一帶;西部以大昌汗溝和大板兔川溝谷區(qū)為主,局部由采煤活動(dòng)造成。
(2)地質(zhì)環(huán)境承載力較低區(qū)呈現(xiàn)條塊狀,面積約708.32 km2,占總面積的22.15%。全區(qū)分布位置與承載力低區(qū)近似,為低區(qū)的外圍延伸地帶,在東北部分布集中,由于道路工程密集,在清水鎮(zhèn)、黃甫鎮(zhèn)呈片狀分布。
(3)地質(zhì)環(huán)境承載力中等區(qū)分布最廣,面積約1 024.60 km2,占總面積的32.04%。主要分布在東北、西南兩側(cè),東北部地質(zhì)災(zāi)害發(fā)育較少,降雨條件相對(duì)充沛,植被覆蓋程度較高;西南側(cè)地勢(shì)較為平緩,煤炭資源儲(chǔ)量豐富,人口分布較少,受斷層影響小。
(4)地質(zhì)環(huán)境承載力較高區(qū)面積約796.02 km2,占總面積的24.90%。在中部、北部及西部承載力高區(qū)外圍地帶呈團(tuán)狀分布,多為境內(nèi)河流上游支溝的溝頂區(qū)域,植被發(fā)育條件較好;在南部黃土梁頂亦集中分布,幾乎無地質(zhì)災(zāi)害分布。
(5)地質(zhì)環(huán)境承載力高區(qū)以塊狀集中分布,面積約358.57 km2,占總面積的11.21%。主要分布在中部木瓜鎮(zhèn)、孤山鎮(zhèn)的平坦地區(qū),受溝谷切割影響小,無地質(zhì)災(zāi)害發(fā)生;侏羅紀(jì)、石炭——二疊紀(jì)煤炭資源埋藏區(qū)的承載力水平高;在北部哈鎮(zhèn)、古城鎮(zhèn)的邊界地帶,承載力高區(qū)亦集中分布,該區(qū)域?qū)υ嫉刭|(zhì)環(huán)境影響較輕。
地質(zhì)環(huán)境承載力涉及環(huán)境、資源、社會(huì)等多學(xué)科系統(tǒng),評(píng)價(jià)體系涵蓋面廣,內(nèi)容龐雜。如何量化影響因素對(duì)地質(zhì)環(huán)境承載力的作用程度,是識(shí)別地質(zhì)環(huán)境承載力主控因素的重要步驟,亦是對(duì)同類地質(zhì)環(huán)境背景地區(qū)的承載力評(píng)價(jià)體系結(jié)構(gòu)的優(yōu)化。
利用PCA-BP神經(jīng)網(wǎng)絡(luò)的地質(zhì)環(huán)境承載力評(píng)價(jià)結(jié)果,結(jié)合上述影響因素與承載力的正負(fù)作用關(guān)系,將影響因素取值范圍劃分為5個(gè)等級(jí),分別賦值1~5對(duì)應(yīng)承載力由低到高。在Model Simulator界面動(dòng)態(tài)提升某影響因素等級(jí)(圖9),對(duì)應(yīng)統(tǒng)計(jì)GECCI的增量百分比,來反映該等級(jí)下某影響因素對(duì)地質(zhì)環(huán)境承載力的作用程度(圖10)。

Input for Model為模型輸入因子;Prediction為預(yù)測(cè)結(jié)果;Supports Prediction為支持預(yù)測(cè)程度;Contradicts Prediction為反對(duì)預(yù)測(cè)程度;CSI為地面塌陷易發(fā)性;DFSI為泥石流易發(fā)性;DT_ratio為采深采厚比;D_faults為距斷層距離;D_rivers為距河流距離;D_roads為距道路距離;LSI為滑坡崩塌易發(fā)性;NDVI為植被歸一化指數(shù);P_density為人口密度;resource為資源可利用量占比;Important Fators for Prediction為影響因子預(yù)測(cè)的重要性
通過圖10可以看出,部分影響因子在不同等級(jí)模擬中,對(duì)GECCI的影響程度差異較大;而另一部分因子對(duì)GECCI的作用相對(duì)不明顯。主要規(guī)律如下。
(1)單因素承載力為低時(shí),災(zāi)害地質(zhì)條件是限制地質(zhì)環(huán)境承載力的決定性因素,如崩塌滑坡易發(fā)性、地面塌陷易發(fā)性以及泥石流易發(fā)性的承載力提升時(shí),分別引起GECCI提升3.89%、5.48%和2.69%。而隨著單因素承載力的上升,災(zāi)害地質(zhì)條件對(duì)GEECI的總體約束能力逐級(jí)降低,如在單因素承載力較高至高變化時(shí),這3個(gè)影響因素分別導(dǎo)致GECCI提升2.98%、2.44%和2.98%。人口密度、距水系距離、土地利用類型以及坡度同樣表現(xiàn)出上述規(guī)律,即承載力低等級(jí)對(duì)GECCI的作用程度大于承載力高等級(jí)。
(2)與之相反的是GDP密度、資源可利用量占比和距道路距離三類因子,在承載力等級(jí)為低時(shí),對(duì)GEECI的影響分別為0.51%、0.17%和1.29%;而在高承載力下作用程度分別提升至8.55%、8.49%和3.52%,社會(huì)經(jīng)濟(jì)條件和礦產(chǎn)資源條件成為對(duì)地質(zhì)環(huán)境承載力作用最顯著的影響因子。
(3)其余7類影響因子,包括地表切割深度、采深采厚比、距斷層距離、NDVI、地層巖性、曲率以及年均降雨量,對(duì)GECCI的作用程度相對(duì)較輕,介于0.17%~1.05%之間,并且在不同單因素承載力等級(jí)下,沒有顯示出較強(qiáng)的變化規(guī)律。
在上述影響因子作用規(guī)律的基礎(chǔ)上,最終通過Explain Predictions算子得出各影響因子的全局權(quán)重(圖11)。

圖11 地質(zhì)環(huán)境承載力綜合影響權(quán)重Fig.11 Comprehensive influence weight of geological environment carrying capacity
可以看出,研究區(qū)地質(zhì)環(huán)境承載力主要影響因素為崩塌滑坡易發(fā)性、地面塌陷易發(fā)性、GDP密度、泥石流易發(fā)性、資源可利用量占比、距水系距離以及人口密度,相對(duì)重要性分別占12.59%、11.13%、10.11%、10.09%、9.71%、9.30%以及8.19%。這7類影響因素累積重要性占比超過70%,在黃土高原水土保持區(qū)的后續(xù)相關(guān)研究中,可直接作為影響因素構(gòu)建評(píng)價(jià)體系。
(1)半監(jiān)督學(xué)習(xí)模型訓(xùn)練與驗(yàn)證結(jié)果表明,半監(jiān)督學(xué)習(xí)模型PCA-BP神經(jīng)網(wǎng)絡(luò)進(jìn)行地質(zhì)環(huán)境承載力評(píng)價(jià)預(yù)測(cè)精度較高,較無監(jiān)督學(xué)習(xí)模型相比,提高了對(duì)地質(zhì)環(huán)境承載力評(píng)價(jià)的敏感性。
(2)府谷縣地質(zhì)環(huán)境承載力空間分布上呈現(xiàn)出西北部高、中東部低的特點(diǎn)。等級(jí)劃分為高承載力區(qū)、較高承載力區(qū)、中等承載力區(qū)、較低承載力區(qū)和低承載力區(qū),分別占總面積的11.21%、24.90%、32.04%、22.15%以及9.69%。
(3)影響因素作用分析結(jié)果表明,地質(zhì)環(huán)境低承載力區(qū)主要受地質(zhì)災(zāi)害控制;而地質(zhì)環(huán)境高承載力區(qū)主要社會(huì)經(jīng)濟(jì)和礦產(chǎn)資源條件決定。
影響因素全局作用為評(píng)價(jià)體系的優(yōu)化提供依據(jù)。結(jié)果表明崩塌滑坡易發(fā)性、地面塌陷易發(fā)性、GDP密度、泥石流易發(fā)性、資源可利用量占比、距水系距離以及人口密度共7項(xiàng)影響因素可優(yōu)先用于黃土高原水土保持區(qū)地質(zhì)環(huán)境承載力研究。