關鍵詞:滑坡易發性;邏輯回歸模型;影響因子;黃河上游段中圖分類號:X43;TV882.1 文獻標志碼:A doi:10.3969/j.issn.1000-1379.2025.07.006引用格式:,,,等.基于邏輯回歸模型的黃河上游段滑坡易發性分析[J].人民黃河,2025,47(7):35-39
Analysis of Landslide Susceptibility in the Upper Reaches of the Yellow River Based on Logistic Regression Model
ZHANG Huarui1, YU Bo2 , XU Peng1, ZENG Feixiangl (1.Guiyang Engineering Corporation Limited,Power China,Guiyang 55Oo81,China; 2.Hydropower and Water Resources Planning amp; Design General Institute,Power China,Beijing 1Oo12O,China)
Abstract:ForthelandslidedsasterinthesetionfromChada VillgetoSongbaVillageintheuppereachesofteYelowRivralogistic regresiomodlwasstablishdtoonductasysteaticalisofitssuseptibilitasdoeasisoftedsaster-pregntio ment,eightinfluencingfactors,includingNormalizedDferenceVegetationIndex(NDVI),DigitalElevationModel(DE),slope, aspect,precipiatio,emperatueoundtemperaturendBAS-SARtseriessurfacedfoatiodatawereselectedtoldadicatorsystemfndslidusceptibilitalysisubeqentlytnaylstceionodelsutldteleioatitie relationshipsbetweenteseifluencngfactorsadthoccurenceoflandslides.Inodertofurterrefineteresearch,spatialcosistency processing was peformedonlocal influencingfactors,and 362 landslidegrid points,covering atotal areaof aproximately 2.855km2 were established.Teessonitsdgessatiosforchifuengfactoetnetedyusigtelistic regresionmodelinalltheoccurenceprobabilityoflandslideazadsinthestudyareawasderivdbyusingteprobabilistciplicit function.Basedonteultsbtaindfroelgsticgresionodel,esatialdisrbutionpsoflandslidesseptbilitinthe studyareawerisussdItifondathigskresarealyoncentratdinegosithsteeeinoegeatioo harsh meteorological conditions.
Keywords:landslidesusceptibility;logistic susceptibilitymode;influencingfactors;upper reachesontheYelowRiver
0 引言
滑坡作為一種具有重大破壞性的自然災害,在全球范圍內廣泛分布,對人類生命財產安全構成嚴重威脅[]。特別是在地質構造復雜、氣候條件多變的地區,滑坡災害的頻發性和嚴重性尤為突出。黃河上游查達村至松巴村段地處青藏高原邊緣地帶,地質構造復雜,且受青藏高原構造運動影響顯著,滑坡等地質災害頻發,給當地居民生產生活和生態安全帶來了巨大挑戰[2]。近年來,遙感技術、地理信息系統(GIS)以及統計分析方法不斷發展,逐漸成為滑坡災害易發性研究與防控的重要手段[3-4]。災害敏感性分析的方法主要包括邏輯回歸模型、模糊層次分析法、決策樹、判別分析法、貝葉斯統計模型法、神經網絡模型法等。其中,邏輯回歸模型簡單、直觀、易于解釋,能夠處理二分類問題,并且可以通過引入正則化方法來防止過擬合。此外,邏輯回歸模型的輸出其有概率意義,便于進行風險評估和決策。相比于其他復雜模型,邏輯回歸在計算效率和模型解釋性方面具有明顯優勢,尤其適用于中小規模數據集,被廣泛應用于滑坡易發性評估。
目前,關于滑坡敏感性的研究已經取得了顯著進展。國內外學者通過不同方法和技術手段,對滑坡的形成機制、影響因素及空間分布特征進行了深入研究。在滑坡易發性分析方面,除了邏輯回歸模型外,還有支持向量機、隨機森林、神經網絡等多種機器學習模型被應用于此領域[5-6]。然而,不同模型在不同地區、不同數據集上的表現存在差異,且各模型的優缺點及適用性也各不相同[7]
本研究針對黃河上游段滑坡易發性分析的需求,綜合考慮研究區地質環境條件以及滑坡發育特征選取8個影響因子,構建基于邏輯回歸模型的滑坡易發性分析指標體系。通過系統分析各影響因子與滑坡發生之間的定量關系,揭示黃河上游段滑坡易發性的空間分布規律,以期為區域滑坡災害的科學防控提供理論支持和實踐指導。
1研究區概況與數據來源
1.1 研究區概況
研究區為青海省黃河上游查達村至松巴村區間,地理坐標為東經 101°28′52′′-101°40′8′′ ,北緯 36°2′ 56′′-36°16′12′′ ,東西跨距 20.37km ,南北跨距23.91km ,總面積 487.05km2 。研究區位于較高海拔地區,其氣候類型為寒冷的干旱和半干旱氣候,年降水量小,且分布不均,受西南季風影響,降水在夏季稍多,易造成滑坡等災害。該區位于青藏高原邊緣地帶,地質構造復雜,受青藏高原構造運動影響,屬于高原山區隆起帶,地殼活動瀕繁,又處于地震活躍帶,地質運動較為活躍。研究區地層主要由古老的變質巖系和沉積巖系組成,尤以石英巖、片麻巖等變質巖為主。這里地勢陡峭,王壤松散,在降水集中和極端天氣條件下存在滑坡等地質災害風險。
1.2 數據來源
選取89幅Sentinel-1衛星影像作為SBAS-InSAR的形變監測數據,C波段的單視復數影像時間跨度為2021年1月3日至2024年1月12日,衛星重返周期為12d,極化方式VV,成像模式 IW 。通過計算干涉圖序列、軌道誤差修正和大氣校正等方法獲取研究區年均形變速率;將空間分辨率為 30m 的Shuttle RadarTopographyMission(SRTM)數字高程模型作為外部DEM數據,利用DEM反演得到坡度、坡向數據;利用LandSat-8影像的第四、五波段數據計算得到歸一化植被指數(NDVI);氣溫、地溫和降水量數據來源于國家青藏高原科學數據中心網站第三極地區長序列高分辨率地面氣象要素驅動數據集。
2 研究方法
二元邏輯回歸模型是一種用于解決二分類問題的統計方法。其核心思想是通過線性回歸模型預測事件發生的概率,并利用邏輯函數(Sigmoid函數)將線性結果映射到[0,1]區間,從而得到事件發生的概率值。模型通過最大似然估計法擬合數據,確定自變量的系數,這些系數可以直觀解釋自變量對事件發生概率的影響。二元邏輯回歸模型簡單高效,輸出結果具有概率意義,便于進行風險評估和決策,廣泛應用于醫學、金融、市場營銷等領域。然而,它對非線性關系的擬合能力有限,且對數據中的多重共線性和異常值較為敏感,需在建模前進行適當的數據預處理
該模型中,易發性分析是衡量模型對輸人特征變化反應程度的重要方法,通常通過多種指標和手段進行評估。其中,易發性系數是關鍵考量之一,反映了模型系數對各輸入特征的貢獻程度。通過觀察模型系數的變化,可以直觀評估模型對不同特征的敏感性。若某特征對應的系數變化較大,則表明模型對該特征較為敏感。在評估二元邏輯回歸模型整體性能時,本研究引入相關性矩陣方法和拔靴法作為重要評估手段。相關性矩陣能夠提供諸多關鍵指標,如顯著性、偏差值和置信區間。同時引入模型系數Coxamp;Snell R2 和Nagelkerke R2 驗證,用于評價易發性分析結果。易發性系數是指在實際正例樣本中被正確預測為正例的比例,能夠有效衡量模型對正例的識別能力。
在二元邏輯回歸中,模型的輸出是一個概率值(0~1) ,表示樣本屬于正例的概率,通常使用Logistic函數將線性組合轉換為概率。
假設有一個具有 n 個特征的樣本 X=(X1,X2,… Xn ),則邏輯回歸模型的權值函數為
Z=B0+β1X1+β2X2+…+βnXn
邏輯回歸模型的概率隱函數為
根據式(1)式(2)可得邏輯回歸模型的概率函 數為
式中: P(Y=1∣X) 為給定輸入 X 條件下變量 Y 等于1的概率, e 為自然對數的底, β0,β1,β2,…,βn 為模型的環境系數權重參數。
在訓練階段,二元邏輯回歸使用最大似然估計方法學習參數,使得模型對觀測數據的似然性最大化,最終的模型可以用于對新的輸入數據進行分類,模型的輸出結果為0\~1,其中0代表發生滑坡的概率為0,1代表發生滑坡的概率為 100% 。
3滑坡影響因子選取與易發性分析
3.1 影響因子選取
在黃河上游地區,滑坡的發生受局地自然環境復雜性影響顯著,在選取滑坡易發性影響因子時,需要從滑坡形成的背景條件、自然環境特征、氣象水文因素以及地表變化等多方面進行綜合考量,以確保分析的全面性。同時,因子的選擇需充分結合研究區滑坡的實際發展特征與數據可獲取性,并確保所選因子間的相互獨立性與科學客觀性,從而提高災害易發性研究的可靠性。
通過對研究區滑坡發生原因的深人分析,結合區域綜合環境的變化特點,分析滑坡孕災環境,為滑坡災害的預防提供科學依據。孕災環境的分析以自然環境為核心,主要關注滑坡的形成機制、分布規律、地形地貌特征以及氣象水文條件。結合黃河上游地區的自然環境特征,本研究選取歸一化植被指數(NDVI)、高程、坡度、坡向、降水量、氣溫、地溫及SBAS-InSAR時序地表形變等8個影響因子,見圖1。基于上述因子,結合二元邏輯回歸模型研究進一步探討各因子與滑坡發生之間的定量關系,旨在揭示黃河上游滑坡易發性的空間分布規律,并為區域滑坡災害的科學防控提供理論支持。
3.2 易發性分析
為進一步研究滑坡的分布特征,對局地影響因子進行空間一致化處理,選取12處滑坡,利用重采樣空間格網分辨率方法構建 30m×30m 的滑坡樣本點362個,總面積約為 2.855km2 。采用柵格提取法將8個影響因子屬性值賦予滑坡樣本點,并利用二元邏輯回歸模型確定每個影響因子的回歸系數,進而確定回歸方程,最后通過概率隱函數得出研究區滑坡災害的發生概率。通過拔靴法列舉相關性矩陣來計算各因子之間的關聯性,相關系數矩陣見表1。
在二元邏輯回歸模型中,相關系數值域為(-1\~1),正負代表數據之間的關聯性,值的大小代表數據之間的關聯程度。通過回歸計算模型確定滑坡影響因子系數與模型參數,見表2。
在評價二元邏輯回歸指標過程中,主要對 Sig、Coxamp;Snell R2 和Nagelkerke R2 進行評價。Sig值表示邏輯回歸函數的差異顯著性水平,由表2可知,有2個影響因子差異不顯著,分別是地表形變和高程,其余6個
因子差異極顯著。Coxamp;Snell R2 和Nagelkerke R2 與線 性回歸模型中的 R2 解釋結果相似,即該值越大表示模
型的擬合優化程度越高。該模型中Coxamp;Snell R2 值為0.600,大于0.5,說明擬合程度符合預期;Nagelkerke R2 值為0.799,接近0.8,說明擬合效果良好。該模型對樣本驗證總體正確百分比達到 88.3% ,說明該模型適用于滑坡易發性評估。
把擬合的各個參數代入式(3)計算邏輯回歸概率,其公式為
式中: z=NDVI×4.406+ 降水量 ×16.141+ 氣溫 × 6.531+ 坡向 ×0.003+ 坡度 ×0.033+ 地溫 ×1.661+ 地表形變 × 0.003+ 159.967 。
結合二元邏輯回歸的結果,對各影響因子數據重采樣柵格數據獲取 30m×30m 格網大小的等距離點風險概率,取值范圍為0\~1,即該區域滑坡災害易發性程度,越接近1,易發性越大;越接近0,易發性越低。最后,結合自然斷點法對邏輯回歸模型計算出的滑坡易發性進行重分類,根據歸一化滑坡易發性系數值越大滑坡越易發生的原理,將研究區按照模型計算結果分為低風險區(0\~0.2)、中低風險區[0.2\~0.4)、中風險區 [0.4~0.6) 、中高風險區[0.6\~0.8)、高風險區 [0.8~ 1]5個分區,系數值為0認為是非風險區。根據表2可知,對滑坡影響較大的因子為降水量、NDVI、氣溫和地溫。如圖1所示,降水量、NDVI、氣溫和地溫在帶狀風險區域均呈現相同的變化趨勢。具體而言,頻繁且大量的降水事件導致土壤含水量增加,進而引起土壤飽和度上升,這直接削弱了土壤的抗剪強度,增大了滑坡發生的可能性。此外,氣溫與地溫的劇烈波動對巖石層穩定性造成了顯著影響,促進了巖石的風化及凍王層的解凍,進一步加劇了地質結構的不穩定性,提升了滑坡風險;NDVI作為衡量植被覆蓋程度的重要指標,在研究中也顯示出其變化對土壤穩定性具有重要影響。植被覆蓋不足或退化區域往往伴隨著較低的NDVI值,這種狀況不僅減少了植被根系對土壤的加固作用,而且減弱了土壤的抗蝕性,從而間接提高了滑坡的發生概率。圖2為研究區滑坡易發性風險分區,將研究區各風險分區面積占比與滑坡面積在各風險區占比進行統計,見表3。可知,風險區域以低風險和高風險為主體,滑坡面積與易發性存在正相關關系,且滑坡多發生在高風險區,符合滑坡普遍分布規律,與實際情況相符,驗證了模型結果的可靠性。
4結論
1)在邏輯回歸模型中,各影響因子的顯著性通過Sig值進行衡量。結果顯示,降水量、氣溫、NDVI、坡度、坡向和地溫等6個因子對滑坡易發性的影響差異極顯著( Siglt;0.01 ),而高程和形變因子的影響差異不顯著。這表明在黃河上游段,滑坡的發生與氣象條件(如降水量和氣溫)、植被覆蓋情況(NDVI)、地形特征(坡度和坡向)以及地表溫度密切相關。
2)基于邏輯回歸模型的結果,對研究區的滑坡易發性進行了空間分布規律的探討。通過重采樣柵格數據獲取等距離點的風險概率,并結合自然斷點法對易發性進行了重分類。結果顯示,滑坡易發性在空間上呈現明顯差異,高風險區域主要集中在降水變化速率大、氣溫和地溫極差大、植被覆蓋較差的地區。這些地區應作為滑坡災害防控的重點區域。
3)根據邏輯回歸模型計算出的滑坡易發性系數值,將研究區劃分為低風險、中低風險、中風險、中高風險和高風險5個分區。統計結果顯示,風險區域以低風險和高風險為主體,而滑坡多發生在高風險區。
參考文獻:
[1]李文彥,胡帥軍,張帆宇.蘭州大沙溝流域山洪與泥石流易發性比較分析[J].人民黃河,2021,43(5):61-66.
[2] 王闖,戴長雷,宋成杰.青藏高原氣候變化的時空分布特征分析[J].人民黃河,2022,44(9):76-82.
[3] 劉志平,張建,閆曉勉.基于ArcGIS的崩塌滑坡地質災害易發性評價:以準格爾旗為例[J].山西師范大學學報(自然科學版),2024,38(4):80-85.
[4] 李洪波.基于遙感與GIS技術的西藏阿里高海拔地區滑坡易發性綜合評價研究[J].華北自然資源,2024(6:119-123,127.
[5] 潘網生,蔚秀蓮,趙所毅.機器學習模型在滑坡易發性評價中的應用現狀與發展趨勢[J].軟件導刊,2024,23(7):13-24.
[6] 穆梟寒.研究基于機器學習的地震滑坡易發性評價:以瀘定地震為例[D].成都:西南科技大學,2024:3-26.
[7] 夏添,唐川,常鳴.空間數據挖掘技術在滑坡敏感性評價中的應用[J].人民黃河,2012,34(9):79-81,132.
【責任編輯 許立新】