中圖分類號:P237 文獻標識碼:A doi:10.12128/j.issn.1672-6979.2025.07.005
0引言
地質災害的早期識別和易發生區域的監測是防災減災的重要工作。山東省的地貌特征呈現為山高谷深、崖陡壁峭,且不同巖性組合和強烈的地質構造運動加劇了該區域地質結構的不穩定性。而季風區域大陸性氣候,雨量集中,災害性天氣頻發,使魯中南地區成為地質災害易發生區域[1-4]。本文選擇山東省臨沂市平邑縣作為研究區域,進行地質災害易發性區域的識別和提取。
由于遙感技術的快速發展,利用遙感影像對地質災害早期識別和易發生區域的監測已成為防災減災的重要手段。多光譜影像結合了地形數據和氣候數據的多源異構數據,包含了更加豐富的特征信息,有助于地質災害易發性區域的提取。如裘湧泉[5基于高分二號和哨兵2A影像,根據構建的識別規則,利用決策樹分類的面向對象方法提取滑坡信息,正確提取率為 82.40% ;白石[等融合高分辨率遙感影像和數字高程模型數據,利用面向對象多特征變化向量分析法,對研究區內的滑坡區域進行識別。多源異構數據豐富的特征信息,也為利用優化的機器學習算法進行地質災害易發性區域的提取提供了支撐。近年來,通過機器學習算法對遙感影像進行解譯,從而進行地質災害的早期識別和易發性研究取得了眾多的研究成果[]。如Stumpf[8]等人提出了一種結合面向對象圖像分析技術和隨機森林算法的監督分類方法,該分類方法能夠減少人工標注工作,并以客觀的方式選取重要的對象特征和分類閾值,提高識別過程的客觀性和效率;胡文杰[9]以SwinTransformerBlock為基礎構建設計集成了一種交叉注意力機制模塊,提升了滑坡的識別率;岳帥帥[10]通過基于隨機森林的面向對象分類提取到略陽縣內505處滑坡體,總體精度為 86.3% ,展現出基于隨機森林的面向對象分類法在識別滑坡中較高的精度和適應性。
在地質災害易發性區域提取領域,機器學習算法已展現出顯著的成效。這些算法具備自動化識別地質災害易發性區域的能力,能夠高效地從多源異構數據中提取關鍵特征信息,進而實現對地質災害易發性區域的精確界定。此外,機器學習算法在計算成本方面相對較低,且通常能夠達到較高的識別精度,足以滿足多樣化的研究和實際應用需求。基于此,本文將GF-1WFV光學影像、ASTERGDEM地形數據和降水數據進行數據處理,形成多源異構數據,通過對比TensorFlow算法、支持向量機和隨機森林三種機器學習算法對地質災害易發性區域的提取效果,確定適用于地質災害易發性區域提取的優秀算法,為平邑縣地質災害預防提供參考。
研究區與數據
1.1 研究區概況
平邑縣地處山東省臨沂市西部、山東省東南部,縣域總面積約為 1825km2 。地質構造復雜,具有明顯的山區特征,浚河、溫涼河穿縣而過,縣內存在大量巖溶塌陷區域[11]。最高點位于蒙山珠峰龜蒙頂,海拔約為 1155m ,最低點在縣北部孫家莊區域,海拔約為 97m 。全境地勢南北高,中間低,略向東南傾斜。平邑縣屬暖溫帶東南亞季風區域大陸性氣候,寒暑交替、四季明顯,雨量集中,旱澇不均[12]夏季雨量集中,災害性天氣頻繁,易引發山體滑坡、泥石流等地質災害。
1.2 數據及預處理
(1)光學遙感數據。云量篩選了高分1號2021—2024年4景遙感數據。高分一號衛星(GF-1)搭載了2臺 2m 分辨率全色、 8m 分辨率多光譜相機和4臺 16m 分辨率多光譜相機,本次使用 16m 分辨率多光譜寬幅影像。GF-1WFV獲取的 16m 分辨率能夠為自然資源部門、地質部門提供高精度、寬范圍的空間觀測服務[13]。所有光學遙感數據均經過輻射定標、大氣校正和正射校正,為確保多源異構數據在實驗中保持空間分辨率一致,對所有數據均重采樣至 30m 分辨率[14]
(2)地形數據。本次使用的地形數據是先進星載熱發射和反射輻射儀全球數字高程模型(ASTERGDEM),該數據是由日本METI和美國NASA聯合研制并免費面向公眾分發[15]。該數據是根據NASA的新一代對地觀測衛星Terra的詳盡觀測結果制作完成,其數據覆蓋范圍為 83°N 到 83°S 之間的所有陸地區域,達到了地球陸地表面的 99%[16]"。
(3)降水數據。本文根據平邑縣發布的各鎮街年度累計降雨量,以各鎮街的地理中心作為降雨數據點,通過克里金插值方法,得到了平邑縣年度累計降雨量圖。數據的具體情況見表1。

2 研究方法
2.1 地質災害易發性識別方法
目前,在基于多源遙感數據進行地質災害易發性識別的研究中,已經有包括支持向量機、隨機森林和TensorFlow算法等機器學習算法。為尋找適用于研究區地質災害易發性識別的算法,本文對比了支持向量機、隨機森林、TensorFlow算法[17]
(1)TensorFlow算 法。TensorFlow 是由Google團隊開發的一款用于機器學習研究和產品開發的深度學習框架,擁有高度靈活性和可擴展性,常用于開發自然語言處理、圖像識別、手寫識別等各種任務模型[18]。其中,Tensor表示張量,即N維數組,Flow表示數據流圖,直觀表達了張量之間通過計算相互轉化的過程,高度的靈活性使得Tensor-Flow成為主流的遙感影像識別和分析工具[19]
(2)支持向量機是一種源自統計學習理論的監督分類方法,使用被稱為最優決策超平面的面將類分開,使類之間的邊界最大化,最接近最優決策超平面的數據點稱為支持向量。同時,在使用支持向量機方法進行分類時,需要選擇一個核函數,用于在估計目標類時提供附近數據點的權重[20]
(3)隨機森林算法由L.Breiman提出,該算法通過構建大量不相關的隨機決策樹,并在使用多數投票決策的方式對所有生成的決策樹進行引導和聚合,從而實現對圖像的分類[21]
2.2 精度驗證
為確定滑坡易發區域的提取精度,在研究區內隨機采集300個樣本點,根據天地圖影像進行目視判讀,確定檢驗樣本點所在區域是否為易發區域,以此判斷提取結果的精度。精度驗證采用混淆矩陣和Kappa系數作為指標。通過混淆矩陣可以得到總體精度(OverallAccuracy,OA)、用戶精度(UserAc-curacy,UA)和生產者精度(ProducerAccuracy,PA)等一系列的精度評價指標。而Kappa系數被廣泛應用于遙感分類的精度評價[22]
3 結果與討論
3.1 識別精度比較
通過使用3種機器學習算法,對研究區進行分類,共分為水體、林地、農業用地、建筑用地、草地和地質災害易發性區域6類地類,具體分類結果對比如圖1所示。

1—平邑縣邊界;2—水體區域;3—高大植被區域;4—農業用地區域;5—建筑用地區域;6—低矮的草本植物地區;7一地質災害易發區域。
由各算法分類結果圖對比可以發現,各算法對于水體、建筑用地和林地的分類結果較為一致,地質災害易發性區域主要集中在研究區西北的蒙山大洼區、唐村水庫南部和九間棚區域。相較于支持向量機和隨機森林的分類結果,TensorFlow算法的分類結果中易發性區域面積明顯更小,且草地面積更大,更加符合研究區地質環境特征[23] 。
為進一步確認各算法的分類精度,本文在研究區內隨機采集300個檢驗樣本點,根據天地圖高分辨率的影像對樣本點所屬區域的正確類別進行目視解譯。通過精度驗證,得到3種機器學習算法對地質災害易發性區域和各類地物的識別精度和Kappa系數,具體結果如表2所示。
不同分類方法的總體精度均不小于 75% ,Kappa系數不小于0.75。其中TensorFlow算法的分類結果總體精度最高,為 82.33% ,Kappa系數為0.82;隨機森林的分類精度次之,支持向量機的分類精度最低。在對各類方法的分類結果進行比較后發現,支持向量機方法在小樣本分類中更具有優勢,但由于少量支持向量影響了精度,因此造成農業用地與草地這種易混淆的地物分類精度較差。隨機森林方法的分類精度相對較高,但存在參數較難調優的缺點,同時其運行速度比另外兩種分類算法更慢。總體而言,TensorFlow算法相較于其他方法的分類精度較高,靈活性高,支持多種優化算法,可根據輸入多源數據的特點進行參數調優,可以通過數據并行和模型并行實現高效計算,非常適合多源遙感數據分析,因此本文使用TensorFlow算法進行平邑縣地質災害易發性區域的提取。

TensorFlow算法提取結果中建筑用地的提取精度最高,用戶精度為 94.00% ,生產者精度為82.46% 。這是由于建筑用地在遙感影像上的特征較為明顯,易于識別和提取。水體和林地的提取精度也相對較高,用戶精度和生產者精度均在 80% 以上。相比之下,農業用地和草地的提取精度稍低,這可能是由于農業用地和草地在遙感影像上的特征相似,且易受季節、氣候等因素的影響,導致分類過程中存在一定的困難。地災害易發區的用戶精度為79.25% ,生產者精度為 85.71% ,相對其他地類而言略低,但考慮到地災害易發區在總體面積中的占比可能較小,且特征復雜,這樣的精度表現仍可接受。此外,其用戶精度和生產者精度的差異也表明,在分類過程中可能存在一定程度的誤判和漏判。綜上所述,TensorFlow算法在不同地類上的提取精度表現出一定的差異性,但整體而言,提取結果的精度較高,其分類結果有較高的參考價值。
3.2 時空變化分析
通過TensorFlow算法對2021—2024年平邑縣同時期影像進行地質災害易發區域提取,地質災害易發性區域主要集中在研究區西北的蒙山大洼區、唐村水庫南部和九間棚區域。2023年提取結果中九間棚區域和唐村水庫南部的地質災害易發性區域面積有所增加。就其他地類而言,浚河、溫涼河兩條河流貫穿研究區,為主要水系,建筑面積在現有的位置逐步外擴,草地區域主要集中在研究區的南部,與農業用地交錯,林地主要集中要蒙山的大洼區和龜蒙區(圖2)。

7—地質災害易發區域。
為驗證數據的準確性,將TensorFlow算法提取的各類型土地利用類型的面積與公開發布的全球土地利用數據進行對比,該分類結果與Sentinel-2世界 10m 土地利用時間序列數據具有高度的一致性[24]。表3詳細體現了2021—2024年期間平邑縣地質災害易發性區域面積的變化,總體上呈現出先穩定后增長再減少的趨勢。從2021年的227.211km2 到2022年的 226.384km2 ,面積略有減少,但占比保持穩定,分別為 12.46% 和 12.41% 。然而,到了2023年,地災易發區面積顯著增加至254.460km2 ,占比也相應提升至 13.95% 。這種增長可能與氣候變化、降水增加、人類活動對地質環境的干擾等因素有關。值得注意的是,盡管2024年地災易發區面積有所減少至 212.868km2 ,但其在總面積中的占比仍然較高,達到 11.67% ,地質災害的防范和治理工作依然面臨嚴峻挑戰。

4結論
本文以山東省平邑縣為研究區域,將GF-1WFV光學影像、ASTERGDEM地形數據和降水數據進行數據處理,形成多源異構數據,通過對比TensorFlow算法、支持向量機和隨機森林3種機器學習算法對地質災害易發性區域的提取效果,在確定算法后提取2021年和2024年同時期地質災害易發性區域,得到以下結論:
(1)TensorFlow算法、支持向量機和隨機森林均能夠較好地識別滑坡易發生區域,總體精度均不小于 75% ,Kappa系數均不小于0.75。
(2)TensorFlow算法相較于其他方法的分類精度較高,總體精度為 82.33% ,Kappa系數為0.82,該算法可根據輸人多源數據的特點進行參數調優,適用于進行地質災害易發性區域的提取。
(3)2021—2024年,平邑縣易發生地質災害的區域面積占比為 11.5%~12.5% ,相較于2021年,2024年滑坡易發生區域面積減少了 14.343km2 ,地質災害易發性區域主要集中在研究區西北的蒙山大洼區、唐村水庫南部和九間棚區域。
本文對比了TensorFlow算法、支持向量機和隨機森林3種機器學習算法對地質災害易發性區域的提取效果,未通過標準樣本對其他算法進行提取效果的對比,如何利用多源異構數據的優勢,優化各類機器學習算法的提取精度和效率有待深人研究。
參考文獻:
[1] 辛魯斌,韓玲,李良志.基于多源數據融合的滑坡智能識別[J].地球科學與環境學報,2023,45(4):920-928.
[2] 孫萍萍,張茂省,賈俊,等.中國西部黃土區地質災害調查研究進展J」.西北地質,2022(3):55.
[3] 高峰,孟凡奇,張麗,等.山東省地質災害調查工作回顧與展望[J].山東國土資源,2022,38(10):35-41.
[4] 常允新,宋長斌.山東省崩塌、滑坡、泥石流災害發育現狀與趨勢分析[J].山東國土資源,2000,16(4):39-44.
[5] 裘湧泉.基于多源遙感數據的黃土滑坡提取[D」.江西:東華理工大學,2023.
[6] 白石,唐攀攀,苗朝,等.基于高分辨率遙感影像和改進U-Net模型的滑坡提取:以汶川地區為例LJ].自然資源遙感,2024,36(3):96-107.
[7] 韓學林,王秀芬,郭寶奎,等.山東省砂石資源遙感解譯成果及應用[J].山東國土資源,2023,39(11):59-67.
[8] Stumpf A,KerleN.Object-oriented mapping of landslides u-singRandom Forests[J]. Remote sensing of environment,2011,115(10):2564-2577.
[9]胡文杰.基于深度學習的滑坡識別方法:以四川省瀘定縣為例[D].廊坊:防災科技學院,2024.
[10]岳帥帥.基于多源遙感數據的滑坡識別技術研究[D].西安:長安大學,2023.
[11]孫頎.巖溶塌陷治理設計與實現:以山東省平邑縣泰和村巖溶塌陷設計治理點為例[J].山東國土資源,2023,39(10):26-30.
[12]馮廣,杜現福,孫超,等.山東省平邑縣九間棚村土壤地球化學調查評價[J].山東國土資源,2024,40(10):35-42.
[13]馬艷敏,袁福香,李建平,等.基于GF-1衛星數據的敦化市園參分布提取與變化分析[J].氣象災害防御,2024,31(3):45-48.
[14]袁金國,牛錚,王錫平.基于FLAASH的 Hyperion 高光譜影像大氣校正[J].光譜學與光譜分析,2009,29(5):1181-1185.
[15]張朝忙,劉慶生,劉高煥,等.SRTM3與ASTERGDEM數據處理及應用進展[J].地理與地理信息科學,2012,28(5):29-34.
[16]衛石印,李忠涵,張啟慧,等.基于多源遙感數據的滑坡易發區域識別:[J].山東國土資源,2024,40(10):60-65.
[17]王家柱,鐵永波,白永健,等.機器學習在斜坡地質災害領域的應用現狀與展望[J/OL].水文地質工程地質,1-13.[202503-27].DOI:10.16030/j.cnki.issn.1000-3665.202402011.
[18]康愷,何偉,董天禎,等.一種基于TensorFlow 的蔬菜識別技術[J].中國科技信息,2023(23):103-106.
[19]榮光旭,李宗洋,田凱.TensorFlow多元線性回歸在邊坡穩定性分析中的應用[J].齊魯工業大學學報,2020,34(6):6.
[20]HSU C W,CHAN C C,LIN C J. A Practical Guide to Sup-port Vector Classification[J].BJU International,2008,101(1):1396-1400.
[21]黃衍,查偉雄.隨機森林與支持向量機分類性能比較[J].軟件,2012,33(6):4.
[22]朱江濤.基于GEE的鄱陽湖濕地植被長期變化特征及影響因素研究[D].南昌:東華理工大學,2022.
[23]尹常銘.基于機器學習的滑坡易發性區劃和滑坡快速識別研究[D].大連:大連理工大學,2022.
[24]Karra K,Kontgis C,Statman-Weil Z,et al. Global land use/land cover with Sentinel 2 and deep learning[C]// 2021IEEE International Geoscience and Remote Sensing Symposi-um IGARSS,2021:4704-4707.
Abstract:Early identification of geological disasters and monitoring of easy-happening areas are important work in disaster prevention and reduction. In this paper,taking Pingyi county in Shandong province as the study area,the GF -1 WFV optical image,ASTER GDEM terrain data and precipitation data are fused into multi-source heterogeneous data. The extraction effects of three machine learning algorithms,such as TensorFlow algorithm,support vector machine,and random forest in geological hazard easy-happening areas have been compared. Geological hazard easy-happening areas in the study area from 2O2l to 2024 have been extracted.By using TensorFlow algorithm,support vector machine and random forest methods, landslide easy一happening areas can allidentified well.compared to other methods,TensorFlow algorithm has a higher classification accuracy with an overall accuracy of 82.33% and a Kappa coefficient of 0.82. From2021 to 2024, the proportion of geological hazard easy-happening areas in Pingyi county ranged from 11.5% to 12.5% . The fluctuations are mainly concentrated in Mengshan Dawa area in the northwest of the study area,the southern part of Tangcun reservoir,and Jiujianpeng area. The research results can provide some references for the selection of extraction algorithms for geological hazard easy-happening areas and the prevention of geological hazards in Pingyi county in Shandong province.
Key words:Geological hazard susceptibility extraction;machine learning;multi-source data; Pingyi county in Shandong province