關鍵詞:水土保持對象;標準樣本庫;構建方法;多源-多尺度-多等級;西南高山峽谷區
中圖分類號::S157文獻標識碼:ADOI:10.3969/j.issn.1000-0941.2025.07.017
引用格式:趙院,金平偉,李浩,等.西南高山峽谷區水土保持典型對象標準樣本構建方法研究與應用[J].中國水土保持,2025(7) :55-59.
黨的十九大報告中明確指出,至2035年,我國生態環境根本好轉,美麗中國目標基本實現;到21世紀中葉,生態文明將全面提升[1-2]。水土保持遙感監測是衡量生態系統健康狀況的關鍵手段,而水土保持遙感數據樣本庫的建設是水土保持研究工作的基石,對提高水土保持工作的科學性、有效性和可持續性具有重要意義,同時對加速生態文明建設的進程具有不可替代的支撐與保障作用[3-4] O
西南高山峽谷區受地形、天氣等原因影響,其影像采集困難,水土保持對象的樣本庫數據嚴重短缺,導致典型水土保持對象識別難、信息提取精度低,仍需大量人力、物力等資源開展現場數據采集等工作,難以滿足新時代水土保持新質生產力發展要求,阻礙了西南高山峽谷區智慧水土保持監測技術體系構建進程。廖瑞恩等[5]根據水力侵蝕的柵格數據,利用Sen趨勢分析和Mann-Kendall顯著性檢驗法對西南高山峽谷區水力侵蝕的時空演變特征及驅動力進行了分析,并認為柵格數據精度需進一步提高;丁琳等利用全國水土流失監測數據,運用土壤侵蝕量計算模型與凍融侵蝕評估體系,探究了西南高山峽谷區水力侵蝕與凍融侵蝕強度的地形地質差異及土地利用模式間的分布特性,認為水土流失數據受地形影響較大;賴金林等選用中國科學院資源環境科學與數據中心提供的月度植被指數空間分布數據集,運用多種技術手段,深入剖析了西南高山峽谷區歸一化植被指數(NDVI)的時空演變趨勢及其穩定性特征,并探討了導致NDVI空間差異性的多種影響因素;ZHANGetal.[8]依據整合與搜集的數據,研究人工林的土攘侵蝕特征,研究結果只反映了一般的侵蝕狀況,缺乏高精度的數據樣本以反映高標準的侵蝕特征;ZHANGet al.[9依據柵格數據集,針對水土流失嚴重的干旱地區,剖析了不同坡向和坡度下生物結皮蓋度的變化,以及由此導致的理化性質波動,但其研究結果在精度上有待提升。
目前,大多學者對水土流失數據的運用方式較為直接、簡單,缺少對數據樣本的精確化處理和系統性制作。本研究聚焦西南高山峽谷區水土保持典型對象樣本庫制作,系統、全面地介紹科學、嚴謹的樣本庫制作方法,通過精細化地優化數據收集流程、精細處理數據、精確標注數據及實施高效的數據增強策略,顯著提高模型的訓練效率與質量,大幅度提升模型訓練與測試階段的表現水平,從而助力研究人員與相關工作者構建出具備高準確性、高標準、廣泛多樣性的樣本庫,旨在為西南高山峽谷區智慧水土保持監測提供大樣本數據支撐
1 研究區基本概況
1)研究范圍及地形地貌。西南高山峽谷區是指以高山、峽谷地形為主的區域,位于四川省、西藏自治區與云南省的交界之處(見圖1)。該區域山地丘陵與高原占據主導地位,地形高峻陡峭,地勢起伏急劇多變,且海拔相差懸殊,從最低的 60m 到高聳的 7404m 不等,有 35.5% 的區域具備巖溶地質特征。
2)氣候特征。西南高山峽谷區坐落于東亞與南亞季風交會的過渡區域,受熱帶與亞熱帶季風氣候交替影響,氣候呈現出顯著的空間差異性。不同地點多年平均降水量在 300~2300mm 之間變動,展現出南部多雨而北部較少、東部濕潤而西部相對干燥的分布特點;多年平均氣溫在 -3~22°C 之間波動。
3)遙感監測存在的問題。天氣多變,云層覆蓋率高,在夏季多雨季節,光學遙感影像中云遮擋問題嚴重,影響影像質量和數據的連續性;高山峽谷地區常常有茂密的植被覆蓋,會增加地面真實景況的提取難度,特別是利用光學遙感影像進行植被類型識別和變化監測時,需要更加精細的分類算法和地面驗證數據;由于地形的高度變化,普通的幾何校正方法存在效果不佳的問題,因此需采用高級的數字高程模型(DEM)進行精確的幾何校正,同時通過影像融合、多源數據結合等方法來提升成像效果和信息提取的準確性。
2數據收集與處理
數據是制作樣本的基礎,本研究為提高樣本自身精度,采集 2m 及優于 2m 的多源遙感影像,以高分系類為主,以利于影像接邊與融合。選取最新全覆蓋高分辨遙感影像,部分典型區域用無人機正射影像補充,主要針對影像難以獲取或質量達不到要求的云雪覆蓋區域或大規模高山梯田區域;同時,結合2023年度開展的水土流失動態監測及信息化監管相關工作,收集其土地利用及擾動圖斑等矢量數據。
2.1 數據來源選擇與獲取
2.1. 1 遙感影像收集
研究區面積達61.5萬 km2 ,為保證典型樣本具有一定代表性,本研究收集了能覆蓋研究區的高分遙感影像,以高分系類( (GF-6,GF-2,GF-7) 為主、部分區域用資源系類ZY01B補充,遙感影像時相為2023年下半年(云雪覆蓋較少時段),具體情況見表1。
2.1.2 矢量數據收集
研究區涉及川西高原高山峽谷生態維護水源涵養區、川西南高山峽谷生態保土減災區、滇西北中高山生態維護區、藏東高山峽谷生態維護水源涵養區、滇北中低山蓄水攔沙區、藏東南高山峽谷生態維護區6個水土保持三級區。主要收集梯田(水平梯田、坡式梯田)、擾動圖斑等典型對象矢量數據,保證各分區均有典型研究對象作為樣本圖斑。樣本圖斑分布情況和典型對象示例分別見圖2、圖3。
2.2 數據修正與編碼
2.2.1 數據修正
通過對大圖斑拆分與切割、小圖斑邊界調整與優化,提升數據整體質量;同時對遙感影像色澤度局部調整,消除不同數據源或不同時間點收集的數據之間的矛盾和不一致,提高模型的預測準確性和泛化能力。
2.2.2 數據編碼
大量樣本數據需通過編碼的方式來分類,以便于檢索和管理,同時更易于計算機批處理,提高運算速度。構建多區域、多類型的樣本庫,即大數據庫,可提高查詢效率和索引性能,有助于機器的識別。西南高山峽谷區典型水土保持對象編碼方式參考表2,同一地類加小標依次遞增,例如SF_1、EG_1等
3典型對象樣本標注與制作
本研究主要采用“人工自由維度”和“固定漁網”兩種模式開展項目區典型對象樣本與混淆地類樣本的制作,選取梯田(水平梯田、坡式梯田)擾動圖斑(生產建設項目)為典型對象樣本,道路、水體、建設用地(完工不再擾動)、林地為混淆對象樣本。
高質量的數據標注是樣本庫制作的核心,直接影響模型的訓練效果。樣本庫要滿足清晰度和地物特征基本標準,確保能清楚判斷出地物類型與邊界,以此為樣本標準制作模型訓練樣本庫,一定程度上能夠提高模型訓練的精度。
3.1 標注方法
3.1.1“人工自由維度”標注
“人工自由維度”標注即人工采用不同尺度對數據進行標注,獲取不同維度的典型對象樣本集。由圖4可知,“人工自由維度”標注樣本集的制作流程可概述如下:首先,依據邊界矢量文件和土地利用矢量數據進行空間疊加分析,以整合不同數據源的信息,更全面地理解與判斷每個區域的土地利用類型;其次,通過Classvalue進行分類字段標記,字段標記為1對應梯田,字段標記為2對應擾動圖斑,字段標記為3則對應其他地類;然后,基于遙感數據進行掩膜提取裁剪,得到梯田柵格數據、擾動圖斑柵格數據和混淆地類柵格數據;最終,所有經過處理的數據被整合成完整的樣本集數據,這些數據可用于后續的土地利用分析、規劃或監測等工作。整個流程從數據收集(邊界矢量文件、土地利用矢量數據)開始,經過空間疊加分析、土地利用類型判斷、分類標記等步驟,最終生成完整的樣本集數據,為構建水土保持典型樣本庫的深入研究和應用提供基礎
3.1.2 “固定漁網”自動標注
“固定漁網”自動標注即固定網格尺寸( 256pt× 256pt.512pt×512pt, ,基于地理信息處理軟件平臺,對研究區域典型對象進行自動裁切,再通過人工復核優化,形成典型水土保持對象樣本集。由圖5可知,“固定漁網”自動標注樣本集的制作流程可總結如下:首先,根據生成漁網后的矢量文件和土地利用矢量數據,進行空間位置疊加分析;其次,判斷漁網單元格與擾動圖斑空間位置重疊率是否大于 50% ,若重疊率大于 50% ,則判斷土地利用類型,梯田Classvalue字段標記為1、擾動圖斑Classvalue字段標記為2、其他地類Classvalue字段標記為3,批量提取各類型矢量數據與遙感影像并進行疊加分析,掩膜提取裁剪( 256pt×256 pt、512pt×512pt)形成對應的柵格數據,得到擾動樣本矢量數據,并整合成完整的樣本集數據;反之,若重疊率小于或等于 50% ,則跳過該漁網,
3.2 樣本集
本研究制作典型對象樣本共6.8萬個、混淆對象樣本4.0萬個,完成了樣本編號與數據庫的構建工作。其中: ① “人工自由維度”勾繪構建典型對象樣本擾動圖斑(生產建設項目)1.7萬個、梯田1.7萬個,勾繪混淆對象樣本2.0萬個; ② “固定漁網”裁切擾動圖斑(生產建設項目)1.7萬個、梯田1.7萬個,裁切混淆對象樣本2.0萬個。圖6為西南高山峽谷區部分樣本集。
4樣本庫構建與擴充
以梯田為例,數據增強通過對現有數據進行變換、擴展,提升樣本庫的多樣性和模型的泛化能力。
1)幾何變換。包括旋轉、翻轉、縮放(見圖7)。
2)顏色變換。包括亮度、對比度、飽和度、噪聲、模糊調整(見圖8)。
5樣本訓練結果測試與對比
本測試主要選取梯田(水平梯田、坡式梯田)、擾動圖斑樣本集,用于模型訓練與模型驗證數據。樣本集統計及應用效果檢驗情況分別見表3、表4。
注:F1得分值為機器學習評估指標,用于衡量模型的準確性,較高的F1分數表示更好的分類器質量。
由表3、表4可以看出,整體而言,西南高山峽谷區典型水土保持樣本應用效果較好,可為構建具有區域特點的水土保持對象自動識別卷積神經網絡模型提供標準、可靠的數據基礎,且具有良好的泛化能力
6 結果與討論
1)通過科學、嚴謹的方法制作樣本庫,能夠顯著提升模型的訓練效果和訓練測試應用精度。本研究構建了西南高山峽谷區梯田(水平梯田和坡式梯田)、擾動圖斑(生產建設項目)標準樣本數據集,進行了統一編碼,形成了樣本數據庫(查詢庫),為水土保持對象的自動識別及提取方法的研究與應用提供了算據支撐。
2)采用“人工自由維度”標注與“固定漁網”自動標注兩種方式開展樣本標注,制作出大量樣本數據集。通過對比分析,“人工自由維度”標注獲取的樣本質量明顯優于“固定漁網”自動標注,“固定漁網”自動標注形成的樣本存在大量無用樣本(TIFF圖像中所需的地物不存在或者占比較小等),還需人工進一步挑選,但“固定漁網”自動標注獲取樣本效率遠高于“人工自由維度”標注。應進一步研究兩種方法的融合技術,為樣本制作提供全面技術支持。
3)未來的研究可以聚焦高質量樣本標注、少樣本學習等方向,針對地域及場景化(季節變化等特點)補充與更新本研究區域典型水土保持對象樣本庫,為高山峽谷區水土保持關鍵要素快速監測提供有效、精準的大數據基礎。
參考文獻:
[1]莫沫.水土保持遙感應用成效與展望[J].中國水利,2024(11) :21-25.
[2]王詩綺,劉焱序,李,等.近20年黃土高原生態系統服務研究進展[J].生態學報,2023,43(1):26-37.
[3]王曉峰,賈子續,馮曉明,等.黃土高原土壤保持服務供需平衡及其驅動因素[J].生態學報,2023,43(7):2722-2733.
[4]袁和第,信忠保,侯健,等.黃土高原丘陵溝壑區典型小流域水土流失治理模式[J].生態學報,2021,41(16):6398-6416.
[5]廖瑞恩,齊實,賴金林,等.西南高山峽谷區水力侵蝕時空變化及其驅動力[J].水土保持研究,2024,31(5):139-147.
[6]丁琳,黃婷婷,秦偉,等.西南高山峽谷區土壤侵蝕空間分異特征[J].泥沙研究,2023,48(6):51-58,66.
[7]賴金林,齊實,崔冉冉,等.西南高山峽谷區植被變化及影響因素分析[J].環境科學,2023,44(12):6833-6846.
[8]ZHANGLin,WUQinzhan,HUANGKangting,etal. Impacts ofdifferent slash disposals on soil and water erosion ofhigh-in-tensitymanagement Eucalyptus grandis × urophyllaplantation[J].Heliyon,2024,10(9) :e30550-e30550.
[9]ZHANG Jing,LIU Yixuan,HOU Fujiang. Changes in vegeta-tion and soil coupling induced by biocrusts:New thinking onthesegmented control of soil and waterlossin the Loess Plat-eau,China[J]. Ecological Indicators,2024,161:111953.
(責任編輯 徐素霞)