孫京祿 張貝爾 王淑文 陸貝貝



[關鍵詞]BP神經網絡;溝壑密度;空間插值;輔助變量;陜北黃土高原
[摘要]溝壑密度是反映地表破碎度的重要因子,也是進行水土保持綜合調查、制定流域綜合治理規劃的重要指標依據。因缺乏高精度的大尺度DEM數據,故選擇合適的插值方法實現溝壑密度在區域尺度上的空間插值是迫切需要解決的科學問題。BP神經網絡插值在區域尺度地理要素空間變異研究中,特別是小樣本情況下,具有更高的精度。基于陜北黃土高原80個試驗樣區5 m分辨率DEM和將30 m分辨率DEM計算得到的研究區平均坡度作為輔助變量,利用BP神經網絡插值方法進行陜北黃土高原溝壑密度插值,并與不同插值方法結果進行精度對比,結果表明:當處理目標變量與輔助變量之間存在相關關系卻不存在一個準確關系式時,BP神經網絡插值具有優越性,插值結果精度更高。此外,還對比了基于不同輔助變量的BP神經網絡插值精度,結果表明:對于樣本點稀疏、地形起伏較大的區域尺度空間插值,采用輔助變量的BP神經網絡插值精度明顯高于不采用輔助變量,且選取的輔助變量必須與目標變量有較強的相關性,增加相關系數低的輔助變量反而會導致插值精度降低。
[中圖分類號] P208;S157[文獻標識碼] A[文章編號] 1000-0941(2023)08-0024-04
溝壑密度是衡量黃土高原地區地貌發育階段、影響侵蝕產沙過程的重要地形參數,也是進行水土保持綜合調查、制定流域綜合治理規劃的重要指標依據[1-2],因此準確計算黃土高原地區溝壑密度具有重要現實意義。目前,溝壑密度的計算主要是基于數字高程模型(DEM)提取溝谷網絡,然后統計研究區溝谷網絡總長度,研究區溝谷網絡總長度與研究區面積的比值即為溝壑密度[3]。然而,DEM分辨率對溝壑密度計算結果的準確性有很大的影響,只有采用高分辨率DEM數據才可以得到比較準確的溝壑密度結果[4-5]。由于缺乏符合要求的大尺度數據,目前難以實現基于高分辨率DEM的黃土高原地區溝壑密度計算,因此在計算樣區溝壑密度的基礎上,選擇合適的插值方法實現溝壑密度在區域尺度上的空間插值是迫切需要解決的科學問題。
目前廣泛應用的插值方法主要包括反距離加權插值、樣條函數插值、克里金插值等方法,這些方法有各自的優缺點和適用條件,在樣本數目有限、插值區域較大時,插值結果的精度難以保證[6]。以克里金插值法為基礎,利用輔助變量衍生出的插值方法包括局部平均的簡單克里金法、具有外部漂移的克里金法、協同克里金法、回歸克里金法等[7-8],這些方法可以有效地提高估值精度,被廣泛應用于中小尺度地理要素的空間估值中。但是,除協同克里金法外,這些插值方法的應用前提是待估值變量與輔助變量之間存在一個明確的關系。
然而,大多數情況下二者之間存在較強的相關關系,卻不存在一個準確的關系式[9-10]。人工神經網絡作為一種用計算機模擬生物機制的方法,無須事先確定輸入、輸出量之間映射關系的數學方程,僅通過自身的訓練,學習某種規則,在給定輸入值時可得到最接近期望輸出值的結果,其分析原理使得這種方法對解決機理尚不明確的問題十分有效[11]。其中BP(Back Propagation)神經網絡屬于多層前饋神經網絡,具有高度的非線性映射能力[12-13],許多研究表明在大尺度地理要素空間變異研究中,特別是在小樣本情況下,BP神經網絡插值方法具有更高的精度[14]。因此,本研究以陜北黃土高原為例,采用BP神經網絡方法進行溝壑密度插值,并與其他插值方法進行對比,分析BP神經網絡插值結果精度,以期為獲取區域尺度溝壑密度結果提供借鑒和參考。
1研究區概況
陜北黃土高原是黃土高原的核心地區之一,主要包括陜西省榆林市和延安市。該區以黃土地貌為主,黃土塬、梁、峁及溝壑等地貌發育十分典型,基本涵蓋了黃土高原大部分的地貌組合及景觀形態。其中,北部主要為沙丘、草灘等風沙地貌;中部主要為黃土梁、峁、丘陵、溝壑等地貌,并分布有石質山嶺;西部為低山丘陵地貌;南部主要為黃土殘塬、黃土臺塬等地貌。屬溫帶半干旱和暖溫帶半干旱氣候區,降水主要集中在夏季和秋季,易形成暴雨徑流侵蝕地面,造成嚴重水土流失。
2研究方法
2.1數據處理
在研究區選擇涵蓋不同地貌類型、均勻分布的80個試驗樣區(見圖1),采用每個樣區5 m分辨率DEM計算溝壑密度,作為BP神經網絡插值的基礎數據,5 m分辨率DEM數據來源于陜西省測繪局;此外采用覆蓋研究區的30 m分辨率DEM計算研究區平均坡度,作為BP神經網絡插值的輔助變量,30 m分辨率DEM數據來源于地理空間數據云網站(https://www.gscloud.cn/)。
2.2BP神經網絡插值
2.2.1插值過程
BP神經網絡包括輸入層、隱藏層、輸出層3層,理論上3層BP網絡可以逼近任何有理函數[15]。BP神經網絡算法包括信號的正向傳播和誤差的反向傳播兩個過程,其中在正向傳播過程中,BP神經網絡通過隱藏層神經元對數據進行處理,并輸出相應結果;在反向傳播過程中,BP神經網絡通過對比真實結果與預測結果之間的誤差來不斷調整各層神經元的參數值,從而減小誤差,達到理想效果。本研究將80個試驗樣區分為72個訓練樣本和8個檢驗樣本,通過Matlab軟件中神經網絡工具箱完成BP神經網絡插值計算,主要過程包括:數據導入→隨機產生訓練集和測試集→創建BP神經網絡→設置訓練參數→訓練網絡→仿真測試→數據反歸一化→性能評價。
2.2.2插值方法對比
為了對比分析BP神經網絡插值的精度,通過ArcGIS軟件分別采用樣條函數、反距離加權、協同克里金、回歸克里金等方法進行插值,其中協同克里金法的協同變量為研究區平均坡度,回歸克里金法的回歸模型采用試驗樣區溝壑密度和平均坡度的線性擬合公式(見圖2)。此外,為了對比分析基于不同輔助變量的BP神經網絡插值精度,設置了研究模型和3個對比模型:①研究模型指輔助變量為研究區平均坡度;②對比模型Ⅰ指不采用輔助變量;③對比模型Ⅱ指輔助變量為3個鄰近點坐標值;④對比模型Ⅲ指輔助變量為3個鄰近點坐標值和研究區平均坡度。
插值結果的精度分析采用平均絕對誤差和均方根誤差2個誤差評價指標,其中平均絕對誤差反映了估值的誤差范圍,均方根誤差反映了估值的靈敏度和極值情況,平均絕對誤差和均方根誤差越小代表插值結果精度越高,計算公式分別為
式中:VMAE和VRMSE分別為平均絕對誤差值和均方根誤差值;n為檢驗樣本數量,本研究中n=8;Pi和Ai分別為檢驗樣本中的溝壑密度的插值結果和實際計算值。
3結果與分析
表1是不同插值方法的誤差評價結果,插值結果精度從高到低依次是:BP神經網絡插值法、回歸克里金法、協同克里金法、反距離加權插值法、樣條函數插值法。有研究表明,對于小區域的地理要素估值,如目標變量與輔助變量的相關系數在0.5以上,則采用協同克里金法插值時可以提高估值精度;如目標變量與輔助變量的相關系數在0.7以上,則采用基于目標變量與輔助變量的回歸模型的回歸克里金法插值時可以提高估值精度[16-17]。由表1可知,
回歸克里金法和協同克里金法的插值精度高于反距離加權插值法和樣條函數插值法,表明對于大區域的地理要素估值,回歸克里金法和協同克里金法在一定程度上可以提高插值精度。以區域平均坡度作為輔助變量的BP神經網絡插值精度高于回歸克里金法和協同克里金法,這是由于盡管平均坡度和溝壑密度之間存在相關關系,但是由圖2可知,樣區平均坡度和溝壑密度的線性擬合決定系數為0.499,數據點的分布相較于擬合直線較為分散,二者之間的回歸關系不夠顯著。因此,當處理目標變量與輔助變量之間存在相關關系,卻不存在一個準確關系式時,BP神經網絡插值具有優越性。
此外,本研究還對比了基于不同輔助變量的BP神經網絡插值精度,結果表明插值精度從高到低依次是:研究模型、對比模型Ⅲ、對比模型Ⅱ、對比模型Ⅰ(見表2)。不采用輔助變量的BP神經網絡插值精度最低,在采用3個鄰近點坐標值作為輔助變量后,插值精度有一定程度的提升;在采用3個鄰近點坐標值和研究區平均坡度作為輔助變量后,插值精度進一步提升。然而,BP神經網絡插值精度最高的是采用研究區平均坡度作為輔助變量,表明增加輔助變量并不能使插值精度保持增加。通過計算,得到試驗樣本溝壑密度與平均坡度、第一鄰近點溝壑密度、第二鄰近點溝壑密度、第三鄰近點溝壑密度的相關系數分別為0.707、0.552、0.540、0.415(顯著性水平均為0.01)。可以看出,對于樣本點稀疏、地形起伏較大的區域尺度空間插值,采用輔助變量的BP神經網絡插值精度明顯高于不采用輔助變量,然而選取的輔助變量必須與目標變量有較強的相關性,由于試驗樣區溝壑密度與鄰近點溝壑密度的相關系數并不高,因此當已選擇研究區平均坡度作為輔助變量時,再增加3個鄰近點坐標值作為輔助變量(對比模型Ⅲ),其插值精度相比于研究模型反而下降,表明提升BP神經網絡插值精度需要增加相關系數高的輔助變量,若增加相關系數低的輔助變量往往會造成多重共線性,導致插值精度降低[18]。
基于BP神經網絡的陜北黃土高原溝壑密度插值結果見圖3,陜北黃土高原溝壑密度在空間分布上總體呈現中部和東北部高、西北部和南部低的特點。北部地區地勢相對平坦,溝壑密度較小;中部地區溝壑縱橫,溝壑密度相對較大,這也是陜北黃土高原水土流失最嚴重的地區;南部地區主要是較平坦的塬面,侵蝕發育處于幼年期,溝壑密度相對較小。
4結論
溝壑密度是反映地表破碎度的重要因子,在土壤侵蝕、地貌演變等研究中具有重要作用,因此對于黃土高原等土壤侵蝕嚴重地區,精準估算區域尺度溝壑密度具有重要意義。BP神經網絡插值在大尺度地理要素空間變異研究中,特別是在小樣本情況下,具有更高的精度。本研究基于陜北黃土高原80個試驗樣區5 m分辨率DEM和將30 m分辨率DEM計算得到的研究區平均坡度作為輔助變量,利用BP神經網絡插值方法進行陜北黃土高原溝壑密度插值,并與樣條函數插值法、反距離加權插值法、協同克里金法、回歸克里金法的溝壑密度插值結果進行對比,結果表明:插值結果精度從高到低依次是:BP神經網絡插值法、回歸克里金法、協同克里金法、反距離加權插值法、樣條函數插值法。當處理目標變量與輔助變量之間存在相關關系,卻不存在一個準確關系式時,BP神經網絡插值具有優越性。此外,本研究還對比了基于不同輔助變量的BP神經網絡插值精度,結果表明對于樣本點稀疏、地形起伏較大的區域尺度空間插值,采用輔助變量的BP神經網絡插值精度明顯高于不采用輔助變量,然而選取的輔助變量必須與目標變量有較強的相關性,若增加相關系數低的輔助變量反而會導致插值精度降低。
[參考文獻]
[1] 趙文武,傅伯杰,陳利頂.陜北黃土丘陵溝壑區地形因子與水土流失的相關性分析[J].水土保持學報,2003,17(3):66-69.
[2] 盧金發.黃河中游流域地貌形態對流域產沙量的影響[J].地理研究,2002,21(2):171-178.
[3] 田劍,湯國安,周毅,等.黃土高原溝谷密度空間分異特征研究[J].地理科學,2013,33(5):622-628.
[4] 李俊,湯國安,張婷,等.利用DEM提取陜北黃土高原溝谷網絡的匯流閾值研究[J].水土保持通報,2007,27(2):75-78.
[5] 沈晶玉,史明昌,田玉柱,等.DEM網格尺寸與溝谷提取精度研究[J].中國水土保持,2007(2):56-60.
[6] 朱會義,劉述林,賈紹鳳.自然地理要素空間插值的幾個問題[J].地理研究,2004,23(4):425-432.
[7] 劉志華,常禹,賀紅士,等.基于輔助變量的森林半腐層厚度空間插值精度[J].應用生態學報,2009,20(1):77-83.
[8] 魯程鵬,束龍倉,張穎,等.稀疏數據插值問題的回歸克里格方法[J].水電能源科學,2009,27(1):81-84.
[9] 姜勇,梁文舉,李琪.利用與回歸模型相結合的克里格方法對農田土壤有機碳的估值及制圖[J].水土保持學報,2005,19(5):97-100,126.
[10] 鄧羽,劉盛和,姚峰峰,等.基于協同克里格的基準地價評估及空間結構分析[J].地理科學進展,2009,28(3):403-408.
[11] 尤淑撐,嚴泰來.基于人工神經網絡面插值的方法研究[J].測繪學報,2000,29(1):30-34.
[12] 鹿應榮,楊印生,劉洪霞.基于BP神經網絡的非線性組合預測模型在糧食物流需求預測中的應用[J].吉林大學學報(工學版),2008,38(增刊2):61-64.
[13] 林宇鋒,鄧洪敏,史興宇.基于新的改進粒子群算法的BP神經網絡在擬合非線性函數中的應用[J].計算機科學,2017,44(增刊2):51-54.
[14] 王漢濤,張瀟瀟.仿生算法優化BP神經網絡在降雨空間插值中的應用[J].水資源與水工程學報,2019,30(3):106-112.
[15] 趙明偉,湯國安,李發源,等.基于BP神經網絡的陜北黃土高原侵蝕產沙影響因子顯著性研究[J].水土保持通報,2012,32(1):5-9,226.
[16] 劉艷芳,宋玉玲,郭龍,等.結合高光譜信息的土壤有機碳密度地統計模型[J].農業工程學報,2017,33(2):183-191.
[17] 張歡,高小紅.復雜地形區土壤有機質空間變異性分析及制圖[J].水土保持研究,2020,27(5):93-100.
[18] 秦雯怡,陳果,李小臻,等.基于機器語言的岷江上游流域表層土壤氫氧穩定同位素空間分布模擬[J].應用生態學報,2021,32(12):4327-4338.
收稿日期: 2023-06-30
基金項目: 國家自然資源和地理空間基礎信息庫安徽省試點項目
第一作者: 孫京祿(1986—),男,安徽淮南人,助理研究員,碩士,主要從事地理信息系統工作。
E-mail: Jinglusun@126.com
(責任編輯李佳星)