郭治興袁宇志郭 穎,2孫 慧,2柴 敏
陳澤鵬3Mogens H. Greve4
(1 廣東省生態環境技術研究所廣東省農業環境綜合治理重點實驗室,廣州 510650)
(2 山西農業大學資源環境學院,山西晉中 030800)
(3 廣東省煙草公司,廣州 510610)
(4 Department of Agro-ecology,Faculty of Science and Technology,Aarhus University,8830 Tjele,Denmark)
基于地形因子的土壤有機碳最優估算模型*
郭治興1袁宇志1郭 穎1,2孫 慧1,2柴 敏1
陳澤鵬3Mogens H. Greve4
(1 廣東省生態環境技術研究所廣東省農業環境綜合治理重點實驗室,廣州 510650)
(2 山西農業大學資源環境學院,山西晉中 030800)
(3 廣東省煙草公司,廣州 510610)
(4 Department of Agro-ecology,Faculty of Science and Technology,Aarhus University,8830 Tjele,Denmark)
基于數字地面模型(Digital Terrain Model,DTM),同時考慮因子組合和分辨率構建土壤有機碳(SOC)最優估算模型。在7 100 km2范圍內,選取了71個分辨率和22個地形因子中不多于5個因子的所有可能組合,構造了2 514 820個模型。采樣點隨機分為兩組,6 362個訓練樣點構造數據挖掘模型,其他2 208個為驗證樣點。根據模型相關系數r值大小從中選取了不同個數因子組合以及相應分辨率的最優模型,并根據這些模型生成對應的土壤有機碳圖。結果表明:單個地形因子模型和柵格大小之間的關系表現出多樣化,并不是分辨率越高模型結果越好。單因子模型r值的大小并不能決定其在因子組合模型中的重要性。不同的因子及其組合有其特定的最適分辨率,最佳分辨率范圍約為60~150 m。綜合數據的存儲空間和計算量、模型復雜度、預測精度以及空間表達能力,該地區最優模型由相對坡位、高程、歸一化高程及多尺度山谷平坦指數等4個變量組成,對應分辨率為121.6 m。同時與多種克里格空間插值方法生成的土壤有機碳空間分布圖進行了對比分析,發現無論幾個變量的組合,其空間預測能力均較克里格空間插值方法更能表達SOC的空間變化,預測精度也較高。
土壤有機碳;數字土壤制圖;數據挖掘;最優估算模型;數字地面模型;地形參數
土壤有機碳(SOC)是全球碳庫的重要組成部分,是陸地生態系統中最大的有機碳庫[1],在全球碳循環和氣候變化過程中起著極其重要的作用[2-3]。同時也是人類可持續利用土地資源進行生產,保證全球糧食安全必須要掌握的基礎信息[4]。
土壤有機碳儲量受自然和人為兩個方面因素的影響[5]。地球環境的進化決定了一個特定地區的氣候、植物、地形、地貌以及土壤等自然屬性,這些屬性之間必定有較高的相關性。一個地區的土壤有機碳和其所處的地質、地貌以及地形等因子是自然形成和演化的共同結果[6]。在此過程中,特定的地質、地貌以及地形等因子均會影響土壤有機碳的形成與演化。因此地形因子的組合與土壤有機碳必然有其內在的聯系,能夠在一定程度上反映所在地土壤有機碳的狀態[7-8]。
土壤有機碳還受人類活動的影響[9-10]。人類利用土壤的方式除受氣候、傳統等因素影響[11],特定的地形因子也會直接影響人類利用土地的方式,例如坡度、坡向等。因此,從人類活動的角度看,地形因子與土壤有機碳儲量之間也有其必然的聯系。
土壤有機碳的計算模型較多,大體分為經驗模型[12-13]、統計模型[14-15]和機理模型[16-17]?;揪情g接的方法,目前還沒有一個方法可以快速測量或估算一個區域內的土壤有機碳儲量。采用地形因子等相對較易獲取的參數建模就是一個經常被采用的方法。在數字土壤制圖領域,土壤屬性的預測和計算,包括土壤有機碳的估算,地形因子經常會被納入模型[18-20]。遙感技術為快速獲取數字地面模型(DTM),提供了一個高效的技術手段[21]。
一個能夠精確預測土壤屬性的模型,還依賴于找到一個最適柵格大小和由其推導出的地形因子[22-23]。眾所周知遙感數據是柵格形式的,而地形因子的取值與柵格的大小息息相關,模型的結果也會隨之變化[24-27]。如何確定這些因子的最適柵格大小的問題仍然未解決,只有一些針對特定區域的研究和原則性的指南[28]。
通常DTM數據是最容易獲取的數據源,常規的做法是直接采用原始分辨率的數據,一般認為這樣會提高模型的準確度和精度[29]。但是不恰當的格柵大小通常會帶來一些問題[30]。如果柵格過大,地形因子的屬性會丟失太多的細節,進而失去預測能力。反之,如果柵格過小,由此導出的地形因子會帶有太多的細節,甚至是“噪聲”,這樣勢必會影響最終模型的精度[31]。同時,高分辨率數據由于擁有較高的空間精度,柵格非常小,數據量非常大,需要更大的存儲空間;模型會需要更多的計算時間,有的時候這種增長是指數級別的。一個合適的分辨率,應該是柵格尺寸足夠大,但又可以充分表達模型所需要的信息[22]。
預測土壤屬性采用哪些地形因子也是一個需要考慮的問題[32]。由DTM可以導出很多地形因子,一個模型采用哪些因子,通常均具有較大的隨意性和主觀性[33-34]。同一個地形因子對不同的土壤屬性有著不同的影響。反之,不同土壤屬性有屬于其特有的決定性的地形因子[35]。地形因子之間存在復雜的相互關系,單個因子在土壤模型中的重要性在多個地形因子組合模型中也會發生變化[36-37]。
利用DTM及相關因子預測SOC前人做出了大量工作,但大都基于一個固定的柵格大小或人為選取的因子或組合[38-39]。本研究試圖通過DTM及其推導的相關地形因子,綜合柵格大小、模型精度以及數據的冗余度等因素,通過數據挖掘技術,尋找最優因子組合和相匹配的最佳分辨率的土壤有機碳預測模型。
1.1 研究區概況
研究區位于56°9′~56°33′N及8°6′~10°57′E之間。是一條從西到東貫穿整個丹麥日德蘭半島(Jutland)的寬約45 km的條狀帶,總面積約7 100 km2(圖1)。整個區域地勢平緩,平均海拔為34 m,最高峰僅為152 m。該區域冬季和夏季平均溫度分別為0°C和16°C,年平均降雨量為500~800 mm。主要種植冬小麥、春大麥、油菜、牧草以及玉米。
由于歷史上冰川侵蝕活動,造成了研究區內復雜多樣的地貌類型[40]。據丹麥土壤分類,研究區范圍內的土壤質地從東部的重黏土和黏土到壤質土到西部的粗砂質土。東部地區的土壤由魏克塞冰期冰磧地貌發育而成,以壤質土為主。而西部主要由嚴重侵蝕和歷史相對較長的撒利冰磧地貌,以及一個相對較大的冰水平原組成,以砂質土為主。

圖1 研究區位置Fig. 1 Location of the study area
該區域包含有丹麥全部8種土壤類型,全部12種景觀類型中10種,全部12種地質類型中的11種,具有典型的代表性。
1.2 土壤采樣點和數據庫
研究中用到的土壤樣點主要來源于全丹麥土壤分類數據庫[41]。該數據庫建成于20世紀70年代中期,當時建庫的主要目的是為了土壤制圖和保護城市化進程中日益受到威脅的土地資源,由于該項目要求三年內完成,因此其目標主要集中在采樣和分析幾個重要和易分析的指標,如土壤質地和耕層(0~20 cm)土壤有機質。全國共采集36 000余個土壤樣品。在研究區域內共計有8 570個樣點數據,其中約75%,計6 362個樣點用來生成和優選模型,其余25%,計2 208個的樣點用來驗證模型。

圖2 采樣點分布圖Fig. 2 Distribution map of sampling sites
1.3 DTM數據
丹麥全國的DTM數據由國家環境部基于光探測與測量(Light Detection and Ranging,LiDAR)數據在2005—2007年間生成。采用不規則三角網方法從LiDAR點云數據中提取全國的地表高程,然后將TIN數據轉換為1.6m分辨率的柵格數據。
采用簡單求平均值的方法生成其他較低分辨率DTM柵格數據集,共采樣計71個,小于150 m的設計了41組,200~1 000 m之間每50 m取一組,1 000 m以上大約每100 m取一組,最小分組的分辨率為2 304 m?;贒TM計算其他地形參數之前,先對每個不同分辨率的柵格DTM數據進行填洼處理,以減少或避免在進行地形運算,特別是推導與水系網有關的地形參數時,由于細小洼和峰導致的錯誤或出現問題[42]。
1.4 導出變量
基于不同分辨率的DTM數據集,通過SAGAGIS計算其他地形相關因子。共導出21個地形因子參數,每個因子的說明見表1。
1.5 基于規則的數據挖掘模型
本研究使用澳大利亞Rulequest公司的數據挖掘工具Cubist 2.08生成SOC預測模型,這種模型利用線性的方法模擬非線性的現實。Cubist設計用來處理海量數據,它的數據挖掘模型不僅注重模型的預測精度,同時也重視模型的可解釋性。其生成的模型以一組規則集表達,每個規則采用如果滿足條件則使用一個線性方程的模式。當自變量滿足某一規則給定的條件時,它就使用該規則對應的多變量線性模型進行預測[43]。
Cubist模型利用相對坡位(RSP)、多尺度山谷指數(MRVBF)、高程(Elevation)和歸一化高度(Normalh)四個變量預測SOC含量。該模型由29個規則組成,每個規則給出一個條件和一個對應的多元線性模型。例如,第一個規則預測1758個樣點的SOC,這些樣點的取值范圍為0.08~540.1,平均值和估計誤差分別為20.315和7.662。該規則列出條件當MRVBF>8.810 939,并且RSP>0.227 911時,其對應的用來預測SOC的多變量線性回歸方程。從這條規則可以看出,這些樣點的SOC隨著RSP的增加而減少呈現負相關,隨著MRVBF、Elevation和Normalh的增加而增加。該模型的總體相對誤差和模型相關系數分別為0.54和

表1 模型地形因子列表Table 1 List of topographic factors derived by DTM
0.71。同時,模型還給出了變量在模型中貢獻率。貢獻率是指相對重要性和相對使用率兩個參數,相對重要性指變量在模型全部規則所有條件中出現的頻率,相對使用率指變量在多元線性方程中參與計算的頻率。在這個模型中RSP的相對重要性和相對使用率分別為89%和81%,較Normalh的9%和52%要高很多。
所有模型均是簡單性和精度之間的平衡。22個變量的所有可能的組合數高達4 194 303個,變量過多會引入太多的噪聲,增加模型的復雜程度。綜合模型復雜度和數據的計算量及存儲空間,選取不超過5個變量的組合是比較合適的。這種組合共計有35 442個,每個組合有71個分辨率,共計生成2 514 820個模型并進行計算。
以上所有組合通過Cubist運算獲得模型結果,每個模型均有對應的相關系數r值。對比所有模型r值,最大r值所在的因子組合與分辨率即為該因子組合和最佳分辨率。
2.1 數據基本統計特征
整體樣本的平均值和標準差分別為36.0 g kg-1和69.7 g kg-1。最小值、中位數和最大值分別為0.08 g kg-1、15.58 g kg-1和540.1 g kg-1。變異系數高達193.6%,說明數據整體變化幅度較大,整體為帶偏度的正態分布。盡管兩組數據的很多統計量有所不同,但通過柯爾莫諾夫—斯米爾諾夫檢驗(Kolmogorov-Smirnov test),訓練數據組和驗證數據組之間并不存在顯著性差異(99.9%)[44],說明兩組數據來自同一母體,驗證數據可以用來對模型進行驗證。
2.2 地形因子與分辨率對模型的影響
表2中列出了單因子在所有分辨率中的模型的r平均值、最大值以及最大值對應的分辨率。單個地形變量模型和柵格大小之間的關系表現出多樣化,并不總是負相關。大部分變量與格柵大小呈偏態的正態分布,如相對坡位(RSP)和水系網高程(Chnl_alti)。個別變量呈正相關,如匯指數(Convergence),隨著柵格的增大,模型的r值增大。也有部分變量與柵格的大小無關,呈隨機狀態,如水系網基準面(Chnl_base),還有部分變量與柵格沒有任何關系,其模型的r值在任何分辨率下均為0,如坡向。最好的地形因子為相對坡位(RSP),r平均值為0.272,最大值達到0.5。最差的為坡向,無論是何種分辨率,坡向的r值均為0,即坡向與SOC沒有任何關系。

表2 單因子模型r值及最佳分辨率Table 2 R and optimal resolution of single factor models
對單個地形因子模型,無論其與柵格大小的關系是正相關還是負相關,r最大值時的分辨率通常并不是最大或最小柵格。不同的變量有一個或多個最佳的柵格大小,例如,相對坡位(RSP)的最佳分辨為92.8m,歸一化高度(Normalh)則有2個分辨率,分別為12.8和16m。
任意多個因子的組合與單個因子的表現不同,多個因子的組合表現出了一致的規律,均為呈偏態的正態分布。從最高分辨率開始隨著柵格的增大,模型的r值增加至一個最大值,此處的分辨率范圍大約為 60~150 m。此后r與分辨率呈負相關,在1 500m附近r值基本達到穩定,之后隨著分辨率的改變,r值呈隨機變化狀態。因此無論使用哪些因子組合建模,分辨率均應在60~150m之間選取。

圖3 變量組合模型相關系數r值與分辨率的關系Fig. 3 Relationship between r of combination of variables with resolution
單因子模型r值的大小并不能決定其在因子組合模型中的重要性。即2個r值最大的單因子模型,它們組合后的模型的r值并不是最大的。單個因子r值最大的6個因子分別為相對坡位(RSP)、水系網高程(Chnl_alti)、山谷深度(Vall_depth)、歸一化高度(Standh)、地表曲率(Convexity)和高程(Elevation)(表2)。但是在篩選出的最佳因子組合模型中出現次數最多的6個因子是:水系網基準面(Chnl_base)、高程(Elevation)、水系網高程(Chnl_alti)、多尺度山脊指數(MRRTF)、歸一化高度(Normalh)和相對坡位(RSP)。事實上在最佳模型中出現的12個因子,并不是最好的12個單因子。最明顯的例子是多尺度山脊指數(MRRTF)因子,該因子與分辨率關系呈隨機分布狀態,r值總體上也偏低,但是在因子組合模型中該因子共出現了4次。
無論何種分辨率,因子的多少決定了r的總體趨勢,引入的因子越多,r值越大。當引用全部22個因子時所構建的模型,r值達到最大0.78(圖3),但是模型的預測能力并非如此。
2.3 SOC最優估算模型
通過對比r值,篩選出不同數量因子組合的最優模型和對應的分辨率。不同個數因子的最優模型列于表3,這些模型的r值變化見圖4。單個因子的模型為相對坡位(RSP)分辨率為 92.8 m。2個因子由相對坡位(RSP)和水系網基準面(Chnl_ base)組成,最適分辨率為 60.8 m。3個因子的模型為水系網高程(Chnl_alti),水系網基準面(Chnl_base)和多尺度山谷指數(MRVBF),最佳分辨率為64 m。有6組4個因子的組合模型其r均為0.71,分辨率從64 m至136 m不等。5個因子共有2個組合模型,r值為0.78,分辨率為152 m。每組均包含水系網高程(Chnl_alti)、高程(Elevation)、水系網基準面(Chnl_base)、多尺度山脊指數(MRRTF)四個因子,此外歸一化高度(Normalh)和中坡位(Midslppst)2個因子分在不同組中。同時還計算了全部22個因子組合模型的r值為0.78,最佳分辨率為40 m或64 m。

表3 不同數量因子最佳組合及分辨率Table 3 Optimal combination of different numbers of factors and resolution
為了確定最終采用的模型,使用預留的25% 計2 208個樣點對這些預選的模型的預測能力和有效性進行了檢驗。r值有著明顯的差異,22個因子模型的r值最差,甚至小于單個因子的r值(表3)。這可能是由于因子太多,引入的噪聲也隨之加大,從而無法真正總結內在的規律。驗證點的r值也是隨著因子數量的增多而增加,但r值最大的是4個因子的組合,共有2組,分辨率分別為64 m 和121.6 m??紤]到數據的存儲空間前者是后者的4倍,模型運算時間指數級增長,因此本文選擇相對坡位(RSP)、高程(Elevation)、歸一化高度(Normalh)和多尺度山谷指數(MRVBF)組成,柵格大小為121.6 m的模型為最優模型。
2.4 土壤有機碳含量空間分布特征
為了表達不同模型對原始樣點SOC的再現能力和相互間的對比,所有圖均采用相同色系和分級值。分級值為11、14、18和28,分別為全部原始8 570個樣點SOC值按從小到大排列后,20%、40%、60%和80%的分段值。這些模型生成的SOC總體空間分布格局是一致的。SOC的高值基本發生在濕地地區。除濕地外,SOC總體上西部較東部高。從空間上對比這些模型生成的SOC空間分布圖(圖5),1個和2個因子生成的圖形明顯綜合過度,粒度偏大,22個變量的圖形中噪聲非常明顯,4個和5個變量的綜合效果最好。

圖4 最優模型r曲線Fig. 4 Curve of r with resolutions of optimae model

圖5 不同模型參數生成的土壤有機碳圖Fig.6 Predicted maps of SOC

表4 克里格方法與模型模擬結果對比Table 4 Results comparison of fitting of the models with Kriging
2.5 與克里格預測模型對比
為了驗證模型的預測能力和空間表達能力,與通常采用的克里格空間插值方法生成的空間分布圖進行了對比。采用全局泛克里格、全局普通克里格、全局克里格以及普通克里格等多種空間插值方法生成空間分布圖(圖6)。利用2208個驗證點驗證其預測精度,r和均方根誤差(RMSE)范圍分別為0.34~0.47,64.6~67.3,與模型的結果相比差距較大。從空間分布圖也可以明顯看出,空間異質性未得到合理的表達,克里格方法生成的空間數據趨向于將數據進行均一化。從表4中的最大、最小以及方差也可以看出克里格生成的數據非常集中。

圖6 不同克里格方法生成的土壤有機碳空間分布圖Fig. 6 Predicted SOC distribution map relative to Kriging method
研究通過數據挖掘的方法,尋找最優的因子組合及最適柵格大小,構建丹麥典型區域土壤有機碳估算模型。結果表明不同的單個地形因子模型與柵格大小有不同的規律。絕大部分變量預測的r
值與格柵大小呈負相關,只有個別的呈正相關。
r最大值通常并未像預料的那樣出現在最大分辨率處。多個變量組合的模型與柵格大小呈偏態的正態分布,不同的變量組合最佳分辨率的位置也不同。最大的r值并不是出現在最高分辨率處,而是出現在60~150 m附近,因此無論何種因子的組合,選擇的分辨率不能低于200 m。總體上,變量越多,模型的r值越大,4到5個變量的組合的效果均能較好地預測SOC。但是由于噪聲的影響,超過4個變量的組合后,變量越多對未知數據的預測能力越差。綜合數據的存貯量和計算量、模型復雜度、預測精度以及空間表達能力,由4個因子相對坡位(RSP)、高程(Elevation)、歸一化高度(Normalh)和多尺度山谷指數(MRVBF)組合的,對應的分辨率121.6 m為SOC最優估算模型。
[1]Eswaran H,Vandenberg E,Reich P. Organic-carbon in soils of the world. Soil Science Society of America Journal,1993,57(1):192—194
[2]Lal R. Soil carbon sequestration to mitigate climate change. Geoderma,2004,123(1/2):1—22
[3]Post W M,Emanuel W R,Zinke P J,et al. Soil carbon pools and world life zones. Nature,1982,298 (5870):156—159
[4]Lal R. Soil carbon sequestration impacts on global climate change and food security. Science,2004,304 (5677):1623—1627
[5]Melillo J,Steudler P,Aber J,et al. Soil warming and carbon-cycle feedbacks to the climate system. Science,2002,298(5601):2173—2176
[6]Nichols J. Relation of organic carbon to soil properties and climate in the southern great plains. Soil Science Society of America Journal,1984,48(6):1382— 1384
[7]Hontoria C,Saa A,Rodríguez-Murillo J. Relationships between soil organic carbon and site characteristics in peninsular spain. Soil Science Society of America Journal,1999,63(3):614—621
[8]Percival H J,Parfitt R L,Scott N A. Factors controlling soil carbon levels in new zealand grasslands is clay content important? Soil Science Society of America Journal,2000,64(5):1623—1630
[9]Stevens A,van Wesemael B. Soil organic carbon stock in the Belgian Ardennes as affected by afforestation and deforestation from 1868 to 2005. Forest Ecology and Management,2008,256(8):1527—1539
[10]李凌浩. 土地利用變化對草原生態系統土壤碳儲量的影響. 植物生態學報,1998,22(4):300—302
Li L H. Effects of land-use change on soil carbon storage in grassland ecosystems(In Chinese). Acta Phytoecologica Sinica,1998,22(4):300—302
[11]Fisher M,Rao I,Ayarza M,et al. Carbon storage by introduced deep-rooted grasses in the south American Savannas. Nature,1994,371(6494):236—238
[12]Burke I C,Yonker C,Parton W,et al. Texture,climate,and cultivation effects on soil organic matter content in US grassland soils. Soil Science Society of America Journal,1989,53(3):800—805
[13]于東升,史學正,孫維俠,等. 基于1∶100萬土壤數據庫的中國土壤有機碳密度及儲量研究. 應用生態學報,2005,16(12):2279—2283
Yu D S,Shi X Z,Sun W X,et al. Estimation of China soil organic carbon storage and density based on 1∶1 000 000 soil database(In Chinese). Chinese Journal of Applied Ecology,2005,16(12):2279—2283
[14]Sims Z,Nielsen G. Organic carbon in montana soils as related to clay content and climate. Soil Science Society of America Journal,1986,50(5):1269—1271
[15]解憲麗,孫波,周慧珍,等. 中國土壤有機碳密度和儲量的估算與空間分布分析. 土壤學報,2004,41 (1):35—43
Xie X L,Sun B,Zhou H Z,et al. Organic carbon density and storage in soils of China and spatial analysis (In Chinese). Acta Pedologica Sinica,2004,41 (1):35—43
[16]Franko U,Oelschl?gel B,Schenk S. Simulation of temperature,waterand nitrogen dynamics using the model candy. Ecological Modelling,1995,81(1):213—222
[17]Li C,Frolking S,Crocker G J,et al. Simulating trends in soil organic carbon in long-term experiments using the dndc model. Geoderma,1997,81(1):45—60
[18]Hao Y,Lal R,Owens L,et al. Effect of cropland management and slope position on soil organic carbon pool at the north appalachian experimental watersheds. Soil and Tillage Research,2002,68(2):133—142
[19]McBratney A B,Mendon?a Santos M L,Minasny B. On digital soil mapping. Geoderma,2003,117(1/2):3—52
[20]陸曉宇,張洪江,程金花,等. 地形因子與人工林土壤有機碳密度的關系——以晉西黃土丘陵區為例. 東北林業大學學報,2013,41(1):48—50,58
Lu X Y,Zhang H J,Cheng J H,et al. Ralationship of topographic factors and soil organic carbon density under plantations:A case in loess hilly region in western Shanxi ProvinceChina(In Chinese). Journal of Northeast Forestry University,2013,41(1):48—50,58
[21]Mulder V L,de Bruin S,Schaepman M E,et al. The use of remote sensing in soil and terrain mapping — A review. Geoderma,2011,162(1/2):1—19
[22]Cavazzi S,Corstanje R,Mayr T,et al. Are fine resolution digital elevation models always the best choice in digital soil mapping? Geoderma,2013,195/196:111—121
[23]Gessler P,Chadwick O,Chamran F,et al. Modeling soil-landscape and ecosystem properties using terrain attributes. Soil Science Society of America Journal,2000,64(6):2046—2056
[24]Behrens T,Zhu A X,Schmidt K,et al. Multi-scale digital terrain analysis and feature selection for digital soil mapping. Geoderma,2010,155(3/4):175—185
[25]Greve M H,Greve M B,B?cher P K,et al. Generating a danish raster-based topsoil property map combining choropleth maps and point information. Geografisk Tidsskrift-Danish Journal of Geography,2007,107 (2):1—12
[26]Kim D,Zheng Y. Scale-dependent predictability of dem-based landform attributes for soil spatial variability in a coastal dune system. Geoderma,2011,164 (3/4):181—194
[27]Smith M P,Zhu A X,Burt J E,et al. The effects of DEM resolution and neighborhood size on digital soil survey. Geoderma,2006,137(1/2):58—69
[28]Shi X,Girod L,Long R,et al. A comparison of lidarbased dems and usgs-sourced DEMs in terrain analysis for knowledge-based digital soil mapping. Geoderma,2012,170:217—226
[29]Murphy P N C,Ogilvie J,Meng F-R,et al. Modelling and mapping topographic variations in forest soils at high resolution:A case study. Ecological Modelling,2011,222(14):2314—2332
[30]Thompson J A,Bell J C,Butler C A. Digital elevation model resolution:Effects on terrain attribute calculation and quantitative soil-landscape modeling. Geoderma,2001,100(1/2):67—89
[31]Sorensen R,Seibert J. Effects of DEM resolution on the calculation of topographical indices:TWI and its components. Journal of Hydrology,2007,347 (1/2):79—89
[32]Grunwald S. Multi-criteria characterization of recent digital soil mapping and modeling approaches. Geoderma,2009,152(3/4):195—207
[33]Florinsky I V,Eilers R G,Manning G R,et al. Prediction of soil properties by digital terrain modelling. Environmental Modelling & Software,2002,17 (3):295—311
[34]Simbahan G C,Dobermann A,Goovaerts P,et al. Fine-resolution mapping of soil organic carbon based on multivariate secondary data. Geoderma,2006,132 (3/4):471—489
[35]Peng Y,Knadel M,Gislum R,et al. Predicting soil organic carbon at field scale using a national soil spectral library. Journal of Near Infrared Spectroscopy,2013,21(3):213—222
[36]Adhikari K,Kheir R B,Greve M B,et al. Comparing kriging and regression approaches for mapping soil clay content in a diverse danish landscape. Soil Science,2013,178(9):505—517
[37]Greve M H,Kheir R B,Greve M B,et al. Quantifying the ability of environmental parameters to predict soil texture fractions using regression-tree model with GIS and lidar data:The case study of Denmark. Ecological Indicators,2012,18(7):1—10
[38]Kheir R B,Greve M H,Bocher P K,et al. Predictive mapping of soil organic carbon in wet cultivated lands using classification-tree based models:The case study of Denmark. Journal of Environmental Management,2010,91(5):1150—1160
[39]劉京,朱阿興,張淑杰,等. 基于樣點個體代表性的大尺度土壤屬性制圖方法. 土壤學報,2013,50(1):12—20
Liu J,Zhu A X,Zhang S J,et al. Large-scaled soil attribute mapping method based on individual representativeness of sample sites(In Chinese).Acta Pedologica Sinica,2013,50(1):12—20
[40]Schou A,Nielsen N. Atlas of Denmark:Text and photographs//Hagerup I H.The landscapes. 1949
[41]Madsen H B,Norr A H,Holst K A. The Danish soilclassification atlas of Denmark. Copenhagen:Rosendahl Press,1992
[42]Wang L,Liu H. An efficient method for identifying and filling surface depressions in digital elevation models for hydrologic analysis and modelling. International Journal of Geographical Information Science,2006,20 (2):193—213
[43]Minasny B,McBratney A B. Regression rules as a tool for predicting soil properties from infrared reflectance spectroscopy. Chemometrics and Intelligent Laboratory Systems,2008,94(1):72—79
[44]Holliday I E. Kolmogorov-Smirnov test(v1.0.3)in free statistics software(v1.1.23-r7). Office for Research Development and Education,2012
Optimal Estimation Model of Soil Organic Carbon Based on the Terrain Factor
GUO Zhixing1YUAN Yuzhi1GUO Yin1,2SUN Hui1,2CHAI Min1CHEN Zepeng3Mogens H. Greve4
(1 Guangdong Key Laboratory of Agricultural EnvironmentPollution Integrated Control,Guangdong Institute of Eco-environmental and Soil Sciences,Guangzhou 510650,China)
(2 College of Resources and Environment,Shanxi Agriculture University,Jinzhong,Shanxi 030800,China)
(3 Guangdong Tobacco Company,Guangzhou 510610,China)
(4 Department of Agro-ecology,Faculty of Science and Technology,Aarhus University,8830 Tjele,Denmark)
【Objective】As an important component of the global carbon pool,soil organic carbon (SOC)is the largest organic carbon pool in the terrestrial ecosystem and plays an extremely important role in the global carbon cycle and global warming. The SOC pool is subject to the impacts of both natural and human activities and sure closely related to terrain attributes or factors. There are a number of methodsfor calculation of SOC,which can roughly be sorted into three types,that is,empirical,statistical and mechanismones. But none of them can be used to predict or calculate reapidly soil organic carbon pool of a region rapidly. Remote sensing is an efficient technical means for fast acquisition of DTM,from which numerous information can be derived with the aid of GIS,thus making it possible to constitute a model for rapid calculation of SOC. 【Method】Based on the Digital Terrain Model(DTM)and the topographic attributesderived thereof,an optimal SOC prediction model was built up,taking into account factor combination and resolution with Cubist,a powerful data mining tool for generating rule-based models. This tool works on conditionspecific rules where the output is a set of rules and each rule has a specific multivariate linear model attached. Whenever a situation matches the condition of a rule,the associated model is used to calculate or predictevalues. A total of 8 570 soil samplescollected from the 7 100 km2study area were divided into two groups randomly,6 362 for training and the other 2 208 for model validation,a total of 2 514 820 models were constructed based on 71 selected resolutions and all possible combinations of no more than 5of the 22 terrains attributes. According to the correlation coefficient(R),terrain factors,varying in number,were selected,to form optimal models with their corresponding resolutions,Based on these models,SOC maps were plotted.【Result】Results show that the relationsships between resolution and single-factor models are diversified,it is not true that the higher the resolution,the better the model. The R value of a single-factor model is not necessarily the factor that determines its importance in a multi-factor model. All the multi-factor modelsexhibit a similar rule of skewed normal distribution. Each factor and its combination has a factorspecific optimal resolution,varying in the range of 60~150 m. For models composed of whatever factors,the resolution t be selected should not be lower than 200 m. The variable of the optimal single-factor model is RSP,with resolution being 92.8 m,the variables of the optimal two-factor model are RSP and Chnl_base with resolution being 60.8 m,while the variables of the three-factor model are Chnl_alti,Chnl_base andMRVBF,with resolution being 64 m. There are 6 four-factor models,with R being 0.71 and resolution varying in the range of 64 ~ 136 m,and 2 five-factor models with R being 0.78,and resolution being 152meters. Every model consists at least of Chnl_alti,elevation,Chnl_base and MRRTF,and in the 2 five-factor modelsNormalh or Midslppst is added. The R of all the models consisting of any four ro five of the 22 factors was calculated to be 0.78 with two optimal resolutions,i.e. 40 and 64 m. In general,the more the variables,the higher the R of the models. But owing to impact of the noise,models with more than four factors decine in predictive ability.Four to five is the appropriate number of factors in combination,making the models more capable of predicting SOC. Comparative analysis of the SOC maps plotted with the aid of global fan Kriging,global ordinary Kriging,global kriging and ordinary Kriging shows that regardless of the number of factors in the model,this method is better than all the four Kriging interpolation methods in prediction of spatial variation of SOC and prediction accuracy.【Conclusion】Takinginto comprehensive account storage space,amount of calculationm,sophistication of the model,accuracy of prediction and ability of spatial expression,the optimal model for the study region should be the four-factor model,consisting of relative slope position,elevation,normalheight and MRVBF,with resolution being 121.6 m.
Soil organic carbon(SOC);Digital soil mapping;Data mining;Digital Terrain Model (DTM);Terrain attribute;Optimal model
S158
A
10.11766/trxb201608150111
(責任編輯:檀滿枝)
* 廣東省科技計劃項目(2015B070701017,2014A040401059,2015A030401068)、國家自然科學基金項目(41601558)、廣東省科學院創新平臺建設專項資助 Supported by the Project of the Science and Technology of Guangdong Province(Nos. 2015B070701017,2014A040401059,2015A030401068),National Natural Science Fund(No. 41601558)and SPICC Program(The Scientific Platform and Innovation Capability Construction Program of GDAS)
郭治興(1966—),男,山西太谷人,博士,研究員,主要從事GIS應用研究。E-mail:zxguo@soil.cn
2016-08-15;
2016-11-09;優先數字出版日期(www.cnki.net):2017-01-03