孫亞洲,陳 杰*,吳克寧,李 玲,韓杏杏,王海洋
(1 鄭州大學水利與環境學院,鄭州 450001;2 中國地質大學(北京)土地科學技術學院,北京 100083;3 河南農業大學資源與環境學院,鄭州 450001)
在國內區域尺度數字化土壤制圖研究與實踐中,多數學者利用研究區成土因素以及地表人為干預情況作為環境協變量,構建各種土壤空間預測模型[1-6];部分研究者則基于樣點土壤如表層質地、各種物質含量、電導率、pH、土壤顏色和特征土層分布等發生學特性,以及各土壤樣點之間的空間關系,構建隨機模型實施土壤空間預測與數字化制圖[7-9]。無論采用何種技術途徑,數值化土壤分類(numerical soil classification)都是數字化土壤制圖的關鍵環節之一。
數值化土壤分類的重要作用主要表現為兩個方面:一是數值化分類結果可以定量揭示不同土壤之間在性狀特征上的相似程度和在發生學上的“親疏”關系;二是基于不同土壤類型屬性空間上相對差異的數值化表達,可以直接用于土壤-環境協變量關系的定量擬合[10-14]。在以往的數值化土壤分類實踐中,常用的算法模型有 3種,分別為相似性層級分類、VLADIMIR 半自動分類和模糊連續分類模型[15-20]。其中,實現模糊連續的技術途徑主要有兩種。模糊聚類是一種自動分類方法,不以現有的常規分類系統為基礎。模糊 c-均值算法(FCM:fuzzy c-means algorithm)(也稱模糊 k-均值算法)或模糊 c-均值聚類(也稱模糊k-均值聚類),是土壤科學中應用最廣泛的模糊分類方法之一[21-25]。
最大限度地發揮土壤診斷層、診斷特性的作用,讓數值化土壤分類結果與譜系式層級土壤分類單元具有最大程度的一致性,無疑是提高數字化土壤制圖與常規土壤圖參比水平的必由之路。本文以分布于河南省境內的雛形土為研究對象,基于診斷層和診斷特性構建雛形土發生特性最小數據集,確立研究區中心土壤類型,并應用模糊連續分類算法模型實施數值化土壤分類,進而完成雛形土不同土族之間分類距離的計算,為土壤空間預測與數字化土壤制圖提供定量信息,以在提高數字化土壤制圖與常規土壤圖的參比基礎、提升數字化土壤圖輸出結果的應用前景方面提供技術支持[25]。
河南省地處黃河中、下游,華北平原的南端,橫跨我國第二、三兩級地貌臺階。地貌類型包括中低山地、丘陵、山間盆地、山前沖積平原和黃泛平原等。由于地處暖溫帶與北亞熱帶的過渡地區,生物氣候條件多樣,地形地貌類型繁多且地層與巖性復雜,水文及水文地質情況各異,同時河南省具有長期水耕與旱耕的悠久歷史,獨具特色的自然和人為條件決定了省域內復雜多樣的土壤形成過程和土壤分布特征。雛形土是指土壤發育程度較弱,并以雛形層為主要診斷層的土壤。在中國土壤系統分類中,除了具有明顯其他診斷層、診斷特性的土綱和無診斷特性的新成土之外,其余的發育弱而未成熟的土壤盡歸雛形土綱中[26-28]。雛形土在河南省境內分布廣泛,相對集中于省內黃淮海平原地區。根據《中國土系志·河南卷》統計,全省雛形土分布面積7. 7萬km2,約占河南省土壤總面積的60%[29]。
本研究所用的土壤基礎數據來源于國家科技基礎性專項 “我國土系調查與《中國土系志》編制”項目中的“河南省土系調查與《中國土系志·河南卷》編制”課題(編號:2008FY110600)。圖1是2009年12月至2013年3月在河南省境內布設的97個雛形土土系調查樣點分布圖,樣點的信息包括土壤分布環境與條件、形態特征及空間位置等[29]。

圖1 河南省境內雛形土土系調查樣點分布示意圖Fig.1 Spatial distribution of sampled cambisol series in Henan Province
對《中國土壤系統分類檢索(第三版)》中雛形土各級分類單元的設置以及分類標準進行統計分析,排除與雛形土分類無關的土壤發生學屬性,然后確定雛形土綱中用于劃分不同層級分類單元的土壤診斷層和診斷特性,共16個診斷層和診斷特性被用于河南省境內的雛形土土族以上各分類單元的劃分(表1)[26-27]。其中,用于劃分土綱的屬性有1個,劃分亞綱的有 2個,劃分土類的有 3個,劃分亞類的有 6個,劃分土族的有4個。

表1 用于劃分河南省境內雛形土各級分類單元的診斷層、診斷特性Table 1 Diagnostic horizons and characteristics of cambisols in Henan province
對于樣點土壤而言,在某一分類層級上特定診斷層、診斷特性被使用與否是其賦值的主要依據。獨立土壤診斷層和診斷特性,例如暗沃表層,如果被用于樣點土壤分類就賦值為1,未使用則為0;對于土壤水分狀況、土壤溫度狀況、控制層段土壤顆粒大小、土壤礦物學特性等組合土壤屬性指標,將其賦予不同數值以最大限度地表現土壤屬性差異、提升數值化土壤分類效果[25]。例如,將河南省境內分布的雛形土的土壤溫度狀況包括熱性土壤溫度狀況和溫性土壤溫度狀況,分別賦值為1.2和0.8(表2)。

表2 數值化土壤分類因子賦值舉例Table 2 Value assignment examples of indexes of soil family in numerical soil classification
中國土壤系統分類是譜系式層級分類系統,不同的診斷層、診斷特性在不同的層次分類單元劃分時發揮作用。對于參與土壤分類的土壤發生學屬性,其作用在劃分不同土壤、不同層級的分類單元時是不一樣的;對于同一種土壤,不同的發生學屬性在不同層級的分類單元劃分中的作用也是不一樣的。某些診斷層、診斷特性,只用于某些特定土壤類型的劃分,譬如雛形土的雛形層,只能用于區分研究區內的雛形土,而不能用于同一地區其他土綱及其下屬單元的劃分。在同一土綱內,不同發生學屬性被用于不同層級的單元劃分,但在不同土綱之間,同樣的診斷特性可用于劃分不同層級的土壤分類單元,譬如土壤水分狀況可以在一個土綱中被用于劃分亞綱,而在另一個土綱中則被用來劃分亞類甚至更低級單元。
由于用于高層級分類單元劃分的診斷層、診斷特性在同一土綱中具有更廣泛的差異性,可以最先把土壤類型在高級層級區分開來,之后的較低層級的單元續分都是在此基礎上進行的。如果將不同層次間的離散分類轉換為同一層級上的連續分類,應該賦予用于傳統分類中高層級單元劃分的發生學屬性更高的權重,層級越低,在連續的數值分類中,土壤發生學屬性的分類權重就越低(表3)。

表3 數值化分類因子在用于不同分類層級時的權重分配Table 3 Factor weights of different classification hierarchies in Numerical Soil Classification
毋庸置疑,分類層級越低,分類單元蘊涵的分類信息也就越豐富,參與的診斷層、診斷特性以及其他輔助屬性也就越多,這就為定量分析不同分類單元之間的發生學聯系提供了堅實的基礎。
本研究采用模糊 k-均值算法模型實施土壤數值化分類。對于一組土壤樣本而言,模糊 k-均值算法模型的輸出結果包括聚類類別數量、中心土族及其樣本土壤對于中心土壤的模糊隸屬關系(fuzzy memberships)或樣本土壤與中心土壤類型之間的分類距離(taxonomic distance)。本研究將之前文中的定量分類因子作為模糊連續分類的輸入參數,以基于分類距離的算法輸出結果作為討論對象。具體的模糊 k-均值算法步驟參閱文獻[23-24, 30-32]。
本研究計算的分類距離為歐氏距離(Eucilidean distance):

式中:d12為土壤樣本與中心土壤之間的分類距離,X1k、X2k分別為兩個土壤樣本樣點的第k個屬性值。分類距離越大,表明土壤樣本與中心土壤類型之間性狀相似性越小,發生學關系越遠;分類距離越小,表明土壤樣本與中心土壤類型之間相似性越大,發生學聯系越緊密。
本研究在R語言中運用k-均值算法模型計算土壤樣本與中心土壤之間的分類距離,基于分類距離判斷土壤樣本類別的歸屬[33]。
運用模糊k-均值模型將研究區分屬于79個土系的97個土壤樣點聚類為6個類別,各類別的發生學屬性質心值見表4。
基于表 4中各聚類質心的診斷層、診斷特性數據,依照《中國土壤系統分類檢索(第三版)》[27],將各聚類中心土族分別確認為壤質混合型溫性非酸性-石灰底銹干潤雛形土(中心土族1)、黏壤質混合型熱性非酸性-普通淡色潮濕雛形土(中心土族2)、壤質混合型熱性非酸性-普通淡色潮濕雛形土(中心土族3)、黏壤質混合型熱性-普通砂姜潮濕雛形土(中心土族 4)、壤質混合型溫性非酸性-石灰簡育干潤雛形土(中心土族5)、壤質混合型溫性非酸性-石灰淡色潮濕雛形土(中心土族6)。
研究區雛形土 6個中心土族之間分類距離的計算結果見表5,樣點土壤與各中心土族之間的分類距離見表6。
表5數據顯示,中心土族2、3(黏壤質混合型熱性非酸性-普通淡色潮濕雛形土、壤質混合型熱性非酸性-普通淡色潮濕雛形土)之間的分類距離最小,表明二者在土壤診斷特征上具有最大的相似性,在成土過程中具有最密切的發生學聯系;而中心土族 4、5(黏壤質混合型熱性-普通砂姜潮濕雛形土、壤質混合型溫性非酸性-石灰簡育干潤雛形土)之間的分類距離最大,二者的土壤診斷特征的相似性最低、成土過程中的發生學聯系最弱。
據表6數據統計,與第1個中心土壤剖面距離最小的土壤剖面樣本有36個,與第2個中心土壤距離最小的土壤剖面樣本有4個,與第3個中心土壤距離最小的土壤剖面樣本有3個,與第4個中心土壤距離最小的土壤剖面樣本有4個,與第5個中心土壤距離
最小的土壤剖面樣本有47個,與第6個中心土壤距離最小的土壤剖面樣本有3個。

表4 研究區雛形土聚類類別發生學屬性質心值Table 4 Centroid values of soil genetic properties of different cambisol clustering categories in study region

表6 研究區雛形土樣點土壤與各中心土族之間的分類距離Table 6 Taxonomic distance matrix between sampled and centroid soil families of cambisol in study region
通過對照97個樣點土壤在《中國土系志·河南卷》中的土族劃分及其亞類、土類級別的歸屬,檢驗本研究中與特定中心土族分類距離最小的一組樣點土壤在《中國土系志·河南卷》中是否同屬一個亞類或者土類。結果表明,其中與第5個中心土壤(壤質混合型溫性非酸性-石灰簡育干潤雛形土)分類距離最小的 47個土壤剖面樣本包含且只包含所有的簡育干潤雛形土(表 7),也就是說以這個中心土族為代表的聚類類別中,樣點土壤均來自于簡育干潤雛形土,并且所有的簡育干潤雛形土都屬于這個類別,表明其常規土壤分類在這種土族劃分上較為合理,現有的劃分簡育干潤雛形土的診斷層和診斷特性可以區分該土類與其他土類,并且土類內部的相似性很高;而《河南省土系志》中的同屬淡色潮濕雛形土的土族樣本在數值化分類中被分別劃分為第2、3、6三個不同的聚類類別(表7),表明傳統的譜系式層級分類系統中的淡色潮濕雛形土的劃分標準不合理,基于現有的診斷層和診斷特性劃分的淡色潮濕雛形土的內部差異很大,可以把淡色潮濕雛形土拆分為多個土類,或者增加限定條件。

表7 研究區雛形土樣本土壤數值化分類結果與中心土族參比Table 7 Reference between results of numerical soil classification and centroid soil families of cambisol in study region
1) 本研究將《中國土系志·河南卷》中的 97個雛形土土壤樣點進行 k-均值聚類,依照《中國土壤系統分類檢索(第三版)》將6個聚類中心土族分別定為壤質混合型溫性非酸性-石灰底銹干潤雛形土、黏壤質混合型熱性非酸性-普通淡色潮濕雛形土、壤質混合型熱性非酸性-普通淡色潮濕雛形土、黏壤質混合型熱性-普通砂姜潮濕雛形土、壤質混合型溫性非酸性-石灰簡育干潤雛形土和壤質混合型溫性非酸性-石灰淡色潮濕雛形土。
2) 本研究基于河南省境內的雛形土土壤樣本的診斷層、診斷特性信息,應用模糊連續分類算法模型實施數值化土壤分類,通過檢驗數值化分類結果與譜系式層級土壤分類單元的一致性,可以檢驗傳統譜系式層級分類系統的合理性。結果表明,壤質混合型溫性非酸性-石灰簡育干潤雛形土的土壤分類標準較為合理;淡色潮濕雛形土的分類標準不合理。
[1] 趙量. 基于模糊集理論的土壤——景觀定量關系提取及制圖應用[D]. 南京: 南京農業大學, 2007
[2] 周銀. 基于決策樹方法的縣級土壤數字制圖研究[D]. 杭州: 浙江大學,2011
[3] 郭澎濤. 丘陵山地預測性土壤制圖研究[D]. 重慶: 西南大學, 2009
[4] 張春弟. 模糊土壤制圖的研究和應用[D]. 武漢: 華中農業大學, 2014
[5] 王良杰. 基于GIS的中比例尺數字土壤制圖研究[D]. 南京:南京農業大學,2009
[6] 王琴. 基于土壤圖的土壤與環境關系的獲取及推理制圖[D]. 武漢: 華中農業大學, 2013
[7] 劉鵬飛. 基于分類距離的數字土壤制圖技術的研究[D].鄭州: 鄭州大學,2011
[8] 李立東, 陳杰, 宋軒, 等. 空間回歸模型在區域數字化土壤制圖中的應用——以河南封丘縣為例[J]. 土壤學報,2013, 50(1): 21-29
[9] 章明奎, 夏建強, 符娟林. 基于土層空間變異性的大比例尺土壤調查制圖研究[J]. 浙江大學學報(農業與生命科學版), 2006, 32(3): 346-349
[10] Carré F. and McBratney A. B. Digital terron mapping[J].Geoderma, 2005, 128: 340-353
[11] Carré F. and Jacobson M. Numerical classification of soil profile data using distance metrics[J]. Geoderma, 2009, 148:336-345
[12] 王恒欽, 潘劍君, 盧浩東, 等. 診斷層和診斷特性與景觀關系探討——以江蘇省句容某樣區為例[J]. 土壤,2015, 47(4): 758-764
[13] 邱霞霞, 李德成, 趙玉國, 等. 基于不同土壤分類系統的土壤景觀格局分析——以我國西北黑河流域中游地區為例[J]. 土壤, 2016, 48(5): 1022-1031
[14] 黃魏, 羅云, 汪善勤, 等. 基于傳統土壤圖的土壤—環境關系獲取及推理制圖研究[J]. 土壤學報, 2016, 53(1):72-80
[15] Rayner J H. Classification of soils by numerical methods[J].Journal of Soil Science, 1966, 17:79-92
[16] Carré F. and Girard M.C. Quantitative mapping of soil types based on regression kriging of taxonomic distances with landform and land cover attributes[J]. Geoderma,2002, 110: 241-263
[17] 劉鵬飛, 宋軒, 劉曉冰, 等. 基于k-均值算法模型的區域土壤數值化分類及預測制圖[J]. 生態學報, 2012,32(6):1846-1853
[18] 劉曉冰. 區域數字土壤制圖方法對比研究[D]. 鄭州: 鄭州大學,2013
[19] 劉超, 盧玲, 胡曉利. 數字土壤質地制圖方法比較——以黑河張掖地區為例[J]. 遙感技術與應用, 2011,26(2):177-185
[20] 韓衛東. 耕地土壤肥力數字化制圖方法對比研究[D]. 杭州: 浙江大學,2014
[21] De Gruijter J J, McBratney A B. A modified fuzzy k-means method for predictive classification[C] // Bock H H.Classification and related methods of data analysis.Amsterdam: Elsevier,, 1988: 97-104
[22] Verheyen K, Dries A, Hermy M, et al. High-resolution continuous soil classification using morphological soil profile descriptions[J]. Geoderma, 2001, 101:1-48
[23] 檀滿枝, 陳杰. 模糊邏輯在土壤連續分類和制圖表達中的應用及展望[J]. 土壤學報, 2009, 46(1):137-143
[24] 檀滿枝, 陳杰. 模糊 c-均值算法在區域土壤預測制圖中的應用術[J]. 土壤學報, 2009, 46(4): 571-577
[25] 孫亞洲. 基于分類距離的土壤系統分類土族單元劃分研究[D]. 鄭州: 鄭州大學,2017
[26] 龔子同, 張甘霖, 陳志誠, 等. 土壤發生與系統分類[M].北京: 科學出版社, 2007
[27] 中國科學院南京土壤研究所土壤系統分類課題組,中國土壤系統分類研究協作組,中國土壤系統分類檢索(第三版)[M]. 合肥: 中國科學出版社, 2001: 161-180
[28] 李德成, 張甘霖. 中國土壤系統分類土系描述的難點與對策[J]. 土壤學報, 2016, 53(6): 1-8
[29] 吳克寧, 李玲, 鞠兵, 等. 中國土系志·河南卷[M]. 北京:科學出版社, 2017
[30] McBratney A B, De Gruijter J J. A continuum approach to soil classification by modified fuzzy k-means with extragrades[J]. Journal of Soil Science, 1992, 43:159-175
[31] De Gruijter J J, Walvoort D J J, van Gamsb P F M.Continuous soil maps-A fuzzy set approach to bridge the gap between aggregation levels of process and distribution models[J]. Geoderma, 1997, 77:169-95
[32] McBratney A B, Odeh, et al. Application of fuzzy sets in soil science: fuzzy logic, fuzzy measurement, and fuzzy decisions[J]. Geoderma, 1997, 77:85-113
[33] 徐建華. 現代地理學中的數學方法[M]. 北京: 高等教育出版社, 2002: 71-72