




摘" 要:為提高土壤屬性數字制圖預測精度,以及隨著遙感環境變量數據量的增加、算力的增強和開源深度學習框架的普及,數字土壤制圖正在從傳統的知識驅動模型向數據驅動的人工智能深度學習模型轉變。該文以土壤關鍵屬性有機碳為例,分析歸納土壤有機碳數字制圖深度學習模型的理論基礎、模型結構、亟待解決的有關環境變量空間上下文信息和多模態數據整合及模型可解釋性等問題,旨在促進人工智能深度學習模型在第三次全國土壤普查土壤屬性制圖中的應用。
關鍵詞:數字土壤制圖;深度學習;神經網絡;土壤屬性;土壤有機碳
中圖分類號:S127" " " 文獻標志碼:A" " " " " 文章編號:2096-9902(2024)12-0011-05
Abstract: In order to increase the prediction accuracy of digital mapping model of soil properties, accompanied by the increase in data quantity especially remote sensing environmental variables, the improvement of computing power, and the popularization of deep learning frameworks, the digital mapping model of soil propertiesis transitioning from traditional knowledge-driven models to data-driven artificial intelligent deep learning models. This article takes the key property of soil organic carbon as an example to analyze and summarize the theoretical basis, model structure, integration of relevant environmental variable spatial context information and multimodality data that urgently needs to be solved, and interpretability of deep learning models. The aim is to promote the application of artificial intelligent deep learning models in soil properties digital mapping of the Third National Soil Survey.
Keywords: digital soil mapping; deep learning; neural network; soil properties; soil organic carbon
土壤屬性圖是基于像元或柵格表達土壤物理、化學、生物等性質的地理空間分布信息的模型,它是通過一組圖例和規則(如地圖投影、符號、文本)建立的真實土壤實體的比例尺模型。通過土壤屬性圖來發現和共享關于土壤屬性的質量/數量的位置、關系、分布模式及趨勢等信息,能更好地服務于土壤資源的管理與開發利用。現代土壤屬性圖是通過數字土壤制圖(DSM)方法/模型來實現的。模型的預測制圖精度越高,即驗證指標決定系數(R2)越高,均方根誤差(RMSE)和平均絕對誤差(MAE)等越低,則產生的土壤屬性圖越有實用價值。為此,土壤學家和數字制圖工作者想方設法開發出幾十種數字土壤制圖模型,以求提高土壤屬性預測制圖精度。
當前,數字土壤制圖模型的環境變量,如遙感大數據越來越容易獲取、云計算等平臺提供了越來越強大的算力、R和Python語言等的開源人工智能(AI)深度學習(DL)框架逐漸普及,這些因素為應用深度學習模型對土壤屬性進行預測制圖提供了條件,從而促進DSM模型從傳統的知識驅動模型(如地統計學模型等)向數據驅動的AI模型(如隨機森林(RF)和深度學習中的卷積神經網絡(CNN)等)轉變,與此同時,人工智能深度學習模型(AI-DL)的預測精度也在不斷提高。
國務院第三次全國土壤普查領導小組辦公室推薦了5種數字土壤制圖方法/模型[1]:地統計學模型(如普通克里格、回歸克里格)、確定性插值(如逆距離加權法)、數理統計(如多元線性回歸)、機器學習(如RF、CNN)和模糊推理方法。《第三次全國土壤普查土壤屬性圖與專題圖編制技術規范(修訂版)》中指出,“對一般面積大小的農業區縣,表層樣點數平均達1 000個以上,一般決定系數R2應大于0.5,RMSE數值越小越好”。當一個農業區縣土壤調查采樣方案一定時,樣點數相同的條件下,采用更為先進的深度學習模型,將有望能進一步提升模型預測精度。本文在介紹數字土壤制圖深度學習模型理論的基礎之上,以土壤關鍵屬性有機碳為例,分析3種常用的AI-DL模型:多層感知機、卷積神經網絡、兩分支神經網絡,并指出深度學習模型亟待改進的地方,旨在推動AI-DL模型在土壤屬性制圖中的應用,并為第三次全國土壤普查土壤屬性圖編制提供參考。
1" 土壤屬性數字制圖深度學習模型的理論基礎
數字土壤制圖方法/模型是以土壤發生學理論為基礎,以定量的土壤-景觀關系模型(從俄國土壤學家道庫恰耶夫和美國土壤學家Jenny的概念公式,發展到“scorpan”概念模型[2])為依據的現代預測制圖技術。“scorpan”概念模型表達式如下
S=f(C,O,R,P,a,n)。
“scorpan”模型將成土因素中的氣候(C)、生物(O)、地形(R)、母質(P)、時間(a)和空間位置(n)作為預測因子,來建模土壤屬性(S)在空間分布中的大尺度趨勢性,用空間自相關模型來建模除去趨勢后的殘差的隨機性特征,通常要求殘差滿足地統計學的內稟平穩假定。
人工智能包括機器學習(ML),深度學習是ML的一個重要的分支領域。深度學習是從數據中學習表示的一種新方法,它利用經過大數據集訓練過的多層神經網絡去解決復雜的信息處理任務(如回歸、分類等問題)。深度學習正在對科學技術和生產力產生革命性的促進作用[3-4]。
自20世紀90年代以來,AI機器學習模型(用AI-ML表示),如RF、支持向量機(SVM)、Cubist、XGBoost和地理加權回歸等在DSM中流行起來,其中RF在土壤有機碳制圖中應用最為廣泛[5-8]。但是AI-ML模型的輸入變量是土壤采樣點對應的遙感環境變量數值組成的向量(圖1(a))。它是由土壤采樣點與遙感環境變量圖像進行空間疊置分析后得到采樣點對應的單個像元值組成的。由于該類向量數據沒有空間上下文信息,以RF為代表的AI-ML模型不具備整合土壤采樣點周圍遙感環境變量圖像空間上下文信息的能力,限制了景觀環境信息對土壤有機碳預測性能的提升[9]。相反,AI-DL模型,如CNN輸入的是遙感環境變量圖像的3D張量(圖1(b)),使得AI-DL模型具有整合遙感環境變量空間上下文信息的能力。人工智能機器學習模型通常被稱為淺層學習模型,而深度學習被認為是深層學習模型,AI-DL比AI-ML具有更強的學習能力[9]。
2" 土壤有機碳數字制圖深度學習模型結構
土壤碳(SC)包括有機碳(SOC)和無機碳(SIC),其中,SOC是土壤的關鍵屬性之一,它與土壤肥力、功能、生態以及氣候變化等密切相關。對土壤有機碳的高精度空間建模、預測與制圖是土壤時空變化研究中的重要科學問題[10]。從2019年開始,有3種人工智能深度學習模型被應用到土壤有機碳制圖:①深度全連接網絡(DNN),該神經網絡采用的是多層感知機(MLP)架構;②CNN;③循環神經網絡(RNN)[11-14],下面進行分述。
2.1" 多層感知機
多層感知機MLP架構的AI-DL模型(圖2)輸入變量是土壤采樣點位置的遙感環境變量像元所組成的向量,該模型本質上是一個多元非線性回歸,它已成功應用于南非(10個隱藏層)和全球(3個隱藏層)土壤有機碳制圖,且預測性能優于RF和SVM等AI-ML數字土壤制圖模型[14-15]。
2.2" 單分支卷積神經網絡
單分支卷積神經網絡是目前土壤有機碳數字制圖常采用的AI-DL模型(圖3[8]),并被列為第三次全國土壤普查土壤屬性制圖的備選模型[1]。表1列出了不同研究者采用的CNN模型預測土壤有機碳的神經網絡結構參數[7,9,16,16-20]。卷積神經網絡模型已經列入到第三次全國土壤普查土壤屬性制圖與專題技術規范中的數字土壤制圖的備選模型[1]。目前,CNN模型預測不同研究區土壤有機碳空間分布時,其網絡結構參數(卷積層數、最大池化層數、Dropout層數、全連接層數和拉平層數)的設置還不完全相同。
單分支CNN結構的缺陷是:遙感、GIS等環境變量圖像中的空間上下文窗口大小必須一致,才能以給定維度(窗口的高、寬和通道數)的3D張量形式輸入到神經網絡中。遙感、GIS數據的空間分辨率通常是不一致的,如Landsat 9 OLI-2的多光譜波段空間分辨率為30 m,Sentinel -2A MSI多光譜波段空間分辨率為10 m或20 m。處理不同空間分辨率的遙感、GIS等環境變量圖像時要將其重采樣到相同的空間分辨率。單分支CNN網絡結構輸入的遙感、GIS等環境變量圖像空間分辨率是經過了重采樣處理,相應地遙感環境變量空間上下文信息也經過了重采樣處理,這可能會導致一些信息的丟失。
2.3" 兩分支卷積神經網絡
如果將土壤有機碳制圖的神經網絡模型設計為2個分支(圖4[20]),就可以將具有時間序列特征的氣候、物候等變量數據在采樣點對應的單個像元值組成數值向量,輸入到一個單獨的非卷積神經網絡分支(如MLP)中;較高空間分辨率的遙感環境變量數據仍然以3D張量的形式輸入到CNN分支。2個分支的輸出經過連接(Concatenate)后輸入到全連接層中。Zhang等[19]采用兩分支CNN網絡結構進行土壤SOC數字制圖,其中一個分支是卷積模塊,用于捕獲遙感環境變量(地形、植被)空間上下文信息。另一個分支是長短期記憶(LSTM)模塊,用于捕獲與土壤有機碳相關的物候變量,因為物候變量是時間序列變量,因此采用了RNN中的LSTM結構。
3" 土壤有機碳數字制圖的深度學習模型存在的問題
3.1" 遙感環境變量空間上下文信息和多模態數據整合的問題
遙感環境變量空間分辨率固定的情況下,輸入CNN的窗口大小就決定了輸入到CNN中的遙感環境變量空間上下文信息的多少。極端情況下,當窗口設定為1×1,則遙感環境變量圖像只有一個像元(即土壤采樣點所在的像元)值輸入CNN,1個像元值是不具有空間上下文信息的。由表1可知,數字土壤制圖工作者設置的遙感環境變量空間上下文窗口的大小是多種的,如3×3……31×31等[9,16,21]。隨著窗口增大,輸入CNN的遙感環境變量空間上下文信息增多,數據量增大,與此同時,神經網絡模型參數也將增多,模型過擬合風險也隨之增大[9]。Yang等[16]認為,窗口大小與輸入CNN模型的遙感環境變量空間上下文信息密切相關,最優的窗口應與環境變量對土壤發育的影響尺度相關聯。但是,遙感環境變量空間分辨率對最優窗口大小的影響規律仍不清楚,遙感環境變量空間上下文窗口對AI-DL模型的預測性能的影響以及最優窗口的選擇(即遙感環境變量空間上下文窗口效應)有待深入研究。
土壤普查以及各種專題調查所產生的數據(包括歷史數據,如第二次全國土壤普查數據、現有數據)具有不同的模態,如文本(土壤普查報告、科技論文等)、圖像(空、天、地遙感影像等)、圖形(土壤圖、土壤屬性圖、土壤專題評價圖等),以及第三次全國土壤普查時的調查視頻等,如何對這些多模態數據進行整合,以實現土壤屬性的高精度預測,這是AI-DL模型所面臨的一個重要挑戰。
3.2" 深度學習模型的可解釋性問題
人工智能學習過程中的基礎問題是泛化和可解釋性問題[22]。AI-DL和AI-ML模型是數據驅動的空間預測模型,被認為是“黑箱”和“灰箱”模型,而傳統地統計學模型是知識驅動模型,被認為是“白箱”模型[7-8,18]。“白箱”模型在透明度和可解釋性方面要高于“灰箱”和“黑箱”模型。盡管以CNN為代表的AI-DL模型在土壤有機碳預測精度方面比AI-ML和地統計學模型有了很大提高,但是,其可解釋性仍不如AI-ML和地統計學模型。因此,在提升數字土壤制圖預測精度的同時,增強可解釋性已經成了當前AI-DL模型亟待解決的重要問題[23]。
參考文獻:
[1] 國務院第三次全國土壤普查領導小組辦公室.第三次全國土壤普查土壤屬性制圖與專題技術規范(修訂版)[Z].第三次全國土壤普查技術規程,2023:378.
[2] ARROUAYS D, MCBRATNEY A, BOUMAS J, et al. Impressions of digital soil map: The good, the not so good, and making them even better[J].Geoderma Regional,2020(20):e00255.
[3] CHOLLET F. Deep learning with Python[M].Manning Publications,2021.
[4] BISHOP C M, BISHOP H. Deep learning: Foundations and Concepts[M]. Springer,2024.
[5] WADOUX A M J C, HEUVELINK G B M, LARK R M, et al. Ten challenges for the future of Pedometrics[J].Geoderma,2021(401):115155.
[6] WADOUX A M J C, ODEH I O A, MCBRATNEY A B. Overview of Pedometrics[J]. Encyclopedia of Soils in the Environment (Second Edition), 2023(4): 471-485.
[7] GRUNWALD S. Grand challenges in Pedometrics-AI research[J]. Frontiers in Soil Science,2021(1):714323.
[8] GRUNWALD S. Artificial intelligence and soil carbon modeling demystified: power,potentials, and perils[J].Carbon Footprints,2022(1):5.
[9] PADARIAN J, MINASNYB, MCBRATNEY A B. Using deep learning for digital soil mapping[J].Soil,2019(5):79-89.
[10] 張甘霖,史舟,朱阿興,等.土壤時空變化研究的進展與未來[J].土壤學報,2020,57(5):1060-1070.
[11] TAO F, ZHOU Z, HUANG Y, et al. Deep learning optimizes data-driven representation of soil organic carbon in earth system model over the conterminous United States[J].Frontiers in Big Data,2020,3(17):1-15.
[12] ODEBIRI O, MUTANGA O, ODINDI J, et al. Deep learning approaches in remote sensing of soil organic carbon: A review of utility, challenges, and prospects[J]. Environmental Monitoring amp; Assessment,2021(193):802.
[13] ODEBIRI O, ODINDI J, MUTANGA O. Basic and deep learning models in remote sensing of soil organic carbon estimation: A brief review[J]. International Journal of Applied Earth Observations and Geoinformation,2021(102):102389.
[14] ODEBIRI O, MUTANGA O, ODINDI J. Deep learning-based national scale organic carbon mapping with Sentinel-3 data[J]. Geoderma,2022(411):115695.
[15] PADARIAN J, MINASNY B, McBRATNEY A B, et al. Additional soil organic carbon storage potential in global croplands[J]. Soil,2021.
[16] YANG L, CAI Y Y, ZHANG L, et al. A deep learning method to predict soil organic carbon content at a regional scale using satellite-based phenology variables[J].International Journal of Applied Earth Observations and Geoinformation,2021(102):102428.
[17] WADOUX A M J C, PADARIAN J, MINASNY B. Multi-source data integration for soil mapping using deep learning[J].Soil,2019(5):107-109.
[18] PADARIAN J, McBRATNEY A B, MINASNYB. Game theory interpretation of digital soil mapping convolutional neural networks[J]. Soil,2020(6):389-397.
[19] ZHANG L, CAI Y Y,HUANG H, et al. A CNN-LSTM model for soil organic carbon content prediction with long term series of MODIS-based phenological variables[J]. Remote Sensing,2022(14):4441.
[20] ZENG P, SONG X,YANG H, et al. Digital soil mapping of soil organic matter with deep learning algorithms[J]. ISPRS International Journal of Geo-Information,2022(11):299.
[21] WADOUX A M J C. Using deep learning for multivariate mapping of soil with quantified uncertainty[J].Geoderma,2019(351):59-70.
[22] 劉瑜,郭浩,李海峰,等.從地理規律到地理空間人工智能[J].測繪學報,2022,51(6):1062-1068.
[23] REICHSTEIN M, GAMPS-VALLS G, STEVENS B, et al. Deep learning and process understanding for data-driven earth system science[J]. Nature,2019(566):195-204.
基金項目:塔里木大學高教研究項目(TDGJYB2226)
作者簡介:伍維模(1971-),男,博士,教授。研究方向為農業遙感與信息技術。