中圖分類號:TV131 文獻標識碼:A 文章編號:1001-9235(2025)07-0101-14
Abstract:Toenrichemoteinversionmethodsofsoilhdraulicparametersandachieveafastandnondestructiveprediction,59high spectrali-situsoilsamplesinXiangzhouDistrict,ZuhaiCityrecollctedusingFieldSpec4spectrometer.Theremotehdraulic parameter models were established for two land types: grassland and bare land(saturated water content θε ,residual water content θr, inverseofairentryvalue α ,shapecoefficient n ,saturatedhydraulicconductivity Ks, and soil moisture content θ ).Theresultsare as follows. ① The spectral curves exhibit clearlinearityin three bands:700~750nm,830~1100 nm,and1520~1 620 nm,with the mean values of coefficient of determination for the linear fitting R2all over 0. 94. ② Among gradient boosting regression(GBR), partial leastsquaresregesionPLSR)andandoforest(RF)GBRpeforstheestandsoshighsensitivitytotelinearfitigater lga2(the logarithm of the slope) in the 83O-11OO nm band. It accurately predicts θε , α n ,and θ forgrassland types(Relative Percent Deviation, RPD gt; 1.4).For the bare land types,the coefficient of determination Rp2 for all hydraulic characteristic parameters, except soil moisture content θ ,is greater than O.9,and RPD exceeds 2.0. ③ In most hydraulic characteristic models predicting the grassland types,thefeatureimportanceofteleafareaindex(LA)isteghestTerefore,anectieinversionmodelisuiltbasedonfield spectraldataandLAI,withsimpleaccsstoiputparametersandgoodpredictionefect,providingapotentialforwideapplicatioin the future.
Keywords: unsaturated soils; hydraulic parameters; spectrum; machine learning;remote sensing inversion
土壤水力特性在研究土壤水分運動、溶質運移等方面具有重要作用[1]。土壤水力特性參量主要包括水分特征曲線、水力傳導率、土壤含水量等,其中水分特征曲線和水力傳導率是研究土壤水分動力的重要物理參數[2]。土壤水分特征曲線是土壤水分吸力和土壤含水率的關系曲線,是定量研究土壤水分運動的重要參數,描述土水特征曲線常用的經驗公式有:Broods-Corey模型、Gardner模型、vanGenuchten(VG)模型和Gardner-Russo模型等。
水力特性參數的測定包括直接法和間接法,直接測量法雖然精確,但費時費力,且效率低、成本較高。因此,間接法在實際應用中更為廣泛,涵蓋了諸如分形幾何方法、物理-經驗方法等多種技術手段,其中土壤傳遞函數(Pedo-transferFunctions,PTFs)發揮著十分重要的作用。PTFs是以土壤理化性質(質地、容重、含水量、有機質含量等)為輸入變量的土壤水分運動參數預測模型[3]。眾多學者通過構建土壤傳遞函數估算水力特性參數,例如,張昭等4引入控制粒徑和不均勻系數建立預測非飽和砂土曲線的PTFs,通過對VG模型參數進行量綱分析和回歸分析,指出所建立的土壤傳遞函數能夠很好地預測模型參數;房麗晶等根據土壤質地和干容重等物理性質,對 0~30、30~60cm 土層分別構建了新的PTFs計算飽和導水率,并將結果與5種傳統PTFs進行對比,新的PTFs在 30~60cm 土層表現較好 (r=0.73,δRMSE=1.62) ;寇青青等5采用多元非線性回歸法推求了渝東北紫色土不同土層的飽和導水率傳遞函數模型和模型參數,經過驗證,PTFs在不同土層 0~10cm(R2=0.73).10~20cm(R2=0.76) 和20~30cm(R2=0.79) 都達到了較好的精度。而機器學習技術以其強大的數據處理和分析能力,高適應性及高精度特性,在土壤水力特性研究領域展現出顯著優勢。它能夠有效構建土壤水力特性參量與王壤理化性質之間的最優關系模型,從而彌補了兩者之間缺乏直接物理關聯的不足[6。隨著機器學習的持續進步,國內外學者利用機器學習構建土壤水力特性參數預測模型[5],Gupta等[7]推導了溫帶和實驗室基于土壤粒徑分布和堆積密度的Ksat土壤傳遞函數(Ksat-PTFs),并通過隨機森林算法(RandomForest,RF)擬合出精確的模型;張賽亞等[8以地理因子和土壤理化特性作為驅動因子,根據相關性分析構建了3種輸入模式的飽和導水率和田間持水量預測模型,基于多元線性回歸(MultipleLinearRegression,MLR)、遺傳算法-人工神經網絡(GeneticAlgorithm-Backpropagation NeuralNetwork,GA-BP)、支持向量機回歸(SupportVectorMachineRegression,SVR)、隨機森林的4種預測模型的表現均優于傳統PTFs。
無論是傳統的PTFs還是基于機器學習的PTFs,通常需要實驗室測定的土壤理化性質作為輸入,然而,這種取樣過程可能會對土壤產生一定程度的擾動,容易破壞土壤結構,導致土壤水力學精度降低[9]。近年來,光譜技術以時效性強、非接觸性、光譜信息量大等優勢[10],被廣泛運用在農業監測和管理等諸多領域,在獲取土壤信息方面的應用也取得重要突破[。已有眾多學者基于光譜特性建立土壤理化特性的估算模型。例如,張笑寒等[12]基于8種光譜輸入量組合建立隨機森林模型,成功預測了 0~20cm 耕作層的土壤有機質含量(SoilOrganicMatter,SOM),取得了較高的精度( R2=0.78 ,ERMS=1 32% ),并發現對光譜反射率進行離散小波變換以及使用不同光譜輸入量組合能夠提升模型表現;張智韜等3通過將光譜指數進行分數階微分(Fractional-orderDerivative,FOD)變換,并將支持向量機與隨機森林模型聯用,進一步提升了SOM遙感反演模型的精度 (R2=0.98 )。此外,李志軍等[14]利用無人機多光譜遙感數據與支持向量機、梯度提升模型和梯度提升決策樹,實現了大田作物根區土壤含水率快速監測,模型在 0~20cm 土層含水率預測中表現較好( R2=0.88 , E?RMS=0.7% ),在 20~40cm ( 0.602lt;0.76 , )和40~60cm(0.592lt;0.71,1.4%RMSlt;1.7%) 土層的SMC預測中模型精度有所下降。羅利華等[15基于多光譜遙感數據建模,對比了一元線性回歸模型與BP神經網絡模型在反演土壤含水率時的精度,發現BP神經網絡模型 R2=0.79 的精度顯著高于前者( R2= 0.60),可能是因為機器學習類的模型更善于捕捉土壤理化性質與多波段光譜信息之間的復雜非線性關系。雖然已有較多利用遙感方法開展土壤理化性質監測的研究,但目前將遙感應用于土壤水力特性監測方面的研究尚少[16],為進一步探究遙感技術在預測和估算土壤水力特性參數中的應用,挖掘快速、無損的土壤水力特性參數預測方法,本研究旨在基于土壤光譜特性與機器學習技術相結合,建立表層土壤水力特性參數的遙感估算模型。
在基于光譜特性反演土壤理化性質的研究領域中,隨機森林RF和偏最小二乘回歸法(PartialLeastSquaresRegression,PLSR)均展現出了良好的性能[6.17]。PLSR具有很強的處理多重共線性的能力,能夠有效捕捉輸人變量和輸出變量之間的線性特征,而RF則不需要假設數據之間的關系形式,可以捕捉數據之間可能存在的復雜非線性關系。梯度提升回歸(Gradient Boosting Regression,GBR)作為一種與隨機森林相似的算法,其特點在于采用加法模型,并通過逐步縮減殘差優化模型性能,因此具有更高的靈活性和敏感度。RF和GBR均屬于樹類機器學習方法,相比于BP神經網絡及深度學習(卷積神經網絡)等方法,其模型結構簡單,可解釋性強,能夠通過相對重要性排序等指標給出因變量的關鍵預測因子等信息。因此,基于PLSR、RF和
GBR三種算法各自的特性和優勢,可以利用這三種算法的預測結果來分析和挖掘輸入數據與土壤水力特性參量之間的潛在關系。綜上,本研究以野外實測光譜數據為基礎,擬基于土壤光譜特性分析,構建PLSR、RF以及GBR三種土壤水力特性參量遙感估算模型,并且考慮到不同土地利用方式對土壤水力特性的影響[18-19],對草地和裸地2種土地類型的建模效果進行對比研究和評估。
1材料與方法
1.1 研究區概況
研究區位于市香洲區中山大學校區,范圍為 113°34′52.57\"~113°36′16.56\"E,22° 20′47.07\"~22°21′1.05\"N (圖1),地處珠江口西岸、南海之濱,三面環山,一面向海,占地面積為3.57km2 。該區域地形平坦,起伏變化較小,土壤以砂土為主,區域內的主要土地利用類型為草甸草地、水域以及各類建設用地,其中,草類以早熟禾和狗牙根等禾本科植物為主。氣候屬于典型的南亞熱帶季風海洋性氣候,冬夏季風交替明顯。該地區熱量充足,平均日照時間超過 10h ,年平均高溫可達27°C ,年平均低溫為 21°C ,冬夏溫差小。此外,該區域年降水量約為 1 200mm ,多集中于夏季,表現出明顯的雨熱同期特征。
圖1研究區采樣點分布
Fig.1Samplingpointsdistributioninthestudyarea
1.2土壤樣品采集與野外光譜測定
采樣測量工作于2023年4一8月進行,并且選擇在天氣晴朗且風力較小的正午時段內開展,在研究區內,選擇地形平坦且距離周圍高樓等地物大于
50m 的地方進行采樣,以減小外部環境對光譜數據的影響。使用環刀法分別采集草地、裸地兩種土地類型的土壤樣品,采樣深度為 0~5cm ,對每個土壤樣品進行標記。采取土壤樣品時,對草地類型的采樣點進行拍照記錄,圖片將用于后續提取采樣點的葉面積指數。以往學者利用遙感方法進行土壤理化性質的反演研究選擇的土壤深度差別較大,從2~60cm 均有[12-15]??紤]到光學遙感方法主要觀測到的是表層土壤的光譜信息,本研究選擇淺層(小于5cm)土壤水力特性參數為主要研究目標,以盡量保證模型反演的精度及可靠性。
土壤光譜測定工作與樣品采集同期進行,使用ASDFieldSpec4便攜式地物光譜儀采取土壤光譜反射率數據,其規格和技術參數見表1。光譜測定時,確保光纖探頭垂直于采樣點并距離采樣點 15cm 。為減少儀器本身誤差對研究結果的影響,每隔 5min 進行一次白板矯正。每個采樣點進行10次光譜測量,取平均光譜曲線作為采樣點的原始光譜曲線,以確保數據的準確性和可靠性??紤]到研究區域內的土地分布較為零散,每一塊采樣區域中,5個距離相近的采樣點的水力特性參量差異較小,可簡化為5個相距較近的光譜測定點位共用1個土壤樣品。經過對數據的篩選和處理,剔除了一個存在異常的草地類型光譜數據,最終獲得了39個草地類型光譜數據和20個裸地類型光譜數據,以及8個草地類型土壤樣品和4個裸地類型土壤樣品。
表1ASDFieldSpec4便攜式地物光譜儀性能信息
Tab.1PerformanceinformationofASDFieldSpec4 portablespectralradiometer
1.3光譜數據預處理
因 350~399…2451~2500nm 光譜波段有大量來源于儀器放置環境及儀器本身的噪聲,信噪比低,可能會降低精度的準確性,同時, 1400,1900nm 波段作為大噪聲頻段(即太陽光-水汽吸收帶)也會影響后續的數據提取和分析,故本研究剔除了350~399、1350~1450、1800~1950、2400~2500nm波段的數據(圖2)。
圖2土壤光譜曲線Fig.2Soilspectralcurves
以往研究[20]表明,在部分波段區間內土壤光譜反射率與波長之間存在一定線性關系,線性模型參數與土壤理化性質具有很強的相關性,并且通過光譜曲線的線性趨勢能夠很好地估算土壤理化性質參數。因此,基于光譜曲線線性趨勢建立土壤水力參數預測估算模型能夠簡化建模方式,減少信息冗余造成的精度下降,故本研究采用光譜曲線線性擬合參數作為模型輸入變量,構建土壤水力特性參量預測模型。已有研究表明[21],400~1340、1460~1790nm 波段與土壤含水率相關性較大,為減小噪聲對模型的影響,本文選擇700~750、830~1100、1520~1620nm 三個具有代表性且反射率變化較為平滑的波段,并對這些波段進行編號。對每一條光譜曲線進行線性擬合,得到各光譜曲線3組線性擬合參數,并通過決定系數 R2 評估線性擬合效果。線性擬合見式(1):
y=ax+b
式中: y 為土壤反射率; x 為波長; a,b 為常數。
經擬合分析,發現斜率a的數值非常小,主要在10-4~10-3 區間內波動,為更好地表現出數據之間的差異性,決定以 lga 替代a作為后續建模的輸入參數,即經過線性擬合后得到的輸人參數是每一條光譜曲線的3組線性擬合參數 logai,bi(i=1,2,3 ,分別對應 700~750,830~1100,1520~1620nm 三個波段)。
1.4水力特性參量測定
采用烘干法測定土壤含水率,為確保不破壞土壤顆粒原有性質,將烘箱溫度設置為 70°C ,并且在樣品放入烘箱前,剔除樣品中的草根、石子等影響因素。在烘干過程中,每隔2h將樣品取出,冷卻至室溫后進行稱重,并記錄數據。之后,將樣品再次放入烘箱中繼續烘干,此循環往復,直至樣品的重量達到恒定。
VG模型在非飽和區域內具有連續性,能夠較好地描述大多數的土水特征曲線,且具有較高的擬合精度和普適性[22],故本研究選用VG模型描述土水特征曲線,其方程表達式為:
式中: θ 為體積含水率, cm3/cm3;θs 為飽和含水率,cm3/cm3;θr 為殘余含水率, cm3/cm3;h 為負壓吸力,cm;α 為進氣值的倒數, 1/cm;m,n 均為形狀系數, n 為孔隙尺寸分布指數, m=1-1/n 。本文通過土壤質地(顆粒含量)和堆積密度構建土壤傳遞函數PTFs估算VG模型參數 (θs,θr,α,n) 及飽和導水率(SaturatedHydraulic Conductivity, Ks ), cm/d 。所以,本文研究的土壤水力特性參量是指飽和含水率、殘余含水率、進氣值的倒數、形狀系數、飽和導水率、土壤含水量。
1.5 葉面積指數測定
葉面積指數(LeafAreaIndex,LAI)通常用于描述植被覆蓋的密度和茂密程度[23],是表征作物生長的重要指標[24-25]。測量葉面積指數常見的方法有直接法和間接法2,直接法精確度較高,但會大面積破壞植被,影響生態環境,且費時費力;間接法一般是基于測量冠層間隙率、透過率等數據并根據光消減模型等復雜數學模型計算葉面積指數,利用特定儀器直接采集進而讀數。然而草地植被低矮,儀器測量誤差大。Xiong等[27]發現ImageJ和Canopeo 在精度上并無顯著差異,在指數估計上具有一致性。綜合考量后,本研究選擇采用ImageJ圖像分析來測量草地葉面積指數。ImageJ能夠通過調整顏色閾值(ColorThreshold)識別圖像中的綠色部分,并且提供了多樣化的圖像調整方法。本研究選擇了基于色調(Hue)、飽和度(Saturation)和亮度(Brightness)的HSB顏色空間方法進行圖像分析,對應參數范圍分別是30~90、40~255、10~255。需要注意的是,每張圖像的具體上下限數值可能需要根據實際情況進行微調,微調過程中需要實時觀察圖像處理效果,以確定具體數值。閾值設置完成后,對圖像進行二值化處理,將圖像分為綠色(在二值化圖像中以白色表示)和非綠色區域2個部分。經過處理后,非綠色部分主要為衰老的葉子、地面垃圾和裸露的地面等低像素值區域。而ImageJ通過提取最大像素值來檢測綠葉面積,最后得出綠葉總面積與區域總面積的比值,即為葉面積指數,記作 I
1. 6 相關性分析
為探究模型輸人參數 (lgai,bi,I) 與水力特性參量的關系,對輸人參數以及水力特性參量進行皮爾遜相關性分析。皮爾遜相關性分析是通過量化2個變量之間的線性關聯程度來衡量兩者間的相關性,該方法簡單直觀,易于計算,但它無法捕捉變量間的非線性關系,且對于離群點較為敏感,而離群點對相關系數會產生較大的影響。皮爾遜相關系數計算公式如下:
式中:變量 X 和變量 Y 具有相同的樣本數量 n;E(X) ! 分別為變量 X,Y 的期望; Cov(X,Y) 表示 X 和 Y 的協方差; σX,σY 分別為 X,Y 的方差; ρχ,γ 為 X,Y 的皮爾遜相關系數,其閾值為-1~1,當相關系數為正時,表示2個變量呈正相關關系;反之,則為負相關關系。相關系數絕對值越接近1,表示2個變量的相關性越強。
1.7 模型構建與驗證
本研究以線性擬合參數 lgai?λbi 以及葉面積指數I為輸入參數,土壤水力特性參量 (θs,θr,α,n,Ks,θ) 為輸出,并以葉面積指數作為區分草地和裸地2種土地類型的關鍵數據,構建偏最小二乘回歸法、隨機森林以及梯度提升回歸3種水力特性參數預測模型
偏最小二乘回歸法是高光譜建模中常用的建模算法,并具有良好的預測效果。其是一種在2個向量空間中對協方差結構進行建模的隱變量方法,可近似視為主成分分析和線性回歸的合體,主成分通過確保特征之間無信息重疊來盡可能有效地表示數據及其差異的特征組合。
隨機森林能夠有效減少過度學習和過度擬合現象,在高光譜建模中也頗受歡迎[28],該方法通過隨機建立一個由多棵決策樹(ClassificationAndRegressionTree,CART)組成的森林[29],每棵決策樹之間互不影響、沒有關聯。隨機森林對于輸入數據要進行行和列的采樣,行采樣采用有放回的方式,以增加模型泛化能力,減少過擬合。列采樣則是在M 個特征中選取 m 個 m?M 進行建模。通過對采樣后的數據實現完全分裂的方式構建決策樹,確保決策樹某一個葉子節點要么無法繼續分裂,要么里面的樣本都指向同一類型或值。
梯度提升回歸的核心思想是通過逐步迭代的方式訓練模型[30]。在每一次迭代中,模型通過計算損失函數的負梯度來擬合先前模型預測結果與真實值之間的殘差。然后,將這個殘差作為下一輪迭代的目標變量,將新模型的預測結果與先前模型的預測結果進行累加,從而逐步減小損失函數,提高整體模型的性能。
上述3種反演模型均使用Python編程語言構建,草地和裸地類型樣本分別按4:1和3:1比例劃分訓練集和測試集,得到31個草地類型訓練樣本和8個草地測試樣本,15個裸地類型訓練樣本和5個裸地測試樣本。而GridSearchCV網格搜索是超參數優化的一個重要工具,可以通過窮舉搜索的方式尋找模型在給定的參數空間中表現最佳的超參數組合,提升模型的預測能力。在訓練過程中,對訓練集使用GridSearchCV網格搜索對max_depth、n_estimators等超參數進行自動調參,并使用5折交叉驗證對每種模型進行性能驗證,將5次交叉驗證的平均得分作為每組超參數的評估結果,最終使用得分最高的超參數組合建立反演模型。
1.8模型評價指標
決定系數取值范圍為0到1,越接近1表示模型對數據的擬合越好,越接近0表示模型的擬合能力較差,其計算見式(5):
式中: yi 為真實的測量值; 為真實測量值的平均值;
為預測值; n 為樣本數。均方根誤差用于衡量預測值與真實值之間的差異,其值越小,表示模型的預測能力越好,與真實值的差異越小,其計算見式(6):
相對分析誤差(RelativePercentageDifference,DRP )用于衡量預測模型在未知樣本上的精度, DRP 的值越高,表示預測模型在未知樣本上的精度越高。通常,當 DRPgt;1.4 時,認為模型能夠達到一定預測效果,當 DRPgt;2.0 時,認為模型的預測能力良好。預測相對分析誤差的計算公式為:
本研究以訓練集決定系數 Rc2 、訓練集均方根誤差 ERMS,C, 測試集決定系數 Rp2 、測試集均方根誤差ERMS,P, 相對分析誤差 DRP 為模型評估指標。
2 結果與分析
2.1水力特性參量與葉面積指數統計與分析
本研究對草地和裸地2種土地類型的水力特性參量進行了統計分析(表2),草地組樣本土壤含水率變異系數為 34.44% ,相較之下,裸地樣本的變異系數較低,為 22.27% ,表明裸地組樣本的土壤含水率數據分布更為集中。值得注意的是,2種土地類型的土壤含水率均呈現出中等變異( 10%vlt; 100% ),反映出2種土地類型在研究區不同區域內的土壤含水率差異較大。這可能歸因于采樣區域周圍環境的多樣性,例如臨近湖泊、低洼地帶的采樣點通常表現出較高的含水率,而臨近水泥路面或地勢較高的區域的含水率相對較低。對于殘余含水率、飽和含水率、進氣值倒數以及形狀參數4種水力特性參量,在2種土地類型之間的統計數據差異并不顯著。對統計數據進行分析,發現 θr 與 θs 的變異程度較小,變異系數均小于 10% ,說明這2種水力特性參量較為穩定,其中 θr 變異系數最小,草地樣本的變異系數為 1.53% ,裸地樣本的僅為 0.92% ,數據穩定性表現尤為突出。 Ks 方面,草地樣本的標準差以及變異系數均大于裸地樣本,表明草地樣本的 Ks 數據分布較為分散,差異性較大,這可能是因為草地類型的采樣區域空間范圍更廣、數據量更大有關。此外,植物根系對土壤的穿插及破碎作用能夠增加土壤孔隙度,進而提高導水性能[31-32]。因此,草地組樣本普遍擁有較高的飽和導水率,表現出更優的人滲能力[33]。
表2土壤樣本的水力特性參數統計
Tab.2Statisticsof hydrauliccharacteristic parametersof soil samples
由于裸地地表無植被覆蓋,其葉面積指數統一設置為0,故僅需對草地組樣本的葉面積指數數據進行統計分析(表3)。結果顯示,葉面積指數最大值為 60.37% ,最小值為 25.15% ,平均值為 41.3% ,變異系數為 22.26% ,屬于中等變異,這主要是由于草地生態系統具有復雜多樣性,其葉面積指數存在很大的時空差異性[34]
表3葉面積指數統計
Tab.3Statisticsofleaf area indexes
2.2局部光譜曲線擬合及參數相關性分析
對每一條光譜曲線中的700~750、830~1100、1 520~1 620nm 三個波段進行線性擬合,得到每條光譜曲線的各波段的線性擬合決定系數并進行統計分析(表4)。以草地類型的某一樣本為例,采用式(1)對其光譜曲線進行擬合(圖3),在 700~750nm 波段內,得到線性擬合參數 a1=0.0026,b1= -1.661 0 ,以及 R2=0.9661 ;在 830~1100nm 波段內, a2=0.0002,b2=0.1063,R2=0.9745 在 1520~ 1 620nm 波段內, a3=0.000 6,b3=-0.697 1,R2= 0.9969 。結果顯示,所有樣本的光譜曲線在 1520~ 1 620nm 波段內的 R2 均大于 0.96,R2 平均值達到0.9910,說明在該波段內光譜曲線具有顯著的線性趨勢;在 700~750nm 波段中,所有樣本的線性擬合決定系數均達到0.92以上,平均值為0.9688,線性變化明顯。總體來看,本研究中的所有光譜曲線在3個波段內均表現出明顯的線性特征,其中在1520~1620nm 波段上的線性擬合效果最好,充分說明式(1)能夠精準地描述所選波段內反射率曲線的線性變化。因此,通過線性擬合參數能夠有效地表征所選波段內光譜曲線的變化,借助線性擬合參數作為模型輸人變量,能夠簡化模型輸入,降低計算復雜度。
表4局部光譜曲線線性擬合 R2 統計
Tab.4Statisticsofcoefficientofdeterminationforlocal spectral curve linearfitting
圖3某個草地樣本的3個波段光譜曲線擬合示意
Fig.3Schematic of spectral curve fitting for a grasslandsample in three bands
2.3植被對光譜數據的影響
分別選取草地和裸地中具有代表性的3個光譜樣本,通過對比分析2種土地類型的光譜曲線(圖4),發現在 500~1400nm 范圍內,草地類型和裸地類型土壤的光譜曲線表現出不一樣的波形特征和反射率。這可能是因為草地通常具有較密集的植被覆蓋,包括草類和其他植物。在可見光譜范圍內中 600~700nm )草地植被對綠色光的吸收較高,因此光譜曲線表現出一定程度的波谷特征。然而,在紅外波段 (700~1400nm 中,由于植物葉片中的葉綠素吸收了大部分可見光,而紅外光在植物細胞中透過和反射的比例較高,所以草地植被對光的吸收較低,導致在紅外波段中反射率較高[35]。
圖4不同土地類型光譜曲線對比
Fig.4 Comparison of spectral curves of different land types
2.4反演模型效果及分析
以線性擬合參數 logai、bi(i=1,2,3) 以及葉面積指數1作為模型輸人參數,構建各水力特性參量預測模型。在對比GBR、PLSR、RF三種反演模型的預測效果后,發現GBR模型預測效果最佳(表5)。
表5各反演模型的精度評估指標
Tab.5Accuracyevaluationindicatorsofeachinversionmodel
注:所有草地樣本的輸入參數均包括葉面積指數;“—”表示結果小于0,沒有參考價值。
在草地類型中,GBR模型對飽和含水率、進氣值倒數、形狀參數以及土壤含水率的相對分析誤差均超過了1.4,分別達到1.99、1.91、1.52和1.57,表明GBR模型能準確預測這些水力特性參量;對于裸地類型樣本,GBR模型展現出卓越的預測能力,能夠實現對裸地類型的所有水力特性參量的預測,并且除土壤含水率外其他水力特性參量的 DRP 均大于 2.0,Rc2 均高達0.99,而 RP 2 均達到0.9以上,充分證明GBR模型對裸地樣本的各水力特性參量(除含水率外)具有極高的預測精度。PLSR模型整體預測精度次于GBR,尤其在草地組的預測上表現不佳。然而,對于裸地樣本的水力特性參量,PLSR仍能實現有效的預測,特別是對 θr?θs?α 以及 n 具有較高的預測精度。RF在對草地組的預測上同樣表現一般,但在裸地樣本上,除飽和導水率 Ks 以及土壤含水率θ 外,其余水力特性參量的相對分析誤差均大于1.4,值得一提的是,RF對裸地樣本的 θr?θs 和 α 的預測效果較為突出,其 DRP 分別為5.27、2.90、4.70,均超過2.0。此外,在多數模型中,K的ERMs.c和ERMS.P數值較大,這主要是由于 Ks 本身數值較大,導致誤差也處于較高的數量級,加之 ERMS 是對誤差的平方進行積累再開方,放大了誤差之間的差異。
綜上所述,GBR模型對草地(G)和裸地(B)2種土地類型的水力特性參量預測均表現最優,GBR對各水力特性參量預測值與實測值關系見圖5。
基于6種水力特性參量的預測結果,對GBR預測模型的輸入參數進行了重要性分析(圖6。對于草地類型而言,在預測任意一個水力特性參量時,模型中的輸入參數相對重要性占比前三的是葉面積指數 I,loga2,b3 ,說明GBR模型在預測草地樣本的水力特性參量時,主要倚重于這3個參數;并且除了殘余含水率θ以外,葉面積指數在各水力特性參量的預測模型中均占據了最大的相對重要性比例,具體數值依次為0.355、0.456、0.630、0.317、0.467,這一發現不僅證實了選擇葉面積指數作為模型輸入參數的合理性,同時也表明在建模過程中應當注重葉面積指數數據的完整性和準確性,避免對模型預測結果造成不利影響。對于裸地類型,模型在預測殘余含水率、飽和含水率以及進氣值倒數的輸入參數時,輸入參數中相對重要性占比最高的均為lga2 ,其占比分別達到了0.714、0.619和0.683;而對于 n 以及 Ks 時, b3 的重要性最為突出,重要性占比分別達到0.73和0.384;此外,GBR在預測土壤含水率時,則十分依賴于輸入參數 b1 ,其相對重要性占比高達0.692??傮w來看,GBR模型預測裸地類型的水力特性參量時,主要依賴于 loga2、b3、loga1 和 lga3 這四個參數。因此,在構建預測模型時,應著重檢查這些參數的數據質量,以確保模型的預測效果。
圖6GBR模型輸入參數重要性分析
Fig.6Importanceanalysisof inputparametersofGBRmodel
對于預測相同的水力特性參量,不同土地類型會對模型輸入參數的相對重要性產生影響。以形狀參數為例,若僅考慮線性擬合參數(即排除葉面積指數的影響),在草地類型中, b3 的相對重要性僅為0.076;而在裸地類型中,其相對重要性占比卻激增至0.73。經過對比分析,對于預測不同土地類型,輸人參數相對重要性會發生一定的變化,個別輸入參數的重要性甚至會發生顛覆性的變化。盡管如此,發現 lga2 在預測不同土地類型上的不同水力特性參量時均表現出了較高的重要性占比,這表明GBR模型對于 lga2 具有較高的敏感度。
綜上所述, I,loga2,b3 對GBR預測草地類型的水力特性參量具有顯著影響,而 loga2、b3、loga1 則在預測裸地類型的水力特性參量時發揮重要作用。不同的土地類型確實會影響模型輸入參數的相對重要性,但值得強調的是,無論是草地還是裸地, lga2 都對GBR的預測結果產生著不可忽視的影響。
3討論
研究表明,以局部光譜線性擬合參數和葉面積指數為輸入的土壤水力特性參量反演模型中,GBR的預測表現優于RF和PLSR,這可能歸因于GBR通過低學習率和逐步校正殘差的建模策略,能夠有效平衡模型的偏差和方差,更好地捕捉復雜的特征交互,對于細微的特征具有更高的敏感度。此外,研究選擇局部光譜的線性擬合參數作為輸入變量,雖然能夠表征局部光譜曲線的線性趨勢,降低了輸入的復雜度,但是這種簡化方式可能會削弱原始光譜數據中的特征表現。而RF采用隨機選擇特征和隨機選擇樣本的建模策略,這種隨機化處理可能會削弱模型對細微信號的捕捉能力,這也解釋了為什么GBR和RF具有相似的算法原理,但RF在研究中的預測表現不如GBR。經過對輸入變量和輸出變量進行Pearson相關性分析(表6),發現輸入參數與水力特性參量之間的線性相關性較弱,這一結果暗示了本研究中的線性擬合參數與水力特性參量并不是簡單的線性關系,而是呈現出更為錯綜復雜的非線性關系,同時也詮釋了PLSR在研究中預測效果不佳的原因。而這種輸入與輸出之間復雜的非線性關系可能源于土壤水力特性的多維度和動態性,以及光譜數據與這些特性之間非直接的聯系。
研究中,GBR對于草地類型的殘余含水率以及飽和導水率的預測效果不佳,這可能是因為在建模過程中引入了葉面積指數,對預測 θr 和 Ks 時產生了額外的非線性影響或噪聲,另一方面,草地冠層對土壤的遮擋對土壤光譜信息造成一定影響,從而影響了模型在草地樣本上的預測效果。但對于預測草地類型的其余水力特性參量,GBR具有較好的表現,表明將草地土壤光譜信息用于預測這些水力特性參量時應考慮植被影響,建模時引入葉面積指數作為影響因子具有一定的可靠性,能夠為草地的土壤水力特性研究提供新的視角。通過對比研究中的草地光譜曲線和劉浩等[35]研究中的冬小麥冠層光譜曲線,發現兩者具有相似的波形特征,若能進一步證明本研究成果適用于灌叢等土地類型,則本研究適用范圍將進一步擴大。
表6輸入變量和輸出變量的Pearson相關性分析Tab.6Pearsoncorrelationanalysisofinputvariablesand
注:*表示 plt;0.05 ,顯著性水平為 5% ;**表示 plt;0.01 ,顯著性水平為 1% 。
此外,通過大規模的光譜數據采集,可以有效地捕捉土壤理化性質參數的空間變化,進而理解土壤水力特性參量的空間分布。建立基于光譜特性的水力特性參量的遙感估算模型,或許在一定程度上能有效解決土壤水力特性參量的空間變異性和尺度變化[3等造成的不確定性問題,從而應對描述土壤水分運動十分復雜的挑戰。
但需要注意的是,本研究中剔除了粒徑大于2mm的顆粒,而碎石、巖屑等粗粒可能會對土壤水力特性造成影響[37]。其次,葉面積指數獲取方法可能受相機畸變影響[38],未進行圖片校準工作,可能會影響數據的準確性。此外,本研究中樣本量較小、數據簡化,導致了模型泛化能力較低,并且可能存在較大誤差,需要進一步精細化研究。
4結論
為了挖掘快速、無損且可靠的土壤水力特性參量預測方法,以土壤水力特性參量為研究對象,在市香洲區內選取典型樣地開展了土壤高光譜數據反演水力特性參量的研究,基于局部光譜曲線的線性趨勢以及葉面積指數分析,建立了草地和裸地2種土地類型的水力特性參量遙感反演模型。
a)研究區土壤含水率 θ 的變異性較大,變異系數大于 20% ,而飽和含水率和殘余含水率的變異程度小, Cv 小于 10% 。
b)土壤光譜曲線在局部波段中具有明顯的線性趨勢,能夠通過線性擬合公式描述曲線的變化,其中 1 520~1 620nm 波段線性趨勢最明顯,線性擬合的決定系數的平均值達到0.9910;此外,在 500~ 1400nm 波段范圍內,草地類型和裸地類型土壤的光譜曲線表現出不一樣的波形特征和反射率。
c)分段光譜曲線線性趨勢的變化能夠反映土壤水力特性參量的變化,在GBR、PLSR和RF三種水力特性參量預測模型中,GBR預測效果最好,能夠達到較高的預測精度,并且對 830~1100nm 的線性擬合參數 lga2 (斜率的對數)敏感度較高。
d)在預測草地類型的飽和含水率、進氣值的倒數、形狀參數、飽和導水率和土壤含水率的GBR模型中,葉面積指數的特征重要性占比居首,研究草地類型的水力特性參數時考慮葉面積指數具有一定的必要性。鑒于草地與灌叢的光譜特性曲線具有相似性,草地類型反演模型或適用于灌叢等類型。
參考文獻:
[1]房麗晶,高瑞忠,劉廷璽,等.巴拉格爾河流域土壤傳遞函數構建與評估[J].干旱區研究,2020,37(5):1156-1165.
[2]宋楊睿,王金滿,白中科,等.土壤水力特性參數預測方法研究進展[J].灌溉排水學報,2017,36(S2):123-128.
[3]秦文靜,樊貴盛.黃土土壤水分運動參數預測模型研究[J].中國農村水利水電,2024(7):229-233,248.
[4]張昭,程靖軒,劉奉銀,等.基于顆粒級配參數描述砂土持水及非飽和強度特性的土壤轉換函數[J].水利學報,2020,51(4):479-491.
[5]寇青青,運劍葦,汪明星,等.渝東北紫色土飽和導水率傳遞函數研究[J].土壤通報,2020,52(3):611-617.
[6]夏子書,白一茹,王幼奇,等.基于GIS和隨機森林算法的寧東土壤飽和導水率分布與預測[J].水土保持學報,2021,35(1):285-293.
[7]GUPTA S, HENGL T,LEHMANN P,et al. SoilKsatDB: globaldatabase of soil saturated hydraulic conductivity measurements forgeoscience applications [J].Earth System Science Data,2021,13(4):1593-1612.
[8]張賽亞,張珂,晁麗君,等.考慮地形與理化性質的土壤關鍵水力特性多種估算模型構建與比較[J].河海大學學報(自然科學版),2024,52(3):42-50.
[9]張鵬,胡心雨,陳官運,等.泰安棕壤土不同土地利用類型飽和導水率比較[J].排灌機械工程學報,2020,38(4):403-408
[10]罩湘棟,龐治國,江威.土壤水分光學遙感反演方法研究進展和挑戰[J].人民珠江,2021,42(11):38-45,111.
[11]史舟,徐冬云,滕洪芬,等.土壤星地傳感技術現狀與發展趨勢[J].地理科學進展,2018,37(1):79-92.
[12]張笑寒,孟祥添,唐海濤,等.優化光譜輸入量的土壤有機質隨機森林預測模型[J].農業工程學報,2023,39(2):90-99.
[13]張智韜,勞聰聰,王海峰,等.基于FOD和SVMDA-RF的土壤有機質含量高光譜預測[J].農業機械學報,2020,51(1):156-167.
[14]李志軍,陳國夫,支佳偉,等.融合無人機光譜信息與紋理特征的大豆土壤含水率估測模型研究[J].農業機械學報,2024,55(9):347-357.
[15]羅利華,張博倫,黃向宇,等.基于模擬多光譜反射率的土壤含水率估算[J].水利科學與寒區工程,2024,7(9):90-94.
[16]BLASCHEK M,ROUDIER P,POGGIA M,et al.Prediction ofsoil availablewater-holding capacity fromvisiblenear-infraredreflectance spectra[J].Scientific Reports,2019,9.DOI:10.1038/s41598-019-49226-6.
[17]CONFORTI M,MATTEUCCI G,BUTTAFUOCO G.Usinglaboratory Vis-NIR spectroscopy for monitoring some forest soilproperties[J]. Journal of Soilsand Sediments,2018,18(3):1009-1019.
[18]楊震,黃萱,佘冬立.晉西北黃土丘陵區土壤飽和導水率的空間分布特征及影響因素[J].水土保持學報,2020,34(6):178-184.
[19]王娟,黃婷婷,趙輝,等.華南典型林分跡地植被覆蓋變化對土壤侵蝕的影響分析[J].人民珠江,2024,45(8):48-56.
[20]婁衛東,林寶剛,周洪奎,等.利用光譜反射率估算土壤理化
性質[J].浙江農業科學,2022,63(4):839-842,863.
[21]劉秀英,王力,宋榮杰,等.黃綿土風干過程中土壤含水率的光譜預測[J].農業機械學報,2015,46(4):266-272.
[22]王醒,方榮杰,張帥普,等.廣西龍脊梯田區森林類型對土壤水力特性的影響[J].水土保持通報,2021,41(5):92-98,106.
[23]劉嘉慧,余瑞,王有,等.基于多光譜無人機的不同放牧策略對草地葉面積指數變化動態解析[J].熱帶生物學報,2024,15(1):60-72.
[24]李陽,林義月,楊曉龍,等.水分管理和播種量對旱直播水稻產量形成的影響[J].節水灌溉,2022(9):87-92.
[25]董建舒,申孝軍,衣若晨,等.花生葉面積指數精準快速監測方法研究[J].節水灌溉,2024(2):88-94,104.
[26]董桂君.葉面積指數的測量方法[J].新農業,2023(6):50-51.
[27]XIONGYD,WESTC P,BROWNCP,et al.Digital ImageAnalysisof Old World Bluestem Cover to Estimate CanopyDevelopment[J].Agronomy Journal,2019,111(3):1247-1253.
[28]包青嶺,丁建麗,王敬哲.利用隨機森林方法優選光譜特征預測土壤水分含量[J].激光與光電子學進展,2018,55(11):470-476.
[29]熊劍智,熊睿,魯海燕,等.基于機器學習的深圳灣水質預報[J].人民珠江,2024,45(7):10-18.
[30]PONRAJ A S,VIGNESWARAN T. Daily evapotranspirationprediction using gradient boost regression model for irrigationplanning[J]. JournalofSupercomputing,2020,76(8):5732-5744.
[31]袁曉良,李俊雅,葛樂,等.不同土地利用方式對土壤團聚體穩定性及其導水率的影響[J].水土保持研究,2020,27(4):67-71,77.
[32]HAO MZ,ZHANGJC,MENG MJ,et al.Impacts of changesinvegetation on saturated hydraulicconductivity ofsoilinsubtropical forests[J].ScientificReports,2O19,9.DOI:10.1038/s41598-019-44921-w.
[33」李永寧,王忠禹,王兵,等.黃土丘陵區典型植被土壤物理性質差異及其對導水特性影響[J].水土保持學報,2019,33(6):176-181,189.
[34]柳藝博,居為民,朱高龍,等.內蒙古不同類型草地葉面積指數遙感估算[J].生態學報,2011,31(18):5159-5170.
[35]劉浩,楊錫震,張蓓,等.基于分數階微分光譜指數的冬小麥根域土壤含水率估算模型[J].農業工程學報,2023,39(13):131-140.
[36]舒喬生,謝立亞,賈天會,等.砂壤質褐土飽和導水率與物理性質的多尺度關系:小波分析法[J].土壤學報,2011,48(2):440-444.
[37」馮娜,劉冬冬,丁繼輝,等.反演含碎石碳酸鹽巖紅土水力特性[J].水土保持學報,2022,36(1):101-109.
[38]左沖,顏小飛,林昱檳,等.基于線性源法與圖像處理的土壤飽和導水率快速測量方法[J].農業工程學報,2022,38(7):110-116.
(責任編輯:向飛)