趙澤藝,李朝陽,王洪博,張 楠,李國輝,唐茂淞,王興鵬*,高 陽
(1.塔里木大學 水利與建筑工程學院,新疆 阿拉爾 843300;2.中國農業科學院 農田灌溉研究所,河南 新鄉 453002)
【研究意義】土壤水、礦物質[1]、有機質量[2]直接影響植物生長與產量形成。快速、準確地監測土壤信息對農業生產具有重要意義。【研究進展】土壤含水率[3]、含氮量[4]、含鹽量[5]的傳統監測方法是現場采樣,然后進行物理或化學監測。傳統監測方法雖然可以獲得準確信息,但耗時、耗力,時效性較差。隨著高光譜技術的發展,星載光譜、機載光譜、地物手持光譜技術逐漸成熟,光譜反演土壤中的元素種類越來越多,反演方法層出不窮。以往研究利用高光譜技術監測了草甸土[6]、黑土[7]、紫土[8]、黃壤土[8]的水分特征,監測了褐土[9]、黃綿土[10]、砂姜黑土[11]、黑土[12]的含氮量;這些研究均證實高光譜監測土壤含水率和氮素是可行的。高光譜不僅可以反演土壤中的含水率和含氮量,還可以反演土壤鹽漬化程度。土壤鹽漬化程度越高,對光譜的反射率則越大[13]。陳睿華等[14]采用支持向量機算法反演了銀川平原的土壤鹽分。李志等[15]利用高光譜特征參數對土壤鹽量進行了建模,發現在17 種一維單波段光譜中,對數倒數的一階微分變換與土壤鹽量的相關性最好,峰值敏感波段為1 083 nm。徐馳等[16]采用光譜吸收參數作為自變量,用鹽分指數對土壤鹽量進行了反演。Ivushkin 等[17]采用無人機遙感技術對土壤鹽量進行了反演,決定系數(R2)最高可達到0.64。Darochaneto 等[18]指出,線性模型在土壤鹽漬化預測方面優于非線性模型。柴思躍等[19]運用遺傳算法、偏最小二乘法對水分、鹽分共同影響下的特征光譜進行建模,得出土壤電導率會受到水分和鹽分的共同影響。王海江等[20]對不同土壤水分與鹽分狀況建立高光譜定量模型,在土壤含水率較低的情況下能夠得到較好的土壤鹽量監測精度。【切入點】然而,已有研究多以土壤水、氮、鹽的單一因子作為變量,缺少多因素相互影響下的土壤信息監測與反演研究。【擬解決的關鍵問題】因此,本研究設置水、鹽(EC)和氮(TN)3 個變量,在不同組合下獲取土壤光譜信息,利用偏最小二乘回歸(PLSR)、支持向量回歸(SVR)和BP 神經網絡(BPNN)模型分別對土壤水、鹽、氮量進行反演。本研究旨在建立多因素影響下的土壤水、鹽、氮反演模型,為精準監測土壤水、鹽、氮量提供技術支撐。
研究區位于新疆生產建設兵團第一師(圖1)。該區域屬暖溫帶極端大陸性干旱荒漠氣候,晝夜溫差大,常年干旱少雨,日照時間長,地表蒸發強烈。多年平均氣溫為10.7 ℃,年平均降水量為48 mm,年平均蒸發量為2 100 mm。土壤類型為砂土,干密度為1.1 g/cm3。土壤鹽分組成以NaCl 為主,有機質量為11.05 g/kg,有效磷量為7.2 mg/kg,有效硼量為0.6 mg/kg,速效鉀量為33 mg/kg。以五點采樣法測定了研究區土壤理化性質,土壤平均田間持水率、全氮量和含鹽量分別為87 g/kg、4.963 mg/L 和0.93 g/kg。

圖1 研究區與采樣點示意Fig.1 Schematic diagram of research area and sampling site
于2021 年11 月16 日在阿拉爾市十團矮砧千畝果園,采集3 m3的0~30 cm 土層的土壤。取樣結束后,將樣品帶回實驗室自然風干21 d;采用4 cm 篩網去除土壤雜質后備用。
試驗設置水、氮、鹽3 個因子,其中土壤水分設置2個梯度,質量含水率分別為64.7 g/kg和56.5 g/kg,約為田間持水率的75%和65%;土壤全氮量設置10個梯度,分別為9.926、12.407、14.889、17.37、19.852、22.333、24.815、27.296、29.778、32.259 mg/L;土壤鹽量設置10 個梯度,分別為1.860、2.325、2.790、3.255、3.720、4.185、4.650、5.115、5.580、6.045 g/kg。不同水平的水、氮、鹽進行全組合設計,共200 個處理,每個處理設置10 個重復,共計2 000 份樣本。通過添加尿素(總氮量≥46.0%)和NaCl(分析純)來調控土壤的含氮量和含鹽量。不同處理的土壤樣品制備好后,將體積質量為0.97 g/cm3的土壤樣品放入深度為4.5 cm,半徑為4 cm 的PVC 圓柱容器內,用于觀測光譜信息。
使用美國SEI公司的PSR+3 500地物光譜儀采集土壤樣品的光譜信息,儀器的波譜范圍為350~2 500 nm,數據輸出重采樣間隔為1 nm,共2 151 個波段,每采集一個樣本,自動收集10 條光譜曲線,取平均后作為一個樣本的光譜數據。測量時,將不同處理的土壤樣品置于光譜儀光纖探頭正下方,每1 min 使用反射率為1 的白板進行一次校正。
在光譜采集過程中,數據會受到諸多因素影響,影響模型反演的精度。因此,對原始光譜信息進行數據降噪是構建反演模型的前提。Savitzky-Golay 是一種常用的降噪方法,是在時域內基于局域多項式最小二乘法擬合的濾波方法;平滑濾波的效果隨選取的窗口寬度不同而有所差異。使用Savitzky-Golay 降噪可以顯著提高光譜平滑度。本研究采用濾波器窗口長度為51,擬合樣本的多項式階數為5 的方法對光譜進行平滑,結果如圖2 所示。將平滑后的數據進行歸一化,使用主成分分析法(PCA)進行降維,PCA 映射到低維度空間后有32 個主成分,保留99.88%的原始信息,將PCA 處理后的數據作為模型的輸入信息。所有算法均由Python 3.10 實現。

圖2 不同含水率處理下土樣的原始光譜與Savitzky-Golay 平滑光譜Fig.2 Original spectra and Savitzky-Golay smoothed spectra of soil samples in different water treatments
采用偏最小二乘回歸(PLSR)[21]、支持向量機回歸(SVR)[22]和BP 神經網絡(BPNN)[23]構建土壤水、氮、鹽量的光譜反演模型。PLSR 是一種多變量回歸分析方法,可以簡化數據結構,構建線性回歸模型。SVR 是一種多元非線性的回歸算法,能夠將低維空間中難以解決的非線性問題映射到高維度空間,從而將非線性問題轉化為線性問題。BPNN 主要分為輸入層、隱藏層、輸出層3 層,采用隨機梯度下降算法。利用決定系數(R2)和均方根誤差(RMSE)評價模型的模擬效果。R2越高、RMSE越小,說明模型所預測的效果越好。R2最大為1,RMSE最小為0。
圖3 為經過Savitzky-Golay 平滑處理后的不同處理土樣的光譜特征值。同一含水率下,含鹽量上升導致氮光譜反射率下降(圖3(a)),光譜反射率的最大差值波段為1 909 nm,處理間最大相差4.24%;同一含水率條件下,含氮量升高導致鹽光譜反射率下降(圖3(b)),光譜反射率的最大差值波段為1 895 nm,處理間最大相差7.01%。同一含氮量條件下,含水率升高導致鹽光譜反射率上升(圖3(c)),光譜反射率的最大差值波段為1 870 nm,處理間最大相差2.34%;同一含氮量條件下,含鹽量升高導致水光譜反射率下降(圖3(d)),光譜反射率的最大差值波段為1 894 nm,處理間最大相差5.01%。同一含鹽量條件下,含水率升高導致氮光譜反射率上升(圖3(e)),光譜反射率的最大差值波段為1 870 nm,處理間最大相差4.27%;同一含鹽量條件下,含氮量升高導致水的光譜反射率下降(圖3(f)),光譜反射率的最大差值波段為1 895 nm,處理間最大相差7.01%。

圖3 經Savitzky-Golay 平滑處理的不同處理土樣的平均光譜值Fig.3 Average spectrum of soil samples in different treatments after Savitzky-Golay smoothing
采用皮爾遜相關系數篩選出土壤水、氮、鹽的特征光譜波段。圖4 為土壤水、氮和鹽的皮爾遜相關系數及其顯著性。在350~2 500 nm 范圍內,土壤水分與光譜反射率呈正相關,但不顯著(P>0.05);在1 900 nm 附近的相關性最高,相關系數約為0.6。在350~2 500 nm 范圍內,土壤含氮量與光譜反射率呈顯著負相關(P<0.05);在512~2 500 nm 范圍內,土壤含氮量與光譜反射率的皮爾遜相關系數在-0.8~-0.6 之間。在350~2 500 nm 范圍內,土壤電導率與光譜反射率呈顯著負相關(P<0.05),在1 878 nm處的皮爾遜相關系數為-0.8。

圖4 土壤含水率、含氮量、含鹽量與光譜特征值的顯著性及皮爾遜相關系數Fig.4 Significance and Pearson coefficient of soil water, nitrogen, and salt content with the characteristic value of the spectrum
不同模型對訓練集的預測效果如圖5 所示。32個主成分的PLSR 模型的R2與RMSE均優于SVR 模型與BPNN 模型。分別對56.5、64.7、56.5、64.7 g/kg含氮量下不同組合處理TN 量進行反演,R2最高的是56.5 g/kg 處理下PLSR 的TN 反演模型,R2為0.576 9,RMSE為6.9 mg/L;R2最低的為56.5 g/kg 與64.7 g/kg組合處理下BPNN 的TN 反演模型,R2僅為0.146 7,RMSE為6.157 mg/L。就RMSE而言,預測值與實測值最接近的是64.7 g/kg 含水率處理下的PLSR 模型,RMSE為5.12 mg/L。BPNN 模型反演土壤含氮量時,無論是針對單一含水率處理還是2 個含水率處理都存在下限閾值。56.5 g/kg 含水率處理下土壤含氮量反演下限閾值為3.619 mg/L,64.7 g/kg 含水率處理下TN下限閾值為5.257 mg/L;而含水率為56.5 g/kg 和64.7 g/kg 組合處理下TN 反演的下限閾值為4.297 mg/L。


圖5 不同土壤含水率條件下土壤含氮量實測值與高光譜反演模型預測值的對比Fig.5 Comparison between the measured and predicted values of soil nitrogen content with the hyper-spectral inversion model under the different conditions of soil water content
圖6 為PLSR、SVR 和BPNN 構建的土壤EC反演模型的預測效果。R2最高的是64.7 g/kg 含水率處理的PLSR 模型,為0.555 6。R2最低的是2 個含水率處理組合的BPNN 模型,為-0.924 4。就RMSE而言,預測值與實測值最接近的是64.7 g/kg 含水率下的PLSR 模型,RMSE為257 μS/cm,最差的是56.5 g/kg 和64.7 g/kg 含水率處理下的SVR 模型,RMSE為530 μS/cm。

圖6 不同土壤含水率條件下土壤電導率實測值與高光譜反演模型預測值的對比Fig.6 Comparison between the measured and predicted values of soil electrical conductivity with the hyper-spectral inversion model under the different conditions of soil water content
由于僅有64.7、56.5 g/kg 的2 個含水率處理,因此,將2 個含水率處理合并進行含水率預測。不同模型對訓練集的預測效果如圖7 所示。PLSR 模型的預測精度最高,R2為0.662 4,RMSE為0.315 3。SVR模型最差,相關系數為0。

圖7 56.5 g/kg 與64.7 g/kg 混合水處理下的測定和預測含水率對比Fig.7 Measurement and prediction of the water content of the water treatment of 56.5 g/kg and 64.7 g/kg
高光譜對土壤中水、氮、鹽的反演精度較高[24-26],這是由于在單一因素下可以放大某一因子的特征波段。本試驗對土壤設置水、氮、鹽3 個因子,研究結果可應用于土壤鹽漬化地區。光譜在1 900 nm 附近的波谷受到水、氮、鹽3 種因素的影響,含水率越低,氮、鹽量越高,1 940 nm 之后波段主要受氮量影響。土壤含水率與光譜反射率呈正相關。隨著土壤含水率的升高,光譜反射率整體呈上升趨勢,這是因為沙土的持水能力較低,添加的水分在沙土表面形成水膜,水膜的鏡面反射導致反射率上升。張世文等[27]、劉秀英等[28]、劉偉東等[29]研究表明,水分會吸收1 400、1 900 nm 附近的特征波段光。本研究篩選出鹽堿土的水分特征波段在1 900 nm 附近,決定系數略低于已有研究結果。這主要是因為氮和鹽吸收了1 400 nm處的光線。孫建英等[30]研究發現,氮在1 827、1 901、2 090、2 240 nm 的4 個波段的相關系數較高。本試驗下土壤氮量的特征波段為1 490~1 506、1 540~2 006、2 011~2 500 nm。隨著土壤含鹽量的增加,土壤光譜反射率呈下降趨勢,這與穆其爾等[31]的結果一致。Srivastava 等[32]研究發現,1 390~2 400 nm 波段的反射率與土壤鹽量相關性較高。
多因素影響下的土壤水、氮、鹽反演模型中,偏最小二乘回歸模型反演水、氮、鹽量的相關系數均高于支持向量機和BP 神經網絡,偏最小二乘回歸的均方根誤差最小。同一水分條件下,隨著含氮量與含鹽量的增加,光譜反射率逐漸降低,并且低濃度NaCl溶液與碳酸銨溶液在光譜反射率上的整體差距不明顯,導致輸入到模型中的光譜區別不大。偏最小二乘回歸對土壤含水率的預測效果最好,這是因為同一水處理內部水分差距較小,不同處理間水分差距較大。土壤含水率反演的R2最高為0.662 4,低于裴承忠等[33]的結果。土壤鹽量反演的R2最高為0.555 6,也略低于裴承忠等[33]的結果,這是由于電導率反映的是土壤中全部水溶性鹽的導電性能,土壤中的鹽分組成較為復雜,且尿素溶于水生成碳酸銨會使電導率上升,導致光譜反射率曲線發生偏移,致使鹽的特征波段信息不全,降低模型對鹽的預測能力。土壤氮量光譜差異顯著,特征明顯且波段多,R2最高為0.576 9。
1)南疆鹽堿土的水光譜特征波段為1 900 nm,氮光譜特征波段為1 490~1 506、1 540~2 006、2 011~2 500 nm,鹽光譜特征波段為1 880~1 883 nm 和1 890~1 942 nm。
2)水分會使南疆鹽堿土光譜反射率上升,氮和鹽會使南疆鹽堿土光譜反射率下降。
3)在水、氮、鹽共同影響下,建立了基于高光譜的土壤水、氮、鹽反演模型,偏最小二乘回歸模型的估算精度最高。
(作者聲明本文無實際或潛在的利益沖突)