牛芳鵬,李新國*,靳萬貴,趙 慧,麥麥提吐爾遜·艾則孜
(1.新疆師范大學地理科學與旅游學院,新疆 烏魯木齊 830054;2.新疆干旱區湖泊環境與資源重點實驗室,新疆 烏魯木齊 830054)
土壤有機質(SOM)是衡量干旱區綠洲農林業與土壤生態系統平衡的關鍵參數,是改善區域土地荒漠化、土壤鹽堿化和草場退化等環境問題的關鍵因子[1-2]。高光譜遙感的出現在土壤有機質含量的估算以及土壤環境的檢測方面提供了強有力的技術手段,可以低成本、高效率的快速掌握該區域土壤理化性質及其動態變化過程[3-4]。在土壤有機質含量與光譜反射率反演模型上國內外眾多學者進行了大量研究[5-8]。Liu等[9]選用混合土地利用類型的土壤樣本進行土壤有機質預測,發現在350~800和1900 nm附近的波長對土壤有機質估算有重要意義,且在350~1000 nm波段土壤光譜反射率在每個波長上都不是線性相關的。王延倉等[10]發現采用光譜變換方法與連續小波耦合可提升土壤光譜反射率對土壤有機質的敏感性;Chen等[1]研究香格里拉森林土壤有機質含量的最優高光譜估算模型,結果表明土壤粒徑與光譜反射率呈負相關關系,土壤粒徑越小光譜反射率越明顯,且一階微分變換可顯著增強土壤有機質的光譜信息。于雷等[11]以江漢平原公安縣為研究區,通過對多種模型精度的比較發現原始光譜反射率經連續統去除后建立的土壤有機質高光譜偏最小二乘回歸(PLSR)預測模型效果最優,驗證集決定系數(R2)達0.84。石樸杰等[12]探討農田土壤有機質含量時發現光譜數據經矢量歸一化校正和一階微分變換后,構建的PLSR模型預測效果顯著,決定系數為0.91。林鵬達等[13]運用多元逐步回歸(MSR)與PLSR方法構建黑土土壤有機質高光譜估算模型,建模效果均顯著,R2≥0.75,均方根誤差(RMSE)≤0.25。土壤光譜反射率與土壤理化性質有著緊密的聯系。呂雄杰等[14]對自然條件下不同水分含量黃棕壤光譜特征進行了研究,試驗結果表明在可見光部分(460~710 nm),土壤含水量與光譜反射率相關性差,而在紅外部分(760~1650 nm)土壤含水量與光譜反射率達到極顯著負相關。沙晉明等[15]對8種不同環境條件下形成的土壤剖面進行光譜測量,發現土壤有機質與376、676及724 nm波段附近有較強的負相關性。國內關于荒漠[16-17]、平原[18-19]、煤礦區[20-21]等研究較多,干旱區湖濱綠洲土壤有機質含量高光譜估算模型的研究鮮有報道。以博斯騰湖西岸湖濱綠洲為研究區,對采集的115個土樣進行土壤有機質含量的試驗測量,并通過對光譜反射率進行5種不同形式的變換和預處理優化方法選取特征光譜波段,對比分析MSR與PLSR兩種方法,構建土壤有機質含量的高光譜估算模型,以期為干旱區湖濱綠洲土壤有機質含量快速估算提供一種方法。
博斯騰湖西岸湖濱綠洲行政規劃上屬于新疆博湖縣,位于焉耆盆地東南面,開都河下游,是典型的山前湖泊綠洲,地勢由西北向東南傾斜;研究區夏季干旱少雨,蒸發強烈;冬季寒冷干燥,年均降水量83.55 mm,年均溫8.0~8.6℃,季節過渡快,屬于大陸性荒漠氣候;主要土壤類型有綠洲潮土、扇緣典型鹽土、山地棕色荒漠等;區域土壤有機質含量較低,主要分布在10.00~20.00 g·kg-1之間,耕地土壤有機質含量平均為17.70 g·kg-1[22]。根據研究區的主要土地利用類型、植被覆蓋類型和微地形等因素,采樣區的范圍為200 m×200 m。
土樣采集按照蛇形法線路隨機布點,采樣時間為2019年5月3日,在每個樣區采用GPS記錄每一樣點經緯度坐標與高程數據;在樣區布設23個土壤剖面,并進一步分成不同深度(0~10、10~20、20~30、30~40與40~50 cm)取樣,每一層分三點取樣混勻后采用四分法取0.5 kg土壤,共計115個樣品。將土樣帶回實驗室經自然風干后進行物理碾磨過0.25 mm篩,分為兩份,其中一份用重鉻酸鉀容量法-外加熱法測定土壤有機質含量,單位為g·kg-1;另一份用作測試室外土壤高光譜數據[23]。
土壤光譜數據測量通過ASD FieldSpec 3地物光譜儀于室外晴朗天氣下測定,光譜波長為350~2500 nm,采集時間為12:00~14:00;光纖探頭視場角為25°,垂直于土樣表面約15 cm處,對每個土樣重復測試15次光譜曲線并記錄存檔;去除光譜反射率大于1的異常值后作均值化處理,得到該土壤樣品的實際光譜反射率數據。為減少采集過程中高頻噪音對光譜信息的隱藏,提升光譜數據信噪比,運用Origin軟件對光譜曲線進行Savitzky-Golay平滑處理[24];由于環境不可控因素,所有光譜曲線統一去除噪聲較大的尾部波段(2451~2500 nm)以及受環境水汽影響較大的1300~1450和1800~1950 nm波 段[25];并 對去除后原始光譜曲線分別進行一階微分(R′)、倒數的一階微分(1/R)′、連續統去除(Rcr)、對數的一階微分(lgR) ′、倒數的對數一階微分(lg1/R)′5種光譜變換。
采用Kennard-Stone(K-S)算法選擇80個土樣作為建模樣本集,剩余的35個樣本作為驗證樣本集[26]。以變換后的5種光譜敏感波段為自變量,實測的土壤有機質含量數據為因變量,運用Matlab軟件完成MSR模型與PLSR模型的建立。模型精度的檢驗選用決定系數、均方根誤差、驗證集相對分析誤差(RPD)和統計量F進行,其中決定系數的取值范圍為0.00~1.00,當決定系數越大、均方根誤差越小、統計量F>Fα時模型的擬合程度越高,估算方程越顯著;當RPD≥2.00時,模型非常成功;當1.40≤RPD≤2.00時,模型較為成功;當RPD<1.40時,模型不可靠[27]。
由表1可知,研究區土壤有機質含量變化范圍為5.09~44.00 g·kg-1,平均值為16.87 g·kg-1;樣本總集變異系數為44.69%,說明研究區土壤有機質含量呈中等變異,樣本的離散程度較高。訓練樣本變異系數為47.02%,驗證樣本變異系數為37.61%,與樣本總集相近,用于模型的構建具有一定的普適性和代表性。由表2可知,在0~10 cm土壤中有機質含量平均值最高,為19.84 g·kg-1,變異系數為39.69%;40~50 cm土壤中有機質含量平均值最低,為14.40 g·kg-1,變異系數最高,為57.53%;20~30 cm土壤中有機質含量變異系數最低,為36.10%;0~50 cm土層中土壤有機質含量隨著土壤深度的增加而逐漸減小,土壤有機質含量平均值最大相差5.44 g·kg-1。

表1 土壤有機質含量統計特征

表2 研究區剖面土壤中有機質的含量
由圖2a可知,在0~50 cm土層中,隨著土層深度的增加土壤有機質含量的反射率逐漸升高,40~50 cm土層土壤有機質反射率最高,0~10 cm土層土壤有機質反射率最低,在775、1150、2240 nm波段存在較明顯的吸收谷。根據研究區土壤有機質含量的狀況,結合前人研究成果,采用K-means聚類分析方法將土壤有機質含量劃分為<11.49、12.03~17.66、17.88~26.66、>29.04 g·kg-14類,獲得4種不同土壤有機質含量的平均光譜曲線[28]。從圖2b可知,4類光譜曲線形狀變化基本一致,在400~2135 nm波段反射率與波長呈正相關,光譜反射率隨波長升高而增強,在2135 nm波段之后反射率逐漸減弱,與波長呈負相關關系;在可見光波段(400~780 nm)波譜曲線上升速度加快,在短波近紅外及部分長波近紅外波段(780~1300 nm)上升相對緩慢。有機質含量越高,光譜反射率越低,在400~1750 nm波段變化較明顯[29]。當有機質含量<11.49 g·kg-1時,其反射率均值為0.36;當有機質含量在12.03~17.66 g·kg-1時,其反射率均值為0.34;有機質含量在17.88~26.66 g·kg-1時,其反射率均值為0.33;當有機質含量>29.04 g·kg-1時,其反射率均值為0.30。
將土壤有機質含量分別與變換后的5種光譜數據進行相關性分析,并選擇通過顯著性檢驗(P<0.01)的波段作為敏感波段用于模型構建。由圖3可知,土壤有機質含量與原始光譜反射率R表現為單一負相關性,通過極顯著性檢驗(P<0.01)的波段數有658個,主要集中在448~1300與1489~1614 nm波段,相 關 系 數0.09<|r|<0.42,在760 nm波段相關性最高;通過微分變換后反射率曲線呈正負波動,放大了原始光譜曲線的細微變化,反射率一階微分R′與土壤有機質含量在400~504、664~891和1025~1092 nm波段相關性較高,相關系數r最大為0.46,通過極顯著性檢驗(P<0.01)的波段數有423個;連續統去除(Rcr)通過極顯著性檢驗(P<0.01)的波段數明顯減少,僅有242個,且相關性的連續性較差,呈極顯著相關性(P<0.01)的波段主要在404~440、458~551、601~687和758~813 nm;反射率倒數一階微分(1/R)′與土壤有機質含 量 在444~906、1003~1093、1171~1297和1541~1646 nm波段范圍內相關性較高,相關系數|r|最大為0.50,相關性比原始反射率R提高了19.05%,通過極顯著性檢驗(P<0.01)的波段數有745個;光譜反射率(lgR)′和(lg1/R)′與土壤有機質含量通過極顯著性檢驗(P<0.01)的波段數分別有556、657個,且都主要集中在590~756、770~892、1003~1092與1223~1291 nm波段,相關系數|r|最大值均為0.49,且都主要集中在676 nm左右。綜合分析,不同光譜變換下的最佳顯著性波段主要集中在590~687、758~892、1003~1092和1171~1297 nm波段。
2.4.1 多元逐步回歸模型
由表3可知,基于5種變換形式建模的決定系數在0.41~0.68之間,均方根誤差在6.55~8.77 g·kg-1之間,建模精度較差。其中以(lgR)′建模決定系數最高,Rcr模型次之,決定系數分別為0.68、0.65;(1/R)′建模效果最差,決定系數為0.41。從圖4可知,(lgR)′模型驗證集決定系數為0.66,預測效果最好,均方根誤差為4.65 g·kg-1,統計量F達56.19,其次為Rcr、R′模型,驗證集決定系數依次為0.63、0.61,均方根誤差依次為3.06、3.55 g·kg-1。R′模型驗證集決定系數大于建模集決定系數,存在不穩定性,總體來說,在MSR模型中經(lgR)′、Rcr變換下的土壤有機質含量估算模型精度較好。

表3 土壤有機質含量多元逐步回歸模型構建
2.4.2 偏最小二乘回歸模型
由表4可知,5種變換光譜建立的PLSE模型較MSR模型的決定系數均有所提高,分別增長了15.52%、26.15%、65.85%、22.06%、48.84%,均方根誤差分別降低了32.70%、24.43%、35.76%、47.99%、32.84%;5種光譜變換形式的PLSE模型預測能力排序為(lgR)′>Rcr>(1/R)′>R′>(lg1/R)′,其中(lgR)′模型的建模集決定系數最高,均方根誤差最小,分別為0.83和4.01 g·kg-1;(lg1/R)′的建模決定系數最低,為0.64,均方根誤差最大,為5.89 g·kg-1。由圖5可知,(lg1/R)′、R′的驗證樣品分布較散,偏離1∶1線程度較大,均方根誤差分別為4.12、3.86 g·kg-1;Rcr、(1/R)′與(lgR)′模型驗證樣品在1∶1線偏離程度較低,決定系數均大于0.75,相對分析誤差均大于1.40,其中以(lgR)′模型驗證效果最好,誤差最小,決定系數為0.82,均方根誤差為2.64 g·kg-1,相對分析誤差為2.30,統計值F為116.41。
對比采用MSR、PLSR兩種方法建立的10個數學模型,可知對數一階微分(lgR)′變化下模型效果均高于其它變換形式,且基于(lgR)′變換下PLSE模型建模集與驗證集決定系數分別高于MSR模型22.06%、24.24%,建模集與驗證集的均方根誤差分別低于MSR模型47.99%、43.23%,表明選用(lgR)′變換下的特征波段所建立的PLSR模型可以更好地實現研究區土壤有機質含量的估算。

表4 土壤有機質含量偏最小二乘回歸模型構建
研究表明,隨著土層深度的增加土壤有機質含量的反射率逐漸升高,且土壤有機質含量越高光譜反射率越低,在不同深度、不同有機質含量下土壤有機質光譜曲線變化趨勢一致[30]。本研究通過樣區采集剖面土樣115個,主要分析了湖濱綠洲土壤有機質含量的高光譜曲線特征,并構建湖濱綠洲土壤有機質含量的高光譜估算模型,結果表明,最優模型決定系數為0.83,比林鵬達等[13]、南鋒等[21]、方少文等[31]最優模型決定系數分別低0.14、0.12、0.07,高于喬娟峰等[32]模型決定系數0.04,表明選用PLSE方法建模效果較一致。土壤光譜反射率能夠綜合反映土壤內在理化性質,不同區域土壤因其理化特性的差異,土壤有機質光譜的響應波段也不同[33-34]。有機物、含水量和土壤質地是影響土壤光譜反射率的主要因素[35]。土壤水分的存在會改變光的折射率而影響光的散射,司海青等[36]的研究結果表明,去除土樣水分可以提高有機質高光譜估算精度。宋金紅等[37]發現土壤光譜特性在很大程度上依賴于成土母質。方少文等[31]選取紅壤地區土壤有機質的敏感波段560~710 nm進行建模,最優模型為(lg1/R)′光譜變換下PLSR模型;林鵬達等[13]研究表明光譜數據利用連續小波變換方法預處理后結合R′變換,選取400、486、712、821、1770和2416 nm波段建立黑土有機質含量高光譜反演模型精度最高;南鋒等[21]選取(lg1/R)′變換下的400~1830、1860~2400 nm波段建立黃土區農田土壤有機質高光譜模型最優;喬娟峰等[32]通過對光譜數據去包絡線后選取800~960、1050~1110與2000~2100 nm波段建立荒地土壤有機質高光譜模型最優;本研究土壤有機質高光譜敏感波段主要集中在590~756、770~892、1003~1092和1223~1291 nm,經(lgR)′變換后建模精度最高,這與上述研究在敏感波段的選擇上基本一致,但在光譜響應的具體位置存在較小差異,可能與對光譜反射率的預處理方法有關[38-39]。萬洪秀等[40]、吳成永等[41]對博斯騰湖流域植被覆蓋變化的研究表明,2001~2016年間博斯騰湖流域植被覆蓋度指數多年平均值為2.85,植被覆蓋度較低,建立植被指數與土壤有機質含量的模型效果不明顯。由于不同綠洲土壤有機質組成的差異,土壤水分、土壤母質等因素對綠洲土壤有機質含量的高光譜估算影響有待于進一步研究。
研究區土壤有機質含量變化范圍為5.09~44.00 g·kg-1,平均值為16.87 g·kg-1,變異系數為44.69%,呈中等變異;不同土壤有機質含量等級的光譜曲線形狀較為一致,土壤光譜反射率在400~2135 nm波段隨波長的增加而升高,呈正相關,在2135 nm波段之后呈負相關,且在400~1750 nm波段土壤有機質含量越高反射率越低。
反射率(1/R)′與土壤有機質含量的相關性最高,相關系數|r|最大為0.50,比原始反射率R提高了19.05%;土壤有機質的顯著性波段(P<0.01)主要集中在590~687、758~892、1003~1092和1171~1297 nm 4個波段。
研究區土壤有機質含量高光譜估算模型為:Y=30428.37X677+12738.78X775+2894.02X865+11589.35X885+5.56,建模集和驗證集決定系數R2分別為0.83和0.82,均方根誤差RMSE分別為4.01和2.64 g·kg-1,驗證集統計量F=116.41(P<0.01),RPD=2.30預測能力較好。