陳香月 丁建麗 葛翔宇 王 飛 王敬哲
(1.新疆大學智慧城市與環境建模自治區普通高校重點實驗室, 烏魯木齊 830046;2.新疆大學綠洲生態教育部重點實驗室, 烏魯木齊 830046;3.深圳大學自然資源部大灣區地理環境監測重點實驗室, 深圳 518060)
土壤鹽漬化指水溶性鹽分向土壤表面遷移和聚集的過程,是自然因素和不合理的人類活動共同作用影響下的產物[1-3]。在人口快速增長背景下,現有土地資源難以繼續承載更多的人口生產生活所需,合理開發利用后備耕地資源,對緩解土地資源稀缺綠洲地區的人地矛盾尤為關鍵,也成為近年來新的研究熱點。如何準確、快速、廉價獲取鹽漬化信息是科學合理開發鹽漬土地資源的重要依據。近年來,遙感技術因其具有回訪周期快、覆蓋面積廣、成本低、獲取方便,且非侵入土壤等優勢,已成為土壤鹽漬化信息數字制圖研究中廣泛應用的有效工具[4]。
地表的異質性意味著就單一尺度研究地學問題具有一定局限性,通常基于特定尺度的研究結果較難直接推廣至其他尺度,尺度上的細微變化都將引出新的科學問題[5-6]。尺度問題研究的根本目的是挖掘時空尺度特征信息,從而找到與研究對象的觀測尺度相匹配的本征時空尺度。土壤鹽漬化往往具有極強的時空變異性,受各類環境要素影響極大,對土壤鹽漬化現象發生發展的深刻理解都離不開尺度問題這一環節[7-8]。由于遙感影像具有多分辨率(多尺度)特性,不同尺度在遙感數據中所呈現的地物信息豐富度存在顯著差異,通常某些規律往往在特定的尺度下才被發現,尺度的不適配將會降低土壤鹽度模擬效果,故探尋最優研究尺度對于干旱區綠洲土壤鹽漬化研究具有重要意義。
在土壤研究中,基于遙感數據計算的環境變量常被用于預測土壤屬性的空間分布。鹽分含量及其組成成分是影響鹽漬化土壤光譜特征的主要因素,已有研究表明鹽分含量增加會引起反射率增加[9-10]。植被作為土壤鹽漬化程度的間接指示器,其光譜特性是各種生態環境因子的綜合表達,而為了有效理解這種表達,需要在合適的尺度下開展研究[11-12]。目前,已有部分學者對土壤屬性與遙感數據尺度(柵格單元大小)之間的關系進行了初步分析[13-14],并在此基礎上對其衍生的生物物理過程開展相關研究[15-16],但基于植被光譜特征信息間接推理土壤屬性研究多停留在單一尺度上,對不同尺度下環境變量對土壤屬性的解析尚不夠深入。而忽略尺度效應可能會導致難以充分理解“土壤-環境”間的復雜關系,更會限制土壤鹽漬化遙感模型的性能[17]。
鑒于此,本研究針對土壤鹽漬化這一典型土壤退化過程開展尺度效應研究,以新疆北部典型綠洲——奇臺綠洲為研究區,利用遙感衍生數據與土壤表層實測電導率數據,定量描述土壤鹽度與環境變量關系之間的尺度影響,結合機器學習算法通過多環境變量對土壤鹽度分尺度進行模擬,并獲取不同尺度下各環境變量對土壤鹽度的解析能力,以期找出最優響應尺度,充分理解不同尺度下環境變量與土壤鹽度之間的復雜關系,對綠洲土壤鹽漬化狀況進行有效評估,為干旱區綠洲農業可持續發展提供科學參考與數據支持。
奇臺綠洲位于新疆維吾爾自治區昌吉回族自治州奇臺縣境內,地處新疆維吾爾自治區東北部,博格達山北麓,天山山脈東側。研究區(43.95°~44.20°N,89.20°~90.00°E,圖1)位于奇臺縣平原地區,屬溫帶大陸性干旱半干旱氣候,夏季高溫少雨,日溫差、年溫差較大,多年平均降水量為211.9 mm,多年平均蒸發量為1 735.7 mm,蒸降比高達8∶1,強烈的蒸散發作用及水資源的不合理利用導致奇臺縣內廣泛存在土壤鹽堿化問題。全區約有31%農業土地存在鹽堿化現象,嚴重危害到當地的生態環境與農業生產生活[18]。
本研究利用的樣本采樣時間為2009年6月,樣本量為58個,樣本主要集中在綠洲平原區,主要的土地利用與覆蓋類型包括:農田、荒漠、灌叢、稀疏草地、草地等。以梅花五點混合采樣方法采取表層土壤(0~20 cm)約500 g,同時記錄樣品相應的地理坐標,標記后用自封袋封裝帶回實驗室。采集得到的樣本在室內剔除雜質晾干后進行研磨與過篩處理(2 mm),采用土水質量比1∶5制備土壤懸濁液,利用土壤溶液電導率儀對制備的浸提取液進行電導率(dS/m)測定[17]。
Landsat TM是搭載于Landsat 4/5衛星上的光學成像傳感器,提供了大量中分辨率和長時間序列的遙感數據。其光譜范圍從可見光波長(0.45 μm)到中紅外波長(12.5 μm)間共7個波段,重訪周期為16 d,空間分辨率為30 m。從美國USGS官網下載2009年6月過境的Landsat TM影像,行列號為141/29,以完全覆蓋所有采樣點且云量覆蓋低于10%為準。通過ENVI軟件對數據進行輻射定標、大氣校正,最后將輻射率轉為研究需要的地表反射率以進行后續分析。
地理空間數據多具有尺度依賴性,尺度效應被認為是對地觀測中不可忽略的問題,嚴重制約了遙感、地信等學科的發展,故在研究中考慮尺度問題非常必要[19-20]。魏陽等[21]研究表明,就干旱區綠洲土壤而言,在地面分辨率1 km左右開展土壤鹽度尺度效應研究是有效的。基于此,本研究采用柵格重采樣和鄰域濾波兩種升尺度方法,將最大分辨率控制在1 km左右,以此為閾值對影像進行升尺度轉換。柵格重采樣方法選用最鄰近法,基于像元對影像進行重采樣計算,鄰域濾波方法主要是基于鄰域窗口的選擇,在特定空間分辨率下按照n×n移動窗口分別計算3×3、5×5、…、31×31多個鄰域濾波,其中窗口尺度為奇數,數值間隔為2,見圖2。具體而言,利用ENVI軟件中的重采樣模塊(Resize data)將空間分辨率為30 m的原始遙感數據進行柵格重采樣處理,研究以30 m為步長將原始遙感數據依次重采樣至990 m。在鄰域濾波計算中,選擇了7種原始分辨率,分別為30、60、90、120、150、180、210 m,鄰域濾波窗口尺度選擇了3×3、5×5、… 31×31共計15個級別,共對應39個尺度,利用ENVI中的鄰域濾波模塊(Occurrence measures)實現。
基于尺度變換后的遙感影像,計算應用于土壤鹽度評價的植被指數和歸一化紅外指數[17]以及圖像衍生變換參量(表1)。植被與土壤關系密不可分,作為地表變化的直接觀測因子,其長勢能夠間接反映土壤鹽漬化程度[22-23]。且已有研究表明,相較于單純利用土壤信息進行鹽度預測,植被光譜信息的引入可以有效改善預測效果[24]。其中,歸一化植被指數(NDVI)、擴展歸一化植被指數(ENDVI)以及擴展增強性植被指數(EEVI)已經被證實可以間接用以判斷土壤鹽度[25-26]。歸一化紅外指數(NDII),亦稱土壤濕度/水分含量指數,通過融合Landsat TM的短波紅外波段信息,使得NDII對冠層濕度與土壤鹽度具有一定指示作用。圖像變換衍生因子某種程度上可以對原始波段信息進行高度凝練,對海量數據進行有效降維,避免維數災難。其中主成分分析(Principal components analysis, PCA)通過生成互不相關的輸出波段,研究表明主成分分析的前3個波段(PCA1、PCA2、PCA3)占數據整體信息高達90%以上,達到隔離噪聲和減少數據集的維數目的;纓帽變換(Tasseled cap transformation,TC)是一種特殊的主成分分析,該變換將地表信息有效地轉換成3個主題因子,分別為亮度(TCB)、植被綠度(TCG)和土壤濕度(TCW),可近似作為土壤屬性的相關指示因子。通過上述兩種尺度轉換方法共產生720個環境變量用于耦合多尺度和機器學習算法的土壤鹽度估算。

表1 選取的環境變量Tab.1 Environmental variables derived from pretreated remote sensed imagery
梯度提升決策樹(Gradient boosting decision tree,GBDT)[27-28]是一種由多棵決策樹組成的集成學習方法,它采用Boosting思想將多個弱分類器組成一個強分類器。該算法的基本原理是通過迭代計算,不斷減小模型的殘差,在梯度方向上建立一個新的模型來代替舊的模型[29],并在構建新模型的過程可以迭代地生成基本分類器的組合,從而將損失函數最小化。作為典型的集成算法,GBDT減少模型在建模過程中梯度方向上的殘差,相較于傳統的機器學習模型具有更好的預測能力[30],不僅能夠靈活地處理各類離散數據,同時無需過分調節超參數,更為重要的是,GBDT對輸入變量的數量及其自相關不敏感,還可以使用一些較為穩健的損失函數,對異常值具有較好的魯棒性[31-32]。針對遙感影像這一高維數據源,GBDT算法可最大程度實現信息的準確提取。因此,本研究基于GBDT,在不同尺度下利用環境變量進行土壤鹽度模擬,并獲取不同環境變量對土壤鹽度的貢獻度。隨機抽取建模集,并固定驗證集,以此優化模型參數,經多次訓練后,GBDT模型具體參數設置為:迭代回歸樹數量為300,學習速率為0.01,葉子節點的最小個數為7,交叉驗證折數為3,算法依托R語言平臺實現,流程如圖3所示。

基于GBDT算法,對不同柵格重采樣尺度下土壤鹽度進行預測,并計算相應尺度下不同環境變量對土壤鹽度的貢獻權重及其總體解析能力。為可視化表達不同尺度下環境變量對土壤鹽度的解析效果,本文引入泰勒圖進行相關表述(圖4,圖中黑色虛線表示調整R2,藍色弧線表示RMSE(dS/m),當調整R2越高、RMSE越小時模型效果越好)。圖4a為不同柵格重采樣尺度環境變量對土壤鹽度的解析能力,尺度范圍為30~990 m,在不同尺度條件下,不同環境變量對土壤鹽度的響應也不盡相同。

表2 土壤鹽度預測效果Tab.2 Statistical results of estimated soil salinity based on various scale conversion modes
由圖4a可知,上述柵格重采樣尺度的調整R2在0.56~0.75之間,RMSE在1.10~1.47 dS/m之間,其中在柵格重采樣尺度60 m下,對于解析土壤表層鹽度-環境變量效果最好,解析能力達到了75.31%(R2>0.75),為單一柵格重采樣尺度下研究土壤表層鹽度-環境變量關系的最佳尺度。結合不同尺度下各環境變量對土壤鹽度貢獻權重(圖5)發現,對應柵格重采樣尺度60 m下,對土壤表層鹽度貢獻率從高到低依次為NDII、EEVI、PC2、ENDVI,其貢獻率總和達到了77.32%,解釋了77.32%的土壤鹽漬化變異,這也佐證了本研究使用植被指數對表層土壤鹽度進行表征是可行的。隨著尺度的上升,GBDT算法對于環境變量和土壤鹽度的關系描述效果越來越不理想。其中,起主導作用的環境變量從原有與植被相關的TCG、植被指數等變成了圖像衍生變換參量,這可能歸因于隨著分辨率的下降,原始數據所包含的信息豐富度損失,植被特征被弱化,而PC、TC等參數以其獨有的信息優勢過渡為主導因素。
對30~210 m柵格重采樣分辨率下對應計算鄰域窗口3×3、5×5、…、31×31的鄰域濾波進行土壤鹽度的預測,并獲取各環境變量對土壤鹽度影響權重,結果見圖4、6。由圖4b可知,在30 m分辨率多種鄰域濾波尺度下,土壤鹽度-環境變量之間的調整R2最大值為0.79,RMSE為1.02 dS/m,可解釋78.55%的土壤鹽度變化,對應鄰域窗口11×11,地面分辨率為330 m、響應的環境變量依次為TCG、ENDVI、PC3、NDVI、NDII,能夠解釋近78.57%的鹽度變異性。圖4c、4d為60~210 m柵格重采樣分辨率下多種鄰域濾波尺度對土壤鹽度與環境變量關系的表征,調整R2為0.66~0.78之間。當基礎柵格重采樣尺度為60 m時,R2在0.68~0.78之間,RMSE為1.05~1.25 dS/m,其中當地面分辨率為300 m、鄰域窗口為5×5時效果最好;90 m時,R2在0.69~0.74之間,RMSE為1.05~1.24 dS/m,其中當地面分辨率為270 m、鄰域窗口為3×3時效果最好;120~210 m時,R2在0.66~0.76之間,其中當窗口為5×5時效果最好;對土壤鹽度的解析力分別達到76.01%、68.11%、69.41%、67.97%。可以發現,當初始分辨率為30、60、90 m和120~210 m時,對應最佳鄰域窗口分別為11×11、5×5、3×3、5×5,其中當初始空間分辨率為30~90 m時,最優土壤鹽度表征尺度為300 m左右。單一柵格重采樣尺度下,伴隨著鄰域窗口的變大,土壤鹽度對環境變量的解析程度也在下降;單一鄰域尺度下,隨著柵格重采樣尺度的增大其對環境變量的響應也在弱化。即隨著尺度上升,調整R2總體呈下降趨勢,RMSE呈上升趨勢,其中與土壤鹽度相關的環境變量集中為與植被相關的TCG和植被指數。
通過GBDT算法結合多尺度環境變量對土壤鹽度進行模擬,并獲取多尺度下環境變量指征土壤鹽度的最優組合。圖7為多尺度下基于原始分辨率數據和鄰域濾波尺度,考量環境變量對土壤鹽度-環境變量的協同影響。在參與分析的30~990 m所有柵格重采樣尺度時,其調整R2可達到0.91,RMSE為0.68 dS/m,對土壤鹽度的解析度達到90.63%。對鄰域濾波,分別以30、60、90、120、150、180、210 m為基礎分辨率,討論在上述7個基礎柵格重采樣分辨率下隨著鄰域窗口的變化環境變量與土壤鹽度的響應情況,結果如圖7所示,在空間分辨率為30、60、90、120、150、180、210 m時,其對土壤鹽度預測的調整R2分別為0.86、0.85、0.82、0.80、0.77、0.73、0.67,RMSE分別為0.81、0.85、0.94、0.99、1.06、1.14、1.27 dS/m,隨著基礎空間分辨率的下降,調整R2降低,環境變量對土壤鹽度的解析力度逐漸降低。當考慮30~210 m所有鄰域濾波的情況下,對土壤鹽度的調整R2可達到0.88,RMSE為0.78 dS/m,由此可見,相較于鄰域濾波變換,柵格重采樣可以更為顯著提高土壤鹽漬化建模效果。當考慮全尺度情況下,調整R2達到0.91,RMSE低至0.68 dS/m,對土壤鹽度的解析度達到90.66%,與柵格重采樣多尺度下性能接近,故當考慮全尺度時,增加鄰域濾波尺度對環境變量與土壤鹽度關系的研究改善有限。綜上所述,多尺度協同極大地提高了環境變量對土壤鹽度的解釋力,其中柵格重采樣尺度對環境變量與土壤鹽度關系的研究起到主導作用。
在植被覆蓋度高的區域,土壤鹽漬化會造成植被紅光波段反射率增加、近紅外波段反射率下降,故植被指數的變化有助于推測鹽漬化的程度和發展趨勢[3]。基于此,在綠洲地區,已有許多學者開展了相關研究,結果表明,因干旱區地理環境存在顯著的差異性,環境變量在某個區域表現出的高解析力,其泛化能力尚不可知;不同鹽度等級下的土壤鹽度光譜信息存在明顯差異,遙感指數在鹽漬化表征上具有復雜的不確定性;受多種因素影響,環境變量的數量和類別上還有待進一步優化[21]。在本研究中,隨著柵格分辨率的上升,環境變量對土壤鹽度的解析能力從與植被相關的TCG、植被指數等變成了圖像衍生變換參量,如PC1、PC2。對鄰域濾波而言,TCG、PC3、NDII、TCW和ENDVI可解析69.83%的土壤鹽度變異,對土壤鹽度的預測具有一定的應用優勢。不同柵格重采樣和鄰域濾波窗口尺度下,環境變量與土壤鹽度的關系存在較為明顯的差異,這說明了環境變量與土壤鹽度之間存在強尺度依賴性。MULLER等[33]在多種分辨率下對比了植被指數與土壤鹽度之間的耦合關系,發現隨著分辨率的降低其響應尺度也在降低,這與本研究得到的結論基本一致,如在30 m分辨率時,最佳鄰域窗口為11×11,隨著分辨率變為60、90 m,最佳鄰域窗口分別為5×5、3×3。然而,值得注意的是當分辨率在120~210 m時,最佳鄰域窗口穩定在5×5,這可能與研究區獨特的地理特征及土壤屬性的空間變異性有關。
尺度問題是生態學研究中最具挑戰的問題之一,也是遙感生態學需要面對的主要問題,反演的準確性和遙感數據的空間精度有很大的關系[34-35]。本研究以國內外研究者廣泛選用的Landsat 影像為數據源,針對土壤鹽漬化現象,分析了土壤鹽度-環境變量關系的尺度效應。但該數據的空間分辨率(觀測尺度)為30 m,僅依據單次采樣數據結合遙感對土壤鹽度進行模擬,仍存在一定的不確定性。隨著遙感技術的發展及傳感器分辨率的不斷提升,更優質的遙感數據的出現(更高空間分辨率、更寬光譜范圍等,如歐洲空間局的Sentinel-2多光譜遙感數據),為進一步研究尺度對土壤鹽度-環境變量之間耦合關系提供了新的選擇。同時,本研究使用固定觀測尺度,柵格重采樣的步長為30 m(像元逐個加入),但這可能造成某些尺度被遺漏。而高空間分辨率數據的引入則可以縮短研究間隔,使得更為細致地研究環境變量-土壤鹽度的尺度效應成為可能。需要注意的是,由于地表空間異質性的存在會影響土壤屬性或者過程模擬的精確程度,故合適的柵格分辨率和鄰域濾波尺度的選擇最終依賴于研究區的地域特點,即被模擬屬性的空間變異性和分布規律。
(1)單一尺度下,鄰域濾波尺度對綠洲土壤鹽度的模擬總體優于重采樣模式。在單一柵格重采樣尺度下,60 m柵格重采樣尺度對土壤表層鹽度-環境變量解析效果最好,解析能力達到75.31%;單一鄰域濾波尺度下,初始分辨率為30 m、鄰域窗口為11×11是土壤表層鹽度-環境變量最佳表征尺度,解析能力為78.55%,隨著鄰域窗口尺度的外推,其對土壤鹽度的響應效果逐漸減弱。
(2)柵格重采樣模式相對鄰域濾波而言,其調整R2波動范圍更為寬泛,分布范圍為0.56~0.75,而后者變化平緩。一定程度上說明,柵格重采樣方法對土壤鹽度-環境變量關系的變化較為敏感,鄰域濾波對土壤鹽度-環境變量關系的敏感程度相對較弱。
(3)當考慮融合多種尺度時,環境變量對土壤鹽度的模擬精度相比僅利用單一尺度而言,得到極大程度提升,具體表現在R2從0.78提高到0.91,RMSE從1.02 dS/m降低到0.68 dS/m,對土壤鹽度的解析度最高可達到90.66%,這也體現了不同環境變量協同作用可最大程度發揮其最大響應效力,同時變量之間的信息進行了有效互補。