孫浩然,趙志根,趙佳星,陳衛衛
(1.安徽理工大學 空間信息與測繪工程學院,安徽 淮南 232001;2.礦山采動災害空天地協同監測與預警安徽普通高校重點實驗室,安徽 淮南 232001;3.礦區環境與災害協同監測煤炭行業工程研究中心,安徽 淮南 232001)
土壤的物理、化學、生物等許多屬性都直接或間接地與有機質的存在有關。土壤有機質是土壤的重要組成部分,是評價土壤肥力的核心指標之一。耕作土壤表層有機質含量通常在5%以下,雖只占土壤總質量的很小一部分,卻在土壤肥力、環境保護、植物生長和農業生產等方面有著積極的作用和意義[1-3]。土壤有機質在空間分布上具有異質性且呈連續變化特點,掌握有機質的空間格局分布有利于農業的精細化管理。土壤有機質含量影響土壤色調、土壤孔隙度等進而影響光譜反射特性[4]。隨著衛星遙感、土壤近地傳感、數據挖掘技術和建模技術的發展,采用遙感技術實現表層土壤有機質空間格局反演及碳庫的數字制圖成為農業與環境遙感領域的熱點[5]。
以往土壤有機質空間分布格局反演通常采用地統計方法,在野外規則化地采集大量樣本數據并在室內分析,通過插值法實現尺度上推[6-7]。該方法取得了較好的效果,但在實際應用中,大面積的規則采樣操作復雜且成本過高。隨著遙感技術在光譜分辨率、空間分辨率、時間分辨率等方面顯著提高使得遙感影像在反演表層土壤有機質中得到廣泛應用,遙感技術反演區域表層土壤有機質含量已成為土壤調查、土地質量評價的主要手段。文獻[1,8]利用多光譜Landsat遙感影像DN值與表層土壤有機質的聯系,建立預測模型,對區域有機質含量進行大尺度反演,并完成表層土壤有機質空間分布格局制圖。Landsat遙感影像空間分辨率較低,在反演表層土壤有機質時受混合像元影響;其光譜分辨率低,土壤有機質含量的差異與反射率(或DN值)之間的響應關系不強,難以精確反演區域表層土壤有機質含量空間格局分布。高光譜精細的光譜曲線構成了獨特的超多維光譜空間,通過識別地物光譜的診斷特征可以在表層土壤有機質反演過程中取得更好的效果[9]。文獻[10-13]利用高光譜數據的光譜反射率及反射率的變換形式,采用線性回歸法、多元線性回歸法、神經網絡法及最小二乘回歸法分析構建土壤有機質預測模型。此方法精度雖高,但多基于田間和實驗室操作層面,尺度較小,不利于區域尺度表層土壤有機質反演。文獻[14-15]將小波分析應用到土壤光譜數據的處理中,確定了原始特征光譜的最佳小波分解尺度,并在小波包分解基礎上建立土壤有機質預測模型,提出了一種新的土壤有機質反演方法。文獻[16-17]將小波包分析方法應用于Hyperion遙感影像數據中,利用高光譜遙感影像反演表層土壤有機質含量,取得良好的預測效果。高光譜遙感反演表層土壤有機質往往受限于空間尺度小,難以完成區域尺度表層土壤有機質反演。隨著中國自主發射的珠海一號(Zhuhai-1)衛星高光譜影像投入使用,以其光譜分辨率和空間分辨率獨特的優勢,能夠高精準、定量化地反演表層土壤有機質。本文以珠海一號的高光譜影像為實驗遙感影像,通過幾何校正、輻射校正、降噪等手段處理遙感影像,探索高光譜影像反演鄉鎮尺度表層土壤有機質含量的方法。引入小波包多尺度分析方法對高光譜遙感數據進行處理,分別建立多元線性回歸預測模型與基于高斯核的支持向量機回歸預測模型,對研究區表層土壤有機質含量的預測取得了可靠的結果。結果表明,以小波包分解高光譜數據的低頻分量建立的基于高斯核變換的支持向量機預測模型,可大尺度、高精準地反演區域表層有機質含量,為區域農業施肥管理與精準農業提供科學管理依據。
實驗地區位于淮南市舜耕山以南的三和鎮、曹庵鎮以及大通區的部分農村(32°36′55.04″N~32°26′22.29″N,117°4′19.81″E~116°55′49.59″E)。該區地處平原地帶,日照充足,全年降水量893.4 mm,是淮南市重要的農業生產基地。研究區內農耕地主要以種植小麥、水稻、玉米、大豆、油菜等為主,以瓜果為輔,種植方式主要為小麥與水稻、玉米、大豆間作和輪作以及水稻的連作等。2019年5月初,通過手持式全球定位系統在研究區內隨機但均勻地采集無農作物覆蓋區域土樣34個樣點,在道路交叉口以及顯著地標處采集8個控制點以用于幾何校正。樣點均分布無植被覆蓋或幼苗期農田中,在30 m×30 m內采用五點取樣法獲得1個樣本,采樣深度為0~10 cm。將樣點烘干,過100目篩,送往安徽理工大學分析測試中心,采用元素分析儀法測定土壤中含碳量,通過SOM=SOC×1.724,將測定的有機碳含量轉化為有機質含量。
影像數據源為歐比特公司提供的高光譜遙感影像,成像時間為2019年4月5日。高光譜影像獲取較難,采樣時間與成像時間相差數日,土壤有機質變化幾乎可以忽略不計。采集土樣為研究區內已收割完畢和幼苗期農田土樣,可以忽略植被對采樣點光譜信息的影響。珠海一號高光譜影像結合成像技術與光譜技術,獲取高分辨率的連續、寬波段的圖像數據,單顆高光譜衛星的最大成像范圍150 km×2 500 km,彌補了以往高光譜影像光譜分辨率高而空間分辨率低和幅寬窄的缺點。同時,珠海一號衛星具有良好的時間周期性,可在較短的時間內實現同一地區的多遍重訪掃描;其波長范圍為400~1 000 nm,光譜分辨率可達2.5 nm,精細的光譜曲線可以檢測到光譜信息的細微差異,有利于地物特征的高精度反演。集成高光譜分辨、高空間分辨率及高時間分辨率等特點的國產高光譜影像在真正意義上促進了高光譜遙感的廣泛應用。本研究所采用的高光譜影像具有32個波段,藍、綠、紅、近紅外波段對應的中心波長分別是480(band2)、566(band7)、670(band14)和880 nm(band28),空間分辨率為10 m,其空間尺度適用于城鎮區域表層土壤有機質空間分布格局的反演與制圖。
為了消除輻射量誤差對表層土壤有機質反演過程中的影響,對高光譜遙感圖像進行輻射校正,獲得高光譜影像大氣上層表觀反射率產品。為精確提取樣本采集點的光譜信息,須首先對遙感圖像進行幾何校正,糾正遙感圖像的位置信息誤差,使得采樣點位置準確定位于遙感影像上。利用圖像自帶的RPC文件對高光譜影像進行幾何校正,誤差控制在 0.5個像元。利用研究區矢量數據裁剪研究區的范圍,并利用5×5高斯低通濾波對裁剪后的遙感影像做圖像增強處理,抑制高頻信息,使圖像平滑,消除遙感影像在成像過程中產生的噪聲。Zhuhai-1高光譜遙感波段信息及對應中心波長如表1所示。

表1 高光譜遙感影像波段信息
由于高光譜遙感影像的光譜反射率受大氣和地表多重誤差影響,光譜反射率與平原地區表層土壤有機質之間的微弱關系不足以準確描述二者之間的預測模型。小波包分析能夠讓信息能量集中,在細節中尋找有序性,篩選出其中的規律,為信號提供一種更加精細的分析方法。根據文獻[14,16]將小波包分析應用在土壤有機質中的研究,本文選用Db5小波基函數對采樣點原始光譜進行三層小波包分解。采用小波包分析多尺度分解采樣點光譜數據,將原始光譜數據分解為高頻分量和低頻分量。高頻系數能夠反映原始光譜微小的吸收特征,低頻系數與土壤質地、土壤微量元素含量、土壤含水量等因素對光譜反射率的影響有關。利用高頻系數、低頻系數分別進行光譜重構能夠達到突出微小細節特征、增強近似特征信息的效果。小波包分解結果如圖1所示。

圖1 小波包多尺度分析結果
在ENVI中提取采樣點在遙感影像上的光譜反射曲線,將實測表層土壤有機質值和提取的高光譜32個波段光譜反射率值、光譜經過小波分解的低頻分量、小波分解的高頻分量導入SPSS 19.0中。對以上數據進行描述統計分析、相關分析和Pearson 相關分析,分析土壤有機質值與高光譜影像各個波段反射率之間的相關關系。
利用相關性分析結果中原始光譜、小波包分解低頻分量、小波包分解高頻分量與土壤有機質含量相關性較高的波段作為自變量,有機質含量作為因變量,建立多元線性回歸分析模型,探究多元線性回歸分析模型對土壤有機質含量的預測效果。
利用支持向量機回歸(support vector machine regression,SVR)建立數據模型時,基于高斯核函數實現一個非線性變換,將輸入空間(歐式空間Rn或離散幾何)對應于一個特征空間(希爾伯特空間),使得在輸入空間Rn中的超曲面模型對應于特征空間中的超平面模型[18]。通過在特征空間中求解線性支持向量機建立擬合模型,使數據點到該平面的距離最近。
對于多元線性回歸分析,采用決定系數R2(式(1))對土壤有機質預測模型的準確性進行評價。基于高斯核函數的支持向量機回歸模型采用預測數據的均方誤差MSE(式(2))和平均絕對誤差MAE(式(3))對其預測準確性進行評價。
(1)
(2)
(3)

通過對研究區土壤采樣點有機質含量與高光譜影像各波段光譜反射率值、光譜經過小波分解的低頻分量、小波分解的高頻分量的相關性分析,土壤光譜反射率與實測有機質含量之間的相關性如圖2所示。

圖2 土壤光譜反射率與有機質含量之間的相關系數
土壤有機質含量與高光譜影像多個波段程負相關,在656 nm處負相關性最強(r=-0.680)。經小波包分解后的低頻分量與高頻分量最大相關波段的相關性均有所增強,低頻分量與土壤有機質的相關性和原始光譜與土壤的相關性較為一致,說明小波包低頻系數分解能夠有效突出光譜近似特征。不同光譜形式與有機質含量之間的最大相關性如表2所示。

表2 不同光譜變換與有機質含量最大相關波段分析結果
對原始光譜、小波分解低頻分量、小波分解高頻分量與土壤有機質含量相關波段做多次多元線性回歸實驗,得到結果如圖3所示。

圖3 不同光譜形式有機質含量預測模型
采用珠海一號高光譜遙感影像反演土壤有機質含量時利用多元線性回歸分析方法預測效果良好,R2均大于0.74;采用小波包多尺度分解的高頻分量和低頻分量建立土壤有機質預測模型,效果優于原始光譜預測效果。表3為不同光譜形式的土壤有機質含量預測方程。

表3 不同光譜變換與有機質含量最大相關波段分析結果
由多元回歸分析結果可以發現,采用高光譜影像原始光譜反射率需要多個波段進行反演土壤表層有機質。光譜經小波包分解的低頻分量和高頻分量實現了信息的集中,能夠以較少的波段達到較好的預測效果,且根據小波包分解后的高頻分量相關波段與低頻分量相關波段建立回歸模型,R2分別為0.770、0.789。結果表明,根據小波包分解得到土壤光譜信息的低頻分量與高頻分量所建立的土壤有機質模型可取得更佳的效果。
在采用遙感的方法反演表層土壤有機質過程中,遙感影像土壤反射率與經過精細處理的土壤所測定的土壤有機質含量存在誤差。同時,土壤含水量與土壤中所含的微量元素也會對遙感影像反射率曲線產生影響,土壤有機質含量與遙感影像的相關性受多種因素干擾,遙感影像反射率與土壤有機質含量之間并非線性關系。簡單的多元線性回歸模型沒有考慮到在反演土壤表層有機質過程中的多種因素干擾及反射率與土壤有機質含量之間并非線性關系,難以對研究區內海量土壤光譜信息數據進行更佳的預測。采用遙感方法進行土壤有機質數字制圖的過程中,基于高斯核函數變換的支撐向量機回歸模型處理遙感大數據往往更具有優勢。基于高斯核函數變換的支撐向量機回歸模型擅于解決非線性問題,通過對已有數據的訓練,尋找出一條最佳的預測曲線,實現對土壤有機質含量的預測。根據小波包分解得到的低頻分量和高頻分量,建立支持向量機回歸表層土壤有機質預測模型,預測效果比多元線性回歸模型更加精準。不同預測模型精度評估對比如表4所示。

表4 預測模型精度評估對比
由于原始光譜反射率詮釋表層土壤有機質含量的敏感信息不集中,且本次實驗采樣點數據較少,根據原始光譜反射率建立的基于高斯核變換的支持向量機預測模型極容易出現過擬合現象,不具備泛化能力。從表4可以得出,根據小波包分解光譜后的低頻分量和高頻分量建立高斯核變換的支持向量機回歸模型其預測值均方誤差(MSE分別為2.591、5.428)均小于多元線性回歸模型預測值均方誤差(MSE分別為9.302、8.765),該方法預測能力優于多元回歸模型;根據小波包分解光譜后的低頻分量和高頻分量建立高斯核變換的支持向量機回歸模型其預測值平均絕對誤差(MAE)分別為1.426、1.520,預測值相比于多元線性回歸模型的預測值更加接近真值。研究結果表明,在小波包對土壤光譜分解結果的基礎上建立高斯核變換的支持向量機模型預測效果優于多元線性回歸模型,其中根據小波包分解的低頻分量建立的基于高斯核函數變換的支持向量機回歸模型在表層土壤有機質的預測中效果最好,為區域表層土壤有機質的精準反演提供了一種新方法。
研究區表層土壤有機質含量與高光譜影像原始光譜反射率最大相關波段為656 nm處,國內學者何挺等[10]通過對174個土樣與ASD光譜反射率進行分析,得出反射率與有機質含量在675 nm 附近的相關性最強。考慮到珠海一號高光譜影像每個波段間隔接近15 nm,且不同區域土壤有機質含量的光譜響應波段略有差異,本研究中土壤有機質含量與光譜反射率的相關性與何挺等人的研究結果近似。本文所提出的預測模型精度與文獻[16-17]略有不同,原因可能是由于采樣樣本不足和不同研究區土壤含量差異性造成的。東北地區土壤有機質含量較高,土壤有機質預測模型精度普遍較高;Hyperion數據光譜分辨高,光譜范圍大,土壤有機質含量的敏感響應波段相關性大,往往在預測土壤有機質含量時會取得很好的效果,但其空間尺度較差,不足以廣泛應用。珠海一號高光譜遙感具有較好的空間尺度,采用珠海一號高光譜遙感影像反演表層土壤有機質分布具有精度和空間尺度上的雙重優勢,有利于推進遙感大尺度高精準反演的應用;其節約成本、較好的時間周期性等優點,有利于表層土壤有機質含量空間分布制圖。
研究區以農業為主,表層土壤有機質含量范圍主要位于8~38 g·kg-1之間。農田類型主要為平原地帶耕作農田、開發區農田、舜耕山腳少量丘陵農田。實驗發現,研究區內平原地帶土壤有機質含量普遍較高,介于25~38 g·kg-1之間,少數土壤有機質含量過高得益于農民的精細管理及部分水源充足、土地肥沃的田塊。開發區農田原屬于耕作農田,由于開發建設導致開發區內農田存在土地荒蕪現象,靠近城市開發區的一些農田與部分耕作農田土壤有機質含量介于15~25 g·kg-1之間,土壤有機質含量有所下降。土壤有機質含量較低的地塊多為山腳坡地,該部分農田由于土壤母質原因導致土壤肥力貧瘠,加之周圍開發區建設,農田種植作物復雜,低矮經濟樹木、糧食作物、蔬菜、瓜果等交錯種植且少于管理,土壤有機質含量介于9~15 g·kg-1之間。合理地劃分研究區土壤有機質含量等級,利用珠海一號高光譜遙感影像,采用小波包分解光譜的低頻分量建立基于高斯核變換的支持向量機回歸模型,可實現區域表層土壤的精準反演,為區域精準農業提供科學決策。
本文探索采用珠海一號高光譜影像反演區域表層土壤有機質含量,通過小波包分析的方法,可有效分離原始光譜的微小吸收特征和近似特征,采用低頻分量、高頻分量建立的多元線性回歸分析預測土壤有機質含量效果優于原始光譜預測效果,提高了土壤有機質含量的預測精度。依據原始光譜,通過小波包分析分解出的低頻分量、高頻分量,建立基于高斯核變換的支持向量機回歸模型效果優于多元線性回歸模型,其中以小波包分解的低頻分量建立的基于高斯核變換的支持向量機回歸模型預測效果最好。由于珠海一號高光譜遙感影像具有良好的空間尺度、光譜分辨率、時間周期等優點,研究結果為區域土壤有機質反演制圖提供了新方法、新思路,促進了遙感大尺度高精準反演區域表層土壤有機質的應用。