顏祥照,姚艷敏,張霄羽
(中國農業科學院農業資源與農業區劃研究所/農業農村部農業遙感重點實驗室,北京100081)
土壤有機質(Soil Organic Matter,SOM)是指以各種形態和狀態存在于土壤中的各種含碳有機化合物,包括土壤中的動物、植物及微生物殘體的不同分解與合成階段的各種產物,具有提供作物養分、土壤保水保肥、土壤緩沖、促進土壤團粒結構形成等生物、化學和物理作用[1]。SOM含量是衡量土壤肥力高低的重要指標,其空間變異及制圖是了解農田土壤肥力的空間分布格局、培肥地力、精準施肥的基礎;同時,SOM也是耕地質量評價、土壤碳循環、土壤污染治理等研究的重要參數,因而,快速、準確地監測SOM含量及其空間分布特征對于農田合理使用與保護、保障糧食安全等方面具有重要意義。
遙感技術的發展為SOM預測和制圖提供了有力的數據和技術支持。土壤有機質含量和組成對土壤反射率有著重大影響已為各國學者公認[2-4]。20世紀70年代,國內外學者嘗試開展土壤光譜反射特性與SOM之間的相關性分析研究[3,5-6];20世紀80年代,學者開始利用多光譜遙感數據預測區域SOM含量和制圖;20世紀90年代以來,隨著各國非成像高光譜儀、成像高光譜遙感的技術發展,高光譜影像光譜波段數已從30多個增加到300多個,波段范圍為0.4~12.7 μm,SOM遙感定量反演與制圖研究有了新的突破,為進入實用化系統應用階段提供了數據基礎和技術支持。目前,利用遙感數據預測SOM含量與制圖可以概括為多光譜遙感法、結合遙感數據的SOM預測性制圖法和高光譜影像直接法。文章對SOM遙感制圖研究進展進行綜述,說明各方法的優點和局限性,重點對影響SOM高光譜影像制圖精度因素進行了分析,提出SOM遙感制圖需要解決的問題和展望。
多光譜遙感法主要是建立影像多光譜反射率或指數與SOM關系模型,進行SOM預測和制圖,可以分為直接法和間接法。直接法是直接建立遙感影像波段地表反射率與地面樣點實測SOM含量的關系模型,估算SOM含量與制圖;間接法是利用植被指數等遙感光譜指標與地面實測點SOM構建模型,間接估算SOM含量與制圖。
1.1.1 直接法
此方法的原理在于SOM含量不同,其光譜反射率不同,衛星傳感器記錄的光譜反射特征即可體現SOM含量的差異性。通過多光譜遙感影像光譜特征與實地樣點SOM數據的模型構建,直接反演獲得遙感監測區域的SOM空間分布格局。
多個學者在不同地域、不同尺度和多種土壤類型上運用多光譜遙感影像直接估算法進行了SOM空間格局研究。曾志遠[7]利用Landsat 1陸地資源衛星多光譜圖像,借助多元非線性回歸方法,探測了土壤表層(0~20 cm)SOM含量,將SOM含量表示成衛星圖像4,5,6,7這4個波段輻射值的函數,所得的回歸方程在0.01水平上顯著。Frazier等[8]利用TM數據1/4、3/4和5/4的波段比值對華盛頓州東部的Palouse地區休耕地進行SOM制圖。Chen等[9]在美國南部喬治亞洲的Crisp縣115 hm2的試驗田,建立了表層SOM含量與航空像片紅、綠、藍波段的圖像亮度值(DN值)的對數方程,預測SOM含量,指出高分辨率遙感影像能夠簡便、較準確地定量分析裸露地表SOM含量的空間變異性。李欣宇等[10]、張法升等[11]、劉煥軍等[12]、Zaheer Ahmed等[13]分別基于Landsat 5多光譜遙感影像,結合地面采樣數據,建立了研究區域表層SOM的遙感預測線性和非線性回歸模型,分析了空間分布格局,為改進土壤理化參數遙感反演、土地質量評價以及土壤碳庫估算等工作方法提供了理論與技術支持。王祥峰等[14]、王瓊等[15]基于HJ-1衛星數據,采用多元線性回歸法構建了SOM遙感監測模型,監測結果與地面SOM含量具有良好的線性關系,實現了SOM快速監測。陳思明等[16]基于Landsat 7中的TM1~TM5和TM7,采用線性波譜分離技術對研究區的TM影像像元進行分解和重建,構建SOM含量的反演模型和制圖。王銳等[17]基于Landsat 8遙感影像,定量反演了重慶市江津區SOM含量和制圖,結果表明第6波段反射率與SOM相關性最大為-0.840,以第4,5,6和7波段地表反射率建立的SOM含量多元回歸反演模型結果較好。
遙感影像直接估算法實施過程簡便,應用性較強,但該方法只能局限于裸露土壤的觀測,植被覆蓋影響SOM的直接遙感反演和制圖效果;而且多光譜遙感圖像波段少,光譜分辨率低,對SOM含量微觀差異敏感性不高。因此,基于多光譜遙感影像進行SOM估算的應用前景有限。
1.1.2 間接法
衛星傳感器無法直接獲取植被冠層覆蓋下的土壤理化性質信息,但是可以獲取植被狀態、生物量等指標,通過這些指標與SOM含量建立相關關系,可以間接獲得遙感觀測區域內SOM含量和制圖。常用的植被指數有歸一化植被指數(NDVI)、增強植被指數(EVI)、土壤調節植被指數(SAVI)、比值土壤指數(RSI)、歸一化土壤指數(NDSI)等。
連鋼等[18]借助Landsat 7 ETM遙感影像采用多元逐步回歸法(SMLR)建立了SOM與SAVI關系模型,分析不同土地利用類型、不同地形條件下,SOM空間變異及分布特征,但SOM預測結果不理想。周濤等[19]基于1982—1999年8 km分辨率的月AVHRR NDVI數據集,結合反映生態系統碳循環動態變化的CASA模型及Van’t Hoff土壤呼吸模型,估算獲得了8 km分辨率的全國土壤有機碳空間分布圖,但制圖精度不確定性較大。郭燕等[20]選擇模擬GF-1數據的第1,4波段構建RSI和NDSI,采用偏最小二乘建模方法(PLSR)預測SOM,結果顯示,模擬GF-1光譜也可以較好預測SOM和制圖,但是模型的穩定性相對較差。
利用植被指數等指標間接估算土壤有機質含量與制圖,具有省時、省力、費用低、應用性較強的特點。但是目前研究中SOM遙感預測結果和制圖精度不高,需要在不同地域和尺度上進一步研究和驗證,并且需要采取各種數學手段不斷完善預測模型,以提高模型的普適性。
該方法以土壤—景觀模型理論為基礎,通過易于獲得的植被、地形、氣候等成土環境因素,采用統計學(如線性回歸模型、決策樹、神經網絡、模糊聚類等)、地統計學等數學定量方法模擬土壤與成土環境因素之間的定量關系,推斷難于測定的土壤屬性值,并在空間上擴展,達到制圖目的[21]。由于遙感技術發展,不同空間分辨率、光譜分辨率的遙感數據產品為SOM預測性制圖提供了豐富的數據源,例如多光譜遙感指數數據(NDVI、濕度指數等)、高光譜遙感產品數據(地表溫度、NDVI、葉面積指數等)、非成像高光譜反射率數據等。各國學者借助3S技術,充分利用多源遙感數據源,采用統計建模、輔助地統計學開展大區域范圍的SOM預測性制圖研究。
在采用統計建模方面,黃興成等[22]以地形(DEM)、土地利用(矢量圖)、植被指數(Landsat NDVI)為環境因子,分別采用多元線性回歸模型(MLR)、SMLR和普通克里格方法得到SOM空間分布預測圖,結果表明,SMLR法的預測結果精度最高,平均誤差為0.167 g·kg-1、RMSE=3.65 g·kg-1、相關系數為0.697。周銀等[23]以東北—華北平原為研究區,以MODIS遙感數據產品(晝夜陸地表面溫度LST、凈初級生產力NPP、蒸散發ET等)、土壤地面高光譜數據為預測因子,基于樹形結構法構建SOM-環境預測因子模型進行SOM制圖,預測結果精度RMSE=7.25、R2=0.69、RPD=1.53,制圖結果與上世紀80年代第二次土壤普查SOM地圖具有相似的分布規律。吳才武等[24]將MODIS第1波段反射率與土壤質地、土壤水分數據相結合,通過回歸分析建立SOM預測模型和制圖,預測結果能反映研究區SOM空間變異特征。Mojtaba Zeraatpisheh等[25]將DEM與ETM遙感數據產品(NDVI、RVI、PVI、SAVI和TM4反射率)作為環境變量,采用Cubist、隨機森林(RF)、回歸樹等非線性模型和多元線性回歸機器學習法,開展伊朗Borujenregion區域8.6萬hm2的SOM預測和制圖,結果顯示RF預測和制圖效果最好,R2=0.55,RMSE=38.32%。Hamza Keskin等[26]以土壤指標(土壤類型、顆粒大小、陽離子交換量CEC等19個因子)、地形指標(高程、坡度等10個因子)、生態區域(9個因子)、氣候因素(降水、溫度等5個因子)、土地利用(土地覆蓋、土地利用等5個因子)、MODIS遙感數據(特征波段、NDVI、EVI、LAI、FPAR、NPP等16個因子)為環境變量,采用分類回歸樹(CaRT)、包回歸樹(BaRT)、增強回歸樹(BoRT)、RF、支持向量機(SVM)、PLSR、回歸克里格(RK)、普通克里格(OK)等8種機器學習方法,開展了美國Florida州0~20 cm表層土壤有機碳預測和制圖,結果表明模型估測精度順序為 RF>SVM>BoRT>BaRT>PLSR>RK>CART>OK,計算獲得了研究區域的總碳儲量。Di Chen等[27]以氣候(年均溫、年降水量)、地形(高程、坡度等4個因子)、MODIS數據(1~7波段、NDVI、EVI、RVI、DVI、SAVI、NDWI等)為環境變量,采用CaRT、BaRT、RF、BoRT等4個機器學習方法,開展了2000—2017年湖北省的SOM預測和制圖,結果表明,BoRT的SOM預測平均誤差最低,SOM制圖精度最好。
在采用地統計學方面,郭燕等[28]基于野外VIS-NIR高光譜測量,進行SOM與全波段和3種光譜指數(NDVI、差值指數和RSI)相關分析,并利用地統計方法和PLSR進行SOM建模預測與制圖研究,結果表明,與實測SOM克里格預測誤差相比,不同的指標均達到了較好的預測效果。劉艷芳等[29]以室內高光譜儀測量的土壤反射光譜為輔助變量,采用PLSR、OK、協同克里格以及RK分別構建土壤有機碳密度預測模型,結果顯示,結合高光譜信息且同時考慮殘差空間結構的OK模型表現優于其他模型,土壤光譜是土壤有機碳密度空間差值的理想輔助因子。Nastaran Pouladi等[30]在丹麥10 hm2農田,基于地形參數(14個)、土壤電導率、Sentinel-2遙感數據指數(DVI、NDVI、RVI、SAVI)、樣點SOM數據,比較RF-kriging、Cubist-kriging、RK-kriging、Kriging 4種SOM制圖方法,結果顯示,基于Kriging的SOM制圖方法最佳,R2=0.91,RMSE=2.27%。
遙感數據為土壤有機質預測性制圖提供了豐富的植被、氣候、土地利用等環境信息,目前仍是SOM制圖的研究熱點。結合遙感數據的土壤有機質預測性制圖提高了傳統土壤景觀建模制圖方法的精度,是大尺度范圍或復雜地形地區SOM制圖的有效方法。但由于SOM制圖精度依賴于土壤發生環境信息的數據質量,反映SOM空間差異特征略顯粗糙,尤其是小區域尺度的SOM空間分布差異特征反映不夠精細化。
高光譜遙感光譜波段可達幾十至上千,光譜分辨率較高,可以反映土壤表層屬性細微差異。例如,我國GF-5高光譜衛星搭載的可見短波紅外高光譜相機(AHSI)光譜范圍為0.4~2.5 μm,可見光近紅外(VNIR)光譜分辨率為5 nm,短波紅外光譜分辨率為10 nm,共有330個光譜通道,為充分利用高光譜優勢挖掘SOM預測和制圖潛力提供了豐富的數據,利用高光譜遙感開展SOM預測與制圖成為各國學者的研究熱點。學者們進行了2個方面的研究:(1)基于便攜式高光譜儀開展室內外SOM光譜理論與應用研究,采用不同統計建模方法估算SOM含量,并試圖分析及解釋其機理,為SOM制圖提供理論依據;(2)實現真正的高光譜遙感制圖,利用機載或星載高光譜數據開展SOM預測和制圖。高光譜影像直接法是直接分析從機載或星載高光譜影像提取的可見光—近紅外、中紅外樣點裸土光譜特征與SOM相關關系,建立反演模型,進行SOM預測和制圖。
1.3.1 可見光—近紅外機載高光譜SOM制圖
在可見光—近紅外機載高光譜SOM制圖方面,Thomas Selige等[31]、Michael Vohland等[32]基于澳大利亞Hymap成像高光譜儀(128個波段,420~2 480 nm),獲得了德國小區域的裸土農田光譜數據,分別構建了MLR和PLSR法的SOC(Soil Organic Carbon)高光譜反演模型,結果顯示,MLR和PLSR都給出較高的SOM建模精度,并獲得較好的SOM空間分布特征。Hively W Dean等[33]使用美國HyperSpecTIR成像高光譜儀(178個波段,400~2 450 nm)獲取了美國Chesapeake Bay區域6塊已耕作的裸地光譜數據,采用PLSR法構建了反射率一階微分的SOM模型,模型驗證精度R2=0.77,RMSE=0.3%,獲得了較好的SOM空間分布圖。Susana Fernández等[34]使用AHS傳感器中VIS-NIR的63個波段進行了西班牙過火山區土壤總碳預測與制圖,基于PLSR的SOM預測精度,制作了較好的土壤總碳分布圖。Daniel ?í?ala等[35]使用加拿大CASI-1500(72個波段,380~1 050 nm)和SASI-600(100個波段,960~2 440 nm)獲得捷克共和國4個區域的裸土高光譜影像數據,采用PLSR、支持向量機(SVM)、RF、人工神經網絡(ANN)等構建SOC反演模型,結果顯示,基于SVM的SOC高光譜模型驗證精度最高,R2>0.8,RMSE<0.16%,獲得了比較精細的SOC空間分布特征。Fabio Castaldi等[36]使用APEX高光譜成像儀(313個波段,400~2 500 nm)獲得了比利時壤土耕地帶和盧森堡Gutland—Oesling區域的高光譜影像,構建了基于PLSR的SOC反演模型,達到了較好的SOC預測和制圖精度,RMSE<4.9 g·kg-1,RPD>1.4。
在國內,周萍等[37]利用國產航空成像光譜儀OMIS-1(128個波段,450~2 500 nm)數據,并結合ASD FieldSpec FR便攜式光譜儀(350~2 500 nm)獲取野外光譜數據,采用MLR模型建立研究區域農田SOM反演模型,驗證精度R2=0.813 4,RMSE=0.379,實現了SOM填圖。張東輝等[38]利用加拿大CASI-1500航空高光譜成像系統(72個波段,380~1 050 nm),基于神經網絡模型(ANN)構建了黑龍江建三江地區黑土地SOM光譜反演模型并進行了制圖,回歸系數達到0.985,證明了這一方法在理論上的可靠性。汪大明等[39]利用加拿大CASI/SASI(100個波段,950~2 450 nm)航空高光譜數據,構建了黑龍江建三江PLSR回歸SOM模型與制圖,判定系數為0.885,RMSE為0.424,制圖結果揭示了SOM分布的更多細節。
1.3.2 可見光—近紅外星載高光譜SOM制圖
在星載高光譜SOM制圖方面,Raffaele Casa等[40]利用CHRIS-PROBA(37個波段,442~1 019 nm,空間分辨率17 m)獲得意大利Maccarese兩個裸土農田高光譜影像,基于PLSR建立SOM反演模型,模型驗證精度不太理想,RPD<1.4,分析可能的原因是研究區域SOM含量<3.5%,SOM含量差異較小(1.76%~2.24%),光譜響應效果較低。Sina Mallah Nowkandeh等[41]使用地球觀測衛星EO-1攜帶的高光譜傳感器Hyperion影像(242個波段,357~2 567 nm,空間分辨率30 m),分別進行了伊朗Ivanekey和Uromia plain區域及澳大利亞農區的SMLR、PLSR、最小一乘回歸(MinR)和主成分分析(PCR)的SOM高光譜預測和制圖,結果顯示,SMLR的SOM驗證精度較高,R2=0.69,RMSE=0.18。Cécile Gomez等[42]基于Hyperion預測澳大利亞農區SOM,獲得較好的預測和制圖結果。榮媛等[43]基于Hyperion高光譜影像,采用MLR、最鄰近法、裝袋算法、多元感知器、RF等5種估測模型預測南京新濟州濕地SOM和制圖,結果顯示,MLR模型預測精度最高,相關系數為0.766,RMSE=0.292。
1.3.3 中紅外高光譜SOM預測和制圖
學者研究顯示,SOM在中紅外光譜(2.5~25 μm)有明顯的光譜特征[44]。McCarty等[45]比較了近紅外和中紅外波段估算土壤有機碳能力,認為中紅外波段可以提供更好的SOC信息。Ladoni等[46]總結了前人估算SOM或SOC的研究成果,認為中紅外波段估算精度較高,平均R2=0.89,而近紅外波段平均R2=0.79,可見光波段平均R2=0.74。隨著中紅外高光譜傳感器技術的發展,例如美國空間增強寬帶陣列光譜儀系統(SEBASS,120個通道,2.5~13.5 μm)、加拿大Hypercam(2.5~15 μm)、芬蘭AisaOWL(96個波段,7.6~12.4 μm,光譜分辨率100 nm,空間像元384)、TASI-600機載高光譜熱成像系統(64個通道,8~11.5 μm,光譜分辨率55 nm,空間像元600)等光譜儀系統日益增加,基于中紅外高光譜SOM預測和制圖日益被學者關注,出現了少量的研究。
Andreas Eisele等[47]采用傅里葉紅外變換光譜儀室內測量了土壤光譜,并光譜重采樣為TASI-600的模擬數據,基于PLSR方法構建SOC反演模型,開展了SOC含量<1.5%的澳大利亞西部半干旱農業土地景觀區SOC預測研究,結果顯示,中紅外波段SOC模型驗證精度較高R2=0.90,RMSE=0.08%,并且如果將可見光—近紅外—中紅外光譜組合在一起,SOC預測精度大大提高R2=0.95,RMSE=0.04%,說明中紅外具有預測SOC的應用潛力。Grinand C等[48]以16 km×16 km格網模式采集了法國0~20 cm表層2 086個典型土樣,基于美國Nicolet 6 700漫反射傅里葉中紅外反射光譜儀(DRFTS,2.5~25 nm)進行了SOC的PLSR建模預測和制圖,結果顯示,SOC模型預測精度較好,SOC制圖趨勢與實測SOC分布圖相似。Pascucci S等[49]獲取了意大利南部Pontecagnano地區裸土機載TASI-600高光譜熱成像系統數據,基于PLSR和Cubist回歸模型開展SOC預測和制圖,并與實驗室條件下采用傅里葉變換紅外光譜(FT-IR)、可見光—近紅外光譜儀的預測結果進行比較,結果顯示,實驗室條件下傅里葉變換紅外光譜SOC預測效果(R2=0.95,RMSE=0.08,RPD=4.51)優于可見光—近紅外,而TASI-600機載高光譜數據的SOC預測效果(R2=0.53,RMSE=0.26,RPD=1.46)低于室內傅里葉變換紅外光譜,但該試驗進一步說明中紅外遙感數據具有較好地定量估算表層SOC的應用前景。
成像高光譜遙感有較高的光譜分辨率、連續的地物光譜信息,提高了SOM的探測能力,加強了小區域尺度SOM空間分布差異精細化表達,日益受到人們的關注。但因受到大氣、地形、植被、地表粗糙度、土壤水分等因素影響,成像高光譜影像SOM估算精度低于室內光譜,真正實現SOM遙感的實際應用還需要大量研究。
通過分析影響成像高光譜SOM預測和制圖精度原因,學者們認為SOM高光譜敏感波段優選以及適宜的SOM高光譜建模方法,是影響成像高光譜SOM預測和制圖精度關鍵,因此,學者們開展了采用非成像和成像高光譜數據解決以上問題的研究。以下將從SOM光譜特征分析、光譜敏感波段確定、定量反演方法等方面進行論述。
土壤有機質在可見光和近紅外區域有獨特的光譜特性,表現在土壤反射率隨著SOM含量的增加而下降,土壤反射光譜與SOM含量呈顯著負相關關系[3-6]。徐彬彬等[50]發現SOM含量與可見光波段的反射率、0.62~0.66 μm、0.6 μm弓曲差等均呈高度負相關。Krishnan等[6]、Galvao等[51]研究表明,SOM含量決定其在土壤反射光譜中所起的作用,當SOM含量>2%時,其在描述土壤反射特性起主要作用;當SOM含量<2%時,SOM在遮蔽其他土壤組成物質的光譜特性(如鐵錳的光譜特性)的能力有所減弱,研究SOM高光譜預測和制圖時,需選擇SOM含量大于2%的地區。
2.2.1 SOM光譜敏感波段位置
眾多學者針對不同土壤類型,利用土壤反射光譜確定SOM最佳敏感波段的研究結論有所差異,確定的敏感波段范圍可以劃分為4種類型:可見光區[52-55]、近紅外區[38,43,56]、可見光—近紅外區[57-67]以及可見光—近紅外—中紅外區[16]。
劉煥軍等[68]分析了黑龍江典型黑土區光譜特征,確定了580 nm、620 nm、630 nm、730 nm等可見光波段為敏感波段。郭燕等[28]分析了紅壤土的光譜特征,認為973 nm、983 nm、988 nm、1 907 nm、1 917 nm、2 213 nm以及2 216 nm近紅外區為SOM的敏感波段。Mathews等[69]發現可見—近紅外波段(0.5~1.2 μm)反射率與SOM相關性較好。陳思明等[16]研究認為濱海濕地土壤在可見光—近紅外—中紅外區都有SOM敏感波段。
2.2.2 SOM光譜敏感波段確定方法
SOM光譜敏感波段與采用的選擇方法有關,常用的方法主要包括相關性分析、主成分分析(PCA)等。相關性分析法是研究者采用最多的方法,用于分析SOM與光譜反射率之間的相關性,選擇相關系數較高(顯著)的波段作為敏感波段,用于建立SOM反演模型[28-29,43,52,57,59-61,70]。馬麗等[71]、欒福明等[62]運用 PCA 法,確定了 SOM 光譜敏感波段主成分最佳因子數。
目前SOM高光譜建模方法主要分為兩類,一類是線性統計模型法,另一類是非線性統計模型法。
2.3.1 線性統計模型法
線性統計模型法一般假設SOM與光譜特征呈線性關系,學者們多采用多元逐步回歸(SMLR)[12]、多元線性回歸(MLR)[37]、偏最小二乘回歸(PLSR)[70-72]等方法構建SOM高光譜模型。王祥峰等[14]以HJ-1衛星數據為數據源,基于MLR方法構建了SOM反演模型。Susana Fernández等[34]基于PLSR法建立了SOM高光譜反演模型,其校正誤差R2=0.970,RMSE=3.10,驗證誤差RMSE=5.85。史舟等[72]基于PLSR法建立了SOM光譜反演模型,取得了較好效果,R2和RPD分別為0.899和3.158。SOM線性模型的優點是,數據處理簡單快速,基于模型的SOM制圖速度也較快。但SOM與土壤光譜往往呈非線性關系,因此,該建模方法不能反映SOM與土壤光譜的非線性關系。
2.3.2 非線性統計模型法
SOM反演非線性模型主要包括人工神經網絡(ANN)、RF、SVM等方法。ANN是一種模仿動物神經網絡的數學模型,由輸入層、隱含層、輸出層構成,模擬任何輸入變量和輸出變量的非線性關系,在處理非線性問題上表現出較大優勢。張東輝等[38]基于航空高光譜影像,采用ANN方法反演SOM和制圖,回歸系數達到了0.985,說明了所建神經網絡模型的有效性;葉勤等[60]研究顯示,BP神經網絡模型的SOM反演精度較高,R2=0.893,RMSE=0.118 5%。王茵茵等[73]以陜西榆陽黃土丘陵和風沙灘地為研究對象,基于RF對表層SOM進行模擬預測,結果表明,SOM反演精度平均絕對誤差在1.27~1.57 g·kg-1之間,RF算法對復雜地貌區的SOM預測更有效。齊雁冰等[74]基于MODIS遙感數據,采用RF建模方法進行陜西省SOM預測,SOM預測精度在設定的不同抽樣百分比條件下,獨立驗證數據集的平均誤差不超過3 g·kg-1,預測值與實測值的相關系數在0.7以上。SVM的處理過程可概括為升維和線性化,將非線性轉化為線性,解決小樣本情況下的機器學習問題。Viscarra等[54]基于SVM建立了SOC的高光譜反演模型,R2達到0.86。雖然非線性模型符合SOM和土壤光譜反射率的非線性關系,但非線性模型計算較復雜,有些SOM反演模型建模精度較高,但驗證精度較低,會產生過擬合現象,同時,基于非線性模型的SOM制圖速度相對較慢。
2.3.3 最優模型選擇研究
線性和非線性統計模型都可以用于SOM高光譜建模,選擇何種模型更優,學者們做了大量研究,結論各不相同[16,43,52,56,58-59,60-62,70]。Hamza Keskin 等[26]采用 CaRT、BaRT、BoRT、RF、SVM、PLSR、RK、OK等8種機器學習方法,開展了美國Florida州表層SOC預測和制圖,結果表明RF模型精度最高,R2=0.72,RMSE=2.39 kg·m-2,RPD=1.88。袁征等[75]分別采用MLR、BPNN、模糊識別法建立高光譜SOM估測模型,研究結果表明,模糊識別模型的決定系數達到0.973,RMSE為0.046 8%,比MLR和BPNN模型精度都高。李勝男等[52]分別采用PLSR、MLR、SMLR法建立黑土區SOM反演模型,發現PLSR的SOM建模效果優于其他模型。
總結前人的研究成果,基于高光譜影像的直接土壤有機質預測和制圖存在以下問題。
(1)目前機載和星載高光譜傳感器較少,基于高光譜影像的SOM預測和制圖研究更少,特別是基于我國GF-5高光譜衛星影像的研究還未見報道,需要探索研究基于GF-5高光譜衛星影像的SOM制圖的可行性和潛力。
(2)SOM光譜敏感波段的位置和數量是影響SOM反演模型精度的關鍵,研究者們采用相關性分析、主成分分析等多種方法優選SOM光譜敏感波段。選擇的方法不同,敏感波段位置和數量不同。采用哪種方法最合適,敏感波段選擇多少,選擇哪些敏感波段,還需要進一步研究。
(3)選擇適宜的SOM光譜反演模型構建方法,也是另一個影響SOM光譜預測和制圖精度的關鍵。研究者們較多基于非成像光譜數據,嘗試采用線性、非線性模型或者多種建模方法組合,利用各自優勢,相互取長補短,從而提升模型整體預測性能,建模方法的復雜度逐漸增強。然而,建模方法的組合不是任意搭配,需充分理解方法的原理及性能,確保形成優勢互補。同時,復雜的模型雖能取得較好的預測效果,但對模型的可解釋性變弱,SOM制圖效率降低。另外,基于高光譜影像的SOM非線性建模研究較少。因此,選擇哪些適宜的SOM光譜建模方法,或者創新建模方法和算法,也需要進一步研究。
遙感技術的快速發展和傳感器的多樣化,使得利用多源遙感數據的SOM預測和制圖成為可能,提高了SOM制圖的精度和有效性。高光譜遙感的光譜分辨率高,能夠提供可見光—近紅外—中紅外波段的輻射信息,且連續的波段信息可以反映土壤表層屬性的細微變化,為SOM預測和精細制圖提供了豐富的光譜信息及空間覆蓋范圍,提高了SOM預測和制圖精度。雖然高光譜傳感器在獲取地表土壤圖像數據過程中,受到植被覆蓋、土壤含水量、土壤表面粗糙度以及大氣衰減和輻射校正的影響,也會影響到SOM預測和制圖精度,但隨著高質量高光譜影像數據改進技術的提高,以及加強SOM敏感波段優選和確定適宜的SOM高光譜模型方法等研究增強,基于高光譜影像開展SOM預測和精細制圖可行性增大,具有更大的發展空間。
隨著高光譜遙感技術的發展,SOM遙感預測和制圖需要在以下幾個方面開展深入研究。
(1)結合高光譜影像的土壤有機質預測性制圖方法的改進。遙感數據為SOM預測性制圖提供了豐富的地形、植被、氣候、土地利用等環境信息,是大尺度范圍或復雜地形地區SOM制圖的有效方法。但對于地形變化不明顯或土壤局部變異性較大區域,限制了其制圖精度。高光譜遙感影像以較高的光譜分辨率區分出那些具有診斷性光譜特征的地表物質,將高光譜遙感影像參與SOM預測性制圖,提高SOM預測精度和制圖精細度,值得進一步探索。
(2)高光譜遙感SOM預測和制圖直接方法的改進。由于適宜的SOM光譜敏感波段數量和位置以及建模方法是影響SOM高光譜反演模型精度的關鍵,這些問題有待進一步探索研究,提高小區域SOM高光譜預測和制圖精度。
(3)中紅外光譜土壤有機質預測與制圖研究。研究發現中紅外高光譜具有預測和SOM制圖的潛力,盡管目前中紅外高光譜傳感器技術發展還不太成熟,但未來該領域的發展值得期待。
(4)基于深度學習的SOM預測和制圖研究。深度學習由于擅長處理多源大量復雜數據,在物體檢測、人臉識別、圖像分類等方面優于傳統的、成熟的方法,以其他方法不可比擬的優勢為很多研究領域提供了新思路和新方法。深度學習是一種深層的機器學習模型,主要包括卷積神經網絡模型(CNN)、循環神經網絡(RNN)、深度置信網絡(DBN)等[76]。在基于深度學習的SOM預測和制圖研究方面,Alexandre M J-C Wadoux等[77]基于CNN方法,進行了澳大利亞Hunter valley area(220 km2)區域表層(0~10 cm)和亞表層(40~50 cm)土壤總碳制圖,并與RF進行了比較研究,使用的數據包括2 388個土壤總碳樣點數據(645個由室內化驗分析法獲得,923個由近紅外光譜法獲得,820個由中紅外光譜法獲得)、DEM、Landsat ETM第5波段和NDVI,結果顯示,表層土壤總碳含量預測精度(R2=0.55,RMSE=0.93)高于RF法(R2=0.35,RMSE=1.08),該研究為SOM遙感預測和制圖提供了新的研究思路。Alexandre M J-C Wadoux[78]還基于CNN,采用2萬個表層(0~10 cm)SOC樣點數據,結合地形、植被、氣候、土壤等其他數據,開展了法國SOC制圖,得到了較好的結果。因此,基于深度學習的SOM預測和制圖研究,也值得進一步探索。