劉春曉,吳 靜,李純斌,楊 偉,張 瑋
(1.甘肅農業大學 管理學院,甘肅 蘭州 730070; 2.甘肅農業大學 資源與環境學院,甘肅 蘭州 730070)
遙感圖像能直接、客觀地反映地表的環境信息,是研究其他環境要素的重要基礎[1]。土壤遙感是指通過對遙感影像的解譯,識別,劃分得出土壤類型,制作出土壤類型圖,并分析出其分布規律,為改良和合理利用土壤來提供參考[2]。在土壤調查中,有效地使用遙感資料對土壤進行檢測,將大大減輕土壤調查的工作量。計算機自動識別技術的迅猛發展,將土壤調查技術的發展提高一步,同時也為精細化農業提供了服務可能。
目前,國外已經開展采用衛星數據和地形數據進行土壤資源調查和制圖的研究。Burrogh[3]利用熱紅外光譜技術進行土壤屬性的估計研究,使近紅外光譜和紅外光譜分析技術對土壤屬性的研究逐漸成熟起來;Odeh等[4]以AVHRR和DEM為數據源,采用普通克里金等方法對土壤性質進行了研究,并結合地形數據,評價了各種研究方法的優缺點;Dobos等[5]基于AVHRR數據空間分辨率為500 m和1 000 m的圖像,以DEM數據為輔助對匈牙利土壤進行分類研究,結果發現地形數據的加入對2種分辨率圖像的土壤分類精度都有顯著提高,且高分辨率圖像的分類精度明顯高于低分辨率圖像;Condi H R[6]研究出一種簡化的方法來測土壤反射光譜曲線,是根據分析土壤反射光譜數據得出的結論。近年來,國內也有不少學者借助遙感圖像進行土壤調查與分類。沙晉明等[7]利用TM圖像作為數據源,對我國植被覆蓋率高的東南山區運用不同的分類方法進行土壤分類的研究,結果發現即使運用較好的分類方法,土壤的地形、質地等信息也影響著分類結果;亢慶等[8-9]基于MODIS遙感數據和地形數據,在第2次全國土壤普查數據庫的支持下,探討了遙感技術在受干旱地區的限制進行土壤調查時,對干旱區的土壤效果和適用性;我國學者彭杰等[10],張俊華等[11],史舟等[12],賴寧等[13],司海青等[14],關紅等[15]都對土壤高光譜特反射性特性和構建土壤鹽分高光譜定量繁衍模型進行了研究。
調查以土壤類型較為復雜的甘肅省為研究區,利用遙感圖像和地形數據,結合甘肅省土壤數據和高分辨率遙感圖像,綜合分析了實地調查數據、遙感信息特征及植被分布情況,并在此基礎上建立了適合試驗區的土壤遙感分類系統,探討了遙感技術在甘肅土壤分類中的可行性,以期為研究區域的土壤調查和分類提供新的方法。
甘肅位于中國地理中心,地理位置N 32°11′~42°57′,E 92°13′~108°46′,地形狹長,橫跨多個氣候帶,地貌錯綜復雜,山地、高原、平川、河谷、沙漠、戈壁等多種地貌類型并存,是全國各省區中地質地貌和氣候類型最為豐富復雜的省份。
甘肅省的土壤類型較為豐富。全省土壤分布大致可按區劃分為隴南黃棕壤、棕壤、褐土地區;隴東黃綿土、黑筍土地區;隴中麻土、黃白綿土區;甘南草甸土、草甸草原土地區;河西漠土、灌溉土區和祁連山栗鈣土、黑鈣土區,共6個地區及19個土坡區。分布特點:(1)水平分布的緯度地帶性明顯,經度地帶性不太明顯,由南往北;(2)垂直分布規律顯著,甘肅是個多山的省份,山地所處的地理位置、山體的高低大小、山地的坡向坡度,都影響著土壤垂直地帶的分布;(3)地域分布規律受各地方土壤的母質、地形、水文、成土年齡等條件的影響,在地帶性土壤內部出現非地帶性土壤類型,并表現為中域或微域分布,中域分布有枝形、扇形和盆形等;(4)耕種土壤受人為作用的強度不同,在各地有著獨特的分布規律。
1.2.1 遙感數據 在研究區域內,考慮植被生長的季節性差異的同時也要考慮地物反射差異。調查采用2011年6月的MODIS MYD09GA 反射率數據(三景)和MODIS MYD13A2植被指數數據(三景)。MYD09GA覆蓋面積約為1 100 km×1 100 km,影像大小1 200×1 200像元空間分辨率為500 m,投影方式為等面正弦投影(Sinusoidal),是可見光、近紅外到中紅外波段的表面反照率參數;MYD13A2數據是空間分辨率為1 000 m的16 d三級產品。該數據來源于美國國家航天局(NASA)的MODIS數據產品分發網站(https://modis.gsfc.nasa.gov/)。
1.2.2 地形數據 地形采用SRTM3數據(數據來源:http://datamirror.csdb.cn/dem),按3弧秒進行采樣,其水平分辨率為90 m,綜合比例1∶25萬。將地形數據作為輔助數據對提高甘肅省土壤分類的精度起到很重要的作用,并提取3個地形參數,高程、坡度、曲率(分別表示為:ELV,SLOP和CAV)。
1.2.3 參考數據 選用全國第2次土壤普查形成的1∶100萬全國土壤數據庫作為遙感分類的訓練數據和驗證數據。此數據是我國目前調查覆蓋面積最大、精度最高、最完整的土壤數據,其基本制圖單元為土壤亞類,共有12個土綱,61個土類,227個亞類,以及10個非土壤單元。其中,研究區內主要涉及約90個土壤亞類,2個非土壤單元。
覆蓋整個甘肅省需要3景MODIS MYD09GA和MODIS MYD13A2影像,使用MODIS產品處理工具MRT對MODIS數據進行投影變換、幾何校正、鑲嵌和重采樣等預處理。投影坐標系為雙標準緯線等積圓錐投影(ALBERS),橢球體為Krasovsky,重采樣像元尺寸為1 000 m。
從MODIS數據產品中提取多波段反射率、植被指數,計算濕度指數、亮度指數,提取紋理特征,并從SRTM3數據中提取坡度和地面曲率等地形特征。
1.4.1 地表反射率 MODIS 09GA數據產品提供了常見的對地觀測的7個光學反射率波段(表1)。

表1 MODIS 7個反射率波段Table 1 MODIS seven reflectance bands
1.4.2 植被指數 歸一化植被指數(NDVI)是目前應用最廣泛的植被指數,是通過兩個(或多個)光譜通道的組合而得到的計算公式:
NDVI=(Ref2-Ref1)/(Ref2+Ref1)
(1)
NDVI在高植被蓋度區易飽和、低植被區易受土壤背景影響的環境下,MODIS增強性植被指數(EVI)可較好地克服NDVI的弱點。EVI可用MODIS數據公式:
EVI=2.5(Ref2-Ref1)/(Ref2+C1Ref1+C2Ref3+L)
(2)
式中:L=1為土壤調節參數,參數C1和C2分別為6.0和7.5,通過藍波段(Ref3)來修正大氣對紅波段(Ref1)的影響。
1.4.3 土壤亮度特征 土壤亮度是區分土壤類型的主要特征之一,采用與TM相對應的MODIS波段反射率數據(Ref1、Ref2、Ref3、Ref4、Ref6、Ref7波段)進行K-T變換[8,16],選擇包含土壤信息的亮度分量作為土壤亮度特征。
1.4.4 濕度指數(NDMI) 濕度指數NDMI對濕度、含水量信息非常敏感[8,16],因為短波紅外波段(相當于MODIS的Ref6)受水吸收帶的影響,并且綠波段(相當于MODIS的Ref4波段)對水體反射敏感強,選用MODIS的這兩個波段通過規格化處理的計算公式:
NDMI=(Ref4-Ref6)/(Ref4+Ref6)
(3)
1.4.5 歸一化水體指數(NDWI) 研究區域有河流,水庫等水體,為了區分水體,把水體指數作為一項分類特征數據,計算公式:
NDWI=(Ref4-Ref2)/(Ref4+Ref2)
(4)
1.4.6 歸一化積雪指數(NDSI) 歸一化積雪指數(NDSI)是提取積雪信息的一種有效方法,其算法較合理,分類精度高,具有普遍的操作意義。NDSI類似于歸一化植被指數(NDVI),對大范圍的光照條件不敏感,對大氣作用可使其局地歸一化并且不依賴于單通道的反射,NDSI的計算公式:
NDSI=(Ref1-Ref4)/(Ref1+Ref4)
(5)
1.4.7 紋理特征 紋理特征是灰度值有規律的分布情況,并且采用表達可視紋理的局部平穩(Homogeneity)特征參與分類[8,17-18],對比分析可視化后的7個波段,選用Ref2波段進行紋理特征提取[18],公式:
(6)
它是對圖像局部灰度均勻性的一種度量。其值越大,代表圖像局部灰度越均勻。
1.4.8 地形參數 由于地形與土壤類型存在著密切聯系,采用分辨率為90 m的DEM數據進行地形特征參數的提取,綜合比例尺相當于1∶25萬的數字高程圖像SRTM3數據,并對地形數據進行特征參數的提取,包括:坡度[16]、表面曲率。
1.4.9 分類數據集生成 將以上根據MODIS數據提取的分類特征:植被指數、積雪指數、濕度指數、水體指數、紋理特征、晝夜地表溫度與SRTM3地形數據提取的地形參數:高程、坡度、表面曲率,對以上分類特征進行配準、疊加、裁切,最后得到多層分類數據集。再對多層分類數據集和整理后的土壤矢量數據進行疊加,為數據分析提供基礎。
通過對土壤數據庫進行統計,甘肅省共有土壤亞類90個,這樣的分類體系對于空間分辨率為500 m和1 000 m的MODIS數據來說類別過于復雜,容易造成分類結果不理想,因此對各個類別的圖斑面積進行統計,最終舍棄了圖斑面積小于0.2 cm的35個亞類,剩余55個亞類。
1.5.1 訓練數據樣本采集 從1∶100萬中國土壤數據庫中裁剪出研究區域(甘肅省)的土壤數據,并對矢量數據進行幾何修復和拓撲檢查,將其轉為柵格圖像,經過投影轉換使其與特征圖像有統一的地理坐標,通過ERDAS窗口同步連接(link)方式對比,在各土類圖斑上分別對55個分類對象選取樣點,并在特征數據集的每一層上分別采集訓練樣本[19]。
1.5.2 土壤類型可分度分析 為了驗證分類訓練樣本的準確性和分類系統的合理性,采用兩種分類模板評價方式對土壤分類進行判別。首先,用分類預警評價的方式對訓練的分類模板進行定性的預警評價,結果顯示預分類的結果與參考圖像基本吻合。其次,使用可能性矩陣對分類模板進行定量評價,結果顯示誤差矩陣值為82.3%。
1.5.3 分類 現有的分類方法有Mahalanobis距離法[20]、最小距離法、最大似然法等[8],而最大似然法是比較常用并且比較成熟的一種分類方法,使用最大似然法在ERDAS中進行監督分類,技術路線見圖1。
由于軟件進行分類時按照圖像的光譜特征進行聚類分析,并且分類具有一定的盲目性,因此,對分類后的圖像進行后處理;首先進行聚類統計,由于制度表達受精度的限制,對于分類結果中較小的圖斑有必要進行剔除,然后進行重新編碼,最后得到分類類別明確和圖面比較完整的分類圖像。由于后處理前的分類圖像存在某一土壤類的圖斑太小而被剔除,因此最終輸出的結果為34類土壤亞類(圖2)。使用驗證樣本,以混淆矩陣分析方法計算總分類精度R和一致性指數Kappa[21]。結果總體分類精度達到74%,整體Kappa統計值為0.728。

圖1 技術路線Fig.1 Technology roadmap

圖2 甘肅省土壤遙感分類結果Fig.2 Result of soil remote sensing classification in Gansu province
甘肅省土壤類型分布比例較大的有黃綿土、灰棕漠土、冷鈣土、荒漠風沙土,所占比例分別是28.70%、19.70%、13.10%、9.10%。其中,甘肅省中部主要土壤類型有黃綿土、淡灰鈣土、黑麻土等。在河西走廊區域主要土壤類型有灰棕漠土、石膏灰棕漠土、荒漠風沙地等。中南部地區土壤類型主要有黑氈土、棕壤、石灰性褐土等。分類結果較差的土壤類型有黃棉土、棕漠土、冷鈣土、淡灰冷鈣土、高山漠土、黑麻土、灰棕漠土、荒漠風沙土,與實際面積的比差分別是20.6、17.7、9.5、5.6、4.2、4.0、3.4、3.0(圖2)。土壤分類結果之所以還存在著一定的誤差,是由于甘肅省山地縱橫交錯,地形錯綜復雜,在獲取數據的時候難免會因為地形起伏,復雜多變引起誤差,使得一些土壤亞類出現錯分的情況。
(1)數據選擇方面。試驗采用6月的光譜數據的成像,由于在該時相下植被生長良好,對于多源數據中表觀植被的部分(NDVI,EVI等)數據分布良好,特征比較明顯,但是由于植被在這個時相下生長旺盛、枝葉繁密,對土壤表面有大面積的覆蓋影響,從而導致土壤亮度等數據分布偏離正常值。因此利用多源數據,結合時間分辨率和空間分辨率更高的數據,并且綜合考慮土壤分類的多方面因子,才能提高土壤分類的精度。因此合理的選擇數據是影響分類精度的重要因素之一。
(2)甘肅省土壤亞類自身差異性的影響。從土壤分布的自身特點分析,土壤亞類間土壤物化性質相似性較大,進而導致地面景觀(植被)分布差異性小,而以地面光譜反射率為信息源遙感數據表現出的光譜特征區分度不高,這也是遙感手段土壤分類結果與全國第2次土壤調查結果的差異所在。
(3)空間因素。首先從整體地形來分析,甘肅省地形復雜多樣,較為破碎,山脈分布面積廣,且縱橫交錯,另外分布有平川、高山、沙漠戈壁和盆地等類型,海拔相差懸殊。受這種破碎的地形和山脈交錯分布特征的影響,對于一些分布面積較小,并未達到數據分辨率要求的水稻土、沼澤土、潮土、灌淤土等未進入分類。因此,研究區域的空間結構在一定程度上會影響著土壤分類。
(1)地表反射率、歸一化積雪指數、水體指數、濕度指數、紋理特征、晝夜地表溫度植被指數等分類特征再結合研究區域的地形參數特征得到理想的分類結果,適合作為甘肅省土壤分類的分類特征。
(2)未被分出的土壤亞類的原因與地理空間因素、數據的選取、數據的分辨率、分類方法和土壤分布的自身特點等因素相關。
(3)根據植被指數等遙感數據產品,提取9種圖像特征,并結合DEM生成的地形參數數據,利用計算機自動分類法,對土壤類型進行系統分類。最終獲得了34個土壤亞類,分類的總體精度達到74%。