孫 明,沈渭壽,謝 敏,李海東,高 菲
基于光譜特征的雅魯藏布江源區草地類型識別
孫 明1,2,沈渭壽1,謝 敏3,李海東1,高 菲4
(1.環境保護部南京環境科學研究所,南京 210042;2.廣西區氣象減災研究所/國家氣象衛星中心遙感應用試驗基地,南寧 530022;3.廣西區氣候中心,南寧 530022;4.江蘇省秦淮河水利工程管理處,南京 210001)
以雅魯藏布江源區為研究對象,以Landsat5 TM圖像為數據源,根據不同草地類型的波段組合特征,結合源區1∶100萬植被類型圖、DEM和NDVI數據,構建草地判別規則,利用決策樹分類法對雅魯藏布江源區草地類型進行遙感識別。研究結果表明:①不同類型草地因其生境不同,利用不同波段組合特征進行草地類型識別能夠達到較好的效果;②與傳統的監督分類法相比,基于波段組合特征的決策樹分類法具有較高的識別精度(總體精度提高了15.4%,Kappa系數提高了0.225);③在海拔4 400~5 000 m區域內,固沙草草原面積最大,其次為矮嵩草和小嵩草混生草甸,再次為變色錦雞兒和金露梅灌叢,藏北嵩草草甸面積最小。
光譜特征;決策樹分類;遙感;雅魯藏布江源區;草地類型
雅魯藏布江源區(以下簡稱源區,亦稱馬泉河流域)發源于喜馬拉雅山北麓的杰馬央宗冰川,地處西藏自治區西南邊陲。因地勢很高,物理凍融侵蝕作用分布廣泛,地表多沙、植被稀疏,山體坡面物質不穩定,生態環境極其脆弱。源區至今沒有氣象、水文等監測站點,自然環境背景數據極為缺乏,科研基礎資料更是寥寥無幾。20世紀70—80年代,中國科學院青藏高原綜合考察隊曾在青藏高原進行過科學考察,但在已發表的文獻中涉及源區的內容比較概略[1-4]。20世紀 80年代末期,西藏自治區農委組織以縣為單位開展過土地利用調查、土壤普查、草地資源調查及草場等級評價,源區各縣的相關調查成果圖成為該區域重要的基礎資料[5]。
植物群落的調查研究能夠為區域生物多樣性的系統研究奠定基礎,進而揭示不同植物群落的發生和發展過程,推論生態環境的演化歷史和發展方向。關于源區植被類型的描述僅有中國科學院編纂的1993年1∶100萬植被類型圖以及何萍等[5]通過實地考察對源區植被類型、群落構成以及地理分布特征提出的輪廓性描述。近20 a來,源區土地沙化程度逐年加重,沙化土地面積以年均0.4%的速率遞增[6],較強烈的風沙作用直接破壞著豐盛的水草牧場[7],草地退化趨勢明顯。對源區草地類型開展定量研究,不僅能準確了解源區不同草地類型的分布范圍及面積,更能為草地沙化研究提供基礎植被類型數據。本文在2010年7月對源區主要植被類型進行野外考察的基礎上,充分分析現有的各種遙感數據源,采用基于光譜特征的決策樹分類方法對源區主要植被類型進行了識別研究。
源區地理位置在 N 29°09'30″~ 30°58'12″,E 81°05'07″~84°30'20″之間,面積約 26 347.82 km2,包括日喀則地區仲巴縣帕羊區全部、扎東區大部、隆嘎爾區小部分,阿里地區革吉縣東南角、普蘭縣東緣以及薩嘎縣很小的面積。海拔均在4 400 m以上,具有光照充足、輻射強度大、干濕季節明顯、暖季涼爽、冬季嚴寒等特點。據周邊地區的氣象臺站資料推測,源區年平均氣溫為 -0.3~1.2℃,年≥0℃積溫為1 167~1 188℃;年降雨量為136~290 mm,6—9月份降水量占全年的90%左右;年蒸發量為2 200~2 300 mm,是年降水量的8~12倍;年濕潤度為40%左右,屬典型的高原寒冷干旱、半干旱氣候區;年日照時數為2 897~3 168 h,年≥8級風日數為112~150 d。
馬泉河谷南側為喜馬拉雅山脈,北側為岡底斯山脈,南北兩山脈之間為陷落型地塹寬谷,谷寬10~20 km,谷底發育著寬坦的沖積平原。谷底由西向東逐漸下降,馬泉河自西向東在寬谷中緩緩流過。河谷基本上都是牧區,帕羊以下河谷兩側由蒿草組成的沼澤化草甸是優良的冬春牧場;帕羊以上沼澤化草甸漸趨消失,代之以高寒草原,坦蕩的谷地廣泛分布著紫花針茅和蒿屬植物,是主要的夏季牧場。
2010年7月下旬,作者對源區開展了野外調查,范圍主要在219國道沿線,重點考察仲巴新、舊縣城,珠珠、崗久居民點以及帕羊鎮、霍爾巴鄉等鄉鎮周邊的山坡與沼澤化草甸。調查的草地類型主要包括固沙草草原、藏北嵩草草甸、矮嵩草和小嵩草混生草甸、金露梅灌叢以及變色錦雞兒灌叢。共設置樣地51個,每個樣地的大小為1 m×1 m。樣地的設置考慮到了所在群落斑塊的大小和均質性,以保證由定位誤差引起的樣地偏移不超出所在像元范圍。詳細調查了不同樣地的經緯度坐標、海拔高度、建群種高度、植被蓋度以及土壤水分等數據,并對每個樣地拍攝了照片。
植被覆蓋度具有明顯的時空分異特性,高原植被的返青時間比較晚,生長期短,7—8月份是草地生長的旺季,因而遙感圖像的最佳時相應選擇7—9月份[8]??紤]成像質量和時相,分析比較現有的各種可用的遙感數據源,僅Landsat 5有時相與野外調查相近且成像質量相對較好的圖像,故本文選用2009年夏季源區的3景Landsat 5圖像(軌道號/行號分別為143/39,142/39和142/40,獲取日期分別為2009-08-01,2009-10-13和2009-06-07)。其中,143/39圖像成像日期與野外采樣日期最為接近,基本滿足時相同步要求,3景圖像中以該景圖像所包含的源區面積最大,故本文主要以143/39圖像為主,對源區草地類型進行遙感識別,輔以另外2景圖像合成整個源區的草地類型圖。
使用ERDAS和ENVI軟件對遙感圖像進行輻射校正、大氣校正和幾何精糾正。由于同一草地類型具有相似的生境條件,而不同草地類型的生境條件差異很大,因此背景土壤類型和土壤水分條件的干擾和影響在一定程度上會增大不同草種之間的光譜可分性。在植被類型樣地調查的基礎上,采用基于波段組合特征的地類識別方法,根據不同草地類型的波段組合特征,構建草地類型識別的判別決策樹,從而對源區草地類型進行遙感識別。本次樣地調查,海拔最低處為4 529 m,最高為5 088 m。考慮遙感反演的可信度,在通過NDVI提取源區植被界線的基礎上,借助DEM數據將源區草地以5 000 m為界分為兩部分,5 000 m以下為野外調查的草地類型,5 000 m以上多為野外調查未涉及的高海拔植被。本文主要采用決策樹分類的方法對5 000 m以下的草地進行類型識別,技術路線見圖1。

圖1 草地類型遙感識別技術流程Fig.1 Flow chart of remote sensing identification of grassland types
植被信息提取的目的是在遙感圖像上有效地確定植被的分布、類型、長勢等信息以及對植被的生物量作出估算[9]。植被指數(NDVI)能很好地反映植被的生長數量、狀況、活力等信息,比用單波段探測綠色植被更具有靈敏性,從而有助于增強遙感圖像的解譯能力[10]。NDVI在植被提取中具有較好的效果,植被區和非植被區的界線較明顯;但由于裸地在近紅外波段的光譜亮度值也大于紅光波段[11],就不能簡單地以0為閾值,需設定合適的閾值才能達到較好的植被提取效果。
根據野外樣地調查數據及其經緯度坐標,提取不同植被蓋度的草地樣地的NDVI值,并選擇區分植被的 NDVI閾值。當閾值設為 0.024(即當NDVI>0.024)時,源區草地邊界提取精度較高。其中固沙草的18個實測點中有15個在提取區內,藏北嵩草的7個實測點中有6個在提取區內,矮嵩草和小嵩草混生草甸的8個實測點中有6個在提取區內,灌叢中變色錦雞兒的3個采樣點均在提取區內;但金露梅灌叢由于植被稀疏,對NDVI的響應較低,因此提取效果較差。
3.2.1 草地建群種光譜曲線提取
由于源區草地存在不同程度的沙化現象,草地植被的光譜值受背景干擾比較大,即使是同一種草地也可能因為草地的稀疏差異而形成“同物異譜”的現象,因此在選取采樣點時,對同一種草地類型要盡可能多地選取采樣點,兼顧不同沙化等級的草地,以便使光譜特征具有廣泛的代表性。根據GPS采集的不同草地類型的樣地坐標,從遙感圖像中提取出對應植被類型的亮度值,繪制出各草地類型的光譜特征曲線(圖2)。

圖2 不同草地類型光譜特征曲線Fig.2 Spectral feature curves of different grassland types

圖3 主要草地建群種光譜特征曲線Fig.3 Spectral feature curves of dominant grassland species
3.2.2 草地光譜特征分析
地物反射和輻射特征的微弱差異是通過各種不
對每個建群種的所有采樣點光譜特征曲線取平均值,得出每個建群種的像元亮度值;根據不同草地類型的光譜亮度值的均值,繪制出不同草地建群種的光譜特征曲線(圖3)。同類型傳感器的不同波譜通道來獲取的,所以不同波譜通道識別物體能力的大小是有差異的,可以利用某一波譜通道的光譜特征直接識別物體,但是在研究對象的單波段光譜特征相差較小的情況下(特別是要識別同一類型的不同子類時),單波段數據的識別能力非常有限(如在TM 3波段,藏北嵩草和變色錦雞兒的光譜特征相差很大,但固沙草和矮嵩草、小嵩草混生草甸卻有著相似的光譜特征)。所以,利用一個固定的分類模式來進行草地識別與分類是不可行的。為此,可利用物體在不同波段中光譜響應的差異及綜合多波段數據來提高識別物體的能力。本文利用TM數據7個波段數據及其之間相加構成的21組波段組合,共28組數據,通過比較不同草地類型不同波段組合之間的差異,得出不同草地類型的判別規則(表1)。

表1 不同草地類型的判別規則Tab.1 Recognition rules of different grassland types
基于波段組合特征的分類決策樹構建流程如下:
1)單一判別規則分類決策樹。根據不同草地類型的波段組合特征,將其逐個加入決策樹進行分類,同時利用采樣點對該特征組合的分類效果進行精度檢驗。不斷嘗試各種波段組合,最終得出一種分類效果相對較好的單一判別規則的決策樹(圖4)。

圖4 基于單一判別規則的決策樹分類Fig.4 Decision tree classification based on single discrimination rule
2)多重判別規則分類決策樹。根據第一步構建的單一判別規則的決策樹,得出源區草地類型的初步分類結果;通過實測點的精度檢驗,發現分類后每種草地類型均存在較大程度的錯分現象,需要在后續處理中對判別規則進行優化。根據草地波段組合特征的統計結果,同一種草地類型,對其判別的波段組合有好幾種,僅使用單一的判別規則將不能很好地區分草地。在初步分類的基礎上,對每種草地類型進行精度檢驗,統計每種草地類型中錯分較多的類型;然后進一步分析錯分類型和該類型草地的波段組合特征,選擇出差異較大的判別規則添加到該類草地的節點上,從而進行草地類型的細分。
3)通過反復嘗試各種波段組合并進行精度分析,重復步驟2,直至每種草地類型的分類精度達到要求,從而得出多重判別規則的分類決策樹(圖5)。

圖5 基于多重判別規則的決策樹分類Fig.5 Decision tree classification based on multiple discrimination rules
在圖4,5的分類決策樹中:①MNDWI=(TM2-TM5)/(TM2+TM5),式中MNDWI為改進的歸一化差異水體指數(Modified NDWI,簡稱為改進水體指數)。MNDWI可以進一步增強水體與其他地類的反差,有利于提取水體。經過實驗,當 MNDWI>0.57時,對水體和冰雪的提取效果較好。②TM6為熱紅外波段,對地物溫度反映敏感,而云頂的溫度比其他地物都低,通過設定合適的閾值,就能達到很好的云層提取效果。通過反復試驗,當TM6<109時,即可提取出云層范圍。③NDVI對植被信息反映靈敏,可以有效區分植被和裸巖沙地,當NDVI>0.024時,植被提取效果較好。④借助DEM數據,可以進一步將植被區劃分為高海拔植被區和實驗區,以5 000 m為閾值,對植被區進行劃分。⑤藏北嵩草識別規則為(TM1+TM3)<(TM4+TM5)(圖4)和(TM2+TM3)<(TM4+TM5)(圖5);固沙草識別規則為(TM1+TM5)<(TM2+TM7)(圖 4)、(TM2+TM7)<(TM3+TM5)、(TM1+TM2)<(TM2+TM3)、(TM2+TM3)>(TM4+TM5)及(TM2+TM3)<(TM3+TM4)(圖5);矮嵩草和小嵩草混生草甸識別規則為(TM1+TM5)<(TM4+TM6)(圖4)和(TM1+TM2)>(TM2+TM3)(圖5);變色錦雞兒、金露梅灌叢識別規則為(TM1+TM5)>(TM4+TM6)(圖 4)和(TM2+TM3)>(TM3+TM4)(圖5)。
分類精度評價是通過建立地面驗證數據的混淆矩陣或誤差矩陣,計算各種分類精度測度指標(如Kappa系數、生產者精度、用戶精度和總體精度)來進行的[12]。Kappa系數的估計值計算方法為

式中:r為誤差矩陣中地物的類型數;N為驗證像元總數;xii為誤差矩陣中主對角線上的元素,即各類中被正確分類的像元點數;xi+為第i行的總觀測數(矩陣右邊的欄外匯總數);x+i為第i列的總觀測數(矩陣底部的欄外匯總數)。為了與決策樹分類效果做比較,利用實測數據對源區圖像進行傳統最大似然法監督分類。建立兩種分類結果的混淆矩陣(表2,3),并比較其分類精度。

表2 2009年基于決策樹分類的草地類型識別精度分析Tab.2 Precision analysis of grassland type recognition based on decision tree classification in 2009 (個)

表3 2009年基于最大似然監督分類的草地類型識別精度分析Tab.3 Precision analysis of grassland type recognition based on supervised classification in 2009 (個)
通過表2,3的對比可以看出,決策樹分類的總體精度和Kappa系數分別達到62.5%和0.493,高于監督分類的總體精度 47.1%和 Kappa系數0.268。因而本文采用的決策樹分類方法在精度上較傳統監督分類方法有更好的效果。
本文將決策樹分類得出的4種草地類型矢量數據分別與1993年1∶100萬植被類型圖對應的植被類型圖斑進行了疊加,分析其分布范圍及特征是否與植被類型圖相吻合。以藏北嵩草為例,圖6中紅色部分為決策樹分類得出的藏北嵩草分布范圍,藍色部分為1∶100萬植被類型圖中對應的藏北嵩草分布范圍,可以看出決策樹分類得出的藏北嵩草分布范圍與1∶100萬植被類型圖的圖斑疊合得較好,說明本文采用的方法在源區草地類型識別方面具有較好的效果。

圖6 藏北嵩草分類結果與1∶100萬植被類型圖疊加顯示Fig.6 Overlaying display of classification results of Kobresia littledalei and 1∶1 000 000 scale vegetation type map
根據構建的波段組合判別規則,利用決策樹分類法對源區遙感圖像進行草地類型識別,得到源區的遙感草地類型圖(圖7)。

圖7 2009年源區遙感草地類型圖Fig.7 Grass types map of the source region by remote sensing in 2009
對草地分類結果進行統計分析,得到源區遙感草地類型的分布狀況(表4)。

表4 2009年海拔4 400~5 000m草地類型面積統計Tab.4 Area statistics of grassland types distributed at the elevation ranging from 4 400 m to 5 000 m in 2009
根據表4的統計結果可以看出,在海拔4 400~5 000 m范圍內,各類型草地面積總計4 924.63 km2。其中,分布面積最大的主要為固沙草草原,達3 111.73 km2,占該海拔區草地總面積的 63.19%;其次為矮嵩草和小嵩草混生草甸,面積為980.43 km2,占該區草地面積的19.91%;再次為變色錦雞兒和金露梅灌叢,面積為607.80 km2,占該區草地面積的 12.34%;藏北嵩草最少,面積為224.67 km2,僅占該區草地面積的4.56%。
1)不同類型的草地由于生境不同,而且受其背景土壤類型和水分的干擾,在一定程度上又加大了不同草地類型之間的光譜可分性,利用遙感圖像的不同波段組合特征進行草地類型識別能夠達到較好的效果。本文對雅魯藏布江源區的草地進行分類,結果表明:在海拔4 400~5 000 m范圍內,草地類型主要以固沙草草原為主,其次為矮嵩草和小嵩草混生草甸,再次為變色錦雞兒和金露梅灌叢,藏北嵩草面積最少。
2)總體來看,利用地物波段組合特征的差異進行分類,在分類效果上有了很大提高,彌補了傳統的最大似然監督分類方法的不足?;诓ǘ谓M合特征的決策樹分類法具有較高的識別精度,分類的總體精度可以達到62.5%,Kappa系數為0.493。與監督分類相比,決策樹分類的總體精度提高了15.4%,Kappa系數提高了0.225。
3)本文采用的決策樹分類法僅是基于地物圖像的光譜特征、波段間的相互運算以及高程等信息,并沒有加入其他分類特征,分類精度還不夠顯著。若在以后的決策樹模型中加入紋理等信息,則決策樹分類法的優勢會更明顯,分類精度會更高。
4)受采樣點數量限制,無法滿足采樣樣地到遙感圖像像元的空間尺度轉換,因而本文在遙感反演過程中并沒有考慮空間尺度轉換以及混合像元分解等問題,需要后期野外調查補充大量的野外樣地數據。
[1] 中國科學院青藏高原綜合科學考察隊.青藏高原科學考察叢書:西藏植被[M].北京:科學出版社,1988:261,311-313.
[2] 中國科學院青藏高原綜合科學考察隊.青藏高原科學考察叢書:西藏草原[M].北京:科學出版社,1992:21-23.
[3] 中國科學院青藏高原綜合科學考察隊.青藏高原科學考察叢書:西藏土壤[M].北京:科學出版社,1985:298.
[4] 中國科學院青藏高原綜合科學考察隊.青藏高原科學考察叢書:西藏冰川[M].北京:科學出版社,1986:106-107.
[5] 何 萍,郭 柯,高吉喜,等.雅魯藏布江源頭區的植被及其地理分布特征[J].山地學報,2005,23(3):267 -273.
[6] 孫 明,沈渭壽,李海東,等.雅魯藏布江源區風沙化土地演變趨勢[J].自然資源學報,2010,25(7):1163 -1171.
[7] 楊逸疇.雅魯藏布江河谷風沙地貌的初步觀察[J].中國沙漠,1984,4(3):12 -16.
[8] 李輝霞,鄢 燕,劉淑珍,等.西藏高原草地退化遙感分析——以藏北高原典型區為例[M].北京:科學出版社,2008:75-99.
[9] 劉 雯,駱劍承,沈占鋒,等.多尺度植被信息提取模型研究[J].計算機應用研究,2009,26(6):2398 -2400.
[10]朱繼蕤,侯宇丹.基于遙感影像的城市植被信息提取研究[J].儀器儀表與分析監測,2010(1):12 -15.
[11]單 捷,岳彩榮.基于光譜特征的決策樹分類方法研究——以昆明市東北部地區為例[J].西北林學院學報,2010,25(6):222-226.
[12]常慶瑞,蔣平安,周 勇,等.遙感技術導論[M].北京:科學出版社,2004.
The Identification of Grassland Types in the Source Region of the Yarlung Zangbo River Based on Spectral Features
SUN Ming1,2,SHEN Wei- shou1,XIE Min3,LI Hai- dong1,GAO Fei4
(1.Nanjing Institute of Environmental Sciences,Ministry of Environmental Protection,Nanjing 210042,China;2.Institute of Meteorological Disaster Mitigation of Guangxi/Remote Sensing Applying and Experiment Base of National Meteorological Satellite Center,Nanning 530022,China;3.Guangxi Climate Center,Nanning 530022,China;4.Qinhuai River Hydraulic Management Agency of Jiangsu Province,Nanjing 210001,China)
With the Landsat5 TM images of the source region of the Yarlung Zangbo River as the datum source,according to the different features of spectral combination of the grassland,and in combination with the 1 ∶1 000 000 vegetation type map as well as DEM and NDVI data,the authors set up the rules of grass identification and conducted researches on grass recognition based on decision tree classification.Some conclusions have been reached:① Due to difference in habitat types,good results of identifying grass can only be achieved by using different spectral combination features;② Compared with traditional supervised classification,the decision tree classification based on spectral combination features has higher precision of identification,the overall classification accuracy has been improved by 15.4%and the Kappa coefficient has been increased by 0.225;③ In the region with elevation ranging from 4 400 m to 5 000 m,the grassland area of Orinus thoroldii is the largest,followed by the mixed meadow of Kobresia humilis and Kobresia pygmaea,and then by the bush of Caragana versicolor and Potentilla fruticos,with Kobresia littledalei having the smallest area.
spectral feature;decision tree classification;remote sensing;source region of the Yarlung Zangbo river;grassland types
TP 751.1
A
1001-070X(2012)01-0083-07
10.6046/gtzyyg.2012.01.15
2011-05-04;
2011-06-09
國家環保公益性行業科研專項(編號:200709045,200809010,200909050)資助。
孫 明(1986-),男,助理工程師,主要從事遙感在生態環境中的應用研究。E-mail:msunies@163.com。
沈渭壽(1958-),男,研究員,博士生導師,主要從事生態環境保護與荒漠化防治研究。E-mail:shenweishou@163.com。
(責任編輯:邢 宇)