劉志濤 蘇根成
摘要:運用監督分類和決策樹兩種方法,以2014-8-25的Landsat8-OLI遙感影像為基礎數據源,提取新巴爾虎右旗的沼澤和草甸信息。方法一:在ENVI中進行監督分類,將研究區分為沼澤和草甸、草地、森林、農用地、水體、居民地、沙地和其他等八類,采用最大似然法對研究區遙感影像進行沼澤和草甸信息的提取工作。方法二:求取研究區的歸一化植被指數NDVI,將NDVI值和坡度值作為限制條件,進行求取研究區域的沼澤和草甸信息。將兩種方法獲得的沼澤和草甸分類圖與驗證樣本進行混合矩陣分析,分別對兩種分類結果進行精度評價,比較監督分類和決策樹分類在沼澤和草甸信息提取的精度。結果表明:Landsat8-OLI影像采用監督分類的精度為89.40%,利用決策樹分類的精度達到了91.05%,精度較高。這兩種方法均能夠很好地進行沼澤和草甸信息提取,同時驗證了基于Landsat8遙感影像在濕地覆被分類的可行性。
關鍵詞:新巴爾虎右旗;沼澤;草甸;監督分類;決策樹
1.引言
1.1研究背景
本文所研究的濕地,包括研究區內的河流濕地、湖泊濕地、沼澤濕地以及草甸濕地等。近年來由于人類經濟的不斷發展,在比較偏遠的濕地也得到了開發利用,同時也遭到嚴重破壞,濕地污染,面積也不斷減少,功能日趨退化。因此,保護濕地已經引起了人們的廣泛關注。濕地多處于偏遠地區,采用傳統的手段來監測,費時、費力、耗費高,調查范圍小,對濕地有破壞性,而且其周期性較長,往往需要幾個月甚至幾年,時效性很差。及時、準確地獲取濕地變化信息已成為濕地保護的重要手段之一。衛星遙感技術具有觀測范圍廣、信息量大、獲取速度快、動態性和實時性等優點,被廣泛應用于濕地動態監測。
本文以內蒙古自治區呼倫貝爾市新巴爾虎右旗為例,通過選取不同方法進行沼澤和草甸信息提取,得到該濕地空間分布圖,為新巴爾虎右旗濕地保護提供參考信息,以期為OLI影像更廣泛和更有效地應用于濕地信息提取提供參考依據。
1.2研究區概括
新巴爾虎右旗是內蒙古自治區的19個邊境旗市和23個牧業旗之一,是自治區唯一一個與兩個毗鄰國家接壤的旗縣,即中俄蒙三國交界處。地理位置在中國東北邊陲(東經111°31′~117°43′,北緯47°36′-49°50′),在舉世聞名的呼倫貝爾大草原西南部。東部以烏爾遜河為界與新巴爾虎左旗隔河相望,東北部與全國最大的陸路口岸城市滿洲里毗鄰。總面積25194km2,其中水域面積2217.4km2。新右旗境內水資源豐富,有克魯倫河和烏爾遜河2條河流和呼倫湖、貝爾湖、烏蘭諾爾3個較大湖泊、濕地,屬于黑龍江流域額爾古納河水系,年徑流總量為8.072億立方米。
2.研究方法
2.1監督分類方法
監督分類(Supervised Classification)又稱訓練分類法,是用已經確認類別的樣本像元來識別未知類別像元的過程。當對研究區域比較了解的時候,或掌握了更多的先驗知識,為了使這些有用的輔助信息參與到遙感分類中,需要使用監督分類方法。監督分類主要是根據分類的復雜程度、精度要求等來選擇分類器。常用的分類器有最小距離、最大似然、平行六面體、馬氏距離、神經網絡、支持向量機等。本文主要選取最大似然法對研究區的不同影像數據進行分類比較。
2.2最大似然法
最大似然判別法,也稱為bayes分類,它是建立在貝葉斯準則的基礎上,偏重于集群分布的統計特性,分類原理是假定訓練樣本數據在光譜空間的分布是服從高斯正態分布規律的,通過對感興趣區域的統計和計算求出樣本均值、方差和協方差等統計特征參數,從而求出總體的先驗概率密度函數,然后通過計算給定像元屬于某訓練樣本的概率,將像元歸人概率最大的一類中,從而達到分類的效果。具體分為3步:首先確定各類的訓練樣本;再根據訓練樣本計算各類的統計特征值,建立分類判別函數;最后逐點掃描影像各像元,將像元特征向量代人判別函數,求出其屬于各類的概率,將待判斷像元歸屬于最大判別函數值的一組。
2.3決策樹
決策樹分類算法的基本思想是:按照一定的規則把遙感數據集逐級往下細分以得到具有不同屬性的各個類別。分類決策樹由一個根節點(Root nodes)、一系列內部節點(Internal nodes)(分支)和終極節點(Terminalnodes)(葉)組成,每個內部節點只有一個父節點和兩個多個子節點。在每一個內部節點(包括根節點)處根據一系列規則將該節點處的數據集劃分為兩個子集,如此往復直至所有的數據被分為預期設定的各個子集為止。這里的規則可以是根據經驗和目視解譯人為設定,也可以按照一定的算法自動獲取。決策樹能夠處理的數據集不僅包含光譜信息,還可以是紋理信息、空間特征和高程信息等多元數據。圖1為本次分類的決策樹的基本模型。
3.數據處理
3.1前期處理
從權威地理信息數據網站http://www.gscloud.cn/下載研究區的遙感影像,選取Landsat8-OLI的2014-8-25遙感影像為基礎數據進行處理。數據必須利用專業軟件打開和處理,數據預處理步驟如下:①輻射校正。Landsat-8得到的數據為Levell T級別,該數據產品是使用地面控制點和數字高程模型數據進行幾何精校正處理后得到的數據產品,因此,實驗用的Landsat-8數據可以直接使用而不需要做幾何校正。本文主要對研究數據直接進行輻射校正處理。輻射校正的目的是消除或修正輻射誤差而引起的影像畸變,主要包括輻射定標和大氣校正。本文采用ENVI中的FLAASH工具進行大氣校正,具有較高的輻射校正精度,更適合用于濕地植被信息的提取。大氣校正后自動剔除卷云波段9,應用于數據分類的是1~7共7個波段。②影像鑲嵌。由于單幅的Landsat-8影像無法完全覆蓋整個研究區域,所以對兩幅互為鄰接的Landsat-8影像進行幾何鑲嵌、色調調整、去重疊等處理,拼接為統一的影像。③影像裁剪。根據已有的研究區矢量化邊界,結合新巴爾虎右旗行政區劃圖,進行影像裁剪,裁剪后的結果影像作為研究區的基礎數據,且影像質量滿足研究需求。
3.2監督分類提取沼澤和草甸
利用監督分類方法,將研究區的覆被信息分為沼澤和草甸、草地、森林、農用地、水體、居民地、沙地和其他等八類。利用經驗和已有資料選取有代表性訓練區,繪制成多邊形,對每一種選取的訓練區都均勻地分布在整個研究區中,濕地感興趣區選擇為181個,將提取好的訓練區用最大似然法分類,得到初步分類效果圖,如圖2所示。由于遙感影像圖的分類過程是按照影像光譜特征進行的聚類分析,都帶有一定的盲目性,分類得到結果圖成塊的地類圖會出現小塊的異類圖斑。本實驗對分類圖進行了聚類分析(Clump),過濾處理(sieve),得到的監督分類影像圖(見圖3)。由于克魯倫河這一主要水系在監督分類過程中沒有與沼澤草甸分離,為此計算了歸一化差異水體指數(NDWI),提取出水體信息,然后進行了波段差值運算,從監督分類結果圖中去除了水體信息,得到新巴爾虎右旗的最終監督分類結果圖,沼澤草甸與河流明確地分離開,而且沼澤草甸斑塊比較完整(如圖4)。
3.3決策樹方法提取沼澤草甸信息
決策樹分類算法的基本思想是:按照一定的規則通過構建決策樹模型,把遙感數據集逐級往下細分以得到具有不同屙性的各個類別,在本文的決策樹模型是通過兩個分支提取的研究區的兩類沼澤草甸信息。
在決策樹模型中,ndvi為歸一化植被指數;p(nir)為近紅外波段的反射率;slope為由DEM求得的坡度圖。
如圖1所示,該決策樹模型是以研究區的NDVI為基礎,在反映新巴爾虎右旗土地覆蓋植被狀況優勢明顯。在構建模型時,通過反復試錯獲得沼澤草甸區域在決策樹各節點的分割閾值為0.3時,能夠較精確的提取出大量沼澤草甸信息,同時也包含了研究區北部的森林地貌信息,此時利用沼澤草甸的坡度較小的特點,以slope<0.8為條件能夠剔除其他干擾信息,而提取出大部分沼澤草甸信息;其次在呼倫湖南岸有大片鹽堿地的ndvi值較低,通過反復試錯以nd-vi<0.15和p(nir)>1400為條件,可以做到精確區分。
4.分類結果評價
對于遙感圖像的分類結果,可以采用混淆矩陣和分類精度指標進行評價,分類精度指標主要有用戶精度、生產者精度、總體精度、錯分誤差、漏分誤差和Kappa系數。本文主要采用總體分類精度(Overall Accuracy)和Kappa系數來進行分類精度評估,驗證樣本為通過已有資料選取的80個樣點,分別建立混淆矩陣。
LandsatS-OLI影像采用監督分類的精度為89.40%,Kappa系數為0.54;決策樹分類的精度達到了91.05%,Kappa系數為0.63。兩種方法均可用,后者能夠更好地進行沼澤草甸信息提取分類,精度更高。表明基于Landsat8遙感影像在沼澤草甸覆被分類的可行性,從而能夠及時合理地保護濕地資源。
5.結果分析
監督分類結果如圖5所示,經過統計,沼澤草甸面積約為916.46km2。決策樹模型得到的結果如圖6所示,沼澤草甸面積約為885.59km2。
由圖可知,新巴爾虎右旗的沼澤草甸植被比較豐富,主要分布在克魯倫河流域以及呼倫湖、貝爾湖周邊,在研究區的南北內陸草原地區受星羅棋布的湖泊影響,也有一定小面積的濕地存在。
6.結論
本文利用landsat-8的影像應用監督分類和決策樹兩種方法提取了沼澤和草甸信息,并將分類結果與已有分類數據進行混淆矩陣驗證,結果表明決策樹的分類精度更高,比監督分類結果高出1.65%。可見在濕地覆被分類研究中有一定的分類精度優勢。
此外就遙感影像分類提取信息而言,在選擇不同時期的影像圖對提取的精度影響也很大。在北方地區提取沼澤草甸信息時,選取八九月份的影像效果較佳,其他草本植物的葉綠素比濕生植物降解的早,此時的沼澤草甸信息在標準假彩色影像的顏色紋理更清晰,提取精度可能更高。