孫文瑞,姜慧芳,左曉慶,李瀟雨,劉懷鵬*
(1.洛陽師范學院 國土與旅游學院,河南 洛陽 471934)
利用遙感技術進行土地利用分類時,根據影像數據特點選擇適用的分類方法非常重要。監督分類由于其具有研究區的先驗知識,被廣泛應用于遙感影像分類中。利用監督分類方法進行土地利用分類的研究較多,如李帥[1]等以Landsat遙感影像為例,從分類精度、錯分漏分誤差等方面分析了平行六面體、最小距離、馬氏距離、最大似然對土地利用分類精度的影響;史敏偉[2]等基于GF-2號影像,對比分析了隨機森林、最大似然監督分類法在高分辨率影像土地利用分類中的優勢;王棟[3]等基于Landsat5 TM影像,對比分析了最大似然、支持向量機(SVM)、隨機森林3種監督分類器對大姚縣各地類的分類效果;黃鵬程[4]等基于Landsat8 OLI影像,對比分析了最大似然、決策樹分類法對于西安市土地利用分類的效果;程國旗[5]等以黃島區為例,基于Landsat8 OLI_TIRS影像,對比分析了最大似然、SVM、神經網絡等6種監督分類器的土地利用分類效果;蘇志強[6]基于GF-2號遙感影像,對比了博湖縣監督分類方法,結果表明隨機森林能更好地發揮GF-2號影像數據在土地利用分類中的應用潛力。綜合上述研究可知,在高維特征影像分類中,隨機森林、SVM表現優異,分類精度較高,而最大似然因產生休斯現象,分類精度極低。土地利用分類采用影像的光譜波段即可取得較高的分類精度,針對應用較廣泛、具有豐富光譜信息的Landsat8數據,利用哪種分類器更為合適,是一個值得探索的問題。因此,本文以洛陽市為研究區,選取Landsat8遙感影像的9個光譜波段,分別采用SVM、隨機森林和最大似然3種監督分類器確定研究區影像的類別,并采集不同像素容量的訓練樣本對影像進行分類;再對3種分類方法在不同訓練樣本中的分類精度進行對比,從而確定以Landsat8影像光譜波段為信息源的影像分類適用的分類器,為基于遙感影像的土地利用分類提供技術支撐。
洛陽是隋唐大運河的中心,先后有10多個王朝在此建都,具有千年帝都之稱;橫跨黃河中下游南北兩岸,東鄰鄭州市,西接三門峽市,北跨黃河與焦作市接壤,南與平頂山市、南陽市相連;截至2018年末,總人口為713.67萬人,常住人口為688.85萬人,總面積為15 230 km2。由于洛陽市吉利區在空間位置上與老城區、西工區、廛河回族區、澗西區和洛龍區不相鄰,本文不將吉利區劃入研究區。研究區位置如圖1所示。

圖1 研究區位置圖
本文選用Landsat8衛星搭載的OLI陸地成像儀獲取的遙感影像數據,成像時間為2017-08-09,共11個波段,包括8個空間分辨率為30 m的多光譜波段,1個空間分辨率為15 m的全色波段和兩個空間分辨率為100 m的熱紅外波段。本文主要利用海岸藍色、藍色、綠色、紅色、近紅外、短波紅外1、短波紅外2、熱紅外1、熱紅外2等9個波段對影像進行分類,因此在影像分類前,需對影像進行波段合成、裁剪、融合等預處理,獲得具有15 m空間分辨率的9個波段影像再進行分類研究。
本文利用ENVI5.3軟件打開研究區遙感影像,為便于各類別訓練樣本以及精度驗證樣本的選擇,選用標準假彩色的波段組合顯示遙感影像。本文通過對影像的目視分析,采用自定義的形式確定影像的分類類別為水體、草類、作物、裸地、樹木、不透水面和陰影,再根據遙感圖像解譯的相關內容[7],建立每種地類的解譯標志,如表1所示。

表1 影像類別的解譯標志
在確定類別的研究區影像中,根據各種地類建立的解譯標志,為影像選擇3套訓練樣本、一套精度驗證樣本。訓練樣本、精度驗證樣本中各地類數量如表2所示。

表2 訓練樣本與驗證樣本數量/個
本文利用ENVI5.3中的ROI可分離性工具來計算任意類別間的統計距離。根據相關文獻,類別之間樣本的可分離性應處于0~2 之間,數值大于1.9,說明樣本之間的可分離性好;數值小于1.8,則需重新選擇樣本;數值小于1,需將兩個類別的樣本合并。本文計算得到的樣本可分離性數值如表3所示,可以看出,各類別之間的可分離性數值均大于1.8,說明選取的訓練樣本符合要求,可用于影像分類。

表3 土地利用類型樣本可分離性數值
基于隨機森林、SVM、最大似然3種監督分類器,分別利用3套訓練樣本對洛陽市9個波段組合的影像進行分類,再利用精度驗證樣本檢驗各種樣本下的總體精度,進而分析不同分類器在不同訓練樣本情況下,總體精度的變化情況。為了分析波段組合、研究區變化情況下,Landsat8影像分類結果與洛陽市9個波段組合所得結果的異同,本文在不同波段組合下利用最佳分類樣本對洛陽市Landsat8影像進行分類檢驗,同時增加不同時相臨沂市蘭山區的Landsat8影像進行研究區變化檢驗。
本文分別采用訓練樣本1、訓練樣本2和訓練樣本3對影像進行分類,并利用精度驗證樣本進行驗證。隨機森林、SVM和最大似然3種分類器的總體精度變化結果如圖2所示,可以看出,隨著訓練樣本數量的增加,隨機森林、最大似然的總體分類精度均有一定程度的提高;對于SVM而言,當訓練樣本數由40個增加到60個時,總體分類精度有所下降,但整體上其總體分類精度仍呈上升趨勢。在以9個波段為信息源的Landsat8影像分類中,最大似然的分類精度最高,隨機森林次之,SVM最低。

圖2 訓練樣本數量對分類精度的影響
在3個分類器中,訓練樣本3的總體精度都是最高的。3個分類器利用訓練樣本3的分類結果混淆矩陣如表4~6所示,可以看出,SVM、隨機森林和最大似然的總體精度分別為87.464 3%、91.000 0%和91.750 0%;SVM、隨機森林和最大似然的Kappa系數分別為0.853 8、0.895 0和0.903 8,最大似然優于隨機森林,更優于SVM;最大似然和隨機森林的制圖精度和用戶精度明顯高于SVM。

表4 SVM監督分類混淆矩陣
就單個地物的分類精度而言,3種分類器對水體、裸地和陰影均可達到較高的識別精度;而草類、作物和樹木的分類精度則較低;不透水面采用隨機森林進行分類可得到相對較高的分類精度。

表5 隨機森林監督分類混淆矩陣

表6 最大似然監督分類混淆矩陣
在9個波段組合分類的基礎上,本文利用最佳訓練樣本(訓練樣本3),在一些典型的波段組合上驗證實驗結果在不同分類器中的異同。不同波段組合下,3種分類器分類的總體精度如圖3所示,可以看出,在12次波段組合變化中,最大似然分類10次取得了最好的分類結果,隨機森林兩次取得了最好的分類結果,SVM未取得最好的分類結果,說明在波段組合變化的情況下,最大似然分類效果仍然最好,隨機森林次之,SVM分類精度最低。

圖3 不同波段組合分類精度對比
以洛陽市老城區、西工區、廛河回族區、澗西區和洛龍區為例,本文分別利用SVM、隨機森林和最大似然3種分類器進行分類,結果如圖4所示,可以看出,整體上3種分類器對影像分類的效果均較好,水體、裸地、不透水面的分類精度較高,結果與實地情況較接近,但草類、作物和樹木互相之間易出現錯分,分類精度略低。

圖4 3種分類器的分類結果比較
本文采用與洛陽市影像相同的處理方法,對2017-05-25成像的臨沂市蘭山區9個波段Landsat8遙感影像進行不同分類器分類結果的檢驗,將影像分為水體、植被、建筑物、裸地和陰影5個類別,每種類別分別選取80個像素作為訓練樣本,400個像素作為精度驗證樣本。實驗結果表明,最大似然分類的總體精度為94.950 0%,Kappa系數為0.936 9;SVM分類的總體精度為93.850 0%,Kappa系數為0.923 1;隨機森林分類的總體精度為92.650 0%,Kappa系數為0.908 4,表明最大似然的分類效果優于隨機森林和SVM。
本文分別利用隨機森林、SVM、最大似然3種分類器對Landsat8影像進行分類,從而判斷較少特征采用的情況下所適用的分類方法。結果表明,對于本文選用的Landsat8遙感影像,最大似然的分類精度最高、分類效果最好,表明在利用較少特征的Landsat8影像進行分類時,選用速度較快的最大似然分類法即可,在高維特征中具有優異性能的隨機森林和SVM,未顯現其優勢。
本文所得結論是否適用于更多季節、地區還需進一步研究。另外,隨機森林、SVM、最大似然3種分類器對Landsat8影像進行分類時,訓練樣本數將對分類器總體精度產生影響,隨著訓練樣本數的增加,3種分類器的總體精度均呈上升趨勢,而它們的總體精度是否繼續隨訓練樣本數的增加而上升,還有待于進一步研究。