周霞 劉彥文 姜宇榕 劉建



摘要針對Landsat-8 OLI和GF-1 WFV傳感器參數的特點,選擇支持向量機(SVM)分類方法分別對咸寧市同一時段的Landsat-8遙感影像和GF-1遙感影像進行土地利用分類研究。結果表明,Landsat-8在耕地與林地、水域與裸地可分離性方面高于GF-1,提取的林地面積占比和耕地面積占比更接近于真實值;Landsat-8和GF-1的分類總精度分別為85.76%和88.38%,Kappa系數分別為0.807 1和0.820 4,說明GF-1的分類效果好于Landsat-8;GF-1具有較高的分辨率優勢,對分布零散的地物識別效果優于Landsat-8。
關鍵詞遙感影像;監督分類;可分離度;Kappa系數
中圖分類號S127文獻標識碼
A文章編號0517-6611(2017)31-0213-03
AbstractAccording to the characteristics of Landsat8 OLI and GF1 WFV sensor parameters, the support vector machine (SVM) classification method was used to classify Landsat8 remote sensing images and GF1 remote sensing images at the same time in Xianning City. The results showed that the separation of water area Landsat8 in the cultivated land,forest land, and bare land was higher than that of GF1, and the proportion of extracted forest land and cultivated land was closer to the real value.The classification total accuracy of Landsat8 and GF1 were 85.76% and 88.38% respectively, and Kappa coefficients were 0.807 1 and 0.820 4 respectively. The classification effect of GF1 was better than that of Landsat8. GF1 had higher resolution advantages, and the classification effect of the fragmented landform type was better than that of Landsat8.
Key wordsRemote sensing images;Supervised classification;Separability;Kappa coefficient
鑒于土地利用變化是某一地區水文、氣候和旱情監測重要的基礎數據,土地利用變化研究也愈發的重要。土地利用數據獲取的主要數據源是遙感數據,原因在于遙感數據具有范圍廣、時效性強以及成本相對較低。為了獲取較為全面精確的數據,自20世紀以來國內外發射了很多搭載新型衛星的傳感器,針對數據需求的不一樣,傳感器也呈現不同的參數特點[1]。Landsat系列衛星作為使用最普遍的衛星,也存在難以保證數據一致性的缺點;另外,對零碎物體分類精度低一直都是Landsat系列衛星的軟肋,而高空間分辨率影像恰好擁有這些優點,因此土地利用變化數據常用高空間分辨率影像作為數據來源。目前,已知的高空間分辨率衛星(如SPOT、IKONOS等)在區域研究中應用較多,但由于波段少、幅寬小等局限性,在研究中仍需要進行不同時相數據的拼接操作,且價格昂貴[2]。高分一號(GF-1)衛星雖然具有重訪周期短、多種分辨率與大幅寬結合等優點,但也存在波段數少的問題[3]。因此,掌握中高等分辨率影像的特點,對各自提取的土地利用數據進行比較研究具有實際意義。筆者選取Landsat-8 OLI和GF-1 WFV 2種傳感器,對咸寧市2種傳感器同一時段提取的土地利用數據進行定性和定量分析。
1材料與方法
1.1研究區概況與數據來源
咸寧市位于湖北東南部,長江中游南岸,下轄一區一市四縣(咸安區、赤壁市、嘉魚縣、通山縣、崇陽縣、通城縣),總面積9 861 km2,處于幕阜山脈向江漢平原過渡地帶。咸寧市南部屬幕阜山系余脈,北部屬于江漢平原。咸寧市區的植被為常綠闊葉林,含有豐富的樹木資源種類,2012年全市的植被覆蓋率達到53.4%[4]。
研究所用的Landsat-8和GF-1數據分別來自地理空間數據云和遙感集市,其中Landsat-8數據4景,GF-1數據1景。成像時間選擇在植被生長較好的季節,原因是因為該時間段的植被覆蓋率比較好,解譯出來的結果可靠性更高。另外,在數據選取時還要考慮到云量的百分比,云量越低,云層對地物解譯的影響越小,越便于地物的正確解譯[5]。Landsat-8數據為研究區2016年的遙感影像,空間分辨率為30 m;GF-1數據為同期的數據,空間分辨率為16 m[6]。Landsat-8和GF-1數據特征見表1。
1.2研究方法
采用遙感影像土地利用數據提取對比及3S綜合分析法,以RS、GIS和GPS為理論基礎,以ENVI、ArcGIS分析處理軟件為核心,實現對2種傳感器影像土地利用數據提取的綜合比較分析。以RS技術為支撐,以咸寧市全市范圍的中分辨率的Landsat-8影像和高分辨率GF-1影像作為研究的數據源,以ENVI 5.1遙感軟件為主,以ArcGIS軟件為輔,對影像數據進行相關分析處理,主要包括輻射定標、大氣校正、數據融合、裁剪和拼接、影像解譯、結果定性定量對比分析等。遙感影像分類準確性是后續分析的基礎,支持向量機(Support vector machine,SVM)分類可以利用徑向基函數將低維空間向量機映射到高維空間,從而在高維空間尋找線性分隔超平面使線性分隔最大。常用的徑向基函數公式為:
K(X,XC)=exp(-‖x-xc‖22σ2) (1)
式中, K(X,XC) 為空間中任一點 X 到某一中心 XC 之間歐氏距離的單調函數,XC 為核函數中心,σ為函數的寬度參數(徑向作用范圍)[7]。
SVM解決了小樣本情況下的機器學習問題,是一種有堅實理論基礎的新穎的小樣本學習方法。從本質上看,它避開了從歸納到演繹的傳統過程,實現了高效的從訓練樣本到預報樣本的“轉導推理”,大大簡化了通常的分類和回歸等問題,提高泛化性能,解決高維和非線性問題,又可以避免神經網絡結構選擇和局部極小點問題。利用SVM進行遙感影像分類具有較高的分類精度,具有明顯的技術優勢與應用前景。該研究技術路線如圖1所示。
1.3土地利用數據提取
1.3.1分類系統制定。
分類體系建立參考國土資源部《土地利用現狀分類》一級分類系統,并考慮所用數據及研究區土地覆蓋類型的特點,最終確定將研究區的土地利用類型劃分為林地、草地、水域、耕地、建設用地以及裸地6類。
1.3.2土地利用分類。
該研究選用計算機自動分類法中的支持向量機(SVM)分類作為監督分類方法,主要原因是因為該方法能夠自動尋找對分類有較大區分能力的支持向量,能最大化地拉開類與類之間的間隔,且具有較高的精確度[8]。由于原始影像數據及不同分類器自身的原因等,對計算機自
動分類的結果一般需要進行分類后處理,如合并分類結果中的細小斑塊、孤立點去除后進行篩選和聚類處理。再經過上述支持向量機分類的方法將中高等遙感影像中各地類分離出來,同樣還會存在一部分像元偏離了徑向基函數中σ的徑向作用范圍,從而在分類時可能出現一些錯分或者漏分的現象,導致精度要求難以達到要求,因而需要對分類后的結果進行分類后處理,后處理結果如圖2所示。
2結果與分析
利用上述支持向量機的分類方法對2幅遙感影像進行分類,直觀地對比了2幅分類結果圖,發現林地的面積最大,分布在咸寧市各個區域,且以中西部、北部和東南部為主,建設用地分布的大致范圍也都在6個城區的位置,Landsat-8和GF-1影像的分類結果較為一致,分類結果見圖3。
2.1樣本可分離性比較
光譜可分離性(Spectral separability)是衡量各類別可分離性,確定各類別間差異程度的重要指標,這也在一定程度上反映后續監督分類的精度。由光譜可分離度的計算結果可知,Landsat-8和GF-1農田和林地分離度分別1.949 02和1.916 03,水域和裸土的類別可分離度為1.999 23和1.999 08,這說明在藍光波段、綠光波段和紅光波段Landsat-8各地物的反射率略大于GF-1,Landsat-8在光譜可分離性方面優于GF-1。
2.2分類面積比較
能夠最直觀地反映2種影像監督分類后主要地類差異的就是各地類的面積。在對分類結果分析后提取了在2個傳感器上各地類的面積,再經過分類統計后分別獲得了Landsat-8和GF-1各個影像ROIs地類面積和所占百分比的對比數據,由于分類面積統計中包含未分類的面積(背景面積),因此真實的地類面積百分比=地類百分比/(1-未分類百分比)×100%,可以根據此公式計算出各地類占總面積的百分比,主要地類面積百分比如表2所示。
從表2可以看出,Landsat-8分辨出的林地面積百分比(55.69%)高于GF-1(48.34%),據統計咸寧市林地覆蓋率在53%左右,因此基于Landsat-8圖像上分類出的林地更接近于真實值。
Landsat-8耕地面積百分比為18.49%,GF-1耕地面積百分比為12.39%,從分類后的結果來看,耕地大多分布在咸寧市的北部,根據實地考察目視解譯的結果可知,嘉魚縣(咸寧市北部)北部基本為種植基地和少部分的水產養殖基地,再對比地類分布圖可看出GF-1錯將少部分耕地分為林地,因此Landsat-8在林地與耕地的分類能力上要好于GF-1,主要是因為傳感器的不同,使得紅光與近紅外波段的光譜響應函數不同,造成GF-1在林地上的接收信號弱于Landsat-8。建設用地和草地在GF-1影像上的面積百分比均比Landsat-8影像更接近于真實值(5.92%和1312%),說明在零碎分布地物類型方面GF-1的分類效果要好于Landsat-8。
2.3分類精度評價
為了檢驗分類樣本的精度和準確性,需要對樣本分類圖進行校驗和檢測,像監督分類一樣選取訓練樣本,但這些樣本需要選擇純凈像元,所謂純凈像元就是一個或者多個相同灰度值的像元,且每個地類需要的樣本數不宜過多,然后采用支持向量機方法進行分類,并對分類結果進行精度評價。
Landsat-8的分類總精度為85.76%,比GF-1的分類總精度(88.38%)低,分類結果較為理想。二者的Kappa系數分別為0.807 1 和0.820 4,均大于0.8,數據可靠性很高,且GF-1的Kappa系數大于Landsat-8,說明GF-1分類效果較好。對比Ground Truth中耕地的數據發現,Landsat-8對耕地的真實性(80.03%)高于GF-1(77.04%),其主要原因是波譜響應函數的差異造成GF-1將有些耕地誤分為林地,Landsat-8在耕地方面的分類精度要高于GF-1。
GF-1對建設用地的分類精度明顯高于Landsat-8,因為在研究區分布較多水域、細小河流、村莊和城鎮的區域地物類型較為復雜,在具有更高分辨率的GF-1影像上混合像元少,細節信息和紋理較Landsat-8更明顯,從而分類效果更好。GF-1將部分未使用耕地或者部分收割農田劃分為裸地,是造成裸地分類精度低于Landsat-8的主要原因。
3結論
不同傳感器參數的數據對土地利用分類結果有不同的影響,Landsat-8在耕地與林地、水域與裸地的地物可分離性方面高于GF-1,而且對提取出的林地面積百分比和耕地面積百分比更接近于真實值,原因是波譜響應函數造成的差異使得Landsat-8對林地類型的接受信號好于GF-1。另外,Landsat-8藍光波段、綠光波段和紅光波段的光譜可分離性方面優于GF-1,因此在林地方面Landsat-8的分類精度高于GF-1。GF-1的混淆矩陣中,建設用地的真實性明顯比Landsat-8的要高,而且GF-1具有較高的分辨率優勢,這也可以說明GF-1對零碎分布地物類型的分類效果要好于Landsat-8。
總體來看,GF-1的分類效果要好于Landsat-8。Landsat-8和GF-1的分類精度分別為85.76%和88.38%,其Kappa系數分別為0.807 1和0.820 4。Landsat-8數據幅寬相對窄、重訪周期長、分辨率低等局限性限制了該系列衛星只適合中低尺度的研究,而GF-1的高空間分辨率影像數據的大幅寬與重訪周期短等優點使其在土地利用數據提取方面效果顯著,精度較高,因此在土地覆蓋分類研究中具有更廣闊的應用前景。
參考文獻
[1]
董墨,王樹力.基于中分辨率遙感影像土地利用類型信息提取及動態[J].東北林業大學學報,2016(3):95-100.
[2] 李芬.資源三號衛星數據在土地利用遙感監測中的應用研究[D].長春:吉林大學,2013.
[3] 宋軍偉,張友靜,李鑫川,等.基于GF1與Landsat8影像的土地覆蓋分類比較[J].地理科學進展,2016,35(2):255-263.
[4] 方世明,鄭斌.區域城市化與經濟協調發展測度研究:以咸寧市為例[J].中國地質大學學報(社會科學版), 2010,10(5):112-118.
[5] 桂玲,孫華,陳利.基于中等分辨率遙感影像的桃源縣竹林信息提取研究[J].中國農學通報, 2012,28(1):85-91.
[6] 孫家波,曲杰卿,張超,等.基于高分辨率遙感影像的土地利用信息提取系統的設計與實現[J].測繪與空間地理信息,2012,35(11):12-15.
[7] 劉世英,李宗仁,皮英楠.基于Landsat8與GF1衛星數據的青海省濕地遙感調查及成果[J].青海國土經略,2016(1):55-59.
[8] 盧偉,文鴻雁,李淑.基于SVM的遙感影像空間特征提取和分類研究[J].山西建筑,2009,35(5):10-12.