程 彬
(長(zhǎng)春師范大學(xué)城市與環(huán)境科學(xué)學(xué)院,吉林長(zhǎng)春 130032)
基于支持向量機(jī)的乾安縣土地利用遙感分類研究
程 彬
(長(zhǎng)春師范大學(xué)城市與環(huán)境科學(xué)學(xué)院,吉林長(zhǎng)春 130032)
吉林西部松嫩平原的鹽堿地是世界上三大鹽堿地集中分布地區(qū)之一。本文以松嫩平原西部典型鹽堿土地區(qū)為研究區(qū),利用支持向量機(jī)方法對(duì)研究區(qū)域進(jìn)行分類研究判斷出旱地和水田、鹽堿土、湖泡、草地、濕地和村鎮(zhèn),并與最大似然法進(jìn)行分類對(duì)比,可以看出支持向量機(jī)方法分類總體精度和Kappa系數(shù)都有所提高,說(shuō)明在小樣本情況下,支持向量機(jī)方法分類精度更高。
支持向量機(jī);徑向基核;遙感;分類
全面查清土地資源和利用狀況,掌握真實(shí)準(zhǔn)確的土地基礎(chǔ)數(shù)據(jù),可為科學(xué)規(guī)劃、合理利用、有效保護(hù)土地資源,加強(qiáng)和改善宏觀調(diào)控提供依據(jù),促進(jìn)經(jīng)濟(jì)社會(huì)全面協(xié)調(diào)可持續(xù)發(fā)展。及時(shí)準(zhǔn)確的土地利用信息是區(qū)域尺度范圍資源調(diào)查與管理的重要依據(jù)。
本文以地處吉林省松原市西北部的乾安縣為研究區(qū),該地區(qū)是吉林西北部沙化、鹽漬化土壤分布比較集中的區(qū)域。掌握該地區(qū)農(nóng)用地與鹽漬化土地的分布及變化情況,對(duì)農(nóng)業(yè)生產(chǎn)有重要意義。
乾安縣位于吉林省西北部,松原市西部,地處東經(jīng)123°21′16″~124°22′50″,北緯44°37′47″~45°18′08″,位于松花江、嫩江匯合處以南,屬松花江第二和第三階地,整體地勢(shì)平坦,無(wú)山川、丘陵和河流。鹽堿土主要穿插分布于地帶性黑鈣土土帶中。在非地帶性土壤中,鹽堿土主要與草甸土、沼澤土及風(fēng)沙土呈復(fù)區(qū)分布。這些都使分類難度增加。研究區(qū)內(nèi)湖、堿泡星羅密布,這些區(qū)域?yàn)橹饕e鹽區(qū)[1]。
研究采用Landsat8 OLI影像,OLI陸地成像儀包括9個(gè)波段,研究區(qū)域?qū)儆陉懙兀匝芯恐羞x取Landsat8 OLI影像的第2~7波段,獲取2015年7月研究區(qū)范圍內(nèi)云量小于10%的影像數(shù)據(jù)、研究區(qū)域矢量數(shù)據(jù)、30米分辨率數(shù)字高程模型數(shù)據(jù)。
利用矢量數(shù)據(jù)將研究區(qū)域裁剪,便于后續(xù)處理,對(duì)影像進(jìn)行輻射校正、大氣校正。大氣校正中由于只是選取MultiSpectral中部分波段,所以要在Multispectral Settings中手動(dòng)設(shè)定對(duì)應(yīng)Landsat8 OLI的光譜相應(yīng)函數(shù)所在位置。
支持向量機(jī)SVM(Support Vector Machine)是在統(tǒng)計(jì)學(xué)習(xí)理論基礎(chǔ)上發(fā)展起來(lái)的一種新機(jī)器學(xué)習(xí)方法。支持向量機(jī)以統(tǒng)計(jì)學(xué)習(xí)理論為基礎(chǔ),相比于傳統(tǒng)學(xué)習(xí)方法,具有精度高、運(yùn)算速度快、泛化能力強(qiáng)等優(yōu)點(diǎn)[2-3]。支持向量機(jī)是一種基于統(tǒng)計(jì)學(xué)習(xí)理論的機(jī)器學(xué)習(xí)算法,采用結(jié)構(gòu)風(fēng)險(xiǎn)最小化準(zhǔn)則,在最小化樣本誤差的同時(shí)縮小模型泛化誤差的上界,從而提高模型的泛化能力。
通過(guò)解SVM的基本數(shù)學(xué)公式得出最優(yōu)分類函數(shù)[4]:

其中,核函數(shù)K(xi,x)可以有多種形式,常用的核函數(shù)包括:
(1)線性核函數(shù):K(x,y)=(x,y)。
(2)多項(xiàng)式核函數(shù):K(xi,x)=(xi·x+1)d,其中,d是自然數(shù)。
(4)Sigmoid核函數(shù)K(xi,x)=S[a(xi,x)+t],其中,S是Sigmoid函數(shù),a、t是常數(shù),一般根據(jù)不同分類體系進(jìn)行確定。
(1)利用預(yù)處理得到的已經(jīng)裁剪影像中選擇典型地作為訓(xùn)練樣本,分為旱地和水田、鹽堿土、湖泡、草甸/草地、草本濕地、村鎮(zhèn)等建筑用地。
(2)利用支持向量機(jī)方法進(jìn)行特征提取最重要的是核函數(shù)的選擇和求解核參數(shù)。本研究選擇徑向基核函數(shù)進(jìn)行分類,因?yàn)閺较蚧撕瘮?shù)能將樣本映射到高維空間,線性核函數(shù)為徑向基核函數(shù)的一個(gè)特例;徑向基核函數(shù)需要確定的參數(shù)較少,而多項(xiàng)式核函數(shù)中多項(xiàng)式階數(shù)較高時(shí),核矩陣值趨于無(wú)窮。本文通過(guò)采用交叉驗(yàn)證的網(wǎng)格搜尋的方法確定兩個(gè)參數(shù)——懲罰系數(shù)參數(shù)和間隔。
(3)精度評(píng)價(jià)。
利用支持向量機(jī)方法對(duì)乾安縣2015年Landsat8 OLI圖像進(jìn)行土地利用分類信息提取,經(jīng)過(guò)處理后得出該地區(qū)的分類圖(圖1)。從圖1中可以看出,該地區(qū)土地利用中自然封閉湖泡較多,其次是耕地,再次是草地,在全縣范圍內(nèi)都有分布。對(duì)分類結(jié)果圖利用混淆矩陣進(jìn)行精度評(píng)價(jià)(表1),總分類精度為81%,Kappa系數(shù)為0.82。同時(shí)采用傳統(tǒng)的監(jiān)督分類方法中的最大似然法,利用相同的訓(xùn)練樣本進(jìn)行分類,同樣通過(guò)計(jì)算混淆矩陣得到分類結(jié)果精度,總分類精度為75.2%,Kappa系數(shù)為0.75。

圖1 乾安縣土地利用分類圖
傳統(tǒng)的監(jiān)督分類方法最大似然法是分類精度較高的一種分類方法,但是與支持向量機(jī)分類方法相比,支持向量機(jī)分類方法總分類精度提高了5.8%,Kappa系數(shù)提高了0.07。采用RBF核函數(shù)的SVM具有較好的分類性能,利用小樣本,RBF核函數(shù)將實(shí)際問(wèn)題轉(zhuǎn)換到高維空間,在訓(xùn)練誤差與真實(shí)誤差之間找尋最優(yōu)解,而面對(duì)高維、小樣本的復(fù)雜問(wèn)題,傳統(tǒng)的最大似然法根據(jù)訓(xùn)練誤差最小的原則,常導(dǎo)致過(guò)度擬合。從分類結(jié)果看,SVM分類方法分類結(jié)果遠(yuǎn)遠(yuǎn)好于最大似然法。因?yàn)閷?duì)于小樣本、高維數(shù)據(jù)的復(fù)雜問(wèn)題,支持向量機(jī)將實(shí)際問(wèn)題轉(zhuǎn)換到高維空間,在訓(xùn)練誤差與真實(shí)誤差之間找尋最優(yōu)解,所以分類效果好。而傳統(tǒng)的最大似然法,信息量增加,反而產(chǎn)生干擾信息影響分類結(jié)果。

表1 兩種分類方法的總體分類精度
本研究應(yīng)用支持向量機(jī)分類方法對(duì)吉林西部乾安縣進(jìn)行土地利用遙感提取,取得較好的分類效果。說(shuō)明SVM方法適用于鹽漬化地區(qū)信息監(jiān)測(cè),并且分類精度高于傳統(tǒng)的最大似然法。由于Landsat8 OLI影像的分辨率是30米,對(duì)于一些混合像元還沒(méi)有很好的解決,若采用高分辨率影像會(huì)進(jìn)一步提高分類精度。隨著數(shù)據(jù)的增多,核函數(shù)類型和參數(shù)選擇對(duì)分類精度有直接影響,懲罰系數(shù)參數(shù)和間隔的確定需要花費(fèi)更多的時(shí)間。本研究中只是用到了支持向量機(jī)方法,需要進(jìn)一步研究,增加光譜信息和紋理信息提高分類精度。
[1]吉林省土壤肥料總站.吉林土壤[M].北京:中國(guó)農(nóng)業(yè)出版社,1998.
[2]杜培軍,譚琨,夏俊士.高光譜遙感影像分類與支持向量機(jī)應(yīng)用研究[M].北京:科學(xué)出版社,2012.
[3]張睿,馬建文.支持向量機(jī)在遙感數(shù)據(jù)分類中的應(yīng)用新進(jìn)展[J].地球科學(xué)進(jìn)展,2009,24(5):555-562.
[4]Huang Hanpang,Liu Yihung.Fuzzy support vector machines for pattern recognition and data mining[J]. International Journal of Fuzzy Systems,2002,4(3):826-835.
LandUseInformationExtractionBasedonSupportVectorMachineUsingMultitemporalRemoteSensinginQian’anCounty
CHENG Bin
(College of Urban and Environmental Sciences,Changchun Normal University, Changchun Jilin 130032,China)
Saline-alkali soil in Songnen Plain in western Jilin province is one of the three areas of saline-alkali land in the world. The research area is classic saline-alkali soil in Songnen Plain. The classification is done using support vector machine. Saline-alkali soil, dry farmland and paddy land, lake, grasslands and town are classified, and compared with the maximum likelihood. We can see that overall accuracy and Kappa coefficient of classification using SVM are improved. In the case of small samples, classification accuracy is higher using support vector machine.
Support Vector Machine(SVM); Radial Basis Function (RBF);remote sensing; classification
K903
A
2095-7602(2017)12-0086-03
2017-08-10
吉林省教育廳“十二五”科學(xué)技術(shù)研究項(xiàng)目“基于被動(dòng)微波遙感的吉林西部蘇打鹽堿土含鹽量的反演研究”(吉教科合字[2015]第368號(hào))。
程 彬(1973- ),女,講師,博士,從事遙感和地理信息系統(tǒng)研究。
長(zhǎng)春師范大學(xué)學(xué)報(bào)2017年12期