李 碩
(中國水利水電建設工程咨詢西北有限公司,西安 710065)
文章編號:1006—2610(2015)03—0012—03
基于SVM的土地利用/覆蓋分類
——以老哈河流域為例
李 碩
(中國水利水電建設工程咨詢西北有限公司,西安 710065)
選取老哈河流域為研究區域,以2007年的兩景Landsat5的TM影像為數據源,對該地區進行土地利用/覆蓋分類。由于該區域土地覆蓋類型復雜,影像較難區分且容易造成錯分類。該研究中采用支持向量機(Support Vector Machine,SVM)分類法,通過引入徑向基核函數進行非線性變換映射至高維空間,提取它們的非線性特征,增強不同類型之間的可分性,減少錯分現象,提高遙感圖像分類的精度。通過試驗,提取出了2007年的老哈河流域的土地利用/覆蓋現狀圖,以校驗該方法的可行性。
老哈河流域;土地利用/覆蓋;支持向量機(SVM);遙感圖像分類
老哈河為西遼河南源,是西遼河流域主流。其地貌特征復雜,黃土廣布,覆蓋層深厚,沖溝發育,溝壑縱橫,土地覆蓋類型比較復雜多樣。 在本研究中所取的興隆坡控制站以上的老哈河流域,面積約為1.9萬km2,位于北緯41°~43°,東經 117°~120°,流域形狀為不對稱扇形,全流域水系共有大小165條。
2.1 研究區數據
根據研究區的覆蓋范圍及生物、氣候特征,本文中將選用成像于無云的晴朗天氣下的2007年9月3日和2007年10月3日的兩景Landsat5的TM影像進行鑲嵌,作為遙感制圖數據源。
將地面高程信息引入遙感圖像分類是提高遙感分類精度的有效措施之一,而老哈河流域相當一部分面積在山區,因而地形信息成為遙感精確分類必不可少的數據。因此,本研究選用SRTM的“3”數據作為DEM數據源。
2.2 數據預處理
由于遙感系統空間、波譜、時間以及輻射分辨率的限制,很難精確地記錄復雜地表的信息,遙感數據在獲取過程中會產生輻射畸變、幾何畸變,從而降低了遙感數據的質量,影響圖像分析的精度。遙感圖像數據預處理即經過幾何校正、輻射校正,以及噪聲抑制等處理,使遙感圖像能最好地接近原始景物[1]。
本研究的遙感影像數據經過了輻射校正、大氣校正、幾何校正和影像鑲嵌,其中輻射校正所使用的影像的增益(Gain)和偏差(Bias)值如表1所示(由于Landsat TM傳感器運行時間較長,其增益和偏差值較最初改變較大),大氣校正使用ENVI遙感軟件的Flaash模塊實現,幾何校正使用最鄰近象元法采用二次多項式實現,精度在0.5個象元之內。

表1 研究所用TM影像的增益和偏差值表
本次試驗基于SVM方法對老哈河流域的高分辨率遙感影像進行特征提取和分類,在此基礎上進行土地利用覆蓋分類。在分類時,主要步驟為:首先,選擇合適的訓練區和檢驗區;其次,進行參數率定,尋求合適的參數,使得分類精度最高;最后,得出分類結果及對結果進行評價。
3.1 訓練區和檢驗區的選擇
根據本研究區的土地覆蓋特征,將土地覆蓋分為水體、城鄉用地、林地、耕地、草地和未利用地6個類別,針對每個類別分別選取感興趣區,每個類別的感興趣區不少于300個樣本。
3.2 SVM參數率定
在多光譜遙感影像的SVM分類中,RBF核函數模型被證明是最有效的核函數,因此本文在SVM分類中選用RBF核函數。
采用交叉驗證的方法來確定RBF必備的2個關鍵參數懲罰系數C和間隔γ,通過不斷改變C和γ的取值可以改變樣本分類結果的精度,最后選取可得到最高的樣本分類結果精度(即樣本精度)的C、γ取值,作為SVM分類的參數值。本文使用libsvm-2.89軟件[2]提供的參數選擇模型Grid.py來搜索C和γ的取值。最佳SVM模型參數為:懲罰因子C=8,核參數γ=8,交叉驗證的精度為95.5631%。
3.3 SVM分類及分類結果評價
在ENVI軟件的支持下,將經過交叉驗證得出的C和γ值帶入其中,對影像進行分類處理,在分類結果的基礎上進行分類精度的評價。
通過基于誤差矩陣(或稱混淆矩陣)的遙感影像分類精度的評價方法,最終算出對于總體的和基于各種地面類型的分類精度值。在基于混淆矩陣的統計量中,總體精度、用戶精度、制圖精度和KKappa系數是最常用的指標。
在進行精度評價時,每類至少有30~50個樣本點,本文根據類別面積大小隨機選取樣本點進行精度評價,每個類別的精度評價樣本大于200個。樣本選取的依據是原始影像的目視判讀和參考2000年的老哈河流域土地利用現狀圖,以及2006年8月份和2008年8月份對老哈河流域進行的土地利用現狀調查數據。最后構建土地利用變化分類混淆矩陣,見表2所示。

表2 SVM分類混淆矩陣及KKappa系數表
由表2可以看出,各地物類別的提取精度較高。其中城鄉用地、耕地、林地等面積較小類別的精度均比較高,取得了較好地分類效果。
從混淆矩陣也可以看出,最大的變化分類誤差來自未利用地類,原因主要是可能當時存在部分新種的農田,由于其光譜特征與未利用地光譜特征較為相近,容易發生混淆,導致出現部分耕地被錯分成未利用地[3-4]。或者變化誤差來源于耕地轉化為城鄉用地類,此類耕地與城鄉用地交錯分布,一部分耕地被收割后,與未利用地的光譜發生混淆,部分面積較小的單元就會構成混合像元,以導致影像上的一部分耕地被錯誤地分為未利用地[3-4]。耕地的分類精度最高,主要是由于耕地的光譜特征跟其他地物的光譜特征差異較大,且耕地區域內的地形起伏不大,幾乎沒有陰影,不易與其他地物產生混淆,所以分類精度最高。
從總體精度和KKappa系數上來看,SVM分類方法精度較高,比較適用于本研究取的土地利用/土地覆蓋分類,研究區最后的分類結果為:在2007年的老哈河流域,水體、城鄉用地、林地、耕地、草地和未利用地所占流域面積分別為0.31%、2.53%、32.04%、41.75%、22.43%和0.94%。從上述統計數據可以看出,流域內城鄉用地不多,城市化程度不高,流域內農林牧用地占流域的96.22%,為流域的主體。
本文采用徑向基函數支持向量機,通過實驗,可以看出SVM分類精度較高,分類結果比較理想,總體精度高達91.14%。
通過本次實驗,亦可以得出,C值可以控制學習過程的邊界誤差與支持向量的數目[5],但是C值過大,也不能提高分類精度。在本次試驗中,當C=8,γ=8時,其土地利用/土地覆蓋分類精度達到最高;C值過小時,其分類精度降低,直到為0。γ值決定了特征空間內決策平面的收縮程度[5],當γ在8附近時,分類效果達到最好,當γ進一步增加或者減小時,其分類精度均有所降低。
該流域土地類型復雜,有些地區草地和林地間雜分布,而使圖像難以區分,同時由于分類是用光譜信息,對影像逐個像元進行比較、分析,在地類交界處的像元中包括有多類別,其混合像元造成錯分類。而基于SVM分類方法對這些類型的分類精度較高,SVM通過引入和函數進行非線性變換映射至高維空間,提取它們的非線性特征,增強不同類型之間的可分性,大大地減少了錯分現象,在一定程度上提高了分類精度。
[1] 李祖鋒,賀麗娟,張成增,周濤. 高角度信號遮擋區域GPS測量控制網精度控制[J].西北水電,2014,(01):27-31.
[2] Chang Chih-Chung,Chih-Jen Lin.LIBSVM : a library for support vector machines[M].2001.
[3] 曹雪.基于TM影像的南京市土地利用遙感動態監測[J].武漢大學學報(信息科學版),2006,(11):958-961.
[4] 劉啟壽,魏蘭花. 坐標轉換在懸高測量中的應用[J].西北水電,2012,(01):24-25,33.
[5] 居紅云.基于K-means與SVM結合的遙感圖像全自動分類方法[J].計算機應用與研究,2007,(11):318-320.
Classification of Land Utilization and Covering Based on Support Vector Machine——with case of Laoha River catachment
LI Shuo
(China Hydro Consulting Engineering Corporation, Northwest Branch, Xi'an 710065,China)
The Laoha River catchment is selected as the study catchment. Based on the data source of TM image of Landsat 5 in 2007, classification of the land utilization and covering in the catchment is studied. As the land covering of this catchment is complicated in classification, the images are difficult to separate and easy to classify. In this study, classification method of support vector machine (SVM) is applied. By utilization of radial basis function, the non-linear conversion is conducted to the high-dimensional space, abstracting their non-linear characteristics, strengthening the separation between different types, reducing mistaken classification and improving accuracy of the remote-sense image classification. Through tests, the land utilization and covering status images of the Laoha River catchment in 2007 are abstracted to verify the feasibility of this method.
Laoha River catchment; land utilization and covering; support vector machine; remote-sense image classification
2014-12-15
李碩(1986- ),男,陜西省渭南市大荔縣人,助理級工程師,主要從事工程測繪工作.
TP79
A
10.3969/j.issn.1006-2610.2015.03.004