紀 凱,韓 棟
(1.安徽交通職業技術學院,安徽 合肥 230051;2.法國格勒諾布爾計算機實驗室,伊澤爾省格勒諾布爾市 38000)
SVM支持向量機在遙感圖像中的應用研究
紀 凱1,韓 棟2
(1.安徽交通職業技術學院,安徽 合肥 230051;2.法國格勒諾布爾計算機實驗室,伊澤爾省格勒諾布爾市 38000)
遙感圖像分類是遙感圖像處理領域中的一個重要的研究方向,隨著傳感器質量的不斷提高,越來越多高質量的遙感圖像需要新的監督分類方法進行處理。常用的將svm二元分類器改進成為多級分類器的方法有“一對一”(one against one,1-v-1)和“一對多”(one against all,1-v-all)。本文將使用這兩種方法進行遙感圖像分類研究,進行對比評價。結果發現在大多數情況下,第一種方法“一對一”在計算速度和分類精度方面要優于第二種方法“一對多”。但是這種差別并不太顯著,具體選擇哪種方法也取決于實際情況。
圖像分類;傳感器;二元分類器
隨著衛星技術的提高,大量遙感圖像可以實時實地獲取。90年代衛星遙感在全球和區域尺度土地覆蓋研究與應用方面取得了突破性進展,土地利用覆蓋遙感研究的新方法不斷出現[1]。遙感數據在土地資源分析和應用中的第一步是遙感圖像分類,在滿足一定精度的要求下,如何解決多類別圖像的識別是遙感圖像研究中的一個關鍵問題[2]。支持向量機(Support Vector Mqchine,SVM)作為一種新的高效學習方法,是近十幾年來發展起來的一種統計學習理論,反映了結構風險最小化原則,在遙感圖像分類領域應用越廣。相比傳統的遙感圖像分類方法計算速度慢,分類精度低,SVM具有小樣本學習,穩定,準確和高效等特點,成為遙感圖像分類研究的熱點。本文結合實際例子,使用SVM進行遙感圖像分類,并對結果對比評價。
1.1 支持向量機
機器學習是為了使期望風險最小,因為可利用的信息只是有限樣本 ,傳統學習方法中運用了經驗風險最小化(ERM)準則。而根據統計學習理論的研究 ,不但經驗風險要最小,VC維也要盡量小,為了縮小置信范圍,實際風險才能取得較小。SVM正是根據 SRM理論在線性可分的基礎上的最優分類面發展出來的。
支持向量機的基本思想是對于一組數據樣本,如果其屬于一個或兩個類,通過一個盡可能寬的分界區間,發現一個可完美分離d維數據的超平面,且最大化這兩個類與超平面的距離。SVM把“內核誘導特征空間”的概念引入,通過內核函數把數據映射到一個可分離的高維空間。內核函數通過樣品的相似性,提供了比給定類的描述符合本身更多的信息。
對于一個二元分類問題,給定一個大小為n的訓練集T:

xi,yi分別是訓練矢量和目標值T中的第i個樣本,且i=1,...,N。則分類超平面的定義是:

(.)是從數據集d映射到更高維的Hilbert希爾伯特空間H,.,.是在H超平面的點積,決定函數f(x)是:

找到一個最佳超平面和兩個預定義的類之間的最大間隔是支持向量機的目標。可轉化為求解下面的二次優化問題來實現:

定義一個映射z= (x)的變換將d維輸入向量x映射到一般較高的d維向量z。選擇一個 (),則新的訓練數據{ (xi),yi}是一個可分的超平面是其目標。注意 (xi)是和其他 (xj)的點積。即公式(內核)如果知道,則用在高維特征空間中的點積:

可不需直接處理映射z= (xi)。
1.2 核函數
核函數的選擇是構造出一個具有良好性能的SVM的關鍵。核函數類型的選擇與類型確定后相關參數的選擇是核函數的選擇的兩個工作。依據泛函的相關理論,如果有一種函數K(xi,xj)滿足默瑟條件(正定的特征值),其就對應某一變換空間的內積。對于判斷哪些函數是核函數到目前為止也取得了重要的突破,得到默瑟條件和以下常用的核函數類型:
(1)線性核函數:

(2)多項式核

(3)徑向基函數,也被稱為高斯核函數是最流行的內核,即:

(4)傅里葉核

(5)樣條核

(6)Sigmoid核函數

如何選取核函數解決實際問題,一般是利用專家的先驗知識預先選定核函數或是采用Cross-Validation方法,即在選取核函數時,通過試用不同的核函數,最好的核函數是歸納誤差最小的核函數。
1.3 SVM多類分類器
如前所述,SVM分類本質上是一個適用于兩種類別的兩類分類技術,因此必須加以修改以適用于處理多類信息,比如遙感圖像多種地物分類。SVM多級分類器實現的基本思想是將多級分類問題簡化為兩類分類問題,這樣就可以使用SVM方法。通常有兩種方法實現:一種是one agaist one(1-v-1),該方法代表了最早和最常見的SVM方法,即通過一系列兩類SVM分類器的構造,把每個分類器識別兩個類別,再把結果以某種方式的組合實現多級分類。比如在一幅遙感圖像上,感興趣的類別有水,植被和建筑物,首先用SVM分類為水體區和非水體區(植被和建筑物)或植被區和非植被區(水和建筑物),然后在非水體區或非植被區再次使用SVM進行分類。另外一種方法是one agaist all(1-v-all),即合并多個分類面的參數求解到一個最優化問題中,求解該最優化問題一次性實現多級分類。第二種方法雖然貌似可以一次性實現多級分類,但是求解最優化問題的過程無論是復雜度還是計算時間都遠遠大于第一種1-v-1方法,而且計算量的加大也會影響分類精度。本文將分別使用以上兩種方法進行衛星圖像的土地覆蓋信息的提取分類,將這兩種技術的性能進行比較和評價。
如圖1所示,研究區是2003年5月Quickbird衛星獲取的位于芬蘭北部的一幅圖像,圖像中主要有四種地物,分別是樹,地面植被,道路和建筑物,使用Matlab 7中的SVM函數進行處理,使用到的SVM核函數主要有線性核函數,多項式核函數,和徑向基核函數。分別使用1-v-1和1-v-all方法進行分類比較,然后導入相關地理信息進行分類精度評估,主要分類精度參數是未分類像素數,混合像元數,最終精度評估和kappa系數。

圖1 研究區域
下面幾組圖是使用不同核函數的1-v-1分類器(一對一分類器)和1-v-all分類器(一對一分類器)對研究區圖像分類的結果。紅色的代表地表建筑物,深綠色代表樹木,淺綠色代表地表植被,灰色是地面道路,黑色是未分類像素,黃色是混合像素。左邊的圖2-1,圖3-1和圖4-1是使用1-v-1分類器,我們可以發現分類結果中幾乎沒有混合像素的情況,只有一些黑色的未分類像素。而右邊的圖2-2,圖3-2和圖4-2是使用1-v-all分類器的結果,顯而易見,分類結果除了有黑色的未分類像素,還有一些黃色的混合像素。

圖2-1:線性1-v-1分類

圖2-2:線性1-v-all分類

圖3-1:多項式1-v-1分類

圖3-2:多項式1-v-all分類

圖4-1:徑向基1-v-1分類

圖4-2:徑向基1-v-all分類
通過表1,可以明顯看出兩種SVM分類器分類方法結果對比,1-v-1分類器沒有混合像素,而1-v-all分類器不僅會出現未分類像素,還會出現混合像素,影響最后的分類精度。

表1 兩種SVM分類器分類方法比較

混合像素 0 95未分類像素 20 187多項式核函數 混合像素 0 64未分類像素 18 104徑向基核函數 混合像素 0 38
三種核函數的分類結果可以通過 95%的置信區間的一致性kappa系數進行對比分析,表2給出了比較結果。

表2 兩種SVM分類器分類方法kappa系數
從表2可以看出,使用線性核函數和徑向基核函數的時候,v1-v-1分類器分類精度優于1-v-all分類器線分類精度,但是總體結果來說差異不顯著。在使用多項式核函數的時候,兩種SVM分類器分類結果沒有區別。由此可以看出,總體來說,1-v-1分類器的結果要優于1-v-all分類器,但是具體選擇那種核函數,要根據實際情況具體分析。
[1]Kramer J.H.,2002.Observation of the earth and its environment:Survey of missions and sensors (4th Edition).(Berlin:Springer).
[2]賈永紅,張春森,王愛平.基于 BP 神經網絡的多源遙感影像分類[J].西安科技學院學報,2001,21(1):58-60.
A Study of Remote sensing image classification based on Support Vector Machine
JI Kai1,HAN Dong2
(1.Civil Engineering Department,Anhui Communications Vocational &Technical College ,Hefei Anhui 230051,China; 2 French Grenoble Computer laboratory,Grenoble Isere 38000,France)
Remote sensing image classification is an important research topic.More high-quality satellite images can be obtained with the improvement of sensor quality.Two of the common methods to enable this adaptation include the "one against one" (1-v-1)and "one against all" (1-v-all).This paper will use these two methods for satellite image classification.It is found that in most cases,the first method,"one against one" is better than the second method "one against all".But there are no much differences so the choice of technique adopted boils down to the actually conditions.
Image Classification; sensor ; Binary Classifier
P237
:A
10.3969/j.issn.1672-7304.2016.01.062
1672–7304(2016)01–0133–02
(責任編輯:廖建勇)
紀凱(1979-),男,安徽六安人,副教授,研究方向:工程測量和遙感數據處理。