孫彥花 梁懷翔
(1.山東省煤田地質局物探測量隊,山東 泰安271000;2.北京望神州科技有限公司,中國 北京100085)
遙感技術作為人類研究地球資源環境的一種技術手段,遙感圖像計算機分類是遙感技術應用的重要組成部分[1]遙感數字圖像的處理就是將遙感圖像的模擬或數字形式的信息輸入計算機中,利用某種遙感圖像處理軟件,按照一定的數學模型,進行變換、加工產生可為專業人員判讀的圖像或者資料[2]。20世紀70年代之后,圖像分類成為遙感領域研究的熱點問題,在諸多領域中應用越來越廣泛,如測繪行業中地理國情監測,鐵路行業中用圖像分類進行環境監測,水利部門用圖像分類技術監測河道或者湖泊周圍的自然環境。近年來許多學者對圖像分類進行了大量的研究和探索,并提出了多種方案。如Huang等人[3]通過獲取圖像顏色的空間相關性等信息,通過用分類樹來對圖像進行分類。
目前常用的圖像分類方法是最大似然法,它是以貝葉斯的主觀理論為代表的,運用最大似然法前提條件是圖像數據呈正態分布,而且主要存在的問題是反映不出對知識的不知道信息[4]。
采用傳統的分類方法,會出現很多錯分,漏分的情況,且分類精度也比較低。在此種情況下,許多人找尋新的分類方法,支持向量機的分類方法應運而生。近些年來,支持向量機被應用到了很多領域,支持向量機的研究已經被越來越多的學者所重視,這種技術在人臉特征檢測、文字體識別、圖像處理以及其他領域都取得了大量的研究成果。圖像分類結果是將圖像空間劃分為若干個子區域,每個區域代表一類地物[5]。

圖1 最優分類面示意圖Fig.1 Schematic diagram of optimal classification face

因為f(x)是單調遞增函數,h隨著△2的遞增而遞減。因此如果訓練樣本數固定后,兩類訓練樣本之間的分類間隔越大,則與之對應的VC維就會越小。
分類超平面方程為wTx+b=0,如果線性可分,則樣本集(xi,yi),其中i=1,2,…,n,x∈Rd,y∈{-1,1},滿足:

最優超平面問題在線性可分情況下,可以表示為下面的約束優化問題,在條件的約束下,求下列函數的最小值

在前面介紹SVM算法的基礎上,本文采用了臺灣林志仁老師開發的一個基于C和C++的LIBSVM開源代碼,并在其上添加許多新的特性。本次設計利用SVM進行圖像分類的流程是:添加數據,新建訓練樣本,圖像分類,分類后處理。本軟件設計程序主要包括以下幾個模塊:樣本采集模塊,樣本訓練模塊,算法分類模塊,圖像顯示模塊。在設計時結合Windows系統下特有圖形設備接口,實現圖像顯示,分析功能,并可以將分類后的結果以一種直觀的形式呈現在用戶面前。
利用別的商業軟件對測區的遙感影像進行預處理,如;幾何校正,影像鑲嵌,影像裁切等,然后將預處理后的數據加載到樣本采集模塊中。用戶可在此模塊中對此影像中設計不同的波段組合顯示,同時需要在此設計不同的訓練樣本,并確定分類地物的類別。
支持向量機的基本思想如(圖1)所示。在圖中直線附近不同的圖形代表不同的訓練樣本,H為把兩類訓練樣本沒有錯誤分開的分類面,H1和H2表示超平面,H1和H2之間的距離△被稱為分類間隔(margin)。
如果給定分類間隔△的值,可以確定相應的分類超平面,當分類面變化時,分類間隔△也隨之發生變化。在分類間隔△存在下,超平面幾何的VC維h滿足下面關系:
本軟件設計的最核心,最復雜的本分就是算法模塊。該算法模塊需要先輸入待處理的文件,輸出的文件路徑,以及先前做的訓練樣本文件。見圖2。

圖2 樣本算法模塊的界面Fig.2 Sample algorithm module interface
分類模塊實現對數據的分類,在分類時需設置需要分類的影像,訓練樣本以及輸出的文件。經過分類后即可將影像分成多個類別。分類模塊如圖3所示。

圖3 樣本分類模塊的界面Fig.3 Sample classification module interface
在這次試驗中,分別采用多項式核函數、線性核函數、徑向基核函數,Sigmoid核函數對測區數據進行分類。然后將分類后的數據利用分類誤差矩陣和Kappa系數來測試分類的精度,并與真實材料比對查看分類的精度。
此次選擇了一景空間分辨率為1.25米的Resurs DK1數據為實驗數據,影像成像時間為2009年11月。首先利用ERDAS軟件對測試數據進行預處理操作,圖4是經過ERDAS預處理之后,真彩色合成圖。

圖4 原圖像Fig.4 The original image
本次實驗針對測試數據利用核函數的四種不同函數對圖像進行分類,將測區數據分為房屋、主干道、植被,小路、草地,水池六類地物,下圖是利用SVM的不同核函數對影像進行分類的效果圖。

圖5 四種核函數的分類結果比較Fig.5 Comparison of classification results of four kinds of kernel function
從上面幾幅圖用肉眼可以看出,對于SVM的四種核函數都可以實現對影像的正確分類,為了更好的區分各種不同核函數的分類效果,采用誤差矩陣和Kappa系數對四種分類效果進行量化評價,表1和表2是利用分類結果誤差(Error matrix of classification)矩陣和Kappa系數對以上各種分類效果精度評價。

表1 核函數為多項式的圖像分類評價Tab.1 Kernel function evaluation for polynomial image classification

表2 核函數為線性的圖像分類評價Tab.2 Kernel function evaluation for linear image classification
通過以上各個核函數的分類結果評價分析可以看出,徑向基核函數的分類精度略高于多項式核函數、線性核函數和Sigmoid核函數的分類精度。

表3 核函數為徑向基的圖像分類評價Tab.3 kernel function evaluation for radial basis mage classification

表4 核函數為Sigmoid的圖像分類評價Tab.4 kernel function evaluation for Sigmoid image classification
本次對SVM在遙感影像上的圖像分類做了深入的研究,并在此基礎上編制了圖像分類軟件。通過實驗發現,利用SVM對影像進行分類,分類的精度比較高。
論文主要對SVM算法進行了深入的研究,并將SVM算法應用到圖像分類中并進行編程實現。且對支持向量機在圖像分類中的若干問題作了研究,通過實驗證明不同的核函數會產生不同的分類效果,針對傳統遙感圖像分類方法的缺點,在分析SVM分類方法的基礎上,對SVM算法表達式的核函數進行了分析,而且針對小樣本的學習,構建了基于支持向量機的圖像分類模型。根結實驗結果通過分類效果圖以及混淆矩陣和Kappa系數表明了采用支持向量機算法建立的模型有很高的分類精度,與最小距離法和最大似然法相比,是一種更加有效的遙感圖像分類方法。
[1]孫家檳.遙感原理與方法[M].武漢:武漢大學出版社,2003.
[2]袁金國.遙感圖像數字處理[M].北京:中國環境科學出版社,2006.
[3]Vapnik V N.The Nature of Statistical Learning Theory[M].New York Spring-Verlag,1995.
[4]Richards A.Remote sensing digital image analysis:an introduction[M].2nd ed.Berlin:Springer-Verlag,1993.
[5]楊昕,湯國安,鄧鳳東,呂恒.ERDAS遙感數字圖像處理實驗教程[M].北京:科學出版社,2009:113.