方 臣, 吳 龍, 胡 飛, 陳 曦, 劉燁青
(湖北省地質調查院,湖北 武漢 430034)
高分一號衛星(GF-1)于2013年4月26日在酒泉衛星發射中心由長征二號丁運載火箭成功發射,搭載了兩臺2 m分辨率全色/8 m分辨率多光譜相機、四臺16 m分辨率多光譜相機[1]。衛星工程突破了高空間分辨率、多光譜與高時間分辨率結合的光學遙感技術,多載荷圖像拼接融合技術,高精度高穩定度姿態控制技術,5—8年壽命高可靠衛星技術,高分辨率數據處理與應用等關鍵技術,對于推動中國衛星工程水平的提升,提高中國高分辨率數據自給率,具有重大戰略意義[2]。
土地是人類長期生存和發展的重要保障,對生態資源環境和人類社會經濟有著重要影響,西北地區生態環境比較脆弱,水土流失、荒漠化嚴重,在該地區開展土地覆被分類研究,為西北地區的社會經濟發展和生態環境建設提供有力幫助[3]。
紋理信息是地物特征空間信息在遙感影像中的表現形式[4]。紋理是不同地物宏觀結構和微觀結構的綜合表現,對解決“同物異譜”和“異物同譜”現象起到一定作用,目前利用不同地物的紋理信息進行圖像分類已經廣泛應用于高分辨率遙感衛星數據中[5]。
支持向量機在1979年由Vapnik首先提出,算法的基本思想是為了尋找分離兩種類別的數據集之間的超平面,然后通過機器學習在潛在高維空間中尋找最優分類邊界,實現最優分類[6]。SVM最初設計處理的訓練數據在輸入空間是線性可分的,而實際應用中數據樣本往往是非線性分布,這使得基本的線性決策邊界很難有較高的分離精度[7]。為此通過引入松弛變量(slack variables)的軟邊緣法(soft margin method)和核技巧(kernel trick)解決非線性條件下的最優分類問題[8]。相比神經網絡在小樣本訓練上存在過學習和局部極值化問題以及最大似然法對樣本空間分布形態的限制,SVM的優勢在于可以利用有限的訓練樣本,通過高維空間變換尋找最優分類面實現最好的分類效果[9]。目前,SVM在許多領域得到廣泛應用,在計算機領域應用于文本識別、人臉識別等,在城市方面主要應用于城市道路和橋梁信息提取[10]。
選取新疆喀什地區一處為實驗區,采用GF-1數據源,結合紋理信息采用SVM進行土地覆被分類,并與單源SVM法和最大似然法的分類精度進行對比分析。
研究區行政區劃上隸屬于新疆喀什地區葉城縣,主體為山體北東方向延伸,總體地勢西高東低,海拔高度在2 500~4 000 m,屬暖溫帶極干旱氣候區。研究區內土地覆被類型主要為草地、湖泊、灘涂、冰川、沼澤、裸地、營區用地等類型。
研究區采用的數據為2014年5月采集的GF-1數據,全色波段空間分辨率2 m,多光譜波段空間分辨率8 m。數據預處理主要為大氣校正、正射校正、圖像融合處理。最終處理成分辨率為2 m、包含4個波段的影像數據。
目前常用的提取紋理信息的方法主要有統計分析法、結構法、模型法和數學變換法[11]。其中統計分析法研究表明占主導地位。本文采用的就是基于統計分析法的灰度共生矩陣(Gray Level Co-occurrence Matrices,GLCM)來提取圖像的紋理信息[12]。GLCM是一種通過研究灰度的空間相關特性來描述紋理的方法,對圖像上保持某距離的兩像素分別具有某灰度的狀況進行統計得到,根據共生矩陣得到一些特征量,常用的特征量有ASM 能量(angular second moment)、對比度(contrast)、逆差矩(inverse different moment)、熵(entropy)、自相關(correlation)等[13]。在實際應用中根據研究目的選擇對應的紋理特征量才能達到最佳效果。通過研究本文選取了ASM 能量、對比度、熵3個特征量為圖像的紋理特征。
支持向量機最開始是研究兩類的線性分類問題,其基本思想可以由圖1得出,圖中實心點和空心點代表兩類樣本,H為分類線,H1、H2分別為過各類中離分類線最近的樣本且平行于分類線的直線,他們之間的距離叫做分類間隔(margin)[14]。而最優分類線就是要求分類線不但能將兩類正確分開,而且使分類間隔最大,過兩類樣本中離分類面最近的樣本且平行于最優分類面的超平面上H1,H2上的訓練樣本就叫做支持向量[15]。

圖1 線性可分情況下的最優分類線Fig.1 Optimal classification line under linear separable conditions


(1)
可以通過尋求上式的對偶問題來求解最小值,為此可以引入Lagrange函數:
(2)
其中,αi>0為Lagrange系數,下面對w和b求Lagrange函數的極小值[16]。
把上式中分別對w和b求偏微分并令它們等于0,就可以轉化成對αi求解最大值:
(3)


(4)
(5)
由此可以構造分化超平面(w*·x)+b*=0,得出分類決策函數[17]:
f(x)=sgn(g(x))
(6)
其中,
根據上述方法結合實際數據情況構建了基于紋理的SVM土地覆被分類模型。圖2為該模型的基本流程圖,具體操作流程主要包括:①對影像進行幾何校正、正射校正、大氣校正、融合處理等預處理操作。②對融合后的圖像進行主成分分析處理,對第一主成分圖像采用灰度共生矩陣的方法提取紋理信息,獲得ASM 能量、對比度、熵3種特征量。③將紋理特征量和融合后的圖像結合,對該圖像進行SVM分類,將分類結果與其他兩種方法進行對比分析。
利用ENVI、Matlab及LIBSVM軟件提取紋理特征和土地覆被分類工作,通過實驗將該區的土地覆被類型劃分為水體、灘涂、耕地、裸地、建筑用地、草地6種類型。為了驗證結合紋理信息的SVM分類法的效果,又分別采用單源SVM法和最大似然法對圖像進行土地覆被分類,將3種方法的分類結果進行對比分析。

圖4 分類結果Fig.4 Classification results

圖2 結合紋理信息的SVM分類流程Fig.2 Flow diagram of image SVM classification after adding the texture feature
在紋理信息提取中,需要考慮紋理窗口大小和窗口移動布長的影像因素,窗口過小會導致計算結果不準確,窗口過大會導致包含的內容復雜同樣也會影響計算結果,通過實驗對比分析,本文最終選擇5×5的像元窗口,移動步長為(1,1),結果顯示提取紋理效果明顯而且耗時比較短。圖3為提取的ASM 能量、對比度、熵3種紋理特征量圖,從圖中可以看出ASM能量的圖反映的是圖像灰度分布均勻程度和紋理粗細度,能量值小則灰度分布均勻,能量值大則凸顯紋理。對比度的圖反映某個像素值及其領域像素值的亮度的對比情況,對比度大的紋理溝紋深,視覺效果清晰,反之則相反。熵的圖是度量圖像所具有的信息量,熵值越大則圖像的紋理信息越豐富。
將紋理信息與SVM法結合進行土地覆被分類,影響SVM分類性能主要因素包括核函數參數γ的選取,懲罰因子C的設定,核函數的類型的選取對分類精度影響較小。選取的SVM核函數為徑向基核函數,利用LIBSVM的網格遍歷和交叉驗證的方法獲取模型參數γ =1.15,C=100,最終分類結果如圖4。
從分類結果圖中可以看出,結合紋理特征的SVM分類效果最佳,各個類別都能很好的區分出來,混分錯分現象比較少;單純的使用SVM分類的結果中,耕地和草地分類效果不佳,存在錯分現象,整體分類的圖像斑塊較多,出現混分現象。最大似然法的分類結果中,部分水體錯劃成耕地,同樣存在嚴重的錯分混分現象。

圖3 原始影像與紋理特征圖Fig.3 Original image and images of textural features
通過三種方式的監督分類方法對比,對分類結果進行混淆矩陣計算,統計各分類結果的總體精度和Kappa系數,見表1,通過對比分析,結合紋理的SVM分類法的的總體精度和Kappa系數均高于其他兩種方法。結果表明,結合紋理信息,可以更好的利用GF-1高分辨率圖像豐富的信息量來提高分類精度,SVM的分類精度高于最大似然法分類精度,也表明了SVM這種基于統計學習理論的分類算法在高分辨率圖像分類處理中具有優勢。
以國產高分一號圖像為數據源,利用灰度共生矩陣提取紋理信息,輔以紋理信息利用SVM分類算法對新疆喀什地區進行土地覆被分類,最終得出以下結論:

表1 總體精度和Kappa系數Table 1 The overall accuracy and Kappa coefficient
(1) 利用灰度共生矩陣獲取ASM 能量、對比度、熵3種紋理特征量,將這3種特征量結合高分一號圖像進行土地覆被分類,結果表明分類精度為93.74%,高于使用純SVM分類精度89.06%和最大似然法分類精度86.79%。說明紋理信息是高分辨率遙感圖像比較重要的特征信息,可以有效的提高土地覆被分類精度。
(2) 高分辨率遙感圖像相對于普通的多光譜數據包含更豐富的信息量,從分類精度和Kappa系數可以看出,SVM分類法優于最大似然分類法,說明SVM分類法在處理高分辨率遙感圖像具有優勢。