陳 超,赫春曉,石善球,周紹光
(1.江蘇省基礎地理信息中心,江蘇 南京 210013;2.江蘇省測繪研究所,江蘇 南京 210013;3.河海大學 地球科學與工程學院,江蘇 南京 210098)
一種基于決策樹方法的遙感影像分類研究
陳 超1,赫春曉2,石善球1,周紹光3
(1.江蘇省基礎地理信息中心,江蘇 南京 210013;2.江蘇省測繪研究所,江蘇 南京 210013;3.河海大學 地球科學與工程學院,江蘇 南京 210098)

以江蘇省泗陽縣的QuickBird影像為研究對象,基于影像的光譜信息、紋理信息、植被指數,采用CART決策樹對影像進行分類,并將結果與最大似然分類結果進行比較。結果表明,此方法分類精度與Kappa系數均得到提高。
影像分類;決策樹;植被指數;紋理特征
從遙感影像中識別各類地物是遙感領域的一項重要研究內容。傳統方法主要利用影像的光譜特征來進行分類,但這種方法會出現較多的錯分、漏分[1];神經網絡在影像分類中也取得了廣泛應用,但這種方法的網絡最優結構難以確定、收斂速度慢[2-3]。
決策樹算法是一種監督分類方法,該方法基于知識發現與數據挖掘,無需任何先驗條件、假設條件即可融合影像的各種知識生成分類規則,因而在遙感信息提取和影像分類中得到了廣泛的應用[4-7]。
本文以江蘇省泗陽縣的QuickBird全色和多光譜影像為實驗數據。對影像進行預處理后利用光譜信息、紋理信息以及植被指數構成待分類多波段數據;然后利用CART決策樹方法從選取的樣本數據中獲取分類規則,并完成分類;最后將本文方法與傳統的最大似然分類法進行比較,并進行精度評價。
使用的實驗數據包括全色和多光譜影像,預處理時首先利用GS方法融合影像,以提高多光譜影像的空間分辨率;然后對融合影像進行增強處理,這樣可以改善影像分類效果、提高可解譯性,使應用者更容易地從影像上獲取感興趣的信息。最后通過分析融合后的影像各波段直方圖,將影像各波段數據拉伸至5%~92%。處理前后圖像如圖1所示,圖片均為真彩色顯示。
實驗影像大小為2 900×5 200像元,全色影像分辨率為0.6 m,多光譜影像(四個波段依次為藍、綠、紅、近紅外)分辨率為2.4 m,融合前影像已經過嚴格配準。拉伸后影像色彩層次更為豐富,拉大了不同地物的差異,易于解譯。

圖1 影像預處理
決策樹是一種分類預測方法,通過生成一系列二叉決策將像元分類,每個新類通過二叉決策樹再次被分為兩類。依此類推,直到不再滿足分類規則為止。
Breiman[8]于1984年提出了決策樹構建算法CART,CART采用經濟學中的基尼系數作為測試變量的準則,通過循環分析樣本數據以獲取二叉樹形式的決策樹結構。

式中,p(j/h)指從樣本集中隨機抽取一個樣本時,測試變量值h屬于第j類的概率;nj(h)為樣本中測試變量值為h時屬于第j類的樣本個數;n(h)為訓練樣本中測試變量值為h的樣本個數;j指類別數。
CART算法從眾多輸入屬性中選擇一個或多個屬性作為分裂變量,將測試變量分給各分枝,重復該過程建立分類樹;對分類樹剪枝,得到一系列分類樹;最后用測試數據測試分類樹,從中選擇最優分類樹。
下面介紹利用CART決策樹對影像進行分類。
2.1 獲取待分類多波段影像
僅利用影像的光譜特征難以準確分類,本文結合影像的植被指數、紋理特征參與分類。植被指數是一個重要的遙感參數,廣泛應用于土地覆蓋、植被分類、農業研究等領域。本文利用NDVI:

式中,DNNIR、DNR分別表示近紅外、紅波段的灰度值。
紋理特征主要表現為影像中地物的形狀、方位、大小等,不同的地物一般具有不同的紋理特征。本文利用灰度共生矩陣獲取影像的均勻性、相異性兩個紋理測度,將獲取的植被指數、紋理特征與光譜信息相結合,得到待分類多波段影像。
利用ENVI軟件,分別計算圖1d的NDVI與紋理測度,結果影像見圖2。計算紋理測度時,移動窗口為3 × 3,移動步長為 1,移動方向為 0°。將圖2的影像與圖1d相結合,即獲得待分類多波段影像。新影像共有7個波段,依次為藍、綠、紅、近紅外、NDVI、均勻性測度、相異性測度。

圖2 NDVI與紋理測度影像
2.2 基于CART決策樹的影像分類
CART決策樹算法是一種監督分類算法,即用戶需先提供一個樣本集用于構建決策樹,隨后才能利用該決策樹對影像進行分類。通過影像分析,將影像分為水體、耕地、建筑物、林地、裸地5類。利用ENVI的RoI工具從新影像中分別選擇五種地物的樣本數據,構成樣本集,結合CART算法獲取決策樹。本文獲取的部分決策樹見圖3。

圖3 決策樹
利用圖3的決策樹為新影像分類,得到的分類結果見圖4a,最大似然法的分類結果見圖4b。將分類結果與影像作比較,可得出結論:①大部分分類結果與實際情況一致;②建筑物陰影區域被誤分為其他類別的問題較嚴重,如圖4a內橢圓標記處的建筑物陰影被分為了水體。

圖4 分類結果

表1 決策樹分類法混淆矩陣

表2 最大似然法混淆矩陣
2.3 精度評定
為客觀評價分類精度,結合衛星影像與航攝影像進行目視判讀, 為每種類別選取一定數目的評價樣本,分別為兩種分類結果建立混淆矩陣(表1、表2)。從表中可看出,決策樹分類法總分類精度、Kappa系數分別比最大似然法提高了6.089 2%、0.075 3。
本文利用CART決策樹方法完成了遙感影像的分類工作,并與傳統的最大似然分類方法進行比較,總分類精度與Kappa系數均得到提高,但建筑物陰影導致的誤分類現象較嚴重。后續工作將在預處理工作中加入陰影處理這一步驟,以進一步提高分類精度。
[1] 陳姝,居為民.遙感圖像分類及研究進展[J].河北農業科學,2009,13(1):143-146
[2] 王玲,龔健雅.基于RBF神經網絡的遙感影像分類算法研究[J].測繪工程,2009,12(3):7-9
[3] 徐磊,林劍,李艷華,等.基于BP人工神經網絡的遙感影像分類[J].地理空間信息,2012,10(4):83-85
[4] 趙萍,傅云飛,鄭劉根,等.基于分類回歸樹分析的遙感影像土地利用/覆被分類研究[J].遙感學報,2005,9 (6) :708-716
[5] 翁中銀,何政偉,于歡.基于決策樹分類的地表覆蓋遙感信息提取[J].地理空間信息,2012,10(2):110-112
[6] 昌小莉,董丞妍,羅明良,等.監督分類和決策樹方法提取欽州灣濕地的對比分析[J].中國農學通報,2014,30(32):295-300
[7] 張紅梅,吳基文,劉星,等,特征提取和決策樹法土地利用遙感分類[J].測繪科學,2014,39(10):53-56
[8] BREIMAN L, FRIEDMAN J H, oLSHEN R A, et al. Classification and Regression Trees [M ].Monterey, California, U. S. A.: Wadsworth International Group, 1984
P237
B
1672-4623(2016)08-0050-02
10.3969/j.issn.1672-4623.2016.08.017
陳超,碩士研究生,研究方向為數字圖像處理。
2015-01-26。
項目來源:國家自然科學基金資助項目(41271420);江蘇省測繪地理信息科研資助項目(JSCHKY201421)。