翟亮,張曉賀,桑會勇,王曉軍,賈毅
(中國測繪科學研究院 地理國情監測研究中心,北京 100830)
為全面掌握我國地理國情現狀,滿足經濟社會發展和生態文明建設的需要,國務院決定于2013年至2015年開展第一次全國地理國情普查工作(國發[2013]9號)。地表覆蓋遙感影像分類是全國第一次地理國情普查的重要工作內容之一,科學準確地測定地表覆蓋的空間分布與動態變化,對于全面獲取地理國情信息,掌握地表自然、生態和人類活動基本情況,以及研究地球系統的能量平衡、碳循環及其他生物地球化學循環、氣候變化等具有十分重要的意義[1-2]。遙感影像分類技術是獲取地表覆蓋數據的主要方法之一。根據分類對象的不同,目前常用的遙感影像分類方法可以分為基于像元和面向對象兩種。其中,基于像元的分類方法作為傳統的分類方法被廣泛應用于中低分辨率的遙感影像分類中,常見的方法有最小距離法、平行六面法、最大似然法和ISODATA、K-Means、模糊聚類方法、神經網絡法、決策樹、支持向量機(SVM)等。隨著圖像空間分辨率的提高,同類地物內部光譜差異逐漸增大,基于像元的分類技術已經不能滿足當前遙感圖像信息提取的要求,成為制約高分辨率遙感影像實際應用的瓶頸,而面向對象分類方法的出現為高分辨率遙感影像信息提取提供了新的思路和方法。
目前決策樹算法已經被廣泛應用于遙感影像分類中[3-6],GLC樹分類器一種組合決策樹分類器,該分類器對C4.5算法進行了改進,并集成了AdaBoost推進技術。在全球地表覆蓋遙感分類——大洋洲地表覆蓋分類工作中,GLC樹被成功應用于Landsat衛星影像(2000年和2010年2期共796景)分類中,并取得了良好的應用效果,其分類精度平均達到85%以上。本文將其應用于 WorldView-2影像面向對象分類技術試驗中,通過對不同地區的分類實驗證明:利用GLC樹進行高分辨率遙感影像分類不僅可以獲得較高的精度,而且適用于多種地物類別的提取。
WorldView-2衛星影像是第一次地理國情普查的主要遙感數據源。WorldView-2衛星于2009年10月由美國Digital Global公司發射,可提供0.46m的全色影像和8個波段(包括海岸帶波段、藍色、綠色、紅色、黃色、紅邊波段及兩個近紅外波段)的2m多光譜影像,與其他影像相比,WorldView-2的空間分辨率更高,多光譜波段更豐富,為用戶提供進行精確變化檢測和制圖的能力。不同的波段能從不同方面反映地物的特性,可用于地物的分類和解譯。第一次地理國情普查項目中主要利用了藍、綠、紅、近紅外4個波段的數據開展地表覆蓋分類。
WorldView-2衛星影像屬于高分辨率遙感影像,傳統的基于像元分類方法會導致椒鹽效應,所以本文采用了面向對象的分類思想,首先由對WorldView-2影像進行影像分割生成同質圖斑,選擇并提取可用于分類的特征;然后選取樣本,利用GLC分類器對生成的圖斑進行分類。在樣本采集之后,可以通過交叉驗證的方式來檢測樣本的質量。具體流程如圖1所示。

圖1 自動分類技術流程
影像分割是面向對象遙感影像分類的基礎,分割結果的好壞直接影響最終分類效果。常用的分割算法有基于邊緣的影像分割、標記分水嶺影像分割、分型網絡演化影像分割等。其中,分形網絡演化算法被目前流行的面向對象解譯軟件所采用,并取得較好的分割效果。該算法采用了異質性標準尺度,其計算公式如下:

影像異質性f是由4個變量計算而得:wcolor(光譜信息權重)、1-wcolor(形狀信息權重)、hcolor(光譜異質性值)、hshape(形狀異質性值)。wcolor取值為0~1之間,為用戶定義。
在利用分形網絡演化算法進行影像分割時,需要確定分割尺度參數,即生成的影像對象最大允許的異質性。通過修改尺度參數,可以改變結果中的影像對象尺寸,高的尺度參數產生的影像對象大,低的尺度參數產生的影像對象小。在滿足必要的精細的條件下盡可能使用大尺度。
在面向對象遙感影像分類中,常用的特征可以分為光譜、形狀及紋理特征等。具體見下表。

表1 常用遙感影像特征
《地理國情普查內容與指標》中規定地理國情信息分為12個一級類,49個二級類,86個三級類。一級類有:耕地、園地、林地、草地、房屋建筑區(群)、道路、建筑物、人工堆掘地、裸露地表、水體、地理單元及界限、地形。在利用WorldView-2進行地表覆蓋分類時要注意靈活使用《地理國情普查內容與指標》中規定的地表覆蓋分類體系。例如,同一景影像中可能同時存在已經長出莊稼的耕地和未長莊稼的耕地,兩者的光譜信息會有較大差異,因此在采集樣本過程中可自定義類別,如將耕地再分為耕地和休耕地或者先將園地、林地歸為一類與其他地類進行粗分類,然后再逐級細分,這樣可以有效提高最終分類精度。
此外,在利用GLC分類器執行影像分類時,樣本采集的過程中有以下幾點建議:
①樣本的質量直接決定了分類結果精度,盡量由影像判讀經驗豐富的技術人員選擇樣本;
②對于一景影像,樣本總數要保證一定的數量,其中每個類別樣本數不少于5個;
③某些地表覆蓋類別的提取精度與采樣時其樣本個數成正比;
④不要在類別不易判斷的地域采集樣本,樣本最好選在確定類別地域的中間;
⑤選取的樣本不要過于集中在一個區域,最好是均勻分布。
在本文中,由于條件限制,訓練樣本和檢驗樣本均采用“隨機生成點,目視判斷類別”的方式獲取。
GLC樹分類器是一種決策樹分類器,采用了改進后的AdaTree算法,在C4.5算法的基礎上修改其多叉樹結構為二叉樹,并加入了AdaBoost算法用于提高分類精度。通過GLC分類器完成對分割結果的自動分類需要經過生成訓練集、生成規則集、執行分類三個步驟。GLC樹分類器具有如下主要特點:
①提供了一種基于采樣樣本直接生成規則集的影像分類解決方案;
②分類規則可自動生成,并可根據閾值設置進行規則自動調整,不僅提高了工作效率,而且避免了人工建立復雜規則集,保障了規則的客觀性和準確性;
③可以面向像元或面向對象,對影像或影像分割結果進行自動分類。
GLC樹分類器生成的單條規則表現形式為:

其中,count表示判斷條件的個數,cover表示該條規則覆蓋的樣本數目,correct表示預測正確的樣本個數,pre表示該條規則的預測權重,class表示類別代號,att和cut分別表示判斷屬性和相應閾值。

圖2 GLC樹分類器自動分類流程
為了檢驗本文方法的有效性,分別采用了陜西臨潼、杭州、東北三個地區的 WorldView-2影像作為實驗數據進行了分類實驗,為了驗證本文采用的GLC樹分類器的優越性,實驗同時采用了SVM算法作為分類器利用同一樣本進行了分類。
(1)陜西臨潼
該地區為農村,影像為7月份數據,圖幅大小4096×4096,分辨率全色0.5m,多波段2m,主要以植被為主。根據地理國情普查要求和影像實際情況,設定解譯標志為:人造覆蓋(包括房屋建筑區、道路、建筑物、人工堆掘地)、耕地、休耕地、水體、耕地、草地、裸地,分割尺度100。訓練樣本368個,檢驗樣本201個。分類結果與原始影像局部對比如圖3,精度評價結果如表4所示。
(2)杭州

圖3 陜西臨潼地區分類結果
該地區影像為WorldView-2 7月份數據,圖幅大小2454×2750,分辨率全色0.5m,多波段2m,主要為城區。根據地理國情普查要求和影像實際情況,設定解譯標志為:樓房、道路、綠地(包括園地、林地、草地)、水體、裸地,分割尺度150。訓練樣本406個,檢驗樣本206個。分類結果與原始影像局部對比如圖4,精度評價結果如表4所示。
(3)東北某地區
該地區影像為 WorldView-2 7月份數據,圖幅大小3836×3561,分辨率全色0.5m,多波段2m,為城鄉結合部。根據地理國情普查要求和影像實際情況,設定解譯標志為:耕地、園\林地(包括園地和林地)、草地、房屋建筑、道路、裸地、水體,分割尺度200。訓練樣本325個,檢驗樣本286個。分類結果與原始影像局部對比如圖5,精度評價結果如表4所示。

圖4 杭州地區分類結果

圖5 東北某地區分類結果

表4 實驗精度評價
上述3個實驗區中,實驗1影像中地物相對比較容易區分,地物類別比較簡單,實驗2影像中地物類別雖然比較簡單,但是不易區分,尤其是高樓陰影的存在對道路和水體的提取都有一定的影像;實驗3影像中地物類別復雜度和區分難度適中。
通過上述對3個不同地區的分類結果分析,可以發現:在影像分割結果的基礎上,對于地物類別容易區分的地區,GLC樹和SVM都可以取得較高的分類精度,但在地物類別較難區分的地區,尤其是城市,兩種分類器的分類精度有所降低。但是從整體結果上講,GLC樹分類器提供了較高的分類精度,在相同影像分割、特征和樣本的基礎上,與SVM分類器相比,GLC具有更高的分類精度。同時,由于GLC樹分類器中用到了AdaBoost提升算法來提高分類精度,每次提升都需要利用隨機函數按照新的權重選取不同樣本,所以每次執行GLC樹分類結果都會有差異,但這種差異很小,不影響地理國情普查生產作業。目前,GLC樹分類器已經集成到地理國情普查生產作業平臺——地理國情要素提取與解譯系統(FeatureStation_GeoEx)。
本文通對 WorldView-2影像數據和面向對象遙感影像地表覆蓋分類方法的研究,提出了地理國情普查中WorldView-2影像地表覆蓋自動分類技術流程,首先利用分形網絡演化算法獲得分割結果并進行特征選擇與提取,然后選擇訓練樣本采用GLC樹分類器對分割結果進行自動分類。實驗分別選取了3幅不同地區、地物類型不同的WorldView-2影像進行分類,現有分類結果證明,利用GLC樹分類器進行高分辨率遙感影像地表覆蓋分類可以獲得較高的分類精度,其平均Kappa系數達到85.61%。今后,為了提高工作效率,將圍繞利用GLC樹分類器建立地表覆蓋分類規則庫進行研究。
[1]陳軍,陳晉,宮鵬,等.全球地表覆蓋高分辨率遙感制圖[J].地理信息世界,2011,2:12-14.
[2]李曉兵,陳云浩,喻鋒.基于遙感數據的全球及區域土地覆蓋制圖—現狀、戰略和趨勢[J].地球科學進展,2004,19(1):71-80.
[3]JOY S M,REICH R M,REYNOLDS R T.A non-parametric supervised classification of vegetation types on the kaibab national forest using decision trees[J].International Journal of Remote Sensing,2003,24(9):1835-1852.
[4]FRANKLIN S E,STENHOUSE G B,HANSEN M J,et al.An integrated decision tree approach (IDTA)to mapping landcover using satellite remote sensing in support of grizzly bear habitat analysis in the alberta yellowhead ecosystem.[J].Canadian Journal of Remote Sensing,2001,27(6):579-592.
[5]SIMARD M,SAATCHI S S,DE GRANDI G.The use of decision tree and multiscale texture for classification of JERS-1 SAR data over tropical forest[J].IEEE Transactions on Geoscience and Remote Sensing,2000,38(5):2310-2321.
[6]溫興平,胡光道,楊曉峰.基于C5.0決策樹分類算法的ETM+影像信息提取[J].地理與地理信息科學,2007,23(6):26-29.