韓 嘯
(海軍92232部隊 北京 100036)
遙感影像分割是遙感影像解譯的基礎。分割精度將直接影響到地物目標的提取,最終影響遙感影像中地物目標的識別與影像解譯的精度[1]。傳統的遙感影像分割方法主要基于像元進行,更多地依賴影像的光譜特征,而容易忽視其紋理、形狀、上下文和結構等重要的空間特征,影響到分割效果。面向對象的遙感影像分割方法以影像對象(圖斑)為基本處理單元,綜合考慮對象的光譜、幾何和紋理等空間分布特征[2],從而提高遙感影像的分割精度。與基于像素的遙感影像分割方法相比,面向對象的分割方法不僅可以在結果上消除椒鹽噪聲,還可以充分利用對象的各種地理空間特征(形狀、方向和空間分布特征等)用于信息提取。雖然現有的面向對象的分割方法已經很多,但由于遙感影像中地物的多樣性、各類別地物特征的不確定性和影像分割方法的問題[3],如何對遙感影像進行更加精確的分割依然是遙感影像處理領域中研究難題之一。
近年來,多尺度遙感影像分割技術已經逐步成為遙感領域的研究熱點之,有關多尺度的遙感影像分割方法(MRS)[4~5]已經被廣泛研究并應用于超高分辨率多尺度分割以及影像分析領域。其主要原因在于:客觀世界中,實體、模式與過程表現出固有的等級和層次結構,而遙感影像作為自然地物或現象的客觀映像,在反映空間分布格局與作用過程時也會表現出尺度依賴性。由于不同的地物目標也會具有不同的本征尺度[6],因而在不同層次和尺度下分析和解譯的結果往往有較大的差異[7]。如果按照單一尺度去分割以及解譯分析不同的地物類型,分割結果中不可避免的也會出現大量的欠分割或者過分割現象;對象的幾何形態和空間關系得不到準確有效的表達,這樣就背離了影像分析用來解決影像語義問題的初衷[4]。
eCognition[4]軟件提供的多尺度分割是多尺度影像分割的典型代表。其中,多尺度分割參數僅僅包括尺度參數和形狀參數,因此eCognition在分割過程中并不考慮地物的紋理特征。此外,用戶在每次分割過程中,都需要設置尺度參數和形狀參數來分割影像。因此,如果想要使用eCognition軟件生成令人滿意的結果,需要多次參數設置嘗試,最終選擇出合適的分割尺度。
基于圖論的分割算法是近年來國際上比較熱門的圖像分割方法[8]。基于圖論的多尺度分割方法的主要思想是把影像映射為圖,通過不同的策略來實現圖劃分,從而達到影像分割目的,輸出多尺度分割層。為了解決上述eCognition多尺度分割中存在的局限性,本研究中使用SWA算法[9]來解決遙感遙感影像中的多尺度問題,提高遙感影像分割的自動化水平和精度,對于后續的多尺度研究具有非常重要的意義[10]。SWA算法最開始用于處理自然影像,本研究中將其引入改進用于高分辨率遙感影像的分割。
SWA是一種有效的多尺度影像分割算法。圖1為SWA算法的流程圖,其主要分為三個步驟:構建圖、粗化圖、輸出結果。
SWA算法首先基于原始影像構建一個四鄰域圖G=(V,E,W),每個頂點vi∈V代表一個像素,每條邊eij∈E連接相鄰的兩個像素。邊權wij表示該邊所連接的兩個像素的光譜差異,其衡量方法如式(1)所示,其中 Ii和Ij代表相鄰像素i和 j的光譜值,α為參數。


圖1 SWA算法流程圖
構建圖完成后,接下來需要通過粗化圖構建完整的金字塔模型。SWA算法中采用代數多重網格(Algebraic Multigrid,AMG)[12]來完成粗化圖過程。
粗化圖G[s]=(V[s],E[s], W[s]),由頂點、邊和邊權三部分構成,每次粗化過程都需要更新這三個組分。粗化圖過程可以概括為以下三個步驟:1)選擇種子結點;2)構建轉換關系,包括頂點轉換關系和邊權轉換關系;3)計算多尺度特征(包括光譜、形狀以及紋理等多維特征),優化邊權度量。通過這三個步驟,如圖2所示,便可以構建s-1層到s層的頂點、邊和邊權的映射關系,生成一個完整的金字塔粗化圖。在此步驟中,最重要的是構建每層之間的轉換關系,計算新建粗化圖的邊權。

圖2 粗化圖過程示意圖
對于粗化圖G[s]來說,邊權可以W[s]可以通過s-1層的邊權 W[s-1]和插值矩陣 P[s-1,s]計算得到[11],計算方式如式(2)所示。其中,δkl是克羅內克函數,即公式中的第二部分僅影響聚類內部權重的累積。當且僅當k≠l且≠0時,存在邊由公式可知,W[s]在W[s-1]的基礎上由插值矩陣計算得到,繼承了W[s-1]的特性,這個過程稱為加權聚合。

生成粗化圖后,粗化圖中的每個結點都代表一個聚類。每個聚類 S={s1,s2,…,sm}?V 是像元集合,對應著原始影像中的若干像元。每個聚類S都有一個與其對應的狀態向量u={u1,u2,…,un}(n=||V||),狀態向量的元素值代表了原始影像中的每個像元是否屬于這個聚類,其中:

通過對于任何一個顯著的聚類S給定一個u[s],則狀態向量u[s-1]可以由式(4)得到。因此,在SWA分割過程當中,并不需要實時存儲聚類類別中對應的像元集合。根據插值矩陣和聚類S給定的u[s],便可以計算得到相應的u[1],最終得到相應的聚類結果,輸出每個金字塔層的分割結果。

實驗數據如圖3所示,影像數據來源于World?View-2,分辨率2m,影像大小為662*528,未做融合處理。實驗區域位于北京市海淀區,覆蓋五道口商業區以及清華北大部分校園。該區域中包含大量的人造地物,包括各類建筑物(包括商業建筑、學生宿舍、教學樓、居民住宅以及棚戶等等)和道路。同時校園內也包含一些自然地物,例如植被和水體等等。

圖3 城市實驗區域圖
SWA算法利用影像光譜、形狀和紋理特征進行影像分割,生成若干個影像分割尺度層。根據每幅影像中存在的地物類別差異,SWA算法可以“因像制宜”,引導分割過程,最終在分割結果收斂時結束,輸出分割結果。對于不同影像,SWA算法生成的分割尺度層數目并不完全相同,實驗中把分割層上限設置為20。
首先,對于城市實驗區域數據(圖3),使用SWA算法生成12個分割尺度層(圖4)。從圖中可以看到,SWA算法綜合使用影像光譜、形狀和紋理特征完成影像分割,生成一系列尺度分割結果(稱之為尺度分割結果集),覆蓋了影像從過分割到欠分割的所有尺度分割結果,而無需人工為每個尺度層設置任何分割參數。在尺度分割結果集中,Lev?el 1~Level 4層的分割結果存在非常明顯的過分割,而Level 10~Level 12的分割結果則出現非常明顯的欠分割。對于城市實驗區域的地物來說,其最優分割尺度則主要集中在Level 5~Level 9上。表1給出了尺度分割結果集的基本統計信息,定量而直觀地顯示了SWA分割結果。


圖4 城市實驗區SWA分割結果
表1中給出了尺度分割結果集中每個分割結果層的對象數目和對象的平均面積統計結果。從表中可以看到,隨著分割層次的變大,后一層次對象數目逐漸減少為前一層的一半左右(Level 9~Level 12除外,分割層正在逐漸收斂,對象數目變化不再顯著)。這種變化規律實際上和SWA算法有關。分割結果中的對象實際上對應著SWA算法中的粗結點,SWA算法在分割過程中逐層選取一定的粗結點,而這些粗結點數目則大概為前層結點的1/2左右。隨著參與分割的粗結點數目越來越少,分割過程也越來越快。事實上,改進后的SWA算法的效率已經得到大幅提高,處理城市實驗區數據(圖3,662*528像素)僅僅只需11.31s的時間,這對于處理海量的遙感數據具有非常重要的意義。
本文使用SWA分割方法,實現了遙感影像的多尺度分割,自動分割生成多個尺度層結果,方便之后的模式識別和影像分析工作。SWA分割方法具有如下優勢:

表1 城市實驗區SWA分割結果統計信息
1)自動生成分割結果
多尺度分割方法(如eCognition軟件提供的分割算法)生成多尺度層時,需要人工確定分割參數來獲得較優的分割結果,因而分割過程依賴操作人員的經驗和認知。SWA算法分割影像時根據影像局部特點,構建金字塔層結構,自動生成多尺度層,很大程度上減少了人為依賴和主觀參與。
2)充分利用紋理信息
eCognition軟件提供的多尺度方法中僅僅只使用光譜和形狀特征來分割遙感影像,并不考慮地物的紋理特征。而SWA分割方法充分利用光譜、形狀以及紋理特征來分割遙感影像,對于紋理特征豐富的遙感影像分割具有顯著優勢。
3)雙向調節優勢
SWA分割方法是一個雙向分割過程。基于高尺度層分割結果計算大尺度特征,逆向調節低尺度層的分割結果;修正后的低尺度層分割結果再次生成高尺度層的分割結果。在這樣一個持續以及敏捷的雙向的“反饋-調整”機制中,SWA分割過程中可以有效利用大尺度特征來輔助分割,不斷修正以及調整原先的分割結果,提高影像分割精度。
4)較高的時間效率
SWA分割方法具有較高的時間效率,對于處理海量的遙感數據具有重要的意義。
[1]王培法,王麗,馮學智,等.遙感圖像道路信息提取方法研究進展[J].遙感技術與應用,2009(3):284-290.
[2]賀洪元.面向對象高分辨率影像多尺度分割[D].武漢:華中科技大學,2013.
[3]Jingxiong Zhang,Jinping Zhang,Na Yao.Uncertainty characterization in remotely sensed land cover information[J]. 地球空間信息科學學報:英文版,2009,12(3):165-171.
[4]Baatz M,Sch?pe A.Multiresolution segmentation:an opti?mization approach for high quality multi-scale image seg?mentation[J].Angewandte Geographische Informations?verarbeitung XII,2000,58:12-23.
[5]Benz UC,Hofmann P,Willhauck G,et al.Multi-resolu?tion,object-oriented fuzzy analysis of remote sensing data for GIS-ready information[J].ISPRS Journal of photo?grammetry and remote sensing,2004,58(3):239-258.
[6]Schneider D C.Scaling Theory:Application to Marine Or?nithology[J].Ecosystems,2002,5(8):736-748.
[7]Addink E A,de Jong SM,Pebesma E J.The importance of scale in object-based mapping of vegetation parameters with hyperspectral imagery[J].Photogrammetric Engi?neering&Remote Sensing,2007,73(8):905-912.
[8]田野.面向對象的遙感影像多尺度自適應分割技術[D].上海:上海交通大學,2009.
[9]Sharon E,Galun M,Sharon D,et al.Hierarchy and adap?tivity in segmenting visual scenes[J].Nature,2006,442(7104):810-813.
[10]Zhang X,Du S.Learning selfhood scales for urban land cover mapping with very-high-resolution satellite images[J].Remote Sensingof Environment,2016,178:172-190.
[11]Sharon E,Brandt A,Basri R.Fast multiscale image seg?mentation[C]//Proc of IEEE Conf on Computer Vision and Pattern Recvsnition,2000:40-77.
[12]Terzopoulos D.Image analysis using multigrid relaxation methods[J].IEEE Transactions on Pattern Analysis and Machine Intelligence,1986(2):129-139.