吳田軍,駱劍承,沈占鋒,張新,邵明文
(1.長安大學 理學院,西安 710064;2.中國科學院空天信息創新研究院 遙感科學國家重點實驗室,北京 100101;3.中國科學院大學,北京 100049;4.中國石油大學(華東)計算機科學與技術學院,山東 青島 266580)
在高空間分辨率(以下簡稱“高分”)遙感影像發展歷程中,面向對象的分析思想對分類、變化檢測、目標識別等信息提取任務的精度提升起到了開拓性、引領性的作用[1-2]。作為面向對象分析的前提和基礎,影像分割是實現對象化信息提取的關鍵步驟,將直接關系到地物信息提取的精度和效率[3-5]。因此,隨著近年來高分對地觀測技術的普遍應用以及各行各業對基礎地理信息獲取精度要求的提高,遙感影像分割技術在面向對象分析領域受到越來越多的關注。
遙感影像的分割其實是將一幅遙感圖像劃分成若干互不交疊的區域(對象),以保證每個區域的像素在一定尺度下具有光譜、紋理等特征的高度同質性(即較小的異質性),從而在空間上分離和表示地物目標[6]。在傳統的圖像處理領域,較為經典的方法是邊緣檢測法和區域分割法。前者是基于不同區域間像元灰度不連續的特點,利用Roberts、Prewitt、Sobel、Laplace、LOG、Canny等算子檢測出區域間的顯著邊緣,以實現影像的對象化切分;后者則是將具有相似性的像元聚合起來構成斑塊,實現的主要方法有閾值法、聚類法、區域生長與合并法等[7]。
與一般圖像相比,遙感影像具有多尺度、多波段、寬覆蓋以及地物類型多樣等特點。其在使用常規的圖像分割方法時,存在兩個方面的典型問題:一是沒有充分利用遙感影像所體現出來的地物多源特征,仍主要依靠圖像的光譜信息進行分割,導致不能有效地融合地物多維特征信息;二是沒有充分考慮遙感影像的地物尺度特性,過分割、欠分割現象較為普遍,導致分割對象的邊界誤差被過多地傳遞到后續的分類、目標識別、變化檢測等任務中,阻礙了面向對象分析方法的推廣應用。
針對這些問題,學者們陸續開展了一些探索,取得了一些研究進展,但總體來看仍存在以下三個方面的問題:首先,單景遙感影像的數據量越來越大,需要同時處理的數據規模已嚴重影響分割效率;其次,影像空間分辨率已發展至米級/亞米級水平,清晰程度的提高勢必對地物分割邊界的精細程度提出了更高要求;最后,尺度對于正確認知地表具有重要意義,但現有分割算法采納的尺度參數以及尺度間的選擇與轉換機制仍無法達到與地物匹配的程度。因此,在這些困境之下,我們有必要面向實際應用的需求進一步發展遙感影像的分割算法,以提高對象級信息提取的精度[8]。
從方法層面來看,在近年來實施的高分遙感影像分割任務中,基于區域生長與合并的分割方法更受重視,相關研究不斷涌現。該類方法是在指定尺度下,從單個像元大小的區域開始,采用相鄰影像區域兩兩合并增長的方式,實現對目標影像上的同質對象的提取。相比其他方法而言,區域生長與合并的分割實現過程更易于與尺度問題相結合,能夠通過在算法中制定一定的合并規則將影像劃分為不同尺度下的小區域(即對象或基元),進而可建立不同尺度間對象的空間關聯與轉換關系[9]。鑒于此,本文聚焦區域生長與合并方法體系中一種快速、穩健的分割算法——均值漂移(mean shift),在其傳統的算法實現基礎上,針對遙感數據特性進行優化改造,以滿足高分遙感影像面向對象分析對邊界精細刻畫的要求,為后續的對象表達與分析奠定基礎。
考慮到影像分割算法輸入的尺度參數與待分割影像中的地物類型以及影像自身的空間分辨率密切相關,因此有必要結合影像空間區域內不同的地物類別進行分割尺度參數的多樣化設置與自適應選擇。源于該想法,本文將傳統的均值漂移分割流程進行改進,提出一種先驗知識引導下的多尺度分割方法,期望在先期解譯獲得的土地覆蓋/利用圖蘊含的地物空間分布信息助力下,實現目標影像的多尺度分割。核心思想是利用先期解譯的土地覆蓋/利用圖斑邊界與土地覆蓋/利用類別等先驗知識的指引,設計出一套基于均值漂移的多尺度分割實現策略,期望改進的均值漂移多尺度算法在對象分割方面能優于傳統的單尺度算法,可以更好地實現從柵格化影像空間到矢量化地理空間的轉換過程,助益于后續的對象分類等信息提取任務。
均值漂移最早是針對傳統自然圖像提出的一種在特征空間中實現統計迭代聚類的算法,其原理簡單、效率高,因而被廣泛應用于平滑、分割、目標跟蹤等圖像處理任務中。該方法的關鍵步驟是依靠特征空間中的訓練樣本點進行非參數的密度函數估計[10]。在此基礎上,密度函數梯度估計可由密度函數估計的梯度求得。因此,均值漂移算法具有較好的收斂性,漂移方向總是能指向局部密度極大值點,故而是一種自適應快速上升算法,可以通過計算找到最大的局部密度,并向其位置“漂移”[11]。
在實際應用中,為了減少計算復雜性,往往會設置樣本點為等權重,并將帶寬矩陣統一選擇為單位矩陣的比例陣。另外,為了增加收斂路徑的平滑性常采用高斯核函數,此時只需指定一個大于零的帶寬h確定核函數即可,由此實現通過數據點向樣本均值移動的迭代過程。綜合來看,均值漂移算法對于不同結構的數據均具有較好的適應性與穩健性,更詳細原理可參見文獻[12]。
近年來,均值漂移算法作為一類區域生長與合并方法被廣泛應用于各領域的圖像分割任務中,特別是被成功用于高分遙感影像的對象化提取[13-14]。概括來說,均值漂移的圖像分割流程包含“濾波”(filtering)和“合并”(merging)兩個步驟,圖1表示了其基本過程,大致包括以下步驟[15-16]:首先,在確定算法核函數以及光譜域帶寬hs、空間域帶寬hr后進行均值漂移算法實施的主體部分,即基于“空間-光譜”域的均值濾波過程;通過均值漂移濾波過程實現影像的初始濾波和像素聚類,從而形成若干個不可再分的碎小斑塊區域(像斑),以此作為后續尺度合并的基礎;其次,通過設置最小區域合并尺度參數M實現基于濾波結果的區域合并,即將像元數小于M的斑塊合并到其相鄰的最相似斑塊中,從而完成像斑的合并過程;最后,通過區域標記和矢量化技術提取多邊形作為對象邊界,完成整個影像的分割過程。

圖1 遙感影像均值漂移分割流程圖
在前期的研究工作中,本文在剖析了均值漂移分割算法filtering和merging兩大關鍵步驟后,對其算法原理開發的開源代碼(edge detection and image segmentation system[17])進行了改造,以使其能更好地適應波段數大于3的多光譜高分遙感影像,并保證在較好抑制遙感影像噪聲的同時,最大限度上保留邊緣等結構特征。此外,本文還發展了基于均值漂移的分區分塊并行分割策略,以適應單幅/拼接的大規模高分影像數據量大的問題[18]。在這些工作基礎上,經過前期的探索和實踐,我們意識到,目前的單尺度均值漂移分割方法存在較大的弊端,亟需對其進行多尺度的實現設計,寄希望通過參數的多元化選擇來生成更符合地物語義表達的對象。
對地表過程的觀察與測量依賴于觀測的尺度。在一個空間尺度上是同質的、各向同性的現象,到另一個空間尺度就可能是異質的、各向異性的,因此尺度選擇與轉換機制是地學研究的關鍵問題[19]。類似地,對于遙感影像信息提取而言,尺度的選擇也會影響結果的精細化程度。因此如何根據不同的成像條件、任務目標、環境影響因素,選擇合適的尺度進行遙感信息提取,已成為目前面向對象分析奏效與否的重要因素。
在本文重點關注的遙感影像分割任務中,尺度選擇問題同樣是影響分割質量的關鍵因素。首先,基于地物的空間分異規律以及交錯分布,不同地物往往具有不同的空間表達尺度,即便同一種地物在不同的尺度上也有著不同的特征[20],因此在遙感影像大范圍宏觀的對地觀測視角下,多尺度是地物的基本特性,但多數分割方法仍是基于單個尺度實現的,很難應對帶有較高地物復雜性的遙感影像分割任務。鑒于尺度參數對分割結果的重要影響,不少學者也提出了一些自適應的多尺度選擇算法[21-22],其中多數方案是基于自底向上的區域合并方法產生的。較為典型的是eCognition軟件所采用的多分辨率分割方法(multi-resolution segmentation),其通過調整一個與分割結果——影像對象大小密切相關的尺度參數實現對影像的多尺度分割。然而,盡管這些算法取得了一定研究進展,但仍沒有建立起遙感影像多尺度分割的統一標準,局限性體現在兩個方面。一是未建立尺度自動選擇和遞進關系的轉換機制,影像分割中“尺度參數”的設置沒有直觀地連接到一個具體的、有關聯的地物目標框架下,“適宜”的尺度參數選擇一直沒有最佳定論。二是影像對象的建立受分割方法的影響較大,不同尺度下得到的結果大相徑庭,對地物的貼合程度差異較大,欠分割和過分割現象的矛盾一直未能有效規避,需要針對不同的地物差異化地選擇與其特征相適應的尺度參數,才能有望得到貼合地表空間表達的分割對象。上述兩個方面的局限性說明,遙感影像的多尺度分割方法值得進一步深入研究和發展。
對于遙感影像分割算法而言,輸入的尺度參數應與待分割影像中的地物類型(土地覆蓋/利用類型)、影像自身分辨率大小密切相關,因此有必要結合影像區域內不同地物類別進行參數的多元化設置與選擇。然而,傳統的分割算法通常只在某一指定的尺度下實現基于影像數據的對象構建,并未考慮影像上不同地物對分割尺度的適應性差異問題。因此,在知識驅動的遙感信息提取架構下,如何將已有的先驗知識融入到分割過程,使尺度參數的設置與選擇更加合理,算法執行效率和精度得到提升,這是本文關注研究的問題。
進一步來說,既往的分割方法一般以單一的影像作為輸入,不尋求建立“待分割對象”與“該空間上的已有認知(如先期土地覆蓋/利用圖的圖斑邊界與地物類別)”兩者之間的對應關系。事實上,作為一類重要的先驗知識,前期解譯的土地覆蓋/利用圖蘊含了大量的地物空間分布和類別屬性信息,可以輔助后續目標影像的智能化處理[23-25]。例如,在過往解譯的土地覆蓋/利用圖中,圖斑邊界表示了從土地覆蓋/利用角度描述的完整、均質地塊,其類別屬性指示了地塊內部占主導地位的土地歸屬類型,而且這些信息在短期內具有相對穩定性,因此依據其提供的先驗認知來指導差異化的尺度參數選擇,有望獲得更好分割結果。另外,參照圖1的實現過程,只需設定多個不同的最小區域合并尺度參數M,即可便捷地實現基于均值濾波的多尺度合并過程,從而達到多尺度分割的目的。鑒于以上分析,本文考慮在目標影像的分割過程中引入先期解譯的土地覆蓋/利用圖,將傳統均值漂移分割流程進行改進,引入先期解譯圖的圖斑邊界和類別屬性等先驗知識,為均值濾波得到的像斑選擇不同的最小區域合并尺度參數M,以實現差異化的像斑合并,繼而達成多尺度分割并改善對象提取精度的目的。
依據上述設計思想,對傳統均值漂移分割流程進行改造,得到了圖2所示的多尺度分割步驟。

圖2 先驗知識引導下的遙感影像均值漂移多尺度分割方法實現流程
具體說明如下:首先,構建特征空間,依據高分遙感影像的空間分辨率和光譜分辨率確定核函數及其帶寬參數h=(hs,hr);設置待識別區域的目標地物類別體系C={C1,C2,…,Cm},并對各地類設定最小區域合并尺度參數Mi(i=1,…,m),由此構建尺度參數集;其次,將已有的土地覆蓋/利用圖實施類別合并和矢量柵格化操作,獲得與目標類別體系一致的地類柵格數據;隨后,依據核帶寬參數對待分割的影像實施基于空間域和光譜域的均值濾波,獲得大量細碎的像斑用于后續的區域合并;濾波完成后,執行本文方法的核心步驟,即多尺度的像斑合并,先讀取第一個像斑,依據地類柵格數據判斷該像斑所在覆蓋區域的優勢地類Ci(即像斑所在空間區域內同類別柵格像元比例最高的地類),據此對該像斑分派匹配于地類Ci的最小合并尺度參數Mi,進而在此尺度參數下對該像斑及其周邊區域進行像斑的合并、標記,并根據給定的不同合并尺度參數Mi對標號數據進行對象限制與再合并,繼而再繼續掃描是否還有未處理的像斑,若有則讀取下一個并重復上述處理步驟,直至所有像斑處理完成且所有像斑區域都滿足要求,從而完成多尺度參數設置下的像斑合并;最后,對合并處理后得到的像斑,利用矢量化技術構建多邊形,輸出最終的分割對象。
為檢驗本文設計方法在遙感影像分割應用上的效果,首先選取國產資源三號(ZY-3)高分影像進行實驗。圖3(a)所示的ZY-3融合影像位于安徽省淮南市,成像于2013年3月18日,尺寸大小為2 675像素×2 279像素,空間分辨率為2.1 m。此外,還收集了在圖3(a)區域范圍內先期解譯的土地覆蓋圖(見圖3(b),參照2012年12月的ZY-3高分影像解譯得到的圖斑矢量,地表覆蓋的主要類別包括耕地、林地、水域及建設用地四大類),將此作為先驗知識用于本文算法中。

圖3 實驗1使用的數據集
在核帶寬參數hs=10、hr=20的設置下,采用單尺度方法以及本文設計的多尺度方法得到的分割結果如圖4所示,其中圖4(a)、圖4(b)分別為采用統一尺度參數M=1 000(情形1,所有地類的尺度參數均為1 000)、M=100(情形2,所有地類的尺度參數均為100)的分割結果,而圖4(c)則是對不同地類設置不同尺度參數(情形3,耕地、林地、水域及建設用地的尺度參數分別為1 000、1 000、1 000、100)的分割結果。需要說明的是,圖4(a)、圖4(b)是為了比較不同尺度下的分割效果而進行的對比實驗結果;另外,圖4(c)的尺度參數集是作者經過多次實驗后選擇的尺度參數組合值,帶有一定的經驗性。
目視比對圖4的三個結果可以看出,在使用單一分割尺度參數M=1 000時(圖4(a)),影像在建設用地區域存在一定的欠分割,而在選用單一分割尺度參數M=100時(圖4(b)),影像在耕地和林地區域存在較嚴重的過分割。相對而言,選用尺度組合參數集M={1 000,1 000,1 000,100}得到的多尺度分割結果(圖4(c)),能對不同地類區域保持較好的對象完整性。因此,對比單尺度參數和多尺度參數設置下針對耕地、林地、水域以及建設用地等地物對象的提取效果后,可以說明,在原始的分割算法中嵌入前期解譯圖蘊含的先驗知識,可以幫助其進行尺度參數的合理選擇,減少了過/欠分割現象的發生。

圖4 實驗1基于不同尺度組合的均值漂移分割結果(黑色線為分割對象邊界線)
由于目前尚無統一標準直接對分割效果進行定量評估,通過對象級分類的分析效果加以間接佐證。在圖4的分割結果基礎上,采集了200個訓練樣本進行分割對象的土地覆蓋分類,得到圖5所示的結果;之后再用其余的50個測試樣本進行了分類精度的評價,精度統計如表1所示。從圖5的分類結果以及表1所示的分類精度評價可以看出,在選用單一的分割尺度M=1 000時,對象尺寸較小的建筑物存在一定的欠分割,導致建筑物這一類別的分類精度相比于選用單一分割尺度M=100時略低;在選用單一的分割尺度M=100時,對象尺寸較大的耕地又存在一定的過分割,導致其分類精度相比于選用單一分割尺度M=1 000時略低;而當基于多尺度分割獲得的對象進行土地覆蓋分類時,分類精度得到一定程度的提高。這間接說明,與單一尺度參數分割相比,本文方法計算得到的多尺度分割對象能較好地兼顧各類型地物在空間上的聚合性和分異性,差異化的分割對象更符合地表實際情況,而這間接助力了面向對象分類精度的提升。

圖5 實驗1基于不同尺度參數組合分割對象的分類結果

表1 實驗1不同分割尺度下面向對象分類的分項精度比較
為進一步檢驗本文方法,選取SPOT 5 全色多光譜融合的真彩色合成影像作為實驗2的數據集(圖6(a))。該實驗區位于廣東省惠州市,數據成像于2006年4月13日,尺寸大小為2 033像素×1 716像素,空間分辨率為2.5 m。圖6(b)是當地2005年參照0.5 m空間分辨率的WorldView影像目視解譯后得到的土地利用調查圖。依據地類層級關系進行了地類合并,得到了如圖6(c)所示的先期地類圖(包括耕地、林地、草地、水域、建設用地、其他用地六大地類),將其作為先驗知識輸入至本文方法開展實驗。

圖6 實驗2使用的數據集
在與實驗1相同的核帶寬參數設置下,獲得了如圖7所示的分割結果,其中圖7(a)、圖7(b)分別為采用了單一尺度參數M=1 000(情形1,所有地類的尺度參數均為1 000)和M=100(情形2,所有地類的尺度參數均為100)得到的分割結果,而圖7(c)是對不同地類采用不同的尺度參數(情形3,耕地、林地、草地、水域、建設用地及其他用地的尺度參數分別為500、1 000、500、1 000、100、500)得到的分割結果。從整體上觀察,可以看出,本文方法提取的對象邊界較單一尺度分割方法得到的結果有一定效果提升:圖7(a)采用單尺度參數M=1 000時,在建設用地區域表現為嚴重的欠分割;在圖7(b)采用M=100時,在耕地、林地及水域區域又表現出明顯的過分割;圖7(c)所示本文方法得到的多尺度分割結果保持了相對完整的對象斑塊,同時也沒有出現過多的欠分割,一方面對尺寸較小的建設用地對象進行了較為細致的分割,另一方面在尺寸較大的林地、水體對象上又保持了較好的完整性。
與實驗1類似,在獲得了圖7所示的分割對象后,采集了100個訓練樣本和50個測試樣本分別進行面向對象分類及其結果的精度分析。從圖8和表2的視覺對照和精度比對可以看出,基于多尺度分割對象的分類結果在整體精度上亦有所提高。這正如上述分析,本文方法實現了不同地類對象的多尺度提取,即避免了選用單尺度參數M=1 000分割導致欠分割較嚴重而影響了建筑用地的分類精度,也規避了選用單尺度參數M=100分割導致的過分割而影響了耕地的分類精度。因此,與單一尺度下對象級分類結果對比,可以看到,本文多尺度分割方法一定程度上減少了過/欠分割現象的發生,獲取的對象邊界與差異化的地物目標貼合程度更好,間接幫助了面向對象分類的精度提升。

圖7 實驗2基于不同尺度組合的均值漂移分割結果(黑色線為分割對象邊界線)

圖8 實驗2基于不同尺度組合分割對象的分類結果

表2 實驗2不同分割尺度下面向對象分類的分項精度比較
針對遙感影像地物對象的多尺度提取需求,本文改造了傳統的均值漂移分割算法,在實施合并步驟時,通過先期解譯圖的地類空間分布獲取了濾波像斑所在空間范圍的優勢地類標簽,據此為不同區域的像斑選擇了符合其地類固有特征的“最小區域合并尺度參數”,從而建立起了待分割對象與先驗知識之間的空間映射關系,自適應地匹配合適的尺度參數,最終實現了多尺度的分割過程。
通過上述兩個實驗的結果分析,我們對本文發展的多尺度分割方法歸納了以下兩點優勢:第一,改進的多尺度分割方法繼承了均值漂移濾波算法在穩健性等方面的原有長處,并在分割對象的邊界準確性方面優于單尺度方法,能更好地實現遙感影像從柵格到矢量的轉換過程,有利于對象形態的表達和后續的特征提??;第二,多尺度是復雜地表空間的固有特性,過往的算法多與對象多邊形的面積而非內容相聯系,而本文設計了結合地物空間分布的尺度參數選擇策略,能適應空間分異的對象提取。
針對面向對象分析的前置環節,本文以適應性和穩健性較好的均值漂移算法為基底,提出了一種先驗知識引導下的多尺度分割方法,詳細給出了實現流程,并通過兩個實驗數據集對其分割效果以及進一步的對象級分類進行了分析驗證。實驗結果表明,在先期解譯土地覆蓋/利用圖提供的先驗知識輔助下,本文設計的多尺度分割方法較傳統的單尺度方法能更好地結合地類空間分布信息實現對象提取,為后續的對象分析提供了精準的邊界形態信息,因而在高分遙感信息提取領域具有一定的應用前景。
最后,需要說明的是,本文僅從算法角度提出并驗證了我們設計方法的可行性與有效性,并未對多尺度分割的其他環節做過多考慮。例如,我們在實驗中是通過反復多次實驗后經驗性地選取了一組較優的尺度參數集,并未通過設定某種準則來選擇更優的尺度參數集,也沒考慮如何在分割過程中耦合除影像色調之外的紋理等多源特征。此外,基于本文提出的技術框架,未來還可以進一步發展更優的像斑歸并規則,以獲得蘊含一定語義的高層次對象。上述這些問題有待在后續研究中進一步探索。