金葉蒙,虞思逸,周堅華
(1.華東師范大學 地理系,上海 200241;2.華東師范大學地理信息科學教育部重點實驗室,上海 200241)
目前使用的遙感圖像分析軟件以及通用的圖像處理軟件,通常以多邊形采樣來獲得訓練或測試數據。當多邊形輪廓復雜時,圈選工作量較大。為此一些通用圖像處理軟件(如Photoshop)和面向對象遙感信息提取軟件(如eCognition)開發了“魔棒”或“一鍵式”采樣工具。它可以根據用戶指定的容差,實現一鍵式點選和快速采樣。然而,目前的魔棒和一鍵式采樣均基于單特征,即波譜特征進行提取。當目標物與背景的波譜特征相似時,使用這種方法會出現容差難以確定和采樣區域過生長或欠生長的情況,使樣本質量下降或無效。
事實上,在利用遙感圖像多特征進行信息提取方面已經有許多成功的實例。多數研究涉及的多特征主要包括波譜、紋理、形狀和空間位 置 等[3-5,9-10]。分類器包括決策樹、支持向量機和一些自適應算法等[6,11-13]。參與分類實驗的圖像多為中等分辨率(如TM/ETM等)和高分辨率(如QuickBird等)的多光譜遙感圖像[14-15];多數研究顯示使用多特征分類比僅僅使用單特征分割能大幅提高分類精度[7,16-17],但在采樣階段就利用圖像多特征的內容尚未檢出。
作為一種嘗試,本文提出了一鍵式多特征遙感圖像采樣器(Multiple Feature Point Sampler,MFPS),它不僅融合了一鍵式采樣的思想,而且率先在圖像采樣階段就采取遙感圖像多特征分析,以盡可能全面和深度利用用戶通過采樣暗示的目標物與背景之間的全部特征差異,或者稱為“用戶判讀知識”。以便在提高采樣效率的同時,進一步提高樣本對用戶判讀知識的代表性。實驗結果表明,MFPS具有采樣效率高、誤判率低等優點。對于常規遙感圖像分析具有普適性,尤其適合于圖像特征復雜的地物類型采樣。另外,MFPS還能用于對分類結果的人機交互后期整理等方面。
本文以上海市高分辨率天然彩色或彩紅外遙感圖像為實驗圖像。對于其他類型的圖像,可能需要重新調整特征描述符。比如對于天然彩色圖像,可以考慮以“綠度指數”[8]代替NDVI。為了適應圖像分辨率的變化,可以使用可變的窗口尺寸d,d是圖像尺寸和分辨率的函數。典型算法具有多特征和串行搜索兩個主要特點。
“串行”包括空間域的串行搜索和特征的串行計算。
空間域的串行搜索與上述魔棒或一鍵式采樣方法相比有了較大改進,主要表現在兩個方面。(1)“容差”的確定方式不同。這里的容差指特征值域。傳統點采樣方法的容差通常由用戶根據經驗指定,并以人機交互方式傳入系統。而MFPS方法通過對采樣窗口值的統計獲得容差。用戶只需要事先定制特征空間,即指定特征維數和特征表達式和采樣窗口尺寸d。(2)特征空間的豐度不同。傳統點采樣方法通常只使用波譜特征,比如由分色亮度R-GB構成的3D空間,或由H-S-V(色調-飽和度-明度)構成的3D空間。而MFPS采用用戶自定義多特征空間,包括波譜、紋理和形狀等特征,特征表達式(描述符)由用戶設計。特征空間的維數任意,通常為s(s≥3)維空間。
MFPS方法以采樣窗口像素作為種子,通過統計獲得種子的圖像特征值域,并按照該值域生長,直至形成采樣區域(圖斑)。
而特征的串行計算指多層面圖像特征的遞進計算。比如先計算采樣窗口的波譜特征和紋理特征,通過分割形成圖斑(波譜和紋理特征的均質區域)后,再計算圖斑的形狀特征值并做形狀分割。
圖1為MFPS的基本算法流程圖,下文將介紹其基本思想和核心算法。

遙感圖像種類和獲取環境條件常常具有多變性,而使得不同時相、不同區域的圖像呈現顯著的波譜特征差異,如果直接以分色亮度做波譜分割,則分割閾值會隨環境條件不同而變化。使用一些復合、歸一化的波譜特征,如歸一化植被指數NDVI[18]等,能夠有效減少分割閾值的多變性。
描述符是圖像特征表達式,體現判讀人員對于具體識別任務中的具體現象的認知。可以使用一些普適性比較好的描述符,(比如本文使用的NDVI、NDSV、暗細節密度、形狀系數等),也可以根據具體任務的要求補充新的描述符。描述符的設計原理超出了本文的討論范疇,將另文詳述。
本文采用NDVI以及歸一化陰影指數NDSV[2]這兩個最為常見的描述符作為本文算法的主要波譜特征描述符參見表1。表中,NIR和R分別為近紅外和紅波段的分色亮度;S和V分別為飽和度和明度。圖2~圖4比較了在常規波譜空間與描述符組合空間幾種典型地物分離性的差別。

表1 波譜特征的數學描述符

圖2 典型地物類在R-G-B空間的分離性

圖3 典型地物類在H-S-V空間的分離性
由圖2和圖3可見,在R-G-B空間,屋頂與部分道路的分離性較差;而在H-S-V空間,兩者的分離性進一步下降。實驗表明,在常規波譜空間,某些類別的區分度較低。

圖4 典型地物類在NDVI-NDSV空間的分離性
而當采用描述符組合空間時,可分性有所改善。由圖4可見,在NDVI-NDSV空間,盡管特征空間降低了一維,4種類別的可分性仍然較好。它說明設計完善的描述符可以提高分類精度,并降低特征閾值的不確定性。因此本文以NDVI-NDSV作為默認波譜特征空間。由該空間值域確定的采樣結果集BW1可以用式(1)表達。

其中,I是采樣圖像全集;minVI,maxVI分別為由采樣窗口計算的NDVI最小和最大值;類似地minSV,maxSV分別為NDSV的最小和最大值。在后面的討論中,也常常把[minVI,maxVI]和[minSV,maxSV]分別稱為NDVI和NDSV的窗口容差或窗口值域。
在窗口尺寸合理的情況下,通??梢垣@得與采樣點具有相似波譜特征的圖斑(圖5)。

圖5 NDVI-NDSV空間一鍵采樣實例
紋理是圖像分析的主要特征之一。由于紋理特征幾乎不受遙感圖像的類型和獲取環境條件變化的影響,使其重要性在許多方面勝過波譜特征[1]。此外,紋理特征不像形狀特征那樣要求前驅分割,可以直接由鄰域/窗口像素的特征值計算得到。
紋理可以用圖像灰度共生矩陣計算的統計量來表達,如二階矩、均質度、對比度和熵等。也可以直接由一些簡單統計特征來表達,如值域(最大最小值之差)、離差、均方差等。也有一些文獻提出了一些新型的紋理描述符,如亮細節密度、暗細節密度等[2]。本文主要測試了暗細節密度Dd用于 MFPS的有效性(圖6)。當僅用光譜特征分割時,樹木和草坪無法區分,它們都歸為植被類(圖6(a));但加入Dd后二者的可分性改善,圖6(b)和6(c)分別顯示草坪和樹木(喬、灌木)圖斑。
另外,植被圖斑的欠提取主要由由樹冠表面陰影引起(圖6(d))??捎脭祵W形態學方法提取尺寸較小的凹陷,稱為暗細節(圖6(e))。根據植被圖斑的暗細節密度(單位面積的暗細節數)不同,可以將植被圖斑分割為草坪(圖6(f))和樹木(圖6(g))。草坪和樹木圖斑二值圖BW2和BW3可分別用式(2)和式(3)表達。

其中,Dd稱為暗細節密度或相對暗細節,它根據式(4)計算;T為Dd的分割閥值,它是一個由高低兩個限值組成的二元陣列,根據式(5)估算。

其中,Sd是區域暗細節數,A為區域面積。這里的“區域”可以是由波譜分析提取的樣本圖斑,也可以是樣本窗口。使用前者時,具有“串行”分析特點,即先波譜分析后紋理分析,根據波譜分析的結果再行紋理分析。而后者具有“并行”分析特點,即將波譜和紋理特征合并構建特征空間,并在該空間里實現由樣本點到圖斑的生長。對后者需要注意的是,波譜特征值域計算和紋理特征計算所使用的窗口尺寸不同,通常波譜值域和紋理特征分別以d*d和nd*nd(n=2,3,4…)窗口計算。
暗細節提取可以使用形態學的“低帽變換”算法。它先用閉合操作消除比結構元素se尺寸小的暗細節,獲得背景估計b;然后從b中減去原圖像I,即能獲得暗細節集da。即:da=b-I=I·se-I。其中運算符·表示圖像“閉合”,即以se做先腐蝕后膨脹的操作。式(4)中的Sd為某區域da子集的像素數。

mean(·)表示求均值;P為2元權系數陣列,P(1)為T(1)的權,P(2)為T(2)的權,通常根據經驗設定。
圖6的實例表明暗細節密度對區分粗糙度不同的地物類有效。

形狀是目標對象的重要屬性,由于形狀分析建立在對象的基礎上,因此要先進行基于波譜特征和/或紋理特征的圖像分割,以獲得目標圖像。一鍵采樣后將提取波譜、紋理、形狀特征相似的若干圖斑,而非僅僅擴展出采樣點所在的單個圖斑。因此,加入形狀特征的“采樣”嚴格來說應當稱為“對象提取”。
常用的形狀特征包括橢圓長短軸之比r、橢圓主軸方向a、圖斑長軸與圖斑骨架長度之比e、圓形度m(P和A分別為圖斑周長和面積)等。
對象提取步驟為:①獲取對象/圖斑。使用一鍵式點選,獲取與采樣點窗口值具有波譜和/或紋理特征相似性的所有圖斑。②計算形狀特征值。計算含樣本圖斑在內的所有圖斑的長短軸之比r、主軸方向a、邊界復雜度e、圓形度m等4個屬性值。③將圖斑分類。在r-a-e-m四維屬性空間將所有圖斑分為目標和背景兩類。
圖7是附加形狀特征提取不同形狀建筑的例子。它表明,引入形狀特征有助于區分那些波譜和/或紋理特征相似、但形狀差別較大的對象。

圖7 附加形狀特征提取目標的實例
下面將通過監督分類實驗分析MFPS方法的樣本質量以及簡單討論該算法的普適性。
一鍵式采樣器試圖在引入Photoshop中魔棒的便捷性的同時,又能達到遙感圖像處理軟件多邊形采樣的效果,甚至試圖在多特征運用方面優于上述軟件的采樣功能。下面將通過MFPS與傳統波譜特征點采樣(如eCognition等軟件)方法的比較,討論MFPS的實際采樣效率和樣本用于監督分類的精度。
分類精度檢驗的過程為:①確定圖像I的類別數cs;②分別以MFPS和點采樣方法對I采樣,各類別的采樣點數規定為MFPS不少于6個(MFPS獲得的是樣本圖斑,在構建訓練集和測試集時,圖斑中的每個像素作為一個樣本。),點采樣不少于30個;③將兩種方法獲得的樣本集隨機分為訓練集和測試集,并要求各占50%的樣本;④以決策樹(DT)作為學習機模型,以兩種方法獲得的訓練集分別訓練學習機,獲得各自的分類決策樹t1和t2;⑤以t1和t2對I分類;⑥以兩組分類結果與各自的測試集對照,統計用戶精度和全局精度。
表1和表2分別為以MFPS和點采樣采樣時,監督分類結果的混淆矩陣。混淆矩陣的行名表示正確類名,而列名表示實際分類。表中數值表示測試用樣本數。比如表2中第一行第二列的值62表示類別w有62個點被誤分為v類。對角線上的數值表示正確分類的樣本數?!傲泻汀北硎緦嶋H分給該列類別的樣本總數,它與對角線數值的差為各類別的誤分樣本數;用戶精度(UA)為對角線數值與列和之比。
由表1和表2可見,以MFPS采樣做監督分類時,各類別的用戶精度均好于傳統點采樣。由圖8和圖9的兩個分類實例可見,以MFPS采樣的分類全局精度(GA)比傳統點采樣采樣分別高出4.19%和8.49%。另外,由表5可見,MFPS與傳統點采樣方法的采樣點數之比為19.55,即MFPS方法采樣的工作量不到傳統點采樣方法的五分之一,但實際獲得的樣本數卻是傳統點采樣方法的33.51倍。


圖9 MFPS適用性檢驗補充實例(圖例參見圖8)

表2 以MFPS采樣分類結果的混淆矩陣

表3 以傳統點采樣采樣分類結果的混淆矩陣

表4 圖9實例的分類精度

表5 MFPS與傳統點采樣工作量比較
MFPS是一種新型采樣方式的概念框架,本文只以有限實例測試了它的關鍵技術和算法的可行性。在本文提供的實例中,以NDVI-NDSV-Dd作為默認的波譜-紋理特征空間,以r-a-e-m 作為默認的附加形狀特征空間。
事實上用戶可以根據具體任務設計波譜、紋理和形狀特征描述符,并將它們組合為特征空間;而不必拘泥于本文介紹的少量描述符。在構建了特征空間后,還需要提供采樣窗口尺寸d、紋理分割權系數陣列P、紋理特征窗口擴展倍數n等少量參數,該過程稱為定制采樣器。
理論上MFPS具有較好的普適性,它對于具體任務的適應程度通常只受限于特征空間維數、特征描述符表達式、采樣窗口尺寸等參數設計的合理性。設計原則包括:使描述符對于目標和背景具有明確的分割閥值、在多描述符構成的特征空間里能有效分離目標和背景、采樣窗口尺寸與最小目標尺寸匹配等等。
決策樹是一種直觀的、易于理解和實現的分類模式。與其他分類器不同,決策樹能處理不同尺度不同類型的數據,且不受數據統計分布特征的影響。與神經網絡相比,決策樹運算開銷較?。?9]。由于MFPS采樣得到的是樣本圖斑,圖斑中的每個像素都作為樣本參與訓練,因此樣本數通常很大。采用決策樹可以減少訓練分類器的運算開銷;同時可以免除輸入矢量各分量歸一化的工作,以及便于查看和分析分類規則等。
本文提出了一種基于多特征信息的一鍵式遙感圖像采樣方法MFPS,其主要目標是減少傳統人工采樣的工作量。MFPS組合使用光譜特征、紋理特征和形狀特征,通過響應用戶的一鍵式點選、在以采樣點為中心的窗口內計算特征閾值、并生長出與點選位置具有多特征相似性的采樣區域/圖斑。
為了證明在采樣特征空間采用描述符的必要性,在傳統分色亮度空間與描述符組合空間比較了幾種典型地物類的可分性,并證明采用描述符組合通常可以降低特征空間維數和提高地物類之間的可分性。
為了檢驗MFPS獲得樣本的質量,進行了MFPS與傳統波譜特征點采樣圖像采樣、訓練學習機和監督分類的MATLAB仿真實驗。實驗結果表明,MFPS方法能夠比較充分地利用用戶提供的目標物和背景之間的多特征差異,因而改善了樣本對用戶判讀知識的代表性。與傳統點采樣相比,以MFPS采樣做監督分類的全局精度平均提高了6.34%。另外,MFPS具有依據采樣點自動生長出采樣圖斑的功能,因而具有較高的工作效率。在本文提供的實例中,MFPS方法采樣的工作量不到傳統點采樣方法的五分之一,但實際獲得的樣本數卻是傳統點采樣方法的33.51倍。
理論上MFPS具有較好的普適性,它對具體任務的適應程度通常只受限于特征空間和采樣窗口尺寸等少量參數的合理性。在這個框架下,用戶可以通過自行設計特征空間和修改某些參數,來改善對具體任務的適應性。
[1]周堅華.遙感圖像分析與空間數據挖掘[M].上??萍冀逃霭嫔纾?010:140-158.
[2]周堅華,周一凡,穆望舒.城鎮綠地樹種識別的數學描述符[J].遙感學報,2011,15(3):524-538.
[3]潘琛,林怡,陳映鷹.基于多特征的遙感影像決策樹分類[J].光電子·激光,2010,21(5):731-736.
[4]劉峰,龔健雅.一種基于多特征的高光譜遙感圖像分類方法[J].地理與地理信息科學,2009,25(3):19-22.
[5]孫顯,王宏琦,張道兵,等.基于多特征融合的城市遙感圖像自動解譯方法[J].光子學報,2010,39(1):179-181.
[6]周夷,景奉廣.多分類器組合的遙感圖像分類的方法[J].城市勘測,2008(2):56-59.
[7]劉仁釗,廖文峰.遙感圖像分類應用研究綜述[J].地理空間信息,2005,3(5):11-13.
[8]李登輝.綠度指數圖像處理方法研究[J].遙感信息,2000(4):74-78.
[9]MALIK J,BELONGIE S,LEUNG T,et al.Contour and texture analysis for image segmentation [J].International Journal of Computer Vision,2001,43(1):7-27.
[10]MAHESWARY P,SRIVASTAVA N.Retrieval of remote sensing images using colour and texture attribute[J].International Journal of Computer Science and Information Security,2009,4(1&2).
[11]HAN Y,KIM H,CHOI J,et al.A shape-size index extraction for classification of high resolution multispectral satellite images[J].International Journal of Remote Sensing,2012,33(6):1682-1700.
[12]KUANG Y C,OOI M P L.Complex feature alternating decision tree[J].International Journal of Intelligent Systems Technologies and Applications,2010,9(3):335-353.
[13]BENHADDOUCHE D,BENYETTOU A.The Decision Tree and Support Vector Machine for the Data Mining[J].Journal of Applied Sciences,2010,10(13):1336-1340.
[14]MYINT S W,GOBER P,BRAZEL A,et al.Per-pixel vs.object-based classification of urban land cover extraction using high spatial resolution imagery[J].Remote Sensing of Environment,2011,115(5):1145-1161.
[16]PENG H,LONG F,DING C.Feature selection based on mutual information criteria of max-dependency,max-relevance,and min-redundancy[J].Pattern Analysis and Machine Intelligence,IEEE Transactions on,2005,27(8):1226-1238.
[17]SCHIEWE J,TUFTE L,EHLERS M.Potential and problems of multi-scale segmentation methods in remote sensing[J].GeoBIT/GIS,2001,6(01):34-39.
[18]GAMON J A,FIELD C B,GOULDEN M L,et al.Relationships between NDVI,canopy structure,and photosynthesis in three Californian vegetation types[J].Ecological Applications,1995,5(1):28-41.
[19]PAL M,MATHER P M.An assessment of the effectiveness of decision tree methods for land cover classification[J].Remote sensing of environment,2003,86(4):554-565.