華 璀 廖 政 蔡耀君 史茹倩
(1.廣西師范學院地理科學與規劃學院,廣西 南寧 530001;2.北部灣環境演變與資源利用教育部重點實驗室,廣西 南寧 530001)
基于光譜和紋理特征的速生桉信息提取方法研究
華璀1,2廖政1,2蔡耀君1,2史茹倩1,2
(1.廣西師范學院地理科學與規劃學院,廣西 南寧 530001;2.北部灣環境演變與資源利用教育部重點實驗室,廣西 南寧 530001)
桉樹生長速度快、用途廣,具有良好的經濟效益、社會效益和生態效益。但桉樹的種植、砍伐與促長之間周期交替過于頻繁,傳統的林業調查不僅會受各種主客觀因素的影響,而且獲取信息的可信度較低。文章以RapiEye影像為數據源,結合GPS調查手段,運用eCognition平臺,以光譜和紋理相結合的面向對象的分析方法,并創建知識規則集,對桉樹林信息進行提取。實驗表明,傳統基于像素的監督分類方法總體精度為68.83%,Kappa系數為0.67。而基于以光譜紋理、創建知識規則集相結合的面向對象分析方法,桉樹信息提取的總體精度達到82.12%,Kappa系數為0.80,該提取方法可獲得更好的分類質量、效率與精度。
光譜特征;紋理特征;桉樹林;遙感信息;提取方法
速生桉作為廣西的主要經濟林之一,不僅具有生長最快、用途最廣泛的特點,還具有很強的環境適應性能力和抗病蟲害能力等許多優良的生物學特性,并且具有很好的經濟效益、社會效益和生態效益。然而速生桉的快速生長同時伴隨著地方生態環境的惡化,其生長過程中需要大量的水資源,大面積種植會導致當地地下水位下降、土壤保水能力降低,長此以往會導致土地板結甚至土壤沙化。速生桉對于土壤中的肥料需求量巨大,凡是種植過桉樹的地區,土地肥力都會有不同程度的下降乃至枯竭。它的種植、砍伐與促長之間周期交替過于頻繁,當規模達到一定數量級則會對當地土壤肥力,地下水資源等生態環境產生負面影響。通過抽樣調查和逐級匯總方式的傳統的林業調查和跟蹤,不僅耗時費力,而且會受到各種主客觀因素的影響使得獲取信息的可信度較低,很大程度上影響了對桉樹林發展的準確、及時監測。
而國外對桉樹的研究多側重于桉樹生物物理反演的比較多,而國內的多集中在桉樹的育種、經濟價值和對生態環境的影響比較多?;阼駱淞址N植的遙感信息快速調查、監測、跟蹤的研究卻很少。在遙感對象的遙感信息提取方面,國外針對面向對象的應用和研究的成果很多,卻在面對對象的桉樹林遙感信息提取中出現的文獻很少;國內應用面向對象的圖像分析方法在土地利用、道路、農作物信息、森林信息等遙感信息的提取研究很多,但由于桉樹在空間上分布顯得較分散,并且林場中往往是樹種混雜、以及樹齡、生長密度等會影像到遙感信息的監測,以面向對象的圖像分析方法,應用在桉樹林遙感信息的快速調查、監測、跟蹤的具體且詳細研究的則相對很少。
因此,在一定空間、時間內,采用面向對象的遙感影像分析方法,及時、準確掌握桉樹種植生產情況,了解、跟蹤、調查桉樹種植的數量、質量及其消長動態信息的技術應用研究,具有很大的科研價值。
建立對象知識庫。對象知識庫是多種特征的集合,選取地物多種特征,建立分類規則,能夠得到很好的分類結果。對象知識庫支持包括分割算法、分類算法、統計算法、優化算法、導出算法等百余種常用算法。eCognition要一款源自德國的遙感影像分析軟件,它突破了傳統影像分類方法的局限性,提出了革命性的分類技術-面向對象分類。它強大的對象知識庫對對象分類不再是傳統意義上的對象像素,充分利用了對象信息(色調,形狀,紋理,層次),類間信息(與鄰近對象,子對象,父對象的相關特征)。因此算法建立對象知識庫可借鑒eCognition平臺,如圖1所示。

圖1 對象特征知識庫平臺
根據對象特征知識庫平臺,分別建立桉樹與其它樹種之間特征閾值范圍的差別,找出閾值的上下限,如圖2所示。


圖2 桉樹與其它樹種特征閾值比較
本文以南寧市高峰林場作為研究區,地理位置為:22°48′48″~23°3′34″N,108°7′55″~108°32′53″E。林場所在區域屬大明山余脈,屬低山丘陵地貌,地勢東北高、西南低,呈東北-西南走向,海拔高度70~500m,坡度20°~35°,地形比較封閉。高峰林場經營土地面積89萬畝,其中場內面積48萬畝,域跨武鳴、賓陽、上林三縣以及南寧市興寧、青秀、西鄉塘三城區;場外造林面積41萬畝,分布在全區37個市(縣、區),森林蓄積量265萬立方米,森林覆蓋率83.7%。林場目前有人造板,速豐林,經濟林和第三產業這幾大支柱產業,并由傳統的林業向現代林業邁進。
在本次研究中,考慮到研究內容、研究對象和工作量等因素,高峰林場取條帶分布區域,不包括外包林場,如圖3所示:

圖3 研究區域地理位置
在遙感影像上提取桉樹林的信息,采用類似于決策樹的構思方法,先簡單后復雜,剔除無關信息篩選有用的地物類別,然后再實現目標地物信息的提取。桉樹林信息提取主要根據次分類方案進行:
(1)水域是較簡單的地類,先從影像中剔除水域對象,得到非水域圖層L1;
(2)在非水域對象層L1中分出植被對象層L2與非植被對象層L3;
(3)在植被層L3中提取林地地類對象層L4;
(4)在林地對象層L4中提取出桉樹林對象層L5;
(5)再在桉樹對象層L5中分出桉樹幼林、中林和成林。
3.1非水域信息提取
近紅外比率(Ratio_Nir)通常用于區別和提取水體和陰影,結合影像藍波段、近紅外比率、歸一化水體植被指數(NDWI)和歸一化植被指數(NDVI)[1],提取水域對象信息。其指數計算的表達公式為:
(1)近紅外比率:
Ratio_Nir=Nir/(Blue+Green+red+Rededge+Nir)
(2)歸一化水體植被指數:
NDWI=(Green-Nir)/(Green+Nir)
(3)歸一化植被指數:
NDVI=(Nir-Red)/(Nir+Red)
設置Ration_nir閾值為<0.926能較好突出水體在影像上的信息表現,NDWI閾值為<0.13能較好的區分水體和植被,Ratio_Nir閾值為<0.429能較好的進一步區分水域與非水域地類。研究區水域信息分布情況,如圖4所示。

圖4 水域信息分布情況
3.2林地信息提取
本文主要使用的桉樹RapiEye影像,其光譜波段在440 nm-850 nm藍、綠、紅、紅外、近紅外有五個波段。地面采樣間隔為6.5m,正射影像的像素大小為5m,幅寬77km重訪周期為每天,影像獲取能力為400萬平方公里/天。桉樹影像的特點比較真實的反映了研究區的概況。
由于桉樹種植土壤中的肥料需求量巨大,凡是種植過桉樹的地區,土地肥力都會有不同程度的下降乃至枯竭是對象層中剔除水域對象后,還需從影像對象層中提取出林地信息,然后再從林地信息提取桉樹林的對象,再進行樹齡識別。
研究區地形比較復雜,可適當引入數字高程模型數據(DEM)作為專題輔助數據,結合DEM數據,篩選一些位于高程較低的農作物。在區分植被與非植被信息時,可應用NDVI植被指數,如農作物、林地的NDVI值大于0,非植被的NDVI值小于0(如居民點及建筑用地)。在提取出植被對象的基礎上,再進一步分析農作物、林地特征,提取林地信息。經提取水體后,把影像對象劃分為林地、居民點及建筑物、耕地和其它地類四種,經分析發現其在影像上各波段的部分特征如表1所示:

表1 不同地物的統計特征表
根據RapidEye影像中地物的特征值表,可發現不同目標地物,其光譜特征統計值有較大的差異,可作出特征統計圖進行比較分析,如圖5。

圖5 不同地物特征波段特征曲線
綜上知,在紅波段(B3),林地等四類地物的亮度值差異較大,根據不同的特征值范圍可將其區別。但各波段之間存在“同物異譜,同譜異物”,單靠一個紅波段很難把互相混淆的地物對象給予劃分,還需要結合其他特征信息,將其對象進行提取。
結合eCognition平臺特征庫,自定義林地信息提取需要的指數特征,編輯相關算法法則等。自定義的指數如:
①歸一化植被指數NDVI;
②土壤調整植被指數SAVI;
③差值植被指數DVI;
④土壤植被指數SOIL。
根據林地、耕地、居民點集建筑用地對象的特征,建立對應的知識規則集,把林地對象進行提取,如表2。

表2 林地提取的規則集
綜上,規則集創建以自上至下、從簡到繁的方法,從影像對象層中提取耕地、居民點及建筑用地信息,然后再剔除耕地、居民點及建筑用地對象的基礎上,提取出林地信息,剩余的對象由于地形比較復雜難以劃分,將未分類的對象合并為其它地類。
由于研究區域地形復雜,不能高精度實現地物信息的分類,必然存在錯分和漏分現象,同時,地物對象間總存在“同物異譜、同譜異物”現象[2],需對提取出來的耕地地類、居民點及建筑地類和其它地類中逐一檢查,并結合Google地球判斷錯分、漏分的地物,以人工編輯將其合并入林地地類,提高分類精度,避免誤差的傳遞。最終得到林地信息的提取結果,如圖6所示。

圖6 以規則集閾值分類提出的林地分布效果圖
桉樹是林地對象層中的其中一類樹種,除此之外還有杉木、馬尾松、相思樹、竹林等樹種。山溝有少量灌木,且地形破碎,森林分布極為破碎,表現為斑塊小、不同樹種呈無規律交叉分布。在林區提取出桉樹林信息相對難度較大,因此需要結合其他目標地物作為輔助地類,以桉樹林信息提取為重點,旨在使桉樹林信息的提取精度更高。因此,把研究區內的林地,繼續劃分為桉樹林、杉木林、松樹林、竹林、灌木林等各種樹種信息。
3.3各林種的影像光譜特征
植被是地球自然系統最典型的地物類型之一,在遙感影像中具有獨特的特征,不同的植被其特征信息存在明顯的差異。從RapidEye影像上分析,森林的反射性特性相差很大,造成相同樹種各對象間的圖像特征變動很大。林地中各種樹種類型的均值(Mean)、標準差(Standard)有著較大的差異,其統計值如表3。

表3 林地各種樹種類型的統計特征
綜上知,桉樹在各波段中的統計特征與其它樹種之間存在著較大的差異,通過這些差異可將桉樹對象信息給予準確的提取。同時,桉樹的光譜特征也存在其它樹種特征互相混淆的情況,如圖7中光譜曲線所示。

圖7 各樹種植被光譜曲線
據上圖可知,林地中的各樹種光譜特征值比較難區分,如果單靠光譜特征閾值,要提取各樹種信息很難,還需要結合紋理特征,進一步分析。
3.4各樹種影像紋理特征
紋理特征通常被認為是紋理基元按照某種確定性的或者統計性的規則,進行重復排列而形成的一種物理現象,紋理特征的基本特征是平移不變性的,其視覺感知基本上與其在圖像中的位置無關[3]。為了分析研究區內桉樹林與其它樹種的紋理特征,以5m分辨率的RapidEye遙感影像為數據源,計算研究區不同植被類型的植被紋理參數。經對比分析發現,桉樹與其它植被相比,具有強烈的空間異質性。
紋理特征通常是用圖層中的8個紋理量共同表達的,如果紋理量過多,會增加相當多的紋理量,不僅使得計算結果復雜化,大大增加了工作量,而且也會使得各緯圖像信息之間,信息的重復率較高,不利于地物信息提取。
本文采用降維的方法,對研究區RapidEye數據進行主成分分析,找出紋理特征值貢獻率最大的圖層,從而便于下文對紋理特征的分析,結果如表4。

表4 RapidEye衛星影像主成分分析結果
上表表明,RapidEye影像中各個波段的主成分分析結果,第一主成分(PC1)的百分比信息占全部信息量的比例為99.34%,基本保存了原影像的全部信息。因此,可針對第一主成分PC1波段層進行紋理特征分析。
在對紋理特征分析時,計算灰度共生矩的特征值,要求圖像的灰度級遠要小于256,主要因為圖像灰度值一般為256,如果矩陣維數太大而窗口的尺寸較小,則灰度共生矩陣就不能夠很好的表示;如果能夠很好表示紋理則要求窗口尺度較大,這樣會使計算量大大增加,而且當窗口尺寸較大時,對于每類邊界區域誤識率較大[4]。而且在不同方向,紋理表現的信息量也不同,紋理有方向上通常通過0°,45°,90°,135°,RapidEye數據已經過正射校正,因此采用GLCM(all dir)視角進行分析。
本文應用8個基于二階矩陣的紋理濾波,其包括均值、方差、同質性、反差、異質性、信息熵、角二階矩和相關性等。分別以PC1圖像按照33、55、77、99的窗口,步長為(1,1),(2,2),(3,3),將圖像灰度值壓縮為64級,進行紋理分析。當步長為(1,1)是,各窗口紋理特征值向量,如圖8。

圖8 各窗口提取的Mean紋理量圖
綜上知,當選擇不同的窗口或步長時,產生的紋理特征也不相同;當窗口或步長選擇不合理,在一定程度上會引發紋理偏差,會影響紋理的視覺效果以及質量,進而影響到影像的分類效果。研究發現,本文選用窗口(3,3),步長(1,1)時,提取出來的紋理特征比較清晰,質量和視覺效果都較好。
對研究區的林地對象層繼續細分,提取桉樹、杉木、松樹、灌木、竹林和其它地類信息,并統計這6類紋理特征值,如表5。

表5 PC1波段各樹種紋理統計特征值
從表5可知,各樹種之間提取出來的紋理特征,存在著較大的差異性,可根據此特征差異閾值,建立相應的規則集,對林地各樹種進行分類。
3.5創建語義知識規則集與分類
對研究區林地對象做光譜和紋理分析,發現桉樹(桉樹為主要提取的目標對象)、杉樹、松樹、灌木、竹林之間的光譜特征和紋理特征有較大的差異,可結合這些不同的特征閾值,創建語義知識規則集,實現樹種的分類。經多次試驗,構建的知識規則集,如表6。

表6 林地各樹種分類規則集
3.6林種分類后人工編輯處理
由于影像對象特征間有一部分因子存在多重相關性,并互相影響,甚至出現“同物異譜”和“異物同譜”的現象[5],在規則集的自動分類會存在錯分、漏分等問題,所以在分類結束后,需要對分類結果進行優化處理。優化分類結果可以通過人工編輯工具修改,選擇需要歸并的地類,然后點擊錯誤的地類進行地類錯誤修正。而對于某些地類邊緣不準確的對象,可以利用軟件提供的切割、合并工具進行相應操作。
3.7各樹類圖斑合并
正確歸類后,同種相鄰的類別被切割成多個對象,但實際的結果需要得到一個整體的類別結果,因此,要對分割的類別進行合并。在規則集自定義中,可通過在Processtree里利用Merge算法實現對每個類別進行合并[5]。
3.8歸并小圖斑和輸出
在林業樹種分類系統中,對于小面積的地類并不能體現其分類的意義,通常情況下,為了減小數據存儲的難度和冗余度,會把小面積的圖版歸類到相鄰的地類中。本文將把小于200平方米的地類,歸類到相鄰的地類中,得到圖9所示?;诿嫦驅ο蠹夹g的桉樹林遙感信息提取研究,桉樹作為主要提取的數據對象,而其他樹種僅作為參考和輔助作用,桉樹的提取精度較其他樹種的精度較高。因此,將桉樹林的對象信息進行整合歸并,得到桉樹林的整體分布圖,如圖9所示。

圖9 研究區林地樹種分類分布圖
4.1面向對象與最大似然分類結果對比分析
本文針對研究區的桉樹林等樹種的種植信息進行提取,采用基于面向對象技術和基于傳統像素分類的最大似然分類的兩種不同分類方法,得到精度不同的兩個分類結果,如圖10所示。

圖10 面向對象技術的圖像分類和基于像素的最大似然方法的圖像分類
綜上圖比較分析可知,研究區各樹種分類總體情況,面向對象技術的圖像分類結果比基于像素的最大似然分類結果更加理想。面向對象技術的圖像分類能更好的保持地物對象的完整性和統一性,且能夠很好的描述各樹種的邊界特征,更接近于實地地物的邊界相吻合;而基于像素的最大似然方法的圖像分類,在各樹種之間存在著較多的噪音,在研究區域內都有分布,造成一定程度的圖斑信息缺失甚至影響到分類的精度。
提取研究區各數種種植信息的目的是要調查其分布范圍以及種植面積,對各樹種的分類結果進行面積統計,得到兩個面積的統計值,如表7。

表7 兩種分類方法中各樹種的統計面積 單位:公頃
從表7可知,基于面向對象技術的分類結果和基于像元的最大似然分類結果在面積統計上有很大的差異。最大似然分類方法的圖斑數目整體上要比面向對象技術的數目多。在面積總和上,各樹種之間的統計都不盡相同,存在很大的差異,因此,最終確定采用那種分類方法提取的結果更理想,更接近實地面積,這需要進一步的精度驗證。
4.2野外實地調查數據驗證
圖像精度指的是經面向對象技術提取的結果分類圖,與一幅假設標準的參考圖像之間的吻合度,兩幅圖的地類以及位置吻合度越高,其結果分類圖的精度就越高。
結合已經建立起來的解譯標志數據,以及通過野外實地GPS采集的坐標點,對遙感影像提取出來的桉樹、杉木、松樹等樹種信息進行精度驗證。在研究區內選擇具有代表性的458個作為檢驗精度的樣本點,對桉樹林等樹種信息的解譯精度進行分析。

表8 野外實地采集的各樹種樣本點樹目

圖11 研究區野外驗證點空間分布圖
4.3精度評價結果與分析
研究區內地形復雜,樹種多樣,如桉樹,杉木、松樹等,要實現整體所有樹種實行精度評價,難以實現。本文針對按樹等分類提取的樹種作為精度評價的主要對象,將沒有分類的樹種或地類類別統歸于其它地類,然后做一個掩膜文件將其不參與精度[6]。此次,參與精度評價的樹種主要有桉樹、杉木、松樹、灌木和竹林,精度評價主要采用混淆矩陣的評價方法。
在eCognition 平臺將458個樹種樣本對分類結果進行精度評價,在對其它林地掩膜不參與評價的基礎上,利用Assuracy Assessment Tool工具,得到表9的評價結果。

表9 基于規則集遙感信息提取精度評價表
由上表知,基于面向對象技術的分類結果比基于像元的最大似然方法的分類結果精度要高。基于面向對象分類的總體精度達到82.12%,Kappa系數達到0.8,且桉樹林的單類精度達到88.69%;而基于像素的最大似然分類的總體精度為68.83%,Kappa系數為0.67,桉樹林的單類精度為75.84%。
本文研究表明,以速生桉為例,用文中在方法可提高面向對象的信息提取精度,究其原因主要有三個方面:一是充分應用高分辨影像豐富的光譜、紋理、屬性等空間特征,有效挖掘高分辨數據海量信息并應用在實際分析上;二是采用面向對象而非像素的分析方法,適當控制過度關注局部信息而忽略重要信息特征的誤區,并采用類與層相互繼承的方法,分類層次更明確,目的和針對性更強;三是將圖像分割、特征提取與分析、規則集建立等技術手段應用在信息提取上,可有效提高對遙感圖像的理解、地物識別以及地物空間信息,提高了信息提取的精度。而基于像素的最大似然分類方法,屬于監督分類中常用的方法之一,由于圖像空間分辨率高,同類地物內部光譜差異逐漸增大,基于像素的分析方法則會過度關注地物細節而忽略高分辨數據的豐富的光譜、紋理等空間信息,這種局限性必然使得其分類精度偏低。
[1] 曹寶,秦其明. 面向對象方法在SPOTS遙感圖像分類中的應用—以北京市海定區為例[J].地理與地理信息科學,2006,32(2):44-49.
[2] 鄧書斌.ENVI遙感圖像處理方法[M].北京:科學出版社,2010.
[3] 熊軼群,吳健平.面向對象的城市綠地信息提取方法研究[J].華東師范大學學報自然科學版,2006(4):84-90.
[4] 葉傳奇,苗啟廣,王寶樹.基于區域分割和Counterlet變換的圖像融合算法[J].光學學報,2008,28(3):447- 453.
[5] 楊海濤,常義林,霍俊彥,等.應用于多視點視頻編碼的基于深度特征的圖像區域分割與區域視差估計[J].光學學報,2008,28(6):1073-1078.
[6] 劉直芳,王運瓊,游志勝.簡單有效的運動汽車投影陰影分割算法[J].光學學報,2007,27(5):835-840.
Based on the spectrum and texture combination of eucalyptus forest remote sensing information extraction
Eucalyptus growth speed, wide application, has the good economic benefit, social benefit and ecological benefit. But the eucalyptus trees planting, cutting and growth cycle, alternating between too frequently, the traditional forestry investigation will not only influenced by various subjective and objective factors, the credibility of and access to information is low. RapiEye images as data source,this paper combined with GPS survey method, combining with spectrum and texture object oriented analysis method, rule set and create knowledge, to extract eucalyptus forest information. Experiments show that the traditional supervised classification method based on pixel's overall accuracy is 68.83%, the Kappa coefficient is 0.67. And based on texture spectrum, create knowledge rule sets the object-oriented analysis method of combining the overall precision of eucalyptus information extraction of 82.12%, Kappa coefficient is 0.80, the extraction method can get better classification quality, efficiency and accuracy.
Spectral characteristics; texture feature; eucalyptus forest; remote sensing information; extraction method
S3-3
A
1008-1151(2016)04-0016-08
2016-03-10
廣西自然科學基金項目 (2014GXNSFAA118293)。
華璀(1962-),女,云南昆明人,廣西師范學院碩士研究生導師,從事廣西師范學院遙感與GIS教學與研究工作,研究方向為資源環境遙感。