劉祖瑾, 楊 玲, 段琳琳, 龔嬌嬌, 喬賢賢
(河南大學環境與規劃學院,河南開封 475004)
近年來,高分辨率遙感影像技術的空前發展對快速準確的高分辨率影像分析技術提出了新的要求,加上地理信息行業要求的即插即用數據更新技術,兩者共同構成了面向對象分析方法產生的市場條件。面向對象分類方法在植被分類中已被廣泛運用。其中,面向對象最重要的特點就是分類的最小單元由影像分割得到同質影像對象(圖斑),而不是單個像素。因此,面向對象分類方法能有效解決同物異譜、異物同譜、混合像元等問題,提高分類精度。在面向對象分類時重點是要解決遙感影像分割問題,而規則分類法是面向對象分類方法中的一個重點和難點。規則分類法[1]在高分辨率遙感影像處理與分析中已越來越受到研究者的關注,通過規則分類法,可以將植被從影像中提取出來。韋雪花通過對提取的特征屬性進行定性分析,建立了分類規則集,實現了規則分類單木冠幅提取,其單木冠幅估測精度為72%[2];王偉選取最優分割尺度和最優分類指標進行面向對象分類提取試驗,分類總體精度達到93.7%,Kappa系數為85.8%[3];樊江川采用基于像元及面向對象的方法,并結合地物的光譜、紋理及形狀特征進行規則分類,得到森林參數,測量單木冠幅精確達到94.31%[4];張凝等結合航空影像紋理和光譜特征,利用規則分類提取單木冠幅精度為90.05%[5]。
上述研究雖是基于規則分類,其結果都取得了較好的分類精度,但大部分是直接借助于知識庫或定性分析建立分類規則集,極少用定量的分析法對大量的特征進行優選,使特征存在冗余,從而導致產生類別錯分以及運算時間較長的問題。而且分類特征約簡也是目前亟待解決的主要問題之一。
針對上述特征冗余問題,王婧等基于粗糙集理論進行對象特征的屬性約簡,約簡出最能代表樹種分類的特征參數,結果將34個特征約簡為13個,其分類精度達到80.45%[6];陳杰等在對光譜特征的初步分類結果基礎上,結合粗糙集理論約簡的紋理特征進行規則分類,分類總體精度達到92.07%,Kappa系數為90.75%[7]。而在上述研究的分類特征約簡過程中,對連續屬性進行離散化時使用的是粗糙集軟件Rosetta中自帶的離散方法,這些方法存在較大的時間復雜度和空間復雜度缺點,容易產生過多的斷點以及陷入局部最優等問題。離散化后的數據集將會降低系統冗余以及機器學習算法的運行效率,提高分類精度[8]。因而,對數據集合中的連續屬性值進行離散化以及離散化方法的研究都具有重要意義[9]。
為解決由于“同譜異物、異譜同物”而造成的地類難以劃分的現象,遙感影像的地物分類提取不僅需要光譜信息,而且需要紋理等信息作為輔助。己有的研究證明,紋理信息可有效提高地物的分類精度,當遙感影像像元大小在25 m以下時,同時應用光譜信息和紋理信息進行植被分類時獲得的精度結果要明顯高于采用任何一種單一信息分類的結果。因此,在基于遙感影像的植被提取中,光譜-紋理信息可作為提高分類精度必不可少的要素。
針對上述問題,本研究結合影像的光譜-紋理及植被的歸一化植被指數(normalized difference vegetation index,簡稱NDVI)特征,并引入粗糙集理論與廣泛用于數據挖掘的FCM(模糊C-均值,Fuzzy C-Mean)聚類算法來約簡分類特征,建立植被分類規則集,以解決特征冗余問題,達到降低錯分率、縮短分類執行時間及提高分類精度的目的。
本研究的主要思路:首先,提取特征參數,計算影像的紋理特征和光譜特征,用于區分植被和非植被,再將提取的不同地物的光譜特征和紋理特征及類別構成決策表;然后,利用模糊C-均值(fuzzy C-mean,簡稱FCM)算法對決策表進行離散化,運用粗糙集理論對離散化后的決策表進行特征約簡,其結果精度以支持向量機(support vector machine,簡稱SVM)分類器進行評估檢驗,實現規則分類提取時特征向量的優選;最后,完成植被規則分類。采用FCM算法與粗糙集理論對無人機遙感影像進行林木分類提取的主要技術路線如圖1所示。

對于所獲取的無人機影像數據,計算其多光譜影像對應的紅(red,簡稱R)、綠(green,簡稱G)、藍(blue,簡稱B)3個波段內的均值(Mean)、方差(Variance)、信息熵(Entropy)、二階矩(Second Moment)、對比度(Contrast)、均一性(Homogeneity)、相關性(Correlation)及相異性(Dissimilarity)8個紋理因子,這些紋理因子對于影像中植被與非植被的區分具有重大影響。通過計算,可以得到24個紋理特征圖層。
1.2.1 網格法采樣 選取ArcGIS中漁網法設置80×80的網格,采用人工選取的方式均勻采樣,根據實地考察結果以及分析影像中研究區覆蓋范圍內包含的地類,將地物劃分為林木、裸地、草地、道路以及其他五大類。在研究區覆蓋范圍內,盡可能均勻地選擇每個不同類別的樣點,其中林木樣點322個,裸地樣點107個,草地樣點253個,道路樣點275個,其他樣點183個,共選取1 140個樣點,樣點分布如圖2所示。

1.2.2 提取光譜-紋理特征值向量 在確定了地物樣點后,將24個紋理特征圖層導入ArcGIS中,利用ArcGIS中的Sample功能提取不同地物各個樣點的光譜及紋理特征值。提取的3個光譜特征向量分別用x1、x2、x3表示, 紋理特征分別用y1、y2、…、y24表示,分類類別用classes表示。表1列出了部分樣點的光譜和紋理特征值。由于上述樣本特征的取值范圍不同,其特征之間沒有可比性,為此筆者對特征向量作歸一化處理,歸一化公式如下:
(1)
式中:xmax和xmin分別為特征值的最大值和最小值,將特征數據歸一化到0~1。
隨著計算機技術和網絡信息技術的迅速發展,使各類數據集呈現爆炸式的增長,從大數據中去除冗余,以及準確獲取其內在的相似關系,成為當今研究的熱點之一[10]。由波蘭數學家Pawlak于1982年提出的粗糙集理論是一種解決不完整性和不確定性問題的新型數學工具[11],并已被成功應用于數據挖掘、特征選擇、模式識別等領域[12-13],其基本思想是在維持決策表分類和決策能力不變的情況下,通過知識約簡導出問題的決策或分類規則。
由于粗糙集理論要求樣本數據的屬性值為離散型,而決策表中數據的屬性值是連續型的,因此需要對決策表進行離散化處理[14]。粗糙集離散化算法主要有Equal Frequency、Scale Entropy/MDL Scale、Na?ve Scale、Semi Na?ve Scale和FCM等[15]。其中,FCM算法是依據對象之間的相似程度,將對象聚合成有限的幾個類別,是一種廣泛適用于數據挖掘的方法。目前,已經有在粗糙集約簡中引用FCM離散方法的報道,并取得了較好的效果[16-17]。
聚類算法FCM最初是由Dumm提出的[18],但其發展和推廣是由Bezdek等完成的[19]。FCM模糊聚類算法是一種迭代優化算法[20],可以描述為最小化指標函數。
設集合X={xi,i=1,2,…,N|xi∈Rn}是特征空間Rn上的1個有限數據集,FCM算法的目標函數如下[21]:
(2)

表1 部分樣點地物光譜及紋理特征值
式中:c為聚類的類數,且2≤c≤N;m為模糊加權指數,且 1 使目標函數J最小的迭代優化算法如下: 步驟1:確定參數,包括聚類數c、模糊加權指數m、迭代終止閾值ε以及初始化聚類中心矩陣V。 步驟2:按下式,用當前聚類中心計算隸屬度函數: (3) 步驟3:按下式,用當前隸屬度函數更新各類聚類中心: (4) 步驟4:如果‖V(n+1)-V(n)‖<ε, (5) 則算法終止,否則n=n+1,轉到步驟3。 因此,本研究引入FCM算法對原始數據集進行聚類離散化,根據聚類結果中的模糊隸屬度矩陣確定的相似關系,得到離散化后的決策表(表2)。 特征約簡的目的主要是在保持分類能力不變的前提下,約去多余的屬性,最大限度地降低系統冗余[16]。目前,特征約簡的計算方法有多種,如動態約簡法[22]、Genetic算法[23]以及Johnson’s算法[24]等,本研究選擇Johnson算法對條件屬性進行約簡。得到最小條件屬性集為{R、G、R_variance、Rhomogeneity、R_contrast、G_homogeneity、G_variance、B_variance、B_homogeneity、B_second_moment},即R和G波段的光譜,R分量的方差、均一性和對比度,G分量的均一性、方差以及B分量的方差、 均一性和二階矩。經過粗糙集特征約簡處理后,去除其中的冗余條件屬性,決策表中的條件屬性從27個精簡為10個。 表2 部分離散化決策表 為了驗證最小條件屬性約簡結果,本研究基于Matlab平臺用Libsvm線性核函數進行評估驗證。運用約簡的最小條件屬性集對測試樣本集進行評估檢驗,由表3可知,利用粗糙集理論規則約簡后的結果評估識別正確率為89.29%,比無規則約簡結果提高9.89百分點。 表3 評估檢驗結果 從測試結果可以看出,通過FCM算法離散化和粗糙集特征約簡,使得分類準確率有較大程度的提高,采用粗糙集和FCM算法相結合的方法進行特征約簡具有一定的優越性。 遙感影像多尺度分割技術中的難點問題是最優分割尺度的選擇。最優尺度的確定直接影響到后續圖像的信息提取與分析,因此確定最優的分割尺度對地物提取是至關重要的。以eCognition Developer遙感軟件為試驗平臺,進行無人機影像林木提取研究。具體方法如下:將加權均值方差、加權均值方差變化率和最大面積相結合,即將加權均值法以及均值方差變化率確定的最優尺度對應到最大面積曲線階梯平臺中,結合加權均值確定的最優分割尺度與最大面積法確定的最優尺度范圍,確定最終分割尺度區間。每個平臺都對應某種地物相應的分割尺度范圍。 通過此方法最后得出遙感影像最優分割尺度為44,即當分割尺度為44時,研究區域整體分割效果最好,而且林木分割邊緣較完整。 利用上述方法選取影像最優分割尺度,可有效避免人為確定分割尺度的主觀性和低效性,提高工作效率。由圖3可以看出,當分割尺度為30 時,對象分割過于破碎,不利于分類,如圖3-a中紅色標注部分是將1個樹冠分割成5個對象,而綠色標注部分為正確分割的樹冠;當分割尺度為70時,分割不完整,出現1個對象包含多種地物或同種地物被分割成1個對象的現象,如圖3-c中紅色標注部分將5個樹冠分割成1個對象,綠色標注部分是1個分割對象包含了2種地物;分割尺度為44的結果相對兼顧了研究區各種地物的局部細節以及空間分布特征,分割效果較好,如圖3-b中紅色和綠色標注部分,都被分割成相互獨立的個體,極個別區域存在2個樹冠被分割成1個對象的現象,如藍色標注部分。3種分割尺度相比較可知,分割尺度為44時分割效果最好。 多尺度分割遙感影像后,具有高度復雜和差異的地物需要利用多種提取知識進行識別提取[25]。首先,建立層次結構體系[26]。通過層次間的傳遞,使得層次之間具有繼承關系,組成復雜的規則知識網絡結構,實現不同地物的高效和準確分類[27]。根據對不同地物的知識分析和特征挖掘,將研究區地物按VI′規則分為植被與非植被,再將植被細分為草地和林木,將非植被分為裸地、道路和其他。其次,建立分類規則集。利用提取影像中不同地物的光譜和紋理特征值,結合“2.2節”中約簡的特征組合,建立分類規則集(圖4)。 本試驗采用無人機遙感影像,無人機型號為AVIAN -PUAS,是彈射型固定翼無人機,無人機搭載的相機型號是SONYILCE-7R,焦距為35.626 8 mm,采集影像時相對航高為280 m,影像航向重疊度為81%,旁向重疊度為43%,影像地面分辨率為0.05 m。數據影像拍攝于2014年10月4日,天氣晴朗。試驗采用的影像經過預處理,使用eCognition Developer遙感軟件與Matlab作為試驗平臺對預處理后的無人機影像進行植被分類提取分析。 由“3.2”節中構建的分類規則集獲得分類結果,圖5-b中,綠色區域為林木,深綠色區域為草地,黃色區域為裸地,灰色區域為道路,紅色區域為其他。采用基于樣本的評價方法對本研究方法的分類結果進行精度評價,計算分類結果的混淆矩陣如表4所示。其中,用戶精度(user’s accuracy,簡稱UA)是描述地物對象被正確地分到對應地類中的比率;生產者精度(producer’s accuracy,簡稱PA)是描述某類分類中,其中確實屬于該地類的對象數占總數的比例;分類精度(accuracy)是表示分類結果總體準確性的指標;Kappa系數是描述整幅影像的分類精度。一般情況下,認為Kappa系數可以更準確地描述全局的分類精度。 表4 本研究方法分類結果精度評價 總體上看,規則分類取得了較好的分類效果。與原始圖像相比,可以看出圖中有一部分草地區域被分類成林木區域,降低了其總體分類精度;道路類別存在極個別的錯分和漏分現象,情況不太嚴重;裸地和其他2個類別存在較嚴重的錯分現象,較大程度地影響了分類精度。 表4為規則分類模型方法對無人機數據集分類結果的混淆矩陣,每行的數值代表此類別樣本被正確或錯誤分類的樣本數。由表4可以看出,分類總體精度為91.94%,Kappa系數為84.20%,分類精度較好,能夠滿足林業需求。林木的用戶精度為92.53%,雖然植被與非植被的光譜特征相似,但是加入多尺度紋理特征和VI′(一般用VI′來計算獲得RGB影像的植被指數)后,使其與另外2種地物得到了較好的區分。草地雖然與部分林木光譜特征相似,且存在一定的混合分布,但通過紋理特征得到了較好的區分,用戶精度為 93.16%。 將本研究方法與文獻[6]、[2]中的方法進行林木提取結果比較,選取3種分類方法的分類精度和Kappa系數對比,由表5可知,本研究分類方法的總體分類精度和Kappa系數優于其他2種方法,是由于本研究采用基于FCM聚類算法的粗糙集理論進行特征約簡,消除了特征冗余,并優選出合適的、分類精度更高的分類特征,降低了錯分率。 表5 3種方法比較分析結果 本研究結合無人機影像的光譜特征和紋理特征,利用FCM聚類算法與粗糙集理論進行特征約簡,減少了特征冗余,實現了林木提取特征向量的優選,完成了林木規則分類提取,并將其結果與其他分類方法進行比較。最后,比較和分析了3種不同分類方法的分類效果和分類精度,結果表明,本方法的分類效果較好,解決了降低錯分率和有效降低混合像元等問題,并很好地表達了影像上真實林木特征信息。遙感分類規則能清晰地描述地物分類中的復雜關系,能夠改善分類效果。同時,本方法也存在一些問題,其分類規則集不具有通用性。2.2 特征約簡

2.3 SVM評估測試

3 規則分類
3.1 影像分割

3.2 分類規則集的建立

4 分類結果及分析
4.1 結果與分析


4.2 與其他方法比較分析

5 結論