999精品在线视频,手机成人午夜在线视频,久久不卡国产精品无码,中日无码在线观看,成人av手机在线观看,日韩精品亚洲一区中文字幕,亚洲av无码人妻,四虎国产在线观看 ?

基于高分一號特征優選的CART決策樹面向對象分類研究

2019-06-21 06:06:36趙英俊
資源環境與工程 2019年2期
關鍵詞:分類特征方法

李 明, 趙英俊

(核工業北京地質研究院,北京 100029)

隨著高分辨率衛星影像應用愈加廣泛,如何利用高分辨率遙感影像豐富的光譜信息、紋理信息、幾何及語義信息進行計算機自動快速提取信息成為遙感技術領域的一項重要研究。

面向對象影像分析方法使得對地物不同特征的分析上升到了一個新的高度,在利用高分辨率遙感影像對自然資源及土地資源的研究中,如何利用一個個同質“對象”豐富各項信息、準確快速地區別較難區分的地物類型是一個難點。單純地利用光譜信息而忽略紋理信息會導致“錯分、漏分”等現象,但是傳統的監督分類如果加入紋理信息又會導致計算量過大、分類效率降低、分類精度有限等問題,因此在面向對象影像分析的基礎上,出現了模糊分類法、SVM支持向量機分類法、C45決策樹分類法、人工神經網絡分類法等眾多影像分類方法。 這些方法相比于傳統的基于像元的分類方法分類精度有了明顯提高。

本文所研究的CART決策樹分類方法具有自動選擇分類特征、自動確定閾值、運算速度快、分類精度高等諸多優點[1],因此非常適合在自然資源及土地覆蓋的計算機自動提取工作中得到應用,能夠大大加快工作效率,提高分類精度。

1 研究區及數據預處理

研究區位于陜西省榆林市北部神木縣,東經109°44′53″~109°52′10″,北緯39°5′49″~39°5′57″,面積71.15 km2,地處毛烏素沙漠東南緣,陜、晉、蒙接壤地帶,典型的黃土地貌,地處丘陵、森林草原向沙漠、干草原的過渡地帶,基本土壤為風沙土和黃土,石多土薄,水土流失嚴重。氣候屬中溫帶半干旱大陸性季風氣候,四季分明,春季多風,夏季炎熱,多雷陣雨,秋季多雨,冬季寒冷干燥,多西北風。年平均氣溫7.5~8.0℃,最熱為 7月,平均23.9℃,極端最高氣溫38.9℃,最冷為一月,平均-8.4℃,極端最低氣溫-24℃;年平均降雨量460 mm,年蒸發量1 200 mm,最大年降雨量849.6 mm,最少199.6 mm。

研究所用影像數據為2015年6月8日高分一號衛星PMS2全色/多光譜相機影像。高分一號衛星是中國“高分專項”計劃的第一顆衛星,突破了高空間分辨率、多光譜與寬覆蓋相結合的光學遙感技術,搭載了兩臺2 m分辨率全色/8 m分辨率多光譜PMS相機與四臺16 m分辨率多光譜WFV相機,全色波段光譜范圍為0.45~0.9 μm,多光譜四個波段光譜范圍分別為Band1(0.45~0.52 μm)、Band2(0.52~0.59 μm)、Band3(0.63~0.69 μm)、Band4(0.77~0.89 μm)。其中作為精度驗證的人工目視解譯所用影像為高分二號2 m分辨率影像。本文所用影像經過輻射校正—大氣校正—幾何校正—影像融合四個階段的預處理達到了研究所需。

2 CART決策樹

決策樹常用的算法有CART、C4.5和D3等[2],CART(Classification And Regression Tree)決策樹算法1984年由Breiman提出,采用經濟學中的基尼系數來作為選擇最佳測試變量(分類特征)和分割閾值(特征閾值)的標準,其定義如下所示:

(1)

(2)

(3)

式中:p(j/h)是從訓練樣本集中隨機抽取一個樣本,當某一測試變量值為h時屬于第j類的概率;nj(h)為訓練樣本中測試變量值為h時屬于第j類的樣本個數;n(h)為訓練樣本中該測試變量值為h的樣本個數;j為類別個數[3]。CART也屬于監督分類方法之一,在執行分類前,需要提供指定的訓練樣本對其進行構建與評價。訓練樣本結構如下:

L=X1,X2,…Xm,YX2=x11,x12,…x1t1

(4)

Xm=xm1,xm2,…xmtnY=Y1,Y2,…Yk

(5)

式中:X1,X2,…,Xm稱為屬性向量(Attribute Vectors)。其屬性可以是有序的,也可以是離散的;Y稱為標簽向量(Label Vectors),其屬性可以是有序的,也可以是離散的。由訓練樣本公式可以看出,該算法既可用于分類,又可用于連續變量的預測,它的基本原理是:將訓練數據集(訓練樣本)劃分為測試變量和目標變量,通過對這兩變量的循環分析形成二叉決策樹。分類算法公式如下:

(6)

訓練數據集D={(x1,y1),(x2,y2)…(xn,yn)},利用特征A的取值a將數據分為兩部分,計算A=a時的基尼系數,對整個數據集中所有的可能特征A以及其可能取值a選取基尼系數最小的特征A*與特征下的取值a*,將數據集切分,數據D1、D2分到兩個子節點中去,對子節點遞歸的重復迭代直至滿足所有條件。回歸算法公式如下:

(7)

(8)

(9)

預剪枝算法如下:

(10)

a=mina,gt

(11)

設T=T0,k=0,a=+,自上而下地訪問內部節點t,對最小的g(t)=ag(t)=a進行剪枝,并對葉節點t以多數表決形式決定其類別,得到樹T。令k=k+1,ak=a,Tk=T,對于產生的子樹序列{T0,T1,…,Tn}分別計算損失,得到最優子樹T*并返回[4]。

相對于其他的決策樹模型,CART決策樹模型CART算法具有如下特點:嚴格無參數,對輸入數據沒有任何統計分布的假設要求;能夠清楚地指出變量對于分類的重要性,選擇與分類相關的變量;方法實現簡單,運行速度較快;結構清晰,容易理解。

3 面向對象分類

BaatzM和Sch?peA針對高分辨率遙感影像的特點,提出了面向對象的遙感影像分類方法[5]。分析單元是由分割形成的具有相同特征的像元組成的同質對象[6],分析目標對象的相關特征屬性,包括光譜、形狀、紋理、陰影、空間位置等,隨后應用不同的分類方法建立相應的規則對分割得到的同質性對象進行影像分類和信息提取。相對于傳統的基于像元的分析方法,面向對象的影像分析方法能夠充分考慮對象之間的語義信息[7],根據所提取的目標可以調整不同的尺度,從較高層次對影像進行分類,因此解決了由于單個像元光譜異質性大而導致的高光譜遙感分類“胡椒鹽”噪聲問題,以及基于像元方法中存在的“同物異譜,同譜異物”現象。

3.1 多尺度分割

依據分割時使用的灰度特征和紋理特征,影像分割方法可分為直方圖閾值、特征空間聚類、區域增長與合并、邊緣檢測4種類型[8],其中應用最為廣泛、最為成功的面向對象影像分割技術是基于分形網絡演化算法(Fractal Net Evolution Approach,FNEA)的多尺度分割(multi-scalesegmentation)方法,該方法是基于鄰域異質性最小的原則以隨機單個像元作為起始點,形成對象自下而上的區域合并。

如何確定最優分割尺度是目前研究的一個重要方向,王志華等以利用分型網絡演化分割算法為例,開展尺度參數選擇研究[9];明冬萍等提出了基于譜空間統計的高分辨率影像分割尺度估計方法[10];殷瑞娟等利用主成分變換后的特征值作為各個主成分圖像的權重,改進了原分割質量評價值(GS),并利用GS值確定最優分割指數[11]。本文使用eCognition9.0實現影像分割,分割參數主要包括波段的權重、均質性因子和分割尺度。影像對象的異質性閾值由分割尺度決定。本文采取建立多個分割層、利用光譜差異分割的方法進行影像分割,并利用OIF最佳指數法選取432波段組合,經過反復對比實驗(圖1),最終針對研究區建立了較為合適的分割參數設置,如圖2所示。

圖1 分割尺度研究Fig.1 The research of the segmentation scale

3.2 樣本選擇及特征選取

根據實際項目解譯要求,將訓練區分為草地、林地、耕地、水體、其它土地五類。輔以2016年人工目視解譯結果作為參考,進行訓練樣本的選擇并分析所選樣本的光譜特征及紋理特征,依據地類區分難易程度進行樣本由多到少的選取。

根據樣本統計結果,初步選擇光譜特征:432波段的均值、標準差、比率、亮度、NDVI(植被指數)、NDWI(水體指數)、MSAVI(修正土壤調整植被指數);形狀特征:長寬比、形狀指數。紋理特征計算方法應用Haralick等人提出的灰度共生矩陣方法[12]。用兩個位置象素的聯合概率密度來定義共生矩陣,它不僅能夠反映亮度的分布特性,也反映具有同樣亮度或接近亮度的象素之間的位置分布特性,是有關圖像亮度變化的二階統計特征。從共生矩陣導出一些反映矩陣狀況的參數,如對比度、相關度、熵、均值、差異性、均勻度[13]。

圖2 分割參數設置Fig.2 The settings of the segmentation parameter

本文主要針對較難區分的草地、耕地等地類引入紋理特征進行提取,這些地類在近紅外波段反射值較高、可區分性最大,因此針對近紅外波段進行上述紋理特征的全方向提取。個別特征計算方法介紹如下:

(12)

(13)

(14)

本文運用eCognition9.0針對分割后的對象進行紋理特征的提取,不需要通過計算J-M距離來調整窗口大小而可以直接計算各紋理特征。初步選取紋理特征如下:con-對比度、cor-相關度、ent-熵、mean-均值、dis-差異性、hom-均勻度。

(15)

(16)

(17)

(18)

(19)

(20)

初步選取光譜形狀及紋理特征共計21個,運用CART決策樹分類時,考慮到運算速度及較難區分地物比如耕地、草地等能更加充分利用所選特征來進行判斷,較容易區分的水體應用NDWI指數通過設定閾值單獨提取。

3.3 優化特征空間及分類結果對比

特征的選擇并不是越多越好,相反盲目地使用多種特征所導致的計算量急劇增大、分類精度降低、分類特征冗余問題是會大大影響整個分類過程的[14],因此如何找到類別之間區分最大平均、最小距離的特征組合,優化特征空間是一個值得研究的問題。叢佃敏等選取研究區分割對象的48個特征,利用OOB誤分率對各個特征的重要性排序,從而優化特征空間[15];林鵬等運用遺傳算法對初始特征集進行最優特征集提取[16];余曉敏等運用改進的SEaTH算法進行特征優選[17]。本文所用CART決策樹分類方法能夠自動選擇特征,自動確定閾值,利用易康9.0特征優選工具FSO模塊優選出的特征構建特征空間進行自動分類,其中,FSO工具優選結果如圖3。

圖3 FSO工具特征維數與區分距離關系Fig.3 The relationship between feature dimension and distinguish distance

這里可以看到,排除水體單獨提取所用到的NDWI指數,初選的20個特征在14個特征組合時樣本之間的區分距離達到最大,光譜特征分別是:3波段的比率標準差及均值、NDVI、4波段的比率標準差、形狀指數、長寬比,初選的6個紋理特征全部在優選的特征范圍內,可見紋理特征在訓練樣本的區分中起到了較為明顯的作用,但由于最鄰近分類引入紋理特征分類時會導致計算量過大、運算速度過慢,因此在最鄰近分類時采用8個特征進行分類,分別是:形狀指數、3波段比率和標準差、NDVI、紋理相關性、紋理差異性、紋理均勻度及4波段比值。基于所選特征,利用FSO工具計算所選訓練樣本的可分離度,如圖4所示。

圖4 訓練樣本在14個特征組合時的可分離度Fig.4 The separable degrees of the training samples combined with 14 features

可以看出所選訓練樣本林地與草地的可分離度較差(只有1.18),草地與耕地的可分離度最差為1.15,在所選特征保持不變的前提下,通過進一步調整所選樣本,最終使得林地、草地分離度達到1.35,草地與耕地分離度達到1.26。

由于訓練樣本相同,為了加快運算速度、提高分類精度,CART分類利用FSO工具進行特征優選后的14個特征進行特征空間的構建,其中水體用NDWI指數單獨提取,建樹如下。

在訓練樣本相同的條件下,最鄰近分類、CART決策樹分類結果如圖5、圖6所示。

圖5 基于光譜及紋理特征執行的CART決策樹Fig.5 The process of CART decision tree based on spectrum and texture features

圖6 最鄰近分類(左)與CART分類(右)結果圖Fig.6 The results of the classification between nearest neighbor(left) and CART decision tree(right)

3.4 精度評價

為了客觀地評價研究區不同分類方法的結果精度,采用野外實地驗證的110個控制點建立混淆矩陣進行分類結果精度評價,最鄰近分類、CART分類精度及各項指標如表1、表2所示。

總體來看,最鄰近分類方法在總體分類精度上略高于CART決策樹分類,但是在數據處理運算速度上,兩者相差過大,這是由于兩者不同的分類原理導致的。即使CART分類所選用的特征比最鄰近的多了6個,但是運算速度相差60倍。兩種分類方法在草地的分類上都不是很理想,尤其是CART決策樹分類,在草地與其它土地的錯分率和漏分率均高于最鄰近分類,而在耕地的分類上精度明顯高于最鄰近分類。結合原始影像分析,最鄰近分類是通過某個樣本在特征空間中最相鄰的幾個樣本特征來歸類,這種判斷方法更加適合研究區林草地混雜的情況,而CART決策樹分類可能在草地的分類中產生了過擬合現象。對于CART決策樹而言,通過選取更多更精確的訓練樣本,對于較難區分的地類其錯分率和誤分率可以得到有效降低。而在耕地分類中,最鄰近分類將少數耕地分為了水體是錯誤的,CART分類將少數其它土地(實際為廢棄的水坑)分為了水體,結合影像來看是可以理解的。

表1 最鄰近分類結果精度評價表Table 1 The accuracy evaluation of the nearest neighbor

表2 CART分類結果精度評價表Table 2 The accuracy evaluation of the CART decision tree

4 結論

目前面向對象分類方法中,CART決策樹是一種高效準確的分類方法。在保證精確訓練樣本和有效特征空間構建的前提下,該方法能夠準確高速對影像數據進行自動分類,并且取得較高的精度。尤其是在處理大數據量的影像數據中,該方法具有很大的應用價值。雖然CART算法能夠自動選取特征及確定閾值,但是如何選取這種特征并沒有詳細的算法,而且過量的特征也會導致信息的冗余和分類速度的減慢,會出現過擬合導致分類精度的降低。本文經過其與最鄰近方法的對比,利用其優化特征空間工具FSO,對分類特征進行初步優選,在保證分類精度的前提下,加快了運算速度,提高了工作效率。

猜你喜歡
分類特征方法
分類算一算
如何表達“特征”
不忠誠的四個特征
當代陜西(2019年10期)2019-06-03 10:12:04
分類討論求坐標
數據分析中的分類討論
教你一招:數的分類
抓住特征巧觀察
用對方法才能瘦
Coco薇(2016年2期)2016-03-22 02:42:52
四大方法 教你不再“坐以待病”!
Coco薇(2015年1期)2015-08-13 02:47:34
捕魚
主站蜘蛛池模板: 无码一区二区波多野结衣播放搜索| 国产精品视频第一专区| 免费无遮挡AV| 无码丝袜人妻| 国内精品免费| 国产剧情国内精品原创| 亚洲国产成熟视频在线多多| 日本不卡视频在线| 欧美一级色视频| 91精品国产自产91精品资源| 亚洲人成日本在线观看| 日本手机在线视频| 久久美女精品国产精品亚洲| 成人a免费α片在线视频网站| 91av国产在线| 久久久精品无码一区二区三区| av性天堂网| 国产一级在线观看www色| 亚洲精品天堂在线观看| 亚洲不卡无码av中文字幕| 国产成人福利在线| 免费看a级毛片| 国产精品成人一区二区| 亚洲国产成人无码AV在线影院L| 亚洲综合久久成人AV| 日本一区二区三区精品AⅤ| 亚洲国产91人成在线| 国产人前露出系列视频| 国精品91人妻无码一区二区三区| 91福利在线看| 中文字幕亚洲精品2页| 日韩精品高清自在线| 亚洲无码高清一区| 凹凸精品免费精品视频| 中文字幕啪啪| 精品人妻系列无码专区久久| 色妞www精品视频一级下载| 99热这里只有精品5| 日本三区视频| 国产人妖视频一区在线观看| 91在线无码精品秘九色APP| 欧美精品高清| 中国成人在线视频| 人妻免费无码不卡视频| 欧美成人影院亚洲综合图| 日韩欧美国产三级| 久久久波多野结衣av一区二区| 97色婷婷成人综合在线观看| 91麻豆精品视频| 亚洲精品少妇熟女| 亚洲成a人片| 国产毛片一区| 狠狠色丁香婷婷综合| 囯产av无码片毛片一级| 91精品国产麻豆国产自产在线| www.国产福利| 国产精品女人呻吟在线观看| 午夜人性色福利无码视频在线观看| 国产免费看久久久| 国产精品成人久久| 久久久四虎成人永久免费网站| 国产特一级毛片| 久久精品国产精品青草app| 无码国内精品人妻少妇蜜桃视频| 99手机在线视频| 91精品国产综合久久香蕉922| 国产视频大全| 日韩欧美中文字幕一本| 26uuu国产精品视频| 亚洲综合香蕉| 国产97公开成人免费视频| 欧美成人免费一区在线播放| 日韩AV手机在线观看蜜芽| 中文字幕波多野不卡一区| 亚洲成人一区二区| 2022精品国偷自产免费观看| 亚洲男女在线| 精品国产女同疯狂摩擦2| 亚洲精品成人片在线观看| 亚洲无码在线午夜电影| 99视频全部免费| 欧美在线视频不卡第一页|