徐世武,楊 雙,孫 飛,郭慶華
(1.中國地質大學(武漢),湖北武漢 430074;2.中國科學院植物研究所,北京 100093)
面向對象的高分辨率影像單值分類耕地提取方法研究
徐世武1,楊 雙1,孫 飛1,郭慶華2
(1.中國地質大學(武漢),湖北武漢 430074;2.中國科學院植物研究所,北京 100093)
隨著城市化進程的加快,耕地面積逐年減少,實時監測耕地信息已成為國土管理部門關注的問題。利用傳統遙感分類器提取地面覆蓋信息要求定義所有感興趣的類別[1],分類系統需要滿足互斥性、完備性、層次性[2]。但在很多應用中,用戶只關心某一特定地類[3],如耕地提取,如果只需標記感興趣的地類(即目標類),勢必減少真實地表數據采集、樣本選取耗費的大量人力和時間。本文將從影像中提取某一類特定地類問題,定義為單值分類問題。
由于傳統的監督分類器需要全類別樣本,故無法直接將其應用于單值分類問題[4]。其次,缺少部分類別的不完全訓練集是對地表景觀的不完全認識,硬分類器采用的加權硬閾值難以模擬真實分布,神經網絡作為一種“軟”處理,在數學上可微,更適合處理不完全訓練集問題[2]。Li等[5]將Elkan和Noto提出的基于正樣本、未標記樣本的學習算法(positive and unlabeled learning,PUL)[6]應用于遙感分類問題,其分類精度優于支持向量機法(BSVM)、一值支持向量機(OCSVM)和高斯域描述(GDD)3種單值分類算法。因此,本文采用這種新算法來解決單值分類問題,并采用神經網絡分類器來實現。
隨著遙感數據分辨率的提高,地物類別內部的光譜響應變異增大,降低類別可分性,導致傳統基于像元的遙感影像分析方法無法滿足分類需求。已有大量研究表明,面向對象的影像分析可有效地對高分辨率影像進行信息自動提取[7],其特點為處理對象為多尺度分割、封裝后的目標,即影像上形狀與光譜性質具同質性的單元[8],將像素進行對象級封裝,在利用光譜信息的同時,考慮其空間特征,并結合對象的紋理與鄰域信息,進而更接近人類的認知過程[9]。
因此,本文在完全訓練集和不完全訓練集下,利用結合面向對象和基于正樣本、未標記樣本的單值(PUL)分類方法對多源高空間分辨率影像進行耕地信息提取研究,選取7塊研究區,對比基于像素的分類試驗,經特征影像提取、抽樣、分類器學習、類別判別及精度評價得到試驗結果。
1.數據獲取
本文選取了3種高分辨率影像數據:廣西北海市鐵山港區(樣區1―3,0.2 m航空數據)、武漢市洪山區光谷一帶區域(樣區4―5,2.44 m QuickBird影像數據)、湖北省大冶市(樣區6―7,2.5 m SPOT影像數據)。試驗樣區大小為1000像素×1000像素,7組試驗樣區包含了幾種典型的土地覆蓋類型,如有覆蓋的耕地類型、無覆蓋的耕地類型、道路、水體、居民地、林地、裸地等。
2.圖像分割和特征提取
本文采用ENVI定義的基于邊界的分割算法,采用多尺度切割方法,綜合考慮光譜特征、緊密度和光滑度等幾何特征,生成同質的影像對象多邊形。影像分割后提取緊密度、多邊形圓特征、形狀要素、矩形形狀量度,波段平均灰度值、灰度值標準差、卷積核內的平均灰度值、卷積核內平均信息熵、飽和度及亮度作為耕地的判別特征。
3.基于面向對象的單值分類試驗
在特征提取的基礎上,按照各個類別隨機抽樣,訓練集需要包括正樣本(目標樣本)及背景樣本(未標記樣本),使用完全訓練集和不完全訓練集進行傳統神經網絡和單值分類框架網絡訓練,單值分類在網絡訓練的同時估算常數c值。根據概率模型計算各個像素屬于各個類別的后驗概率,依據最大概率原則決定每個像元的歸屬,同時設置閾值0.5控制后驗概率的可靠性。最后,計算遙感分類的各個精度指標并進行精度評價。PUL模型詳細見Elkan相關論述[8](如圖1所示)。
4.基于像素的單值分類試驗
本文中用于對比的基于像素分類試驗,除處理對象、特征提取不同之外,為增加可比性,其他步驟均與基于面向對象分類試驗相同。該部分試驗特征提取均基于影像二階概率紋理統計,選取的紋理因子包括均值、方差、協同性、對比度和二階矩,且均采用3×3開窗計算。

圖1 PUL單值分類框架
表1是不同分辨率的7組試驗樣區抽樣大小為正樣本800的10次試驗結果平均值。

表1 基于像素分類結果與面向對象分類結果對比表
從表1中2.44 m數據基于面向對象的結果中可以明顯看出,在不完全訓練集的情況下,對于傳統的神經網絡分類,相比完全訓練集的情況,總體精度有5%~7%的降低,Kappa系數有8%~11%的下降,而PUL方法的則只有0~1%的下降,對于部分數據有1%左右的提高。這就說明,在缺少部分類型先驗知識的情況下,對于傳統的方法有很大的影響,而PUL方法則有相對比較穩定的表現。同時PUL方法在不完全訓練集作用下比傳統神經網絡分類總體精度高2%~5%,平均高出3.5%;Kappa系數高4%~8%,平均高出6.3%,說明單值PUL分類與傳統神經網絡分類相比有較高的優勢。
為了驗證多源高分辨數據是否都有這個現象,對于0.2 m數據和2.5 m數據也進行同樣的分析,結果發現2.5 m數據有相同的現象,而對于0.2 m更高分辨率數據卻發現在不完全訓練集下傳統方法與PUL方法的精度相當,其差異不超過1%。通過以上分析,可初步得到在不完全訓練集下2.44 m數據和2.5 m數據面向對象的單值分類要優于傳統方法,并且在缺少部分類別時有相對比較穩定的表現,而對于更高分辨率的0.2 m航空影像數據卻沒有這個規律的結論。
另從表1中可以明顯看出,基于面向對象法的分類結果在對應的數值上均要優于基于像素的分類結果。在不完全訓練集下,單值分類,對于0.2 m數據,基于面向對象的總體分類精度比基于像素高2.3%~16.8%,平均高出10.4%,kappa系數高2.4%~23.5%,平均高出17.3%;對于2.44 m數據,總體精度平均高17.5%,Kappa系數平均高出25.3%;對于2.5 m數據,總體分類精度平均高出11.4%,kappa系數平均高出15.6%。
綜合以上分析,在不完全訓練集模式下,可得到基于面向對象的單值分類有較大優勢的結論。
將樣區1(0.2 m數據)基于面向對象和基于像素的分類結果進行可視化,對比真實地物分布矢量圖(土地調查成果數據加以人工解譯修正),比較完全訓練集和不完全訓練集下的傳統方法與單值分類對于耕地的提取效率。如圖2―圖4所示(均為原始結果,未進行分類后處理)。

圖2 樣區1

圖3 樣區1面向對像分類結果

圖4 樣區1基于像素的分類結果
圖2―圖4中淺灰色部分代表道路,黑色部分代表有覆蓋耕地,深灰色部分代表無覆蓋耕地,特別的,白色部分代表類型不確定部分(其他類),可能為陰影區域或者地類分界處。從目視效果來看,對于典型地物基于像素和基于面向對象的傳統方法和單值分類方法均可以正確判別。在基于面向對象的分類結果中,完全訓練集下,傳統神經網絡分類明顯存在很多錯分現象,在耕地中存在大量的白色區域,而單值分類則較少錯分;對于不完全訓練集,傳統方法由于不充分地訓練學習,造成白色代表的不確定類別錯分為已知類,而單值分類結果則比較穩定。在基于像素的分類結果中,完全訓練集下,傳統分類中存在大量白色區域,明顯多于相同條件下的單值分類結果。而對于不完全訓練集兩種方法結果中白色區域都非常的少,但與真實地表矢量圖的吻合度要低于基于面向對象的分類結果。
本文結合面向對象的思想和基于正樣本、未標記樣本遙感單值分類方法對多源高空間分辨率影像進行分類,同時對比基于像素的分類試驗。結果表明:
1)對不完全訓練集問題,單值分類較傳統神經網絡分類有更較穩定的表現。
2)對多源高分辨數據,在解決不完全樣本問題上,面向對象的分類精度都要遠高于基于像素的分類精度。單值分類應用面向對象分類可以提高分類精度。
3)基于面向對象的分類效果圖與真實地表矢量圖的吻合度明顯要優于基于像素的分類效果圖。單值分類對于不完全樣本集問題具有更穩定的表現。
[1]HODGSON M E,JENSEN J R,TULLIS J A,et al. Synergistic Use of LiDAR and Color Aerial Photography for Mapping Urban Parcel Imperviousness[J].Photogrammetry Engineering&RemoteSensing,2003,69(9):973-980.
[2]RICHARDS J A,JIA X.Remote Sensing Digital Image Analysis:An Introduction[M].Berlin:Springer,1999.
[3]FOODY G M,MATHUR A,SANCHEZ H C,et al. Training Set Size Requirements for the Classification of a Specific Class[J].Remote Sensing of Environment,2006,104(1):1-14.
[4]MUNOZ M J,BRUZZONE L,CAMPS V G.A Support Vector Domain Description Approach to Supervised Classification of Remote Sensing Images[J].IEEE Transactions on Geoscience and Remote Sensing,2007,45(8):2683-2692.
[5]LI W,GUO Q H,ELKAN C.A Positive and Unlabeled Learning Algorithm for One-class Classification of Remote-sensing Data[J].IEEE Transactions on Geoscience and Remote Sensing,2011,49(2):717-725.
[6]ELKAN C,NOTO K.Learning Classifiers from Only Positive and Unlabeled Data[C]∥Proceedings of the 14th ACM SIGKDD International Conference on Knowledge Discovery and Data Mining.Las Vegas,Nevada,USA:[s.n.],2008.
[7]OPITZ D,BLUNDELL S.Object Recognition and Image Segmentation:The Feature Analyst Approach[C]∥Object-Based Image Analysis.Berlin:Springer Berlin Heidelberg,2008:153-167.
[8]BENZ U.Definiens Imaging GmbH:Object-Oriented Classification and Feature Detection[J].IEEE Geoscience and Remote sensing Society Newsletter,2001(5):16-20.
[9]GAMOTTO J P.A New Approach to Combining Region Growing and Edge Detection[J].Pattern Recognition Letters,1993,14(11):869-875.
Method Research on Cultivated Land Extraction Based on Object One-Class Classification of High-spatial-resolution Images
XU Shiwu,YANG Shuang,SUN Fei,GUO Qinghua
遙感技術已廣泛應用于土地覆蓋/土地利用分類中。在專題應用中,用戶只對某一類地物感興趣,如耕地提取,即單類別分類問題。隨著影像分辨率的提高,基于像元的分類算法難以滿足高分辨率影像高精度信息提取的需求。本文采用結合面向對象分類思想和基于正樣本、未標記樣本遙感單值(PUL)分類方法從多源高分辨率影像中提取耕地信息,并與基于像素的分類試驗進行對比分析。結果表明,在缺少部分地類的不完全訓練集下,基于面向對象的單值分類較傳統神經網絡分類有更較穩定的表現,并且遠優于基于像素的分類結果。
面向對象;單值(PUL)分類;多源高分辨率影像;耕地;不完全訓練集
P236
B
0494-0911(2014)10-0078-04
2013-08-20
國土空間規劃決策支持與管理平臺開發(2012BAB11B05);國土空間優化配置關鍵技術研究與示范(2012BAB11B00)
徐世武(1973―),男,土家族,湖北長陽人,博士,副教授,主要從事國產GIS、遙感、國土資源管理的教學、科研與成果產業化工作。
楊 雙
徐世武,楊雙,孫飛,等.面向對象的高分辨率影像單值分類耕地提取方法研究[J].測繪通報,2014(10):78-81.
10.13474/j.cnki. 11-2246.2014.0334