郝 明,史文中,張 華
(1. 中國礦業大學 環境與測繪學院,江蘇 徐州 221116; 2. 香港理工大學 土地測量與地理資訊系,香港 999077)
基于遙感數據自動提取建筑物和建筑物的三維重建是當前研究的熱點[1-4]。利用人工提取方法從高分辨率遙感影像中提取建筑物耗時長、費用高,而利用計算機自動提取建筑物則會受到建筑物陰影及“同譜異物”現象的干擾,導致自動提取結果精度偏低。機載激光掃描測高(light detection and ranging, LiDAR)技術的蓬勃發展,為建筑物的提取和三維重建提供了新的數據源和方法,并取得了較好的效果。
LiDAR技術是激光掃描測距系統、慣性測量系統(inertial measurement unit, IMU)、動態差分全球定位系統(GPS)、成像系統和計算機的集成,能夠快速獲取高精度的地物和地面三維信息,并存儲為海量的點云數據,具有全天候和大面積作業的優點。近年來,國內外學者對基于LiDAR數據的建筑物提取作了大量研究。文獻[2]利用馬爾可夫隨機場(RMF)模型根據建筑物的形狀、面積、空間關系和熵4部分能量進行基于LiDAR數據的建筑物提取;文獻[3]利用多相水平集方法對建筑物屋頂進行分類,并提取屋頂形狀,進而得到更精確的建筑物輪廓;文獻[5]根據灰度共生矩陣計算的紋理特征,對規則化后的數字地表模型(DSM)進行建筑物的提取,以區分建筑物與樹木;文獻[6]和文獻[7]將LiDAR數據與高分辨率遙感影像結合進行建筑物的提取,充分利用LiDAR數據的高度信息和影像的光譜信息,取得了較好的效果;文獻[8]利用形態學濾波、區域增長和邊緣探測等方法綜合提取建筑物。研究發現,在一些傳統算法中需要設置建筑物的最小和最大高程值[4, 9],當地形存在較大起伏或呈現階梯狀時,容易導致建筑物遺漏。針對該問題,本文提出一種基于層次(由粗到細)的建筑物提取方法。
本文的試驗方法流程如圖1所示。主要包括:① LiDAR數據的預處理,即對點云數據重采樣,生成DSM;② 利用迭代自組織數據分析(ISODATA)算法根據高度信息對DSM進行聚類;③ 在聚類結果基礎上依次利用建筑物面積、地面高度差和梯度信息進行建筑物信息的初步(粗)提??;④ 最后基于空間鄰域關系對粗提取到的建筑物進行精處理。

圖1 由粗到細的建筑物提取流程圖
為進行建筑物的提取,首先要對LiDAR點云數據進行空間插值生成規則網格的DSM。文獻[10]對12種不同的插值方法(最近鄰插值、克里金插值、多項式回歸和移動均值等)進行了研究,結果表明最近鄰插值對間斷保存信息是適用的,且建筑物的原始高度可以較好地保存在插值后的DSM中,準確提取建筑物不連續性。本文采用最鄰近插值方法對原始點云數據進行插值生成2 m分辨率的網格DSM,作為后續處理的基礎數據。
ISODATA是一種動態聚類算法,得到了廣泛應用[11],本文用其對DSM進行聚類。

(1)
式中,μc是c類的中心。在迭代過程中允許類的分裂、合并和刪除。誤差平方和在迭代中減小,直至達到收斂標準。
本文在ENVI軟件中執行ISODATA算法,對DSM數據進行聚類,需要預先設置控制參數,包括類別數目C、允許迭代的最大次數I、一個類別中樣本的最少數目M、誤差平方和e、類間距離D和每次允許合并的類別對數L。
在完成對DSM距離影像的聚類之后,首先根據建筑物的最大和最小面積對各類進行選擇,初步選出一些面積符合建筑物特征的備選目標Oi,同時超過最大面積的目標認為是地面Gi,并利用這一假設進行下一步提取。
在此基礎之上,利用高度信息,計算備選目標Oi與其最近的地面G之間的高差hi
hi=Hi-HG
(2)
式中,Hi和HG分別為備選目標Oi和距其最近的地面G的平均高度。若hi小于設定的閾值,則認為備選目標Oi不是建筑物?;诟卟畹姆椒ù媪藗鹘y的設置建筑物最小高度的方法,在一定程度上避免了由于地形起伏較大引起的建筑物錯誤提取。
最后根據DSM的坡度信息,對備選目標作進一步提取。計算備選目標的平均坡度值,并與設置的坡度閾值比較,如果大于坡度閾值,則認為備選目標是建筑物,否則為非建筑物。經過上述處理,完成建筑物的粗提取。
基于粗提取到的建筑物信息,根據DSM距離影像像元之間的空間8鄰域信息,如圖2所示,對提取的建筑物內部的小洞進行填充,對粗提取建筑物進行精處理。

圖2 空間8鄰域關系示意圖
該試驗以徐州某大學校園的LiDAR數據為例,大小約為1.2 km×1.3 km。經過最近鄰插值后生成2 m分辨率的DSM距離影像,如圖3所示,大小為596像素×651像素,最低和最高處分別為29 m和118 m。

圖3 最近鄰插值后生成的DSM
在ENVI軟件中執行ISODATA算法,對DSM距離影像進行聚類,初始參數設置如下:最小類別數為5,最大類別數為10,允許迭代的最大次數為20,一個類別中的最少數目為50,類間距離為10,每次允許合并的類別數為2。經過迭代,DSM距離影像最終被聚為10類,如圖4所示。
依據聚類結果,依次對每類進行建筑物的粗提取。首先設置建筑物的最小和最大像素數目分別為25和2500,提取的備選目標如圖5所示??梢钥闯觯ㄖ锉惶崛〉耐瑫r,也有一些山體、樹木和高坡被提取出來。此外,面積大于2500像素的目標認為是地面,并記錄下來,為高差閾值提取建筑物提供地面信息。

圖4 ISODATA算法聚類結果

圖5 面積閾值提取的備選建筑物
在此基礎之上,判斷備選建筑物平均高度與距其最近地面的平均高度之差,若小于設定的閾值,則認為備選目標是地面;反之則認為是建筑物,接受后續處理。本文中設置高差閾值為3 m,處理后的結果如圖6所示。從圖中可以看出,原來建筑物內部的區域已被去除。

圖6 高差閾值提取的備選建筑物
建筑物粗提取的最后一步是根據備選建筑物的坡度信息判定其真實性。圖7為試驗區的坡度圖,最小值為0,最大值為89,本文設置坡度閾值為40。提取的結果如圖8所示。

圖7 試驗區坡度信息

圖8 坡度閾值提取的建筑物
最后根據DSM距離影像的空間8鄰域關系,對提取的建筑物進行填充,最終的提取結果如圖9所示。

圖9 最終提取的建筑物
從圖9中可以看出,校園的主體建筑物均被提取出來,并且位于山坡下和校園內低矮的建筑物也能被提取。但是由于面積、高度差和坡度等閾值的設置,不可避免地造成了一些面積較小或與地面高差較小的建筑物的漏提或錯提,見表1。試驗區共有93棟建筑物,漏提和錯提的建筑物分別為4棟和3棟,有89棟建筑物被正確提取出來,總誤差為7.5%,實現了高精度的建筑物自動提取。

表1 建筑物提取誤差統計
影響本文方法精度的因素主要是ISODATA聚類數目和面積、高差、坡度閾值的設置。在ISODATA聚類過程中,類別數目設置過多或過少都會影響建筑物聚類的完整性,降低提取精度。在設置面積、高差和坡度閾值時,如果設置的閾值不恰當,將造成建筑物的漏提或錯提。因此最好對測區有些先驗知識,或者經過多次試驗調節這些閾值,以提高建筑物的提取精度。
針對LiDAR點云數據的特點,本文提出一種由粗到細的建筑物自動提取方法。試驗表明,經過粗提取和精處理,絕大部分建筑物都能被準確地提取,能夠滿足三維建筑物重建的需要。特別是測區地形起伏較大時,可以避免傳統方法中設置建筑物最小高度而引起的建筑物漏提現象。如果能結合測區的多光譜影像或原始GIS數據等其他信息,可以進一步提高建筑物的提取精度,這也是今后的研究方向。
參考文獻:
[1] BALTSAVIAS E. Object Extraction and Revision by Image Analysis Using Existing Geodata and Knowledge: Current Status and Steps towards Operational Systems [J]. ISPRS Journal of Photogrammetry and Remote Sensing, 2004, 58(3): 129-151.
[2] APARECIDA DOS SANTOS G E, PORFRIO D P A. Extraction of Building Roof Contours from LiDAR Data Using a Markov-Random-Field-Based Approach [J].IEEE Transactions on Geoscience and Remote Sensing, 2012, 50(3): 981-987.
[3] KIM K H, SHAN J. Building Roof Modeling from Airborne Laser Scanning Data Based on Level Set Approach [J]. ISPRS Journal of Photogrammetry and Remote Sensing, 2011, 66(4): 484-497.
[4] 馮甜甜, 龔健雅.基于 LiDAR 數據的建筑物自動提取方法的比較[J].測繪通報, 2011(2):21-23.
[5] 張皓, 黃艷, 楊洋, 等.基于 GLCM 紋理特征的 LiDAR 點云建筑物自動提取[J].測繪通報, 2010(11):31-33.
[6] 郝明, 鄧喀中, 張華.基于遙感數據提取建筑物的主動輪廓改進模型 [J].中國礦業大學學報, 2012,41(5):833-838.
[7] SOHN G, DOWMAN I. Data Fusion of High-resolution Satellite Imagery and LiDAR Data for Automatic Building Extraction[J]. ISPRS Journal of Photogrammetry and Remote Sensing, 2007, 62(1):43-63.
[8] ZHANG K, YAN J,CHEN S C. Automatic Construction of Building Footprints from Airborne LIDAR Data [J].IEEE Transactions on Geoscience and Remote Sensing, 2006, 44(9):2523-2533.
[9] 張小紅. 機載激光雷達測量技術理論與方法[M]. 武漢:武漢大學出版社,2007:137-146.
[10] YANG C S, KAO S P, LEE F B, et al. Twelve Different Interpolation Methods: A Case Study of Surfer 8.0[C]∥Proceedings of the XXth ISPRS Congress.Turkey: Istanbul,2004.
[11] JAIN A K, MURTY M N, FLYNN P J. Data Clustering: A Review[J].ACM Computing Surveys, 1999, 31(3):264-323.
[12] TARABALKA Y, BENEDIKTSSON J A, CHANUSSOT J. Spectral-spatial Classification of Hyperspectral Imagery Based on Partitional Clustering Techniques [J].IEEE Transactions on Geoscience and Remote Sensing, 2009, 47(8):2973-2987.