王婷婷
(臨沂職業學院 建筑工程學院, 山東 臨沂 276000)
建筑物是數字城市建設的重要組成部分,而建設數字城市的過程中,需要大量的三維空間數據信息。目前空間數據的獲取方式主要有實地測繪、數字化測圖和攝影測量等,數據采集和更新的速度還不能夠滿足城市三維建模的需求。因此,研究一種快速、準確地獲取建筑物信息的方法,將有助于數字城市的發展。使用地面激光點云獲取建筑物空間信息已經成為當前研究熱點,然而在原始點云數據內不僅包含建筑物信息,還含有大量的其他地物如樹、路燈等,因此獲取點云數據后首先要進行建筑物點云數據的提取。根據研究現狀,本文以地物不同特點作為建筑物自動提取算法的依據,實現了一般建筑物點云的自動提取。
車載激光掃描測量技術不受天氣限制和非接觸主動測量方式直接獲取高精度三維數據,已經發展成為傳統測量技術的一個重要補充[1]。車載移動測量系統是測繪領域一個新的發展方向和趨勢[2],其具有采集目標信息速度快、可獲取高密度、海量三維點云的特點,在地形圖的測量與更新、城市三維建模、城市部件采集等領域大量應用[3-5]。該系統主要由激光掃描儀、全球定位系統(Global Positioning System,GPS)、慣性導航系統(Inertial Navigation System,INS)、CCD相機等荷載組成。
本次實驗數據使用青島秀山移動測量公司Vsurs-Q車載移動測量系統(圖1)采集獲得。其主要由FARO130三維激光掃描儀(有效距離為1~30 m,視場角范圍為300°,精度≤2 mm)、諾瓦泰SPAN-LCI組合導航、LADYBUG5全景相機構成,他們之間由工控機連接、監控端控制、時間同步板控制時間同步,能應付多種復雜地形,提高掃描覆蓋率,可快速獲取高精度點云數據和全景數據。該系統小巧靈活,可以測量許多大型車載測量車難以到達的測區。

圖1 VSurs-Q型移動測量系統
車載LiDAR點云豐富、海量、離散,彼此之間并不存在拓撲關系,直接進行點云處理比較復雜。因此本文先分離出路面,然后基于地物的不同特征,實現建筑物點云的自動分類,為建筑物三維建模提供先行條件。
根據城市中各地物點云的特征不同,提出一種建筑物點云自動提取方法,其算法步驟如下:首先對車載LiDAR點云數據進行預處理,包括點云去噪聲地面濾波,接著對離散的地物點利用歐氏距離方法實現空間聚類,然后進行建筑物的提取。通過高差指標,排除掉低矮地物;通過投影面積,去掉桿狀地物和單株樹;通過法向量、投影形狀去掉相連樹,最終實現建筑物的點云分類。建筑物點云自動分類的算法流程如圖2所示。

圖2 建筑物點云提取算法流程圖
將處理好的點云創建如圖3所示的三維空間格網。它是以點云的范圍來搜索確定X、Y、Z方向上的最大值和最小值,Xmax、Ymax、Zmax、Xmin、Ymin、Zmin,這樣就可以確定整個三維格網的最外范圍。立體格網的范圍確定之后,就可以對點云數據區域進行劃分,得到更小的三維體,稱為體元。以XOY平面建立二維水平格網,從南向北的方向設為Y軸,從西向東的方向為X軸,垂直于XOY平面方向設為Z軸。

圖3 三維空間格網
(1)三維格網索引G(r,c,h)的大小為行號、列號、層號構成的三維坐標,三維格網劃分數目計算公式為:
(1)
式中,m、n、k分別為當前點云所在的三維格網在X、Y、Z方向上的劃分數目。
(2)任意一個掃描點,設為(xl,yl,zl),在立體格網中設置X軸為行號(r),Y軸為列號(c),Z軸為層號(h)。則每一個體元可以用行、列和層號來表示,設為G(r,c,h),對應的公式為:
(2)
式中,int為取整函數;Δx、Δy、Δz分別表示格網在X、Y、Z方向上的劃分間距。
(3)對應的三維空間格網號G(r,c,h)計算公式如下:
(3)
(4)三維格網被細分后,點云范圍內每個數據都會被唯一一個小格網包圍,對所有范圍內的點云進行遍歷,最終完成整個區域點云的三維格網化,提高點云管理速度。
車載激光掃描系統測量后得到目標物點云數據在空間是離散分布的,這樣的數據比較雜亂,同時也包含許多沒用的噪聲點云,無法有效利用,因此要對點云進行處理,包括點云去噪和地面濾波。
實際上,去除噪聲點和地面濾波后,每個空間點簇可能由同一地物組成,也可能由不同地物組成。雖然這些點簇在空間上相互獨立,實際上仍然是毫無關聯的離散點,只有進行空間聚類才能實現進一步的分類。在此基礎上,可以對某一類別進行單獨分析,找出這個類別所代表的物體的獨有特征[6-10]。
距離的大小決定著地物點云相似性的程度,通常情況下,距離小則表示相似度高,歐幾里得距離聚類方法是最常用的空間聚類方式之一,其定義為:

(4)
式中,i=(xi1,xi2,…,xim),j=(xj1,xj2,…,xjm);i和j為2個m維數據對象。
對于聚類得到的不同單元,通過建筑物特征分析進行提取,主要從高差、投影面積、分層投影形狀三個方面進行篩選。
(1)高差:是指每個聚類單元中點云的最大值與最小值的差值。一般來說,在城市典型地物中,建筑物、樹木、桿狀地物等的高差相差較大,因此可以根據高差與設置的閾值相比較,區分出低矮地物(一般認為此類地物高差小于1.5 m)。實驗設置高差閾值為1.5 m,高差計算公式如下:
H=Zmax-Zmin
(5)
式中,H為高差;Zmax、Zmin分別表示點云高程的最大值和最小值。
(2)投影面積:通常利用建筑物點云投影到水平地面之后的投影點形成的凸包多邊形的(圖4)面積來表示建筑物投影面積。構建凸包多邊形的方法采用Graham掃描法,Graham掃描法詳細的算法步驟見文獻[11],本文計算建筑物投影面積的步驟如下:
①將建筑物點云投影到地面上,對水平面上的離散投影點集利用Graham掃描法構建凸包;
②計算凸包多邊形的面積:假設凸包多邊形含有n個頂點,則其面積計算公式為:
(6)
式中,xi、yi表示第i個頂點的x坐標和y坐標,xi+1、yi+1表示第i+1個頂點的x坐標和y坐標,凸包多邊形的面積S即為建筑物投影面積,單位為m2。

圖4 凸包多邊形
建筑物比較大,具有整體性,投影面積較大,而相連樹投影后也具有一定的面積,一般都為數平方米;路燈等桿狀地物往往在一定高度處為桿狀,投影面積較小,一般不會大于1 m2;單株樹投影到地面后面積也不會太大;因此可以設定閾值為3 m2,利用投影面積區分建筑物和單株樹及其他桿狀地物。
(3)投影形狀:由于建筑物有可能只掃描到一個立面,相連樹和建筑物投影到地面后,可能都為條帶狀,因此采用分層投影的形狀來區分。投影形狀用緊湊度來表示,計算公式如下:
(7)
式中,D為投影區域的周長;S為投影區域的面積。圓形的緊湊度最大,為1。因此本文算法設定閾值為0.5。
建筑物一般具有整體規則性,在不同高度層的投影形狀基本相同;相連樹木在超過樹干處為離散的類似橢圓形狀,與整體投影到地面的投影形狀相差較大;綜上,可以利用分層投影形狀的方法來分離建筑物和相連樹。
為了驗證本文提取算法的有效性和準確性,利用C#實現本文提出的基于車載LiDAR點云的建筑物信息提取算法,選取了兩個區域進行實例分析。
數據組1如圖5所示,該區域位于山東科技大學南面,包含1 321 436個數據點,高差范圍為90 m。該組數據中主要包含高層建筑物、植被、路燈等地物,本組數據的特點是建筑物比較高、數量少。

圖5 實例1處理結果
數據組2如圖6所示,為青島某地區建筑物點云數據,包含4 378 340個數據點,高差范圍為23 m。該組數據中主要包括相連建筑物、行道樹、路燈等地物。數據特點是范圍稍大、建筑物比較多。

圖6 實例2處理結果
數據組1中5個建筑物很規整,均被正確分割出來,并且去除了其他干擾地物,分割出的建筑物符合真實形態,沒有點云的地方可能就是玻璃等物體反射造成的空洞;數據組2中地物比較多,建筑物分布離散,有未被識別出的建筑物。有的建筑物由于面積過小,而且掃描不全,不符合建筑物的通用特征而造成漏分。
把算法運用到實例的過程中出現了錯分、漏分的情況,為了分析提取結果的有效性,選用查準率(Precision)、查全率(Recall)和綜合評價(F-Measure)三個指標對實驗結果進行評價。設置Nb為正確提取的建筑物個數,Nε為誤分為建筑物的其他地物個數,Nl為漏分的建筑物數目。
查準率是指提取結果中正確提取出的數量與提取總數的比值,定義如下:
(8)
查全率是指正確提取的個數與實際建筑物個數的比值,定義如下:
(9)
F-Measure是一種同時兼顧查準率和查全率的評價標準,若F-Measure的數值越大,則說明提取的總體效果越好,定義如下:
(10)
式中,β為參數。本次實驗采用常見的F1-Measure(β=1),三組實驗數據的定量分析結果見表1。

表1 建筑物提取精度分析
從表1可以看出本文算法對兩個數據組的分割結果,無論是準確率還是查全率,F值都超過0.8,說明本文算法對實例測區環境下的不同建筑物點云提取具有較好的有效性。
本文研究了基于地物特征提取建筑物的算法,對點云數據去噪,地面進行濾波后,根據各地物的不同特征進行濾除,最終實現建筑物點云提取。通過兩處實驗區建筑物點云提取結果分析,絕大部分建筑物點云都能被準確地提取,并能夠去除其他干擾地物的影響,是一種快速提取建筑物點云的有效方法,完全滿足后續數字城市三維建模的需求。