劉如飛,侯光強,王旻燁,楊繼奔
(山東科技大學 測繪與空間信息學院,山東 青島 266590)
建筑物是城市建設與管理的基礎單元,從三維激光掃描數據中分類建筑物對更新城市基礎地理信息具有重要意義。建筑物包括頂面和立面兩部分,空基激光掃描數據缺乏立面的細節(jié)信息[1],而地面固定掃描、車載移動掃描、背包移動掃描等地基激光掃描系統(tǒng)可以快速獲取建筑物立面的高精度點云數據,為建筑物分類研究提供了新的數據源[2]。但掃描距離不同以及地物遮擋導致地基點云存在密度不均勻和缺失現(xiàn)象,給地基點云中建筑物分類帶來了巨大的挑戰(zhàn)[3-4]。
目前從地基點云中分類建筑物的方法大體可以分為四類。一是依據點云自身特征及其鄰域特征分類建筑物點云[5],常用特征包括高程紋理、反射強度、幾何形態(tài)等,該類方法避免了圖像轉換和體素劃分的信息損失,但受點云密度不均勻的影響,局部特征計算時鄰域范圍難確定[6],且點云的海量性導致該類方法計算時間較長。二是依據建筑物點集在掃描線上的分布特征分類建筑物點云,常用特征包括z方向坐標方差、y方向坐標差值、非離散分布等,但該類方法對點云的上下文特征利用不足,且難以處理散亂點云。三是將點云投影到水平面,劃分二維格網[7-8],通過最大高程或點云個數等單一屬性定義格網值[9-10],或通過高程差異、密度差異等多種屬性定義格網值,生成特征圖像[11-12],然后利用圖像處理技術進行建筑物分類[13]。此類方法中,點云轉為圖像處理加快計算速度的同時會造成精度損失,且格網大小對分類結果影響較大。四是將點云過分割為體素,對體素進行分割實現(xiàn)建筑物分類[14-15],加快了計算速度,但分類效果受體素分割影響較大。
針對以上問題,本文通過分析多尺度特征格網中建筑物立面的鄰域梯度分布,提出一種利用三維HOG(histogram of oriented gridients)特征進行建筑物點云分類的方法,從復雜的環(huán)境中準確分類建筑物點云。
本文提出的建筑物分類方法主要包括多尺度特征格網生成、三維HOG特征設計和建筑物點云分類三個步驟,算法流程如圖1所示。

圖1 算法流程圖
首先,確定點云范圍和格網邊長,建立多尺度格網索引;然后,利用格網索引和統(tǒng)計濾波去除噪點;最后,利用格網內點云的空間分布特征計算格網特征值,得到整個掃描區(qū)域的多尺度特征格網。
1)多尺度格網索引建立。根據點云的坐標最值xmax、xmin、ymax、ymin、zmax、zmin以及格網邊長d,得到點云與不同尺度格網的對應索引關系,計算方法如式(1)所示。
(1)
式中:int[]表示向下取整;mod[]表示取余數;某一點P(Xp,Yp,Zp)對應的三維格網的行列層號為row、col、layer;某一小尺度格網(rowa,cola,layera)對應的大尺度格網的行列層號為rowb、colb、layerb。
2)噪點去除。將三維空間中的坐標點垂直投影到xy水平面上(即令z值為0),投影點在固定鄰域內的鄰近點個數表示投影密度。統(tǒng)計顯示:建筑點投影密度較大,呈連續(xù)線性分布,而噪點投影密度較小,散亂分布在建筑點周圍,如圖2所示。為防止噪點影響特征值計算,本文利用格網索引和平面坐標對格網進行統(tǒng)計濾波。

圖2 建筑物點云投影示意圖
3)格網特征值計算。通過格網(i,j,k)內ni,j,k個點的坐標加權計算格網特征值Ii,j,k,該值由格網內點的個數、空間分布形式(投影形狀、高程差異等)決定,投影形狀越接近線形則權值越大,距離最低點的高差越小則權值越小。
格網內點pr(0 (2) 式中:wsijkr、whijkr分別為投影形狀權值以及高差權值;λ1、λ2為格網內點利用主成分分析得到的特征值。 根據上述權值公式計算格網值Ei,j,k,并歸化到0~255灰度空間得到格網特征值Ii,j,k,生成突出表達立面目標的多尺度特征格網,計算如式(3)所示。 (3) 1)立面空間分布。以建筑物立面為中心的局部范圍內,立面兩側通常不存在點,存在點的情況有三種:窗戶位置的散亂噪點、地面點、灌木等植被點。圖3為不同方向的建筑物立面空間分布示意圖,立面在豎直方向分布連續(xù),因此只對綠色層進行展示,紅色方形代表中心立面,藍色方形代表鄰域立面,灰色圓形代表非立面地物或無地物。 圖3 建筑物立面空間分布示意圖 2)鄰域梯度分布。首先,利用邊緣算子[-1 0 1]計算格網(i,j,k)沿坐標軸方向的梯度GXi,j,k、GYi,j,k、GZi,j,k;然后,計算三維梯度Gi,j,k,并通過水平方向θHi,j,k和豎直方向θVi,j,k共同描述梯度方向,計算如式(4)所示。 (4) 圖4為以建筑立面格網為中心的鄰域梯度分布示意圖,各層立面的鄰域梯度多為水平分布,因此只對綠色層梯度進行展示,藍色箭頭代表梯度,綠色星形代表較小梯度或無梯度。可以看出,立面兩側梯度分布大致對稱,而延伸方向梯度較小。 圖4 立面鄰域梯度分布示意圖 3)HOG特征分析。HOG是一種描述圖像局部紋理的特征,廣泛應用于圖像處理領域。基本原理是根據圖像區(qū)域內每個像素點的梯度方向,將幅值利用雙線性內插法累加到直方圖中,形成HOG特征向量,但HOG特征不具備旋轉和尺度不變性,通過統(tǒng)計多尺度下不同方向立面的鄰域梯度,發(fā)現(xiàn)立面兩側梯度的對稱關系在一定程度上不受旋轉和尺度變化的影響。圖5為接近水平方向的梯度統(tǒng)計圖,藍色矩形代表相應方向的梯度統(tǒng)計值。 圖5 方向梯度統(tǒng)計示意圖 為充分反映上述對稱關系,對HOG特征進行改進,如圖6所示。圖6(b)將豎直方向劃分為3層,圖6(c)將水平方向均勻劃分成8個扇形區(qū)間,統(tǒng)計26鄰域內格網的梯度,按方向分配給圖6(a)中對應層的區(qū)間。具體統(tǒng)計方法為采用夾角為90°、步長45°的滑動窗口遍歷不同層的區(qū)間,統(tǒng)計每個窗口的梯度,選取最大值記為F1并記錄層號L,然后選取同層剩余窗口的最大值記為F2,同時要求F1和F2所屬窗口的區(qū)間相離(假設F1位于紅色窗口1,則F2在剩余綠色窗口4、5、6中產生),最后用鄰域總梯度減去F1、F2,結果記為F3。使用F1、F2、F3、L描述中心格網的HOG特征。 圖6 HOG統(tǒng)計示意圖 1)立面格網識別。對格網進行HOG特征判斷,當格網滿足條件時標記為1,否則標記為0,判斷條件如式(5)所示。 (5) 式中:Tsym、Text為特征閾值。 不同尺度下的建筑物立面均滿足上述判斷條件,如圖7所示。圖7(a)為數據1局部原始點云,圖7(b)、圖7(c)分別為使用單一尺度格網提取的立面點云,圖7(d)為多尺度求交結果。由于植被影響,單一尺度下提取結果存在噪點,而多尺度求交在保留建筑物立面點的同時,能夠剔除噪點。因此,構建多尺度HOG特征識別模型提取建筑物立面點(式(6))。 圖7 求交結果 S=Sa∩Sb (6) 式中:S為建筑物立面點集合;Sa、Sb分別為在尺度a和尺度b下提取的建筑物立面點集合。 2)約束生長去噪。分析發(fā)現(xiàn),屬于同一立面的格網不僅空間上相鄰,而且具有相似的投影方向和特征值。將空間相鄰定義為鄰域格網重心到中心格網擬合線的平面距離小于閾值dT,約束生長的條件如下。 ①種子格網選取。從未聚類的格網中選取標記為1的初始種子格網。 ②生長準則。在空間相鄰的基礎上,對于標記為0的格網,生長準則為投影方向夾角小于閾值θT0且特征值之比小于閾值rT;對于標記為1的格網,生長準則為投影方向的夾角小于閾值θT1。 ③立面篩選。統(tǒng)計立面高度,大于2 m時,認為屬于建筑物立面。 3)相鄰立面聚類。建筑物通常由多個相鄰立面組成,將距離相近的立面進行聚類,具體過程如下。 ①選取未聚類的立面g0,新建集合類S。 ②若存在立面g1,其包含格網與g0包含的格網距離小于3 m,則將g1添加到S中;以g1作為g0,重復②;否則返回①。 為了驗證本文方法的有效性,采用地基激光掃描系統(tǒng)采集兩組數據進行實驗,數據點位精度優(yōu)于5 cm。如圖8(a)所示,數據1共4 705 426個數據點,覆蓋范圍大致為150 m×60 m,該區(qū)域包括建筑物、樹木、花壇、車輛、宣傳欄、圍欄等地物,其中建筑物陽臺為弧狀立面。如圖8(b)所示,數據2共11 195 112個數據點,覆蓋范圍大致為200 m×120 m,該區(qū)域包括高層建筑物、大型樹木、車輛等地物,其中建筑物內部存在大量噪點。 圖8 實驗數據 利用本文方法進行實驗,參數及閾值設置如表1所示。 表1 參數及閾值 建筑物立面不完全垂直于地面和掃描誤差導致立面投影線存在寬度,格網邊長應至少為線寬的三至四倍,以保證格網內立面投影線的長寬比符合線狀特征,因此格網邊長d設置為 0.1 m和0.5 m。權值參數α、β值的選取依賴于感興趣的目標特征,為體現(xiàn)建筑物投影點線狀分布且高差較大的特征,設置α=0.6、β=0.4。上文分析,立面兩側的梯度相差最大時接近4∶3,遠大于延伸方向的梯度,因此設置HOG特征商閾值Tsym=0.5、Text=3。通過驗證,區(qū)域生長時距離取值略大于投影線寬度,生長方向的夾角取值在5°~20°之間可以取得理想結果,因此設置dT=0.15 m和0.6 m、θT1=15°和20°。對于標記為0的格網,與中心格網的特征值相似時加入聚類,設置θT0=10°和5°、rT=0.5。 對數據1進行建筑物點云分類,結果如圖9所示。圖9(a)為原始點云局部示意圖。圖9(b)為利用HOG特征識別的建筑物立面點,去除樹木、車輛等地物的同時,基本完整地保留了建筑物。圖9(c)為區(qū)域生長提取建筑物立面的結果,進一步去除了噪點,并且對漏提的立面點進行了補充。圖9(d)為建筑物點云分類的最終結果。 注:原始點云按高程賦色;立面點云按立面ID號賦色;建筑物點云按建筑ID號賦色。 數據1分類結果如圖10所示,提取的建筑物按照ID號隨機賦色。圖10中I為A區(qū)域的局部放大俯視圖,其中#1為平直立面,#2為拐角立面,#3為弧狀立面。可以看出,各類型立面提取完整。圖10中Ⅱ為B區(qū)域的局部放大圖,上方為提取立面,下方為原始點云。可以看出,本文方法在去除噪點的同時完整保留了窗戶邊緣點,存在缺失的立面根據生長條件也被完整提取。圖10中Ⅲ為C區(qū)域的局部放大圖,該區(qū)域存在樹木、車輛等多種地物。從放大圖左圖可以看出,經本文方法處理后,車輛等低矮地物被去除,與樹木緊鄰的立面能夠完整被提取。 注:原始點云按高程賦色;立面點云按立面ID號賦色;建筑物點云按建筑ID號賦色。 數據2分類結果如圖11所示,提取的建筑物按照ID號隨機賦色。圖11顯示,建筑物點云被準確分類。圖11中I為A區(qū)域的局部放大圖,其中左側為提取建筑物的立面,右側為原始點云。由原始點云可以看出,立面的高差和投影密度變化較大,本文方法搜索種子格網鄰域內距離擬合線較近的格網,計算特征值比rT,以1/2作為生長條件,保證了建筑物的完整提取。圖11中Ⅱ為B區(qū)域的局部放大圖,其中左側為提取建筑物的立面,右側為原始點云。可以看出,建筑物內部存在大量玻璃折射產生的噪點,但建筑物被完好提取,如放大圖左圖所示。圖11中Ⅲ為C區(qū)域的局部放大俯視圖,可以看出 #1處弧狀立面被漏提,主要因為本文方法較好地適用于平直立面提取,當格網尺寸較大時,弧狀立面格網方向變化較大,不滿足生長條件導致漏提。 注:原始點云按高程賦色;立面點云按立面ID號賦色;建筑物點云按建筑ID號賦色。 對數據1和數據2的建筑物分類結果進行立面級的定量分析,利用正確提取率(right draw proportion,RDP)、完整提取率(all drow proportion,ADP)兩個指標對結果進行評價。如表2所示,本文對兩組數據中建筑物立面的正確提取率分別達到94.02%和94.55%,完整提取率分別達到90.91%和85.25%。數據2中,建筑物立面在延伸過程中多次轉折,轉折處立面梯度情況復雜,與數據1相比,立面級的完整提取率下降。 將本文方法與文獻[16]方法進行對比。由表2可知,對于數據1和數據2,本文對建筑物立面的提取正確率和完整率均高于后者,其中數據1分別高出4.8%和15.7%,弧狀陽臺的漏提是造成完整率差異的主要原因;對于數據2,分別高出3.81%和4.92%,可見本文方法的適用性更好。 表2 實驗結果評估對比 本文以地基激光點云數據為研究對象,提出一種利用三維HOG特征的建筑物點云分類方法。根據格網內點的分布特征進行加權計算,生成顯著表達立面目標多尺度特征的三維格網;通過分析建筑物立面的空間分布和鄰域梯度分布,結合HOG算子對梯度對稱性進行描述,設計三維HOG特征,對不同尺度下方向各異的立面進行準確識別;最后利用區(qū)域生長對立面進行提取,聚類相鄰立面實現(xiàn)建筑物點云分類。實驗結果表明,本文方法能從地基點云中有效分類建筑物點云,穩(wěn)健性較強,研究成果為城市建筑信息快速采集提供了新的思路,但對于存在曲折立面的建筑物點云分類存在局限性,需要進一步改進。1.2 建筑物立面HOG特征




1.3 建筑物點云分類

2 實驗分析
2.1 實驗數據

2.2 實驗結果與討論





3 結束語