(Urban 3D segmentation and modelling from street view images and LiDAR point clouds)
帶有語義標(biāo)簽和度量信息的3D城市地圖不僅是自動駕駛汽車和城市無人機(jī)的關(guān)鍵支撐,而且還有助于局部環(huán)境在移動用戶應(yīng)用中可視化。機(jī)器視覺挑戰(zhàn)是用最少的手工注釋從現(xiàn)有數(shù)據(jù)中生成準(zhǔn)確的城市地圖。針對這項工作,本文提出了一種新的方法,該方法采用GPS注冊的激光雷達(dá)(光檢測和測距)點云和街景圖像作為輸入,并結(jié)合點云和光度學(xué)特征使用基于規(guī)則的分析和基于學(xué)習(xí)的標(biāo)記混合創(chuàng)建三維點云的語義標(biāo)簽。基于規(guī)則的分析可以提高對75%的點云數(shù)據(jù)簡單化和對大型結(jié)構(gòu)(如街道表面和建筑立面)的分割。對于更復(fù)雜的結(jié)構(gòu),例如汽車、樹木和行人,本文利用結(jié)構(gòu)(LiDAR)和光度(街景)特征的推動決策樹來創(chuàng)建。本文還提供了三維可視化方法的定性示例,從標(biāo)注數(shù)據(jù)和二維圖像分割中構(gòu)建參數(shù)化圖形模型,其中三維標(biāo)簽反投影到街景圖像。在定量評估中,本文給出了該方法的分類準(zhǔn)確性和計算時間,并將結(jié)果與當(dāng)前三種常用數(shù)據(jù)庫的競爭 方 法(NAVTEQ True、Paris-Rue-Madame和地面激光掃描Velodyne)進(jìn)行比較。
本文所提出的方法可以在商用臺式機(jī)硬件上運(yùn)行不到一個小時的時間就可以處理8000萬個三維點(2.4公里街道距離)。首先使用基于規(guī)則的探測器來測量超過75%城市點云的道路表面和建筑立面。這些規(guī)則基于強(qiáng)大的自適應(yīng)處理(例如,以一個特定城市的平均建筑高度)為基礎(chǔ),設(shè)置具有明確物理意義的閾值。然后,剩余的點云由構(gòu)建vox-els(點群)的方法進(jìn)行處理,最后將超體素通過增強(qiáng)決策樹的集合進(jìn)行分類。體素構(gòu)建、超體素構(gòu)建和提取的特征也是基于具有明確物理意義的閾值。實驗驗證了所提出方法相比其他現(xiàn)有的方法表現(xiàn)良好。今后的研究工作將增加其他三維地圖數(shù)據(jù)的方法適應(yīng)性。