王 濱
(蘭州鐵道設計院有限公司,蘭州 730000)
傾斜攝影測量技術近些年得到了廣泛的研究和應用,尤其在城市規劃和災害評估等多個領域中,表現出了其不凡的應用價值[1-2]。該技術能夠提供各種環境場景下的高分辨率三維影像數據,成為地理信息科學領域中的一項關鍵技術[3]。然而,盡管傾斜攝影技術在多個應用場景中都展現出了顯著的優勢和價值,但在數據整合、特征提取和融合方面的具體應用潛力還有許多未被完全發掘的空間。因此,探討如何在地理信息與地理信息系統(GIGIS,geographic information and geographic information system)技術的框架下,將傾斜攝影與機載激光雷達(LiDAR,light detection and ranging)技術有機融合,優化建筑物的測量過程,成為當前研究的重中之重。與此同時,傳統的測量方法通常因依賴單一數據源而在準確性、完整性和可視化等方面表現出一定的局限性[4-5]。王金等人[6]對于車載激光掃描技術處理數據難度較大的問題,提出了一種用于高速立交中線提取點云數據的處理方法,通過多種濾波算法對非道路點云進行處理,并利用Alpha shapes算法識別道路邊界,最后采用B-spline曲線擬合算法對道路中線進行擬合。這種方法可以幫助建立智能道路并進行維護工作。然而,由于車載激光掃描技術采集的數據量大且噪聲較多,因此道路中值提取仍存在不足之處,需要繼續完善。王利媛等人[7]為解決地表物體點云數據密度不均的問題,引入了一種密度相關的點云卷積算子PointConv,并提出了一種注意力機制模塊來調整局部信息的權重,提高網絡對不同點云實例的識別能力。通過在城市室外場景車載點云數據集GML_DataSetA和三維語義標注基準數據集ISPRS Vaihingen上進行分類實驗,驗證了所提方法的有效性。但在實際應用中,受初始數據的影響,該方案的準確率和效率仍然難以讓人滿意。此次研究力圖突破這些局限性,探索融合這傾斜攝影和LiDAR測量技術,以開辟建筑物測量應用的新路徑。在此基礎上,研究對點云數據的特征提取和融合方法進行了進一步的優化研究,確保在建筑測量領域能夠獲得更精確和全面的數據特征。研究期望能夠推動建筑測量技術朝著更加成熟和先進的方向發展,為整個建筑測量領域帶來更多的創新和啟示。
LiDAR是一種遠程感測技術,主要依靠發射脈沖光線并接收其反射回來的信號來測量目標與傳感器之間的距離。LiDAR系統通過發射激光脈沖并接收被地面或其他目標反射回來的脈沖來工作。通過計算發射激光與接收反射之間的時間差,可以確定激光脈沖與目標之間的距離[8]。研究總結LiDAR的主要類型及其重要組成部分,如圖1所示。

圖1 LiDAR的主要類型及其重要組成部分
在圖1中,與其他兩類LiDAR相比,機載LiDAR獲取數據的速度更快,精度更高,受天氣影響更小[9]。考慮到建筑測量的現實需求,此次研究在機載LiDAR的基礎上,構建建筑測量模型。在傳統的機載LiDAR建筑測量模型中,由于點云重建缺少紋理信息,因此得到的三維模型不夠真實。而作為近年來迅速發展的無人機傾斜攝影技術,從不同的角度捕捉目標地面的照片來獲取三維信息[10]。研究將無人機傾斜攝影技術與機載LiDAR集成,使建筑模型更真實;又發揮機載LiDAR高精度的優勢,得到高精度的建筑三維測量模型。在機載LiDAR系統中,點P坐標計算如式(1)所示:
(1)
式中,(x,y,z)為掃描點P的三維坐標;S為P點與掃描點中心O的距離;θ為觀測的垂直方向角;α為觀測的水平方向角。激光測距系統是機載LiDAR系統的核心組成,主要功能是測量傳感器到目標物之間的距離。此次研究采用的是脈沖式測距法,該方法利用光速計算激光走過的總距離,計算傳感器到目標物的距離,如式(2)所示:
(2)
式中,S為機載LiDAR與待測建筑之間的距離;c為光速;Δt為脈沖信號發射和返回的時間。傳統攝影測量法只能采集地面物體的垂直影像。然而,伴隨著無人機和航空數字攝影技術的進步,新一代的傾斜攝影測量技術已逐漸浮現[11]。傾斜攝影測量技術利用無人機裝載5個相機,分別從垂直、前、后、左、右共5個方位捕捉物體的全方位影像。這種無人機傾斜攝影測量法徹底改變了傳統攝影測量僅從正面角度采集影像的模式,拓寬了遙感影像的應用領域。對比傾斜攝影測量與傳統攝影測量的處理流程,如圖2所示。

圖2 傾斜攝影測量與傳統攝影測量的處理流程對比
如圖2所示,傾斜攝影測量經過數據預處理、三維重建、數據處理和分析以及成果提取與應用等一系列嚴格的處理流程,能夠生成高質量的三維模型。而傳統攝影測量技術僅能從垂直角度獲取地物影像,其生成的模型多為二維,應用范圍較為有限[12]。此次研究探索了傾斜攝影測量技術與GIGIS技術的深度結合,以挖掘并增強其在建筑測量中的應用潛力。傾斜攝影測量技術在獲取三維數據時具有獨特優勢,而GIGIS平臺為這些數據提供了更廣泛的應用場景,從而不僅能為用戶提供詳細和精確的地圖和查詢工具,還能進行更復雜和深入的空間分析和模擬。具體來說,GIGIS平臺能夠將傾斜攝影得到的影像和點云數據與其他空間數據,如衛星圖像和地形圖,進行高效融合。這種融合技術充分展現了GIGIS在空間分析、數據管理和可視化方面的強大功能。通過GIGIS平臺,研究首先利用高精度、低噪聲的機載LiDAR技術對建筑進行點云信息采集,同時捕捉其紋理和色彩特征信息。隨后,使用GIGIS對采集的數據進行整合和管理,并運用其空間分析工具深化對建筑物的認知,如進行陽光照射和視線分析等模擬。此外,GIGIS的高級可視化工具允許用戶從多種視角探索場景,為他們提供一種沉浸式的三維可視化體驗,使觀察更加貼近真實環境。
建筑的三維重建是測量學中的一大挑戰,這需要依賴精確且高效的算法。此次研究利用GIGIS進行高效的數據預處理,包括去噪、濾波和數據格式轉換,以建立準確、穩定的算法基礎。其次,GIGIS允許從多個源,包括LiDAR、衛星圖像和傾斜攝影融合數據[14]。這種多源數據整合為建筑物的三維模型提供了更豐富且精確的信息。進一步的空間分析能夠深入挖掘建筑物的幾何特性、空間分布和相互關系,這有助于更細致、更準確地重建建筑物的形狀和結構。三維重建算法涉及深度圖采集、圖像預處理、點云生成、點云配準和數據融合等多個階段。在深度圖采集階段,深度相機被用于捕捉深度圖,同時,它也能像普通相機一樣,捕捉環境的彩色圖像。在GIGIS技術的支持下,可以從不同視角捕捉圖像,能夠獲取被拍攝環境的全方位信息。然而,在圖像數據預處理階段,受到設備分辨率等限制,深度圖信息在獲取過程中也存在著諸多缺點,通常采用高斯濾波法和中值濾波法進行降噪處理。高斯濾波法常用二維零均值的離散高斯函數作為平滑過濾器,其本質是對像素點進行加權平均,目標像素點與比較像素點之間的距離越大,權值越大,其權值如式(3)所示:
(3)
式中,w(i,j)為濾波器在(i,j)處的權值。中值濾波法是將像素值的大小像素排序后所獲得的像素值均值,濾波后的圖像如式(4)所示:
g(x,y)=med[f(x-k,y-l),(k,l∈W)]
(4)
式中,g(x,y)為濾波后的圖像,f(x,y)為深度圖像,W為二維中值濾波模版。點云計算是一種基于三維重建技術的模型重建方法,能將真實世界的三維模型通過算法進行重建。點云模型中的點云計算指的是將點云數據并行處理,計算每個點的三維坐標,并根據這些坐標計算出該點的云模型[15]。點云匹配是指將點云數據集與真實世界的三維模型進行匹配,以確定每個點的三維坐標和云模型中的位置。點云匹配是三維重建模型中的一項關鍵技術,可以提高三維重建模型的準確性和可靠性。通過點云匹配,可以實現真實世界與虛擬世界之間的交互,從而構建更加逼真的虛擬世界。數據融合是將不同參考視圖的深度圖融合過濾成為一個密集的點云,其中圖像坐標與世界坐標的轉換如式(5)所示:
Pω=dT-1K-1Px
(5)
式中,Pω為圖像坐標系中像素點的坐標,Px為世界坐標系下像素點的坐標,T和K分別為相機內外參數矩陣。在融合后的點云中,并非所有像素點都能夠被保存,為解決這一問題,研究通過多視角立體視覺算法(MVS,multiple view stereo)對三維模型進行重建。MVS能夠對深度圖進行濾波處理,對于每一張深度圖,都有一張與之對應的置信度圖產生,其映射過程如圖3所示。

圖3 深度圖像映射過程
圖3為深度圖像素點映射過程。圖3中P點表示深度圖的像素。Ii表示原始深度圖像,Ij則表示經過映射后的相鄰視圖。通過估計深度Di(P),從而將圖像Ii中的像素P映射到其他的相鄰視圖Ij,會得到一個新的像素P′。深度圖像素點閾值的計算如式(6)所示:
(6)
式中,τ1為閾值,P″則表示P點在原始深度圖像中的另一個位置。另一個閾值τ2的定義如式(7)所示:
(7)
式中,τ2表示另一個閾值,Dj(P″)為P″的投影深度。由于Ij也有自己的深度圖,因此也可以得到對應的深度Dj(P′)。通過公式(6)、(7)可以進一步得到深度圖的過濾約束公式,只有在至少3個相鄰的視圖下滿足上述約束的像素點才能被認定為是有效的像素點。
衡量三維重建算法性能好壞的指標通常有精度、點云完整度和F值等。準確度的計算如式(8)所示:
(8)
式中,Pp表示三維重建模型中的任意一個點云的位置,Pg則為真值點云集合。Argmin表示使后面這個式子達到最小值時相關參數的取值。完整度是指真值三維點云在重建后的點云中可以匹配的像素點百分比度量,其計算如式(9)所示:
(9)
式中,(Pp)為真值點云的集合,完整度也可以通過絕對平均距離進行衡量。
建筑測量技術受到數據特征精度的直接影響,在融合GIGIS技術的傾斜影像中,提供了豐富的紋理和色彩信息,而機載LiDAR確保了點云數據的高精度和低噪聲,兩者的結合實現了對地物特征的全方位、多角度捕捉。這一綜合方法有助于更全面細致地理解和描繪地表物體,為不同領域的研究和應用提供了強大的支持。此次研究針對融合過程中可能遇到的問題進行優化探索,以期獲得更為精確且完整的建筑測量數據。研究優化基于GIGIS傾斜影像和機載LiDAR的點云特征提取和融合的技術流程如圖4所示。

圖4 點云信息特征提取與融合流程圖
在傾斜影像色彩特征的提取與轉換中,首步需要形成傾斜影像的匹配點云[16]。借助裝備多鏡頭相機的無人機,傾斜攝影技術能從多角度迅速并精準地收集地面的影像資料。這種多角度拍攝可以將三維空間特性轉化為二維圖像信息并保存。通過密集匹配技術,這種轉化被逆向處理,即從二維圖像恢復到具有三維坐標的空間點。此流程主要包括稀疏和密集的點云重建,最后產出是一個帶有色彩屬性的三維點云,如圖5所示。

圖5 影像密集匹配流程圖
如圖5所示,點云的生成可以劃分為稀疏和密集兩個步驟。考慮到稀疏點云無法完全描繪每個對象的結構,研究進一步對MVS算法進行優化,以獲得更密集的點云數據。與單視角算法相比,MVS算法具有更高的精度和可靠性,并且可以處理復雜的光照變化和背景干擾等問題。為進一步提高MVS算法的性能,有學者利用深度學習模型構建了MVSNet模型,雖然MVSNet提升了場景的整體完整度,但是卻犧牲了局部紋理的完整度[17-18]。造成這一情況的原因是忽略了特征提取網絡的作用,因此,此次研究將空間注意力機制(SA,spatial attention)和通道注意力機制(CA,channel attention)進行結合,最終生成了一個雙通道注意力機制(CBAM,convolutional block attention module),并將該機制用于MVSNet中,旨在提高MVSNet特征提取網絡的特征提取能力,從而搭建效果更好的三維數字圖像虛擬場景重建模型。SA和CA的結構如圖6所示。

圖6 SA與CA的結構示意圖
在特征圖中,每個通道均被認為是一個特征檢測器,這主要是為了對各個特征的重要性進行建模,并據此對不同任務的輸入進行特征分配。由此,通道注意力模塊主要是通過調節不同通道的表達來強化或減弱特征的表達。在復雜紋理或漫反射區域的情況下,簡化的特征提取網絡可能會導致一些原視圖轉換過程中特征圖的細節丟失,這會阻止獲取完全的特征信息,繼而影響重建點云的完整性。因此,在通道注意力機制模塊中,采用了最大池化與平均池化的組合,并通過共享權重的神經網絡進行特征提取。而在空間注意力機制的應用中,特征圖中樣本點的空間位置極為關鍵。如果位置存在偏差,那么在概率選擇過程中,將不能保證概率最大的點確實是原本屬于該空間坐標的真實點。為了更有效地突顯重要信息區域,將通過沿通道軸對通道注意力圖進行平均池化和最大池化操作,然后經Sigmoid函數處理生成空間注意力圖。采用雙通道注意力機制的MVSNet特征網絡結構如圖7所示。

圖7 融合SA與CA的MVSNet模塊圖
圖7展示的是基于雙通道注意力策略的MVSNet結構圖。首先,遍歷待重建場景的各個視角圖像。每幅圖像都被視作參考視角,并與其相鄰的源視角圖像一起被輸入。接著,MVSNet對這些參考和源視圖進行特征化,從而生成的特征映射會被用于進行單應性調整和雙線性內插。在MVSNet的深層中,CBAM雙通道注意力策略被采納,這樣在特征達到一定深度后,能夠突出關鍵特征并強化特征間的互相關聯。為了集中特征數據,結合了最大池化和平均池化的策略,然后將得到的二維特征傳入一個共享權重的神經網絡,產生通道注意力映射。該注意力映射與原始圖像執行乘和加運算,之后的通道注意力映射會進行連續的最大池化和平均池化,并經過Sigmoid處理來生成相應的權重映射。這些權重與輸入側的通道注意力映射進行按元素的乘和加運算,從而輸出的空間注意力映射成為最后的特征映射。
通過MVSNet-CBAM算法獲得密集點云后,研究首先選擇一張參考影像,利用前述的攝像機姿態估計,為其選擇鄰近的影像來形成立體像對。隨后,基于這些像對和特征點,計算每個影像的深度[19-20]。最后,合并所有深度信息,形成整個場景的密集點云。由于密集匹配點云數據與機載LiDAR點云數據獲取方式有所不同,這導致同一區域內的點云不能完全對應。因此,在特征融合時不能簡單地將這兩組數據組合。為解決這一問題,研究使用KDTree索引進行最近鄰點搜索,將距離激光點最近的密集匹配點的顏色信息賦給激光點,并將兩者的特征融合。這一系統化的方法確保了點云特征融合的準確性和高效性,也為建筑測量提供了更準確的數據。
技術的改進與優化需要在實踐中經受嚴格的驗證,因此,研究將結合理論分析和實際實驗,全面驗證改進后的LiDAR建筑測量技術性能,以期確保每一項改進都能夠在實際應用中帶來顯著的效果提升。研究采用常規的LiDAR技術與研究改進的LiDARA測量技術進行對比,比較點云特征提取與融合的效果。研究首先進行對優化的MVSNet-CBAM算法進行測試,數據集為MVS的經典數據集,包括DTU、Eth3D和BlendedMVS。其中DTU包含來自49個場景的圖像,每個場景都包含從已知相機參數的不同視點捕獲的圖像,由于不同的場景復雜性,該數據集提供了一系列的挑戰,包括不同的表面屬性、深度和遮擋。Eth3D集來自蘇黎世聯邦理工學院,旨在為多視圖立體和表面重建算法提供基準測試。它具有高分辨率的圖像和多樣的真實世界場景,包括室內和室外環境。BlendedMVS是一個專為室內場景量身定制的大規模多視圖立體數據集。它結合了幾個真實捕獲的數據集,并通過混合不同的場景和光照條件,旨在提高深度MVS模型的訓練效果。對比模型選用MVSNet、MVSNet-SA和MVSNet-CA與此次研究提出的MVSNet-CBAM模型進行實驗對比。實驗在同一環境下進行,開發語言為C++;開發平臺為Visual Studio 2019;實驗使用的計算設備CPU為Inter(R) Core(TM) i5-10210U,操作系統為Windows 10 Home,內存為8 G,顯卡為NVIDIA GeForce GTX 1080ti。模型的輸入均為基于GIGIS傾斜攝影得到的多角度影像資料,并結合攝像機的姿態和已有的稀疏點云信息。輸出均為密集的三維點云。先對4個不同的模型進行訓練,訓練過程中的損失函數曲線如圖8所示。

圖8 迭代訓練曲線
如圖8所示,在前2 000次的迭代中,各模型的損失函數曲線呈現快速下降的趨勢。其中MVSNet-CBAM的下降趨勢最為明顯。隨著迭代次數的增加,各模型的損失函數曲線已經接近收斂,說明參與訓練的模型均采取了正確的訓練策略。在損失函數值穩定后,MVSNet-CBAM的損失函數值最低,為4左右,相較于其他3個模型分別減少了53.77%、49.49%和42.71%。并且MVSNet-CBAM在達到穩定時所經過的迭代次數最少,更快地接近收斂。訓練結果表明,此次研究構建的模型收斂速度更快,損失函數值更低,模型的性能更優秀。在訓練結束后,使用以上4種模型進行測試,研究統計了在不同數據集的測試中數據,如表1所示。

表1 不同數據集下各評價指標數據
如表1所示,研究選用的模型評價指標包括準確度、完整度和綜合評分。其中準確度越高越好,完整度越高越好。綜合評分是準確度與完整度的平均數,綜合評分越低越好。整體來看,在準確度方面,按照從優至差進行排序,分別為MVSNet-CBAM、MVSNet-CA、MVSNet-SA和MVSNet;在完整度方面,按照從優至差進行排序,分別為MVSNet-CBAM、MVSNet-CA、MVSNet-SA和MVSNet;在綜合評分中,按照從優至差進行排序,分別為MVSNet-CBAM、MVSNet-CA、MVSNet-SA和MVSNet。統計結果證明MVSNet-CBAM模型具有最好的表現,驗證了此次研究的有效性。
為了驗證研究方法在實際測試中的準確性,研究選用天津市某郊區建筑群機載點云數據的兩處區域作為實驗對象。天津市某郊區建筑群點云數據信息如表2所示。

表2 天津市某郊區建筑群機載點云數據
對比不同方法的特征提取的精度,如圖9所示。

圖9 不同方法的特征提取準確率對比
圖9為不同方法的目標建筑物測量特征提取精度對比結果。其中圖9(a)為A區域的點云數據特征提取準確率對比情況,從圖中可以看出LiDAR在20次測試中的平均準確率為81.05%,最高準確率為87.03%,最低準確率為76.87%;研究改進的LiDAR在20次測試中的平均準確率為93.56%,最高準確率為97.05%,最低準確率為90.11%。圖9(b)為B區域的點云數據特征提取準確率對比情況,從圖中可以看出LiDAR在20次測試中的平均準確率為79.75%,最高準確率為86.12%,最低準確率為74.22%;研究改進的LiDAR在20次測試中的平均準確率為92.14%,最高準確率為95.85%,最低準確率為92.72%。實驗結果表明,研究在GIGIS技術支持下改進LiDAR的方法是有效的,使建筑測量中點云數據特征提取的準確率得到了極大的提升。對比不同方法的特征提取的召回率,如圖10所示。

圖10 不同方法的特征提取召回率對比
召回率通常被用于衡量一個模型正確識別正樣本的能力。在點云數據的建筑物特征提取中,召回率可以幫助使用者了解有多少真實的建筑物特征被正確地提取出來。召回率高意味著大部分真實的建筑物特征都被正確識別,而召回率低則意味著許多真實的建筑物特征被漏掉了。圖10為不同方法的目標建筑物測量特征提取的召回率對比結果。其中圖10(a)為A區域的點云數據特征提取召回率對比情況,從圖中可以看出LiDAR在20次測試中的平均召回率為70.12%,最高召回率為77.65%,最低召回率為66.63%;研究改進的LiDAR在20次測試中的平均召回率為91.02%,最高召回率為92.44%,最低召回率為88.51%。圖10(b)為B區域的點云數據特征提取召回率對比情況,從圖中可以看出LiDAR在20次測試中的平均召回率為68.82%,最高召回率為71.31%,最低召回率為66.03%;研究改進的LiDAR在20次測試中的平均召回率為90.14%,最高召回率為92.23%,最低召回率為87.85%。實驗結果表明,研究對LiDAR的改進是成功的,使建筑測量中點云數據特征提取的召回率得到了極大的提升。最后,研究統計了不同方法的準確率與召回率,繪制了準確度-召回率(PR,precision recall)曲線,如圖11所示。

圖11 不同方法PR曲線對比
PR曲線是一個用于衡量二分類模型效果的工具。PR曲線的下方面積可以用來衡量模型的整體性能。曲線下方面積越大,模型的性能通常越好。在建筑物點云數據特征提取的場景中,使用PR曲線對比可以幫助研究者或工程師明確哪些方法在平衡精確率和召回率方面表現得更好。圖11(a)為區域A中不同方法的PR曲線對比情況,從圖中可以明顯看出,改進LiDAR曲線下面積顯著大于LiDAR,結果表示在區域A中,研究改進的LiDAR很好地平衡了準確率和召回率的關系,性能更好。圖11(b)為區域B中不同方法的PR曲線對比情況,圖中改進LiDAR曲線下面積更大,LiDAR曲線下面積更小。結果表示研究方法的整體性能更加優秀,驗證了改進是有效的。
隨著全球城市化的加速推進,對建筑和城市結構的精確測量成了一個越來越重要的需求。傳統的測量方法在處理復雜的建筑結構和環境時顯示出了明顯的局限性。結合現代傾斜攝影測量技術和機載LiDAR技術,以便在GIGIS技術的支持下實現更精確和完整的建筑測量。研究通過GIGIS的傾斜影像技術獲取了豐富的紋理和色彩特征信息,并利用機載LiDAR技術獲取高精度和低噪聲的點云信息,從而克服了單一數據源的局限性。為了驗證研究對點云特征提取與融合方法優化的效果,研究首先對MVSNet-CBAM優化算法進行了性能驗證,發現優化模型在準確度、完整度和綜合評分上的評價均優于其他3種模型。進一步驗證研究所提建筑測量技術的性能,在兩個不同區域實驗結果中,研究方法的平均召回率分別為91.02%和90.14%,而傳統方法的平均召回率分別為70.12%和68.82%。此外,在PR曲線的對比中,研究方法的曲線下面積也顯著大于改進前的LiDAR測量方法。實驗結果表明,基于GIGIS的機載LiDAR可以為提供更高質量的點云數據,從而保證了測量的準確性。更重要的是,研究中提出的點云特征提取和融合方法進一步優化了這兩種數據的結合,使得在建筑測量應用中能夠獲得更為精確和完整的數據特征。不過,由于實驗條件有限,郊區建筑群機載點云數據不可避免地會與城市建筑機載點云數據存在差異,因此研究所提方法還需要在今后的研究中得到進一步的驗證和優化。