吳國華
(福州市勘測院,福建 福州 350108)
隨著經(jīng)濟的快速發(fā)展和信息網(wǎng)絡技術的飛速進步,人類已進入以信息化為主體的新經(jīng)濟時代,房產(chǎn)作為經(jīng)濟社會發(fā)展最活躍的板塊,是信息化工作的重要組成部分,目前以“房產(chǎn)信息”為先導的不動產(chǎn)信息化已成為國民經(jīng)濟和社會信息化的熱點。
福州市針對房產(chǎn)業(yè)務空間數(shù)據(jù)呈現(xiàn)出的多時空性、多尺度性、多語義性、多種存儲格式等數(shù)據(jù)差異[1],明確房產(chǎn)數(shù)據(jù)的融合應以空間數(shù)據(jù)融合為先導,進而推動其他相關數(shù)據(jù)的融合統(tǒng)一。通過數(shù)據(jù)匹配融合既有效保證數(shù)據(jù)空間位置的精準性、又充分兼顧屬性數(shù)據(jù)的豐富性[2],從而實現(xiàn)全市統(tǒng)一“樓盤表”的搭建,為后繼不動產(chǎn)信息化及智慧城市建設奠定數(shù)據(jù)基礎[3]。
為有效地對多源地理信息空間矢量數(shù)據(jù)進行融合,需要消除多源異構數(shù)據(jù)之間的空間坐標系差異、數(shù)據(jù)存儲格式差異。
同名地物要素的識別匹配過程實際上就是通過分析判斷待融合區(qū)域內空間實體之間的差異性和相似性,進而識別出矢量地圖中表達地球表面同一實體的過程。同名地物實體匹配的目標就是識別出不同地圖數(shù)據(jù)中所表示的同一空間地物的實體。在GIS中表示地物實體的方法是采用點、線、面幾何表示方法,因此研究同名實體的匹配可通過研究點、線、面的匹配來實現(xiàn)[4]。
采用模擬人眼對現(xiàn)實世界物體進行成像識別時對各類物體綜合匹配的原理,依據(jù)各類待匹配要素的特征選擇合適的匹配指標來求解其特征的相似度,然后根據(jù)人眼識別圖形的視覺原理為各項特征指標設置權重,最后通過計算加權綜合各特征地物的空間相似性,從而實現(xiàn)空間地理實體之間的匹配。綜合各類地理實體空間相似性指標情況,通過對地理實體的結構相似度、空間位置相似度、幾何形狀相似度、實體大小相似度來計算其總相似度的方法來實現(xiàn)地理實體的位置匹配[5]。那么待匹配要素A和B的要素相似度ObjSim(A,B)是將結構相似度P(A,B),空間位置相似度S(A,B)、幾何相似度G(A,B)、大小相似度Size(A,B)等結合在一起,綜合評價它們之間的整體相似情況,其值域區(qū)間為[0,1],ωP、ωS、ωG和ωSize分別代表結構、空間位置、幾何形狀、大小相似度在評價要素相似度時的權重值須滿足:
ωP+ωS+ωG+ωSize=1
(1)
ObjSim(A,B)=P(A,B)*ωP+S(A,B)*ωS+G(A,B)*ωG+Size(A,B)*ωSize
(2)
待融合業(yè)務空間數(shù)據(jù)的地圖比例尺一般都是 1∶500或 1∶1 000,屬相同或相近比例尺地圖的匹配范疇。在GIS空間數(shù)據(jù)的表達上,面狀數(shù)據(jù)的表達其實包含點狀數(shù)據(jù)和線狀數(shù)據(jù),此處以房屋面數(shù)據(jù)的匹配為例來說明。房屋面數(shù)據(jù)的匹配其實就是房屋輪廓線和房屋面頂點的匹配,其中關鍵是房屋面頂點的匹配。設待匹配的房屋面要素A和B,二者的要素相似度ObjSim(A,B),通過計算匹配房屋面要素A和B的要素結構、空間位置、幾何形狀、大小相似度在評價要素相似度時的權重值,利用式(1)、式(2)求解其相似度值。如果其要素相似度大于閾值,則表明這對房屋面組合即為最優(yōu)的要素匹配結果,從而實現(xiàn)了不同數(shù)據(jù)源之間同名房屋面實體的匹配。匹配工具采用FME中Geometry、VertexCreator、stringCountenator等轉換器,通過要素類型提取、節(jié)點方位編碼、相似度函數(shù)定義計算,實現(xiàn)房屋面數(shù)據(jù)的匹配。
空間地理實體的幾何位置調整,是在同名地圖匹配的基礎上建立起兩個或兩個以上待調整地圖之間的局部坐標轉換關系。在對業(yè)務空間數(shù)據(jù)進行位置調整之前,各地物要素的可信度評價至關重要[6]。而可信度的量化需要綜合考慮地物要素的自身因素及周圍其他地物要素的因素。因此待匹配要素位置的可信度評價可用同名實體對周圍地物的影響度、同名實體位置的準確度、同名實體在不同數(shù)據(jù)源中的重要性等三個因子來綜合評價。
(1)多評價因素的同名地物要素調整變換
在矢量數(shù)據(jù)中面要素的表達最為復雜,且可以認為面是由點和線構成的,這里仍以房產(chǎn)空間數(shù)據(jù)面要素的調整變換為例來闡述同名地物要素調整變換的過程。具體調整變換算法采用多評價因素的面狀地物調整變換算法,所采用的權值不僅與進行調整變換的同名面狀地物的可信程度相關,也與構成該面狀地物的各頂點密切相關。基于面狀地物要素的調整變換算法流程框架如圖1所示。

圖1 基于面狀地物要素的調整變換算法框架圖
對不同數(shù)據(jù)來源的同名面狀地物要素的可信度計算,需先確定該評價因素矩陣。評價因素矩陣描述了各評價因素對某個點要素的影響,矩陣中元素ρij表示評價因素j對點要素i的影響大小。設基于多評價因素的面要素位置調整變換共有n個同名點狀要素ρi,記為i={1,2,……,n},有m個評價因素,記為j={1,2,……,m},則稱矩陣ρ=(ρij)n*m為同名面要素的評價因素矩陣。所選取的評價因素有三個,故m=3。由于不同的評價因素量化值的數(shù)量級不同,所以要對其進行歸一化處理,否則評價因素之間就沒有可比性。在評價因素矩陣確定后,就需要對各個評價因素權值的確定,各評價因素權值的合理與否直接決定調整變換結果的可信程度。根據(jù)信息論中熵法來確定各評價因素的權值,表明各評價因素對于面狀要素位置的重要程度。
房屋面數(shù)據(jù)融合調整采用FME的VertexCreator轉換器獲取相關要素的節(jié)點,然后利用TINGenerator轉換器對獲取的節(jié)點構TIN,再通過空間分析轉換器SpatialRelator獲取與要素節(jié)點相關的Delaunay三角網(wǎng),最后利用AreaCalculator求其面積和,即地物要素對周圍地物要素的影響度,同時定義其準確度和重要性,來綜合評定其可信度。此處對所有房屋在數(shù)據(jù)源中的重要性數(shù)值采用經(jīng)驗值來確定,而其要素位置準確度用其位置中誤差的倒數(shù)。FME轉換器組合流程如圖2所示。

圖2 地物要素的影響度計算流程圖
(2)同名房屋面的調整變換
同名房屋面要素的調整變換,原理是利用離散Fréchet距離來確定同名面要素上的對應節(jié)點對,它是用來度量兩線之間的最短距離。應用FME的轉換器組合及python代碼通過循環(huán)遍歷調整所選節(jié)點序列,計算兩條離散Fréchet距離最小值,以篩選獲得節(jié)點間的匹配點對,匹配轉換流程圖及輔助python代碼部分截圖如圖3、圖4所示。

圖3 節(jié)點間最短距離計算流程圖

圖4 節(jié)點間最短距離計算python代碼截圖
確定同名房屋面要素的對應節(jié)點對后,還需要考慮節(jié)點所在的房屋面要素的可信度和最佳節(jié)點配對路線中對應節(jié)點出現(xiàn)在所有節(jié)點對中的次數(shù),次數(shù)的倒數(shù)與可信度的乘積即為不同數(shù)據(jù)源中對應節(jié)點對的權重值,再結合對應節(jié)點對的坐標值,進行加權平均計算調整變換后圖形的節(jié)點位置。
在空間數(shù)據(jù)融合中除了要進行幾何位置融合,還要解決空間數(shù)據(jù)由于采用不同的分類、分級標準所產(chǎn)生的差異,針對這類差異可采用編碼拆分組構、編碼擴充、分類分級調整、重新編碼等一系列的編碼規(guī)范化融合方法[7]。比如同屬于房屋層數(shù)據(jù),融合前有商品房、自建房、單位產(chǎn)權等多層,按照標準應融合為統(tǒng)一的房屋層,其區(qū)別僅是分類分級編碼不同。解決了空間數(shù)據(jù)分層的問題,在屬性編碼表的統(tǒng)一過程中還需要對各自獨立分類分級的編碼進行規(guī)范化統(tǒng)一。仍以空間數(shù)據(jù)中房屋面編碼融合為例,針對業(yè)務空間數(shù)據(jù)的特性,為精確地表示每一棟建筑物,在業(yè)務空間數(shù)據(jù)編碼融合中采用規(guī)范的7段27位層次碼結構。整個編碼由城市基礎網(wǎng)格代碼、建筑代碼以及業(yè)務管理拓展碼構成,具體編碼結構如圖5所示。

圖5 房屋編碼結構圖
空間數(shù)據(jù)的時效性是指空間數(shù)據(jù)所表示的地物沿時間軸呈現(xiàn)在空間的變化情況。在空間數(shù)據(jù)融合的過程中不僅是對現(xiàn)狀地物要素的融合,對已經(jīng)滅失的歷史數(shù)據(jù)同樣需要融合保留,以保留空間數(shù)據(jù)的時空完整性。數(shù)據(jù)時空特性的融合統(tǒng)一,實際上就是對數(shù)據(jù)空間尺度和時間尺度的融合統(tǒng)一[8]。在業(yè)務空間數(shù)據(jù)時效性融合的過程中,著重空間尺度的融合,而對于時間尺度則采用保留多時點歷史數(shù)據(jù),方便后繼數(shù)據(jù)使用者的歷史回溯查詢等。而對于時效性不高的業(yè)務空間數(shù)據(jù),則需要根據(jù)數(shù)據(jù)時相進行融合補充。
空間數(shù)據(jù)融合評價:是對融合生成的點、線、面數(shù)據(jù)精度的評價。評價數(shù)據(jù)融合后空間坐標位置合并變換質量的優(yōu)劣程度,具體方法是通過計算若干組同名面狀要素頂點點對的距離中誤差值來評價融合精度是否符合要求。選擇調整圖層和參照圖層中90組同名房屋面進行統(tǒng)計,采用基于多評價因素的調整變換算法實現(xiàn)其空間位置調整,通過計算90組同名房屋面中點對的距離中誤差為 ±0.036 m。綜上分析得出采用基于多評價因素的調整變換算法保持了房屋圖形實體的形狀特性,且調整結果亦反映出調整圖層和參照圖層之間的點位精度上的差異,其變換結果精度符合要求。具體房屋面調整變換截圖如圖6所示。

圖6 房屋面調整變換示意圖
空間數(shù)據(jù)融合驗核:主要驗核內容是拓撲關系和邏輯關系,比如房產(chǎn)丘幢落水、與道路矛盾、房產(chǎn)丘間重疊或間隙等。采用融合成果與高精度地形圖或正射影像疊套比對的方式,驗核融合成果的位置精度及拓撲關系。通過對融合成果中涉及的2萬多個地塊和約30萬個房屋面進行抽樣比對驗證,統(tǒng)計滿足鄰近地物要素點間距中誤差不超過 ±0.20 m的比率約為76%。對不滿足精度條件的業(yè)務空間數(shù)據(jù),需人工比對融合處理。
選取具有代表性的業(yè)務屬性信息與空間數(shù)據(jù)融合前后的對比效果展示說明如下。
以龍院新村3#樓為例,融合前的業(yè)務屬性信息、分層圖、戶型圖等多源數(shù)據(jù)如圖7所示。

圖7 龍院新村3號樓融合前空間及屬性組合示意圖
融合后通過查詢該樓盤第203單元信息獲取的圖形、屬性融合成果展示,如圖8所示。

圖8 業(yè)務屬性數(shù)據(jù)與空間數(shù)據(jù)融合效果圖
原業(yè)務數(shù)據(jù)對拆遷樓盤僅在屬性表中記錄標識,并未形成空間對應更新成果。通過數(shù)據(jù)融合,對歷史原因存在的大量冗余空間數(shù)據(jù)進行清除更新。如圖9融合前后的業(yè)務空間數(shù)據(jù)分別疊加對應年份的正射影像,明顯對拆遷后的房屋面做了刪除,對新增房屋進行了融合補充。

圖9 融合前后數(shù)據(jù)疊加影像對比圖
通過對多源異構房產(chǎn)數(shù)據(jù)的融合,有效提升了房產(chǎn)空間數(shù)據(jù)的精度和時效性,同時大幅提升了融合效率。房產(chǎn)空間數(shù)據(jù)的融合統(tǒng)一不僅有效避免了信息化的重復建設,消除了數(shù)據(jù)冗余提升了數(shù)據(jù)管理效率,而且統(tǒng)一標準后的集中管理也大幅降低了日常管理維護成本,提高了數(shù)據(jù)應用的深度、廣度,同時為福州市進一步實現(xiàn)不動產(chǎn)信息化及智慧城市建設奠定了堅實的數(shù)據(jù)基礎。