鄧曉紅,馮劍橋,周 靜,朱雪虹,張書亮,3
(1. 南京市城市地下管線數字化管理中心,江蘇 南京 210000; 2. 南京師范大學虛擬地理環境教育部重點實驗室,江蘇 南京 210023; 3. 江蘇省地理信息資源開發與利用協同創新中心,江蘇 南京 210023)
當前,我國城市地下管線數據包括綜合地下管線數據與專業地下管線數據兩大類,分別由城市規劃部門與各管線權屬單位管理、維護。綜合地下管線數據位置精準、屬性簡單,以其為基礎形成的城市綜合地下管線地理信息系統可服務于城市規劃與建設;專業地下管線數據分類細致、屬性豐富、現勢性強,以其為基礎形成的城市專業地下管線地理信息系統可用于電力、燃氣、給水、通信等行業的管線建設與維護。
基于不同的探測技術與應用目的,由不同單位采集的同一區域的綜合地下管線數據與專業地下管線數據在數據模型、位置精度與屬性信息等方面存在一定差異[1],由此產生的“兩套數據、兩個系統”的管理模式[2]阻礙了管線信息化與深層次應用工作的開展,嚴重影響不同單位間管線數據的集成融合與共享交換。因此,如何實現兩類地下管線空間數據匹配是目前地下管線信息化工作中亟待解決的問題之一。
基于此,本文結合兩類管線數據的特征,構建管線層次匹配模型,研究管點相似性計算方法,開發城市地下管線空間數據匹配系統,為城市地下管線數據的集成與融合提供軟件支撐,促進管線空間數據的共享與深層次應用。
傳統管線數據匹配模型主要借鑒矢量數據匹配模型,將連通管線視為獨立的點、線集合,分別對離散的點、線進行匹配,忽視了數據的整體性,易造成匹配錯誤。本文在傳統矢量數據匹配模型的基礎上,結合兩類城市地下管線空間數據特征,提出了管線空間數據層次匹配模型,從整體與局部兩個層次進行管線數據匹配,如圖1所示。根據地下管線數據整體性的特征,本文提出了管線Stroke[3-5]的概念,即由局部的管段生成整體的管線骨架線。基于管線骨架線的匹配從宏觀角度實現了管線結構的匹配,將匹配由單一的管段、管點上升至整個管線。在管線整體匹配的基礎上再進行局部匹配即管點匹配,由干網到支網分層進行。

圖1 管線空間數據層次匹配模型
管線骨架線提取的核心是構造管線Stroke,即基于一定的連接規則與連接策略選擇合適的管段合并為Stroke。根據管線Stroke的長度指標提取管線骨架線后,采用緩沖區疊置法進行管線骨架線匹配。
匹配控制點的概念借鑒了測量學中的“控制點”概念。管點匹配前,需在區域內選取一系列點作為整個區域匹配的參照點。本文通過管線骨架線的關聯關系確定匹配控制點。
管點分層匹配通過計算管點間的結構相似性、語義相似性[6]與幾何相似性,構建候選匹配集合,依據匹配的策略與規則對其按照先干網后支網的順序進行匹配。
本文在計算管線結構相似性時,參照文獻[1]中的管線空間結構相似性計算方法,綜合管段的方向、長度及管點關聯管段的數量進行管線結構相似性計算。
設綜合管線中管點A,其關聯管段數量為m,分別為la1、la2、la3、…、lam。根據先驗知識或指定閾值,依次選取專業管線中與管點A的距離小于最大距離ε的管點B作為管點A的待匹配點。管點B關聯管段數量為n,分別為lb1、lb2、lb3、…、lbn。計算管段la1與lb1之間的相似性即計算2個管段對應向量的相似度。假設la1長度大于lb1,則以管點A為起點,在管段la1上截取一段長度與lb1相等的距離,截點為C,記lb1的另一端點為B′,令i=AC,j=BB′,則向量的相似度為
(1)
在管點A關聯管段與管點B關聯管段相似性計算的基礎上,參照圖論中二分圖最優匹配方法求解向量相似度之和最大的管點對,即為最優匹配。
混合模型綜合考量概念的層次結構與其屬性集合,語義相似度計算公式為
(2)
式中,l為概念節點Ci、Cj共同且最近的父節點與根節點間的距離;dCi、dCj分別為Ci和Cj與二者共同且最近的父節點間的距離;a(Ci,Cj)為Ci、Cj共同且最近的父節點與Ci、Cj間的距離,計算公式為
(3)
本文通過對綜合地下管線與專業地下管線數據體系的分析,建立統一的綜合地下管線與專業地下管線的語義層次樹,以滿足各個概念語義相似性的計算,以給水管點為例說明,如圖2所示。
綜合地下管線中概念Izh與專業地下管線中概念Izy的語義相似度計算公式為
simp(Izh,Izy)=wSs(Izh,Izy)+vSf(Izh,Izy)
(4)
式中,w與v分別為概念名稱相似度與屬性相似度在語義相似度計算中的權重,其和為1;Ss為Izh與Izy的概念名稱相似度,根據式(2)與式(3)計算;Sf為Izh與Izy的屬性相似度,根據Tversky定義的相似度模型計算公式計算。若2個概念“同義不同名”,則其語義相似度為1。因此,需建立同義詞集,解決“同義不同名”的問題。

圖2 語義樹(以給水管點為例)
幾何相似性計算包括管點的空間距離、管線的空間距離及方向3方面的計算。管點的空間距離采用歐氏距離計算。管線的方向包括整體方向與局部方向,整體方向由管段起止管點連線與水平方向的夾角表示,局部方向由管線上管點切線與水平方向的夾角表示。

H(lAA′,lBB′)=max{h(M,N),h(N,M)}
(5)
式中
h(M,N)=max{min{d(a,b)}}a∈M,b∈N
(6)
式中,a、b分別為集合M、N中的點;d(a,b)為兩點間距;h(M,N)為集合M中各點與N中各點的最小距離中的最大值。
根據地下管線管理部門的應用需求,本文將地下管線空間數據匹配系統劃分為系統管理、地圖操作、管線數據匹配、數據查詢4個功能模塊,如圖3所示。
系統管理包括用戶管理與參數設置功能,其中參數設置包括管線匹配所需的連接規則、連接策略、匹配閾值與匹配過程中兩類管線空間數據的關鍵屬性字段的設置。地圖操作提供地圖放大縮小、平移、單雙視圖切換等基本工具。數據查詢提供管線數據匹配結果的可視化功能。
管線數據匹配[8-9]是整個系統的核心功能模塊,包括以下功能:

圖3 系統功能
(1) 數據預處理。數據預處理[10]主要功能是通過添加對象ID、去除懸掛線、計算起止點等處理,使待匹配的地下管線數據滿足后續匹配的要求,并且建立管線Stroke圖層與管線Stroke緩沖區圖層。
(2) 管線匹配。管線匹配主要功能是構造管線Stroke與管線骨架線提取、匹配,把握管網形態,為后續管點匹配作準備。系統根據設置的連接規則與策略將零散的管段連接形成連續的管線Stroke,以其長度為指標提取管線骨架線,根據兩類管線骨架線緩沖區疊置率匹配骨架線。
(3) 管點匹配。管點匹配包括匹配控制點的確定、干網管點匹配、支網管點匹配及管點補充匹配4個層次。管點匹配以管線骨架線匹配為基礎,根據管線骨架線的關聯關系確定匹配控制點;計算兩類管線數據的結構、幾何、語義相似性,根據一定的匹配規則篩選管點對作為干網匹配管點;在干網匹配的基礎上對支網管點進行匹配;最后對未匹配的管點進行補充匹配。
城市地下管線空間數據匹配原型系統采用Microsoft Visual Studio 2010開發環境,基于C#語言與ArcGIS Engine實現二次開發,界面如圖4所示。
試驗數據采用南京市某區域的綜合給水管線與專業給水管線數據,分別按照管點、管線圖層存儲,見表1。通過系統數據預處理、管線骨架線提取與匹配、管點匹配3個階段,形成管點匹配結果見表2。

圖4 系統界面

管線類型管點數圖層數管段數總長度/m綜合管線1080211253996191.85專業管線9657181132394700.50

表2 管點匹配結果
為檢驗系統匹配結果,本文選取小區域管線數據進行分析。該區域綜合管點共529個、管段共527條,專業管點共623個、管段共623條。人工判讀529個綜合管點發現,其中共479個可匹配管點,50個綜合管點無法與專業管點匹配。系統匹配形成287對匹配管點,其中正確匹配280對,錯誤匹配7對。
傳統管線數據匹配方法著眼于管點且受相似度權重的影響。本文層次匹配模型結合管網的整體結構,從整體到局部,從管線到管點進行匹配,減少了匹配錯誤的出現。部分區域傳統方法與本文方法匹配結果的對比如圖5所示。
兩類管線數據之間除存在1∶1的關系外,還存在1∶0、1∶n等關系(如圖6所示),導致大量管點無法找到相應的匹配點,因此系統匹配后仍存在未匹配點。錯誤匹配原因是本文未對補充匹配結果進行驗證與修正。

圖5 傳統方法與本文方法匹配結果對比圖

圖6 兩類管線數據分布圖
“兩套數據、兩個系統”的管理模式,嚴重影響了不同單位間管線數據的集成融合與共享交換。為解決上述問題,本文結合綜合地下管線與專業地下管線數據的特征,構建了包含管線骨架線整體匹配與管點局部匹配兩個層次的管線層次匹配模型,基于管線骨架線提取與匹配方法、管線相似性計算方法,開發了城市地下管線空間數據匹配系統,以實現兩類管線數據的匹配,極大提高了管線數據的質量,為城市地下管線數據的集成與融合提供了軟件支撐,可以促進管線空間數據的共享與深層次的應用。
參考文獻:
[1] 龔敏霞,袁賽,儲征偉,等.顧及多空間相似性的地下管線數據匹配 [J].測繪學報,2015,44(12):1392-4000.
[2] 張書亮,儲征偉,何源,等.城市綜合與專業地下管線空間數據的差異性分析 [J].測繪通報,2013(12):58-62.
[3] THOMSON R C,RICHARDSON D E.The Good Continuation Principle of Perceptual Organization Applied to the Generalization of Road Networks[C]∥The 19th International Cartographic Conference.Ottawa[s.n.],1999.
[4] PORTA S,CRUCITTI P,LATORA V.The Network Analysis of Urban Streets:A Primal Approach[J].Environment and Planning B:Planning and Design,2006,369(5):853-866.
[5] LI Z,DONG W.A Stroke-based Method for Automated Generation of Schematic Network Maps [M].[S.l.]:Taylor & Francis,2010.
[6] 陳玲.顧及語義相似性的城市地下管線空間數據匹配方法研究 [D].南京:南京師范大學,2014.
[7] TVERSKY A.Features of Similarity:Psychological Review[J].Review,1977,84(4):290-302.
[8] 黃蔚,蔣捷.多尺度矢量簡單幾何實體數據幾何匹配方法研究 [J].遙感信息,2011(1):27-31.
[9] 童小華,鄧愫愫,史文中.基于概率的地圖實體匹配方法 [J].測繪學報,2007,36(2):210-217.
[10] 張廣群,王保平,汪杭軍.基于Map X的空間數據不一致性問題處理 [J].浙江林學院學報,2009(4):587-591.
[11] 劉闖,錢海忠,王驍,等.利用城市骨架線網的道路和居民地聯動匹配方法[J].測繪學報,2016,45(12):1485-1494.
[12] 郝燕玲,唐文靜,趙玉新,等.基于空間相似性的面實體匹配算法研究[J].測繪學報,2008,37(4):501-506.
[13] 萬波,宗琴,劉川川,等.基于骨架化和蜘蛛編碼的面狀實體匹配方法研究[J].測繪科學,2012,37(5):97-99.
[14] 王永杰,孟令奎,趙春宇.基于Hilbert空間排列碼的海量空間數據劃分算法研究[J].武漢大學學報(信息科學版),2007,32(7):650-653.
[15] 周艷,朱慶,張葉廷.基于Hilbert曲線層次分解的空間數據劃分方法[J].地理與地理信息科學,2007,23(4):13-17.