藍振家,郭慶勝,劉紀平,王 勇
(1.武漢大學 資源與環境科學學院,湖北 武漢 430079;2.中國測繪科學研究院,北京 100830)
多尺度面實體的匹配方法研究
藍振家1,郭慶勝1,劉紀平2,王 勇2
(1.武漢大學 資源與環境科學學院,湖北 武漢 430079;2.中國測繪科學研究院,北京 100830)
從多尺度面實體匹配的需要出發,分析地圖綜合所引起的一對多、多對多匹配關系,以及不同地圖綜合算子給同名實體所造成的差異,將一對一匹配關系的幾何相似性度量模型和非一對一匹配關系的基于重疊度的面實體匹配方法相結合,采用指標閾值自動確定方法,建立一種新的適用多尺度變化的面實體匹配方法。最后以多個比例尺的居民地為實驗對象,驗證本方法的可行性和有效性。
面實體;多尺度;匹配;幾何相似性;地圖綜合
同名實體匹配已經成為空間數據集成、空間數據自動更新、位置服務等空間數據處理的關鍵技術,是目前國內外學者研究的一個熱點問題,例如,居民地、湖泊等面狀地物的匹配[1-3]。已有的面實體匹配方法主要適用于相近比例尺的一對一關系匹配,大致有3類方法:①從單個面實體的幾何特征出發,通過計算位置、形狀、大小、方向等多特征的幾何相似性來確定匹配實體[2,4-6];②利用降維技術,通過提取二維面實體骨架線,將二維面匹配問題轉化為一維線匹配問題[7-8];③通過提取面實體空白區域骨架線,將面實體的匹配轉換為空白區域骨架線網眼匹配[9]。在多尺度空間目標匹配方面,郭黎研究了基于面狀拓撲要素關系的數據匹配技術[10],翟仁建研究了基于全局一致性評價的多尺度矢量空間數據匹配方法[1]。然而,當數據源的比例尺差異較大時,地圖面狀目標匹配受地圖綜合的影響比較大,同名實體以一對多、多對多匹配關系為主,并且有少量其它的匹配關系。因此,本文從多尺度面實體匹配的需要出發,分析了不同地圖綜合算子給同名實體所造成的差異,將幾何相似性度量模型和基于重疊度的面實體匹配方法相結合,建立了一種顧及地圖綜合因素的能適應多尺度面實體匹配的新方法。
不同地圖空間的同名實體之間有差異原因:地圖綜合、實際變化以及數據誤差[11],其中,地圖綜合是不同比例尺地圖空間的同名實體有差異的主要原因[1]。地圖綜合算子在地理空間數據的綜合包括目標選取、目標簡化、多目標的合并、移位、夸大以及典型化[12-14,15]。不同地圖綜合算子造成的同名實體差異也會不同,簡化、夸大算子會造成同名實體在形狀、大小等方面的差異;選取算子會造成實體的刪除;移位算子會產生空間位置的差異;合并算子和典型化算子會造成同名實體多方面的差異。多尺度地圖空間中面實體之間的匹配可細分為一對零(即1∶0或0∶1)、一對一(即1∶1)、一對多(即1∶N或M∶1,N>1,M>1)和多對多四種不同的匹配關系[1,11]。不同地圖綜合算子造成的同名實體的差異以及對應的匹配關系如表1所示。

表1 不同地圖綜合算子造成同名實體的差異以及對應的匹配關系
2.1 幾何相似度模型原理
面實體幾何相似度模型是以單個面實體的形狀、大小和位置三個幾何特征量作為匹配的依據,將形狀、大小和位置的相似度進行加權求和,綜合性相似度最大的兩個實體可以匹配。假設:待匹配實體為A和B,其綜合性相似度指標由向量[a1,a2,a3]T和[b1,b2,b3]T組成,其中的分量代表大小、位置、形狀;g(A,B)表示A與B之間的差異度;sim(A,B)表示A與B之間的相似度,見式(1)。若采用加權的歐氏距離度量g(A,B),式(1)可以轉化為式(2)。

(1)
(2)

(3)
式中:AreaA,AreaB分別為面實體A,B的面積;Max(AreaA,AreaB)為面實體A和B面積的最大值。
(4)
式中:(XA,YA)和(XB,YB)分別為面實體A和B的中心點;dmax(A,B)為面實體A邊界上任意一個點與面實體B任意邊界上任意一個點之間的最大距離。
2.2 匹配的過程
設有2個面實體集合,大比例尺面實體集合A={a0,a1,…,am},小比例尺面實體集合B={b0,b1,…,bn},這兩個集合的面實體匹配步驟:
1)采用文獻[4]的方法確定匹配參數閾值。從兩個集合中人工選取認為可以匹配的若干實體目標對,作為樣本,計算樣本中每一個實體對的距離差異度、形狀差異度和大小差異度三個分量,并對每一個分量的標準差進行倒數歸一化,得到各個分量的權重w1,w2和w3。根據分量權重和每個實體對的各個分量,求取實體對的綜合性相似度。然后,根據綜合性相似度均值S以及標準差δ,計算出綜合性相似度閾值:S-3δ。
2)對A和B建立固定格網空間索引,計算A和B中每個面實體所經過的格網和每個格網所包含的面實體。
3)讀取A中實體ai(i=1,2,…,m)在空間索引中的格網位置,以一個格網為距離單位,找到這些格網的BUFFER區域,隨后以這個區域內的格網為范圍,檢索出B中的面實體子集合,作為ai候選匹配集。
4)在實體ai和與候選匹配集中每個實體之間計算位置差異度、大小差異度和形狀差異度3個分量。計算實體ai與候選匹配集中每個實體之間的綜合性相似度,若綜合性相似度最大并且大于閾值,那么實體ai在候選匹配集中有匹配實體。
5)若A中實體都已經被匹配,則結束;否則回到第(3)步。
設大比例尺面實體集合A={a0,a1,…,am},小比例尺面實體集合B={b0,b1,…,bn},具體的匹配過程如下:
1)依據前文所提到的閾值計算方法,人工選取一定數量的正例樣本,確定重疊度閾值(Mlimit),而現有的方法需要人工設置重疊度閾值。設dmin為最小可分辨距離,并按照地圖比例尺轉換為數據庫的長度單位。
2)遍歷集合A中的m個面實體元素ai,針對每個元素(面實體),檢索出與其最短距離小于dmin的所有實體,設這些面實體組成一個集合ACi,對于集合A而言,形成了一個由m個集合組成的集合群AC。
3)遍歷集合B中的n個面實體元素bj,針對每個元素(面實體),在集合A中檢索出與其相交的所有面實體,設這些面實體組成一個集合BCi,對于集合B而言,就形成了一個由n個集合組成的集合群BC。
4)集合ACi和集合BCj中的元素都是來源于集合A,也可能為空,因為可能在集合A中沒有檢索到符合條件的面實體。若BCj的元素個數大于1,則計算BCj中每一個面實體ai與BCj對應的面實體bj的重疊度M。把M>Mlimit的面實體組成一個集合Qj,就從BCj得到一個與bj有匹配關系的面實體集合,其元素都是來源于集合A。
(5)
其中,sc為ai與bj的重疊面積;sai代表ai的面積;sbj為bj的面積。
5)從集合Qj中遍歷所有的元素(面實體ai),若ai對應的集合ACi中的元素(面實體ak)也是集合BCj中的元素,則面實體ak也加入集合Qj中,形成一個新的集合群Q。
6)從集合Qj中分析面實體的匹配關系:若Qj的元素個數大于1,并且Qj中的某個面實體(ai)在整個集合群Q中具有唯一性,則匹配關系為一對多(bj與Qj中的面實體之間的匹配關系),否則相關的面實體(包含元素ai的集合Qj中的所有面實體和bj)之間的匹配關系為多對多。
4.1 數據匹配總體流程
設有2個數據集,大比例尺面實體集合A,小比例尺面實體集合B,依據前文所設計的算法,面實體匹配的主要流程如下:
1)坐標變換。兩種數據源之間坐標變換有兩個目的[10]:一是統一兩幅圖的投影系統和坐標系統;二是消除兩幅圖之間可能存在的系統偏差。
2)建立面實體空間格網索引。索引的建立有2個好處:一是在匹配過程中,減少了不必要的搜索時間,提高了算法的效率;二是在確定匹配候選集時,縮小了匹配候選對象的范圍。
3)匹配過程。若比例尺相近(倍數小于2.5),則采用幾何相似度模型進行匹配;否則采用改進的非一對一匹配方法。
4)輸出匹配關系。若比例尺相近,則輸出的匹配關系有一對零和一對一;否則輸出的匹配關系包括一對零,一對一,一對多和多對多。
4.2 匹配實驗
實驗1采用武漢周邊某區域1∶1萬和1∶2.5萬的居民地數據,如圖1所示,淺灰色為1∶1萬居民地,有270個面,黑色為1∶2.5萬的居民地,有84個面。

圖1 1∶1萬與1∶2.5萬居民地重疊圖
匹配開始之前,人工隨機選擇6對已經確定匹配的正例樣本(盡量選擇位置誤差較大的實體對),計算樣本對中面實體幾何特征的各個分量的差異度,見表2。
對距離差異度、形狀差異度和大小差異度等分別計算標準差,然后對標準差進行倒數歸一化,則距離權重是0.101 1,形狀權重是0.690 7,大小權重是0.208 2;根據權重值求得各對樣本的綜合性相似度,相似度的均值是0.972 4,標準差是0.01,則綜合性相似度閾值為0.942 3,同理可得重疊度均值0.847 4和標準差0.096 6,則重疊度閾值為0.557 4。設居民地面實體間的圖上最小可分辨距離為0.5 mm[18],匹配結果的統計如表3所示。
實驗2采用同一區域的1∶1萬和1∶5萬比例尺的居民地數據,如圖2所示,淺灰色為1∶1萬居民地,有270個面,黑色為1∶2.5萬的居民地,有11個面。匹配結果的統計如表4所示。

表2 樣本特征分量、總相似度以及重疊度

表3 1∶1萬與1∶2.5萬居民地匹配實驗統計結果

圖2 1∶1萬與1∶5萬居民地重疊圖

表4 1∶1萬與1∶5萬居民地匹配實驗統計結果
本文將面實體的形狀、位置和大小三個幾何特征量作為構建幾何相似度模型的因素,匹配方法中指標閾值能自動確定,由表3和表4可知,多個比例尺的匹配實驗都得到了正確的匹配結果,證明了該方法適應于多尺度面實體的匹配,相對于文獻[10]的方法,本方法更加科學。
[1] 翟仁健. 基于全局一致性評價的多尺度矢量空間數據匹配方法研究[D]. 鄭州:信息工程大學, 2011.
[2] 郝燕玲, 唐文靜, 趙玉新,等. 基于空間相似性的面實體匹配算法研究[J]. 測繪學報, 2008, 37(4):501-506.
[3] 張橋平, 李德仁, 龔健雅. 城市地圖數據庫面實體匹配技術[J]. 遙感學報, 2004, 8(2):107-112.
[4] 安曉亞, 孫群, 肖強,等. 一種形狀多級描述方法及在多尺度空間數據幾何相似性度量中的應用[J]. 測繪學報, 2011(4):495-501.
[5] 付仲良,逯躍鋒.利用彎曲度半徑復函數構建綜合面實體相似度模型[J].測繪學報,2013,42(1):145-151.
[6] 郭黎, 崔鐵軍, 鄭海鷹,等. 基于空間方向相似性的面狀矢量空間數據匹配算法[J]. 測繪科學技術學報, 2008, 25(5):380-382.
[7] 黃智深, 錢海忠, 郭敏,等. 面狀居民地匹配骨架線傅里葉變化方法[J]. 測繪學報, 2013, 42(6):913-921.
[8] 黃智深, 錢海忠, 王驍,等. 基于降維技術的面狀居民地匹配方法[J]. 測繪科學技術學報, 2012, 29(1):75-78.
[9] 王驍, 錢海忠, 何海威,等. 利用空白區域骨架線網眼匹配多源面狀居民地[J]. 測繪學報, 2015, 44(8):927-935.
[10] 郭黎, 崔鐵軍, 王豪,等. 基于面狀要素拓撲關系的數據匹配技術研究[J]. 測繪科學, 2010, 35(1):130-132.
[11] 趙彬彬.多尺度矢量地圖空間目標匹配方法及其應用研究[D].長沙:中南大學,2011.
[12] 郭慶勝.地圖自動綜合理論與方法[M].北京:測繪出版社,2002.
[13] 楊杰, 楊敏華. 基于信息熵的面狀要素在地圖綜合中的量測方法分析[J]. 測繪工程, 2012, 21(2):54-56.
[14] 武芳, 王家耀. 地圖自動綜合概念框架分析與研究[J]. 測繪工程, 2002, 11(2):18-20.
[15] 張清林,林泉,周偉.基于多尺度公開版地圖數據庫的制圖綜合指標與模型的建立研究[J].測繪與空間地理信息,2016,39(4):102-104,109.
[16] 王斌, 舒華忠, 施朝健,等. 一種基于輪廓線的形狀描述與匹配方法[J]. 電子與信息學報, 2008, 30(4):949-952.
[17] 藍秋萍.地圖數據多尺度級聯更新方法研究[D].武漢: 武漢大學,2010.
[18] LI Z L, YAN H, AI T, et al. Automated Building Generalization Based on Urban Morphology and Gestalt Theory[J]. International Journal of Geographical Information Science, 2004, 18(5):513-534.
[責任編輯:李銘娜]
Research on the method of multi-scale areal feature matching
LAN Zhenjia1, GUO Qingsheng1, LIU Jiping2, WANG Yong2
(1.School of Resource and Environment Science,Wuhan University,Wuhan 430079,China; 2. Chinese Academy of Surveying and Mapping, Beijing 100830,China)
The existing methods of areal feature matching mainly focus on the similar scale. According to the need of multi-scale areal feature matching, the reasons of causing 1∶M and M∶N matching relationships in map generalization and the differences between same entities caused by different map generalization operators are analyzed in this paper. Combining geometrical similarity model for 1∶1 matching relationship of areal features with the matching method based on overlap which is suitable for not 1∶1 matching relationship, the thresholds of indices can be determined automatically. A new adaptive method is proposed for multi-scale areal features matching. At last, the multi-scale residential data are taken as the experimental object to verify the feasibility and effectiveness of this method.
areal feature;multi-scale;matching;geometrical similarity;map generalization
著錄:藍振家,郭慶勝,劉紀平,等.多尺度面實體的匹配方法研究[J].測繪工程,2017,26(11):28-31.
10.19349/j.cnki.issn1006-7949.2017.11.006
2016-08-17
國家自然科學基金資助項目(41471384);公益性科研專項基金資助項目(201512032)
藍振家(1991-),男,碩士研究生.
TP75
A
1006-7949(2017)11-0028-04