劉 杰
(1.上海市測繪院,上海200063)
面向地理國情監(jiān)測的地理要素變化檢測方法
劉 杰1
(1.上海市測繪院,上海200063)
地理要素是地理國情監(jiān)測的重要組成部分,特別是在城市地區(qū),其具有種類多、數(shù)據(jù)量大、格式多樣、變化頻繁等特點。提出并設計了一種基于不同時態(tài)同源參考數(shù)據(jù)的地理要素變化檢測技術方法。經(jīng)應用實踐證明,該技術方法適用于工程化應用的地理要素變化信息提取,可為常態(tài)化地理國情監(jiān)測提供參考。
地理要素;變化檢測;FME

地理國情監(jiān)測是在普查數(shù)據(jù)成果的基礎上,對自然和人文地理要素的空間分布、特征及其相互關系[1]進行定量、空間化的監(jiān)測,從而獲取地表覆蓋和國情要素的變化信息。近年來,基于高分辨率遙感影像和數(shù)字地表模型(DSM)的地表覆蓋信息提取[2-3]以及變化檢測[4]已得到廣泛應用,地理國情要素的變化檢測逐漸成為研究重點[5-7]并已取得部分理論成果。上海市作為特大型城市的典型代表,市域內社會、人文、資源等各類地理要素高度集中,通過定期收集基礎地理信息數(shù)據(jù)庫、公開版地圖數(shù)據(jù)庫、各委辦局行業(yè)專題資料等參考數(shù)據(jù),在滿足國家國情監(jiān)測要求的基礎上,拓展監(jiān)測了幾十種市情專題,共同構成了綜合反映城市地區(qū)特征的數(shù)據(jù)資源,具有重要的理論研究和社會應用價值。然而,地理要素具有種類多、數(shù)據(jù)量大、格式多樣、變化頻率相對較快等特點,如何快速高效地整理和獲取有價值的數(shù)據(jù),一直是研究的熱點問題。本文在技術分析的基礎上,提出了一種在工程化應用中可行的地理要素變化信息提取方法;并通過FME實現(xiàn)了變化信息自動提取,為地理國情監(jiān)測的地理要素變化信息提取提供參考。
地理要素實體[8]主要包括點要素、線要素和面要素。變化檢測主要體現(xiàn)為對地理要素的空間變化和屬性變化的檢測,從空間角度出發(fā),對地理要素的空間位置和幾何形狀作定量和定性分析,比較其間的相似程度以尋找同名實體[9]。本文對于點要素的空間變化采用歐氏距離進行判讀;線要素的空間變化限定在空間位置和走向變化(節(jié)點的增刪或差異不考慮),采用長度重疊度和Hausdorff 距離進行判讀;面要素的空間變化限定在空間位置和形狀變化(節(jié)點的增刪或差異不考慮),采用面積重疊度進行判讀;屬性變化采用Levenshtein算法對同一屬性項進行相似度判讀。
以兩個不同時態(tài)的同一專題要素為例,本文設計的地理要素變化檢測流程如圖1所示。

圖1 地理要素變化檢測流程圖
1.1 數(shù)據(jù)預處理
將矢量空間數(shù)據(jù)的坐標系統(tǒng)和投影系統(tǒng)、數(shù)據(jù)存儲格式、空間數(shù)據(jù)精度、屬性字段類型進行統(tǒng)一,形成空間參考與屬性類型一致的同源數(shù)據(jù)。
1.2 空間變化檢測
1)點要素的空間變化檢測采用歐氏距離:

以基態(tài)點要素為圓心,搜索位置相同或歐氏距離在一定閾值范圍內的最新時態(tài)點要素。閾值的設定可參考地理要素采集精度,閾值過小,難以找到同名點;閾值太大,會導致過多一點匹配多點的情況
2)線要素的空間變化檢測采用長度重疊度和Hausdorff 距離:

長度重疊度是基態(tài)線要素的分布與最新時態(tài)線要素的分布相重疊的部分占二者總體分布的比率;基于一定的閾值對新舊時態(tài)線狀要素作線線疊加計算長度重疊度。Hausdorff 距離用以比較兩個線要素的總體差異;其中線要素的點集簡化為起點、終點、中心點以及若干其他按長度百分比在線上取得的點,基于上述點集計算新舊時態(tài)線要素Hausdorff 距離。
3)面要素的空間變化檢測采用面積重疊度:

面積重疊度是基態(tài)面要素的分布與最新時態(tài)面要素的分布相重疊的部分占二者總體分布的比率;基于一定的閾值對新舊時態(tài)面狀要素作面面疊加計算面積重疊度。
1.3 屬性變化檢測
Levenshtein距離又稱編輯距離,是兩個字符串之間,由一個轉換成另一個所需的最少編輯操作次數(shù)。許可的編輯操作包括替換、插入和刪除,Levenshtein算法一般給每個操作相同的權重,也可定義不同操作的代價。地理要素的屬性變化采用Levenshtein算法對同一屬性項進行相似度判讀。
FME是Safe Software公司開發(fā)的空間與非空間數(shù)據(jù)分析、處理、轉換、共享的完整ETL平臺。本文基于上述方法與流程,利用FME實現(xiàn)了地理要素變化檢測和變化信息的自動提取。
2.1 數(shù)據(jù)輸入
地理要素變化檢測雖涉及幾十種要素,但主要以點、線、面來表示,因此數(shù)據(jù)輸入只需保證兩個時態(tài)的要素類型一致。FME支持動態(tài)讀取同一格式的不同數(shù)據(jù)源,然后根據(jù)數(shù)據(jù)源的結構動態(tài)生成目標表,主要通過讀取模塊的合并要素類實現(xiàn)。輸入的數(shù)據(jù)源分為基態(tài)數(shù)據(jù)和最新時態(tài)數(shù)據(jù),二者都通過Geometry Filter轉換器分成點、線、面3種幾何要素,用于后續(xù)點、線、面分要素類的變化檢測。
2.2 變化檢測
地理要素變化檢測主要步驟包括時態(tài)標識、數(shù)據(jù)過濾、空間匹配、屬性匹配等,如圖2所示。

圖2 基于FME實現(xiàn)地理要素變化檢測流程圖
點要素的空間匹配通過NeighborFinder查找歐式距離在閾值范圍內的鄰近點,并把該范圍內所有鄰近點的信息存放在該點的列表屬性中。在屬性變化檢測時調用Levenshtein算法,計算該點與列表中所有鄰近點的文本相似度,然后對點的相似度進行排序,提取最優(yōu)值并判斷屬性是否發(fā)生變化。
線要素的空間匹配通過Snapper和LineOnLine Overlay對新舊時態(tài)線狀要素作線線疊加計算長度重疊度;通過Snipper、NeighborFinder和StatisticsCalculator提取點集,計算點到線最近距離以及統(tǒng)計Hausdorff 距離。
面要素的空間匹配通過Snapper和AreaOnArea Overlay對新舊時態(tài)面狀要素作面面疊加計算面積重疊度。線要素和面要素一般根據(jù)重疊度直接提取最優(yōu)值,在屬性變化檢測時調用Levenshtein算法判斷屬性是否發(fā)生變化。
在實現(xiàn)過程中,對于空間不能匹配的要素,不再進行屬性相似度判斷,而是簡化為直接判斷屬性是否完全一致,再根據(jù)數(shù)據(jù)時態(tài)作進一步判斷。
2.3 變化信息輸出
空間上能夠匹配但屬性不能匹配的,輸出為屬性變化要素;空間上不能匹配但屬性上完全一致的,輸出為空間變化要素;空間和屬性均不能匹配的,根據(jù)數(shù)據(jù)時態(tài)標識,輸出為新增或刪除要素。根據(jù)輸出的變化信息還可以分要素統(tǒng)計變化數(shù)量、變化長度、變化面積和更新比例等信息。
本文技術方法已成功應用于2015年上海市地理國情標準時點核準和2016年基礎性地理國情監(jiān)測中。現(xiàn)以公開版地圖數(shù)據(jù)庫不同時態(tài)的學校(點)、道路(線)和公園綠地(面)數(shù)據(jù)為例,通過設置輸入和輸出路徑,即可得到屬性變化要素、新增要素、刪除要素和位置變化要素,如圖3所示(擴大圖為迪士尼周邊的變化情況),通過對變化信息提取結果的比較可知提取結果是正確的。

圖3 地理要素變化檢測結果
地理要素時空數(shù)據(jù)變化檢測技術在與地理信息有關的領域有著廣泛的應用前景,特別是對于時空數(shù)據(jù)庫的管理具有重要意義。本文設計的地理要素變化檢測方法,已經(jīng)成功應用于2015年上海市地理國情標準時點核準和2016年基礎性地理國情監(jiān)測的生產(chǎn)實踐和質量檢查中。經(jīng)過實踐證明,該方法可有效提高國情監(jiān)測地理要素變化檢測的效率,對實際生產(chǎn)和質量控制有較大的幫助;也可進一步擴展到基礎地理信息數(shù)據(jù)庫的現(xiàn)勢性更新、質量控制等方面,從而形成增量式基礎地理數(shù)據(jù)庫,構建多要素多時空的地理信息數(shù)據(jù),更加有利于對地理信息進行地理變遷、地理現(xiàn)象變化規(guī)律等的研究。但該方法還存在局限性,對檢測數(shù)據(jù)有一定的要求,即更新前后數(shù)據(jù)必須是一致的,對于不同來源的數(shù)據(jù)目前還不適用,在以后的工作中需要繼續(xù)研究與改進。
[1] 陳俊勇.關于地理國情普查的思考[J].地理空間信息,2014, 12(2):1-3
[2] 程滔,周旭,劉若梅.面向地理國情監(jiān)測的地表覆蓋信息提取方法[J].測繪通報,2013(8):84-86
[3] 余詠勝,羅名海,吳克友,等.基于FME的地理國情覆蓋要素提取技術探討[J].地理空間信息,2014,12(5):1-3
[4] 郭容寰.基于DSM和DOM特征的城市變化檢測[J].測繪通報,2012(增刊):414-416
[5] 王懷,高小明,樊文峰,等.地理國情要素時空變化檢測技術研究[J].測繪通報,2014(11):84-87,119
[6] 張偉.矢量更新的變化信息提取與統(tǒng)計方法研究[J].測繪與空間地理信息,2012,35(11):91-93
[7] 任家鋒,馬衛(wèi)春,木林.地理國情普查矢量數(shù)據(jù)變化量提取方法[J].地理空間信息,2015,13(5):6-9
[8] 陳愛軍,李琦,徐光祐.地理空間信息共享理論基礎及其解決方案[J].清華大學學報(自然科學版),2002,42(10):1 405-1 409 [9] 郭黎,崔鐵軍,王豪,等.基于面狀要素拓撲關系的數(shù)據(jù)匹配技術研究[J].測繪科學,2010(1):130-132
[10] GB/T 13923-2006.基礎地理信息要素 分類與代碼[S].北京:中國標準出版社,2006:1-2
P208
B
1672-4623(2017)05-0032-03
10.3969/j.issn.1672-4623.2017.0051.0
劉杰,碩士,工程師,從事地圖制圖學與地理信息工程方面的工作和研究。
2016-08-19。
項目來源:現(xiàn)代工程測量國家測繪地理信息局重點實驗室開放課題資助項目(TJES1308)。