丁小陸,黃炳耀,鮑曉娣
(1.寧海縣規劃局,浙江 寧海 315600;2.寧??h規劃設計院,浙江 寧海 315600)
基于GIS的地名地址管理系統構建
丁小陸1,黃炳耀2,鮑曉娣2
(1.寧??h規劃局,浙江 寧海 315600;2.寧??h規劃設計院,浙江 寧海 315600)

地名地址作為GIS最基礎的數據組成部分,其命名和管理一直是各國、組織機構需要解決完善的問題,也是數字城市地理空間框架建設中重要的一環。以此為背景提出基于二維GIS組件ArcGIS Engine和三維地理平臺TerraExplorer的地名地址管理系統,實現了基于條件隨機場的地名地址要素識別、標準化入庫、二三維要素關聯和數據分析等功能,并簡要介紹了該系統的功能設計、關鍵技術等。
GIS;地名地址;系統設計;條件隨機場
我國于2010年推出的《數字城市地理信息公共平臺地名/地址編碼規則》,為地名地址數據的標準化和共享提供了系統、科學的體系[1-3]。依據規范,地名數據可分為3種形式:地名、地址和POI(point of interest,興趣點)[4]。地名是人們對各個地理實體賦予的專有名稱,屬于面狀空間形態,空間指代性較模糊;地址是對地理實體位置的具體結構化描述,屬于點狀空間形態,空間指代性較具體;POI是人們對感興趣點位的信息描述,一般為地名或地址+實體名稱的形式。根據寧海縣的實際情況進行補充和完善,本系統將地址要素分為9大類15小類,如表1所示。

表1 地址要素分類分級體系
2.1 系統總體設計
區別于傳統的地名地址管理系統,本系統是一個融合測繪、規劃、民政、公安、工商等部門資源,包括地理信息技術和分布式數據庫技術的綜合性工程,涉及地名地址、空間數據、GIS、網絡分布式信息處理系統和大型數據庫等復雜要素。
系統設計在滿足計算機軟件工程的基本要求和原則外,還需要實現以下目標:
1)地名地址分類標準化。
2)民政、公安、工商、測繪等部門地名地址資源的整合。
3)系統應結合目前主流的二維和三維開發平臺,實現地名地址要素與二維地理實體(房屋面)、三維地理實體(建筑模型)的一體化。
4)系統應保證各類數據成果的安全高效存儲和管理,并方便地名地址數據的入庫、查詢、分析統計。
按照上述要求,為充分發揮GIS的服務功能,系統采用C/S模式進行開發。二維基礎地理平臺使用組件式GIS軟件——ArcGIS Engine,ArcGIS Engine封裝了大部分ArcGIS底層功能模塊和方法,具備強大的地理分析應用功能[5]。三維基礎地理平臺使用目前與ArcGIS結合最好的Skyline公司的TerraExplorer軟件,TerraExplorer能夠實現三維影像的交互式體驗,并實現對ArcGIS數據格式的良好支持。系統按照架構分為硬件基礎層、數據層、應用層和交互層,如圖1所示。
2.2 系統功能設計
地名地址管理系統集地名地址、二維系統和三維系統為一體,系統主要分為地名地址數據入庫與編輯、POI數據入庫與編輯、數據分析和系統管理4大組成部分。地名地址/POI數據入庫與編輯功能主要包括要素的新建、編輯、查詢和批量入庫,要素與三維建筑模型數據的關聯等;數據分析主要包括圖面和屬性查詢、數據審核、數據導出和書簽管理功能;系統管理主要包括用戶管理和角色管理,用以實現不同人員的系統操作權限,從而保障系統的安全性,明確各部分的責任人。系統的功能結構如圖2所示。

圖1 地名地址管理系統整體架構圖

圖2 地名地址管理系統功能結構圖
2.3 數據管理發布
地名地址管理系統的數據種類多樣,主要包括二維影像地圖集、二維基礎地理底圖、三維地形文件、建筑模型、地名地址數據、POI數據等。按照數據的結構,可分為文件系統和數據庫系統。
文件系統主要存儲二、三維基礎地理要素。二維影像地圖和基礎地理底圖采用瓦片切圖的形式,利用ArcGIS Server發布。三維地形文件由航攝影像和DEM疊合而成,通過TerraGate發布;三維矢量建筑模型和三維場景文件由IIS發布。
數據庫系統采用ArcSDE for SQL Server數據庫,實現了關系數據庫和空間數據庫的一體化管理,主要存儲地名地址數據、POI數據、模型點位數據、用戶數據等。
3.1 基于條件隨機場的地名地址要素識別
地名地址數據管理中,如何整合已有的大量不同數據源和數據格式的地名地址數據是有待解決的一個重要問題。本系統通過地名地址分類標準化體系,實現了基于條件隨機場的地名地址要素識別。
條件隨機場是由Lafferty在研究序列化數據標注的過程中提出的,它是對最大熵模型的改進,具備最大熵模型的一切優點,是近年來應用在自然語言處理和圖像處理等研究領域的一種新的數學模型工具[6]。條件隨機場模型建立的關鍵是參數估計和特征選取。參數估計是從訓練數據中訓練模型,求解每一個特征的權重參數,即權重向量λ={λ1,λ2,…,λn}的過程;特征的選取是篩選出具有表征意義的特征,關鍵在于根據具體任務抽象出合適的特征模板集。
本系統中,為了能夠應用基于字的標注方法來識別中文地名要素,使用4詞位標注集來表示地址要素類別。根據中文地名的平均詞長特征和于江德的語料測試,下文對識別性能的貢獻比上文的貢獻要高出6個百分點以上[7],系統選擇非對稱的地名要素上下文窗口,上文的寬度為3,下文的寬度為5,如圖3所示。

圖3 地址要素上下文窗口圖
基于中文字符特性,在選取特征時主要考慮單個字符的信息,從而抽象出3類特征:原子特征、復合特征和詞位轉移特征。
經實驗,在20萬條訓練語料規模下,基于條件隨機場的地名地址要素識別對各項分類字段的成功率達到84.39%以上,大大提高了地名地址分類的準確性,降低了人工成本。
3.2 數據入庫
地名地址管理系統的核心是數據的入庫管理,按照數據的來源,可分為新建數據入庫和已有數據入庫兩種方式。
1) 新建數據入庫。新建數據入庫是指在系統內通過新增地名地址/POI要素入庫的方法。按照系統設計原則,新建數據須嚴格執行規范要求,依次進行位置信息匹配、完整性檢查、重復性檢查、鄰接關系檢查和管理員審核,審核通過后才能入庫。
2)批量數據入庫。批量數據入庫與新建數據入庫流程相同,首先執行數據的完整性檢查,然后進行數據的各項拓撲關系檢查,最后由管理人員審核入庫。
3.3 二三維聯動
二三維聯動不僅包括二維與三維視圖顯示區域相一致,還表現在兩個場景屬性數據、分析結果的一致性[8]。二維和三維顯示區域聯動是基于兩者統一的坐標系實現的。三維聯動二維可通過TerraExplorer的ScreenToTerrain方法獲取中心點坐標和四至,再由ArcGIS Engine的Extent屬性實現三維到二維的聯動。二維聯動三維較復雜,可通過建立二維比例尺和三維視點高度的轉換系數,再利用二分法實現坐標轉換。
三維地名地址/POI圖層采用流方式加載,與二維圖層采用同一套數據,確保了二三維屬性數據的一致性。同時,系統在查詢和分析等操作時也要保證顯示效果的一致性。系統的三維界面如圖4所示。

圖4 地名地址管理系統三維界面
本系統實現了地名地址要素信息的標準化入庫,從而減少數據后期的處理難度。同時,系統結合基于條件隨機場的地名地址要素識別,解決了原始地名數據的融合難題;并通過地名地址要素和二、三維建筑成果的關聯,實現了地名地址數據與二三維數據的一體化。系統的成功建設和運行可為地名地址數據的標準化共享提供重要的基礎和保障。
[1] 高小萍,兀偉. 地理編碼技術探討[J]. 測繪標準化,2012, 28(4):1-3
[2] 周傲英,楊彬. 基于位置的服務:架構與進展[J]. 計算機學報,2011,34(7):1 155-1 171
[3] GB/T 23705-2009. 數字城市地理信息公共平臺地名/地址編碼規則[S].
[4] 秦學秀. 地名數據的3種形式及其質量要求[J]. 測繪通報,2011(10):68-69
[5] 廉光偉,義崇政. 基于AE組件和OSG的二三維聯動GIS系統研究與實現[J]. 城市勘測,2012(6):17-20
[6] Lafferty J,Mccallum A,Pereira F. Conditional Random Fields: Probabilistic Models for Segmenting and Labeling Sequence Data. In: Proceedings of the 18th International Conference on Machine Learning[C]. IEEE,San Francisco,USA, 2001
[7] 于江德,王希杰,樊孝忠. 字標注漢語詞法分析中上文和下文孰重孰輕[J]. 計算機科學,2012,39(11):201-203
[8] 萬幼,邊馥苓. 二三維聯動的GIS系統體系結構構建技術[J].地理信息世界,2008,6(2):48-52
本 刊 聲 明
為適應我國信息化建設,擴大本刊及作者知識信息交流渠道,本刊數據已被《中國核心期刊(遴選)數據庫》、《CNKI 中國期刊全文數據庫》和《中文科技期刊數據庫(全文版)》等收錄。在《地理空間信息》發表的論文均默認將其在著作權保護期內的復制權、發行權、匯編權、翻譯權以及網絡傳播權授權給《地理空間信息》編輯部,編輯部可將上述權利轉授給第三方使用。作者不再許可他人以任何形式使用該篇論文,但可以在其后續作品中引用(或翻譯)該論文中部分內容或將其匯編在作者的非期刊類文集中。如不同意,請事先聲明,本刊另作處理。其文章的著作權使用費與本刊稿酬一次性給付(已在收取發表費時折減和換算為雜志贈閱)。
(本刊編輯部)
P208
B
1672-4623(2015)04-0072-03
10.3969/j.issn.1672-4623.2015.04.026
丁小陸,高級工程師,研究方向為地理信息系統開發和遙感影像數據處理。
2015-03-17。