林淑媛
摘要:地理實體是智慧城市時空信息云平臺建設的數據基礎,地理實體通過編碼可有效實現數據規范化、統一化的數據交換。本文通過研究地理實體的定義和分類,厘清地理實體概念和現實世界的關系。在地理實體數據建庫中,構建流程化、批量化的地理實體數據處理以及探討地理實體的更新方法,為智慧城市數據交換和數據共享提供基礎。
關鍵詞:地理實體;建庫流程;地理編碼;時空化處理
智慧城市的核心是數據共享,在《智慧城市時空大數據與云平臺建設技術大綱(2017版)》中,明確要求建設地理實體數據,地理實體定義以及編碼的目標就是用過唯一、規范的編碼進行地理空間數據的交換,實現空間上的屬性信息和圖形信息的共享,如:土地權屬、人口信息、經濟指標、地類代碼等。用地理編碼作為空間數據的關聯線索,可以避免多尺度、多投影、多格式GIS數據整合帶來的繁瑣工作。地理實體化處理以融合多種數據源的空間信息,進行批量化、流程化和標準化的作業方式,生產符合地理實體化建庫標準的數據為智慧城市建設提供數據和服務共享的基礎。
一、地理實體
(一)地理實體的定義
依據《地理實體數據規范》,將地理實體定義為現實世界中獨立存在的、可以唯一性標識的自然或人工地物[1]。地理實體是具有社會意義的小地理單元,是社會經濟、自然資源信息與空間位置關聯的基本單元。地理實體由圖元和實體構成,其中,圖元為地理實體的構成單元,用點、線、面表達,并以圖元標識碼唯一標識;實體由一個或多個圖元構成,地理實體通過實體標識碼唯一標識。
地理實體數據庫為實現不同比例尺以及不同來源數據的匯聚共享,根據應用需求,利用面向對象的思想和機理,將地理空間實體數據對象的屬性和行為統一存儲在地理實體數據庫。
(二)地理實體對象
包含大比例尺度的基礎地理實體數據,每一尺度的地理實體數據至少包括水系、建筑物、道路、鐵路、管線、行政區劃、植被七大類實體數據。
1.水系包括河流、湖泊、水庫、涵洞、支渠、干渠等,建筑物包括院落、房屋等;
2.道路包括鐵路、城際道路、城市道路、非機動/機動車道、加油(氣)站等;
3.鐵路包括鐵路、火車站等;
4.管線包括輸電線、配電線、變電設備、通信線、城市管線等;
5.行政區劃包括地市級行政區、區縣級行政區劃、鄉鎮/街道級行政區劃、社區/村級行政區劃等;植被包括城市綠地、農林綠地等。
由于行業應用方式的不同,規范中實體的管理方式無法滿足行業應用需要,用戶可自行根據需要擴展自己的業務對象和行業專題實體。相關的行業專題實體需要增加相應的實體編碼。行業專題實體以此實體編碼實現與業務部門的關聯,從而實現基礎實體和業務專題實體的一體化管理。
二、地理實體建庫流程
地理實體數據主要是在基礎地理數據成果的基礎上整合加工而成,一般情況下包括預處理、數據組織重構、實體化處理等過程[2]。具體流程如圖1:
(一)基礎數據規范處理:對基礎數據,統一數據格式、數據基準等,并按照GB/T13923-2006基礎地理信息要素分類編碼規則,進行統一處理。
(二)編碼轉換:按照基礎數據與地理實體數據之間的轉換關系,進行編碼轉換。
(三)對象化處理:對轉換后的實體,逐類逐個進行處理,形成滿足標準的實體數據。
(四)質量檢查:包括過程質量檢查和成果檢查,在數據采集的過程中,進行數據質量控制和檢查,其中質量檢查,包括空間拓撲關系、屬性結構的完整性、正確性以及編碼的唯一性、合規性。根據相關規定數據采集的內在約束性;成果檢查主要是依據建庫標準對數據進行入庫前的檢查,檢查合格方可入庫。
(五)數據入庫:對于檢查合格的數據,即可進行入庫。數據入庫,需要依托GIS桌面軟件及空間數據庫引擎,將空間數據存儲于數據庫管理系統中。
(六)時空化處理:針對入庫的區劃數據,按標準進行統一編碼,并按對象賦予時間屬性,包括區劃啟用時間、數據更新時間,構建行政區劃時空數據庫。
三、結語
在地理實體建庫設計中,關鍵因素是地理編碼的設計和數據抽取為基礎的數據融合。地理編碼的設計不僅要體現地理實體概念邏輯和現實世界的關系,更要體現地理實體之間、屬性之間的關系,形成具有統一分類、唯一編碼、規范化的編碼體系。而數據抽取是以地理編碼和數據融合為基礎,從各類基礎數據、專題數據中按照地理實體的分類來融合圖形和屬性要素,形成完整的地理實體。地理數據建庫技術的研究,有助于使智慧城市多源的海量數據形成統一、規范的數據基礎,使數據交換提供可行的路徑。
參考文獻:
[1]郭小玉.地理實體制作技術探討[C].中國測繪學會學術年會,2012.
[2]蔣捷,黃蔚等.地理信息公共服務平臺地理實體數據建模研究[J].城市空間信息共享,2009(04).