

摘 要 基礎地理實體是時空數據庫的重要內容之一,也是時空信息云平臺進行數據分析和挖掘的基礎。本文探索了時空化基礎地理實體數據設計和生產的流程,從時空數據集級和時空數據對象級兩個方面來設計基礎實體的時空化數據結構,并從數據分析、預處理、實體分層、整合編輯、規范化處理、質量檢查幾個環節來描述時空化實體數據的生產過程,對市縣級開展時空信息云平臺建庫工作的實施具有現實的參考價值。
關鍵詞 時空信息云平臺;時空化;實體數據;數據整合編輯
引言
隨著地理空間框架和時空信息云平臺項目的開展,實體數據被廣泛應用于地理空間數據建模。其中,基礎地理實體在時空數據庫中起到基礎性、規范性的作用,也是與社會經濟、自然資源等專題實體進行關聯的基礎,基礎地理的規范性、完整性和準確性也是時空數據庫建庫的關鍵內容。本文探討基礎地理實體數據的時空化設計以及生產建庫的基本流程,以規范化、流程化的生產來確保數據的質量,也為后期專題實體的掛接和時空信息平臺數據分析和挖掘提供基礎。
1基礎地理實體時空化表達
地理實體主要由空間特征、時態特征和屬性特征所構成,其特征主要有兩種表現形式:一是呈現把不同的空間維度;二是相同的空間連續性呈現不同形態[1]。因此,時空數據庫在框架數據庫的基礎上,是由標示實體的外觀形態的幾何形態信息,標示實體各種語義特征的屬性描述信息[2]。本文基礎地理實體建庫研究,主要是從數據集和數據對象兩個維度,增加時間描述字段,空間數據存儲數據生產時間、入庫時間、更新時間,對應數據元數據的有效期開始時間和有效期結束時間,記錄每個數據對象的生命周期。
時空數據集級。歷史記錄存儲方式以有效期開始時間和有效期結束時間記錄數據集在時間軸上的更新變化情況,更新過程以版本號記錄,數據類別區分數據集狀態,是歷史還是現狀,每一個歷史版本都關聯現狀數據集的唯一標識碼數據集ID,形成數據集從現狀到歷史的回溯。
時空數據對象級。歷史記錄存儲以有效期開始時間和有效期結束時間記錄對象在時間軸上的更新變化情況,對象的每一次更新記錄一個版本號,以對象編碼作為唯一標識,通過當前狀態判斷該對象是否有效,當前使用的對象有效結束時間為最大值,當有效結束時間停止,則該對象消亡,生成新的對象,重新編碼,保證編碼唯一。記錄數據的來源、采集、入庫預更新時間進行時空化處理。
2基礎地理實體建庫方法
地理實體數據是對基礎地理信息數據進行內容提取與分層細化、模型對象重構、統計分析等處理而形成的[3]。基礎地理實體的建庫主要從數據分析、數據預處理、實體提取分層、整合編輯、規范化處理以及質量檢查來構建生產流程(見圖1時空化基礎地理實體建庫流程圖)。
2.1 數據分析
數據分析是在收集的數據基礎上,對數據進行定性與定量分析,確定基礎數據和參考數據,即通過分析理清獲取的不同來源原始數據的數學基礎、時效性、比例尺、數據范圍、數據內容、數據分層、圖層結構、屬性結構、要素對象及屬性信息等。形成數據融合與處理初步計劃,包括圖層融合主要依據圖層、參考圖層、字段融合原則,數據來源記錄方式等。
2.2 數據預處理
根據數據分析結果和確定的數學基礎、要素內容、字段結構和屬性內容、數據來源等,對原始數據進行初步的預處理加工,形成細化的數據加工方案。
(1)統一數據格式與數學基礎
不同格式的數據應通過格式轉換使得數據統一格式,不同數學基礎的數據應進行坐標轉換處理統一數學基礎。
(2)圖層與屬性的整合編輯
對于不同來源的實體數據進行圖層層面整合編輯,使得整合編輯后的數據在現勢性、準確性、完整性等方面達到最優,實體數據可直接使用的空間位置、圖形內容、字段結構和屬性內容直接從原數據轉換提取。基礎地理信息數據的空間位置與圖形信息比較準確豐富,實體數據的空間位置與圖形信息就可通過基礎地理信息成果數據直接提取利用。
(3)規范化處理入庫
根據實體數據命名規范、分層規范、字段結構規范、屬性內容要求進行規整處理,在整合編輯處理之后數據在屬性結構與內容上都有重復或是不規范的填寫,此時應按照相應規范進行處理,相關的操作有字段的重命名、別名漢化、字段類型修改、屬性更新等,之后進行質量檢查,對于不合格的數據重新處理,直至數據質檢合格后再進行數據入庫。
2.3 實體提取分層
基于基礎地理信息數據提取實體數據的原則是結合現實世界可抽象可表達的地物要素選取,剔除制圖輔助要素和屬性信息。分層原則同理基礎地理信息數據分層分類,依據《基礎地理信息要素數據字典 第1部分:1:500 1:1000 1:2000基礎地理信息要素數據字典》(GB/T 20258.1-2007)與《基礎地理信息要素分類與代碼》(GB/T 13923-2006),基于融合后的基礎地理信息成果數據提取水系、道路、建筑物、行政區劃、綠地數據。
2.4 數據整合編輯
實體數據的整合編輯即形成空間位置準確、圖層結構規范、屬性信息完整、實體關系準確的基礎實體過程。基礎實體數據整合編輯主要是對不同來源的基礎數據進行融合處理,具體基礎實體整合編輯規則及說明可在實體數據生產過程中結合數據資料據和建庫工具進行不斷完善和補充,使其與數據生產過程相一致,提高數據成果的準確性和生產效率。
在實體整合編輯的過程中,具體系列規則和說明主要是:確定基礎地形圖要素空間位置為主要提取依據;基于影像和國情監測數據對基礎實體進行補充,對于不完整的建筑、道路、水系、綠地等圖形要素,可通過影像和地理國情要素補充完整,同時在屬性字段中標明補充修改的圖形的數據來源;結合道路面/線圖層生成道路中心線圖層。
2.5 規范化處理
在規范化處理方面,主要是依據標準進行屬性的填寫,關鍵是圖元標識唯一碼的確定。基礎地理實體與其構成圖元通過圖元標識碼建立關聯,其邏輯結構變現為圖元表、實體圖元關系表及兩者之間的關系[4]。
2.6 質量檢查
對實體化處理后的實體成果數據的質量進行檢查,檢查內容同矢量成果數據大體一致,主要檢查項為:數學基礎是否符合要求;數據是否完整,包括圖形與屬性的完整,屬性信息完整性按照各類實體屬性表結構中規定的內容進行檢查,尤其是必填字段的完整性,例如實體對象唯一標識碼UUID。屬性表的字段名、長度正確性與屬性內容是否填寫規范;數據邏輯是否一致;數據拓撲是否正確,各圖層是否有不合理壓蓋;數據接邊是否正確等內容。
2.7 實體數據庫
處理后的數據,即可進行入庫,依托GIS桌面軟件及空間數據庫引擎,將空間數據存儲于數據庫管理系統中。
3結束語
基礎地理實體是時空信息云平臺建設的關鍵內容,對基礎地理實體數據的時空化設計和規范化、流程化的生產,是實體數據完整性、準確性以及高質量的保障。其關鍵是實體時空化的數據庫設計,對數據進行唯一編碼和時間、空間的屬性字段設計。在生產環節中應注重對數據的分析和分類,提取相應的要素并進行規范化處理、編碼、掛接,確保地理實體的唯一性、準確性和要素之間的關聯性。
參考文獻
[1] 季曉林.地理實體的多態特征研究[J].測繪通報,2014(3):310-314.
[2] 周成虎,裴韜.地理信息系統空間分析原理[M].北京:科學出版社,2011:1-3.
[3] 王磊,李長輝,邢漢發.地理實體化數據處理關鍵技術研究[J].測繪通報,2012(增刊): 550-552.
[4] 蔣捷,黃蔚,盧衛華,等.地理信息公共服務平臺地理實體數據建模研究[J].城市空間信息共享,2009(4):11-18.
作者簡介
劉勇(1983-),男,廣西柳州人;學歷:碩士研究生,職稱:工程師;現就職單位:柳州市地理信息中心,研究方向:地理信息與智慧城市。