張 亮,覃俊華,王愛華,戴 騰,趙 鵬
(1.湖北省測繪工程院,湖北 武漢 430074;2.山東省國土測繪院,山東 濟南 250013)
基礎測繪成果對各行各業高質量發展起到了基礎性、保障性和先導性作用[1],當前基礎地理信息仍然以點、線、面等幾何圖元的方式組織存儲。隨著我國經濟的發展,數據應用的深入,這種組織方式的缺點逐漸暴露,即概念完整的地理實體如河流、道路等被分割成多個對象,難以提取和更新與之相關的經濟、社會和人口信息;地理實體屬性在時間上的差異未能體現;地理實體的關聯信息通過實時計算得到,空間分析效率低下;沒能實現對異構數據源的關聯管理,不便于聯動更新。隨著大數據、物聯網、云計算、人工智能等技術的興起,地理信息數據應用逐漸深入,亟待由傳統的基于幾何圖元方式組織向基于地理實體組織方式轉變。
國家測繪地理信息“十三五”規劃整體思路中也強調,加快推進基礎地理信息數據庫建設的轉型,逐步建立基于最詳細的地理實體的成果采集和管理模式[2]。因此,建設地理實體時空數據庫具有很強的現實意義。
國內外學者從不同角度對地理實體展開了研究,美國聯邦地理數據委員會(FGDC)對地籍、行政管理單元、水系、交通四類標準數據采用了面向實體建模[3]。歐洲議會2007年通過建設歐盟空間信息基礎設施(INSPIRE)的決議后,推出了一系列盡可能地采用面向實體的數據建模的地理數據規范[4]。蔣捷[5]等提出將地理信息公服務平臺設計成面向對象實體;于天星[5]等設計了“三級空間”和“0~1位置變化序列”的地理實體時空位置的多粒度表達方法;張翼然[7]等研究了地理實體的空間組織與多態特征,以房屋建筑實體為例介紹了數據融合;閭國年[7]等整理了面向“智慧城市”建設的地理實體科學分類與編碼體系的構建思路;趙云鵬[9]等從矢量空間數據表達視角對地理實體的語義信息進行分析和描述,提出了基于多特征約束的語義相似性度量模型,并應用于道路實體匹配。
這些研究分別從概念、分類、編碼、數據融合等多方面對地理實體進行了闡述和總結,本文基于面向對象思想,設計了一種地理實體時空數據模型,探討了其在數據庫中的組織與存儲和具體構建方法,為今后基于地理實體的新型基礎測繪地理實體數據生產奠定基礎。
針對傳統地理數據模型存在的問題,設計了基于地理實體的時空數據模型。地理實體的時空數據概念模型主要由三部分組成:空間信息、屬性信息、關聯信息,如圖1所示。

圖1 地理實體時空數據概念模型
空間信息描述地理實體的幾何特征和位置信息,以復合幾何類型或簡單幾何類型圖形來表示。復合幾何類型是簡單幾何類型的集合,簡單幾何類型通常為點、線、面、體中的一種。屬性信息用以描述地理實體的基本屬性,一般包括識別信息、特征信息、狀態信息、其他專題信息。關聯信息用以描述兩個地理實體間的聯系,此為傳統以圖元表示數據模型中缺失的部分,可包括時間關系、空間關系、語義關系、事件關系4個方面。
地理實體間的時間關系用來銜接同一地理位置的不同地理實體,可采用時間謂詞來描述,時間謂詞有“before”和“after”。
空間關系包括拓撲關系、方向關系和距離關系。拓撲關系包括相離、相接/鄰接、重疊/相交、包含等,距離關系包括遠、相鄰、近等,可根據應用需求進行定義。方向關系有基本方向關系和組合方向關系兩類,基本方位關系分為東、南、西、北4個方位,組合方向關系為基本方向關系的組合,如東北、東南等。
語義關系主要包括繼承、依賴、組合、聚合等。繼承關系是為了指定地理實體的類別。依賴關系旨在把某些地理實體的相關屬性關聯到其他地理實體的屬性上,以實現數據的聯動更新,如某省級行政區劃的人口依賴于下轄市級行政區劃的人口,二者關聯可實現同步變化。組合關系描述地理實體和其組成部分的關系,一旦作為整體的地理實體不存在了,作為組成部分的地理實體也不復存在。聚合關系與組合關系的區別在于即使作為整體的地理實體不存在了,作為組成部分的地理實體仍然存在,例如一個街區由多個房屋組成,街區因合并等原因不存在了,但街區中房屋實體仍然存在。事件關系指2個實體之間因為某個事件產生了關聯,如2個小區之間進行了一次聯誼活動等。
基于以上地理實體數據模型描述,可采用關系數據庫,如PostgreSQL來組織和存儲,如圖2所示。數據庫中每類地理實體記錄了實體固有屬性、實體專有屬性、實體構成圖元信息和實體間關聯關系。

圖2 地理實體數據庫結構
為避免信息冗余,這些信息被分別存儲到“實體固有屬性表”、“實體專有屬性表”、“二/三維圖元表(一個或多個)”、“關聯關系表”等多個邏輯關聯的結構化數據庫表中,各表間以地理實體編碼建立關聯。
實體固有屬性表記錄實體的固有屬性,字段固定不變;實體專有屬性表記錄實體的專有屬性,根據實體分類的不同,屬性字段各異。實際建庫中,針對每類實體,可將實體固有屬性表和實體專有屬性表合并為實體屬性表。
二/三維圖元表,指一個地理實體可能有一個或多個(點/線/面/體)圖元表達。
關聯關系表如表1所示,用來記錄2個實體之間的關系,建庫中不可能將任意實體間的所有關系一一描述,應根據具體應用需求進行定制,選取通用常用的關聯關系進行記錄,如道路的交匯關系等,并預留可擴展空間,但實體間的組合或聚合關聯關系必須給出描述,記錄其構成關系。

表1 關聯關系表
關聯類型(RELATIONTYPE)描述實體A與實體B之間關聯類型,0表示時間關聯;1表示拓撲關聯;2表示方向關聯;3表示距離關聯;4表示依賴關聯;5表示組合關聯;6表示聚合關聯;7表示事件關聯。關聯關系(RELATION)填寫實體間關聯關系的謂詞表達,關聯關系說明(INSTRUCTION)用于補充說明謂詞表達的關聯關系。
地理實體的關聯描述采用謂詞和被關聯的其他地理實體組成謂詞-實體對方法。規定關聯關系的名稱是以被描述的實體作為主體的,例如描述樓房A實體時,樓房A實體由房屋B實體構成,關聯關系類型填“5”,關聯關系填“父實體”。
對于新采集的地理實體可遵循以上模型設計,直接采集入庫。對于已有傳統基礎地理信息成果數據則需要進行數據處理和轉換后入庫。
對于傳統基礎地理信息成果數據,需建立數據轉換映射表,數據過濾、數據分類后,按空間數據、屬性數據、關系數據等類別進行統一歸類,以地理實體為基本粒度進行提取,并進行完整性檢查、拓撲檢查、空間關系檢查,封裝成GeoJSON格式[10]數據作為中間成果,對GeoJSON數據進行編輯處理后解析入庫,轉換入庫后可查看地理實體與圖元的組成關系。
地理實體數據庫是一種新型地理信息產品,較傳統的基礎測繪數據庫有著諸多的先天優勢,通過全球唯一編碼、對象化處理和實體關聯融合,可以滿足智慧城市建設過程中跨尺度、跨區域、跨部門的多樣化應用需求。本文設計了一種地理實體的時空數據模型,探索了地理實體在空間數據庫中的存儲,通過少量數據入庫實驗驗證了數據模型實現在技術上的可行性,但尚未以大量數據的實際應用驗證模型的可靠性與實用性,仍需結合應用實踐進行優化和改進。同時,該模型設計尚未涵蓋常見的動態目標和地理現象,語義部分描述也未能與機器學習和自然語言處理技術相結合,以實現GIS動態的學習與更新,尚不能動態描述時刻產生的海量時空信息對象的相互關系。這些都是今后需要繼續研究和逐步完善的方向,以使得地理實體產品得到更好的推廣和應用。