曹文濤,姚垚,陳莎,李海亭
(武漢市測繪研究院,湖北 武漢 430022)
《國務院關于全國基礎測繪中長期規劃綱要(2015-2030年)的批復》提出:“到2030年新型基礎測繪體系全面建成”[2]。目前,測繪行業管理部門已陸續選擇上海、武漢、西安、寧夏、北京和山東[3]等省市作為新型基礎測繪建設國家試點,從省市兩級積極探索新型基礎測繪在產品體系、技術體系、生產組織體系和管理體系等方面的創新升級之路。去年底,全國國土測繪工作會議提出了新時期測繪工作“兩服務、兩支撐”的根本定位,明確要求重點以基礎地理實體為突破口,加快推進體系化的新型基礎測繪早日建成。
基礎地理實體生產一般分為存量測繪成果數據實體化改造和基于傾斜攝影模型、激光點云等全息采集數據直接生產兩條技術路線,本文以存量測繪成果數據實體化改造技術路線為切入點,以“繼承和創新”為原則,研究DLG轉換為基礎地理實體的關鍵技術和轉換流程,包括地理實體在數據內容、表達形式、數據組織、數據庫結構、語義屬性、關聯關系等方面的轉換細節和要求,并以國家新型基礎測繪建設武漢市試點(以下簡稱“武漢試點”)的生產為例,闡述生產轉換的具體技術實現過程。
地理實體是現實世界中占據一定且連續的空間位置、單獨具有同一屬性或完整功能的自然地物、人工設施及地理單元[4]。作為統一的空間定位框架和空間分析基礎的地理實體稱為基礎地理實體[5],它是新型基礎測繪建設的數據基礎,是構建“一庫多能、按需組裝”的地理實體數據庫的核心內容。
圖元表示空間內單一、連通和同質元素的幾何對象,一般為點、線、面、體,它是根據基礎地理實體自身的表達維度、形態特征以及實際應用需求設計的空間形態幾何表達[6]。不同圖元具有不同的作用和特性,為了加以區分和管理,減少存儲冗余,將基礎地理實體圖元分為二維圖元和三維圖元。根據基礎地理實體唯一性和整體性的特征,二維圖元又分為根圖元、主體圖元和構件圖元[7];三維圖元主要表現為傾斜三維單體、MAX模型三維單體等,如圖1所示:

圖1 基礎地理實體圖元結構
二維圖元根據基礎地理實體空間表達完整性和應用特征分為以下三類:
(1)根圖元是指在空間位置、權屬管理等方面,能夠完整表達基礎地理實體空間特征的幾何圖形,與基礎地理實體一一對應。
(2)主體圖元是指除根圖元以外,其他能夠完整表達基礎地理實體空間特征的幾何圖形。
(3)構件圖元是指僅能夠部分表達基礎地理實體空間特征的幾何圖形。
根圖元、主體圖元和構件圖元均用于構建基礎地理實體,每個基礎地理實體必有一個根圖元,但不一定有主體圖元和構件圖元,主體圖元和構件圖元是根圖元的補充表達。例如,道路實體包括道路中心線和道路面圖元,兩者都能完整表達基礎地理實體的幾何特征,為避免基礎地理實體基本屬性存儲冗余,需從中挑選一個圖元作為根圖元,如選擇道路面作為根圖元存儲道路實體的基本屬性(如道路名稱、道路等級),道路中心線則作為主體圖元,不存儲道路名稱、道路等級等屬性信息;又例如房屋地理實體包括房屋基底面、第五立面等圖元,房屋基底面能完整表達房屋地理實體的空間特征,可作為根圖元,而第五立面(屋頂面)表示房屋的錯層信息,僅能部分表達房屋地理實體的空間特征,則作為構件圖元。
本文主要介紹以DLG為主要數據源的存量數據轉換基礎地理實體流程,轉換生成基礎地理實體二維圖元,對三維圖元不做詳細介紹。
存量數據轉換基礎地理實體是以DLG數據為基礎數據源進行轉換生產,具體生產作業流程包括源數據收集分析、源數據預處理和數據轉換編輯等三個環節[8]:
(1)源數據收集分析環節包括收集、整理用于轉換基礎地理實體的DLG數據及各類輔助參考數據集,并綜合分析各類數據集的特性,規劃每一類數據的最適宜用途;
(2)源數據預處理環節是對數據源進行規范化、標準化處理;
(3)數據轉換編輯環節是DLG轉換基礎地理實體作業流程的核心,首先配置基礎地理實體數據庫結構,然后制作DLG要素與基礎地理實體圖元映射表,再對源數據進行轉換編輯,生產出符合要求的基礎地理實體數據。
生產轉換流程如圖2所示:
源數據分析,主要是按基礎地理實體的類別特征和質量要求對源數據的類型、執行標準、來源、法定性、特性和用途等進行綜合考量,形成數據源分析表。

圖2 存量數據轉換基礎地理實體流程圖
由于DLG數據無法完全覆蓋所有類型的基礎地理實體,且對于部分基礎地理實體而言,其權威性與時效性存在欠缺,因此除DLG數據外,還需要獲取國土調查、國土空間規劃、不動產登記、地下空間、地下管線、地理國情等數據集,作為基礎地理實體數據生產的輔助參考數據。
源數據預處理包括源數據檢查、統一源數據數學基礎,完整性處理等工作。
(1)源數據檢查,主要是對源數據進行幾何檢查、拓撲檢查、屬性檢查等,如同層數據重疊、懸掛點、線自相交、必填字段完整性、屬性字典值合理性等,對檢查出的錯誤進行自動化批量修改和半自動化人工交互修改,從而保證源數據的質量。
(2)統一源數據數學基礎主要包括統一格式和統一坐標系。前者是將DLG以及其他輔助參考數據的格式進行統一,可選擇dwg、shp、mdb、gdb等常見的矢量數據格式作為統一后的數據格式;后者主要是將各種數據源的空間參考坐標系進行統一,平面坐標系統可選擇基于CGCS2000橢球的3°或6°帶的高斯投影平面坐標系或地方獨立坐標系,高程系統采用1985國家高程基準。
(3)完整性處理是將由于分幅整飾、作業區域劃分等因素被分割為若干部分的地形圖要素,按照實際地物表達重新合并為完整要素的過程。在新型基礎測繪建設武漢試點生產實踐中,完整性處理一方面是將標準格網分幅的DLG接邊位置處的線和面要素依據空間位置和屬性信息進行連接、合并等處理;另一方面是將DLG圖幅內的圍墻、柵欄、花壇等分段表達的離散要素按照實際地物的空間表達連接成完整的要素。
對存量源數據進行收集、分析和預處理后,即可獲得滿足轉換基礎地理實體要求的源數據,然后通過轉換規則制定、數據轉換和轉換后處理等環節,就能夠得到最終的基礎地理實體數據。
(1)轉換規則制定
數據轉換規則制定主要包括制作DLG與基礎地理實體圖元映射表和建立基礎地理實體數據庫結構。制作基礎地理實體圖元與DLG映射表,是規范數據轉換過程中DLG要素的圖形、屬性信息與基礎地理實體圖元的對應關系,方便利用程序進行批量化、自動化的轉換處理;建立基礎地理實體數據庫結構是依據地理實體數據規范的內容與要求,創建基礎地理實體所有數據圖層與屬性字段,以便轉換后的數據能夠規范存儲。
DLG轉換基礎地理實體規則是DLG要素圖形與圖元圖形、DLG要素屬性信息與圖元屬性信息對應關系的規定,前者即圖層映射規則,后者即語義映射規則。
圖層映射規則用于規定源圖層與目標圖層之間的對應關系,規定了源圖層轉換至目標圖層的過濾條件。通過圖層映射規則,依據過濾條件,將DLG源圖層數據轉換至基礎地理實體目標圖層中。過濾條件為指定要素編碼、要素名稱或指定屬性值等。
語義映射規則用于描述源數據與目標數據之間屬性字段及其值的映射關系,該規則主要分為通用字段映射規則和專有字段映射規則。通用字段映射規則適用于所有目標圖層,專有字段映射規則適用于某一具體的目標圖層。字段映射取值有三種形式:一是源字段映射;二是固定值填寫;三是屬性字典映射。源字段映射一般是存在直接對關系的字段間進行屬性值映射;固定值填寫則主要是在基礎地理實體及其圖元屬性項中,按照數據標準要求,填寫固定的分類編碼、名稱等內容;屬性字典映射是指存在對應關系的字段間需要利用屬性字典進行針對性的屬性值映射。
(2)數據轉換
依據DLG與基礎地理實體圖元映射表和基礎地理實體數據庫結構,可以將部分DLG要素直接批量轉換為基礎地理實體圖元。
此外,由于DLG要素內容與基礎地理實體的內容并非完全對應,部分DLG要素并無對應的基礎地理實體,如等高線、高程點、注記等要素,所以這部分要素無法參與轉換基礎地理實體圖元,但為了能夠滿足從基礎地理實體數據庫中派生DLG的應用需求,可保留這部分DLG要素原有的屬性結構和空間表達內容,單獨作為制圖要素數據集,保存到基礎地理實體數據庫中,以便于基于基礎地理實體數據庫定制派生地圖產品。
(3)轉換后處理
由于基礎地理實體對幾何類型、語義屬性和關聯關系等方面均有特定的要求,這與DLG要素本身的圖形表達和語義屬性存在較大差異,且DLG要素彼此之間不存在關聯關系,因此在DLG要素批量轉換為基礎地理實體圖元數據后,還需要對不滿足基礎地理實體數據要求的圖元幾何表達、語義屬性與關聯關系進行編輯,主要包括圖形編輯、屬性編輯、基礎地理實體與圖元關聯三個部分,通過這三個方面的編輯處理,便可形成符合數據規范要求的基礎地理實體數據。
圖形編輯是按照基礎地理實體圖元的幾何圖形設計要求,將DLG中參與表達基礎地理實體但無法直接轉換生成基礎地理實體圖元的要素,通過數據加工處理得到能夠真實、完整表達地理實體的空間位置、范圍和形態的圖元。在DLG轉換基礎地理實體轉換流程中,常見的圖形編輯處理主要包括圖形勾繪、按屬性合并、跨圖層合并、線切割、按線構面、提取中心線、線續采、構建外包面等。
屬性編輯是按照基礎地理實體圖元的屬性規范要求,結合并參考各類輔助數據,對經過DLG批量轉換基礎地理實體和圖形編輯后得到的基礎地理實體圖元數據的屬性信息進行補充和完善,得到能夠真實、完整表達地理實體的屬性數據。屬性編輯工作主要分為兩種,一種是批量賦值,如通過空間位置關系將相關聯的圖元屬性進行批量掛接或賦值;另外一種是人工賦值,對利用現有數據無法再進一步完善的屬性信息,采用影像判讀、外業調查核實等方式進行屬性補充。
基礎地理實體與圖元關聯是對同一基礎地理實體的多個圖元,賦予相同的地理實體標識碼,方便對其進行統一的組織管理。
存量數據轉換為基礎地理實體數據后,應進行數據質量檢查。檢查內容包括基本檢查、拓撲檢查、空間檢查、屬性檢查、關聯關系檢查和邏輯一致性檢查,質量檢查合格后才可進行數據入庫操作。基礎地理實體數據檢查項與要求如下:
(1)基本檢查。如檢查基礎地理實體數據分層是否存在錯誤層、遺漏層、多余層或重復層的現象。
(2)空間檢查。如檢查圖元構造是否合理性;檢查圖元空間范圍合理性。
(3)拓撲檢查。檢查線圖元是否存在打折線、微短線、懸掛點、偽節點、自重疊、自相交、無效邊界等現象。
(4)屬性檢查。如檢查基礎地理實體基本屬性項、專有屬性項是否存在命名錯誤、類型錯誤、長度錯誤、順序混亂、取值不規范等現象;檢查基礎地理實體標識碼是否正確、重復。
(5)關聯關系檢查。如檢查基礎地理實體標識碼與其根圖元、主體圖元和構件圖元屬性中的地理實體標識碼是否一致。
(6)邏輯一致性檢查。如檢查不同圖元屬性值邏輯是否一致,如房屋根圖元的建筑層數與房屋構件圖元的地上層數是否一致。
本文以武漢試點的生產實踐為例,選擇房屋地理實體詳細介紹存量數據轉換為地理實體的具體技術實現。
按照指導武漢試點地理實體數據生產的標準規范要求,房屋地理實體的二維圖元包括1個根圖元和若干構件圖元,前者表示房屋地理實體的權屬基底,需要依據不動產登記自然幢、建筑信息調查等數據進行生產編輯;后者則主要表示房屋的局部構成部分以及附屬物信息,可直接由DLG中的對應要素直接轉換生產,具體圖元名稱、幾何類型以及圖層如表1所示:

房屋地理實體圖元編碼、類型與分層要求 表1
房屋地理實體圖元的屬性包括基本屬性和專有屬性兩個部分,基本屬性是所有地理實體圖元都有的屬性項,如圖元標識碼、圖元編碼和圖元名稱等;專有屬性則是根據各個地理實體圖元表達內容和特征的不同,規定的特定屬性字段。房屋地理實體根圖元、構件圖元的屬性表如所2示:

房屋根圖元(G_JMD_FW_A)專有屬性表 表2

第五立面(屋頂面)構件圖元(GJ_JMD_FW_A)專有屬性表 表3
由存量數據轉換生產房屋地理實體的主要數據源為DLG數據中的一般房屋、突出房屋、飄樓、陽臺等房屋類要素,輔助參考數據有不動產登記自然幢數據、建筑調查數據等。從數據來源、法定性、特性、用途和數據優先級等方面,對主要數據源和輔助參考數據進行分析,形成數據源分析如表4所示:

生產房屋地理實體數據源分析表 表4
其中,DLG中房屋類要素的格式為dwg,幾何類型為面,圖層為RESA,屬性結構如表5所示:

DLG房屋類要素屬性結構表 表5
主要數據源可直接轉換為房屋地理實體的對應構件圖元,但其根圖元的幾何形狀為了表達實際房屋權屬的獨立性與完整性,需要參考不動產登記自然幢數據和建筑信息調查數據來生產,當這兩種數據不一致時,優先采用不動產登記自然幢數據;而房屋類要素的屬性信息可以通過語義映射規則批量賦值到房屋地理實體圖元的相應字段中。
制作房屋地理實體圖元與DLG要素映射表,規范數據轉換過程中DLG要素的圖形、屬性信息與基礎地理實體圖元的對應關系。
(1)圖層映射表(表6)

房屋構件圖元與DLG要素圖層映射表 表6
(2)語義映射表(表7)

房屋構件圖元與DLG要素語義映射表 表7
根據房屋地理實體構件圖元與DLG映射表,將DLG數據直接批量轉換為對應的房屋地理實體構件圖元,構件圖元的“類型”“結構”字段可根據相應的屬性字典映射關系賦值,“地上層數”和“架空層數”可通過源字段映射賦值,頂部高程和底部高程可分別利用DSM和DEM數據由自動批量賦值。
(1)圖形來源
將房屋地理實體構件圖元(GJ_JMD_FW_A)中圖元名稱為第五立面(屋頂面)的圖形導入房屋面根圖元所在圖層(G_JMD_FW_A),作為圖形基礎。
(2)圖形處理
考慮到DLG房屋類要素精度高但不體現權屬信息,而不動產登記自然幢或建筑信息調查數據精度低但包含權屬信息,因此房屋地理實體根圖元的圖形處理原則為:每一個不動產登記自然幢或建筑信息調查圖形對應一個房屋地理實體根圖元,對落入同一自然幢的房屋地理實體構件圖元進行圖形合并,形成一個完整的房屋地理實體根圖元。具體圖形編輯步驟如下:
①首先,以不動產登記自然幢數據為依據,自然幢數據中是一棟房屋的,將多個房屋地理實體構件圖元合并為一個面,作為房屋地理實體根圖元。(表現為房屋基底面,不包括陽臺、雨罩、檐廊、挑廊、廊房等,破壞房屋不參與合并);
②不動產登記自然幢數據尚未覆蓋的范圍,將建筑基礎調查數據作為生產房屋地理實體根圖元的參考依據,方法與步驟(1)相同;
③刪除代表地下建筑出入口、公交車站、地鐵出入口的棚房。
房屋地理實體根圖元生產的DLG數據、不動產登記自然幢參考數據、經過圖形處理后的房屋實體根圖元如圖3所示:

圖3 房屋地理實體根圖元圖形處理示意圖
(3)屬性填寫
首先根據DLG要素以及不動產登記自然幢、建筑信息調查等參考數據,為房屋地理實體根圖元和構件圖元的基本屬性項與專有屬性項進行賦值。
①建筑類型
根據DLG中要素名稱自動批量填寫,如表8所示:

房建筑類型屬性字段對應表 表8
②建筑結構
建筑結構由參與構成根圖元的相關構件圖元建筑面積值來確定。首先,計算構件圖元的建筑面積,即構件圖元的幾何面積與地上層數的乘積,然后挑選建筑面積值最大的構件圖元建筑結構作為根圖元的建筑結構屬性值。
如果挑選出建筑面積最大的構件圖元為簡易房屋、棚房、破壞房屋、建筑中的房屋等,則根圖元無須填寫建筑結構。
③建筑層數
與建筑結構賦值步驟相似,根據所選取的建筑面積最大的構件圖元的“地上層數”字段。
④建筑狀態
建筑中的房屋填“02”(在建),拆遷區范圍內的填“03”(待拆),其他已建成的填“01”(已建成)。
⑤其他屬性字段
依據建筑信息調查數據中的建筑用途、外形特征、行政區屬、建筑年代屬性字段來對應賦值。若建筑狀態為“02”,則建筑用途、外形特征、建筑年代不填寫。
除了房屋地理實體根圖元和構件圖元的相關屬性項外,還需要對房屋地理實體的名稱、地址、所有者/管理者、產生時間等基本屬性項賦值。
①地理實體名稱
將建筑名稱作為地理實體名稱屬性填寫,參考DLG數據文字注記、不動產登記自然幢數據等,并結合互聯網地圖查詢搜索與實地調查的相關情況填寫。
②地址
房屋的地址來源于不動產登記宗地數據的坐落、建筑基礎調查的地址及互聯網地圖的查詢結果等。
③所有者/主要管理者
通過院落的“所有者/主要管理者”字段進行掛接,同一個院落內的房屋所有者相同院落的所有者/主要管理者來源于不動產登記宗地數據中的權利人。
④產生時間
產生時間代表房屋建筑竣工年代,采用建筑基礎調查數據中的建筑年代屬性字段。產生時間字段為年月日8位的日期型,如:19991231
⑤地理實體分類碼、圖元名稱、圖元編碼
按照武漢試點地理實體數據生產的標準規范填寫:房屋地理實體根圖元的地理實體分類碼為01010100,圖元名稱為房屋,圖元編碼為01010100A01。
⑥測取時間、存續時間
測取時間按DLG要素中的測取時間自動批量填寫;如果根圖元是由多個不同測取時間的構件圖元合并生成,根圖元的測取時間采用其中最早的測取時間。
存續時間填寫數據生產的當前時間。
(4)圖元關聯
根據空間關系識別同一房屋地理實體的房屋根圖元與第五立面(屋頂面)、第五立面(屋頂面)與其鄰接的廊房、飄樓、雨罩、陽臺等房屋構件圖元,將其進行關聯,標記為相同的地理實體。
最后經過質量檢查,便可生成符合數據規范要求的基礎地理實體數據。
綜上,以房屋為例,通過對需要轉換生產房屋地理實體的DLG要素、不動產登記自然幢等源數據進行收集分析,制定房屋圖元與DLG要素的圖層和語義映射表,實現從DLG要素到房屋地理實體圖元的圖形、語義轉換,并參考建筑信息調查等數據房屋地理實體及其圖元的屬性項進行信息補充和完善,從而實現DLG中房屋類要素向房屋地理實體的快速轉換生產。
本文首先介紹了新型基礎測繪建設的背景、基礎地理實體的構成以及圖元的具體內容,詳細說明了存量DLG等數據轉換為基礎地理實體的具體流程與方法,最后以房屋為例,具體敘述了基于DLG房屋等要素、不動產登記自然幢以及建筑信息調查等數據轉換生產房屋地理實體的實現步驟,系統地闡述了存量數據轉換基礎地理實體的具體技術實現過程。
存量DLG等數據轉換基礎地理實體不僅實現了對傳統基礎測繪成果的有效利用,還在對生產成本有效控制的基礎上大大縮短了新型基礎測繪建設的周期,從而有利于全國范圍內基礎測繪事業的轉型升級和服務變革,為自然資源管理和經濟社會發展盡快提供全方位、多層次的定制化服務[8~10]。