張 亮,胡 菡,石婷婷,邵 軍
(1.湖北省測繪工程院,湖北 武漢 430074;2.湖北省航測遙感院,湖北 武漢 430074;3.湖北省測繪成果檔案館,湖北 武漢 430074)
隨著我國經濟發展進入新時代和信息化進程的不斷加快,現有基礎測繪成果在應用中的問題逐漸凸顯:一是其形式上雖變成了以數字表現,但執行的標準還是以紙質地形圖為標準,成果品種單一、社會經濟和人文信息不全,不能適應信息化社會和地理信息產業發展多樣化、精細化、個性化的需求;二是其更新速度難以滿足實際需要,國、省、市縣數據難以共享,做不到協同更新和服務。目前,互聯網、大數據、人工智能等高新技術在測繪領域深度融合,正促使測繪體系升級換代,也催生了一批新業態、新需求,新型地理實體應運而生。地理實體的產生與發展,使測繪數據轉向地理信息[1],制圖表現轉向對象化表達,多空間目標轉向地理單元的唯一標定,為解決過去基礎測繪成果在應用中的各種遺留問題提供了新思路,有利于實現基礎地理信息數據與各類專題數據的深度融合及國、省、市縣數據的聯動更新。
《全國基礎測繪中長期規劃綱要(2015-2030 年)》[2]中提出:“到2030 年新型基礎測繪體系全面建成。”在新型基礎測繪體系數據庫建設試點中,推動按尺度分級的基礎地理信息數據庫向按地理實體分級的非尺度基礎時空數據庫轉變,是其中一個重要方面和直接目標。因此,如何建設好新型基礎地理實體,是目前急需解決的一個關鍵問題。
地理實體是現實世界中具有空間位置、共同屬性的獨立自然或人工地物[3]。從產品應用角度而言,地理實體可分為基本地理實體和擴展地理實體,基本地理實體形成基礎框架,擴展實體根據數據源和應用情況進行抽象和擴展。
從自然資源管理“兩統一”職責需求出發,基礎地理實體應涵蓋兩部分內容:一是傳統基礎測繪成果,尤其是系列比例尺數字地形圖上所有表達的地理要素;二是滿足自然資源調查、確權和監管等職責需求,山水林田湖草礦等自然資源要素。從不同的視角、學科、行業及應用需求出發可形成對地理視角不同的實體分類標準[4],本文對傳統的基礎地理信息數據與自然資源業務數據進行了融合,在繼承原基礎地理信息要素分類與代碼的基礎上,結合三調、地理國情監測、統一確權登記等工作,對自然資源業務管理對象和現狀數據進行了梳理,沿用了其8 個門類,在各門類基礎上擴展劃分出共48 個大類,新增了部分地理要素,重新定義了部分地理要素,并對原分類代碼進行了擴展。
擴展的分類碼采用10 位十進制數字碼,實體要素的分類代碼結構是在國標代碼(門類、大類、中類和小類)后加圖形碼和細分碼,具體代碼結構如圖 1所示。

圖1 擴展分類碼結構圖
1)左起第一、二位為門類碼,根據地理實體的門類劃分,門類碼為“01”~“08”。
2)左起第三、四位為大類碼,在門類基礎上細分形成的實體類,是已有各分類編碼體系的一級類編碼。
3)左起第五、六位為中類碼,在大類基礎上細分形成的實體類,是已有各分類編碼體系的二級類編碼,無此級別的,則中類碼補“0”。
4)左起第七、八位為小類碼,在中類基礎上細分形成的實體類,是已有各分類編碼體系的三級類編碼,如有四級類編碼的情況,則將其并入三級類編碼中,無此級別的,則小類碼補“0”。
5)圖形碼采用1 位數字碼,0 表示注記、1 表示點、2 表示線/中心線、3 表示面、4 表示邊線。
6)細分碼是對國標代碼中子類碼的進一步劃分,按 1~9 順序添加,如沒有細分類,則為 0。
地理實體間按照層級關系組織,上級實體包含一種或多種下級地理實體,如圖2 所示。

圖2 地理實體層級關系示意圖
任何一個地理實體,在它的生命周期內占有的地理空間是唯一的,這種時空唯一性使得我們基于一種全球統一的空間參考基礎,對每個實體指定唯一的編碼,便能描述該實體時空特征的數據關系。因此,地理實體編碼如同地理實體的身份證,能夠為多源大數據匯聚提供關聯,為數據聯動更新和綜合信息挖掘提供基礎。
圍繞地理實體編碼,國內各試點城市進行了有益探索。如武漢采用42 位定長編碼,由分類碼(12 位)+位置碼(18 位)+時間碼(8 位)+順序碼(4 位)構成;上海采用32 位(如果有專業碼,則變長)編碼,由位置碼(15 位)+分類碼(10 位)+順序碼(7 位)構成;嘉興采用31 位定長編碼,由省市縣行政區域碼(6 位)+鄉村行政碼(6 位)+分類碼(5 位)+時間碼(8 位)+順序碼(6 位)構成。為標定地理實體的時空信息,各方案中實體編碼通常包含時間碼和位置碼信息,時間碼規則相對單一,位置碼的定位點和編碼方式則各有不同。如嘉興利用行政區劃碼來標定位置范圍,武漢采用實體幾何中心作為定位點,以經緯度方式進行編碼,上海則用外接矩形左下角所在格網編號+ 右上角所在格網編號作為空間定位,采用投影坐標按200 m×250 m 劃分格網進行編碼。
本文在上述研究基礎上,提出了一種新的40 位地理實體編碼方案,其組成如表1 所示。

表1 地理實體編碼組成
其中,分類碼由前文規則給出,位置碼采用GeoSOT剖分網格的四進制1 維定長編碼[5],采用第18 級的地理網格編碼,可表示到256 m 格網,能基本滿足應用需求。時間碼采用8 位數字定長編碼,以地理實體首次采集、調查或建庫等的公元紀年時間為內容,如2020-09-25,則時間碼為20200925;順序碼為4 位定長數字或字母編碼,當地理實體分類碼、位置碼、時間碼完全一致時,以0 ~9、a~z的流水號順序,從右至左依次編碼。
與傳統地理要素相比,地理實體是一個抽象概念,每個地理實體在不同維度空間和不同表達層級下有不同的表現形式,其不僅承載所代表地物的空間信息,而且還包括其自然屬性、社會人文屬性、擴展屬性以及時間信息等。地理實體的構建就是完成實體化的過程,判斷哪些圖元為同一實體的過程[6],即建立圖元和實體的對應關系,對要素進行實體化重組,賦予相應屬性,以實現地理對象在時空維度的唯一性和屬性的完整。
以交通為例,鐵路一般提取中心線數據,構建線實體;以單線形式表示的鄉村道路(不依比例尺)提取單線數據,在遇有橋梁、涵洞等使道路表示中斷時,應在斷開處添加線段使道路表示完整,構建線實體; 以雙線形式表示的城際公路、城市道路、鄉村道路(依比例尺)提取兩條邊線數據和中心線數據,不提取附屬設施數據,構建面實體[7]。
構建好的地理實體在存儲上由圖元表和實體表構成,圖元表類似于傳統的地理要素類,實體表記錄了實體的圖元構成和實體標識碼。兩表間通過圖元標識碼建立關聯,因此實體表務必清晰地描述實體標識碼和圖元標識碼的對應關系。
在新型地理實體建設中,地理實體編碼作為關聯和承載各政府部門信息的紐帶和橋梁,顯得尤為重要。地理實體唯一編碼的方法很多,為了便于快速檢索和定位,應制定科學的分類和編碼方案。新型地理實體的興起,加速了測繪地理信息開放共享的進程。在大數據時代,只有在描述其與圖元的基本關系的同時,于應用中進一步構建其與人、物、法人、事件等的關系,提升新型測繪成果組合方式,為多學科、多行業、不同用戶類型開發按需定制的服務產品,才能盡顯地理實體的優越性。