張 亮,周志誠(chéng),厲芳婷,趙 鵬
(1.湖北省測(cè)繪工程院,湖北 武漢 430074;2.地理國(guó)情監(jiān)測(cè)國(guó)家測(cè)繪地理信息局重點(diǎn)實(shí)驗(yàn)室,湖北 武漢 430072,3.湖北省航測(cè)遙感院,湖北 武漢 430074)
基礎(chǔ)測(cè)繪是基準(zhǔn)體系建設(shè)與維護(hù)、基礎(chǔ)航攝遙感影像獲取、基本比例尺地圖測(cè)制和更新的統(tǒng)稱(chēng),其成果對(duì)促進(jìn)各行各業(yè)高質(zhì)量發(fā)展起到了基礎(chǔ)性、保障性和先導(dǎo)性作用[1]。隨著我國(guó)經(jīng)濟(jì)的發(fā)展,現(xiàn)有基礎(chǔ)測(cè)繪成果形式固化、社會(huì)經(jīng)濟(jì)和人文信息不全、現(xiàn)勢(shì)性不足、聯(lián)動(dòng)更新困難等問(wèn)題突顯[2],逐漸難以適應(yīng)當(dāng)前信息化社會(huì)和產(chǎn)業(yè)發(fā)展的需求,加上互聯(lián)網(wǎng)、大數(shù)據(jù)、云計(jì)算、人工智能等高新技術(shù)的深入應(yīng)用,促進(jìn)了測(cè)繪技術(shù)體系的升級(jí)換代,倒逼基礎(chǔ)測(cè)繪轉(zhuǎn)型升級(jí),建立起適應(yīng)新時(shí)代要求的新型基礎(chǔ)測(cè)繪體系。
國(guó)家測(cè)繪地理信息“十三五”規(guī)劃的整體思路中強(qiáng)調(diào),應(yīng)加快推進(jìn)基礎(chǔ)地理信息數(shù)據(jù)庫(kù)建設(shè)的轉(zhuǎn)型,逐步建立基于最詳細(xì)的地理實(shí)體的成果采集和管理模式[3],因此探索按地理實(shí)體分級(jí)的非尺度基礎(chǔ)時(shí)空數(shù)據(jù)庫(kù)建設(shè)具有很強(qiáng)的現(xiàn)實(shí)意義。
建設(shè)地理實(shí)體數(shù)據(jù)庫(kù),首先要弄清地理實(shí)體與地理要素之間的異同,地理實(shí)體是現(xiàn)實(shí)世界中具有空間位置、獨(dú)立語(yǔ)義屬性或功能的自然或人工地物[4],其與傳統(tǒng)4D 產(chǎn)品中的地理要素既有聯(lián)系,又有區(qū)別。從本質(zhì)上說(shuō),它們都是對(duì)現(xiàn)實(shí)世界一種現(xiàn)象的抽象,但在數(shù)據(jù)組織形式和表達(dá)上又有差別。
傳統(tǒng)4D 產(chǎn)品中的地理要素,將現(xiàn)實(shí)世界抽象成點(diǎn)、線、面要素構(gòu)成的圖層,能很好地展示各要素之間的空間關(guān)系,但卻將一個(gè)完整的地理實(shí)體切割為多個(gè)空間目標(biāo)。由于未建立相互之間的唯一性標(biāo)識(shí)關(guān)聯(lián),使得表達(dá)同一實(shí)體的空間目標(biāo)碎片化,難以按照實(shí)體提取相關(guān)空間目標(biāo),并維護(hù)其與相關(guān)專(zhuān)題信息的掛接關(guān)系[5]。另外,以往采集的要素屬性未加入時(shí)間戳,因此無(wú)法完整描述地理實(shí)體在時(shí)間和空間上的語(yǔ)義關(guān)系。因此,按要素采集建庫(kù)的方式已難以滿足當(dāng)前地理信息應(yīng)用的需求,如一條道路,以傳統(tǒng)的幾何要素表達(dá),其只能包含道路中心線或道路邊線或道路面,它們之間并無(wú)關(guān)聯(lián);而以地理實(shí)體來(lái)表達(dá),則可同時(shí)包含道路中心線、道路邊線和道路面等多個(gè)圖元,且有唯一的地理實(shí)體編碼作為標(biāo)識(shí),對(duì)其賦予產(chǎn)生和消亡時(shí)間屬性,能完整描述地理實(shí)體的時(shí)空關(guān)系語(yǔ)義。這種按實(shí)體對(duì)象建庫(kù)的表達(dá)無(wú)疑更符合人們認(rèn)識(shí)現(xiàn)實(shí)世界的模式,在應(yīng)用上也更加靈活便捷。
在地理實(shí)體建庫(kù)過(guò)程中,地理實(shí)體編碼和通用屬性設(shè)計(jì)是關(guān)鍵環(huán)節(jié),直接決定了庫(kù)體的組織結(jié)構(gòu)。
地理實(shí)體編碼是為每個(gè)地理實(shí)體賦予唯一的身份標(biāo)識(shí),目前的基礎(chǔ)地理數(shù)據(jù)分類(lèi)代碼尚不支持新的時(shí)空模型,不能標(biāo)識(shí)地理實(shí)體的位置[6],因此不能滿足地理信息時(shí)空大數(shù)據(jù)的應(yīng)用需求。針對(duì)該問(wèn)題,本文設(shè)計(jì)了分類(lèi)碼+位置碼+時(shí)間碼+順序碼的地理實(shí)體編碼方式。
2.1.1 地理實(shí)體產(chǎn)品分類(lèi)碼
哪些地理要素需作為實(shí)體進(jìn)行采集是地理實(shí)體生產(chǎn)首先需要解決的問(wèn)題。目前,對(duì)于地理實(shí)體產(chǎn)品的采集和分類(lèi),尚未形成統(tǒng)一的規(guī)范規(guī)定,本文結(jié)合基礎(chǔ)地理信息數(shù)據(jù)、自然資源和其他行業(yè)部門(mén)的應(yīng)用需求來(lái)確定分類(lèi)。在兼容傳統(tǒng)地理要素分類(lèi)標(biāo)準(zhǔn)的基礎(chǔ)上,本文對(duì)地理實(shí)體的覆蓋范圍進(jìn)行了拓展,主要涵蓋基礎(chǔ)實(shí)體、專(zhuān)業(yè)實(shí)體和綜合實(shí)體3 個(gè)方面的內(nèi)容,劃分定位基礎(chǔ)、水系、居民地與設(shè)施、交通、植被與土質(zhì)、管線與設(shè)施、境界與區(qū)域、地貌等8 個(gè)門(mén)類(lèi),并在各門(mén)類(lèi)的基礎(chǔ)上進(jìn)一步劃分出48 個(gè)大類(lèi),對(duì)應(yīng)創(chuàng)建107 個(gè)圖層。
分類(lèi)碼采用10 位十進(jìn)制數(shù)字碼,實(shí)體要素的分類(lèi)代碼結(jié)構(gòu)是在國(guó)標(biāo)代碼(門(mén)類(lèi)、大類(lèi)、中類(lèi)和小類(lèi))后加圖形碼和細(xì)分碼。具體代碼結(jié)構(gòu)如圖 1 所示。

圖1 要素分類(lèi)代碼結(jié)構(gòu)
1)第一、二位為門(mén)類(lèi)碼,根據(jù)地理實(shí)體的門(mén)類(lèi)劃分,編碼為“01”~“08”。
2)第三、四位為大類(lèi)碼,是在門(mén)類(lèi)的基礎(chǔ)上細(xì)分形成的實(shí)體類(lèi),是已有各分類(lèi)編碼體系的一級(jí)類(lèi)編碼。
3)第五、六位為中類(lèi)碼,是在大類(lèi)的基礎(chǔ)上細(xì)分形成的實(shí)體類(lèi),是已有各分類(lèi)編碼體系的二級(jí)類(lèi)編碼,無(wú)此級(jí)別的,則中類(lèi)碼補(bǔ)“0”。
4)第七、八位為小類(lèi)碼,是在中類(lèi)的基礎(chǔ)上細(xì)分形成的實(shí)體類(lèi),是已有各分類(lèi)編碼體系的三級(jí)類(lèi)編碼;如有四級(jí)類(lèi)編碼的情況,則將其并入三級(jí)類(lèi)編碼中;無(wú)此級(jí)別的,則小類(lèi)碼補(bǔ)“0”。
5)圖形碼采用1 位數(shù)字碼,0 為注記、1 為點(diǎn)、2 為線/中心線、3 為面、4 為邊線。
6)細(xì)分碼是對(duì)國(guó)標(biāo)代碼中子類(lèi)碼的進(jìn)一步劃分,按 1~9 順序添加,如沒(méi)有細(xì)分類(lèi),則為0。
2.1.2 位置碼
位置碼采用GeoSOT 剖分網(wǎng)格[7]的一位四進(jìn)制變長(zhǎng)編碼,不同層級(jí)對(duì)應(yīng)不同的格網(wǎng)大小劃分,反映地理實(shí)體幾何中心點(diǎn)大地坐標(biāo)所在的地理網(wǎng)格編碼。編碼包含網(wǎng)格的定位信息和級(jí)信息,編碼長(zhǎng)度等于該網(wǎng)格的級(jí)數(shù)。編碼以G 開(kāi)頭,最長(zhǎng)編碼為32 級(jí),由32 位四進(jìn)制數(shù)字組成,分為9 位度級(jí)編碼、6 位分級(jí)編碼、6 位秒級(jí)編碼和11 位秒以下編碼4 段,具體形式為“Gddddddddd-mmmmmm-ssssss.uuuuuuuuuuu”,其中,d、m、s、u 取值均為0、1、2、3。
2.1.3 時(shí)間碼
時(shí)間碼采用8 位數(shù)字定長(zhǎng)編碼,以地理實(shí)體首次采集、調(diào)查或建庫(kù)等的公元紀(jì)年時(shí)間為內(nèi)容,如2020 年7 月27 日,則時(shí)間碼為20200727。
2.1.4 順序碼
順序碼采用7 位定長(zhǎng)數(shù)字,從1 開(kāi)始,根據(jù)地理實(shí)體分類(lèi)碼、位置碼和時(shí)間碼相同的地理實(shí)體產(chǎn)生的先后順序依次編碼,不得重復(fù)使用,順序碼不足7 位的,則補(bǔ)“0”。
地理實(shí)體的通用屬性項(xiàng)是指所有地理實(shí)體都具備的屬性項(xiàng),應(yīng)體現(xiàn)地理實(shí)體的時(shí)空性,能滿足聯(lián)動(dòng)更新的需求。本文對(duì)地理實(shí)體數(shù)據(jù)通用屬性項(xiàng)的規(guī)定如表1 所示。

表1 地理實(shí)體數(shù)據(jù)通用屬性項(xiàng)
地理實(shí)體數(shù)據(jù)建庫(kù)主要是在基礎(chǔ)測(cè)繪成果數(shù)據(jù)的基礎(chǔ)上進(jìn)行整合加工,首先對(duì)已有基礎(chǔ)測(cè)繪成果進(jìn)行轉(zhuǎn)換,然后按地理實(shí)體的方式進(jìn)行全新采集和更新。其過(guò)程主要包括預(yù)處理、實(shí)體化、屬性賦值、質(zhì)量檢查、數(shù)據(jù)入庫(kù)等。
1)預(yù)處理工作負(fù)責(zé)統(tǒng)一數(shù)據(jù)格式、數(shù)據(jù)基準(zhǔn),按本文描述的數(shù)據(jù)分類(lèi)和分層規(guī)則對(duì)原基礎(chǔ)測(cè)繪成果進(jìn)行對(duì)照,建立映射關(guān)聯(lián);對(duì)原有要素屬性進(jìn)行擴(kuò)充,實(shí)現(xiàn)實(shí)體分類(lèi)碼的編碼轉(zhuǎn)換和錄入;對(duì)于新增和更新的實(shí)體,按照分類(lèi)和分層的規(guī)則進(jìn)行要素的分類(lèi)采集。
2)實(shí)體化工作即為判斷哪些圖元為同一實(shí)體的過(guò)程[8],建立圖元與實(shí)體的對(duì)應(yīng)關(guān)系,用以實(shí)現(xiàn)地理對(duì)象在時(shí)空維度的唯一性。將具有相同名稱(chēng)、空間連通的圖元構(gòu)成一個(gè)實(shí)體,而沒(méi)有名稱(chēng)的圖元為一個(gè)單獨(dú)的實(shí)體。當(dāng)圖元屬于多個(gè)實(shí)體時(shí),則對(duì)其進(jìn)行地理實(shí)體編碼的擴(kuò)充。
3)屬性賦值。按照地理實(shí)體通用屬性項(xiàng)的要求進(jìn)行屬性的采集與完善,通過(guò)軟件工具生成地理實(shí)體編碼,以保證其唯一性。
4)質(zhì)量檢查。對(duì)圖元的拓?fù)潢P(guān)系、實(shí)體編碼的唯一性、實(shí)體邏輯的一致性、屬性結(jié)構(gòu)的完整性和正確性等進(jìn)行檢查,檢查合格方可入庫(kù)。
5)數(shù)據(jù)入庫(kù)。開(kāi)發(fā)和利用相應(yīng)的入庫(kù)軟件工具將空間數(shù)據(jù)存儲(chǔ)于關(guān)系數(shù)據(jù)庫(kù)中。
地理實(shí)體數(shù)據(jù)庫(kù)具有對(duì)象化的數(shù)據(jù)組織、自由的專(zhuān)題屬性掛接、靈活的按需組裝、高效的空間分析、便捷的聯(lián)動(dòng)更新等優(yōu)勢(shì),相較于傳統(tǒng)的按要素分類(lèi)組織的數(shù)據(jù)庫(kù),其有著更加廣闊的應(yīng)用前景。地理實(shí)體數(shù)據(jù)庫(kù)建設(shè)的關(guān)鍵問(wèn)題是地理實(shí)體編碼的設(shè)計(jì)和ETL技術(shù)(數(shù)據(jù)的抽取、轉(zhuǎn)換和加載)的應(yīng)用。地理實(shí)體數(shù)據(jù)庫(kù)建設(shè)是新型基礎(chǔ)測(cè)繪體系建設(shè)的重要一環(huán),如何從各類(lèi)基礎(chǔ)數(shù)據(jù)、專(zhuān)題數(shù)據(jù)中按地理實(shí)體的分類(lèi)融合圖形和屬性,實(shí)現(xiàn)自動(dòng)化實(shí)體構(gòu)建是今后繼續(xù)研究的方向。