王秀琴,傅 蓉
(1.甘肅省地圖院,甘肅 蘭州 730000;2.蘭州大學 資源環境學院,甘肅 蘭州 730107)
淺析地理國情要素數據的質量檢查
王秀琴1,傅 蓉2
(1.甘肅省地圖院,甘肅 蘭州 730000;2.蘭州大學 資源環境學院,甘肅 蘭州 730107)

作為一種全新的基礎地理信息產品形式,地理國情要素數據是第一次全國地理國情普查成果的重要組成部分。結合甘肅省地理國情普查的生產實踐,系統歸納和總結了地理國情要素數據的質量元素、質量子元素及其檢查項,對每個檢查項的質量檢查和控制方法進行了闡述,以提高地理國情普查數據的準確性和可靠性。
地理國情普查;地理國情要素;質量檢查;檢查項
國務院決定2013 ~2015年開展第一次全國地理國情普查,全面獲取地理國情信息,掌握基本國情[1]。地理國情信息不僅能夠客觀、準確地反映地表特征和地理現象,而且還能夠反映地表變化情況及其相互關系[2],是制定和實施國家、區域發展戰略與規劃、調整經濟結構轉型升級、優化資源配置的重要依據[3]。地理國情信息主要包括地形地貌、地表覆蓋、地理國情要素等自然地理要素和人文地理要素[1]。地理國情要素數據是一種全新的基礎地理信息產品形式,是第一次全國地理國情普查的重要成果之一,如何保證質量,獲得權威、客觀、準確的地理國情要素信息,質量檢查是一個非常重要的環節[4]。本文在系統歸納地理國情要素數據質量元素、質量子元素及其檢查項的基礎上,對易出錯項及質量檢查和控制方法進行了探討。
在第一次全國地理國情普查中,地理國情普查數據主要包括精細化數字高程模型及坡度坡向、地表覆蓋分類數據和地理國情要素數據等,數據集共37 個層,其中地表覆蓋分類數據存儲在LCA層中,地理國情要素數據根據要素類型存儲在其他36 個層中。地理國情要素數據是按照實體要素方式采集的地理國情要素信息,內容包括道路、水域、構筑物、人工堆掘地、地理單元等[5],其質量控制難度較大。根據地理國情要素數據以實體形式采集以及分層等特點,通過歸納數據質量元素、質量子元素及其檢查項[6],實現對關鍵節點及全過程的質量控制。
地理國情要素數據質量元素可歸納為空間參考系、時間精度、邏輯一致性、位置精度、屬性精度、完整性、表征質量7個質量元素,每個質量元素包含若干個質量子元素及檢查項。其中,空間參考系包括大地基準、高程基準、地圖投影3個質量子元素;時間精度對應現勢性一個質量子元素,邏輯一致性包括概念一致性、格式一致性和拓撲一致性3個質量子元素;位置精度對應平面精度一個質量子元素,屬性精度包括分類正確性和屬性正確性2個質量子元素;完整性包括多余和遺漏2個質量子元素;表征質量包括幾何表達和地理表達2個質量子元素。這些質量子元素共涵蓋28個檢查項。
2.1 空間參考系
空間參考系共涵蓋坐標系統、高程基準、投影參數3個檢查項。這3個檢查項重點檢查坐標系統、高程基準、地圖投影參數是否符合設計要求。空間參考系質量元素的檢查項均為符合項,所以不同的檢查結果對成果質量有嚴重的影響。但質量控制過程卻相對簡單,在開始作業前,由專門的技術人員制作統一的作業方案,在地理國情要素數據采集一開始,就要督促作業人員使用統一下發的標準方案,在成果質量檢驗階段利用不同軟件的“方案檢測”工具檢查數據所使用的方案,就能杜絕該項質量元素檢測結果的“不符合”。
2.2 時間精度
時間精度共涵蓋原始資料、成果數據2個檢查項。原始資料主要檢查影像數據、基礎地理信息數據、行業專題資料等數據源的現勢性,成果數據主要檢查成果數據的現勢性,檢查結果均為“符合/不符合”。
1)原始資料。對于變化較大的區域,需要使用其他影像源時,應認真檢測補充影像的獲取時間,查驗其現勢性是否滿足要求。基礎地理信息數據是地理國情要素數據采集的重要參考資料,但基礎地理信息數據均為某年度按某一區域進行生產,因此在使用前,必須由技術負責人對其現勢性進行檢查。
2)成果數據。根據第一次全國地理國情普查標準時點要求,自然和人文地理要素的現勢性應與2015-03-01至2015-06-30時間段的航空航天遙感影像的現勢性保持一致,交通網絡、居民地與設施、地理單元等要素的現勢性應為2015-06-30。
2.3 邏輯一致性
該質量元素涵蓋屬性項、數據集、數據格式、數據文件、文件命名、重合、重復、相接、連續、閉合和打斷11個檢查項。
1)概念一致性。包括屬性項和數據集2個檢查項,這2個檢查項分別檢查屬性項、數據集(層)定義是否符合要求,檢查結果為“符合/不符合”,在兩級檢查、一級驗收中均為重點檢查內容,主要通過軟件的“方案檢查”功能實現。
2)格式一致性。包括數據格式、數據文件和文件命名3個檢查項,重點檢查數據包的擴展名是否正確、文件是否缺失、數據是否可讀,檢查方法雖然較為簡單,但檢查結果均為“符合/不符合”,在數據上交時必須重點檢查。
3)拓撲一致性。包括重合、重復、相接、連續、閉合和打斷6個檢查項。這些檢查項中最容易出錯的是“連續”和“斷開”,如在LRDL層中,其他等級的公路通過高速公路時,均應連續表示而不斷開;除高速公路以外的其他等級公路與LVLL層的鄉村路相交處,LRDL層的等級公路應打斷而不是連續。
2.4 位置精度
該質量元素涵蓋幾何位移和矢量接邊2個檢查項。幾何位移主要檢查數據與正射影像套合位置超限或與地表覆蓋分類數據套合不合理的要素個數。矢量接邊檢查要素幾何位置接邊超限的個數。這2個檢查項一般通過人機交互的方式,先用軟件自動檢查,再由人工排查錯誤。常見的錯誤為地表覆蓋分類數據與地理國情要素的套合不合理,如圖1所示。另一種錯誤是對相關規范掌握不準確造成的,如HYDA層雙線常年河邊線,有河堤的應依堤為界,無河堤的應沿高水界采集,如圖2。
2.5 屬性精度
該質量元素包括分類代碼值和屬性值2個檢查項。分類代碼值主要檢查與正射影像、外業調繪資料、基礎地理信息數據、行業專題資料等比對,檢查分類正確性,包括CC碼與GB值。屬性值檢查的內容為屬性值錯漏的個數,包括屬性不接邊的錯誤。在實際生產中,分類代碼值CC的錯誤較普遍,主要表現為易混淆類的歸類,這類問題在《地理國情普查常見問題解答(一)》中已有較詳細的描述和處理方法,這里不再贅述。屬性值的錯誤類型較為雜亂,主要表現為與資料不符,如LRDL層的NAME屬性項,基礎測繪及交通部門資料的名稱均為從某地到某地,如“北京-拉薩”,但地理國情要素的屬性要求錄入全稱,如普通公路則應表示為“北京-拉薩公路”,高速公路則應表示為“北京-拉薩高速公路”,除加大檢查力度外應加強對相關規范及設計的學習。

圖1 地表覆蓋與地理國情要素套合

圖2 雙線常年河邊線采集
2.6 完整性
完整性包括要素多余和要素遺漏2個檢查項。要素多余主要檢查非本層要素,即要素放錯層,主要表現為采集不夠指標的要素,如橋梁、隧道,采集100 m以下的情況。要素遺漏主要表現為對符合采集指標的要素未進行采集,多見于HYDA層的坑塘、地理單元的行政村、城鎮綜合功能單元的三級類居住小區、工礦企業和單位院落等。要杜絕此類問題,需在掌握指標的基礎上利用好各種資料。
2.7 表征質量
該質量元素包括幾何類型、幾何異常、要素取舍、圖形概括、要素關系和方向特征6個檢查項。幾何類型主要檢查點、線、面表達是否正確,錯誤多出現于城鎮綜合功能單元的三級類,如面積大于5 000 km2的居住小區要求采集定位點,但中心城區中應按范圍線構面表示。幾何異常主要檢查極小的不合理的面或線,以及折刺、回頭線、粘連、自相交、抖動等,這類錯誤一般用相關軟件均能發現。要素取舍、圖形概括主要通過人工目視的方法檢查,這類問題的發現要在掌握指標的基礎上,了解任務區域的地域特征,做到在符合指標的同時能夠反映地域特征。要素關系的錯誤多見于相關要素與其附屬設施的表達錯誤,如圖3所示。道路與橋梁應共線表示,而不應存在裂縫。方向特征主要檢查常年河、干涸河等有矢量方向的要素,如果檢查時有等高線作為輔助,則可以用相關軟件自動檢查,若沒有,則只能人工檢查,檢查方法為全部顯示矢量要素的矢量方向,人工逐屏查看。
P208
B
1672-4623(2015)02-0018-02
10.3969/j.issn.1672-4623.2015.02.007
2015-02-04。