馬夢然,花向紅,賀小星,舒穎,龔國棟
(1.武漢大學測繪學院,湖北武漢 430079; 2.江西省數字國土重點實驗室,江西南昌 330013; 3.地球空間信息技術協同創新中心,湖北武漢 430079; 4.武漢大學災害監測和防治研究中心,湖北武漢 430079)
地理國情普查入庫數據質量檢查相關問題研究
馬夢然1,2?,花向紅1,3,4,賀小星1,2,舒穎1,2,龔國棟1,2
(1.武漢大學測繪學院,湖北武漢 430079; 2.江西省數字國土重點實驗室,江西南昌 330013; 3.地球空間信息技術協同創新中心,湖北武漢 430079; 4.武漢大學災害監測和防治研究中心,湖北武漢 430079)
以河北省某縣地理國情普查入庫數據質量檢查為例,系統介紹了地理國情普查數據入庫質量檢查方法及流程,提出了基于5種屬性數據的入庫數據質量檢查方法,并結合ArcGIS進行實例進行分析,提出了相應的質量修正方案。結果表明:經過ArcGIS對5種屬性數據進行拓撲分析及修正后,能夠有效提高質量檢查的效率和質量,確保地理國情普查成果順利進行入庫。
地理國情普查;數據入庫;方法與流程;質量檢查
為全面掌握我國地理國情現狀,滿足經濟社會發展和生態文明建設的需要,國務院下發了《國務院關于開展第一次全國地理國情普查的通知》(國發[2013]9號)決定于2013年~2015年開展第一次全國地理國情普查工作[1]。為順利開展國情普查數據地理國情監測與統計分析應用,確保地理國情普查中各種成果數據能夠順利入庫,各類成果數據在入庫前均需要按照成果數據入庫檢查技術要求進行入庫檢查。由于檢查成果數據中可能存在待入庫數據文件與結構一致性、邏輯一致性、拓撲關系一致性、空間參考正確性及矢量數據接邊等影響入庫的數據問題,需要利用地理國情普查質檢軟件依據檢查要求對地理國情普查入庫數據進行質量檢查與質量評價[2,3]。對于影響數據入庫的問題需要修改后才能進入下一個建庫工序。從第一次全國地理國情普查開始以來,各省測繪地理信息相關部門都積極行動起來,在全國各個任務區開展了大量工作。針對地理國情普查數據庫的建設,國家測繪產品質量檢查測試中心和四川省測繪產品質量監督檢驗站共同開發了地理國情普查質檢軟件,實現了對數據檢查的自動化[4,5]。
2.1地理國情普查入庫數據
通過二級檢查驗收后的地理國情普查數據主要包括:地表覆蓋數據、地形地貌數據、地理國情要素數據、正射影像數據、遙感影像解譯樣本數據及相關元數據等數據成果。按照地理國情普查數據入庫質量檢查程序,需要在質檢前將成果數據統一拷貝到預先分配好的存儲位置和目錄下,并轉換成軟件可識別的數據組織形式,其數據組織形式如圖1所示。

圖1 數據組織形式圖
由圖1可以看出地理國情普查入庫原始數據格式主要分為地表覆蓋及國情要素和解譯樣本兩大類[6],其中地表覆蓋及國情要素包括地表覆蓋數據(DLGO)和元數據(Metadata),其數據存儲方式按照“一個縣一個gdb存儲”,數據命名方式為“縣級代碼+縮寫.gdb”、“M+縣級代碼+縮寫.gdb”;解譯樣本數據按照國家生產規定進行數據組織,即SMPDATA,包括數據庫文件SMPDATA.mdb、地面照片文件PHOTO、影像實例目錄SMPIMG[5]。
2.2數據入庫檢查方法
數據入庫質量檢查方法以自動檢查為主,利用地理國情普查入庫質檢軟件,對生產單位提交的成果數據的文件與結構一致性、拓撲關系一致性、邏輯一致性、空間參考正確性以及矢量數據接邊等進行檢查,發現問題給出錯誤列表,然后進行修改[7,8]。而對無法實現自動檢查的要素內容,可采用可視化的半自動人機交互檢查方式發現問題,檢查人員對問題進行分析后,采取相應的技術措施,主要是利用ArcGIS軟件中的相應功能或以人工方式進行文件格式、命名修正等方法進行修改,保證數據完整,數據格式、結構和內容符合數據入庫要求。
2.3入庫質檢的工作流程
入庫質檢的工作流程如圖2所示。首先對入庫前數據成果進行匯交目錄的檢查,按照生產規定、建庫規定和匯交規定進行省級匯交目錄和國家級匯交目錄檢查,檢查未通過,按照錯誤信息提示,對照數據格式要求由生產單位進行修改。
然后,匯交目錄的檢查合格后,主要進行地理國情普查要素數據、地表覆蓋數據、普查元數據、正射影像數據、遙感解譯樣本數據、網絡數據檢查6類數據的檢查工作。對于檢查結果不合格的數據,檢查后會自動生成相應的錯誤列表文件。生產單位根據錯誤列表文件信息進行相關數據的修改。
第三,對檢查合格的數據進行入庫前數據預處理工作。預處理工作主要包括普查要素處理、地形地貌數據處理、解譯樣本數據處理、地表覆蓋數據處理、網絡數據處理、正射影像數據處理,并進行數據整合。
最后,經過預處理的數據,仍需進行上述第二步檢查,檢查合格后才能進行地理國情普查數據入庫工作[10]。

圖2 入庫質檢的工作流程
3.1省級匯交目錄檢查
省級匯交目錄檢查主要對提交的地理國情數據資料進行初步檢查,按照規定的格式進行數據轉換,并按照一定的組織形式進行存儲,通過與標準目錄信息進行比較分析,來檢查省級匯交目錄的正確性、完整性。圖3給出了河北省某縣地理國情普查入庫數據匯交目錄檢查情況。從圖3及檢查結果表明提交的數據存在DEM、DOM、SURVEYDATA、省級擴展普查成果文件缺失等錯誤,其處理辦法是用戶根據生成的錯誤列表文件進行編輯處理,必要時由生產單位補交缺失的相關的數據資料。

圖3 省級匯交目錄檢查分析結果
3.2地理國情普查要素數據檢查
地理國情普查要素數據主要是對不同地理要素數據的拓撲關系進行檢查,即檢查鐵路、城市道路、公路、鄉村道路、水系、構筑物等對象是否存在重合、重復、懸掛點、偽節點、未閉合以及幾何位置接邊是否超限、屬性值錯漏或不接邊、是否存在極小不合理面或極短的不合理線等。圖4給出了要素數據檢查過程中發現不同屬性的要素(要素3、要素6)相交處未斷開的情況,其處理方案是結合原始數據利用ArcGIS軟件的拓撲功能對出現的錯誤的拓撲關系進行相應的修改。

圖4 地理國情普查要素數據結果情況
3.3 地表覆蓋數據檢查
地理國情普查要素數據地表覆蓋數據檢查的對象為矢量、柵格以及網格化的地表覆蓋數據,對數據集屬性項定義是否符合要求、格式及拓撲關系是否一致、圖斑是否有細縫或重疊、位置相鄰CC碼是否一致等進行檢查。圖5給出了地表覆蓋數據檢查中出現的問題,從圖5可以看出層內拓撲關系地表覆蓋面折刺不符合規范要求,即出現小于規范限差的打折角(限差為5°),其解決問題方法是采用ArcGIS軟件的拓撲工具(如planarize lines工具)對不符合規范的打折角度進行拓撲關系修改。

圖5 地表覆蓋數據結果情況
3.4普查元數據檢查
普查元數據檢查主要是對高程帶、坡度帶、行政區劃、水系參考資料及格網單元數據進行分析,對文件結構一致性、空間參考正確性、層內拓撲關系、屬性項值域及其數據模型等進行檢查分析。圖6給出了普查元數據檢查分析結果情況,由圖6可知檢查出的錯誤為字段refFreshWater的長度為64,根據《地理國情普查數據生產元數據規定》,有關水系參考資料元數據MRDW圖層中,字段refFreshWater的屬性長度為10,與數據模型定義的字段不符,通過分析提出的修改方案為將錯誤字段長度修改為規范要求的字段長度。

圖6 普查元數據檢查情況
3.5普查元數據檢查
遙感解譯樣本數據包括地面照片和遙感影像實例,遙感解譯樣本數據檢查主要檢查數據完整性(文件缺失及冗余檢查)、屬性正確性等進行檢查。圖7為遙感解譯樣本數據檢查情況,從圖7可知解譯樣本數據存在遙感影像實例、地面照片格式及命名不正確、遙感影像實例裁切范圍不正確等錯誤。其解決方案是按照生成的錯誤列表相應提示進行修改,使其符合相關規范的要求。

圖7 遙感解譯樣本數據檢查情況
本文主要以河北省某縣地理國情普查入庫數據為例,系統介紹了地理國情普查數據入庫質量檢查方法及流程,提出了基于“省級匯交目錄數據、地理國情普查要素數據、地表覆蓋數據、普查元數據、遙感解譯樣本數據”五類屬性數據為基礎的入庫數據質量檢查方法,并結合ArcGIS進行實例進行分析,提出了相應的質量修正方案。實例分析結果表明,經過ArcGIS對5種屬性數據進行拓撲分析及質檢后,能夠發現地理國情數據中存在的質量問題,通過修正后能夠有效提高相關地理國情數據的質量,確保地理國情普查成果順利進行入庫。
[1] 國務院關于開展第一次全國地理國情普查的通知[N].遼寧省人民政府公報,2013(8):25~26,38.
[2] 薛雪舟,劉利凱.地理國情普查質量管理探討[J].測繪與空間地理信息,2014(12):205~207.
[3] 陳俊勇.關于地理國情普查的思考[J].地理空間信息, 2014(2):1~3,7.
[4] 地理國情普查成果質檢軟件用戶手冊V1.0[R].國家測繪產品質量檢驗測試中心,2014.
[5] 楊海關,邱云峰,李俊娟.地理國情普查質量檢驗軟件的功能設計[J].測繪與空間地理信息,2015(6):64~65.
[6] 劉敏.面向地理國情普查的地表覆蓋解譯技術與方法[D].阜新:遼寧工程技術大學,2013.
[7] 程滔.地理國情普查樣本數據入庫質量檢查方法研究[J].測繪通報,2015(10):103~106.
[8] 賈佳.地理國情普查質量監督檢查驗收方法[J].測繪與空間地理信息,2014(6):220~221.
[9] 馮存均,左石磊,詹遠增.地理國情監測工作機制探討[J].測繪科學,2014(4):50~54.
[10] 汪斌.關于地理國情普查過程成果質量控制的思考[J].測繪標準化,2015(1):8~9.
[11] 戴錫花.安徽省地理國情普查管理問題研究[D].合肥:安徽大學,2014.
[12] ESRI,Redlands.ArcGIS desktop:release 10.Environmental Systems Research Institute,CA,2011.
Research on Related Problems of Quality Checking During Database Construction in Geographic National Conditions Investigation
Ma Mengran1,2,Hua Xianghong1,3,4,He Xiaoxing1,2,Shu Ying1,2,Gong Guodong1,2
(1.School of Geodesy and Geomatics,Wuhan University,Wuhan 430079,China;
2.Jiangxi Province Key Lab for Digital Land,Nanchang 330013,China; 3.Collaborative Innovation Center for Geospatial Technology,Wuhan 430079,China; 4.Hazard monitoring&prevention Research Center,Wuhan University,Wuhan 430079,China)
This paper took the geographic Census data of a county in Hebei Province for example,mainly discussed the data quality checking methods and technological process of Geographic National Conditions Investigation.Quality inspection method based on five kinds of property data checking were proposed,and examples carried out with ArcGIS,several plans have been proposed according to the particular problem.The results show that the proposed strategy based on five kinds of property data checking with ArcGIS can effectively improve the quality and reliability of Geographic National Conditions investigation,ensuring the smooth progress of data warehousing on Geographic National Conditions investigation.
geography census;data warehousing;methods and processes;quality inspection
1672-8262(2016)01-72-04
P208.1
A
?2015—12—17
馬夢然(1991—),女,碩士研究生,主要研究方向:GNSS數據處理及精密工程測量。
國家自然科學基金項目資助(41174010,41374011,41574031);江西省數字國土重點實驗室開放研究基金資助項目(DLLJ201605)。
1672-8262(2016)01-76-05
P208.2
A