謝文玉
(贛州市城鄉規劃設計研究院,江西 贛州 341000)
在二次土地調查數據建庫中,矢量數據建庫占到整個數據建庫工作量的80%以上,怎樣能夠充分利用現代計算機技術實現二次土地調查矢量數據質量的自動化檢核?依此來大幅度提高二次土地調查矢量數據的建庫效率,已成為一線工程技術人員在數據加工與建庫過程中的關鍵技術問題。
數據質量是指數據的可靠性和精度,在測量學中通常用誤差來度量,在二次土地調查建庫過程中,有許多生產環節,每個環節均產生一定的誤差,按照誤差傳播理論,每項誤差的傳播直接影響到最終數據的質量。而對于數據質量控制,很多人認為是一個空洞的概念,是專家與學者研究的理論,其實,隨著信息技術的應用普及,數據質量控制在數據加工與建庫過程中無處不在,一般來說,由于數據采集過程中某些因素的影響,因此誤差總是存在,通常有位置誤差、屬性誤差、時域誤差、邏輯一致性誤差、不完整性誤差。二次土地調查數據的數據質量是一個相對的概念,其基本質量要求是國家對土地利用管理和分析的適用性,即數據精度能夠達到二次土地調查后土地利用、管理和分析應用的需要。
按照作者的理解,質量控制是理論,數據加工是過程。質量控制理論指導數據加工過程,數據加工的成果又必須符合質量控制的理論。沒有質量控制理論指導,數據加工的過程只能是盲人瞎馬;沒有數據加工的質量控制理論,也只能是“紙上談兵”。質量控制不僅僅適用于數據加工,也適用于數據采集,在數據采集階段如果能盡可能的遵循質量控制理論,就能夠大大減少后續數據加工的工作量。
4.1 統一標準原則:數據建庫中數據內容、分層、結構、質量要求等要嚴格按照《第二次全國土地調查技術規程》、《土地利用數據庫標準》、《城鎮地籍數據庫標準》中的規定,擴充部分要嚴格按照地方統一規定;
4.2 過程控制原則:要對數據采集、數據入庫等過程中的每一重要環節進行檢查控制與記錄,以免環節出錯造成誤差傳遞、累加等,同時要保證建庫過程的可逆性;
4.3 持續改進原則:應遵循持續改進原則,使其貫穿數據采集、檢查、入庫等各環節中,不斷優化各環節的數據,保障數據質量;
4.4 質量評定原則:及時對數據進行質量評定,準確地掌握數據的質量狀況,盡早發現建庫中存在的問題,保證二次土地調查數據建庫成果的質量。
5.1 嚴格遵循國家、省、地方二調辦發布的各類規程、規范、細則規范是進行數據質量控制的基礎,具體包括數據庫模式規范和數據內容質量規范兩個方面。
5.1.1 數據庫模式規范
數據庫模式規范主要包括數據分層、各層數據的表示類型、數據層之間的關系、表的結構(字段列表)、字段名稱、數據類型、數據文件命名與數據格式等方面,簡單地說就是圖層結構和表結構。數據庫設計方案往往確定了最終的數據庫模式,但數據加工過程中可以根據具體情況采用不同的數據庫模式,入庫時再轉換到目標數據庫模式。不論哪種情況,都必須對相應的數據庫模式做出明確規定,建庫各階段必須嚴格按相應的數據庫模式存放數據。
數據檢查時首先檢查數據庫模式,這是一種形式(格式)檢查。數據庫模式不正確,數據內容是沒有太大意義的。
5.1.2 數據內容質量規范
二次土地調查數據主要包括空間數據與屬性數據,這兩類數據的質量控制各有不同。依據《第二次全國土地調查數據庫建設技術規范》和矢量數據質量控制理論,二次土地調查數據質量要求主要包括:矢量數據幾何精度、矢量數據拓撲關系正確、屬性數據的完整性和正確性、接邊是否完整等內容。
5.2 調查底圖處理、數據采集、數據加工過程質量控制
在二次土地調查數據的采集與建庫過程中,每一個環節都可能影響最終數據的質量,所以必須在調查地圖處理、數據采集、數據加工等每個過程嚴把質量關。
5.2.1 調查底圖選擇與處理
調查底圖或已有的基礎資料,雖然無法選擇,但可以通過資料預處理,消除其中錯誤的、有疑義或缺漏的地方,從而提高這些圖件和表格的質量,奠定采集數據質量的資料基礎。
5.2.2 數據采集的定位處理
地圖數據采集與處理是影響數據庫質量的關鍵階段,為了提高質量應盡量減少甚至取消不必要的中間環節,避免中間環節引入數據誤差。外業調繪圖直接用作建庫基礎資料,不經過中間清繪環節,一方面減少了工作量,另一方面也避免了引入誤差。不論是以何種方式進行地圖數字化,除選用高精度的設備和有效的軟件之外,更重要的是以明確的質量標準來控制作業過程,數據質量取決于作業員執行這些質量標準的情況。
5.2.3 數據加工的質量核查與自動糾正
數據采集過程中無論要求多么嚴格,都不可避免地會存在數據質量問題,因為有些質量問題是人工很難發現的,這就需要根據具體情況編制計算機程序進行自動化檢查。有些數據質量是無法通過計算機來自動核查的,只有通過一定方法進行人工檢核。
數據質量控制是個復雜的過程,數據檢查方法必須采用程序方法和人工方法交互檢查才能保證數據成果的最終質量。
6.1 程序檢查方法
由于空間數據的圖形與屬性、圖形與圖形、屬性與屬性之間存在有一定的邏輯關系和規律,通過編制計算機程序,設計模型和算法,將數據中不符合規律、邏輯關系矛盾的要素自動挑選出來,這些自動化檢查主要包括:數據文件的完整性檢查、屬性一致性檢查、拓撲關系建立檢查、異常屬性值檢查、不符合邏輯關系的屬性值檢查等。
采用計算機程序進行數據質量自動檢核,不僅可以大大提高工作效率,而且可以處理數據中許多人工無法處理的錯誤。
6.2 人工檢查方法
人工檢查方法是一種低效率、費時、費力的檢查方法,但有些檢查項目無法使用程序來完成,只能采用人工檢查方法。最常用的人工檢查方法是對照檢查法,即在屏幕上或使用輸出圖,對照原始圖件或外業調查表格,檢查數字化的地圖圖形或者表格的數據項是否與原始數據一致。
針對國家二次土地調查數據建庫過程中數據質量檢查需要,筆者依據前述數據質量控制理論,結合贛州市章貢區第二次土地調查項目開發了基于AutoCAD平臺下二次土地調矢量數據采集與質量控制軟件(GZLand-Survey),采用程序方法與人工方法相結合,對數據庫模式和數據內容兩個方面進行全面檢查,充分保證了贛州市章貢區二次土地調查GIS數據建庫質量,為章貢區二次土地調查提供了一套實用高效、技術先進的自動化處理方案,取得了很好的應用效果。
由于二次土地調查技術復雜、難度較大,涉及到很多新的技術,二次土地調查中的很多技術問題還需要廣大科研人員和一線工程技術人員繼續不斷探索與創新。
[1]國土資源部.第二次全國土地調查技術規程(TD/T 1014-2007)[M].北京:中國標準出版社,2007.
[2]國土資源部.土地利用數據庫標準(TD/T 1016-2007)[M].北京:中國標準出版社,2007.
[3]國土資源部.城鎮地籍數據庫標準(TD/T 1015-2007)[M].北京:中國標準出版社,2007.