孫龍,李娜
(大連市測繪院,遼寧 大連 116011)
由于技術特點和歷史原因,CAD數據在我國測繪行業的數據生產、成果保存、成果應用等方面被廣泛應用,較好地滿足了制圖領域的需求,但隨地理信息系統技術的迅速發展,CAD數據由于自身的局限性,在屬性存儲、空間分析、查詢統計等方面已不能滿足應用需求,一些同時支持空間信息和屬性信息的地理信息數據格式被引入我國測繪領域。
這樣的局面產生了兩個矛盾:其一是CAD成果數據大量存在與地理信息數據相對短缺的矛盾;其二是傳統的CAD數據生產工藝與地理信息數據生產工藝差別導致的矛盾。
我國于“十一五”期間開始的基礎測繪,注重了地理信息數據的生產和建庫,能夠逐漸緩解第一個矛盾,但在基礎測繪的實施過程中,卻不可避免地受到第二個矛盾的影響:與傳統的CAD數據生產工藝相比,基礎測繪DLG數據不僅關注圖面,更注重了要素編碼體系、屬性信息錄入、拓撲關系等內容,傳統的方法已不能保證生產出符合規定的數據成果。但目前大多數的數據生產平臺仍然是基于CAD的,從事數據生產的隊伍通常對這種平臺比較熟悉,因此出現了一些基于CAD開發的支持附加屬性、支持拓撲關系、支持地理信息數據格式轉換等功能的數據生產平臺,如南方測繪CASS、廣州開思等,這就引發了一個新的問題——基礎測繪DLG數據從生產到建庫,經歷了一系列的數據轉換過程,采用什么樣的措施能夠保障數據在各個環節做到無損轉換。
基礎測繪DLG數據兼顧了制圖和信息服務兩方面的需要,但在當前階段,能實現圖庫一體化的數據生產平臺還很少,許多部門仍采用維護兩套數據的方案,即生產帶附加屬性信息的CAD數據,滿足制圖需要,再將其轉換為地理信息數據,以滿足數據入庫和系統搭建的需要,如圖1所示。在這種情形下,數據轉換前后的一致性檢查在測繪生產過程中具有非常重要的地位,是保證數據無損地傳遞至下一環節的控制措施。

圖1 基礎測繪數據生產、入庫一般流程
矢量數據格式轉換的實質,是按某種矢量格式的要求將坐標信息及屬性信息讀取后重新寫入。由于各種矢量模型定義有區別,對坐標的精度要求可能不同,對實體的描述方式也可能不同等原因,DLG數據從一種格式向另一種格式轉換是存在風險的,數據一致性沒能得到延續是有潛在可能性的。
本文所指的數據一致性,在整體上表現為轉換前后數據包含的各類要素的數量保持一致,在細節上表現為轉換前后每一個具體的要素其空間位置和屬性值不發生改變,即從數據完整性和數據精度兩方面控制數據損失。
(1)數據完整性
在不同平臺下,DLG數據的組織方式是不盡相同的。以大連市“十一五”基礎測繪DLG數據生產項目為例:采用南方CASS軟件作為編圖平臺,CASS環境下的數據是按要素編碼分層的,依據生產技術規程轉換為Geodatabase格式后,變為基于地物類的幾何分層。在這個過程中,只有保證轉換前后各類要素的數量保持一致,才能保證數據的完整性。
(2)數據精度
數據的完整性從“質”的角度確保了數據轉換的正確性,數據精度則是從“量”的角度衡量數據是否無損轉換。對于地理信息數據,其空間信息和屬性信息同等重要,所以本文從空間精度和屬性精度兩方面來闡述數據轉換過程中可能存在的數據精度損失問題。
綜上,考量一個媒介成功的標準應是涵蓋媒介表現領域,從媒介內容的相關性、機會及媒介的反應度來進行衡量,從咪蒙公眾號文章內容的相關性、對當前媒介生態環境反應、了解受眾需求方面來看,該公眾號的營銷是很成功的,以擴大受眾覆蓋面、實現自身經濟利益為主進行的一系列內容規劃和媒介管理。
①空間精度損失
通常將矢量數據分為點狀、線狀和面狀三類,其中,線狀數據是由一系列的點組成,面狀數據則是由首尾相連的線構成,歸根結底,矢量數據的位置和形態是由構成矢量數據自身的點位及其順序決定的。倘若轉換后的數據結點坐標發生了變化,如數據類型不同導致的坐標數據小數點后取位不足,三維信息丟失,或其他原因導致的坐標信息錯誤,則意味著數據在轉換過程中發生了空間精度損失。
②屬性精度損失
要素的屬性具有兩方面的含義:一是它是什么,即它劃分為地物的哪一類;第二是實體的詳細描述信息。數據轉換后,應檢查各個層的名稱是否正確,是否有漏層,檢查屬性表中的屬性項類型、長度、順序等是否正確,有無遺漏。數據轉換過程中,如果屬性信息發生了精度損失,即使空間精度沒有損失,對數據質量的影響也是非常大的。
以大連市“十一五”基礎測繪DLG數據建庫為例,首先是在南方CASS下將DWG編圖成果轉換為Personal Geodatabase格式,再轉交超圖,超圖將其轉換成SHAPE文件再進行入庫處理,如圖2所示。

圖2 大連市“十一五”基礎測繪DLG數據建庫流程圖
可見,數據經歷了3次轉換、4種格式才最終入庫,每一次數據轉換在理論上都存在風險,但如果對每次轉換前后的數據都進行數據一致性檢查,工作量會非常大,在實際中很難開展,所以最終確定的方案是:對比最初始的DWG數據和最終的Oracle數據庫,如果這兩部分數據能夠保持一致,則可以認為中間成果數據不存在一致性方面的問題。
檢查數據一致性的基本思想:引入GlobalID屬性,附加給每一個要素,即為每個要素進行編碼,以此作為該要素的全局唯一標識,即使是不同的數據格式,也能通過GlobalID進行要素級別的匹配。以此為關聯紐帶,對最初始的編圖成果數據和最終的數據庫逐圖幅、逐要素進行對比,分別檢查數據完整性和數據精度。
GlobalID的編碼規則,采用“圖幅號_類型代碼_系統序號”的三段組合,其中,圖幅號采用《大連市基礎測繪技術規程》中規定的圖幅編號規則;類型代碼標識要素的幾何類型,1表示點,2表示線,3表示面,4表示文字注記,5表示輔助線;系統序號是給每幅數據附加GlobalID屬性時為每個要素自動生成的順序號,定義為8位長度。例如“dlgl31301044_2_00000001”,采用此種編碼方式能夠保證任意要素的GlobalID全局唯一。
數據完整性方面,基于GlobalID,主要把握兩方面內容:其一是檢查轉換后各要素是否歸于正確的圖層或類中,其二是檢查轉換前后各類要素的數量是否保持一致。
(2)檢查數據精度
①空間精度
檢查一個要素在轉換后是否發生空間精度損失,可以以GlobalID為關聯條件,通過對比相關的幾何信息來判斷:對于點狀數據,以點坐標信息為參照;對于線狀數據,以其長度信息和外接矩形的中心點坐標信息同時作為參照;對于面狀數據,以其面積信息和外接矩形的中心點坐標信息同時作為參照。
②屬性精度
以GlobalID為關聯條件,檢查數據轉換前后,各要素的屬性項類型、長度、順序、內容等是否一致,有無遺漏。
(1)完善已有的檢查工具
在現有的檢查軟件進行改進、完善,增加部分功能:如附GlobalID字段屬性、生成匯總統計表等;強化部分功能:如數據完整性檢查、屬性精度檢查等。考慮到應充分利用已有檢查工具,且已有檢查工具支持方案定制功能,故將數據完整性檢查和屬性精度檢查功能置于已有檢查工具中實現。
(2)開發專項檢查工具
針對空間精度檢查,采用了由南方CASS開發專項檢查工具的辦法。輸入“ADD_GLOBALID”、“WRITE_GLOBALID_MDB”命令分別表示給數據附加GlobalID屬性、將編圖成果數據匯總統計輸出至Access數據庫中,匯總統計內容如表1所示。

編圖成果檢查匯總統計表 表1

表2 數據庫成果檢查匯總統計表

圖3 數據庫匯總統計工具
數據庫匯總統計工具是在數據入庫后讀取數據庫中內容,并將其匯總統計結果輸出至另一個Access數據庫中,如圖3和表2所示。

圖4 對比檢查工具
數據對比檢查工具,如圖4所示,是按照前面闡述的數據一致性檢查思想,利用要素GlobalID的一一對應關系,將編圖成果匯總統計結果和數據庫匯總統計結果進行對比,在一個新的Access數據庫中羅列出建庫前后不一致的要素,并記錄了所在圖幅、GlobalID和錯誤內容信息,如表3所示。數據檢查人員在分析過檢查結果后,如果屬于軟件問題,則進行系統整改;如果屬于生產作業問題,則將檢查結果反饋給數據生產作業人員,通過錯誤信息能夠快速地進行定位及改正。

數據對比檢查結果 表3
本文以大連市基礎測繪為實例,闡述了數據一致性檢查在基礎測繪DLG數據建庫過程中的必要性,從數據完整性和數據精度兩方面說明了數據轉換的風險,在此基礎上提出了一種基于GlobalID的數據一致性檢查方法,用以檢查數據建庫前后一致性,經過實踐驗證,該方法不僅使數據的完整性、空間精度和屬性精度在數據建庫過程中得到了有效的監控,還能檢查出一些不易發現的錯誤,如弧線的誤用、輔助島面構造錯誤等,有益于基礎測繪數據成果質量的提高。
[1]胡勝華,何宗宜,陶利佳.AutoCAD與GIS數據轉換的研究[J].測繪通報,2007(12):44~47
[2]鄭小梅,鄧小軍.數字地形圖質量檢查系統研究[J].城市勘測,2003(5):23~25
[3]劉峰,曹凱濱.城市基礎測繪DLG數據入庫的實現[J].測繪與空間地理信息,2010(2):165~168
[4]付超,聶時貴.基礎測繪E00數據的質量控制[J].現代測繪,2003(2):36~37
[5]劉春.GIS屬性數據的精度度量及質量控制的抽樣原理與方法[J].測繪學報,2001(4):367
[6]劉建軍,王東華,商瑤玲.國家1∶50 000 DLG數據庫質量檢查軟件的設計和開發[J].地理信息世界,2006(4):23~26
[7]陳軍.試論中國NSDI建設的若干問題[J].遙感學報,1999(2):95~97