王 程,王小軍,趙 龍,張 號,王煥萍
(1.自然資源部陜西測繪產品質量監督檢驗站,陜西 西安 710054;2.自然資源部測繪標準化研究所,陜西 西安 710054)
現有的地理空間數據存在形式多樣,種類繁多、關系復雜等特點,用于描述各類實體要素(地理空間數據中對現實世界現象(實體)的抽象描述)的數據也十分復雜,按表達形態進行分類,實體要素可分為點、線和面實體要素。研究不同實體要素與地球空間網格對應關系,實現實體要素的網格化離散,利用適宜級的地球空間網格單元表達,能夠推進地球空間網格地理信息的組織、表達方式,更好地發揮其作為信息整合、管理的作用。本文主要研究1∶10 000 常用比例尺下,面實體要素的表達精度,確定面實體要素網格化描述的地球空間網格的較優級[1-5]。
面實體要素網格化是在確保據數據精度的基礎上,利用地球空間網格對面實體要素進行網格化離散,通過選定適合級的地球空間網格單元,將面實體要素離散為一系列緊密關聯的空間單元集合。網格化離散能夠為多維、多源、多尺度空間數據的一致性關聯、新型空間索引建立提供解決方案,促進多源空間數據統一組織、融合和管理,消除數據間的不一致、矛盾和沖突情況,提高空間數據融合、管理及應用的效率,滿足統一化、精細化管理的需要。地球空間網格共分為33 級,各級地球空間網格所表示的空間范圍固定,而不同實體要素大小、范圍和幾何特征不相同,不同比例尺其精度也不同,若選取的網格過大(級過低),則不能夠準確的表達面實體要素,損失其精度。選取的網格過小(級過高),會增加數據量,造成數據冗余,降低索引速率。因此,合適的地球空間網格級的選取是面實體要素網格化離散表達的關鍵。
面實體要素網格化描述的較優級需要按照其表達精度和尺寸確定,在保證數據精度基礎上利用合適大小的網格單元,描述面實體要素的形狀、分布、大小和地理空間位置。首先需要確定面實體要素網格化描述級范圍,在選擇合適的網格級范圍內,才能進一步找到較優級。在確定網格化描述級范圍后,通過選定判別因子,統計分析結果,最終找到面實體要素網格化描述較優級。
根據《基礎地理信息數字成果1∶5 000 1∶10 000 1∶25 000 1∶50 000 1∶100 000 數字線劃圖》和《1∶5 000 1∶10 000 地形圖航空攝影測量內業規范》中的規定:“地物點相對鄰近野外控制點的平面位置中誤差平地、丘陵地不大于5 m;山地、高山地應不大于7.5 m”[6];“地物點對附近野外控制點中誤差分別在平地、丘陵地不大于0.50 m;在山地、高山地不大于0.75 mm 的規定”[7]。將這2 個指標解算到地面約為5 m 和7.5 m,限差約為10 m 和15 m,可以確定1∶10 000 面實體要素的平面位置精度應在5 m 和15 m 之間。而22~24 級地球空間網格赤道附近邊長在15.5~3.9 m 之間[5],由此可得,1∶10 000 面實體要素網格化描述的級對應范圍為22~24 級網格。
面實體要素網格化較優表達可以通過面積差比指標來進行判斷,即面實體要素的網格面積與實體要素本身的面積(面實體要素的矢量面積作為真值,以下簡稱面積真值)之差的比值越小,越接近零,說明網格化表達越優,網格化圖形更接近面實體要素。正確的統計網格面積,對正確計算面積差比有重要的影響。面實體要素網格化,對于實體要素內部,面積統計可以直接計算網格總面積(即網格面積×網格總個數)。對于邊緣網格(面要素邊界落入的網格),如何統計其面積,確保面實體要素的網格面積計算能夠最準確,是解決問題的關鍵。本研究通過計算面實體要素在邊緣網格的面積占比,并利用不同的面積占比閾值,作為邊緣網格是否統計面積的依據,找到邊緣網格的最優面積占比閾值,準確統計網格面積。并統計在最優面積占比閾值下,各面實體要素在不同的網格級,計算得到的網格面積與面積真值的差比,找出1∶10 000比例尺下,面實體要素網格化的較優級,即面實體要素網格化的較優表達。
本實驗共選取9 幅1∶10 000 標準圖幅DLG 面實體要素數據展開,選取了陜西省范圍內不同地貌特征的典型區域進行。由于各矢量圖幅中的面實體要素是按照類型進行分層表示的,如:HYDA 層為水系面層,LRDA 層為道路面層,所以,對面實體要素的相關面積統計是按照各圖幅下的分層進行分類統計。
通過統計各圖幅面實體要素(以圖層為統計單元)22 級到24 級網格面積,同時利用面實體要素矢量數據計算得到的面積真值,比較網格面積與面積真值之間的數據差異,統計分析確定1∶10 000 面實體要素較優表達尺度所對應網格大小(較優級)。

表1 試驗數據情況簡介
實驗主要分為2 個部分:
1)最優面積占比閾值的確定。主要選取了網格面積與實體要素的面積真值之差比作為級選取的判別因子。網格面積計算的正確性將直接影響級的選取,而邊緣網格面積的統計直接影響著網格面積計算的正確性。因此首先要確定邊緣網格統計的正確性,即邊緣網格最優面積占比閾值。實驗閾值選定了10%,20%,30%,40%,50%,60%,70%,80%,90%,即對于邊緣網格,面實體要素落入網格內部,其面積占比達到設定的閾值后,將網格面積統計在內,否則,不統計此網格面積。實驗主要統計圖幅內面實體要素在22~24 級的地球空間網格面積,對邊緣網格分別計算不同面積占比閾值得到的網格面積與面積真值的差比,找到最接近面積真值的最優面積占比閾值。
2)較優級的選取。面實體要素網格化較優級的確定需要在保證數據精度的前提下,利用合適大小的網格單元對其進行描述,既要保證數據本身的精度,又要避免數據冗余。1∶10 000 面實體要素的平面位置精度在5 m 和15 m 之間,由此確定其網格化描述對應的等級范圍為22~24 級。在找到邊緣網格最優面積占比閾值的情況下,統計實驗圖幅中各面實體要素在22~24 級下,各圖層面實體要素的網格面積與面積真值的差比,并對結果進行分析,找到1∶10 000 比例尺面實體要素網格化描述較優級。
1)通過對9 幅實驗圖計算各面實體要素在22 ~24 級網格下,對邊緣網格的不同面積占比閾值統計,得到的網格面積與面積真值的差比結果可知,邊緣網格面積占比閾值過小或者過大,都不能夠正確的表達面實體要素的網格面積。隨著閾值的變化可以發現,閾值選定離50%越遠,統計得到的面實體要素的面積真值與網格面積差比越大,越難正確的表達面實體要素的面積。
實驗結果表明,所有實驗圖幅在22、23、24 級,均以50%面積占比閾值統計得到的網格面積與面積真值的差比最小,最接近實體要素面積真值。對于邊緣網格而言,面實體要素與網格相交,面積占比大于網格面積的50%,才將其面積統計在內。由此可知,50%面積占比閾值為邊緣網格的最優面積占比閾值,如圖1所示。

圖1 不同面積占比閾值下面積真值與網格面積差比統計圖(部分圖幅,23 級)
2)通過統計實驗圖幅在最優面積占比閾值(50%)下22~24 級網格面積與面積真值之差比(見圖2)發現,在所有實驗圖幅中,22 級網格面積與面積真值的差比最大為-82.42%;23 級網格面積與面積真值的差比最大僅為-4.64%;24 級網格面積與面積真值的差比最大為10.84%。從22 級到23 級間網格面積與面積真值的差比變化速率最大,而從23 級到24 級間網格面積與面積真值的差比變化速率相對較小。由此可見,面實體要素利用23 級網格計算得到的網格面積與面積真值較為接近,表達效果較好。

圖2 各級面實體要素網格面積與面積真值差比統計圖(50%面積占比閾值)
綜上所述,在考慮數據的表達精度和尺寸的前提下,23 級網格能夠較好的對1∶10 000 面實體要素網格化進行描述。
本文以地球空間網格理論為基礎,對1∶10 000 比例尺面實體要素網格化表達較優級進行研究,根據1∶10 000 面實體要素的平面位置精度,確定其網格化描述對應的級范圍為22 ~24 級。利用網格面積與面積真值的差比為判別指標,找到了邊緣網格統計面積的最優面積占比閾值為50%。在此基礎上,通過實驗統計得到從22 級到23 級間網格面積與要素面積差比變化速率最大,23 級的網格面積與要素面積差比值較小,多集中在0~1%之間。在考慮數據的表達精度和尺寸的前提下,選取23 級網格作為1∶10 000 面實體要素網格化描述的較優級。本實驗結果進一步驗證了利用比例尺精度確定實體要素網格化描述適合級的可行性。然而本實驗目前僅完成了某一特定比例尺下的某一類實體要素的網格化級選取工作,需要進一步研究完善。下一階段將加大樣本選取量并選擇不同比例尺下實體要素開展實驗,進一步確定不同比例尺實體要素描述所需的較優地球空間網格級,找到其規律。