林東銓 張俊鑫
(1.廣東省國土資源測繪院,廣東 廣州 510663;2.自然資源部華南熱帶亞熱帶自然資源重點實驗室,廣東 廣州 510663;3.廣東省自然資源科技協同創新中心,廣東 廣州 510663)
在國土變更調查縣級數據庫建設工作中,涉及大量圖斑矢量圖形的調整、修正及空間分析。由于各類業務數據的來源及工作要求不同,且在作業過程存在大量人工整理的步驟,導致未經檢查的數據庫成果中常存在重疊、縫隙、局部狹長、節點過密、自相交等拓撲問題,嚴重影響后續數據的治理與使用。因此,對圖斑的矢量圖形進行系統檢查并修正,對建庫成果質量至關重要。在數據庫存在的拓撲問題中,對圖形重疊等有明確定義的情況,可直接通過矢量圖形的簡單處理進行檢查及修復。針對圖斑存在局部狹長的情況,目前雖已有不少學者研究,但由于缺少量化且精確的定義,未形成具備穩定性與普適性的方法。
目前,針對國土變更調查數據,已有較為成熟的數據檢查軟件[1-3],對地理國情監測、新型基礎測繪等同樣涉及圖形拓撲檢查的工作,也有相應的研究并形成質檢工具[4-7]或數據檢查機制[8],實現圖形拓撲檢查與數據精度控制。同時,也有學者針對狹長圖斑、圖斑狹長分支等的判定與處理方法[9-15]進行研究。在上述研究中,對圖斑狹長情況的識別多基于圖斑的矢量特征進行判定,如采用圖斑邊界平移、計算圖形周長面積比例等方式,該些方法能識別出一部分狹長的圖形,但矢量圖形中狹長的位置可能存在節點過密、多余節點等不規律、不可預測的情況,過度依賴圖形的邊、點等特征進行識別的方法,其穩定性以及普適性將會大大降低。
因此,本文從圖斑本身的圖形分布特征出發,分析并研究對圖斑局部狹長區域進行識別及定位的方法,通過規避圖斑矢量圖形本身拓撲問題帶來的不可預測因素,提高方法的穩定性與普適性。
為保證識別過程中不受矢量圖形拓撲問題的影響,本文通過將圖斑柵格化,以柵格單元集代表圖形范圍,并基于柵格單元開展研究。同時,由于局部狹長區域呈狹窄、細長、尖銳的形狀,位于該區域的柵格單元集呈具有一定長度但寬度有限的特點,即該區域內的每柵格單元,以其為中心的一定范圍內可搜索到的柵格單元數量相比其他區域相對較少。根據該特點,本文在柵格化的基礎上,為每柵格單元設置一個初始累積值并逐漸追加,當各柵格單元的累計值達到一定程度后,將值逐漸往周邊擴散,使周邊柵格單元數量多的區域轉移速度快、柵格單元的值則分布均勻,反之轉移速度慢、柵格單元的值集中,則柵格單元累計值集中的部分可認為是局部狹長區域,如圖1所示。

圖1 狹長區域示意圖
本文首先將圖斑進行柵格化,通過設定固定大小的柵格單元,將圖斑矢量圖形所覆蓋到的位置轉化為柵格單元的集合,作為圖斑范圍UA。
在柵格化的基礎上,本文由圖斑邊緣開始,按一定速度增加柵格單元的值,為此,將位于圖斑范圍UA中且與圖斑范圍UA外存在接觸的柵格單元認為是邊緣柵格單元,將其集合作為柵格邊緣UE。接著,設定一定周期,每周期內柵格邊緣UE中的柵格單元增加一個累積值,并對整圖斑范圍UA中的柵格單元進行遍歷,如有柵格單元的累積值高于周邊其他柵格單元,則將較高累積值往較低累積值處進行擴散,具體如下:
(1)將圖斑范圍UA中每柵格單元的累積值設置為0個。
(2)設定一定周期,在每周期內柵格邊緣UE中柵格單元的累積值均增加1個。
(3)在圖斑范圍UA內,每周期內當有柵格單元相對相鄰柵格單元的累積值更高且差值大于1 個時,則將當前柵格單元的累積值減少1 個,將目標柵格單元的累積值增加1個。
在此方法下,隨圖斑范圍UA中總體的柵格單元累積值越來越高,各區域柵格單元的累積值逐漸往低處擴散,在經歷足夠多的周期后,位于局部狹長區域的柵格單元由于可進行擴散的其他柵格單元較少,累積值難于擴散,相對其他區域的累積值將相對較高。
如圖2(a)和圖2(b)所示,分別為圖1 中的圖斑經柵格化后進行10 次、60 次演算后的柵格單元累積值分布示意。

圖2 柵格單元累積值分布示意圖
可以看出,隨演算次數增加,對圖斑范圍內非局部狹長區域,其柵格單元累積值分布愈加均勻,且越遠離邊緣或折點處越低;而對圖斑范圍內局部狹長區域,其柵格單元累積值則遠高于其他位置。
根據多次演算后各柵格單元反映的特征,本文分別選取存在局部狹長區域的圖斑與無局部狹長區域的圖斑,通過上文方法演算相同的次數,并在演算后獲取各柵格單元的累積值,對數值一致的累計值僅統計一次,并由小至大排序,分析其變化趨勢。
由圖3可以看出,進行相同次數的演算后,無局部狹長區域的圖斑的柵格單元累計值的上升速度平緩,而存在局部狹長的圖斑的柵格單元累計值起初上升平緩,在某范圍內迅速上升后又重新趨于平緩。結合圖2 的示例可以看出,柵格單元累積值起初上升平緩的部分對應圖斑范圍內分布均勻的位置,突然迅速上升的部分則對應圖斑范圍內分布均勻位置與局部狹長位置的交界部分,最終重新趨于平緩的部分為對應該圖斑的局部狹長范圍。

圖3 柵格單元累積值變化趨勢示意圖
根據該特征,將柵格單元的累積值由小至大依次排序,如存在累計值上升速度急劇增加的情況,則認為該圖斑包含局部狹長區域,并將該值作為判斷局部狹長區域的閾值,對大于局部狹長區域閾值的柵格單元值,認為是局部狹長區域對應的柵格單元值;而對柵格單元值持續以較為穩定的效率上升的,則認為是不包含局部狹長區域的圖斑。根據該方法,對包含局部狹長區域的圖斑,將判定為局部狹長區域的柵格單元提取并轉化為矢量圖形,最終定位至圖斑矢量圖形中的局部狹長區域。
如圖4 所示,經對圖1 中圖斑進行柵格化并演算后,將判定為局部狹長區域的柵格單元提取并轉化為矢量圖形,即可定位至圖斑中的局部狹長區域。

圖4 局部狹長區域定位示意圖
為驗證方法的有效性,同時保證實驗結論的準確性及合理性,本文選取了某縣區的國土變更調查數據庫進行實驗,除驗證該方法是否能識別出局部狹長區域的存在外,同時考慮到同一圖斑包含的多個局部狹長區域可能會對識別結果產生影響,對該方法是否適應同一圖斑同時包含多個局部狹長區域的情況也一并驗證。因此,本文對選取的數據庫中的每個圖斑,隨機勾繪若干個局部狹長區域,并通過本文方法對每圖斑進行識別,驗證是否能識別出圖斑中的每個局部狹長區域并定位,對單一圖斑中每狹長區域均識別成功的情況認為是“識別成功”,對部分識別成功或全部識別失敗的情況認為是“識別失敗”,對各類圖斑以“識別成功”的圖斑數占圖斑總數的比例計算識別成功率。
本文選取的數據庫共包含2 137 個圖斑,并對每圖斑隨機勾繪1~3 個局部狹長區域,其中包含局部狹長區域個數為1、2、3 的圖斑數分別為1 337、491、309,成功識別的個數分別為1 223、439、283,識別成功率分別為91%、89%、92%,總識別成功數為1 945,總識別成功率為91%。具體如表1所示。

表1 識別結果表
由實驗結果可以看出,分別包含1~3 個局部狹長情況的圖斑的識別成功率在89%~92%,單個圖斑內局部狹長區域的個數對識別成功率未產生明顯影響,總識別成功率達到91%。另外,本文對未成功識別的圖斑進行分析,發現由于實驗時采用了固定的柵格單元大小進行柵格化,未成功識別的圖斑基本屬于狹長區域與圖斑主體較為貼近的情況,導致柵格化過程中狹長區域與主體融為一體。對該部分圖斑,本文采用長、寬較小的柵格單元對圖斑進行柵格化后,即可正確區分開來,并進行后續識別與定位,但因柵格化后的柵格單元數大大增加,識別效率受到一定影響。此時,本文將演算次數減少,在不影響識別成功率的前提下,識別效率得到一定提升。
經實驗證明,本文的研究方法能夠有效識別圖形存在的局部狹長區域并進行定位,同時能夠規避矢量圖形拓撲問題的影響。另外,方法中涉及的柵格單元大小、演算次數等多個參數均在不同程度上對識別成功率及效率產生影響,參數的合理設置方法仍有研究空間。
本文基于目前對圖斑局部狹長情況的檢查方法的穩定性與普適性有限的情況,提出一種基于圖斑位置分布識別圖斑局部狹長區域的新方法,并通過實驗證明該方法的有效性。通過將圖斑柵格化并基于其形狀特征進行演化計算,根據計算后的柵格單元值特征區分圖斑內部的狹長與非狹長區域,實現對圖斑局部狹長區域進行快速檢測及定位,在規避圖斑矢量圖形自身拓撲問題帶來的不可預測因素的前提下,提升對圖斑局部狹長區域的檢查精度,具有較高的穩定性、普適性和推廣價值。