胡開
摘要:以巴宜區為例,在融合2012二類調查矢量數據和2009林地保護利用規劃矢量數據時引入基于模糊集的小多邊形處理方法,對原理和可行性操作步驟進行了闡述。探討了疊加分析后不同處理方法對處理結果精度的影響,闡述了基于模糊集的小多邊形處理方法在西藏自治區、乃至全國林地年度變更中的應用前景。
關鍵詞:矢量數據融合;模糊集;小多邊形處理;林地年度變更
中圖分類號:TP391 文獻標識碼:A 文章編號:1674-9944(2016)06-0181-03
1 引言
在林地年度變更工作中,由于西藏2012年二類調查矢量數據和2009林地保護利用規劃矢量數據在時效性、空間位置、屬性數據等方面均存在較大差異,需將二者融合形成林地年度變更本底數據庫以減少外業現地的核實工作量。
隨著二者的疊加分析后需消除小多邊形。目前常見的GIS軟件中普遍使用的處理方法是按相鄰最長邊界線合并到臨近多邊形中去,或按照相鄰最大面積合并到臨近小班中,然而這些方法都是針對由幾何位置的不確定性引起的小多邊形而提出,沒有考慮屬性數據的差異,具有一定的隨機性。
筆者在此引入了基于模糊集的小多邊形處理方法,綜合考慮矢量數據幾何位置融合和屬性數據融合。
2 實驗數據
本次研究采用巴宜區(原林芝縣)2012年二類調查矢量數據和2009林地保護利用規劃矢量數據作為研究數據。
其中2012年二類調查矢量數據更新至2012年年底,采用高斯克呂格投影,西安80坐標系,信息量大,調查大部分為實地調查,數據可靠。
2009年林地保護利用規劃矢量數據更新至2009年年底,是在2002年二類調查的基礎上補充區劃加實地驗證而得,采用高斯克呂格投影,西安80坐標系,該數據的屬性數據更加符合林地年度變更要求。
兩種數據坐標系一致,不存在空間基準的融合。
3 研究原理
3.1 矢量邊界適宜性判別
假設矢量數據有x種屬性,對于每個矢量面,其屬性值則可能與這x個屬性值有關。取各屬性值與矢量面相吻合的程度為其隸屬度,表達式為:(1)
其中rik表示第k種屬性與第i個面要素屬性符合的程度;i表示第i個矢量面;j表示矢量面的第j個特征;Ikj為第k種屬性類型的第j個特征準則值;ωj則為第j個屬性特征的權重。
如果矢量數據是通過n種矢量數據疊置所得,那么疊置后的矢量面屬性與n種類型的屬性有關,由式(1)可得
由于n=2,從而得到疊置圖上地理邊界適宜性判決函數為:
其中△rij表示兩相鄰矢量面屬性模糊集對應元素的差值。架設各疊置層上各屬性值的權重系數相同,令各疊置層的權為ω1,ω2,……,ωn,其中,λ為參數,應該適當選取,使得0≤μ≤1;則有:
3.2 屬性不確定性的度量
將小多邊形進行合并時,必然引起屬性數據的變化,即小多邊形合并之后模糊屬性值調整為面域模糊屬性值時,與原模糊屬性值的差異。使小多邊形在合并前后屬性值變化最小的是最理想狀態。分析(3)式和(4)式可知,此時“取最小值。因此,進行小多邊形合并的時候,應選其邊界中μ值最小的邊界作為消除邊界,從而達到小多邊形在合并前后屬性值變化最小的目的。
3.3 小多邊形的處理
圖1為2012年二類調查矢量數據和2009林地保護利用規劃矢量數據疊加分析后產生了小多邊形C,其中A、B、D、E為其相鄰的多邊形,關鍵問題為C與哪個多邊形合并最合理。對于C的四條邊界ab、bc、cd、ad選其邊界中適宜性最小的作為消除邊界,與鄰邊邊界合并。
由于二調數據與林地保護規劃利用規劃矢量屬性數據較多,如果對每種屬性都定義其與矢量面的隸屬度工作量巨大,而且實際意義不大。為了簡化計算,結合疊置后矢量面的實際情況,以及兩種矢量數據的特征,作如下處理。
從兩種不同矢量數據中選取有代表性的屬性宇段。選取相關屬性字段為林地保護林用規劃數據的“地類”、“面積”、“林地保護等級”;二類調查數據的“地類1”,“圖形面積”、“小班蓄積”。選取“地類”是因為它們是區劃小班的主要屬性,選取“面積”和“蓄積”是為了跟蹤小多邊形(進行相交后,被切碎的細小多邊形保留了原始數據的字段和屬性)。
對于每條邊界對應的兩個不同矢量面的屬性模糊集,定義模糊集相對應元素的差值。若邊界對應兩矢量面屬性一致,則認為△rij=0,若邊界對應兩矢量面屬性不一致,則認為△rij=1;涉及到行政界線,不可合并,認為△ij=1。以邊界ab為例,矢量面A和C對應的屬性如表1。
由式(7),可知:
μ=1/4(△r11+△r12+△r13+△r21+△r22+△r23)=1/4(0+1+1+O+0+0+0)=0.5。
同樣的方法計算bc、cd、ac的邊界適適宜性判別值為0.25,0.75,1。其中邊界bc適宜性判別值最小,所以應該消除邊界bc,將矢量面B和C進行合并,并取B的屬性為合并后多邊形的屬性。
4 批量處理方法
實際操作中,如果對每個多邊形進行不同邊界的適宜性判別,工作量巨大,可行性不高。下面結合實際,介紹一種批量處理的方法,對關鍵步驟作如下解釋。
4.1 轉換為coverage格式
Coverage是ArcInfo workstation的原生數據格式。它將空間信息、屬性信息分別存放在兩個文件夾。COV-erage可以存儲拓撲要素類,支持高級要素類對象:比如多點和多線等。通過小多邊形由“shapefile”格式轉換成為“coverage”將相鄰面的屬性賦到公共邊界上提供了條件。
4.2 去偽節點
由面轉成線后,在很多線與線交叉的地方存在偽節點,使得原來一條邊界變成了兩條,在國產軟件geo-way3.6中可以批量處理該類偽節點。
4.3 計算value值
Value值即為前文提及的邊界適宜性判別值。
具體操作流程詳見圖2。
5 結果與分析
處理完小多邊形后重新計算面積,分地類統計面積變化,同時按照傳統方法“最大邊長合并”與“最大面積合并”2種方法進行小多邊形的自動處理,分地類統計不同方法的兩種矢量數據面積的變化,以各樹種與原始數據的差平方和為方差,反映處理前后,數據的波動。為突出處理前后,以及不同方法的效果,面積統一采用“公頃”,保留兩位小數。
從表2和表3可以看出,無論是二類調查數據,還是林地保護利用規劃數據,用基于模糊集的方法進行合并,方差都遠遠小于最大面積合并和最大邊長合并的方差。從表中可以看出,“基于模糊集的方法”優于“最大邊長合并”,效果最差的是“最大面積合并”的方法。
6 結語
從數據分析可以得出,基于模糊集的小多邊形處理方法明顯優于傳統的最大邊長合并、最大面積合并兩種方法?;谀:男《噙呅翁幚矸椒ㄔ诰葥p失方面是最小的。但同時也會相應增加數據處理工作量,根據實驗結果,處理一個縣的數據大概要增加工作量一個工日。
隨著林地年度變更的全面鋪開,西藏自治區2016年度將有65個縣(區)需要進行林地年度變更工作,基于模糊集的小多邊形處理方法能明顯提高融合數據精度,減少外業工作量,能夠較好的適合林地年度變更的需求,提高林地年度變更工作效率。