屈 清,田永中,王 龍,郭金銘,刁德彬
(1.西南大學 地理科學學院,重慶 北碚 400715;2.內江師范學院 地理與資源環境學院 ,四川 內江 641112)
基于FME與ArcGIS的空間數據連接與數值模擬
屈 清1,田永中1,王 龍1,郭金銘2,刁德彬1
(1.西南大學 地理科學學院,重慶 北碚 400715;2.內江師范學院 地理與資源環境學院 ,四川 內江 641112)

在已有GIS理論與空間數值模擬的基礎上,根據涪陵區DEM、降水、溫度、農用地質量等級和永久基本農田等數據,綜合使用FME與ArcGIS的數據鏈接集成、可視化與圖解建模等功能,并結合數據統計分析軟件SPSS,發現農用地利用等指數分布與其他地理要素存在線性相關關系;并在此基礎上構建了多元線性回歸模型。此模型主要用于解決永久基本農田劃定中利用等指數部分缺失問題。
基本農田;GIS;空間數據;模擬
地理空間數據是用來表示地理實體或現象的位置、形狀、大小及其分布等諸方面特征的數據[1,2]。從眾多的地理空間數據中獲取有用的地理空間數據是比較困難的,本文以區域性的地理數據處理為例,將FME與ArcGIS相結合進行了空間數據處理并實現了數值模擬,探尋未知區域的數據[3]。
1.1 研究區概況
涪陵區位于北緯29°21′~30°01′,東經106°56′~107°43′之間,地處四川盆地和盆邊山地過渡地帶,長江與烏江交匯處。該區域地貌以低山丘陵為主,地勢總體上東南高而西北低[4],整體條件優異,有利于農作物的生長。
1.2 地形特征分析
根據中國科學院研究員李炳元[5]對陳志明[6]及歐洲地貌形態的總結分類,總體上涪陵區地形可歸納為4大類型(見表1):微起伏平原、平壩,起伏丘陵,山地起伏低山和山地起伏低中山。

表1 涪陵區地表形態歸類
利用ArcGIS10可實現地表形態的可視化分類,實驗過程分4步進行(見圖1)。結合ArcGIS10的圖解建模功能,利用涪陵區的DEM與地表起伏度數據建立涪陵區地表形態分類組合圖解模型。圖解模型中最主要部分是要實現柵格數據的擦除功能,以及海拔數據與起伏度兩者相結合的涪陵區地表形態分類(見圖2),并在此基礎上將每個結果合并為一個數據集,最終得到涪陵區的地表形態分類(見圖3)。由此可見,涪陵區地表形態主要是起伏丘陵山地,其次是平原、平壩,起伏較大的山地比較少。

圖1 涪陵區地表形態分類過程圖

圖2 ArcGIS10擦除功能實現圖解模型圖

圖3 涪陵區地表形態分類圖

圖4 數據推導模型構建流程圖
1.3 氣候特征分析
涪陵全區總體上降水量比較充沛,但仍然存在空間上的不均,降水主要集中在東南武陵山丘陵、山地起伏區,西南微起伏平原、平壩區,長江、烏江一線降水量相對偏少。涪陵區常年均溫較高,年均高溫區主要集中在長江、烏江一線,年均中溫區主要位于臺地和丘陵地區,年均低溫區包括東南山地起伏和山地區。
1.4 農用地等級空間分布
根據涪陵區農用地分等定級成果數據,通過空間可視化定性分析,全區利用等級較高的區域主要分布在平原、平壩區域以及年均溫較高降水適中的區域;利用等級較低區域大都分布在起伏山地與丘陵區域,年均溫較低區域。從可視化角度,結合上述地形與降水、氣溫圖分析發現,利用等級與地形分類的相關程度較高,吻合度較好,具有一定的規律性。
為了探尋未知區域的數據,需把不同來源但相同空間位置的數據通過疊加,將上述海拔、地表起伏度、氣溫、降水、坡度、農用地利用等數據集成在一起進行空間統計分析,并構建相關的數學模型,實現對未知區域數據的求解。首先需要構建數據分析處理總體流程,如圖4所示。
2.1 數據鏈接輸入
FME重投影是在缺少轉換七參數的前提下首選的方式。首先需要在FME Workbench中將原始基于北京54坐標系的土地利用等數據*.shp格式文件輸入FME,然后調用Reprojector函數模塊,設置輸出的坐標系統為西安80坐標系,通過這種方法可很好地將基于北京54的農田分等定級數據與基于西安80的基本農田數據實現空間位置配準。在空間數據校正的基礎上,以基本農田圖斑為統計單位,利用ArcGIS中的分區統計將需要融入分析的空間位置相同的數據以標識碼為統計單位和數據鏈接依據,將所涉及的空間數據集成為一張表,便于數據統計分析。這里所涉及的空間數據主要包括海拔、地表起伏度、氣溫、降水、坡度、基本農田圖斑和農用地利用等。
2.2 利用等指數反演數學模型構建
采用上述數據集成方法將海拔、氣溫和降水等數據合并為一張表格(見表2),建立基本農田圖斑標識碼與這些數據的對應關系,總計涉及83 764個圖斑,其中缺失質量數據部分總計15 530塊圖斑,此部分利用等指數的獲取作為空間數值模擬的重點。
結合諸多要素數據以及回歸模型,其基本構建流程為:①對多要素與基本農田質量指數的相關性進行分析;②提取相關性明顯的要素進行回歸分析,選取構建模型構建回歸模型。
2.2.1 數據的量化分析
根據表2中數據,采用地理學中的經典統計分析方法,分別分析5類地理要素與利用等指數之間的相關程度,分別記為相關系數Rei、Rqi、Rsi、Rri和Rti。將上述空間變量代入Pearson的相關系數計算公式可求出相關系數。

表2 基本農田圖斑地理要素對應表
利用SPSS數據分析軟件對上述數據進行相關分析,得到各要素與土地質量等級的相關性程度表(表3)。可以看出,在樣本容量為66 948且置信水平為0.01的情況下,質量等級與坡度、起伏度表現出強烈的負相關;與年均降水量和海拔高度呈負相關,但相關性較弱;與年均氣溫呈正相關,且正相關較強。總之,這5類地理要素與質量等級之間表現為較強的線性關系,從相關程度上選取起伏度、坡度和年均氣溫作為構建土地質量估計模型的參數。

表3 各地理要素與土地利用等指數相關系數表
2.2.2 構建回歸模型及模型顯著性檢驗
在構建回歸模型之前,需明確地理要素變量的多寡,如果要素變量在一個以上,則需要選擇多元線性回歸模型,多元線性回歸 模型更具有普遍意義[7]。
假設土地利用等指數這一因變量i受3個自變量s、p、q的影響,其n組觀測值為(ia,sa,pa,qa),a=1,2,…,66 948,那么多元線性回歸模型的結構形式為:

式中,β0、β1、β2、β3為待定參數;εa為隨機變量。
如果b0、b1、b2、b3分別為β0、β1、β2、β3的擬合值,則回歸方程為:

式中,b0為常數;b1、b2、b3分別為偏回歸系數。其意義在于當其他自變量sj、tj、qj(j≠w)固定時,sw、tw、qw中一個自變量每變化一個單位而使因變量i平均改變的數值。
根據最小二乘法原理,β0、β1、β2、β3的估計值b0、b1、b2、b3應該使擬合值與觀測值之間的離差平方和趨近于最小,將樣本數據代入向量計算公式得到:

套用公式,進行矩陣運算,得到回歸系數:

坡度(s)、溫度(t)和起伏度(q)之間的線性回歸方程為:

將所需參數代入公式得:

在置信水平α=0.05上,通過使用Excel中的F值計算函數FINV( ),可以查出F0.05(3,66 948)= 2.61。由于F> 2.08,所以回歸方程是顯著的。
2.2.3 對基本農田缺失土地質量的反演
通過以上的定量化分析,土地利用等指數與地表起伏度、坡度和氣溫線性關系明顯,從而利用擬合線性回歸模型并根據起伏度、坡度和氣溫的值就能計算出基本農田中缺失土地利用等指數部分的指數。
1)通過數值的回歸模擬,解決了涪陵區基本農田數據中部分圖斑缺失利用等指數部分的數據。
2)綜合使用FME與ArcGIS等主流數據處理軟件,對空間數據集成的一般技術步驟做了進一步探析。
3)對涪陵區的地表形態分類做了一定的探討,不足之處在于對空間數值模擬結果需要進一步驗證,并在驗證的基礎上對模型做改進。
[1] Chang Kang-tsung. Introduction to Geographic Information Systems[M].北京:科學出版社,2003
[2] 田永中.地理信息系統基礎與實驗教程[M].北京:科學出版社,2010
[3] Guo Diansheng, Mennis J. Spatial Data Mining and Geographic Knowledge Discovery—An Introduction [J].Computers, Environment and Urban Systems,2009,33: 403-404
[4] 重慶市涪陵區統計局.涪陵統計年鑒2011[G].2011
[5] 李炳元.中國陸地基本地貌類型及其劃分指標探討[J].第四紀研究, 2008, 28(4): 535-543
[6] 陳志明.1∶400萬中國及其毗鄰地區地貌圖說明書[M].北京:中國地圖出版社, 1993
[7] 徐建華.計量地理學[M].北京:高等教育出版社,2006
P208
B
1672-4623(2014)01-0114-03
10.11709/j.issn.1672-4623.2014.01.039
屈清,碩士,研究方向為地圖制圖技術與土地信息系統。
2013-05-03。
項目來源:“十二五”農村領域國家科技項目(2012BAJ231300)。