陳 飛 香,戴 慧,胡 月 明*,趙 元,周 永 章
區域土壤空間抽樣方法研究
陳 飛 香1,2,3,戴 慧2,3,胡 月 明2,3*,趙 元2,3,周 永 章1
(1.中山大學地球環境與地球資源研究中心,廣東 廣州 510275;2.廣東省土地利用與整治重點實驗室,廣東 廣州 510642;3.華南農業大學,廣東 廣州 510642)
對不同空間抽樣方法進行對比研究是尋找具有空間相關性的不同資源和調查對象的最適宜抽樣設計方案的重要手段。該文以廣東省增城市土壤鉻含量為空間要素,分別采用空間簡單隨機抽樣、空間分層抽樣和三明治抽樣3種方法進行抽樣;為便于比較3種方法的抽樣精度,設定相同樣本容量,采用Kriging插值對抽樣結果進行精度評價。結果表明:在較為豐富的先驗知識的情況下,三明治空間抽樣方法所抽樣點在預測土壤重金屬含量分布情況時得到的克里格估值誤差最小,是一種抽樣精度更高、適用范圍更廣的抽樣方案。
地統計分析;空間抽樣;GIS;土壤鉻含量
土壤要素空間分布一直是土壤學與地理學的研究熱點之一。長期以來,因受客觀條件所限,不能對區域內所有位置的土壤性狀一一進行調查,因而抽樣調查方法成為獲取土壤空間分析信息的基本方法,即從研究對象中抽出部分單位進行分析,通過其數量特征推斷總體數量特征。目前,常用的抽樣調查方法有經典抽樣方法和空間抽樣方法。經典抽樣方法野外采樣點多,耗費大量人力、物力和時間,因而效率低、成本高[1];空間抽樣方法是在地統計學支持下,設計抽樣樣點時考慮區域土壤空間自相關性[2],適合于具空間相關性的土壤性狀調查[3,4],廣泛應用于耕地資源調查與監測[5]、社會問卷調查[6]、人均農業總產值調查[7]等領域。
隨著抽樣技術的發展和應用的廣泛性,抽樣過程中逐漸融入空間信息,并將其與GIS、RS技術結合,形成高效的空間抽樣方法,如空間隨機抽樣、空間分層抽樣和三明治抽樣模型。本文采用空間隨機抽樣模型、空間分層抽樣模型和三明治抽樣模型估算廣東省增城市土壤鉻含量的空間分布,并對三種方法的抽樣結果進行精度評價,選出最適合于獲取區域土壤重金屬含量空間分布信息的空間抽樣模型,進一步完善我國區域土壤重金屬含量空間分布的抽樣研究,為土壤重金屬污染治理提供依據。
在空間簡單隨機抽樣中,抽樣均值是總體均值的無偏估計。考慮到空間對象的空間自相關性,其均值估計方差需要根據空間抽樣對象的相關程度而調整。在抽樣中,主要是通過樣本點估計一個連續表面上的均值[3],公式為:

式中:ˉZ為均值,n為樣本量,Z(xi)為樣本值。
在分層抽樣的基礎上,將空間研究區域N按其空間屬性特征分成L個互不重復的類型或層,先計算研究區域總體樣本量;再利用平均分配、按各層離散方差與總體規模乘積分配等方法將樣本量按權重Wh分配到每個層內;最后在每個層內進行簡單隨機布樣,計算各層的樣本均值(式(1))、方差(式(2))[3]和權重(式(3))。

式中:Wh是h層的權重,N是樣本量,Nh是h層中所有的樣本數。
先將研究區域劃分為多個分區(知識層),根據用戶對抽樣精度的要求計算所有層總的抽樣樣本量,依據分層抽樣樣本分配理論,將樣本分配到每個知識層;利用用戶調查的樣本值計算知識層的樣本均值和方差,并將其傳遞到報告層,得到每個報告層的樣本均值和方差[3]。報告層由用戶感興趣的空間報告單元構成,如果抽樣結果需要在多個報告單元進行統計與推斷,抽樣費用將大大增加;報告單元的靈活性表現可由用戶定義,這也是三明治空間抽樣方法的一大特性,該特性既解決了經典抽樣理論默認只有唯一報告單元的局限性問題,也解決了在多個報告單元布設樣本帶來的昂貴費用問題[3]。
根據研究區土壤類型和地形特點,在保證樣品代表性的前提下,在研究區電子地圖上布點,再根據當地實際情況用GPS手持機獲取實際坐標。采用“X”法,在10 m半徑的范圍內取0~20 cm耕層土壤,5個點混合為一土樣,共采集194個土樣;所有樣品經風干、剔出雜質、研磨、分別過20目和100目篩后,采用GB/T 17137火焰原子吸收光譜法測定土壤鉻含量。
空間自相關性反映了一個區域單元上某一地理現象或某一屬性值與鄰近區域單元上同一現象或屬性值的相關程度。本文利用Arc Map,采用Moran′sI系數法檢測研究區域內土壤鉻空間自相關的指標;檢測到 Moran′sI為0.4691,且p<0.01,表明研究區域內土壤鉻屬于空間正相關,且相關性顯著。
經典采樣技術廣泛應用于樣本容量大小的確定,本文采用Cochran提出的純隨機采樣方法確定樣本容量,計算公式為:

式中:n為樣本容量大小,t為與顯著性水平α相對應的標準正態偏差,Std為樣本標準差,d為樣本平均值與相對誤差(%)的乘積。
經計算,90%、95%和99%置信水平下對應的標準正態偏差t值依次是1.6449、1.96、2.5758,樣本標準差Std值為14.3744,樣本平均值為35.6583。為了更好地表達樣本容量的代表性,置信水平取99%,相對誤差分別取15%、10%、5%條件下得到的合理樣本容量依次為48、108、432。根據研究區域實際情況,本文選取相對誤差10%條件下得到的108個樣點進行空間抽樣對比研究。
傳統的分層將屬性值相對近似的盡可能分到同一層,根據這個分層標準對空間對象分層時,在同一層的對象屬性值相差可能很大。而知識層分區,考慮了樣本點的空間信息,兼顧了同一層的對象能夠在空間上相連。目前,知識層分區的方案主要有兩類,一類是直接利用已有的分區單元對樣本劃分,另一類是根據單一要素或多要素相結合進行分層。本研究主要采用第一類方法,根據研究區土地利用類型,將研究區分成耕地層、園地層、林地層和非農用地4層(圖1)。報告層是用戶感興趣的空間報告單元(用戶希望了解的抽樣調查對象所分布的空間區域)的集合,當前常見的報告單元有省、市、縣等行政區,也可以是流域等自然帶,本研究的報告單元采用增城市行政區劃圖。

圖1 增城市知識層分區Fig.1 The partition of knowledge level in Zengcheng City
抽樣過程中,空間簡單隨機抽樣不涉及分層,空間分層抽樣只涉及空間分層,三明治空間抽樣既涉及空間分層,又涉及報告單元的選取。采用SSSampling軟件包對3種抽樣方法進行對比抽樣。
空間簡單隨機抽樣樣本量取108,總體方差根14.3744,絕對誤差1.7,空間相關系數0.13,其抽樣結果如圖2a。空間分層抽樣在分層抽樣知識層分區(圖1)的基礎上進行,其樣本量108,用戶給定抽樣方差0.000045,均值標準差3.66,均值空間標準差4.15,結果如圖2b;樣點在各層分布情況如表1,在園地分布最少(9個),占樣本容量的8.33%,在耕地層分布最多,占樣本容量的60.19%。三明治空間抽樣也是在分層抽樣基礎上進行的,其知識層如圖1,報告單元取增城市行政區劃圖;其樣本量108,用戶給定抽樣方差0.000045,知識層均值13.51,知識層均值標準差3.01,知識層均值空間標準差4.06,抽樣結果如圖2c;各層樣點數量分布情況如表1,抽樣點主要分布在耕地層,占樣本容量的62.96%,園地樣點分布最少,僅10個。

圖2 3種抽樣方法的抽樣結果Fig.2 Sampling results of the three sampling methods

表1 空間抽樣模型各知識層的樣點數分布Table 1 Sample distribution for different knowledge level of spatial sampling methods
借助地統計學方法,對3種方法抽樣結果進行Kriging插值,以便評價抽樣結果的精度。Kriging方法也稱為空間局部估計或空間局部插值,它是一種非常重要的最優、線性、無偏空間插值方法,首先考慮的是空間屬性在空間位置上的變異分布,確定對一個待插點值有影響的距離范圍,用此范圍內的采樣點估計待插點的屬性值[8]。經柯爾莫哥洛夫-斯米諾(Kolomogorov-Semirnov,K.S)正態分布檢驗,土壤鉻含量滿足正態分布,符合采用Kriging插值的前提條件。本文采用普通克里金法(Ordinary Kriging)對抽樣結果和原始樣點的土壤鉻含量進行最優內插,幾種插值結果如圖3所示。

圖3 不同布局樣點下土壤鉻含量普通Kriging插值Fig.3 The ordinary Kriging interpolation of soil Cr under different distribution of sample points
3種空間抽樣方法所抽樣點與原始樣點土壤鉻含量Kriging插值后的交叉驗證(Cross Validation)結果見表2,總體上,平均誤差(ME)和標準化平均誤差(MSE)的絕對值均趨近于0,均方根誤差(RMSE)和平均標準誤差(ASE)的值都較小且較接近,表明預測結果均比較理想。但從局部驗證差異看,不同空間抽樣方法所抽樣點的插值交叉驗證(Cross Validation)結果卻有所差異。3種空間抽樣方法中,|ME|的值最接近于0(0.0973)的是三明治空間抽樣方法,最大(0.3421)的為空間簡單隨機抽樣。|RMSE-ASE|大小排序為空間簡單隨機抽樣(1.74)>空間分層抽樣(1.44)>三明治空間抽樣模型(1.04),說明三明治空間抽樣模型所抽樣點通過插值預測的結果最接近真實值。表2中各樣點插值的RMSSE值均大于1,說明預測值全部被低估了,但三明治空間抽樣模型RMSSE值為1.057,最接近于1,表明被低估的程度最小。與原始樣點插值的交叉驗證相比,鑒于原始樣點樣本量大(為208),原始樣點的各項指標均為最理想,預測精度最高;而3種空間抽樣方法中,三明治空間抽樣方法所得樣點插值的精度與原始樣點最為接近,其次是空間分層抽樣。

表2 不同布局樣點下普通克里格插值估測精度Table 2 The predict accuracy of ordinary Kriging under different distribution of sample points
在區域土壤空間抽樣中,空間簡單隨機抽樣、空間分層抽樣、三明治抽樣3種方法均可以設置相同樣本容量,但空間簡單隨機抽樣僅考慮樣點自身位置,而空間分層抽樣與三明治抽樣可以利用技術人員已有經驗,抽樣結果能滿足不同研究目的的需要。采用三明治抽樣方法,因其引入報告層與知識層的處理,抽樣結果具有更高的精度與效率,在對區域土壤空間要素具有較豐富先驗知識的情況下尤為適用。
區域土壤重金屬含量抽樣是其空間預測制圖的基礎,必須選用可靠的、高精度的抽樣方法,才能夠為設計科學合理的野外采樣方案提供切實的依據。本文因數據所限,未能對3種抽樣方法在其他土壤要素的空間抽樣上做出對比分析;另外,在三明治空間抽樣方法的知識層選擇時,僅以研究區土地利用現狀作為知識層分層,未能進一步考慮其他可能對土壤鉻含量空間分布造成影響的因素,如產業布局、人類活動、地形坡度和種植作物等。
[1]楊琳,朱阿興,秦承志,等.一種基于樣點代表性等級的土壤采樣設計方法[J].土壤學報,2011,48(5):938-946.
[2]WANG J,LIU J,ZHUAN D,et al.Spatial sampling design for monitoring the area of cultivated land[J].International Journal of Remote Sensing,2002,23(2):263-284.
[3]王勁峰,姜成晟,李連發.空間抽樣與統計推斷[M].北京:科學出版社,2009.
[4]鄧仕虎,楊勤科.DEM采樣間隔對地形描述精度的影響研究[J].地理與地理信息科學,2010,26(2):23-26.
[5]劉海啟.大尺度耕地變化監測的遙感抽樣方法研究[J].農業工程學報,2001,17(2):168-171.
[6]高麗玲,李新虎,王翠平,等.空間抽樣的理論方法與應用分析——以廈門島問卷調查為例[J].地球信息科學學報,2010(3):358-364.
[7]連健,李小娟,宮輝力,等.GIS支持下的空間分層抽樣方法研究——以北京市人均農業總產值抽樣調查為例[J].地理與地理信息科學,2008,24(6):30-33.
[8]KNOTTERS M,BRUS D J,OUDE VOSHAAR J H.A comparison of Kriging,co-Kriging and Kriging combined with regression for spatial interpolation of horizon depth with censored observations[J].Geoderma,1995,67(3):227-246.
Study on Regional Soil Spatial Sampling Method
CHEN Fei-xiang1,2,3,DAI Hui2,3,HU Yue-ming2,3,ZHAO Yuan2,3,ZHOU Yong-zhang1
(1.CenterforEarthEnvironment&Resources,SunYat-SenUniversity,Guangzhou510275;2.KeyLaboratoryofGuangdongProvinceLandUseandRemediation,Guangzhou510642;3.SouthChinaAgriculturalUniversity,Guangzhou510642,China)
The comparative study on different spatial sampling method is an important means to find a spatial correlation of the different resources and survey the most appropriate sampling design.In this paper,the soil Cr content in Zengcheng City in Guangdong Province was taken as spatial elements,three kinds of methods for sampling analysis that respectively were the spatial simple random sampling and spatial stratified sampling,spatial Sandwich sampling were discussed.For ease of comparison of three methods of sampling precision,this paper set the same sample size,and then used the Kriging interpolation on the sampling accuracy evaluation,and then did cross-validation after Kriging interpolation.In cross-validation process,|ME|value of the Sandwich space sampling method is the most closet to zero,it is 0.0973,and the value of spatial simple random sampling is the largest.The order of the|RMSE-ASE|value is:spatial simple random sampling>spatial stratified sampling>spatial Sandwich sampling.The results show that,in the case of more rich of prior knowledge,the sample points which gained by Sandwich sampling attain the minimum Kriging estimation error in the case of predicting the distribution of the contents of heavy metals in soil,Sandwich sampling has higher sampling precision and wider range of application.
geo-statistical analysis;spatial sampling;GIS;soil Cr concentration
P 208;X53
A
1672-0504(2012)06-0053-04
2012-04- 28;
2012-06-27
國家自然科學基金項目(40971125);廣東省科技計劃項目(2011B020313020)
陳飛香(1978-),女,壯族,博士研究生,講師,研究方向為地理信息系統應用。*通訊作者E-mail:ymhu163@163.com