王 迪,仲格吉,張 影,田 甜,曾 妍
(1. 中國農業科學院農業資源與農業區劃研究所,北京 100081; 2. 農業農村部農業遙感重點實驗室,北京 100081)
區域農作物面積估算對于預測農作物產量,優化農業種植結構,加強農業生產管理,確保國家糧食安全具有重要意義[1-3]。受自然災害損毀、耕地休耕輪作、市場供求關系等因素影響,農作物種植面積年際間動態變化強烈,因此,快速、準確、高效地獲取農作物面積信息顯得尤為重要[4-6]。
將衛星遙感技術與傳統抽樣相結合構建的空間抽樣方法,充分發揮了遙感與抽樣統計的各自優勢,已被美國、歐盟及中國在內的多個國家和地區廣泛應用于大區域農作物面積統計調查業務中,并顯著提高了農作物面積估算的準確性和時效性[7-14]。美國大面積農作物估產計劃(Large Area Crop Inventory Experiment,LACIE)[15]、農業和資源空間遙感調查計劃(Agriculture and Resources Inventory Surveys Through Aerospace Remote Sensing,AGRISARS)[16]、歐盟的農業遙感監測計劃(Monitoring Agriculture with Remote Sensing,MARS)[17]和土地利用/覆蓋面積框調查計劃(Land Use/Cover Area Frame Survey,LUCAS)[18],中國農情快速調查系統、中國國家統計局的農業統計遙感系統[19-21]等均采用空間抽樣方法進行區域農作物面積估計。迄今為止,美國國家農業統計署(National Agricultural Statistics Service,NASS)仍采用分層兩階段抽樣與衛星遙感相結合的空間抽樣方法進行全美大宗農作物面積估算[22]。
目前,國內外對農作物面積空間抽樣的研究主要集中在如何通過衛星遙感影像與傳統抽樣方法相結合來改善抽樣調查精度,減少抽樣調查費用,提高統計調查時效性,節省調查工作量方面。研究的農作物多為水稻[12]、玉米[23]、大豆[24]、小麥[25]等大宗糧食作物,采用的抽樣方法包括分層抽樣[26]、系統抽樣[29]、整群抽樣[30]、多變量與規模成比例概率(Multivariate Probability Proportional to Size,MPPS)抽樣[23,31]及兩階段抽樣[32-34]。然而,以往農作物面積空間抽樣研究與實踐均假設抽樣單元間相互獨立,即所有抽樣單元內的農作物屬于獨立同分布(Independent Identical Distribution,IID),而農作物的種植受自然條件、社會經濟等因素影響常存在空間自相關性(定義為空間近鄰的面積單元中地理變量的相似性,距離越近的單元相似性越強[35-36])。關于空間自相關性對農作物面積空間抽樣調查效率的影響研究目前則較少,從而導致農作物分布存在空間自相關特征時的抽樣設計的合理性明顯不足。雖有Wang等[37]在農作物面積空間抽樣方案設計中對抽樣單元空間自相關性加以考慮,但研究重點在于優選分層標志降低層內單元空間自相關強度,以此滿足樣本單元相互獨立原則,并未就空間自相關性對抽樣效率的影響做出評價,更未提出適合于空間自相關分布特征的農作物面積空間抽樣方案。
綜上,本研究選取國家級抽樣調查縣—安徽省鳳臺縣為研究區,通過衛星遙感影像與空間分析方法相結合評價不同尺度下抽樣單元內冬小麥種植的空間自相關性,分析空間自相關性對冬小麥面積抽樣外推總體精度及所需樣本容量的影響,優選空間自相關存在下的抽樣單元尺度、樣本抽選方法及布局方式,旨在為合理設計農作物面積空間抽樣方案提供參考依據。
本研究區選擇為安徽省中北部的鳳臺縣(32°33′N~33°02′N、116°21′E~116°56′E),屬淮北平原主要農業自然經濟類型區,地處之間,全縣面積1 100 km2,其中耕地面積為46 100 hm2(圖1)。縣域大部分地區為沖積平原,地勢平坦,高程變化范圍在19.4~40.0 m之間,土壤類型以黃土、坡黃土、白黃土等為主,具有典型的暖溫帶和北亞熱帶過渡性生物氣候特征。年平均氣溫15.2 ℃,無霜期216 d,日照時數2 373 h,多年平均降雨量916 mm。冬小麥和水稻是該縣主要種植的農作物,種植結構單一,耕作制度為一年兩熟制,其中冬小麥在每年10月中旬播種至下年6月上旬收獲。
1)基礎地理數據。鳳臺縣1: 250 000縣級行政邊界。
2)GF-1全色多光譜(Panchromatic and Multispectral,PMS)影像。GF-1衛星于2013年發射,搭載了1臺全色相機(空間分辨率為2 m)和1臺高分辨率多光譜相機(空間分辨率為8 m,含藍、綠、紅、近紅外4個波段),成像寬幅60 km×60 km,重訪周期為4 d。本研究使用2017年4月13日的4景PMS影像提取研究區冬小麥。
3)Landsat-8 陸地成像儀(Operational Land Imager,OLI)影像。該影像包括9個波段,空間分辨率為30 m,成像寬幅185 km×185 km,重訪周期為16 d。本研究從美國地質勘探局(United States Geological Survey, USGS,https://earthexplorer.usgs.gov/)網站下載1景Landsat-8 OLI影像(成像日期為2017年4月30日)用于對GF-1 PMS影像進行幾何校正。
4)樣點地面調查數據。通過地面調查與Google Earth高空間分辨率影像相結合,將研究區土地利用類型分為小麥、油菜、水體、建筑、其他(道路、林地、草地等地物)5個類別(表1)。針對每種類別,利用全球定位系統(Global Positioning System, GPS)進行地面樣點地理位置采集。野外采集樣點總數為190個,其中隨機選取66.7%(127個)的樣點作為訓練集,剩余33.3%(63個)樣點作為驗證集。
對GF-1多光譜影像進行輻射定標、大氣校正、幾何糾正、圖像融合、拼接和裁剪處理。利用遙感圖像處理軟件ENVI 5.3對GF-1多光譜影像進行輻射定標,將原始圖像中各像素灰度值轉換為輻射亮度值。采用ENVI 5.3軟件中的FLAASH大氣校正模塊對輻射定標后的影像進行大氣校正,將各像素的輻亮度值轉換成反射率。分別以Landsat-8 OLI和GF-1多光譜影像為基準和待糾正影像,采用二次多項式法對進行圖像幾何糾正。根據地面控制點(Ground Control Point,GCP)和對應像點坐標確定二次多項式系數。選取均方根誤差(Root Mean Square Error,RMSE)作為基準和待糾正影像配準精確性的評價指標,當幾何糾正后的RMSE<0.5個GF-1多光譜影像像素時,即停止GCP的選取。總計選取50個GCP。采用三次卷積法對配準后的GF-1多光譜圖像像素值進行重采樣處理,重采樣后的影像空間分辨率為8 m。為提高GF-1多光譜影像空間分辨率,利用ENVI5.3軟件中的Image Sharpening模塊對GF-1衛星多光譜和全色影像進行融合處理,選擇NNDiffus作為融合算法,將多光譜影像空間分辨率提高至2 m。對覆蓋研究區的4景融合后的GF-1 PMS影像進行拼接處理,使拼接后影像能夠全部覆蓋研究區。利用鳳臺縣行政界限對拼接后影像進行裁剪處理,經預處理后覆蓋研究區的GF-1 PMS影像如圖2所示。

表1 訓練集和驗證集中各地物類別所對應樣點數量和像素Table 1 Number of sample points and pixels corresponding to the object categories in the training set and verification set
1.4.1 冬小麥空間分布圖
在融合裁剪后的GF-1 PMS影像上,采用監督分類中的最大似然分類法進行研究區冬小麥提取。考慮到研究區內冬小麥種植面積較大,根據分類需要,本研究將區域內地物簡單分為冬小麥和非冬小麥。結合Google Earth高空間分辨率影像,在GF-1 PMS影像上隨機選取300個樣點,其中200個樣點作為訓練集,其余100個樣點作為精度驗證集。利用冬小麥和非冬小麥訓練集,在ENVI5.3軟件上采用最大似然分類法進行目標地物分類。利用驗證樣本對分類結果進行精度驗證后,總體精度為91%,Kappa系數為0.80。由于總體分類精度優于90%,冬小麥分類結果能夠客觀準確反映研究區2017年冬小麥種植面積及空間分布情況,因此,本研究利用冬小麥分類圖進行后續的空間抽樣方案設計和自相關性評價。
1.4.2 冬小麥本底圖
經實際比對,選用融合效果更好的Gram-Schmidt算法對GF-1衛星多光譜和全色影像進行融合處理,融合后影像空間分辨率為2 m。利用融合后影像結合地面調查數據中的訓練樣點數據,采用支持向量機(Support Vector Machine, SVM)監督分類法提取研究區冬小麥。針對冬小麥提取結果中易錯分(如田塊邊界處的樹林等)或不確定部分,采用目視解譯法進行手工處理,進一步提高冬小麥提取結果的準確性。利用地面調查數據中的驗證樣點數據,對研究區土地利用分類結果進行精度驗證,結果顯示總體分類精度為96.93%,Kappa系數為0.95。其中,冬小麥的生產者精度為98.34%,用戶精度為99.60%,錯分誤差為0.40%,漏分誤差為1.66%。由于冬小麥提取結果的用戶精度優于99%,因此,本研究利用GF-1 PMS影像提取的研究區2017年冬小麥本底圖(圖3),對空間抽樣外推研究區冬小麥面積總體的精度進行檢驗。
本研究選取全局莫蘭指數(global Moran's index,I)作為評價抽樣單元內冬小麥面積比的空間自相關強度指標,其計算由式(1)所示[38-40]:
式中N是總體容量,即抽樣框內全部抽樣單元的數量;xi是第i個抽樣單元內冬小麥面積比;xj是第j個抽樣單元內冬小麥面積比;是抽樣框內所有抽樣單元內冬小麥面積比的均值;wij是空間鄰接矩陣。
空間自相關顯著性采用Z統計量檢驗。Z統計量計算由式(2)所示:
式中Z(I)為統計量Z得分;E(I)為全局莫蘭指數的數學期望;V(I)為全局莫蘭指數的方差。
1.6.1 抽樣單元
為分析不同尺度下抽樣單元內冬小麥面積比的空間自相關性,本研究設計500、1 000、1 500、2 000、2 500、3 000、3 500、4 000、4 500、5 000 m共計10種尺度的正方形格網,利用格網對研究區進行分割,選擇研究區行政邊界內或與其相交的全部網格作為抽樣框內的基本抽樣單元。將GF-1PMS影像提取的研究區冬小麥空間分布圖與抽樣單元網格疊加,利用地理信息系統軟件ArcGIS 10.2統計每個抽樣單元內的冬小麥面積比作為該單元的觀測值。針對10種尺度的抽樣單元,分別構建抽樣框。
1.6.2 樣本抽選與總體外推
本研究選取簡單隨機抽樣(Simple Random Sampling,SR)、系統抽樣(Systematic Sampling, SY)和分層抽樣(Stratified Sampling, ST)3種常用抽樣方法進行樣本抽選、總體外推和誤差估計。為了評價各種抽樣方法外推總體的穩定性,針對每種抽樣方法和抽樣單元尺度均采取有放回的方式抽取10套樣本。利用每套樣本進行研究區冬小麥面積總體推斷。系統抽樣外推總體與誤差估計的計算與簡單隨機抽樣相同。簡單隨機抽樣和分層抽樣方法外推總體與誤差估計的計算分別由式(3)~式(6)所示[41-42]:
1.6.3 樣本容量
為在相同水平下比較不同抽樣方法的外推總體精度,本研究將3種抽樣方法采用的抽樣比均設計為5%。另外,為評價空間自相關性對冬小麥面積抽樣外推總體所需理論樣本容量的影響,本研究將樣本容量計算中涉及的相對允許誤差(γ,%)設定為5%和10% 兩種水平。
1.6.4 樣本空間布局
對于簡單隨機抽樣,利用ArcGIS10.2軟件對抽樣框內全部單元根據其空間位置順序進行從1~N的數字編碼,當總體單元的編號與生成的偽隨機數相同時,該單元即被抽中,同時該樣本單元的空間位置也被確定。系統抽樣中采用3種方式進行樣本抽選與空間布局:1)按ArcGIS10.2軟件默認的標識碼對全部抽樣單元進行排序(SY1);2)按單元冬小麥面積比由小到大排序(SY2);3)按空間等距方式進行樣本選取與布局(SY3)。對于前2種方式,抽樣間隔(k)均相同。第3種方式中,被抽中的相鄰樣本在水平和垂直方向上間距相等,樣本在空間上均勻分布于整個研究區。分層抽樣中選取抽樣單元內冬小麥面積比作為分層標志。為降低層內方差,將全部單元分為5層。按層內單元占總體單元比例分配每層樣本容量。層內采用簡單隨機抽樣進行樣本抽選與空間布局。為檢驗不同布局方式下抽樣樣本外推總體的穩定性,針對每種樣本空間布局方式,分別抽出10套樣本進行總體外推與誤差估計。
選取均方根誤差(Root Mean Squared Error, RMSE)、平均相對誤差(Mean Relative Error, MRE, %)和平均變異系數(Mean Coefficient of Variance, MCV, %)作為評價抽樣外推精度的3個指標。其中,RMSE和MRE分別用來評價總體外推的絕對和相對誤差;MCV用來衡量抽樣外推總體的穩定性,其計算分別由式(7)~式(9)所示:
式中m為每種抽樣方法抽選出的樣本套數,m=10;為第i套樣本外推研究區冬小麥面積總體的估計值;Y為研究區冬小麥面積總體總值的實測值(由研究區冬小麥面積本底圖(圖3)獲得);為第i套樣本外推研究區冬小麥面積總體總值估計量的方差。
為分析各種尺度下抽樣單元內冬小麥面積比的空間自相關性,10種尺度下抽樣單元內冬小麥面積比的全局莫蘭指數I及其顯著性檢驗指標Z得分的變化情況如圖4所示。由圖4可知,隨著單元尺度的增大,抽樣單元內冬小麥面積比的全局莫蘭指數I和Z得分值均呈減小趨勢。這說明抽樣單元內冬小麥面積比的空間自相關性及其顯著性水平隨抽樣單元尺度的增大而減小。盡管抽樣單元內冬小麥面積比的全局莫蘭指數I及Z得分值隨單元尺度的增大而減小,但I的最小值(對應抽樣單元尺度為5 000 m)仍不低于0.50,且I的最小值所對應的Z得分值為7.15>Z得分值(Z0.05=1.96,P<0.05)。這說明盡管抽樣單元內冬小麥面積比的空間自相關性隨抽樣單元尺度的增大而減小,但無論在何種尺度下抽樣單元內冬小麥面積比都存在顯著的空間正相關性。
為分析空間自相關性對冬小麥面積抽樣外推精度的影響,利用了3種抽樣方法(簡單隨機抽樣、系統抽樣和分層抽樣)外推研究區冬小麥面積總體的MRE(圖5a)和MCV(圖5b)值隨不同抽樣單元空間自相關強度(即全局莫蘭指數I,其隨抽樣單元尺度的增大而減小)的變化(表2)。其中,隨著空間自相關強度的逐漸減小,3種方法外推總體的MRE和MCV值均呈現出先減小然后逐漸增大的變化趨勢。當I由0.75降至0.68時(對應的抽樣單元尺度由500 m 增大至2 000 m),3種方法外推總體的MRE和MCV值隨空間自相關強度的減小而減小;當I由0.68降至0.50時(對應的抽樣單元尺度由2 000 m 增大至5 000 m),3種方法外推總體的MRE和MCV值隨空間自相關強度的減小而明顯增大。當I為0.68時,即對應抽樣單元尺度為2 000 m時,對于10種抽樣單元尺度而言,無論哪種抽樣方法外推研究區冬小麥面積總體的MRE和MCV值均為最小(簡單隨機抽樣、系統抽樣和分層抽樣外推總體的相對誤差分別為17.94%、9.48%和1.82%)。這說明空間自相關存在下,選擇2 000 m作為抽樣單元尺度進行冬小麥面積總體外推的精度最高,穩定性最好。另外,相比于簡單隨機和系統抽樣,無論空間自相關強度處于何種水平,利用分層抽樣外推研究區冬小麥面積總體的MRE和MCV值均為最小。10種抽樣單元尺度下采用分層抽樣外推冬小麥面積總體的MRE和MCV平均值分別為4.74%和7.89%。
此外,為了分析空間自相關強度對抽樣外推農作物面積總體絕對誤差的影響,各種空間自相關強度下3種抽樣方法外推研究區冬小麥面積總體的RMSE值(表2)。隨著空間自相關強度的降低,3種抽樣方法外推冬小麥面積總體的RMSE值呈先減小而后逐漸顯著增大的變化趨勢。當空間自相關強度(即全局莫蘭指數I)為0.68時,各種抽樣方法外推總體的絕對誤差最小(簡單隨機抽樣、系統抽樣和分層抽樣外推總體的RMSE分別為3.26×108、1.05×108和0.11×108m2)。隨著空間自相關強度的降低,RMSE表現出與MRE和MCV值相同的變化規律。由3種抽樣方法外推冬小麥面積總體的平均RMSE結果可知,分層抽樣最小(RMSE為1.45×108m2),其次是系統抽樣(RMSE為4.48×108m2),簡單隨機抽樣最大(RMSE為6.53×108m2)。綜合不同空間自相關強度下各種抽樣方法外推研究區冬小麥面積總體的MRE、MCV和RMSE結果表明,當抽樣單元尺度為2 000 m,采用分層抽樣進行冬小麥面積總體外推的精度(MRE為1.82%)和穩定性(MCV為3.19%)最好。

表2 不同空間自相關強度下三種抽樣方法外推研究區冬小麥面積總體的均方根誤差值Table 2 Root Mean Squared Error (RMSE) of winter wheat area population extrapolation using three sampling methods under different spatial autocorrelation intensity
樣本容量是反映抽樣調查費用高低的一個重要指標。為分析指定抽樣誤差下空間相關性對冬小麥面積抽樣外推總體所需樣本量的影響,以10%和5%的相對允許誤差γ為例,各種抽樣方法外推研究區冬小麥面積總體所需樣本容量隨空間自相關強度的變化情況如圖6所示。需要說明的是,由于系統抽樣使用的樣本容量與簡單隨機抽樣相同,因此,本研究僅選取簡單隨機和分層抽樣2種方法進行樣本容量計算。由圖6可知,對于簡單隨機抽樣,無論相對允許誤差γ設計為5%或10%,計算所需樣本容量均隨空間自相關強度的降低而減小。當I由0.75降至0.65(對應的抽樣單元尺度由500 m 增至3 000 m)時,利用簡單隨機抽樣外推冬小麥面積總體所需樣本容量減小速度較大(當γ為10%,樣本容量由189降至80;γ為5%時,樣本容量由660降至122);而當I由0.65降至0.50(對應的抽樣單元尺度由3 000 m 增至5 000 m)時,簡單隨機抽樣外推冬小麥總體所需樣本容量的減小速度趨于平緩(當γ為10%,樣本容量由80降至57;γ為5%時,樣本容量由122降至56)。這說明空間自相關強度對簡單隨機抽樣外推研究區冬小麥面積總體所需樣本容量有顯著影響。相比于簡單隨機抽樣,利用分層抽樣外推冬小麥總體所需樣本容量并未隨空間自相關強度的減小而呈現明顯的增加或減小趨勢,而是維持在一個較小的變化區間。當γ為10%,分層抽樣外推冬小麥總體所需樣本容量變化區間為[7, 14];γ為5%時,樣本容量變化區間為[29, 39]。這說明空間自相關強度對分層抽樣外推研究區冬小麥面積總體所需樣本容量幾乎沒有影響。由圖6可知,無論空間自相關強度和設計相對誤差處于何種水平,分層抽樣外推研究區冬小麥面積總體所需樣本容量均明顯小于簡單隨機抽樣。
樣本布局方式對空間抽樣外推冬小麥面積總體的效率(精度和費用)有重要影響。為優選適合空間自相關存在下的樣本布局方式,本研究在前述優選的2 000 m抽樣單元尺度及抽樣比為5%的前提下,利用不同類型的樣本布局方式分別進行冬小麥面積總體外推,并比較各種樣本布局方式外推總體的精度。5種樣本布局方式下抽樣外推研究區冬小麥面積總體的MRE、MCV和RMSE值如圖7所示。
5種樣本布局方式分別簡單隨機抽樣(SR)、按照抽樣單元標識碼排序的系統等距抽樣(SY1)、按照抽樣單元內冬小麥面積比由小到大順序的系統等距抽樣(SY2)、按照抽樣單元空間等距的系統抽樣(SY3)、分層隨機抽樣(ST)。由圖7可知,5種樣本布局方式中,采用簡單隨機抽樣方式(SR)進行樣本布局進而外推研究區冬小麥面積總體的MRE、MCV和RMSE值最大(其中MRE和MCV值均大于15%,RMSE值為3.26×108m2),其余按由大到小的順序依次為SY1、SY3、SY2,采用分層隨機抽樣方式(ST)外推冬小麥面積總體的MRE、MCV和RMSE值最小(MRE和MCV值均低于4%,RMSE值僅為0.11×108m2)。這說明在空間自相關顯著存在下,相對于其他樣本布局方式,采用分層隨機的樣本布局方式外推研究區冬小麥面積總體的精度和穩定性最高。
農作物面積信息是產量預測、種植結構調整及糧食政策制定的重要依據。聯合衛星遙感技術與傳統抽樣理論的空間抽樣方法為大區域尺度的農作物面積估算提供了有效手段。然而傳統抽樣方法均假設調查單元間相互獨立,而農作物的分布受各種因素影響常存在空間相關性。對于農作物分布的空間相關性特征及其對抽樣外推面積總體的精度和效率的影響,現有研究明顯不足,尚不能為空間相關性存在下的農作物面積空間抽樣方案的合理制定提供依據,進而影響了區域農作物面積抽樣外推精度和效率的進一步改善。為提高農作物面積空間抽樣方案的設計合理性和效率,本研究選取典型的中國冬小麥主產區—安徽省鳳臺縣為研究區,以冬小麥面積為研究對象,聯合衛星遙感影像、空間分析方法與抽樣統計理論,探究了抽樣單元內冬小麥面積比例的空間自相關性特征及其隨單元尺度的變化規律,分析了空間自相關性對冬小麥面積抽樣外推精度、樣本容量及樣本空間布局的影響。結果表明,抽樣單元內冬小麥面積占比呈顯著的空間自相關性,并隨單元尺度的增大而逐漸降低。抽樣外推冬小麥面積總體誤差隨空間自相關強度的減小呈先減小后增大的趨勢。當抽樣單元尺度選為2 000 m,采用分層隨機抽樣設計樣本數量、抽選方法與空間布局時,外推總體的誤差最小,穩定性最高。就樣本容量、抽選方法、空間布局及抽樣單元尺度的選擇方面而言,本研究為有空間自相關性存在下的農作物面積抽樣方案合理設計提供了一個重要依據。
空間自相關性是地理事物普遍存在的一大特性[43]。以往眾多學者對各種地理事物的空間自相關性特征進行了大量研究,并明確指出在地物的抽樣調查方案中需考慮其存在的空間自相關性。但是現有研究主要集中在生態[44]、水文[45]、土壤[46]、環境[47]等領域,而就農作物空間分布相關性特征及其對抽樣外推精度和效率的影響研究則相對較少,且主要集中于空間自相關性存在下農作物面積空間抽樣方案某一要素(如抽樣單元尺度、分層標志等)的優化設計方面。如劉金福等[48]聯合GF-1衛星影像、傳統抽樣方法和空間自相關理論對福建省閩侯縣的農作物面積進行了估算,利用全局莫蘭指數I對5種抽樣單元尺度下農作物分布的空間自相關性進行了定量評價,選取1 500 m作為最優抽樣單元尺度。在分層標志的優選方面,Sun等[49]選取浙江省諸暨市為研究區,通過Landsat-8 OLI、GF-1寬幅數據(Wide Field of View, WFV)與分層抽樣方法相結合對研究區的水田面積進行了估算,研究發現,當水田分布存在空間自相關性時,相比于抽樣單元內水田面積比和耕地地塊破碎度這兩個指標,采用抽樣單元內水田分類誤差作為分層標志進行總體外推的精度最高。Wang等[37]則以玉米和水稻為研究對象,對抽樣單元內農作物分布的空間自相關特征進行了有益探索,但研究重點在于優選分層標志,以此降低層內空間自相關強度,從而使層內抽樣單元滿足相互獨立原則。上述研究僅對空間相關性存在下的農作物面積空間抽樣方案中的個別要素進行了優化設計。與上述研究不同的是,本研究通過衛星遙感影像與空間分析理論相結合,定量評價了不同抽樣單元尺度下的農作物空間自相關強度與變化規律,全面系統地分析了空間自相關性對樣本數量、空間布局及外推總體誤差的影響,在此基礎上,提出了適合空間自相關存在下的農作物面積空間抽樣方案。
為合理設計有空間自相關存在下的農作物面積空間抽樣方案,本研究以冬小麥面積為研究對象,選取安徽省鳳臺縣為研究區,通過遙感技術、空間分析與經典抽樣方法相結合,設計10種抽樣單元尺度、3種抽樣外推方法和5種樣本布局方式,就空間自相關性對農作物面積抽樣效率的影響進行了試驗研究,結果表明:
1)抽樣單元內冬小麥面積比的空間自相關強度(即全局莫蘭指數I)隨抽樣單元尺度的增大而減小,I由0.75降至0.5,但無論在何種尺度下抽樣單元內冬小麥面積比都存在顯著的空間自相關性,I的最小值所對應的顯著性檢驗指標Z得分值為7.15>Z得分值(Z0.05=1.96,P<0.05)。
2)3種抽樣方法外推冬小麥面積總體的誤差隨空間自相關強度的減小呈先減小后明顯增大的趨勢。當抽樣單元尺度為2 000 m時,無論哪種抽樣方法外推冬小麥面積總體的誤差最小(簡單隨機抽樣、系統抽樣和分層抽樣外推總體的相對誤差分別為17.94%、9.48%和1.82%)。相比于簡單隨機和系統抽樣,分層抽樣外推冬小麥面積總體的精度和穩定性最高。在10種抽樣單元尺度且對應每種尺度分別抽取10套樣本條件下,采用分層抽樣外推冬小麥面積總體的平均相對誤差(Mean Relative Error,MRE)和平均變異系數(Mean Coefficient of Variance,MCV)的均值分別為4.74%和7.89%。
3)簡單隨機抽樣外推冬小麥面積總體所需樣本容量隨空間自相關強度的降低而減小。當相對允許誤差γ設計為5%時,簡單隨機抽樣外推總體所需樣本容量隨空間自相關強度的降低從660降至56。空間自相關強度對分層抽樣外推總體所需樣本容量的影響不顯著。
4)在空間相關性強度和抽樣比相同條件下,以外推總體的MRE、MCV和均方根誤差(Root Mean Squared Error, RMSE)為評價標準,5種樣本布局方式中,采用分層隨機抽樣的樣本布局方式進行研究區冬小麥面積總體外推的誤差最小(MRE、MCV和 RMSE值分別為1.82%、3.19%和0.11×108m2)。