李若溪,周 翔,呂婷婷,陶 醉,王 錦,謝富泰
植被異質性樣區真實性檢驗的優化采樣策略
李若溪1,2,3,周 翔1※,呂婷婷1,陶 醉1,王 錦1,謝富泰1,2,3
(1. 中國科學院空天信息創新研究院,北京 100101;2. 中國科學院大學,北京 100049;3. 中國科學院大學電子電氣與通信工程學院,北京 100049)
遙感反演植被產品的真實性檢驗是推動其在農業領域應用水平提升的重要保證,其中異質性植被樣區的優化采樣設計是真實性檢驗地面測量過程中的關鍵技術。該研究以遙感影像作為先驗知識,通過K-means聚類分層選取初始樣點,利用空間模擬退火算法規劃最優采樣方案,并采用同期地面實測數據進行檢驗。研究結果表明,空間模擬退火算法在樣點與總體空間變異性的一致性、插值面的精度、插值點和實測點的相關性3個方面都明顯優于傳統采樣方案,2塊樣區優化后的采樣方案插值面與影像面的均方根誤差分別為3.102 6和2.962 7,插值點與實測點的皮爾遜相關系數分別為0.601和0.757,表明空間模擬退火算法可以為真實性檢驗地面試驗提供可靠的優化采樣策略。
遙感;算法;采樣;真實性檢驗;植被異質性樣區
農業是支撐國民經濟的一大重要產業,隨著遙感技術的快速發展,遙感數據在農用地資源調查、農作物長勢監測、農作物估產和農業氣象災害預測等領域得到廣泛應用[1]。近幾年來基于不同傳感器、不同空間尺度、不同反演算法的遙感植被產品越來越多,例如由星上自主項目-植被衛星(Project for On-Board Autonomy Vegetation,PROBA-V)、哨兵3號(Sentinel-3)衛星數據生產的空間分辨率為300 m的全球時間序列植被產品;由美國海洋大氣管理局(National Oceanic Atmospheric Administration,NOAA)氣象觀測衛星搭載的高分辨率輻射儀(Advanced Very High Resolution Radiometer,AVHRR)生產的全球公里級植被類產品;基于美國宇航局泰拉(Terra)衛星搭載的中分辨率成像光譜儀(Moderate-Resolution Imaging Spectroradiometer,MODIS)數據生產的250、500和1 000 m的全球植被產品等。這些植被產品廣泛應用于農作物熟制分布[2]、農田干旱監測[3]、農田覆蓋變化[4]、植被物候[5]等諸多研究領域,為農業生產提供了數字化、定量化和機理化的支撐[6],成為宏觀快速監測區域或全球尺度植被生長狀態的有效手段。不同的植被產品之間存在差異,差異的來源除了傳感器不同之外,還與數據的預處理、生產算法的不同有關。因此科學地評價植被產品精度及不確定性是準確使用這些數據的重要基礎。
遙感產品真實性檢驗是指通過與參考數據(相對真值)比較,獨立地評價遙感產品精度和不確定性的過程,是評價遙感產品質量、可靠性和適用性的唯一手段[7]。目前,遙感反演植被產品的真實性檢驗主要分為間接檢驗和直接檢驗兩種方法。間接檢驗是利用精度已知的同類產品作為參考對待檢驗產品進行評估的方法,該方法僅能給出待檢驗產品和參考產品間的相對準確度和不確定度。直接檢驗是利用地面測量數據對遙感產品進行檢驗和評估的方法,該方法是遙感產品真實性檢驗的主要方法。雖然真實性檢驗工作已經取得了很大的進展,但由于地表空間異質性的普遍存在[8-9],異質性地表遙感植被產品的真實性檢驗仍面臨很大的挑戰。對于中低分辨率的遙感植被產品來說,獲得像元尺度的地面觀測相對真值是真實性檢驗的核心問題。如果像元內對應地物均一,通常可以忽略異質性的影響,可將地面觀測值與待檢驗產品像元值直接比較開展精度評價。但在實際驗證工作中發現,由于作物長勢的差異以及多種地物類型的存在,中低分辨率的植被產品在像元尺度的地表通常具有空間異質性,因此需要測量大量的地面樣點,來捕捉地表的空間變異,才能代表像元范圍內植被參數的相對真值。對于高分辨率遙感植被產品而言,由于像元尺度地表內的異質性可以忽略,獲取待檢驗產品范圍內具有空間代表性的樣點是真實性檢驗的關鍵。
在異質性樣區數據采集的過程中,采樣點的隨機性或樣點數量的不足會導致不可接受的采樣誤差,從而錯誤地評估衛星產品的精度。高密度采樣可以避免采樣隨機性引起的采樣誤差[10],但需消耗大量的人力、財力。因此如何在研究范圍內確定最少樣點的最優位置,使其具有最佳的全局代表性是優化采樣策略需要解決的重要問題。目前植被類遙感產品真實性檢驗過程中常用到的樣點空間布設方法主要有:空間簡單隨機采樣、空間系統采樣、空間分層采樣和樣區內固定的正方形、交叉和樣帶采樣模式等[11]。這些采樣方法均是以植被特征狀態的空間變異是隨機的、樣本完全獨立且服從某類型的概率分布作為假設前提,而沒有考慮到植被參數的空間相關性和樣點的空間位置。而事實上不同尺度上的植被均呈現出一定的空間結構,且具有明顯的空間相關性。如果采用這些方法會導致局部樣點冗余或局部樣點不足的情況。因此許多采樣方法從單純的統計采樣發展到考慮空間相關性的采樣[12-14]。樣點的確定方法也從單純的“找點”再評估變成將評價指標作為目標函數,尋找最優解的過程。隨著采樣區域以及樣本量的增大,一些廣泛使用的高效算法也被應用到空間樣點優化中,如空間模擬退火算法[15]、神經網絡[15]、遺傳算法[16]和蟻群算法[17]等。這些智能優化算法的引入本質都是模擬一種常見的生物、物理、化學現象,不斷搜索、變異、擾動產生新解,從而實現樣本的優化組合,非常適合大樣本量的最優解的計算。
綜上,本研究以異質性植被樣區作為采樣策略設計對象,采用同期遙感影像提取的能有效反應地表植被類型及生長狀況的歸一化植被指數(Normalized Deference Vegetation Index,NDVI)[18-20]作為先驗知識,通過分層采樣生成最初的樣點布局。然后以克里金方差最小作為目標函數,通過空間模擬退火算法實現初始樣點的優化布局,并對布局方案的可靠性進行評價。以期為植被遙感產品的真實性檢驗提供可靠的精度評價,進而推動遙感植被產品更好地應用于農業研究。
本研究開展采樣策略優化的試驗樣區位于河北省北部張家口市壩上地區的沽源縣,是內蒙古高原向華北平原過渡的地帶,屬溫帶大陸性草原氣候。本研究樣區選擇的基本原則為1)植被樣區具有明顯的異質性;2)交通方便,便于實測;3)樣區空間范圍300 m×300 m。根據以上要求選出2塊具有代表性的樣區,每個樣區采樣數量均為50個。1號樣區(41°45′51.12″N~41°45′41.53″N,115°40′43.38″E~115°40′56.99″E)的植被以馬鈴薯為主,由于地面試驗日期為2018年7月29日至8月1日,正值馬鈴薯生長中后期。2號樣區(41°42′37.26″N~41°42′47.05″N,115°43′56.83″E~115°44′10.59″E)的植被以羊草為主。2塊樣區的空間位置和地表實測點的空間分布如圖1所示。
本研究選取2018年8月1日覆蓋試驗區的Sentinel-2A衛星數據來計算NDVI。首先利用歐洲空間局發布的針對哨兵衛星數據的Sen2Cor軟件對其進行大氣校正,然后利用紅波段(Sentinel-2A的第4波段)和近紅外波段(Sentinel-2A的第8波段)的反射率數據計算NDVI,計算如式(1)所示
地面測量NDVI通過美國ASD(Analytica Spectra Devices.,Inc)公司生產的便攜式地物光譜儀的測量數據計算獲取。由于ASD地物光譜儀的光譜測量范圍在350~2 500 nm之間,所以首先要根據Sentinel-2A衛星傳感器光譜響應函數對測量光譜通過卷積運算進行光譜等效,其計算如式(2)所示
本研究2塊樣區的NDVI實測點數分別為49個和78個,與遙感影像對應位置像元值的皮爾遜相關系數分別為0.85和0.89。
本研究以異質性植被區域作為對象開展采樣策略優化設計,主要步驟包括1)將基于遙感影像的NDVI產品作為先驗知識引入采樣設計。2)基于選定的先驗知識,采用變異函數和NDVI頻率分布直方圖開展樣區異質性評價,實現空間分層采樣。3)在分層采樣確定的初始樣點的基礎上使用空間模擬退火(Spatial Simulated Annealing,SSA)算法,以平均克里金方差最小作為目標函數實現樣點的布局優化。4)建立不同采樣數量與預測誤差之間的關系,在考慮采樣成本的情況下確定合理采樣數量。5)從樣點與總體空間變異性的一致性、預測面的精度、插值和實測值的相關性三個方面對采樣策略進行評價。具體的技術路線如圖2所示。
1.2.1 樣區空間異質性評價
1)變異函數法

式中為距離間隔,m;()為處的區域化變量,(+)為+處的區域化變量,該區域變化量在本研究中為像元的NDVI;()為間隔距離的個數。

式中為變程,m;0為塊金值;為擬合變異曲線穩定時的函數值;0+為擬合變異曲線基臺值。塊金值為間隔為0時的變異函數值,代表了一種由非采樣間隔所造成的變異,理論為0,但是由于測量誤差的存在或者觀測尺度大于空間變異的細微尺度時,塊金值就不為0。變程為半變異函數曲線首次呈現水平狀態的距離,描述的區域變量具備空間關聯的范圍。在變程值以內區域變量具有空間相關性,而在變程值以外這種相關性就會消失。基臺值為變異函數的極大值,代表區域變量總的變異程度。塊金和基臺的比值,又稱基底效應,可以用來說明空間的變異特征。該值越大說明空間變異更多是由于隨機成分引起,否則是由特定地理過程或多個過程綜合引起的。
2)數據正態分布檢驗
應用克里金方法的一個重要前提是樣本數據必須符合正態分布[23],否則會對變異函數的擬合產生影響。本研究選用柯爾莫可洛夫-斯米洛夫(Kolmogorov-Smirnov,K-S)檢驗方法對樣區數據進行正態分布檢驗,計算如式(6)所示
1.2.2 樣區分層
本研究首先基于樣區NDVI數據,通過分層采樣方法確定最初的樣點布局,為之后的優化提供初始輸入。其中分層方法采用K-means聚類分層。分層層數采用聚類評價指標(Calinski-Harabasz,CH)來確定。該指數表征類內緊密度和類間分離度,值越大代表類自身越緊密,類與類之間越分散,計算如式(7)所示
1.2.3 基于地統計學的優化采樣策略
本研究在利用變異函數描述區域變量空間變異規律的基礎上構建目標函數,通過優化組合算法實現目標函數的最優值,從而確定最優采樣點的空間位置。
1)目標函數的建立
本研究選擇克里金方差最小作為優化算法的目標函數。克里金法是一種典型的地統計方法[24],其不僅考慮了各樣本數據的空間相關性,而且在給出估計的屬性值的同時,還能給出表示估計誤差的方差。待估算點的屬性值的計算如式(8)所示


2)空間最優組合算法
模擬退火算法是一種隨機計算基數,可以有效避免局部最優的算法[25],因此空間模擬退火算法對于處理組合優化問題有其顯著的優勢,被廣泛應用到空間統計[26]和地統計分析中[27]。目前有些研究利用模擬退火算法進行植被樣區的優化采樣[28-30],研究結果表明采用模擬退火優化后的采樣方案比簡單的隨機抽樣和系統抽樣更能代表整個植被研究區特征[31]。其基本步驟如下:
步驟1:設置初始溫度(0,℃)和循環次數。
步驟3:步驟2循環次后,利用降溫系數不斷降低溫度,當溫度低于設定截止溫度時,充分迭代收斂,實現目標樣點的最優布局。
1.2.4 評價方法
本研究中評價采樣精度采用的統計分析指標為均方根誤差(Root Mean Square Error,RMSE)和平均絕對誤差(Mean Absolute Error,MAE),計算如式(12)和式(13)所示:
NDVI對植被的生長狀態和空間分布密度反映敏感,常用來評價植被地表的空間異質性[32-33]。因此通過最優模型擬合樣區NDVI的半方差函數與步距的變異曲線,可以定量分析該區域植被的異質性特征。
對樣區NDVI進行變異函數分析之前需要確保樣區數據的正態分布,因此本研究分別對2塊樣區繪制了頻率分布圖并開展了K-S檢驗。1號樣區NDVI整體分布范圍為0.45~0.88,平均值為0.68,高頻集中在0.6~0.7之間,偏度較小,峰度平緩,其K-S檢驗的>0.05,因此整體符合正態分布。2號樣區NDVI整體分布范圍為0.43~0.86,平均值為0.63,高頻集中在0.55附近,正向偏移程度較大,其K-S檢驗的<0.05,不滿足正態分布假設,因此本研究對其進行了對數正態轉換處理。
對2塊樣區的NDVI變量分別采用球狀模型、高斯模型方法擬合后得到的特征參數如表1所示,用來描述區域化變量的變異程度。塊基比表示隨機因素引起的NDVI空間變異,由表1可知,2塊樣區的塊基比(即隨機因素引起的空間變異占比)分別為0.182和0.244。隨機因素和空間結構共同影響著空間變異,即二者相加為1,因此空間結構引起的空間變異占比分別為0.818和0.756。2塊樣區的變程值分別為143.7 m和112.9 m,說明大于該距離的NDVI變量將不存在空間自相關性。

表1 樣區空間異質性的特征參數
分層采樣是將樣本總體按照某種屬性分為若干層,然后在各個層內抽取樣本點。研究表明通過合理分層抽取出的樣點更具有代表性,能夠有效提高采樣精度[34]。本研究利用CH指標評價聚類結果得出2塊樣區最佳分類數均為3層,然后對每一個樣區進行K-means聚類分層。在樣本數量固定的情況下,每一層的樣本數量通過該層像元數占總像元數的比例來確定,每一層樣點的空間位置通過隨機采樣的方法來確定。
基于分層的空間采樣不能達到全局最優,因此本研究繼續在分層采樣的基礎上使用SSA算法,通過平均克里金方差最小準則[35-40]實現樣點的最優布局。SSA算法存在一個很大的問題在于最優解的產生依賴于模型初始參數。為研究各參數設置對采樣結果的影響,本研究以克里金方差最小化為準則,通過模擬試驗研究不同參數設置對采樣精度的影響。結果得出降溫系數對采樣結果的影響最大,經反復驗證本研究將SSA算法的初始溫度設置為5 000 ℃,降溫系數為0.999。另外,狀態的搜索、跳轉策略直接影響著算法的性能。擾動采樣是經典蒙特卡羅和網格結構采樣的混合[41],因此本研究在SSA算法內循環中設置了擾動邊界,使狀態轉換在邊界范圍內進行,逐點抖動,同時將每次迭代后的當前最優解作為下一次抖動的起點。此外,接受惡化的概率直接影響算法惡化的程度,本研究接受惡化的初始概率被設置為0.2,并隨著迭代的進行呈指數下降。當標準在超過2 000次迭代后沒有改進,或迭代次數超過20 000次,SSA算法過程被停止。這意味著采樣點從分層采樣確定的初始位置在不斷地組合變化,最終得到了使克里金方差為最小的最優解。1號樣區采樣50個點時SSA算法迭代次數和克里金方差的關系如圖3所示。
在實際采樣過程中不存在絕對最優的樣本容量,只能在權衡真實性檢驗過程中采樣精度與采樣成本后確定合理的采樣數量。統計采樣中通常采用Cochran公式[42]計算給定置信區間和一定誤差要求下的最佳采樣數量,例如,本研究2塊樣區在95%置信水平,5%總體相對誤差條件下,最少采樣個數分別為24個(1號樣區)和22個(2號樣區)。但Cochran公式[42]沒有考慮實地樣區植被空間變異情況,可能會造成不可接受的預測誤差和不確定性。本研究利用SSA算法、分層采樣和隨機采樣的方法,選取10~500之間的樣點個數,通過建立不同采樣數量與克里金預測誤差之間的關系(圖4),在考慮采樣成本的情況下確定合理采樣數量。由圖4可以判斷出不同采樣數量對預測誤差影響較大,隨著樣點數量的增加,克里金預測誤差逐漸降低,不同采樣方法的差距也逐漸縮小。當樣點數量足夠大時,不同采樣方法得到的預測誤差同時趨于收斂。由圖4可知,SSA算法的優勢在于:1)預測精度明顯提高。SSA算法優化后的采樣點克里金方差比傳統采樣點誤差降低了3~4個數量級。在相同采樣數量的條件下,2塊樣區隨機采樣得到的預測誤差平均是SSA算法的6.4倍和8.1倍,分層采樣得到的預測誤差平均是SSA算法的3.6倍和2.6倍,說明SSA算法在不同采樣數量下均有穩定的優勢,能夠給真實性檢驗的提供可靠的代表性強的采樣方案。2)采樣數量明顯減少。在相同預測精度的條件下,2塊樣區隨機采樣所需的采樣數量約是SSA算法的10倍,分層采樣所需的樣點數量約是SSA算法的6倍和4.25倍,表明空間模擬退火算法可以在保證精度的情況下,有效地減少真實性檢驗實地測量的采樣成本。3)優化速度明顯提高,受采樣數影響明顯減小。隨機采樣和分層采樣的預測方差隨采樣個數增加急速下降,直至100個樣本量時出現下降拐點,下降速度變緩。此過程說明隨機采樣和分層采樣的結果受樣本量影響較大,即采樣結果依賴于樣本量的合理性,采樣精度受采樣成本的制約更強。由于SSA算法具有突出的尋找最優解的優勢,因此在樣本量較少時,也能找到較低預測誤差的采樣組合,相比之下,對樣本量或者采樣成本的依賴明顯減小。基于上述SSA算法的優勢確定,綜合考慮置信水平、真實性檢驗的精度要求、樣區范圍大小以及采樣成本,總樣本量被設置為50個。
本研究對目前常用的隨機采樣、系統采樣、閾值分割采樣與本研究提出的基于先驗知識的SSA算法采樣策略進行比較,并從三個方面開展采樣精度評價來證明SSA算法采樣方案的可靠性和高效性。不同方案的樣點布局如圖5所示。

圖5 采樣點布設方案
2.5.1 基于空間異質性的樣點精度評價
基于地統計評價樣本點代表性,采樣點變異函數與總體變異函數的偏差可以表征樣本點模擬抽樣總體的能力。與傳統采樣點相比,基于SSA算法優化后的采樣點擬合的變異函數與總體變異函數特征值更接近(圖6),2塊樣區的變程分別為143.7 m和111.9 m,SSA插值面的變程分別為150.9 m和112.9 m,平均變程偏差為3%,而隨機采樣、系統采樣和閾值分割采樣的插值面平均變程偏差分別為14%、13%和9%,由此可知,SSA插值面的變程偏差明顯減小;2塊樣區的基臺值分別為0.007 5和0.003 8,SSA插值面的基臺值分別為0.006 0和0.005 2,平均基臺值偏差為28%,而隨機采樣、系統采樣和閾值分割采樣的插值面平均基臺值偏差分別為63%、30%和35%,由此可知,SSA插值面的基臺值偏差明顯減小。在一定程度上反映出SSA算法優化后的采樣點對抽樣總體的模擬能力更好,即在樣點本身與總體的關系上證明了SSA算法采樣點的代表性。

2.5.2 基于克里金插值面的樣點精度評價
基于地質統計學模型的采樣通常選擇克里金方差最小作為最佳樣本的選擇標準[43]。插值表面的整體克里金方差可以用來說明插值表面生成的精度,其與樣本點的布局息息相關,可以有效規范采樣點在空間的合理布局[10]。克里金預測誤差表征采樣代表性,以遙感影像為基準選出的樣點預測面與影像面相關性越高,預測誤差越小,平均絕對誤差越小,代表性越高。基于克里金插值結果的分析從采樣點克里金方差、插值面預測誤差和預測相關性3個方面評價,評價結果如表3所示。由克里金方差可知,2塊樣區基于SSA優化后的采樣方案克里金方差分別為0.000 6和0.000 8,明顯低于其他采樣方案,說明SSA算法采樣能充分迭代尋找最佳擬合的采樣點,在一定程度上反映了SSA采樣策略的可靠性。采樣點克里金插值面與影像面的RMSE和皮爾遜相關系數表征采樣點對影像的代表性,即模擬還原相對真實地表的能力。2塊樣區基于SSA采樣方案的插值面與影像面的RMSE分別為3.102 6和2.962 7,皮爾遜相關系數分別為0.45和0.73,與其他3種采樣方案相比,RMSE最小且皮爾遜相關系數最高。與隨機采樣、系統采樣和閾值分割采樣相比,SSA采樣方案的插值面與影像面的RMSE分別減少了11%、5%和6%,皮爾遜相關系數分別提高了29%、30%和6%,在一定程度上肯定了采樣點的可靠性和代表性。

表3 不同采樣方案的克里金插值面精度評價
2.5.3 基于實測數據的樣點精度評價
基于實測數據的評價以實測點及其對應位置的基于采樣點的插值面為對象,從相關性和MAE兩個方面進行采樣策略精度評價(表4)。4種采樣方案的實測點與插值點的MAE均大于影像點與插值點的MAE,符合地面驗證的精度要求,說明對比結果是有效的。2塊樣區基于SSA采樣方案的插值點與實測點的皮爾遜相關系數分別為0.601和0.757,均高于其他3種采樣方案;實測點與插值點的MAE分別為0.070 1和0.058 4,影像點與插值點的MAE分別為0.056 8和0.044 1,均低于其他3種采樣方案。與隨機采樣、系統采樣和閾值分割采樣相比,SSA采樣方案的實測點與插值點皮爾遜相關系數分別提高了0.23,0.14和0.07,MAE分別降低了18%、17%和20%,SSA明顯優于傳統采樣方案。

表4 基于實測樣點的采樣方案評價
以減少采樣費用、提高采樣效率和精度為目標,本研究針對植被遙感產品真實性檢驗中異質性樣區的采樣提出了一種基于先驗知識的、以克里金方差最小作為目標函數的空間模擬退火(Spatial Simulated Annealing,SSA)算法優化采樣策略,并在試驗樣區進行了驗證。結果表明,由于傳統采樣方法沒有考慮異質性地表的空間自相關性,空間采樣不能達到全局最優。本研究提出的結合地統計學和空間模擬退火算法的采樣策略能夠在保證采樣精度的條件下,在2塊樣區中分別選取最具空間代表性的50個樣點,試驗表明可以為真實性檢驗地面試驗提供可靠高效的優化采樣策略。具體結果如下:
1)從變異函數的特征值來看,本研究方法得到的采樣點對抽樣總體的模擬能力更好;
2)從克里金插值的角度來看,本研究方法得到的優化采樣點的克里金方差比傳統采樣點誤差降低了3~4個數量級。2塊樣區基于SSA采樣方案的插值面與影像面的均方根誤差分別為3.102 6和2.962 7,皮爾遜相關系數分別為0.45和0.73,與其他3種采樣方案相比,均方根誤差最小且皮爾遜相關系數最高。相比隨機采樣、系統采樣和閾值分割采樣,SSA采樣方案的插值面與影像面的相關性分別提高了29%、30%和6%。
3)從實測數據檢驗的角度,2塊樣區基于SSA采樣方案的插值點與實測點的皮爾遜相關系數分別為0.601和0.757,實測點與插值點的平均絕對誤差分別為0.070 1和0.058 4。相比隨機采樣、系統采樣和閾值分割采樣,基于SSA采樣方案生成的插值點與實測點皮爾遜相關系數平均提高了0.23、0.14和0.07。
本研究空間模擬退火算法的僅僅是針對單一目標優化,而在實際采樣過程中影響采樣工作的要素有很多,比如不同作物類型的種植結構導致的樣點通達性都是影響采樣效率的重要因素。在今后的研究工作中將引入這些要素,實現多目標優化,建立更為精細和實用的采樣策略。
[1]姚云軍,秦其明,張自力,等. 高光譜技術在農業遙感中的應用研究進展[J]. 農業工程學報,2008,24(7):301-306.
Yao Yunjun, Qin Qiming, Zhang Zili, et al. Research progress of hyperspectral technology applied in agricultural remote sensing[J]. Transactions of the Chinese Society of Agricultural Engineering (Transactions of the CSAE), 2008, 24(7): 301-306. (in Chinese with English abstract)
[2]楊婷. 基于時間序列NDVI數據的中國熟制分布的變化研究[D]. 長春:東北師范大學,2014.
Yang Ting. Study on the change of maturity distribution in china based on time series NDVI data[D]. Changchun: Northeast Normal University, 2014. (in Chinese with English abstract)
[3]吳楊潔. 基于SPOT和NOAA數據的河北省干旱遙感監測研究[D]. 石家莊:河北師范大學,2012.
Wu Yangjie. Remote sensing monitoring of drought in Hebei Province based on SPOT and NOAA data[D]. Shijiazhuang: Hebei Normal University, 2012. (in Chinese with English abstract)
[4]張超. 1960—2015年內蒙古氣候診斷及其與農田覆蓋變化相互關系[J]. 中國農學通報,2016,32(32):124-130.
Zhang Chao. Climate diagnosis and its relationship with farmland cover change in Inner Mongolia from 1960 to 2015[J]. China Agronomic Bulletin, 2016, 32(32): 124-130. (in Chinese with English abstract)
[5]劉玲玲,劉良云,胡勇. 基于AVHRR和MODIS數據的全球植被物候比較分析[J]. 遙感技術與應用,2012,27(5):754-762.
Liu Lingling, Liu Liangyun, Hu Yong. Comparative analysis of global vegetation phenology based on AVHRR and MODIS data[J]. Remote Sensing Technology and Application, 2012, 27(5): 754-762. (in Chinese with English abstract)
[6]邢素麗,張廣錄. 我國農業遙感的應用現狀與展望[J]. 農業工程學報,2003,19(6):174-178.
Xing Suli, Zhang Guanglu. Application status and prospect of agricultural remote sensing in China[J]. Transactions of the Chinese Society of Agricultural Engineering (Transactions of the CSAE), 2003, 19(6): 174-178. (in Chinese with English abstract)
[7]晉銳,冉有華,柳欽火,等. 陸地定量遙感產品的真實性檢驗關鍵技術與試驗驗證[J]. 地球科學進展,2017,32(6):630-642.
Jin Rui, Ran Youhua, Liu Qinhuo, et al. Key methods and experiment verification for the validation of quantitative remote sensing products[J]. Advances in Earth Science, 2017, 32(6): 630-642. (in Chinese with English abstract)
[8]李新. 陸地表層系統模擬和觀測的不確定性及其控制[J]. 中國科學:地球科學版,2013,43(11):1735-1742
Li Xin. Characterization, controlling, and reduction of uncertainties in the modeling and observation of land-surface systems[J]. Science China: Earth Sciences Edition, 2013, 43(11): 1735-1742. (in Chinese with English abstract)
[9]張仁華,田靜,李召良,等. 定量遙感產品真實性檢驗的基礎與方法[J]. 中國科學:地球科學版,2010,40(2):211-222.
Zhang Renhua, Tian Jing, Li Zhaoliang, et al. Principles and methods for the validation of quantitative remote sensing products[J]. Science China: Earth Sciences Edition, 2010, 40(2): 211-222. (in Chinese with English abstract)
[10]Crow W T, Berg A A, Cosh M H, et al. Upscaling sparse ground-based soil moisture observations for the validation of coarse-resolution satellite soil moisture products[J]. Reviews of Geophysics, 2012, 50(2): 372-392.
[11]丁艷玲. 植被覆蓋度遙感估算及其真實性檢驗研究[D]. 長春:中國科學院東北地理與農業生態研究所,2015.
Ding Yanling. Remote Sensing Estimation of Vegetation Coverage and Its Authenticity Test[D]. Changchun: Northeast Institute of Geography and Agricultural, Chinese Academy of Sciences, 2015. (in Chinese with English abstract)
[12]Atkinson P M. Optimal ground-based sampling for remote sensing investigation: Estimating the regional mean[J]. International Journal of Remote Sensing, 1991, 12(3): 559-567.
[13]Griffith D A, Haining R, Arbia G. Heterogeneity of attribute sampling error in spatial datasets[J]. Geographical Analysis, 1994, 26(4): 300-320.
[14]Stehman S S, Sohl T L, Loveland T R. Statistical sampling to characterize recent United States land cover change[J]. Remote Sensing of Environment, 2003, 86(4): 517-529.
[15]韓宗偉,黃魏,羅云,等. 基于路網的土壤采樣布局優化—模擬退火神經網絡算法[J]. 應用生態學報,2015,26(3):891-900.
Han Zongwei, Huang Wei, Luo Yun, et al. Application of simulated annealing method and neural network on optimizing soil sampling schemes based on road distribution[J]. Chinese Journal of Applied Ecology, 2015, 26(3): 891-900. (in Chinese with English abstract)
[16]吳宗書,艾矯燕,李修華,等. 基于智能算法的礦區土壤修復采樣優化[J]. 環境工程學報,2016,10(10):5995-6000.
Wu Zongshu, Ai Jiaoyan, Li Xiuhua, et al. Sampling optimization in mine soil remediation based on intelligent algorithm[J]. Chinese Journal of Environmental Engineering, 2016, 10(10): 5995-6000. (in Chinese with English abstract)
[17]陳偉杰. 土壤特性的優化采樣策略及空間離群樣點檢測算法研究[D]. 哈爾濱:東北農業大學,2019.
Chen Weijie. Research on the Sampling Strategies for Soil Properties and a Method for Spatial Local Outlier Detection[D]. Harbin: Northeast Agricultural University, 2019. (in Chinese with English abstract)
[18]Liang S L. Quantitative Remote Sensing of Land Surfaces[M]. New Jersey: John Wiley & Sons, 2003.
[19]趙英時. 遙感應用分析原理與方法[M]. 北京:科學出版社,2003.
[20]曾也魯,李靜,柳欽火,等. 基于NDVI先驗知識的LAI地面采樣方法[J]. 遙感學報,2013,17(1):107-121.
Zeng Yelu, Li Jing, Liu Qinhuo, et al. A sampling strategy based on NDVI prior knowledge for LAI ground measurements[J]. Journal of Remote Sensing, 2013, 17(1): 107-121. (in Chinese with English abstract)
[21]Li H, Reynolds J F. On definition and quantification of heterogeneity[J]. Oikos, 1995, 73(2): 280-284.
[22]Matheron G. Principles of geostatistics[J]. Economic Geology, 1963, 58(8): 1246-1266.
[23]Krige D G, Magri E J. Geostatistical case studies of the advantages of lognormal-de Wijsian kriging with mean for a base metal mine and a gold mine[J]. Journal of the International Association for Mathematical Geology, 1982, 14(6): 547-555.
[24]Laslett G M, McBratney A B, Pahl P J. Comparison of several spatial prediction methods for soil pH[J]. European Journal of Soil Science, 1987, 38(2): 325-341.
[25]Metropolis N, Rosenbluth A W, Rosenbluth M N. Equation of state calculations by fast computing machines[J]. Journal of Chemical Physics, 1953, 56(21): 1087-1092.
[26]Geman S, Geman D. Stochastic relaxation, Gibbs distributions, and the Bayesian restoration of images[J]. IEEE Transactions on Pattern Analysis and Machine Intelligence, 1984, 6(6): 721-741.
[27]Guedes L P C, Uribe-Opazo M A, Ribeiro J P J. Optimization of sample design sizes and shapes for regionalized variables using simulated annealing[J]. Ciencia e Investigacion Agraria, 2014, 41(1): 33-47.
[28]Vandita S, Alfred S, David G R, et al. Simulated annealing with variogram-based optimization to quantify spatial patterns of trees extracted from high-resolution images[J]. IEEE Geoscience and Remote Sensing Letters, 2016, 13(8): 1084-1088.
[29]雷秀強. 龍泉山脈中段植被葉綠素含量估算模型研究[D]. 成都:成都理工大學,2019.
Lei Xiuqiang. Study on Estimation Model of Vegetation Chlorophyll Content in Middle Longquan Mountains[D]. Chengdu: Chengdu University of Technology, 2019. (in Chinese with English abstract)
[30]范德芹,朱文泉,潘耀忠,等. 青藏高原小嵩草高寒草甸返青期遙感識別方法篩選[J]. 遙感學報,2014,18(5):1117-1127.
Fan Deqin, Zhu Wenquan, Pan Yaozhong, et al. Screening of remote sensing identification methods for Kobresia alpine meadow in Qinghai Tibet Plateau[J]. Journal of Remote Sensing, 2014, 18(5): 1117-1127. (in Chinese with English abstract)
[31]李佳燕. 基于模擬退火算法的礦區復墾土壤監測樣點布設研究[D]. 北京:中國地質大學,2019.
Li Jiayan. Optimal Sampling Design for Reclaimed Soil Monitoring in Mining Area Based on Simulated Annealing[D]. Beijing: China University of Geosciences, 2019. (in Chinese with English abstract)
[32]Ding Y L, Zhao K, Zheng X M, et al. Temporal dynamics of spatial heterogeneity over cropland quantified by time-series NDVI, near infrared and red reflectance of Landsat 8 OLI imagery[J]. International Journal of Applied Earth Observation, 2014, 30(1): 139-145.
[33]Wen Z F, Zhang C, Zhang S Q, et al. Effects of normalized difference vegetation index and related wavebands' characteristics detecting spatial heterogeneity using variogram-based analysis[J]. Chinese Geographic Sciences, 2012, 22(2): 188-195.
[34]Gallego F J. Stratified sampling of satellite images with a systematic grid of points[J]. ISPRS Journal of Photogrammetryand Remote Sensing, 2005, 59(6): 369-376.
[35]Filho C F F C, Albuquerque A T D, Costa M G F. Luminance optimization in closed environments by simulated annealing[J]. IEEE Latin America Transactions, 2008, 8(3): 229-235.
[36]Guedes L P C, Ribeiro P J, Piedade S. Optimization of spatial sample configurations using hybrid genetic algorithm and simulated annealing[J]. Chilean Journal of Statistics, 2011, 2(2): 39-50.
[37]Ruiz-Cárdenas R, Ferreira M A R, Schmidt A M. Stochastic search algorithms for optimal design of monitoring networks[J]. Environmetrics, 2010, 21(1): 102-112.
[38]Xiao X Y, Gertner G, Wang G X, et al. Optimal sampling scheme for estimation landscape mapping of vegetation cover[J]. Landscape Ecology, 2005, 20(4): 375-387.
[39]Groenigen J W V, Stein A. Constrained optimization of spatial sampling using continuous simulated annealing[J]. Journal of Environment Quality, 1998. 27(5): 1078-1086.
[40]Pausinger F, Rachh M, Steinerberger S. Optimal jittered sampling for two points in the unit square[J]. Statistics and Probability Letters, 2018, 132(1): 55-61.
[41]Rodeghiero M, Cescatti A. Spatial variability and optimal sampling strategy of soil respiration[J]. Forest Ecology and Management, 2008, 255(1): 106-112.
[42]Ge Y, Wang J H, Heuvelink G B M, et al. Sampling design optimization of a wireless sensor network for monitoring ecohydrological processes in the Babao River Basin, China[J]. International Journal of Geographical Information Science, 2015, 29(1): 92-110.
[43]Cochran W G. Sampling Techniques[M]. New Jersey: John Wiley & Sons, 1977.
Optimal sampling strategy for authenticity test in heterogeneous vegetated areas
Li Ruoxi1,2,3, Zhou Xiang1※, Lyu Tingting1, Tao Zui1, Wang Jin1, Xie Futai1,2,3
(1.,,100101,; 2.,100049,;3.,,,100049,)
With the rapid development of remote sensing technology, large-scale and high timeliness satellite products provide digital, quantitative, and mechanistic support for agricultural production. To evaluate the accuracy and uncertainty of vegetation products retrieved by remote sensing better, the sampling design is very important in the process of ground measurement experiment for validation in heterogeneous vegetated areas. In this study, the remote sensing image was regarded as the prior knowledge, the initial sampling points were selected by the K-means algorithm, and the optimal sampling scheme was planned by Spatial Simulated Annealing (SSA) algorithm. Then, the research scheme was verified by the field data of the same period. Based on the prior knowledge and geostatistics theory, it provided a strong theory for the sampling scheme. The essence of spatial simulated annealing algorithm is to search randomly, transfer state, accept (or discard) new solutions before the cooling cut-off, to find the optimal combination. By constantly jittering the new sampling combination, it jumped out of the local optimal solution, avoided the randomness of sampling, and could find more satisfaction. It meant that the initial positions of sampling points determined by stratified sampling were constantly combined and changed. Finally, the optimal combination that minimizes Kriging variance was obtained. Compared with other sampling schemes, it could be concluded that the SSA had stable advantages on different sampling numbers, the sampling accuracy was less affected by the number of samples, and the sampling combination with lower prediction error could also be found when the sample numbers were small. Under the condition of ensuring the sampling accuracy, the sampling quantity was obviously less than the traditional sampling scheme, which effectively reduced the sampling cost. The representativeness and accuracy of sampling points were evaluated by the relationship between sampling points and population, the scale of the trend surface and the real surface sample site. From the aspect of geostatistics, the sampling points obtained by SSA had better simulation ability to the sample population; From the aspect of Kriging interpolation, the Kriging variance of the sampling points optimized by SSA was 3-4 orders of magnitude higher than that of the traditional sampling points. The root mean square error between the interpolation surface and the image surface of the two sample areas based on the SSA algorithm was 3.102 6 and 2.962 7, respectively, and the Pearson correlation coefficient was 0.45 and 0.73, respectively. Compared with the other three sampling methods, the result of SSA was the smallest root mean square error and the highest Pearson correlation coefficient. Compared with random sampling, systematic sampling, and threshold segmentation sampling, the correlation between interpolation surface and image surface based on SSA improved by 29%, 30%, and 6%, respectively; the Pearson correlation coefficients of the interpolation points based on SSA and the measured points were 0.601 and 0.757, respectively, which were higher than those of the other three sampling methods. Compared with random sampling, systematic sampling, and threshold segmentation sampling, the correlation coefficients of interpolation points and measured points based on SSA increased by 0.23, 0.14, and 0.07 on average. It was proved that SSA could provide a reliable and optimized sampling strategy for the ground experiment of validation.
remote sensing; algorithm; sampling; authenticity test; heterogeneous vegetated areas
李若溪,周翔,呂婷婷,等. 植被異質性樣區真實性檢驗的優化采樣策略[J]. 農業工程學報,2021,37(8):177-186.doi:10.11975/j.issn.1002-6819.2021.08.020 http://www.tcsae.org
Li Ruoxi, Zhou Xiang, Lyu Tingting, et al. Optimal sampling strategy for authenticity test in heterogeneous vegetated areas[J]. Transactions of the Chinese Society of Agricultural Engineering (Transactions of the CSAE), 2021, 37(8): 177-186. (in Chinese with English abstract) doi:10.11975/j.issn.1002-6819.2021.08.020 http://www.tcsae.org
2020-09-25
2020-11-18
國家重點研發計劃項目(2018YFE0124200)
李若溪,研究方向為遙感陸表產品真實性檢驗。Email:liruoxi19@mails.ucas.ac.cn
周翔,研究員,研究方向為遙感真實性檢驗。Email:zhouxiang@radi.ac.cn
10.11975/j.issn.1002-6819.2021.08.020
TP79
A
1002-6819(2021)-08-0177-10