黃宇杰
(貴州省農業區域經濟發展中心, 貴州 貴陽 550001)
農業資源是農業自然資源和農業經濟資源的總稱。長期以來,我國農業資源存在數據分散、“家底”不清、變化不察、質量不明等問題,嚴重影響其科學管理和有效利用。推進重要農業資源臺賬制度建設,是摸清現代農業發展資源底數、夯實農業資源管理基礎的重要抓手,是服務鄉村振興戰略、科學指導農業農村發展的重要依據。為加快推進貴州重要農業資源臺賬制度建設,貴州省農業農村廳于2017年開始重要農業資源臺賬制度的試點工作。針對農作物種植情況,組織地面調查可以獲得準確的結果,但是地面調查所需的時間長、成本高,區域覆蓋難以根據季節和農作物的生產周期進行動態安排。近年來,高空間、時間和光譜分辨率遙感技術的發展,為監測農業資源提供了技術支撐。遙感手段中,多光譜衛星覆蓋面積大,重返周期短,數據獲取成本低。但作為一種通用目的的遙感手段,使用多光譜影像對農作物進行識別富有挑戰性。通常而言,多光譜衛星只記錄一個近紅外波段的信息,難以反映農作物之間,甚至農作物同其他植被之間光譜特征的差異。就空間分辨率來說,即使是亞米級0.5 m的水平,也很難有效記錄農作物本身的外形特征,獲得的信息主要還是記錄農作物的種植方式或農田的紋理,由于這些特征多不具備特異性,需要綜合利用。為構建農業資源監測體系,實現農業資源的大范圍動態監測,以多光譜光學衛星遙感和地面調查相結合的方式對貴州省部分重要農作物的種植情況進行評估,在綜合多光譜光學遙感影像和地面調查矢量數據的基礎上,創建一套適合貴州特定區域主要農作物(油菜、玉米、水稻、茶葉、烤煙)信息提取的影像解譯方案,并在特定解譯方案下對各類主要農作物的影像特征統計量化,最終形成特定區域內主要農作物的影像特征樣本庫,進而達到直接利用多光譜遙感影像提取主要農作物種植情況信息的目的。為多光譜光學遙感影像在農業資源監測上的應用提供參考,現將其在貴州農業資源監測上的應用效果報道如下。
油菜、玉米、水稻、烤煙、茶葉目標農作物生產的地理分布,選擇鳳岡縣、湄潭縣、安龍縣、平塘縣和松桃縣的部分鎮作為試點區域,多光譜遙感影像見表1,農田矢量數據見表2。

表1 多光譜遙感影像概述

表2 農田矢量數據概述
在已知農業生產用地分布及特定時間農作物種植情況的基礎上,利用多光譜遙感影像提取影像特征,通過機器學習,尋找同目標農作物擬合最佳的模型及參數。通過對更大范圍的影像進行解譯工作,驗證各類農作物影像特征的準確率。由于受到光譜分辨率、空間分辨率和異源數據兼容性方面因素的影響,選擇使用人工判讀同自動解譯相結合的方式,在一定程度上實現對目標農作物的自動解譯。
1.2.1 遙感影像預處理 為使用反射率值以突出地表對象的反射光譜特性,修正大氣和太陽因素對不同區域反射率值的影響,修正相對高程差異帶來的幾何畸變,匹配地面調查矢量數據,使用L1A級遙感影像產品進行輻射定標、大氣校正、正射校正、圖像融合、幾何校正等預處理。
1.2.2 人工判讀 由于地面調查組織和衛星有效覆蓋之間的差異,使用的矢量數據同遙感影像并不完全兼容,需要人工判讀修正。由于農作物在多光譜影像上的視覺差異不明顯,人工判讀要根據主觀確定性,從高到低依次對各目標對象進行標注。如水田和玉米的特征比較明顯,首先,對對象進行標注,排除這些對象后,其他對象會變得明顯;其次,對于圖像特征較難區分的對象,優先選擇其特征清楚的部分進行標注,對于余下仍然難以區分的部分將其歸入一個特定的組別,或直接略過不進行處理。人工判斷時安排盡可能平均的概率,從各目標農作物及其對照組中隨機抽取一定數量的矢量圖框并結合遙感影像進行分類和標注。
1.2.3 基于超像素對象的遙感影像描述 不同于中低分辨率衛星影像一個像素即覆蓋較大區域或覆蓋一個或多個對象的情況,米級/亞米級衛星影像的一個像素往往只是記錄一個對象的結構或紋理等細節的一部分。如在0.5 m的空間分辨率下,單個像素覆蓋的面積(0.25 m2)遠小于農田的面積,只能反映農田局部的信息,這個尺度略大于單棵植株覆蓋的面積,不能反映農作物的細節。
不同農作物的局部信息不一定具有特異性。像素級的信息可能在不同農作物之間有較高的混淆程度,某些特征可能在信號中占有不小的比例,但可能是不同農作物的共同特征。因此,單純依靠像素級信號進行分類可能無法有效地對目標農作物進行區分,綜合考察一個對象的全部像素才有實際意義[1-7]。由于影像分辨率以及標記數據數量等因素的制約,尚無法有效地使用深度學習以實現自動化的抽象和要素提取。因此,使用簡單線性迭代式聚類(SLIC)[8]對遙感影像進行超像素級對象劃分。圖像分割之后,一個對象由一個或多個分割的部分組成。分割的部分再使用計算機視覺方法提取圖像特征,并使用統計學方法進行概括。用以上原則調較超像素分割器,即在保證邊界清晰的前提下以更少的區塊實現對目標對象覆蓋區域的描述。使用少量參數組合進行試錯,并使用可以接受的結果中最優的一個作為執行參數。經過試驗,使用四波段融合RGB作為SLIC的輸入影像。
波段融合RGB是一個基于遙感影像制作的要素圖層。要素圖層是針對油菜、玉米、水稻、烤煙、茶葉5種目標農作物建立分類器的先決條件。為建立有效的分類器,要素圖層制作如下:
1) 四波段融合RGB。在HSV空間使用432假彩色的亮度值替換321真彩色的亮度值,之后再將合成結果轉換到RGB空間,以強化植被之間以及植被同其他地表覆蓋之間的差異。
2) H和S。色調和飽和度。
3) A和B。分別將真彩色在CIELAB空間A(綠色到紅色的程度)和B(藍色到黃色的程度)2個維度上的投影作為單獨的要素圖層,以更好地捕捉圖像色彩之間的差異。
4) L。使用四波段融合RGB在CIELAB空間L維度上的投影作為單獨的要素圖層,以更好地捕捉圖像亮度之間的差異。
5) NDVI。歸一化植物指數。
6) ASM。同時使用4個波段計算8方向角二階矩[9],將其作為描述局部紋理均勻程度的要素圖層。
7) SLIC超像素。使用四波段融合RGB進行SLIC圖像分割。
上述要素圖層中,四波段融合RGB和SLIC超像素為關鍵中間件,其余7個圖層,包括H、S、A、B、L、NDVI、ASM為后續分類器的輸入要素圖層。
1.2.4 建立分類器 建立基于監督式機器學習的分類器是實現目標對象自動識別的一個基石。建立分類器的方法:
1) 針對目標農作物選擇一定數量的典型例子使用多邊形進行描繪。
2) 像素水平上的分析。基于步驟1)描繪的區域,計算目標對象在各要素上的描述統計值并繪制直方圖,獲得大致的分布情況。搜索潛在的特異性信號,并據此形成各目標對象在各個要素上的閾值。
3) 根據閾值過濾生成像素級分類信號,并使用地塊矢量圖對信號分布圖進行裁切。根據信號的地理分布對閾值進行調整,在保證信號特異度的基礎上降低信號混淆度,閾值調校完成后過濾掉面積不大且不連片的信號區域。
4) 根據信號在地塊內的面積占比,進一步對信號進行過濾。過濾掉信號面積/地塊面積小于0.1的地塊,保留剩下地塊為進一步的分類工作使用。
5) 像素級信號處理完成后,綜合各目標農作物的信號區域,并對其檢查。對信號區域中不同于目標農作物的部分使用多邊形進行描繪,并將其歸入對照組。
6) 超像素水平上的分析。在矢量描繪的區域,包括目標農作物和對照組,獲取對應的超像素對象,計算各要素在各超像素對象上的均值。之后,計算目標農作物在超像素水平上各要素的描述統計值并繪制直方圖。嘗試設定在超像素水平上各目標對象在各個要素圖層上的閾值。
7) 基于超像素對象,利用隨機森林[10]建立機器學習分類器。
8) 在試點區域上,獲取步驟5)輸出的地塊對應的超像素對象,首先利用步驟6)獲得的閾值進行過濾,之后再使用步驟7)的分類器對余下的超像素對象進行分類。
9) 基于步驟8)生成的超像素級信號對地塊的種類進行判定。過濾掉超像素信號面積/地塊面積小于0.3的地塊,余下地塊中,將覆蓋面積最大的超像素對象的種類作為該地塊的種類,最后將所有過濾掉的地塊標記為其他已完成地塊的標記。
10) 隨機選取一定數量的地塊,將其地面調查的標記同步驟9)生成的標記進行比較,并計算混淆矩陣和準確率。
從表3可知,在超像素對象上,分類器在大多數情況下有0.85以上的準確率。在單張影像中,需要區分的對象越多,分類器的表現越差。在春季油菜為主要的目標農作物時,分類器的準確率都在0.9以上,但在夏季,除目標對象的特征明顯且樣本數量充足外,分類器的準確率難以達到0.9。樣本的數量對分類器的表現有顯著影響,如水稻的特征比較明顯,但在高景1A的覆蓋區域中,由于樣本數量少,分類器的表現也不佳。農作物的生長階段也有顯著影響,如7月的玉米容易同烤煙混淆,但到8月中下旬混淆程度會下降。對照組對象種類多、數量大,圖像特征上容易同目標對象產生混淆,會帶來相對主觀的對照組選取,從而給準確率的估計造成不確定性。

表3 針對超像素對象的分類器在測試集上的準確率
從表4可知,在農田地塊對象上,分類規則在大多數情況下有0.8以上的準確率。分類規則基本上延續了分類器在超像素對象上的表現模式,即需要區分的目標對象越多表現越差,樣本數量、生長階段均有顯著影響。分類規則在長寬比趨于1的地塊上表現較好,但在細長形地塊上的表現較差。由于圖像分割尺度的緣故,細長形地塊可能獲得的超像素單元數量較少,從而在整體判斷時可能有較大的偏差。

表4 在測試集上農業生產地塊分類的準確率
準確率衡量特定對象被正確判定的概率,即P(正確種類判定|特定對象)。實際工作更多涉及的是回溯率,即被識別的對象確實為該種類的概率,即P(特定對象|種類判定)。根據貝葉斯公式,回溯率取決于分類器的準確率和涉及對象的基礎比例,基礎比例可以通過地面調查進行估計。從表5可知,基礎比例對回溯率有決定性影響,對于占主導地位的對象,大致準確的分類可以獲得合意的回溯率;但對于占次要地位的對象,需要非常準確的分類才能達到相似的回溯率水平。如夏季的烤煙田(分別為高景1A和高分2號拍攝),烤煙的基礎比例非常小(分別為0.019和0.016),分類規則的準確率大致可以接受(分別為0.729和0.904),但回溯率處于非常低的水平(分別為0.270和0.177)。總體看,需要區分的目標對象越少,回溯率水平越高;目標對象的基礎比例越高,回溯率水平越高;目標對象之間混淆程度越低,回溯率水平越高;反之亦然。

表5 在測試集上農業生產地塊分類的回溯率
結合地面調查數據,使用拍攝自不同衛星的多張遙感影像對貴州省鳳岡縣、湄潭縣等5個縣8個鎮的水稻、油菜、玉米、茶葉、烤煙5種目標農作物進行自動識別,結果如下:1)基于SLIC超像素對象建立的分類器可以較好對水稻、油菜、玉米、茶葉、烤煙5種農作物分類,在大多數任務上可以達到0.8以上的準確率。在明確分類對象是目標農作物之一的前提下,分類的效果會更好。2)相較于分辨率和成像質量,結合目標農作物的生長周期選擇適當拍攝日期更為重要。即使分辨率是0.5 m,農作物植株的特征也不能被充分捕捉。因此,如果多種農作物處于相似的生長階段,僅憑借多光譜遙感影像很難做到高效分離,能在農作物處于不同的生長階段獲取遙感影像,識別的準確率將顯著提高。3)分辨率會顯著影響農作物的解譯。農田的紋理信息在0.5 m的分辨率下還可以被記錄,但到2 m時同樣的信息很難獲取。如果需要人工判讀和標注,分辨率也會對工作的效率和質量產生實質性影響。4)就衛星在目標農作物的成像質量上看,從優到差依次是Pleiades-1A、Pleiades-1B、高景1號、北京2號、高分2號、資源3號、高分1號。
由于衛星的重返周期和有效拍攝窗口期不完全可控,應逐漸增加無人機航拍影像的積累,并在人工標注數據趨于充分的情況下,利用深度學習技術開展相關工作。