郭倩, 魏嘉豪, 張健, 葉章熙, 張厚喜,2,3*, 賴正清, 鄧輝
(1.福建農林大學林學院,福州 350028; 2.南方紅壤區水土保持國家林業和草原局重點實驗室,福州 350028;3.海峽兩岸紅壤區水土保持協同創新中心,福州 350028; 4.南京師范大學海洋科學與工程學院,南京 210023; 5.成都理工大學地球科學學院,成都 610059)
及時準確的蔬菜種植信息(空間分布、面積等)是實現水肥精準管理、優化蔬菜生產及提升產量估算精度的重要基礎[1]。近年來,隨著空間信息技術的高速發展,遙感作為一種重要的對地觀測技術,已被廣泛應用于作物的不同參數監測中,如作物長勢監測、葉面積指數反演等[2]。然而,雖然傳統衛星遙感在大面積、種類單一的作物參數監測方面的應用效果顯著,但由于衛星影像時空分辨率較低,其在作物種植種類精準識別方面具有一定的局限性。特別是在顏色相似、形態相近的蔬菜種類識別上,傳統衛星遙感技術的局限性更加突出,加上蔬菜生長周期較短,在有限的時間內精準地識別蔬菜種植種類就要求遙感影像有更高的空間和時間分辨率。近年來興起的無人機遙感有超高的空間分辨率以及靈活可控的重訪時間[3],有效彌補了傳統衛星遙感的不足,因此將其應用于作物信息的監測研究受到廣泛關注。此外,無人機能夠通過搭載多光譜等傳感器有效提高影像信息量,進一步增大了無人機監測蔬菜信息的優勢。
面向像元和面向對象是遙感分類的2 種基本方法。基于像元的分類方法在處理高分辨率影像時存在一定的局限性,如易出現椒鹽現象,即同種地物由于光譜變異較大而被分為不同類別,使得原本均一的地塊被打碎,而面向對象的分類方法則將影像分割成屬性相對均一的對象,讓對象代替像元作為分類的基本單位,這樣可以綜合利用每一對象的光譜、紋理、幾何特點以及上下文特征,從而有效提高分類精度與結果的可靠性[4]。但是,面向對象分類方法在充分利用特征信息的同時也增加了特征維度,在引入多種特征信息時容易讓次要特征影響整體分類精度,近年興起的隨機森林方法有效規避了這樣的缺陷,隨機森林方法可以通過算法確定特征權重,優化分類方案,從而提高分類精度[5]。作為一種數據驅動的非參數分類方法,隨機森林方法通過有放回的自助抽樣方法構建決策樹,采用投票方式得到最終分類結果[6-7],擅長處理高維數據,并且抗過擬合能力強、計算速度快,近年來被廣泛應用于生物學、醫學、遙感等領域。
由于面向對象和隨機森林算法各自有著其他方法所不具備的優點,近年來不少學者嘗試將二者結合起來開展遙感影像分類。Lee 等[6]使用隨機森林及紋理特征建立了一套適用于無人機拍攝的大規模坡地影像自動判讀程序,一定程度上解決了坡地地物識別困難的問題。Wang等[7]比較不同影像及不同分類方法(支持向量機、K-近鄰法和隨機森林)對同一地區土地分類的結果,發現隨機森林法得到的分類精度最高。為削弱多維特征對分類精度的負面影響,劉舒等[8]提出一種多目標隨機森林組合式特征選擇算法進行特征集優化,進一步提高了分類精度。
雖然基于面向對象和隨機森林相結合的研究已經取得了一些成果,但目前的研究主要集中于較大尺度范圍,而其在小尺度范圍的應用,特別是蔬菜精準識別的研究還十分有限。因此,本文以蔬菜種植園的無人機多光譜遙感影像為數據源,通過提取光譜、指數、紋理和幾何4 類特征形成不同特征子集構建不同的分類方案,利用面向對象與隨機森林算法相結合的方法開展蔬菜種類識別研究,以期通過對分類方法的驗證分析,獲得一種實用高效的蔬菜種植種類識別方法,為高精度農作物遙感監測提供借鑒。
研究區(26°03′N,119°19′E)位于福州市閩侯縣東南部,平均海拔約9 m,面積約956 m2(圖1)。該地處于亞熱帶季風氣候區,年降雨量900~2 100 mm,年均氣溫18~26 ℃。

圖1 研究區真彩色影像Fig. 1 RGB image of research area
為了減少陰影對分類結果的影響,選擇有云且光線較好的時段,利用大疆無人機(精靈4多光譜版,深圳市大疆創新科技有限公司)進行航拍。該款無人機集成了5 個單波段相機鏡頭,藍光波段(blue,B)(450±16) nm;綠 光 波 段(green,G)(560±16) nm;紅光波段(red,R)(650±16) nm;紅邊波 段(red edge,RE)(730±16) nm;近 紅 外 波段(near infrared,NIR)(840±26) nm;定位精度為0.1~0.3 m。設定航高為20 m,航向、旁向重疊度均為70%,共獲取單波段影像250 張。影像尺寸為1 600像素×1 300像素,影像預處理主要包含影像拼接與重采樣,借助大疆Terra 軟件拼接并重采樣生成研究區多光譜影像(空間分辨率0.01 m×0.01 m)。
技術流程如圖2 所示。首先,對拼接生成的影像重采樣至0.01 m×0.01 m,然后進行多尺度分割,并計算分割后每個對象的4類特征值,包括光譜特征(spectrum features, SPEC)、指數特征(index features,INDE)、紋理特征(grey-level co-occurrence matrix features,GLCM)和 幾 何 特 征(geometric features,GEOM);其次,以光譜特征為基礎分別加入其他3 類特征組合成為8 個特征子集,并形成8 個相應的分類方案。通過特征選取、參數調整和模型訓練3 個步驟構建不同方案隨機森林模型;利用分層抽樣方法構建每個類別的訓練樣本和驗證樣本,分別用于模型訓練和精度評價;最后,根據最佳模型預測生成整個研究區分類圖。

圖2 技術流程Fig. 2 Technical flow
1.3.1 影像分割 采用eCognition9.0 軟件對圖像進行多尺度分割,為了得到最佳效果,在50~1 000 區間內以50 為間距設置不同分割尺度,同時設置相應的形狀因子和緊致度,然后逐個進行影像分割。
1.3.2 對象特征提取 使用eCognition9.0 軟件選取對象的4大類共96個特征。
①光譜特征(SPEC):B、G、R、RE 和NIR 每個波段像元亮度值均值、標準差以及波段最大差異(max difference)和總體亮度值[9](brightness),共12個。
②指數特征(INDE):包含歸一化植被指數[10](normalized difference vegetation index,NDVI)、歸一化差異紅色邊緣指數[11](normalized difference red edge index,NDRE)、綠色歸一化植被指數[12](green normalized difference vegetation,GNDVI)、比值植被指數[13](ratio vegetation index ,RVI)、RVIGRE[14]、土壤調整植被指數[15](soil-adjusted vegetation index ,SAVI)、SAVIGRE[14]、差值植被指數[13](difference vegetation index,DVI)、DVIREG[14]、DVIGRE[14]、歸 一 化 差 異 水 指 數[16](normalized difference water index, NDWI)、改進的陰影水體指數[17](modified shade water index ,MSWI)、綜合權重水體指數[17](comprehensive water weight index ,CWWI)的均值和標準差,共26個。
③紋理特征(GLCM):B、G、R、RE 和NIR 波段各對象全方位灰度共生矩陣的均值、標準差、熵(entropy)、同質度(homogeneity)、對比度(contrast)、非相似性(dissimilarity)、角二階矩(angular second moment)和相關性(correlation),共40個。
④幾何特征(GEOM):對象的形狀和范圍特征,包括面積(area)、長寬比(length/width)、長度(length)、寬度(width)、邊界長(border length)、形狀指數(shape index)、密度(density)、主方向(main direction)、不對稱性(asymmetry)、圓度(roundness)、邊界指數(boundary index)、像素數(number of pixels)、緊致度(compactness)、體積(volume)、橢圓擬合(ellipse fitting)、矩形擬合(rectangle fitting)、最 大 橢 圓 半 徑(maximum ellipse radius)、最小橢圓半徑(minimum ellipse radius),共18個。
1.3.3 分類方案構建與樣本獲取 共設置8 個子特征集,并形成8 個相應的分類方案(S1~S8),具體如表1所示。

表1 不同分類方案Table 1 Different classification schemes
基于高分辨率無人機影像采用目視解譯與實地核查的方式選取地物總樣本(包含訓練和驗證樣本)。根據影像中不同地物的大致面積,確定了11 類地物的總樣本數(表2)。為了保證訓練和驗證樣本中不同地物數目比例與總樣本中的一致,采用分層抽樣法進行抽樣,即對每類樣本以6∶4的比例隨機抽取訓練樣本和驗證樣本。

表2 不同類別樣本Table 2 Samples for different categories
1.3.4 隨機森林算法原理和參數調試 隨機森林由眾多決策樹構成,每棵決策樹獨立生長,在節點處隨機選擇特征變量參數進行分叉,最終預測結果由決策樹投票產生[5]。其中有2 個重要參數—決策樹數目和每棵樹包含的特征數目,通常采用遍歷法來確定。首先,將決策樹數設置為1 000,依次遍歷特征參數數量(1~96),選取袋外誤差最小的特征數目作為其最佳值;然后,將特征數目固定為最佳值,遍歷決策樹數目(1~1 000),選取袋外誤差最小的決策樹數目作為其最佳值,通過上述方法來確定決策樹數目和特征數目的最佳組合。利用R 語言軟件的Random Forest 程輯包實現基于隨機森林算法的分類。
1.3.5 精度評價 采用基于混淆矩陣計算出的4個指標(總體精度、Kappa系數、生產者精度和用戶精度)進行模型精度評價。由于隨機森林每次運行結果存在一定差異,因此每個方案將分別運行2 000次后再進行精度評價。
2.1.1 光譜可分性分析 從圖3 可知,非蔬菜地物的光譜曲線與蔬菜地物之間存在較大差異,特別是近紅外波段,非蔬菜地物的反射率明顯低于蔬菜地物(蔥除外)。各蔬菜地物的光譜曲線比較相似,綠光波段(560 nm)處各蔬菜的反射率增高,形成反射峰,但包菜和生菜在綠光波段處的亮度值較為相近,難以進行有效區分。各種類蔬菜的亮度值在紅邊波段(730 nm)處反射率迅速增高,但其在紅邊波段處的亮度值高度相似,難以對其類別進行區分。由上可知,通過光譜特征差異可以明確區分蔬菜與非蔬菜地物,但某些蔬菜地物的光譜曲線極其相似,僅依靠光譜特征難以進行準確區分,有必要綜合利用其他特征。

圖3 地物光譜圖Fig. 3 Object spectrum image
2.1.2 分割尺度選擇 影像分割結果如圖4 所示,通過比較發現分割尺度設置過大會導致影像欠分割,每個對象中會包含多種地物類型,即每個對象的純凈度較低;分割尺度設置過小則會使對象碎片化,難以吻合對象真實邊界,將加大識別難度及后續的計算量。當分割尺度為100~300 時,分割后的對象與地物實際邊界較為吻合,影像分割效果相對較佳,進一步目視對比以100~300 作為尺度分割的影像,最終選擇150 作為影像的分割尺度。

圖4 不同分割尺度分割效果Fig. 4 Segmentation effect of different segmentation scales
2.1.3 隨機森林參數調試 由參數的調試結果(圖5)可知,當決策樹數目設為1 000 時,隨著特征數目增加,不同方案的袋外誤差均呈現先下降而后處于波動的變化趨勢,此時每個方案袋外誤差最小時即為所對應特征數目的最佳值;將特征數目設置為最佳值后,通過改變決策樹數目,不同方案的袋外誤差均呈先下降而后趨于平穩的趨勢,此時每個方案袋外誤差最小時即為對應決策樹數目的最佳值。8 個方案(S1~S8)特征數目與決策樹數目的最佳值組合分別為(4,161)、(12,848)、(12,365)、(15,203)、(19,197)、(38,731)、(25,708)和(41,165)。

圖5 不同方案不同特征個數與決策樹數量袋外誤差率Fig. 5 Out-of-bag error rate of different numbers of features and different numbers of decision trees for various schemes
2.2.1 總體精度與Kappa 系數 由圖6 箱式圖可知,所有方案的分類精度都較高,不同方案總體精度的均值均高于85.85%,Kappa 系數均值均大于0.84;其中,精度最高的為方案S5(SPEC+GLCM+INDE),其總體精度均值為92.75%,Kappa 系數均值為0.92;精度最低的是方案S7(SPEC+INDE+GEOM),其總體精度均值為85.85%,Kappa 系數均值為0.84。通過比較不同方案的總體精度可知,幾何特征的引入將會使分類精度出現不同程度的下降,例如S4(SPEC+GEOM)比S1(SPEC)降低了0.58%,S7 比S3(SPEC+INDE)下降了3.93%;而紋理特征和指數特征的引入則正好相反,例如S5(SPEC+GLCM+INDE)比S2(SPEC+GLCM)提高了2.60%,S6(SPEC+GLCM+GEOM)比S4(SPEC+GEOM)提高了1.69%。由上可知,不同特征對于分類精度的影響存在差異,其中幾何特征表現為負向影響,而指數特征和紋理特征則相反。

圖6 不同方案分類精度Fig. 6 Classification accuracy of different schemes
2.2.2 生產者精度與用戶精度 通過對比可知(圖7和8),非蔬菜地物的生產者精度與用戶精度都很高(大多接近100%),而大部分蔬菜的生產者精度與用戶精度都較高(大多>80%),但白菜和包菜這2 種蔬菜精度則相對較低,低于80%,尤其是白菜,在方案S2 和S4 中的生產者精度分別為(70.0±2.0)%和(66.3±2.1)%,顯著低于其他蔬菜,而包菜的生產者精度雖然略高于白菜,但其在不同方案中的生產者精度也大多低于80%,與其他類別蔬菜的精度仍存在差距。同種蔬菜在不同方案中的分類精度也存在差異,方案S5 的精度相對較高,如芥菜和油麥菜在所有分類方案中都是方案S5 的精度最高,其生產者精度分別為100%和(97.4±0.8)%,且蔥、花椰菜和生菜的用戶精度都高于90%,明顯高于其他方案。而包含幾何特征集的方案其精度相對較低,尤其是方案S4,其生產者精度顯著低于其他方案,如白菜、包菜及芥菜都是方案S4的生產者精度最低,尤其是芥菜,其方案S4的生產者精度僅為79.6%±2.6%,遠遠低于其他方案。

圖7 不同蔬菜類別不同方案生產者精度Fig. 7 Producer accuracy of different schemes for different vegetable categories

圖8 不同蔬菜類別不同方案用戶精度Fig. 8 User accuracy of different schemes for different vegetable categories
不同分類方案特征重要性排序結果如圖9 所示,其中S1 方案僅有的12 個特征全部顯示,其他方案則顯示前20 個。從圖9 可知,不同分類方案的特征排序存在差異。前20 個最重要特征中大多為光譜特征與指數特征,只有個別方案中出現紋理特征與幾何特征。除方案S2、S6 和S7 以外,所有方案前10 個最重要特征均為光譜特征與指數特征,其中方案S1 和S4 前10 個最重要特征均為光譜特征,S2 和S6 前10 個最重要特征中光譜特征占9 個,可見在不同分類方案中光譜特征對于分類結果均起著重要作用。除光譜特征外,指數特征也非常重要,方案S3、S5、S7 和S8 前10 個最重要特征中比例最高的均是指數特征,且其排名也比較靠前。從前10 個最重要特征來看,光譜特征和指數特征的重要性差別不大,但從前5 個最重要特征中可發現光譜特征的重要性高于指數特征。方案S1、S2、S4 和S6 的前5 個都為光譜特征,方案S3、S7和S8的前5個中第1、3、5個都為光譜特征,光譜特征不論從數量上還是排序位置上都要優于指數特征。在最佳分類方案S5中,前20個最重要特征中有8 個光譜特征、10 個指數特征和2 個幾何特征,光譜特征與指數特征仍占主導,而紋理特征和幾何特征的作用則居次要位置。另外,由最重要特征排序圖可知,對于具體的特征而言,方案S1~S8 中排在第1 位的都是藍波段均值(Mean_B),而排在第2 位的為綠波段均值(Mean_G)或MSWI均值,但在方案S3中同時存在光譜特征與指數特征時,排第2 位的為MSWI 均值,故MSWI 均值重要性高于綠波段均值。總體而言,在光譜特征中波段均值的重要性排名高于最大差異(Max_diff),而波段方差和總體亮度值重要性排名要稍后于波段均值。

圖9 不同方案前20個最重要特征排序圖Fig. 9 The twenty most important features for different models
基于最佳方案S5 預測生成的研究區分類結果如圖10 所示,總體來說不同地物分類結果與實際情況比較一致。但白菜和包菜的錯分情況較多,尤其是白菜,少許白菜被錯分為生菜和包菜,也有相當一部分番薯被錯分為白菜;除白菜外,蔥的錯分情況也較多,大多發生在蔬菜種植邊緣區域以及混植區域。從整體來看,菜地邊緣區域及蔬菜混植區域為錯分漏分頻發區,而菜地中央區域錯分情況較少,可能是邊緣區域存在較明顯的不同地物混雜現象,且邊緣區域影像質量欠佳,導致像元純凈度相對較低,從而降低了分類精度。由于影像中大多蔬菜都處于生長期和成熟期,而幼苗期的蔬菜數量較少,訓練樣本相對較少,故處于生長期和成熟期的蔬菜分類精度更高,本研究也更適合生長期及成熟期蔬菜。

圖10 基于最佳方案的分類結果Fig. 10 Classification result based on the best scheme
本研究表明,不同方案之間分類精度存在較大差異,其中包含光譜、紋理和指數特征的S5 方案總體精度最高,達到了92.75%,而包含光譜、指數和幾何特征的S7 方案總體精度最低,只有85.85%。通過對比發現,引入幾何特征的方案分類精度均出現不同程度下降,說明幾何特征對于分類精度呈負向影響,這一點在劉舒等[9]使用超高空間分辨率影像進行土地分類的研究中也有體現,在光譜和指數特征構成的數據集中引入幾何特征后總體精度由97.35%降到了96.93%。幾何特征包含面積、周長、寬度等幾何信息,這些信息一般更適用于城市空間以及地形方面的分類研究[18],而對蔬菜的識別不僅幫助不大,反而會因增加了特征數使得計算過程復雜化,導致處理速度和精度同時受到影響[19]。除了特征集選取外,分割尺度也是影響分類精度的重要因素。本研究使用手動試錯法得到的較優分割尺度區間為100~300,但更精確的分割尺度難以通過目視解譯法得出,因而為了提高分類精度,后續研究有必要采用自動確定分割尺度的方法,如采用ESP2工具[9]。
本研究顯示,不同類別蔬菜的精度存在差異,其中白菜和包菜的生產者精度相對較低。原因是這2 種蔬菜在形態、顏色等方面均較為相似,分類方案中引入的光譜、指數和紋理特征所起的作用還比較有限,因此后續研究應考慮植株高度等其他特征。蔥、芥菜、番薯和油麥菜這4 種蔬菜的生產者精度較高,說明在本次分類方案中所選的特征能有效識別它們。非蔬菜地物(土壤、水體和地膜)的分類精度都很高,大多接近100%,總體上遠高于蔬菜。究其原因主要有2 點:一是樣本選擇,相對于蔬菜而言,非蔬菜地物的形態特征比較明顯,易于目視識別,且其分布較為集中,在進行樣本選擇時不易被誤選為其他地物;二是地物本身特性,不同種蔬菜之間的光譜反射曲線差異較小,容易混淆,而非蔬菜地物的光譜反射曲線不僅彼此之間存在一定差異,且與蔬菜類別也有較大差別,再加上它們外部形態的較大差異,故不論僅基于光譜特征,還是加入指數、紋理等特征的分類方案,非蔬菜地物的可分性都較高,有著較高的分類精度。
本研究中對于蔬菜識別最重要的特征為光譜特征,其次為指數特征,紋理特征和幾何特征的作用相對次要,尤其是幾何特征,不僅在特征重要性排序中位置靠后,而且結果顯示多個方案都因幾何特征的引入使得分類總體精度出現一定程度的降低。夏盈等[20]的研究也取得了相似的結果,即在所有特征中重要性排在最前面的是光譜特征。本研究在光譜和指數特征基礎上加入紋理和幾何特征是為了加大影像信息量,得到更高的分類精度,然而分類結果顯示基于所有特征的方案S8 反而比基于部分特征的方案S5 精度低,Nguyen 等[21]的研究也發現了類似現象,只使用8 個最重要變量的精度比使用所有變量的略高,表明并不是數據集包含的特征數越多,精度就會越高。研究表明,當使用少量特征時,新特征的引入會使地物的可分性顯著增加,而當特征數達到一定數量后再繼續加入特征,地物的可分性只有細微提升,特別當達到飽和點后,總體精度不僅不會進一步提升,反而有可能出現降低的情況[22]。過多的特征數量會導致模型冗余信息增多,使得運行效率降低,進而影響分類性能,而隨機森林的優勢在于它能計算輸入特征的重要性,根據重要性排名構建較優方案,從而提高分類精度。研究發現,在分類中使用隨機森林計算特征重要性,在減少80%不重要特征后得到了最高的Kappa 系數[23],另外比較隨機森林和Adaboost算法的運行速度和運行穩定性后發現隨機森林更勝一籌[24]。不論是從分類結果還是運行效率上來說,隨機森林都表現得更加出色,表明隨機森林對于處理多維或高維特征數據具有較大優勢,它能夠識別特征重要性程度進而幫助優化方案,從而獲得更高的分類精度。
本文提出了一種基于無人機多光譜影像的蔬菜識別方法,主要通過提取影像光譜、指數、紋理和幾何特征,結合面向對象和隨機森林算法來實現蔬菜識別,不足之處在于分割尺度的確定主要采用手動試錯法,主觀性較強且自動化程度較低;白菜和包菜的生產者精度明顯低于其他類別,在后續研究中將進一步探討能高精度識別白菜和包菜的試驗方案(如引入植株高度等信息),以期得到精度更高的蔬菜識別方法,為實現蔬菜智能化管理奠定基礎。