胡靈炆,周忠發*,尹林江,朱孟,黃登紅
(1.貴州師范大學喀斯特研究院,國家喀斯特石漠化防治工程技術研究中心,貴陽 550001;2.貴州師范大學地理與環境科學學院,貴陽 550001)
油菜是我國主要油料作物之一,主要分布在長江中下游平原,云貴高原和四川盆地一帶,種植面積和產量都排在世界前列[1-2],其生長情況的實時、準確監測對優化種植空間以及后期估產有重要意義。傳統的人工監測費時、費力,隨著遙感技術的快速發展,近年來諸多學者利用遙感對油菜生長進行監測。李中元等[3]利用Sentinel-2對平原地區油菜種植面積進行計算,效果較為理想,但針對破碎耕地的精度還有待提高;王東等[4]利用GF-2對花期油菜進行識別,能較好地區分油菜花與其他地物,可為種植分布制圖提供支持。Wei等[5]利用植被指數混合機器學習方法對油菜葉面積反演,該方法在苗期雜草較多時容易出現誤差?,F有研究遙感數據源多使用衛星數據,集中于大范圍作物生長信息的提取,如種植面積計算、不同作物類型識別等,而對小區域作物的生長監測(如株數、出苗率等)研究較少。貴州喀斯特高原地區多云多霧,難以獲取無云的傳統光學衛星遙感影像[6-7];同時,油菜種植地塊面積小且分布破碎,存在識別特征不清晰、觀測尺度模糊等問題,現有研究難以滿足喀斯特高原山區現代農業精細化遙感監測的需求,提取作物的準確率和高效性亟待進一步發展。
喀斯特山區山高、起降條件差、云層低,無人機遙感因具有靈活性高、獲取數據速度快、應用成本低等優點,成為該地區農作物監測的優選方法之一[8-11]。目前,利用無人機可見光影像應用于農作物識別提取已有較多成果,主要體現在2個方面:一是利用目標三維空間特征進行提取,如葡萄樹行距監測[12]、火龍果樹特征提取[13]、樹木莖體積識別與估算[14]等,該方法可以避免地物顏色相似的干擾,但是依賴于點云的高程信息,若作物植株高度接近地面,會造成一定程度的混淆;二是利用紋理和光譜等遙感特征進行提取,該方法對光譜和紋理有明顯特征的作物效果較好,郭鵬等[15]利用光譜和紋理特征對棉花、玉米和葡萄進行提取。Li等[16]利用過綠指數(excess green,ExG)和OTSU算法計算馬鈴薯出苗率,證明無人機圖像是計算出苗率的高通量表型之一;戴建國等[17]結合顏色指數SUM模型監測棉花出苗率,為苗情信息大面積提取奠定了基礎;高永剛等[18]提出了超綠紅藍差分指數(excess green-red-blue difference index,EGBRDI),該指數在植被較稀疏地區適用性較好。以上方法可較準確地識別地物的光譜特征差異,但是對于顏色和紋理特征相似的地物識別精度還有待提高??λ固厣絽^種植結構復雜,引起的幾何與光譜畸變降低了作物識別與分類精度,難以實現農作物植株級別精準識別[19]。
貴州喀斯特山區獨特的自然資源孕育了多樣的農作物品種,但作物生長環境復雜,導致不同農作物的遙感特征各異,使得農作物的生長監測非常困難[20-21]。油菜是貴州省大宗經濟作物,油菜生長分為苗期、蕾薹期、開花期、成熟期,苗期是油菜生長的重要階段之一,對其進行實時高效的監測有利于及時開展補種以提高產量,為出苗率計算奠定基礎。同時,苗期是雜草生長的高峰期,需及時合理的噴灑農藥和犁地培耕,減緩田間的雜草的長勢,保障油菜作物的產量和質量,故對油菜苗期生長情況監測尤為重要。本文采用四旋翼無人機獲取苗期油菜種植區正射影像,分析不同地物在紅(red,R)、綠(green,G)、藍(blue,B)波段上的光譜差異,結合樣本統計法和數理概率構建綠藍紅差異指數顏色指數(green-blue-red difference index,GBRDI),以期為油菜植株識別提取、農情監測和種植管理提供技術支持。
研究區位于貴州省遵義市播州區樂意蔬菜現代高效農業示范園,中心坐標E 106°43"49.854"、N 27°31"55.855",年均氣溫15.5℃,最高氣溫32℃,最低氣溫-2℃,平均降雨量為1 073 mm。園區內種植油菜分為春油菜(4月底種植,9月底收獲)和冬油菜(9月底種植,次年5月底收獲),冬油菜苗期較長,占生長周期的一半[22]。油菜與不同作物輪作換茬,間作套種,定植的行間距采用16 cm×16 cm,其他管理同大田生產。
采用大疆Phantom4 Pro V2.0四旋翼無人機獲取可見光影像,飛行時間17 min,飛行速度10 m·s-1,搭載FC300SE-CMOS(FOV 94°20 mm)鏡頭,有效像素2 000萬,單張影像分辨率為4 000 pixel×3 000 pixel,水平懸停精度(±0.3)m。為減少太陽光入射導致的作物陰影,拍攝時間為2020年9月27日14:00—14:20,風力1級,天氣晴朗,航線設計采用Altizure航線規劃APP,為保證數據精度,設置航向重疊度為75%,旁向重疊度70%,航高設置20 m。使用Pix4DMapper處理航拍數據,包括影像篩選、影像拼接、矯正和空三加密,生成正射影像的空間分辨率0.6 cm。如圖1所示,a為實驗區,雜草主要集中在左上部分;b1、b2、b3、b4為驗證區,雜草生長較多,分布情況較為復雜。

圖1 研究區Fig.1 Study area
研究區非植被主要為土壤、水泥路、柏油路,植被主要為油菜苗和雜草。DN(digital number)值代表地物反射電磁波的能力,不同地物在R、G、B波段的反射值不同[23]。在RGB顏色系統0~255的可見光范圍內,利用ENVI5.3的Arbitrary profile工具獲取同一比例下純凈像元的任意剖面折線,以橫坐標為任意剖面曲線的長度,縱坐標為曲線經過的像元對應DN值,可得到不同地物在R、G、B 3個波段的變化曲線。為進一步分析油菜苗與雜草在各波段上的差異,使用ENVI中ROI工具,分別選取土壤、油菜苗和雜草純凈像元樣本區各50個,統計3類樣本區的R、G、B波段平均反射值,即DN值。
基于植被指數統計圖交點法和數理概率論[24]的思想,使用ENVI軟件人工選取土壤、油菜苗和雜草樣本區各50個。以各植被指數DN值作為橫坐標、總像元個數作為縱坐標繪制統計直方圖,其形成的曲線與橫、縱軸構成的多邊形面積即為該坐標范圍內像元的數量,將同一坐標系下不同地物的直方圖曲線交點作為不同地物的分割閾值。樣本選擇原則如下[9]:①選取面積相同且盡量處于像元中心的區域;②樣本選取時應該最大程度的包含高、中、低3種亮度范圍;③每種地物選取的數量盡量平均,對于顏色和亮度值差異較大的樣區可以適當增加樣本數量。
為驗證GBRDI指數的提取效果,與過綠指數(ExG)、[25]、差異植被指數(VDVI)[26]、歸一化綠藍差異 指 數(normalized green-red difference index,NGBDI)[27]3種可見光植被指數[28-29]對研究區油菜苗提取的結果進行對比,計算公式如下。

式中,G、R、B分別為綠波段、紅波段、藍波段提取結果。
為定量評價GBRDI指數的精度,參考Shufelt等[30]的研究方法,設提取結果中正確提取的油菜苗株數為TP(true positive)、錯誤提取的油菜苗株數為FP(false positive)、漏提取的油菜苗株數為FN(false negative)。選取分支因子(branching factor,BF)、檢測率(detection rate,DR)、完整性(quality procedure,QP)3個評價指標,計算公式如下。


式中,DR表示被正確分類為油菜苗株數所占總數的百分比;QP體現油菜苗植株提取結果的質量,其值越高說明提取結果質量越高。BF與錯誤分類的油菜苗植株數量呈正相關,BF越小,DR和QP越大,則提取結果越好[31]。
2.1.1 地物RGB波段變化分析 由圖2可知,非植被土壤對紅光強反射,綠色植被油菜苗和雜草對綠光強反射,此處有較為明顯的植被與非植被分離指示性。根據油菜苗-雜草曲線,在油菜苗與雜草過渡的地方R和B波段有交點,變化表現為R波段的DN值升高至高于藍波段的值,B波段的DN值驟減至低于R波段。由此可知,油菜苗植株對光反射強度為G>B>R,雜草為G>R>B,以上結果表明,利用R、B波段的差異可以有效分離土壤-植被和同為綠色植被的油菜苗-雜草。

圖2 地物RGB波段變化曲線Fig.2 RGBband variation curve of ground features
2.1.2 地物DN值分析 從不同地物間的DN平均值(表1)來看,土壤與油菜和雜草的差異在R波段最小,G波段最大;油菜苗和雜草在R波段差異最小,在B波段差異最大,G波段居中。另外,通過同一地物各組數據標準差來看,各組數據分布較為平均,數據離散程度較低,各組數據間存在內在聯系。

表1 地物DN值統計值Table 1 Statistical value of every object DNvalue
為進一步探究各地物不同波段DN值的關系,基于各地物DN值分析的基礎上,擬合各地物RGB波段DN值正態分布,如圖3所示。經正態性檢驗,各組數據P值都大于臨界值0.05,代表這幾組數據服從正態分布。變量X服從數學期望或均值為μ、方差為σ2的正態分布,記為N(μ,σ2)。其期望值μ為概率密度函數,標準差σ則決定了數據的離散程度[32]。正態分布在橫軸區間(μ-σ,μ+σ)的面積為68.27%,橫軸區間(μ-2σ,μ+2σ)的面積為95.45%[33],即在這2個置信區間的概率分別是68.27%、95.45%,代表各組數據在平均值的基礎上加減2倍標準差基本可以涵蓋95.45%的觀察值。

圖3 不同地物DN值正態分布Fig.3 Normal distribution of DNvalues of different ground features
油菜苗R波段的DN值與2倍標準差(均值±2×標準差)范圍為137.10~184.14,綠波段為186.42~234.02,藍波段為152.13~206.53;雜草DN值(均值±2×標準差)范圍為118.42~194.06,綠波段為133.26~231.06,藍波段為101.23~170.47。二者R、G、B波段的DN值比值范圍分別為0.95~1.16、1.01~1.40、1.21~1.50,取其區間平均值,即95.45%置信區間內3個波段油菜苗和雜草的平均比值分別為:R油菜苗=1.05 R雜草、G油菜苗=1.21 G雜草、B油菜苗=1.36 B雜草。
以油菜苗與雜草各波段的平均比值1.05、1.21、1.36作為RGB波段的系數創建公式。同時,圖2中油菜苗-雜草RGB波段的變化曲線中,油菜與雜草交點處G、B波段驟降、R波段驟升的趨勢以及植被與非植被DN均值G波段差異最小,R波段差異最大的特征。因此,為增大不同地物之間的差異值,使不同地物信息之間無重疊部分,綠藍紅差異指數(GBRDI)計算公式如下。

式中,DNR、DNG、DNB分別代表影像中像元在紅、綠、藍波段的DN值。
2.3.1 植被指數計算結果 研究區可見光影像經ExG、VDVI、NGBDI和GBRDI運算,結果如圖4所示。4種指數的灰度空間由亮度高低不同的斑塊相間分布,DN值越大圖像亮度越高,較高亮度的為油菜苗植株或雜草,較低亮度為土壤。在分離植被和非植被方面,GBRDI、ExG、VDVI的效果都較好,很大程度上區分了植被與非植被,只有NGBDI出現大面積混淆情況;在細化分離植被中的油菜苗和雜草方面,ExG、VDVI中出現部分錯提,特別是左上角雜草生長茂盛區塊,易將雜草與油菜苗混淆;GBRDI較好地分離了雜草與油菜苗。

圖4 不同顏色指數計算結果Fig.4 Different color index calculation results
2.3.2 不同指數獲得地物DN值比較 分別統計各地物DN值,如表2所示。VDVI、NGBDI標準差很小,數據分布過于集中,說明其可劃分的地物波段范圍較為狹窄,不利于作物提取與閾值確定,在本實驗區不適用。GBRDI、ExG標準差相對數據區間較為合理,適用于分離地物。

表2 不同指數下地物DN值統計Table 2 DNvalue of ground featuresby different index
2.3.3 各地物均值與1倍標準差范圍 為進一步確定數據是否存在重疊情況,分析4種指數處理后各地物DN值的均值與1倍標準差范圍,結果如圖5所示。波段計算后NGBDI指數土壤DN值范圍為0.05~0.11、油菜為0.06~0.11、雜草為0.15~0.21。各地物出現大范圍重疊,分離效果較差;ExG的土壤DN值范圍為1.66~28.32、油菜為67.29~93.51、雜草為69.52~118.72。VDVI的土壤DN值范圍為0~0.04、油菜為0.09~0.13、雜草為0.12~0.18。上述2個指數中油菜苗與雜草都有不同程度重疊,未能達到細化分離油菜苗與雜草的目的;GBRDI中土壤DN值范圍為176.42~218.36、油菜為292.66~311.20、雜草為199.75~265.79。油菜與土壤和雜草基本無重疊,能較好地分離出油菜植株。因此,結合4種指數計算結果的目視判別特征和統計值特征,說明GBRDI在本實驗區提取油菜苗的優越性。

圖5 DN值均值與1倍標準差范圍Fig.5 Range of DN mean value and one standard deviation range
2.4.1 閾值分割 利用ENVI中各指數計算結果(圖6),結合曲線與坐標軸圍成的面積即為占比大小的思想,分析各指數3種地物曲線的交點。GBRDI中采用油菜和雜草的交點作為分割閾值,交點值為272.81,由此,油菜的閾值區間為[272.81,355.00];ExG中采用油菜和雜草的2個交點55.92與105.75為閾值;VDVI采用油菜和土壤的交點0.04與油菜和雜草的交點0.13為閾值;NGBDI采用油菜和土壤的第1個交點0.07與油菜和雜草的交點0.14為閾值。

圖6 地物DN值統計Fig.6 Statistics of DNvalue of ground features
2.4.2 閾值分割后提取結果 利用上述植被指數統計圖交點法將各指數波段運算后的結果進行閾值分割,出現部分不連續的細小斑塊和空心現象。將閾值分割結果導出到ArcGIS10.2中,利用面積屬性去除碎小斑塊和填充斑塊空心區域,提取結果如圖7所示,綠色表示提取的油菜苗植株。由圖7可知,NGBDI出現大面積誤提取,僅南部剔除了部分土壤,該指數的提取效果最差;VDVI與ExG基本都能分離各地物,但在圖像北部出現少量將雜草誤提為油菜苗情況,ExG的提取效果優于VDVI;GBRDI除了南部有小斑塊誤提情況,能最大程度分離各地物且分離效果較好。
2.4.3 研究區提取結果 如圖8所示,大多數植株提取正確且能勾勒大致形狀。誤提一是由于某些地物與植株像元值相似,如枯枝和黑色地膜等,二是由于部分雜草顏色與油菜相似性高;漏提則是由于少量油菜苗幼苗長勢較差,出現倒伏和萎縮導致圖斑太小,在剔除細小圖斑時被剔除。

圖8 GBRDI提取結果Fig.8 Extraction results by GBRDI
通過田間調查和目視解譯航拍影像,獲取4種指數提取油菜苗的性能,如表4所示。NGBDI指數檢測率(24.64%)和完整性(2%)都很低,提取精度較差;ExG、VDVI檢測率都在80%以上,完整性分別為78.68%和71.97%,表明這2個指數漏提較多,提取結果質量較低;GBRDI檢測率為92.93%,說明正確提取的植株占大部分,誤提和漏提的油菜苗植株數量很少,誤差主要集中在油菜長勢較差的區域。提取結果完整性為83.63%,說明即便存在小部分誤差,提取結果仍與真實的數量相近,具有較好的完整性,驗證了本方法的可行性。

表4 不同指數提取精度評價Table 4 Accuracy verification of extraction by different index
2.6.1 驗證區提取結果 為進一步驗證GBRDI指數的適用性與可行性,選取4個雜草生長較為茂盛的驗證區,對比GBRDI與其他3種指數在驗證區的提取效果,結果如圖9所示??梢钥闯?,ExG、VDVI、NGBDI指數只能較好地分離土壤與植被,對于同為綠色的雜草出現了大面積誤提。GBRDI指數則可以較準確分離油菜與雜草,驗證區誤提情況與實驗區相似,多為顏色相近的土壤和雜草;而漏提則是因為幼苗長勢較差造成。

圖9 驗證區提取結果Fig.9 Extraction results of validation area
2.6.2 驗證區精度評價 如表6所示,4個驗證區提取油菜效果最好的指數為GBRDI,分支因子都小于1,檢測率最高達到95.70%,最低為93.54%,完整性最高為84.38%,最低為73.84%。研究選取雜草生長茂盛且雜亂的部分作為驗證區,提取精度受生長環境復雜程度的影響,油菜提取的干擾進一步增強,故4種顏色指數的完整性較實驗區均有所下降,但GBRDI指數的各項評價指標仍高于其余指數,具有較好的精度相關性,表示該指數在地物顏色相似的復雜生境下性能更好。

表6 驗證區精度Table 6 Accuracy of verification areas 續表 Continued

表6 驗證區精度Table 6 Accuracy of verification areas
本研究在貴州高原山區利用四旋翼無人機采集油菜苗期的厘米級可見光影像,對比分析不同地物間光譜特征的異同,根據不同地物的波段特征及數據間正態分布關系,構建了相近綠藍紅差異植被指數(GBRDI)。該指數能從同為綠色的植被中分離油菜和雜草,達到綠色植被細分的效果。該方法實現了苗期油菜識別和計算株數,克服了不同季節、云層陰影遮擋、雜草存在等較復雜生長環境等綜合因素的影響,證明了基于無人機遙感的RGB圖像數據在復雜山地環境中進行苗期油菜目標識別和株數計算的可行性,可為后期油菜精準估產奠定關鍵性數據。
基于顏色指數對農作物信息進行分類提取[34-35],其原理是利用作物在不同波段的反射和吸收特性,進行波段的組合運算,從而增強待提取地物的信息,弱化土壤等背景干擾信息。目前遙感領域的顏色指數有近200種[36],波段大多使用近紅外-可見光,僅針對可見光波段的植被指數較少。大量研究者利用ExG對植被信息進行識別,具有較高精度[37-38],能較好地分離植被與土壤,但細化區分同為綠色的地物時效果不夠明顯,未能達到植被再細分[39-40]。本研究構建的GBRDI指數,可以達到分離同為綠色的油菜苗與雜草的效果。
閾值是特征提取的關鍵,確定分割閾值的方法較多,如雙峰直方圖閾值法、直方圖閾值法和模型反演法等[41-42]。當地物豐富或地物類型較為接近時,顏色指數直方圖不具備雙峰性質。本文運用目視判別的方法,選取各地物50個樣區,結合監督分類與植被指數統計直方圖,基于曲線交點面積和數理概率確定閾值。較傳統閾值確定方法更快速簡便,能解決閾值確定難的問題,一定程度上滿足作物提取的精度。使復雜環境驗證區油菜苗識別的目標檢測率為94.69%、95.70%、93.54%、95.29%,精度驗證完整性為74.83%、83.18%、82.86%、84.38%。驗證區總體提取精度較好,說明該指數具有可靠性和適用性。數據獲取時的客觀條件如光照、土壤耕作和作物長勢都會影響到閾值的取值,可以考慮針對作物不同時期建立閾值選取庫以提高分類效率。
在選取不同地物樣點時,對技術人員的專業知識和經驗有一定要求,在以后的研究中有必要建立油菜植株不同生長情況和不同時相影像的識別特征庫和多場景識別指標體系,降低人為誤差對目標識別精度的影響,為多場景下的作物目標識別和株數計算打下基礎。其次,研究區域的選擇僅體現了雜草,未能對特殊地形下地塊破碎、作物類型多樣、套種現象多等問題開展研究,未來可對種植破碎的多類型作物存在的特征差異進行研究。在本研究特征提取的基礎上,可通過出苗率對播種行距與植株分布等播種方法進行質量評估,結合線性回歸建模分析方法探究復雜地形下非機械直播的油菜在苗期的出苗率與產量的關系。