苗建馳 崔文豪 楊蕾 李京謙 蘭玉彬 趙靜
摘要:為了快速估算免耕種植夏玉米出苗數,提高大田夏玉米種植管理的精準性,本研究利用無人機搭載可見光相機獲取夏玉米田塊高分辨率可見光影像,計算8種植被指數并結合最大類間方差法分割植被與非植被,經分析,選擇紅色植被指數(RI)二值化圖像對可見光影像掩膜;然后統計夏玉米和雜草的24項紋理特征,比較雜草特征的變異系數及其與夏玉米的相對差異系數,選擇紅色方差提取夏玉米苗的特征,使用時序交點閾值法確定的閾值去除雜草干擾;提取夏玉米苗形態學特征參數作為樣本,采用支持向量機(SVM)、BP神經網絡、K近鄰和決策樹4種算法構建夏玉米苗數預測模型。結果表明,SVM和決策樹算法的整體效果較好,決定系數均超過0.8且平均絕對誤差(MAE)小于0.3,尤以決策樹模型的精度最高,可達94.1%。本研究結果可為大面積夏玉米出苗率估測提供技術支持。
關鍵詞:夏玉米;出苗數;無人機(UAV);遙感;可見光
中圖分類號:S127 文獻標識號:A 文章編號:1001-4942(2024)03-0145-09
玉米是我國重要的糧食作物,在我國秋糧生產中占有舉足輕重的地位,其中夏玉米占全國玉米產量的36%左右。夏玉米一般以免耕播種為主,上茬作物的秸稈與根莖對其出苗率有較大影響,而出苗率是影響夏玉米產量的關鍵因素之一,及時監測夏玉米出苗情況能夠預防因缺苗造成的產量損失。傳統苗情普查主要依靠人工抽樣調查,但這種方式不適用大面積種植的作物,費時費力且效率低下,難以滿足夏玉米種植精準管理需要。
無人機(unmanned aerial vehicle,UAV)和傳感器技術的快速發展,為大范圍獲取農作物信息提供了新的手段。目前,無人機遙感技術在農業中的應用已成為研究熱點。戴建國等對棉花二值圖采用網格線法去除雜草干擾,提取棉花形態特征構建棉株數量識別模型,準確率達97.17%。趙必權等利用超高分辨率影像對油菜目標數量與形態特征進行提取,采用逐步回歸分析方法建立油菜株數回歸模型,其決定系數為0.803。韓文霆等通過比較5類地物特征的種內變異系數及其與玉米的差異系數,采用特征組合分層分類提取玉米種植信息,提取面積誤差最小為13.98%。劉帥兵等對玉米二值圖采用影像尺度變換法剔除噪聲,結合Harris角點監測算法提取玉米苗期植株信息,識別精度高達97.8%。趙曉偉等選擇ExG指數分割玉米與土壤背景,通過優化形態學特征組合參數建立支持向量機模型,預測玉米苗株數的精度達96.54%。支俊俊等通過提取遙感影像植被指數、HIS色彩特征和紋理特征,建立5種監督分類算法模型,實現玉米種植信息的高精度提取,總體精度為86.2%。
目前基于無人機遙感技術對作物苗數估算主要是結合顏色特征分析實現作物的識別與分割,運用網格法或設置緩沖區域去除雜草干擾。但這類方法適用于背景簡單、雜草少、雜草與目標作物無粘連區域,而免耕種植的夏玉米區域,機收掉落的小麥種子多導致出苗密集,麥苗及雜草往往與玉米苗密集粘連,葉片相互遮擋,尤其3-4葉期的玉米株與雜草(包括小麥苗)高度差較小,單獨采用顏色分析方法難以實現對夏玉米苗的提取。針對該問題,本研究以無人機獲取免耕種植夏玉米田的可見光遙感影像,采用二階概率統計濾波算法提取夏玉米和雜草紋理特征,選擇最佳分類特征,利用時序交點閾值法確定的閾值提取夏玉米苗,并結合機器學習算法構建夏玉米苗數預測模型,實現免耕種植夏玉米出苗信息的統計,從而為夏玉米早期田間管理提供參考依據。
1 材料與方法
1.1 研究區域概述
研究區域位于山東省淄博市臨淄區朱臺鎮山東理工大學生態無人農場(36°57'12"N,118°12'58"E),屬暖溫帶半濕潤大陸性季風氣候,地形以平原為主,主要種植小麥、玉米等作物。試驗田總面積為43292m2,研究區域面積為7500m2。采用免耕方式種植夏玉米,行距60cm,株距20cm。雜草種類以小麥苗為主。研究區域如圖1所示。
1.2 數據獲取與預處理
于2022年7月4日(夏玉米3-4葉期)采集可見光影像數據,當日風力小于4級,天氣晴朗。數據采集設備為大疆M300 RTK,搭載大疆Zen-muse P1相機L(DJI DL 35mm F2.8 LS ASPH Lens鏡頭),設計航向重疊率為80%,旁向重疊率為85%,飛行高度為30m,飛行速度為5m/s,曝光方式為自動曝光,采用等時間間隔拍照模式,共采集970幅玉米可見光影像。利用Pix4Dmapper軟件對獲取的影像進行校正和拼接,得到空間分辨率為0.37Cm的正射影像。
在研究區域隨機選擇35個大小為3.6m×3.6m的樣方,方向分別為順壟和垂直壟方向,用于目視判讀玉米苗數。樣方選擇時,盡可能使樣方邊長是玉米行距和株距的整倍數,避免夏玉米苗被分塊切割,影響目視識別精度。
1.3 研究方法
首先對獲得的正射影像進行8種顏色特征分析,使用最大類間方差法實現非植被(裸土與麥茬)和植被(玉米與雜草)像元分離,提取非植被區域對可見光圖像進行掩膜;統計夏玉米與雜草(包括麥苗)的24項紋理特征,選擇提取夏玉米苗信息的最佳特征,采用時序交點閾值法得到夏玉米與雜草的分類二值圖;提取夏玉米苗形態特征參數,通過相關性分析篩選特征變量,然后采用4種機器學習算法(K近鄰算法、支持向量機、BP神經網絡、決策樹)對夏玉米苗數進行建模,實現夏玉米苗數估測。
1.3.1 非植被像元去除
對研究區域的地物分析發現,植被與非植被色彩差異明顯,非植被主要呈褐色,植被主要呈綠色,因此可以先從可見光圖像中去除非植被區域,從而提高后續夏玉米苗的提取精度。
最大類間方差法是一種自適應的閾值提取方法,核心思想是通過一個最佳閾值將圖像像元分為目標與背景兩類,具有運算快速和錯分概率小的特點,因此用于對本研究中綠色植被分布的識別和提取。最佳分割閾值的計算公式如下:
gm=w090+w1g1 (1)
S=w0(g0-gm)2+w1(g1-gm)2 (2)
式中:w0、w1、g0、g1分別為目標和背景的像元比例及平均灰度;gm為圖像總的平均灰度;S為最佳分割閾值。
植被指數是不同特定波長反射率的組合,由于不同地物反射率存在差異,其植被指數也各異。根據前人研究結果,本研究選擇CLI、NCRDI、ExG、NGBDI、Cg、ExR、ExG-ExR和RI共8種植被指數(表1),采用最大類間方差法基于這8種植被指數對圖像進行非植被像元分割,對比圖像分割效果后選出最佳植被指數,用于提取非植被區域對可見光圖像進行掩膜處理,從而實現植被與非植被的分割。
1.3.2 夏玉米苗目標提取
夏玉米苗與雜草顏色相近,從顏色特征難以對兩者進行分類識別,因此通過提取可見光圖像中夏玉米與雜草的紋理特征進行分類。紋理特征可以較好解決同譜異物的現象,進而提高地物的識別精度。通過對遙感數據紅(R)、綠(G)、藍(B)3個波段的灰度圖進行二階概率統計濾波,得到3個波段各白的均值、方差、協同性、對比度、相異性、信息熵、二階矩、相關性等24項紋理特征,二階概率統計濾波的窗口設置為7×7,方向為45°,灰度級為64。
人工目視隨機選擇468處夏玉米樣區,512處雜草樣區,從中提取24項紋理特征參數的均值和方差,進而根據雜草特征參數均值和方差得到雜草特征的變異系數(圖2),根據雜草和夏玉米特征的均值計算得到與玉米相對的差異系數(圖3)。變異系數是對樣本特征像元統計值分布離散程度的歸一化量度,差異系數是反映樣本像元特征的差異程度,通過選擇具有較小變異系數和較大差異系數的特征對夏玉米苗進行提取。經過對雜草特征的變異系數及其與夏玉米相對的差異系數進行排序評選,最終選擇紅色方差為區分玉米和雜草的特征。
采用時序交點閾值法確定最佳分離閾值,以像元統計個數為縱坐標,以紅色方差像元值為橫坐標,顯示夏玉米和雜草的高斯擬合曲線(圖4),以圖中夏玉米與雜草兩條線的交點作為兩者最佳分割閾值,為36.39。
1.3.3 夏玉米苗幾何特征提取
對夏玉米苗二值圖像觀察分析發現,有包含多株苗的連通區域,而連通區域夏玉米苗數會影響該區域的幾何形態特征。為優選特征變量,根據前人研究經驗,本研究共計算了夏玉米苗的9種幾何形態特征參數,如表2所示。
基于以上特征參數,對35個監測樣方內夏玉米苗的特征參數和所對應的苗數y進行相關性分析,結果如圖5所示,發現特征參數之間存在嚴重共線性。因此以相關系數0.8作為閾值進行篩選,最終選擇a3、a5和a7共3個變量進行建模。
1.3.4 模型構建及精度評價
在監測樣方內共統計1061條樣本數據,選擇742條數據用于模型訓練,剩余319條數據用于模型性能測試。采用K近鄰(KNN)、支持向量機(SVM)、BP神經網絡、決策樹4種分類算法進行建模。確定4種算法參數:KNN采用曼哈頓距離,最近鄰K值為30;SVM的核函數為徑向基函數(radial basisf'unction,RBF),懲罰系數為5,核函數系數為scale:BP神經網絡的激活函數為identity,求解器為adam,學習率0.1,迭代次數為1000;決策樹回歸采用遺傳算法,葉子節點數最大為50,應用五折交叉法進行驗證。
為了評價4種模型對夏玉米苗數預測的準確性,選用均方根誤差(RMSE)、平均絕對誤差(MAE)、決定系數(R2)對模型進行檢驗。3個指標的計算公式如下:
式中:IRE、IME、IR分別代表RMSE、MAE、R2的值;n為樣本數量;yi為實際值;y'i為預測值;y'為預測值的平均值。
2 結果與分析
2.1 非植被像元去除
為去除可見光影像中非植被區域,對整幅影像計算8種植被指數,采用Otsu算法對8種植被指數圖像進行植被與非植被分割,得到8張二值化影像,見圖6。可以看出,ExG-ExR、ExR、GLI、NCRDI 4種植被指數將麥茬錯分為植被,無法精準去除非植被區域;而Cg、ExG、NGBDI、RI對非植被像元均有較好的去除效果,土壤、麥茬像元摻雜較少。綜合對比分割結果,RI二值化圖像雜質較少、分割更為完整,因此選擇紅色植被指數二值化圖像對可見光影像掩膜,從而得到植被圖像。
2.2 夏玉米目標提取
從RI二值化圖像中可以發現,RI對綠色植被有較好的提取效果,但無法對雜草和夏玉米進行分割。圖7(a)為RI二值化圖像再通過腐蝕、膨脹等形態學操作處理后的影像,發現完全可以剔除夏玉米周邊面積較小且無粘連的雜草,但對于面積較大且與玉米密集粘連的雜草,如圖7(a)黃色圓內外的雜草,去除效果不佳。采用紋理特征提取夏玉米苗的效果如圖7(b)所示,可以看出該方法能夠剔除夏玉米周圍大面積雜草,精準提取玉米苗。
2.3 模型評價
用3種評價指標對4種機器學習模型的預測結果進行評價,結果(表3)顯示,支持向量機和決策樹模型的決定系數均達到0.8以上且MAE小于0.3,預測效果較好;其中決策樹算法的R2為0.941、RMSE為0.182、MAE為0.064,預測效果最好。K近鄰算法的預測效果最差,R2為0.729、RMSE為0.404。
圖8為基于決策樹模型的測試集數據預測結果。可以看出,樣本點玉米苗主要為1株,說明本試驗田的夏玉米苗以單株為主。對比實際調查結果發現,當樣本點實際苗數為1、2、3株時,準確率較高;而當實際苗數為4、6、7、8株時,準確率明顯下降。通過對誤差較大樣本的定位分析發現,當實際苗數為1-3株時,誤差可能是由夏玉米植株分布不均勻及葉片遮擋所引起:當實際苗數為4-8株時,誤差主要由夏玉米間的密集雜草粘連、間隙混入秸稈等噪聲引起,導致預測苗數過大:當玉米植株冠層相互重疊度較大時,預測苗數會小于實際苗數。
2.4 夏玉米總體苗情分布
整幅遙感影像覆蓋面積較大,難以處理,小范圍內玉米株數可以在一定程度上反映玉米的出苗情況,因此本研究按照邊長為1.2m的正方形監測單元對整幅影像做分割處理,分割成漁網狀,分別對每個網格內的苗數進行預測,一個網格理想出苗數為12株。基于決策樹模型預測結果計算樣方內夏玉米苗數,并繪制夏玉米苗分布圖直觀顯示苗情信息,如圖9所示。可以看出,監測單元內的夏玉米苗數多集中在6株及以上:該區域整體出苗率較差,可能受麥茬秸稈覆蓋影響較大:從圖9(a)可以看出有兩條缺苗帶,對比圖9(b),同區域的兩行小格子有多處為深綠色,對應的夏玉米苗數為零,可能是機器漏播所致,應及時補苗。
3 結論
本研究基于無人機可見光影像數據,采用紋理特征分析結合時序交點閾值法提取夏玉米苗二值化圖像,利用選取的形態學特征參數構建機器學習模型對玉米苗數進行預測,從而獲取免耕種植夏玉米出苗情況。主要結論如下:
(1)為了去除可見光影像中非植被區域,本研究通過計算8種植被指數并結合最大類間方差法分割植被與非植被像元,發現紅色植被指數(RI)二值化影像分割效果較好。因此利用該方法提取非植被區域對可見光影像進行掩膜,從而消除冗余信息并提高運行效率。
(2)針對基于植被指數無法對夏玉米和雜草進行有效分割的問題,采用灰度共生矩陣提取夏玉米和雜草的紋理特征參數,分析發現紅色方差結合時序交點閾值法分割夏玉米苗和雜草的效果最好。
(3)提取夏玉米苗形態學特征參數,構建4種夏玉米估算模型。模型測試表明,當樣點夏玉米苗數在1-3株、雜草與夏玉米葉片無粘連時,決策樹模型對夏玉米苗數預測的精度最高,總體精度91.4%,MAE值低于0.25。基于該模型繪制夏玉米苗情分布圖,可直觀顯示出田間苗情信息。
本研究方法能夠快速、準確獲取田間大面積夏玉米出苗情況,從而為夏玉米田間精細化管理提供技術保障。
基金項目:山東省自然科學基金項目(ZR2021MD091);山東省引進頂尖人才“一事一議”專項經費資助項目(魯政辦字[2018]27號 )