陳曉倩,唐晶磊,苗榮慧
(西北農林科技大學 信息工程學院,陜西 楊凌 712100)
?
正態分布下最小錯誤率的變量噴施貝葉斯決策
陳曉倩,唐晶磊,苗榮慧
(西北農林科技大學 信息工程學院,陜西 楊凌712100)
摘要:傳統農田除草采用田間統一定量均勻噴灑,導致了除草劑浪費和環境污染問題。智能變量噴施能夠保護環境和提高作物產量,是促進農業可持續發展戰略的重要途徑。為此,對經典的雜草監測參數進行改進并提出了正態分布下最小錯誤率的貝葉斯決策以實現精確變量噴施。首先對農田圖像進行灰度化、二值化及去噪等預處理;然后依據作物行中心線對農田圖像進行網格單元的劃分,并在網格單元格內提取改進的雜草監測參數;最后將貝葉斯決策分為兩個階段:線下階段利用改進的雜草監測參數數據庫計算正態分布參數,線上階段根據改進的雜草監測參數實現正態分布下最小錯誤率的貝葉斯決策,從而為變量噴施提供決策依據。實驗結果表明:正態分布下最小錯誤率的貝葉斯決策正確率可達92%,與BP算法和SVM算法相比決策正確率相對較高。
關鍵詞:變量噴施;雜草監測參數;正態分布;最小錯誤率;貝葉斯決策
0引言
我國是一個發展中的農業大國,農業發展關乎國家經濟和社會的發展。在長期的農業生產管理中,雜草始終是農作物的一個強大威脅因素。雜草生長速度快,可生長在農田的任何區域,與處于不同生長階段的作物爭奪陽光及養分。據不完全統計,我國農田雜草大概有1 500種多,其中常見雜草有200種多,惡性雜草有38種[1]。農田雜草危害面積大約4 000萬hm2,造成小麥減產40億kg,玉米減產20億kg[2]。根據國家農業部植保總站統計,我國每年用在除草上的勞動量高達20~30億個工作日,農田除草用工占田間工作總量的1/3~1/2,除草劑的施用量占農藥總施用量的20%,每年消耗總量近47萬t[3]。
由于生物防治和生態防治周期較長,目前雜草仍是通過化學防治進行及時控制。長期大面積粗獷式噴施化學除草劑,導致化學除草劑利用率較低,還帶來了嚴重的環境污染、化學農藥殘留超標和雜草抗藥性等嚴重的生態與農產品安全問題,嚴重威脅人類的健康。因此,精確識別雜草,可為智能化的變量噴施提供理論和技術上的支持,對“精準農業”在我國的發展,有著十分重要的現實意義和廣闊的發展前景。
綜合雜草識別的效率及成本問題,目前國內外主要采用計算機視覺的方法識別雜草。Manh等人利用可變形模板方法識別部分遮擋的葉片,主要通過檢測葉子的端部,然后進行變形使模型與葉片匹配;該方法只適用于葉片邊緣未被遮擋的情況,對于部分被遮擋的葉片識別則存在一定的局限性[4]。Steffen Gebhardt和Walter Kuehbauch采用形態學方法實現圖像分割獲得雜草葉片圖像,然后利用顏色和紋理特征進行雜草識別,雜草識別率約為90%;但該方法計算量大、識別速度慢、實時性差[5]。黃士凱等人以3葉期3行玉米田間圖像為研究對象,利用YIQ顏色空間中的Q分量灰度化田間彩色圖像,通過建立實際田間玉米行寬與圖像行寬玉米的映射關系,確定基于識別率和識別速度的覆蓋范圍,雜草識別率為89.2%;但該方法僅適用于3葉期等間距行寬作物[6]。楊會清等人利用BP神經網絡對田間雜草進行識別,以田間除草指標體系作為神經網絡的輸入,以田間除草指標的各級評價標準作為模型的訓練樣本和檢驗樣本,雜草識別精度較高;但該方法會受訓練樣本的選取影響識別精度[7]。
針對上述雜草識別的局限性,本文首先對農田圖像進行灰度化及去噪等預處理,然后基于Hough變換識別出作物行中心線,并根據農機行進速度對農田圖像進行網格單元劃分。為降低雜草監測參數WIR(Weed Infestation Rate)各分量的相關性和計算復雜度,將WIR改進為MWIR(Modified Weed Infestation Rate),并在網格單元內對MWIR進行計算;最后,在線下階段利用MWIR數據庫計算正態分布參數,線上階段采用基于正態分布下最小錯誤率的貝葉斯決策實現在線變量噴施決策支持。變量噴施貝葉斯決策流程如圖1所示。

圖1 正態分布下最小錯誤率的變量噴施貝葉斯決策流程圖
1圖像獲取及處理
1.1圖像獲取
本文圖像拍攝于西北農林科技大學北校區試驗田,拍攝時間為2013年6-7月,分別在不同的光照(晴天、陰天)、不同的時間段和不同的地塊條件下,實地拍攝了1 200幅彩色農田圖像,圖像格式為JPEG,如圖2所示。

圖2 圖像獲取
1.2圖像預處理
1.2.1圖像灰度化
本文拍攝的農田圖像是平行透視圖,即物體在視平線上某一點消失。針對這一特點,本文使用Ribeiro[8]對圖像進行灰度化處理。灰度化公式為

(1)
其中,R(i,j)、G(i,j)和B(i,j)分別是RGB圖像的3個分量,r、g和b是其對應實系數。根據Ribeiro[8],當r、g、b分別取值為-1、2和-1時,能獲取到較好的圖像效果。灰度圖像的像素值為

(2)
1.2.2圖像二值化
將RGB圖像轉化為灰度圖像后,可將灰度圖像進行二值化,目的是實現綠色植物和土壤背景的分割。通過實驗可觀察到圖像的直方圖具有雙峰性質。當圖像的直方圖呈現雙峰特性時,利用全局閾值法分割圖像效果較好[9]。因此,本文使用全局閾值法對圖像進行分割。全局閾值法首先根據圖像的直方圖會呈現出雙峰性質的原理,通過選取雙峰之間的谷底點對應的灰度值作為閾值,此閾值即為目標與背景之間的邊界;然后將圖像中的每個像素值與閾值相比較,最后根據比較結果將圖像進行分類,這樣便可將目標從背景中分離出來。
1.2.3圖像去噪
圖像二值化處理后,圖像中仍存在很多偽白色像素點如植物陰影、植物殘茬等,它們將會影響后續雜草監測參數提取的準確率。因此,需要進行圖像去噪,將偽白色像素點去除。
本文針對農田圖像是平行透視圖,即物體在視平線上某一點消失的特點,需使用不同的結構元素進行形態學開運算[10],即將圖像等間距的劃分為3部分,即左邊、中間和右邊,分別使用SL、SC及SR結構元素進行形態學開運算。最終,不僅消除了一些偽白色像素點,還達到了去噪以及平滑輪廓的效果[11]。
SL、SC和SR結構元素為

1.3作物行中心線的識別
通過圖像預處理,最終得到二值化圖像。其中,白色像素點包括雜草和作物,黑色像素點包括石頭、土壤、陰影等。在行檢測主要算法中,1962年由Hough提出的Hough變換算法被認為是最具有魯棒性,同時抗干擾能力較強,因此本文為了更好地查找作物行的中心線,采用Hough變換[12]。Hough變換主要是利用點-線的對偶性,即在原始圖像坐標下的一個點對應極坐標下的一條直線。
為避免直角坐標系中直線斜率趨于無窮大,需將點到線變換為點到正弦曲線,即直角坐標系x-y中的點(x,y)經過點-正弦曲線對偶變換為
ρ=xcosα+ysinα
(3)
在極坐標α-ρ中,0<α<180°,可證明直角坐標系x-y中直線上的點經過Hough變換后,對應的正弦曲線在極坐標系α-ρ中有1個公共交點[13]。在識別作物行中心線時,將農田圖像空間中的直線變換為極坐標參數空間的點,累加統計所有可能落在直線邊界上的點即可[14]。
Hough變換后,實驗結果如圖3所示,圖中縱線代表作物行中心線。

(a) 原始圖像

(b) 經Hough變換后的圖像

(c) 原始圖像

(d) 經Hough變換后的圖像
2雜草監測參數的提取
2.1網格單元的劃分
為進一步計算單元格內的雜草覆蓋面積、作物覆蓋面積,需要對農田圖像進行網格單元的劃分。網格單元的縱向線可由Hough變換后的農田圖像獲得,即作物行中心線可將農田圖像劃分為柵條形,則有
y=ku
(4)
水平線按照式(4)進行劃分。其中,u取值為4m,k=1,2,…,n;n的選取依據圖像高度。在本文中將n設為4,則每個單元格的面積為行寬與4m的乘積。由于獲取的農田圖像是透視圖(見圖2),當單元網格越來越多時,就會出現上面單元網格消失的現象,因此只需要處理每副圖像下面的單元格。
2.2經典雜草監測參數(WIR)計算及改進

(5)
(6)
其中,Ciw為單元格內的雜草覆蓋面積,Aic為單元格內的面積,Cic為單元格內的作物覆蓋面積,Cis為單元格內的土壤覆蓋面積。
(7)
其中,Ciw為單元格內的雜草覆蓋面積,Cic為單元格內的作物覆蓋面積。對比式(6)和式(7)可知:改進的雜草監測參數(MWIR)計算公式涉及參數較少,計算更加簡單,同時降低了兩個分量的相關性。
2.3MWIR的提取
對圖像進行網格單元劃分后,即可通過水平掃描法計算網格單元內的MWIR。如圖4所示的左下角為坐標原點O(0,0),分別用i和j標記單元格的行列號。下面以單元格G12為例,利用改進的水平掃描法,獲取式(5)、式(7)中雜草覆蓋面積和作物覆蓋面積等參數。改進的水平掃描法如下:
1)根據獲取的作物行的中心線,即直線a,首先以直線a為基準,向右掃描一定寬度的像素,將直線記作b,寬度根據經驗值獲取,將像素值之和記作Cicl。
2)以直線b繼續向右掃描,初始化k為單元格G12的高度。
3)判斷k是否大于等于0,如果是繼續;否則說明當前圖像掃描結束。
4)如果是白色像素點,則Cicl++;否則k--,轉到步驟2)。

O(0,0)abG12
圖5算法示例圖
通過上面步驟,即可得到Cicl為單元格G12左半部分的作物覆蓋面積;采用同樣原理,可獲得單元格G12右半部分的作物覆蓋面積,記作Cicr。通過相加Cicl和Cicr即可得到單元格G12內作物所占面積。根據二值化后的圖像可統計單元格G12內白色像素點之和,記作Si;單元格G12的面積,記作Aic。則作物覆蓋面積、雜草覆蓋面積和土壤覆蓋面積為
作物覆蓋面積Cic=Cicl+Cicr
(8)
雜草覆蓋面積Ciw=Si-Cic
(9)
土壤覆蓋面積Cis=Aic-Si
(10)
3正態分布下最小錯誤率的貝葉斯決策
提取出單元格內的雜草覆蓋率和雜草威脅率兩個分量后,即可為變量噴施提供決策支持,本文使用基于正態分布下最小錯誤率的貝葉斯進行決策。
本文將基于正態分布下最小錯誤率貝葉斯決策分為兩個階段:線下階段和線上階段。在線下階段,只需將雜草監測數據庫中的數據進行統計分析,計算出正態分布的相關參數即可;在線上階段,采用基于正態分布下最小錯誤率的貝葉斯決策進行在線實時變量噴施。
1)線下階段:將前述的1 200幅圖像進行分割,并進行網格單元劃分,獲取到5 600個網格單元。請農學院具有圖像分析經驗的作物學專業研究生進行人工判別,需要噴施的網格數為4 536個(標記為y),不需噴施的為1 064個(標記為n),則先驗概率分別為P(Wn)=0.81,P(Wy)=0.19。


(11)

(12)

(13)

(14)
通過線下階段,即可獲取正態分布相關參數,然后利用基于多元正態分布模型下的最小錯誤率貝葉斯決策的判別函數進行線上變量決策。
2)線上階段:基于多元正態分布模型下的最小錯誤率貝葉斯決策的判別函數為
(15)

4實驗結果與分析
為了更好的評價決策結果的準確性和有效性,本文將實驗結果分為4類,如表1所示。
將4類實驗結果進行合并,用決策正確率P1和威脅錯誤率P2表示。則有
(16)
(17)
由式(16)、式(17)可知:P1越大表明決策正確率越高;P2越小表明需要噴施但沒有噴施的單元格數目越少,因此對作物的影響后果較小,不會威脅作物的生長。

表1 實驗結果分類
本文以100組實驗數據為例進行測試,利用多元正態分布模型下的最小錯誤率貝葉斯決策的判別函數進行決策,決策實驗結果如表2所示。將決策結果與人工判斷結果進行比較,決策正確率為92%,威脅錯誤率為4%。從實驗結果可知:只有少部分如編號為第4和第8組的數據出現決策失誤。分別對第4和第8組的處理過程和數據進行分析,主要原因為圖像預處理中,噪聲去除不徹底,利用Hough變換查找作物行的中心線時,偏離作物行中心線和利用改進的水平掃描法獲取植物覆蓋面積等時出現誤差。

表2 實驗決策結果

續表2
為了驗證本文算法的有效性,首先選取15幅圖像,然后經過網格單元的劃分后有80個單元格,并從單元格中提取NWIR,最后對神經網絡(BP)算法、支持向量機(SVM)算法與本文算法進行比較分析:BP算法決策正確率為88.5%;SVM算法決策正確率為94%;本文算法決策正確率為92%。與BP算法相比,本文算法比BP算法決策正確率高。主要原因是:①BP算法需要根據經驗值來設置隱層數和隱節點個數,而隱節點的選取缺乏理論指導,主要取決于訓練樣本數量和樣本噪聲,因此樣本的選擇對BP網絡的影響很大;同時,BP算法易形成局部極小而影響全局最優。②SVM雖然決策正確率較高,但其借助二次規劃進行求解支持向量,而求解向量將會涉及到n階矩陣的計算,當n數目非常大時,將會帶來空間效率問題。③對于正態分布下的最小錯誤率的貝葉斯決策,在線下階段只需要根據樣本數據庫獲取參數,在線上階段即可根據相關參數進行在線變量決策,具有實時性,因此使用此算法決策正確率是相對較高的。
5結論
針對傳統農田統一定量均勻噴灑除草劑帶來的除草劑浪費和環境污染問題,利用計算機視覺技術,首先對分割后的農田圖像進行網格單元的劃分;然后以經典的雜草監測參數(WIR)為基礎,對其進行了改進,降低了計算復雜度,并在網格單元格內計算改進的雜草監測參數(MWIR);最后,提出基于正態分布下的最小錯誤率的貝葉斯決策實現在線變量噴施。實驗結果表明:雜草識別決策正確率達92%,可以滿足精細農業的精確除草要求。
參考文獻:
[1]許辛穎.面向雜草識別的K近臨算法研究[D].哈爾濱:東北農業大學,2013.
[2]鄧巍,何雄奎,張錄達.雜草光譜識別技術應用綜述[C]//2008年植保機械與施藥技術國際研討會,2008:86-91.
[3]李先鋒.基于特征優化和多特征融合的雜草識別方法研究[D].鎮江:江蘇大學,2010.
[4]Manh A G, Rabatel G, Assemat L, et al. Weed Leaf Image Segmentation by Deformable Templates[J].Journal of Agricultural Engineering Research,2001,80(2):139-146.
[5]Gebhardt S, Kuehbauch W. A new algorithm for automatic rumex obtusifolius detection in digital images using color and texture features and the influence of image resolution[J].Precision Agric,2007(8):1-13.
[6]黃士凱,祁力鈞,張建華,等.基于行寬的玉米行間雜草識別算法[J].中國農業大學學報,2013,18(1):165-171.
[7]楊會清,李明剛.基于BP神經網絡的田間雜草識別技術研究[J].山東理工大學學報:自然科學版,2014,28(2):70-74.
[8]Ribeiro A, Fernández-Quintanilla C, Barros J, et al. Development of an image analysis system for estimation of weed pressure[C]//Precision Agriculture 05 Papers Presented at European Conference on Precision Agriculture,2005:169-174.
[9]何東健,耿楠,張義寬.數字圖像處理[M].西安:西安電子科技大學出版社.2008:82-83.
[10]Pablo M, Granitto, Pablo F, et al. Large-scale investigation of weed seed identification by machine vision Compute[J].Computers and Electronics in Agriculture,2005(47):15-24.
[11]AlbertoTellaeche, Gonzalo Pajares, Xavier P. A computer vision approach for weeds identification through Support Vector Machines[J].Applied Soft Computing,2011(11): 908-915.
[12]段汝嬌,趙偉,黃松嶺,等.一種基于改進Hough變換的直線快速檢測算法[J].儀器儀表報,2010,31(12):2774-2779.
[13]張廣斌,束洪春,于繼來.基于Hough 變換直線檢測的行波波頭標定[J].中國電機工程學報,2013,33(19):165-173.
[14]章毓晉.圖像工程[M].北京:清華大學出版社,2000:64-66.
[15]Alberto Tellaeche, Xavier P, Burgos-Artizzu, et al. A Vision-based method for weeds identification through the Bayesian decision theory[J]. Pattern Recognition,2008,41(2):521-530.
Variable Spraying Based on the Minimum Error Ratio of Bayes Decision under Normal Distribution
Chen Xiaoqian,Tang Jinglei,Miao Ronghui
(College of Information Engineering, Northwest A&F University, Yangling 712100,China)
Abstract:Traditional farmland spraying is united quantitative and evenly, and this cause the waste of herbicide and environment pollution. Intelligent variables spraying, which not only can protect environment but also increase crop output, is the crucial way to promote sustainable agriculture development. In this paper, first modified the classic weed infestation rate(WIR)and then an accurate variables spraying based on the minimum error Bayes decision under normal distribution is presented. Firstly, farmland images are pre-processing using graying, binary and de-noising. Secondly, grid unit of farmland images are divided according to the centerline of crop rows and then compute the modified weed infestation rate(MWIR) in the grid unit. Finally, bayesian decision is divided into two stages. Normal distribution parameters are computed base on database of MWIR in the offline stage, and Bayes online decision based on minimum error according to MWIR under normal distribution, which provide basis for decision making of intelligent variables spraying.The experimental results showed that the accuracy of this algorithm is as high as 92%, which exceeded BP algorithm and SVM algorithm.
Key words:variable spraying; weed infestation rate; normal distribution; minimum error; bayes decision
文章編號:1003-188X(2016)07-0114-06
中圖分類號:S491;TP391.4
文獻標識碼:A
作者簡介:陳曉倩(1992-),女,陜西渭南人,碩士研究生,(E-mail) SaraCXQ@163.com。通訊作者:唐晶磊(1974-),女,河北邢臺人,副教授,博士,(E- mail)tangjinglei@nwsuaf.edu.cn。
基金項目:國家高技術研究發展計劃資助項目(2013AA- 10230402);國家自然科學基金項目(31101075);西北農林科技大學科創專項(QN2011069)
收稿日期:2015-06-08