劉哲, 烏偉, 張善文, 崔倩倩, 李瑞洋
(西京學院信息工程學院, 西安 710123)
種植密度影響小麥生長的許多方面,包括產量、水和肥料需求以及對病原體的易感性等。小麥的最佳種植密度提供了最佳的小麥冠層結構,對其籽粒產量和品質有重要的影響,及時準確對田間苗數進行計算對于指導生產具有積極意義[1-3]。在傳統測產過程中,首先要人工獲得單位面積內的小麥穗數和穗粒數,然后根據籽粒的千粒質量計算得到小麥的產量,這種估產方法往往耗時耗力,效率低下。近年來,隨著圖像處理技術和人工智能技術的發展,逐步被應用于農作物生長管理中,對改善傳統農業操作方式和實現農業智慧化等方面做了有意義地探索工作。在小麥育種和生長管理過程中,圖像處理技術和人工智能的應用主要體現在病害診斷[4-6]、品種分類[7-9]、不完善籽粒檢測[10-12]、產量預測[13-16]、小麥籽粒形態測量[17-20]等方面。
在農作物測產方面,龔紅菊[21]基于彩色攝像機拍攝成熟期水稻群體圖像,運用分形理論和圖像紋理分析方法分析水稻群體圖像的分形特征,完成水稻穗頭計數,用多元線性回歸方法建立單位面積水稻穗頭與水稻產量的數學模型,模型估產精度為92.57%。Reza等[22]提出了一種基于形態運算和連通邊界的水稻植株數自動圖像處理計數方法,其計數精度達到了89%~93%。劉濤等[14]利用圖像的顏色特征和紋理特征對大田環境下麥穗圖像進行分割,通過對撒播和條播各35 幅樣本圖像進行計數實驗,準確率分別為95.77%和96.89%,該方法在麥穗圖像沒有粘連時計數精度較高,當麥穗粘連時該方法精度較差。范夢揚等[15]采用支持向量機學習方法精確提取小麥麥穗輪廓,同時構建麥穗特征數據庫對麥穗進行計數,平均識別精度高于93%。杜世偉等[23]提出了一種基于圖像處理技術的小麥小穗拋物線分割方法,實現了小穗數及麥粒數的同步識別計數,使用3 個品種小麥穗圖像對麥粒數計數方法進行驗證,結果表明,麥粒數計數的平均絕對誤差為2.11%,平均相對誤差為5.62%。Fernandez-Gallego等[24]提出選擇拉普拉斯頻率濾波器去除圖像中出現的低頻和高頻元素,使用中值濾波器減少存在于麥穗周圍的噪聲,最后通過查找最大值分割局部峰值并確定圖像中的麥穗數目,其算法識別精度達到了90%。Zhu等[25]提出了一種粗檢測和細檢測相結合的兩步小麥穗檢測方法,在粗檢測步驟中密集提取SIFT尺度不變特征作為低層視覺描述符,選取候選的麥穗區域;在細檢測步驟中使用Fisher向量(FV)編碼生成中層表示,去除非麥穗區域,結果表明,與人工觀測相比,自動檢測麥穗計數法是可以接受的。Li 等[26]利用麥穗植株圖像中穗頭的顏色和紋理等特征參數,并結合神經網絡來檢測小麥穗頭,檢測正確率在80%左右,但是該研究是在基于實驗室環境下所培養的盆栽小麥上進行的,并未應用到實際田間測產中。李毅念等[27]基于凹點檢測匹配連線方法實現粘連麥穗的分割,進而識別出圖像中的麥穗數量,通過計算圖像中每個麥穗的面積像素點數得到每個麥穗的籽粒數,該方法在識別3個品種田間麥穗單幅圖像中麥穗數量的平均識別精度為91.63%,籽粒數的平均預測精度為90.73%;對3 個品種穗數、籽粒數及產量預測的平均精度為93.83%、93.43%、93.49%。在作物種植密度估計方面,Liu等[28]在超綠色空間利用OTSU方法從背景中提取小麥幼苗信息,通過分析田間重疊區域的特征參數,建立了基于鏈碼的骨架優化方法和相應的方程,用于重疊區域小麥幼苗的自動計數,結果表明,該方法可以有效地計算小麥苗數,平均準確率為89.94%,最高準確率為99.21%。Nasim等[29]通過低空無人機獲取地面水稻植株圖像,基于形態學操作和連通成分邊界的自動圖像處理方法對獲取的圖像進行自動處理,計算移栽后的水稻植株數量,結果表明,該算法平均準確率為87%。Liu等[30]使用圖像分析技術提取幼苗,計算幼苗的覆蓋度和重疊葉的角點數,利用多元回歸分析構建小麥幼苗數量估算模型,當該模型應用于不同品種時,決定系數R2始終大于0.85,表明該模型適用于不同品種,隨著葉片階段或密度的增加,模型的準確性下降,但最小決定系數R2仍然大于0.83,表明該模型對不同葉齡和密度的幼苗具有良好的適應性。Liu等[31]從地面沿行方向拍攝得到麥苗RGB高分辨率圖像,統計表明,沿行方向的相鄰麥苗之間的間距是獨立的,并且在經歷行距變化條件下遵循伽馬分布,然后導出伽馬計數模型以估計麥苗密度,估計精度達到了90%。
綜上所述,目前運用圖像處理技術對田間小麥種植密度進行估計主要是通過圖像分析的方法對小麥幼苗(幼苗的1葉至3葉期)進行識別和計數,從而得到小麥的種植密度。但是復雜環境對小麥的出苗率和成活率會造成很大的影響,需要持續對小麥各個生長階段進行監測,通過小麥生長密度的變化來評估小麥的長勢,這就需要一種比較通用的小麥種植密度估計方法。為此,本文提出一種基于多元嶺回歸模型估算小麥種植密度的方法,該方法以麥苗的邊緣像素總和、麥苗面積像素總和、麥苗局部紋理特征作為輸入參數,麥苗密度作為輸出參數,得到麥苗密度與特征參數間的多遠回歸方程,具有一定的通用性且估計精度較高。
麥苗圖像拍攝地點在陜西省寶雞市農業科學研究院試驗場,位于寶雞市岐山縣鳳鳴鎮,拍攝時間為2018年10月30日至11月05日下午,小麥正處于分蘗期,生長態勢良好,品種分別為西農529、西農511、西農583、陜農33,獲取圖像樣本分別為100、100、150、150幅。拍攝器材選用陜西維視MV-E工業相機,采用千兆以太網絡進行傳輸,相機功耗低、散熱良好,具有圖像質量清晰、色彩還原性好和工作穩定等特點,支持IO信號輸入輸出,圖像分辨率為2 560×1 920像素,圖像格式為JPG,相機拍攝視場大小為0.75 m×0.40 m。在晴天微風條件下進行垂直拍攝,拍攝高度距離地面80 cm,拍照時間15:30~16:30。
對采集地麥苗圖像進行處理,首先,將采集的彩色麥苗圖像從RGB顏色空間轉到Lab顏色空間,基于改進的K-means算法在Lab空間對麥苗進行分割;其次,對訓練圖像進行標準化,求得圖像的面積特征、輪廓特征和LBP紋理特征,將其特征值和麥苗數作為輸入參數,利用多元嶺回歸得到麥苗圖像特征值與麥苗數間的函數關系;最后,將測試圖像特征值代入函數,計算麥苗密度值。
RGB顏色空間無法直接轉換成Lab,需要先轉換成為XYZ顏色空間,再轉換到Lab顏色空間,再通過式(2)轉換到Lab顏色空間。
(1)
(2)
(3)
式中,Xn、Yn、Zn一般默認是95.047、100.000、108.883。
K-means算法中K個聚類中心是事先給定的,由于無法確定數據集的的合適類別個數,可能導致無法得到有效的聚類結果。為此,本文對K-means算法進行改進。
在此定義2個參數ρi和δi,ρi表示第i個數據點的局部密度,δi表示第i個數據點與最近鄰類間距離。首先,求出數據xi與數據集中其他數據點xj之間的距離dij。
(4)
式中,dc為截斷距離。

(5)
根據式(4)得到所有數據點的局部密度后,按照密度值由大到小排序,取前k個密度值較大的數據點,于是得到δi。
(6)
式中,l代表密度值最大的k個數據點。

(7)
計算出每個像素點的(ρi,δi)值,設ti=ρiδi,依據麥苗圖像由麥苗和土壤2部分構成,選取ti值最大的2個像素點作為麥苗圖像的2個聚類中心,然后依據歐氏距離相近原則,將所有像素點進行聚類。
針對麥苗彩色圖像像素的三顏色分量之間存在的高度相關性特點,本文采用基于Lab 顏色空間改進的K-means算法進行彩色圖像分割。
為了對獲取的麥苗圖像進行密度估計,首先對麥苗圖像進行標準化。文中獲取的麥苗圖像分辨率為2 560×1 920像素,把每幅圖像裁剪成100個256×192像素的標準塊圖像。每種小麥分別選取5 000個標準塊圖像作為訓練圖像,100幅標準塊圖像作為測試圖像。
對于訓練圖像,分別提取圖像的面積特征、輪廓特征、LBP紋理特征作為輸入。
①面積特征定義為:麥苗在圖像中的像素數,用a來表示。
②輪廓特征定義為:麥苗邊緣在圖像中的像素數,用c來表示。
③LBP紋理特征定義為:LBP麥苗紋理特征圖像的直方圖,用b來表示。
對于給定的訓練圖像Ii,i=1,2,…,N,N為輸入訓練圖像的總數,分別提取Ii的面積特征ai、輪廓特征ci、LBP紋理特征bi作為訓練輸入向量,xi=[ai,bi,ci],Ii中的麥苗密度yi作為訓練輸出,于是{xi,yi}作為訓練對式(8)訓練輸入和輸出映射函數的參數。
(8)
對于{xi,yi},多元嶺回歸模型如式(9)所示。
(9)
這里W∈1×3和b∈1×1分別表示權矩陣和偏置向量,稱為弗羅貝尼烏斯范數(簡稱F-范數),λ是一個控制懲罰和擬合之間權衡的參數。求解(9)式等效于對式(10)進行求解。
(10)

θ=-(QTQ)-1QTP
(11)
多元嶺回歸估算麥苗密度算法流程如圖1所示。

圖1 多元嶺回歸估算麥苗密度算法流程
為了驗證本文方法的性能,采用決定系數R2、統計誤差Pe和統計精度Pa三個指標參數進行評價,這3個指標參數計算公式分別如式(12)~(14)所示。
(12)
(13)
(14)
式中,M代表總共要估計的麥苗密度圖像數,i代表第i個麥苗圖像,Yi代表本文算法對第i個麥苗圖像的麥苗密度估計結果,Xi代表人工對第i個麥苗圖像的麥苗密度計數結果。
對采集的原始麥苗圖像用本文所提的方法進行處理,分別得到麥苗圖像的分割圖像、輪廓圖像、紋理圖像,結果如圖2所示。可以看出,用改進K-means算法對麥苗圖像進行分割,能很好的把麥苗從背景中分割出來;在麥苗分割圖像的基礎上,運用圖像邊緣提取方法得到輪廓圖像,再經LBP方法獲得紋理圖像。LBP是一種用來描述圖像局部紋理特征的算子,具有旋轉不變性和灰度不變性等顯著的優點。基于麥苗LBP紋理圖像統計直方圖獲得麥苗訓練圖像塊的面積特征、輪廓特征和紋理統計直方圖特征(圖3),用這些特征參數就能夠訓練和計算麥苗的種植密度。

圖2 麥苗圖像處理結果比較

圖3 麥苗LBP紋理圖像的統計直方圖
圖4給出了4種品種小麥人工測量麥苗密度與算法估計麥苗密度間的線性相關關系。由圖4可知,4個品種利用圖像處理算法估測的麥苗密度與人工實測麥苗密度具有極其顯著的線性相關性,所有品種的計數預測值與實測值的決定系數R2都大于0.85。根據算法估計的麥苗密度分別是“西農529”是318.6萬株·hm-2、“西農511”是307.95萬株·hm-2、“西農583”是297.9萬株·hm-2、“陜農33”是311.25萬株·hm-2。

圖4 4個品種小麥人工測量麥苗密度與算法估計麥苗密度間的線性相關關系
人工實測麥苗密度和算法估計麥苗密度的統計分析比較結果如表1所示。可以看出,4個小麥品種的麥苗密度平均統計誤差是6.01%,平均統計精度是93.99%,比人工實測的結果偏小。

表1 人工計數與算法計數統計比較
圖5給出了同一幅麥苗圖像在RGB顏色空間和Lab顏色空間的圖像顏色分量變化特征,可以看出,R顏色值、G顏色值和B顏色值變化趨勢比較一致,具有很強的相關性,由麥苗向土壤過度時或者由土壤向麥苗過度時,各顏色值沒有明顯的變化,所以在RGB顏色空間很難精確地表示麥苗顏色和土壤顏色之間明顯的差距。同時,由圖5可以看出,Lab顏色空間的a和b顏色值在由麥苗向土壤過度時或者由土壤向麥苗過度時變化非常明顯,可以區分出麥苗和土壤。所以在Lab顏色空間運用改進的K-means聚類算法能夠分割出麥苗。

圖5 不同顏色空間的顏色值
本文提出了一種不借助于特制儀器,直接用數碼相機獲取自然生長條件下的麥苗圖像。RGB 顏色空間是面向設備的顏色空間,其用歐幾里德距離表示三顏色距離,三顏色分量之間存在高度相關性和非線性,導致在RGB顏色空間進行圖像分割結果的魯棒性不佳。Lab 顏色空間是與設備無關的最均勻的顏色空間,其用歐氏距離來表示色差。用歐氏距離表示色差既能滿足人眼對圖像的敏感性,又能較精確地測量顏色之間微小的差距,在彩色圖像分割中使用歐氏距離來表示人類對顏色的差別感知。分割時,K-means算法基于樣本之間的距離大小將給定的樣本集劃分為K個簇。為了使簇內的點盡量緊密的連在一起,簇間的距離盡量大,由于無法確定數據集的的合適類別個數,可能導致無法得到有效的聚類結果。為此,對K-means算法進行了改進。本研究在Lab 顏色空間能較精確地測量麥苗顏色和背景顏色之間微小的差距,進而運用改進的K-means聚類算法將麥苗從背景中分割出來。
利用本文提出的算法對麥苗圖像進行處理分析可得到麥苗密度的估計值,但比實測值偏小,主要有兩點原因:①由于本文算法在進行估算時,麥苗的葉子會交疊在一起,從而造成麥苗真實面積會有所減小,造成估計誤差;②利用圖像分析求麥苗輪廓長度時,由于麥苗的葉子交疊在一起,從而造成麥苗真實輪廓長度會有所減小,造成估計誤差。
總體來說,本文提出的麥苗密度估算方法能夠適用于麥苗的不同生長階段,而且是一種非接觸式測量方法,不需要采集麥苗樣本,在田間直接操作可以獲取測量參數,快速便捷。