伍鎣芮,張志勇
(山西農業大學農業工程學院,山西太谷030801)
我國是世界上最大的番茄生產國,年產量高達6 300 萬t,棚室種植是主要的種植方式。棚室番茄普遍采用人工采摘,人工成本費用較高,占總生產費用的比例約為50%~70%,且人工長時間工作,會影響采摘效率。相比于傳統的人工采摘,采用果蔬采摘機器人進行作業可以降低勞動成本、減輕勞動強度。果蔬采摘機器人使用計算機視覺技術,根據形狀、紋理、顏色等相關信息將番茄果實從原始圖像中分割出來,通過控制末端執行器完成果實的采摘任務。利用計算機視覺技術完成果蔬識別任務是保證機器人精準作業的重要前提[1-3]。
目前,國內外眾多學者基于計算機視覺技術開展了對果蔬目標識別的研究。TAO 等[4]提出一種基于點云數據的蘋果自動識別算法,融合支撐向量機能夠分辨蘋果果實、樹枝和樹葉。JHAWAR[5]提出了一種基于模式識別的柑橘自動識別方法,能夠判別柑橘果實的成熟度。YU 等[6]提出了一種基于目標區域卷積神經網絡和深度學習的草莓識別算法。鄧立苗等[7]基于MATLAB 建立了一個批量處理玉米葉片的特征提取與識別系統,使用了支撐向量機(SVM)和卷積神經網絡(CNN)訓練模型并自動提取和識別目標物。王茂林等[8]、楊天樂等[9]、馮曉等[10]分別使用圖像識別技術識別水稻、薊馬和小麥。
棚室環境下,番茄圖像中的果實部分可能會出現光斑現象,且棚室內棚頂曝光過強,背景較為復雜,該環境下識別番茄果實目標準確率不高。為提高棚室環境下番茄果實目標識別率,本研究分別使用色差法、K-means 算法和DBSCAN(Density-Based Spatial Clustering of Application with Noise)算法對棚室環境內的番茄果實圖像進行分割識別,分析比較3 種算法的識別分割效果,為棚室環境下番茄采摘機器人準確識別番茄果實提供研究基礎。
本研究所使用的棚室環境下的番茄圖像拍攝于山西省晉中市太谷區巨鑫現代農業園區(經度112.48°,緯度 37.39°)。筆記本 CPU型號為Intelcorei5,內存4 G,硬盤容量500 G。拍攝相機為3D-1MP02-V92,CMOS 型感光元件,拍攝輸出圖像分辨率為2 560 像素×960 像素,拍攝時候最高幀數為60 幀,拍攝輸出圖像格式為JPG,支持win 7、win 8、win 10等電腦系統,所用軟件為MATLAB2018B。在棚室環境內采集拍攝圖像時,盡量保證光照較為合適,減少拍攝鏡頭的抖動,攝像機通過MICROUSB 口連接至計算機,便于將拍攝的圖像隨時保存至本地以供計算機處理。本試驗共拍攝棚室環境下番茄原始圖像60 張,隨機選擇的2 個樣本的番茄果實圖像如圖1 所示。

1.2.1 色差法 色差法利用圖像色域信息不同識別圖像目標區域,亦是區分目標與背景最為直觀的方式。在棚室環境內,成熟的番茄果實與背景內的莖稈、枝葉等顏色相差較大,因此,利用番茄果實與背景在色域上的差異性來提取目標果實具有較高的可行性。色差法通常基于RGB 模型進行分析,RGB 是由紅(R)、綠(G)、藍色(B)三原色混合疊加的顏色模型。
1.2.2 DBSCAN 算法 DBSCAN 算法是一種新型的基于密度的聚類算法,常應用于數據挖掘[11]、圖像分割[12]、供應商優化[13]、空間聚類[14-16]等。其原理是找出輸入數據集中密度最高的部分區域劃分為一個聚類簇。DBSCAN 需設置2 個參數:領域半徑R 和最少點數目MP(min points)。輸入的數據點完成聚類后共有3 類標簽:核心點、邊緣點和噪聲點。核心點是領域半徑R 內的數據點數量大于等于最少點數目MP 的點,同一簇內不屬于核心點的數據點稱為邊緣點,不屬于上述2 類點的數據點稱為噪聲點。算法迭代完成后將圖像中的目標區域與背景區域分割。
1.2.3 K-means 算法 K-means 是一種常見的基于歐氏距離的幾何聚類算法。常用于數據的聚類劃分[17-20]、模型的參數評價[21]等。該算法的思想將待聚類的數據劃分為K 組,先隨機選擇K 個點作為聚類初始的中心,依次計算所有數據點到這K 個中心點的距離,將所有距離中心點最近的點劃分為一個聚類簇,然后在簇內取所有同簇點的幾何均值中心,作為新的聚類中心,重復上述步驟直到所有數據點的分不再發生改變或者達到最大迭代次數。此時所有數據點均完成聚類劃分,實現對目標與背景的分割。DBSCAN 算法和K-means 算法基于HSV色域模型進行分析。
棚室內采集的原始圖像存儲格式為JPG,默認使用RGB 顏色模型。將拍攝的60 幅圖像分為10 組,每組6 張。樣本1 和樣本2 的番茄原始圖像與RGB三原色如圖2 所示。

統計每組圖像的R 和G 分量信息,結果如表1所示。從表1 可以看出,原始圖像的R 與G 分量之間的差值比其他分量之間的差值更大,R-G 的平均值接近100,可選取合適的閾值T 來區分番茄果實與背景。

表1 樣本番茄分量統計情況
棚室環境下,由于曝光較強會在番茄果實上形成光斑,經過多次試驗調節,設置閾值T 為120,2 幅番茄果實圖像的R-G 與R-G 閾值分割識別效果分別如圖3、4 所示。由分割圖可知,色差法能成功將果實區域與背景分離,但對光斑較為敏感,造成果實識別形狀不完整。


DBSCAN 算法通常基于HSV 進行分析,原始圖像在HSV 色域模型下成像效果如圖5 所示,HSV 色域模型的H 分量直方分布如圖6 所示。
由圖6 可知,HSV 模型的H 分量有明顯的雙峰,設置DBSCANS 算法密度半徑R 為10,最少點數量MP 為5,使用該算法對番茄果實圖像的H 分量聚類的識別效果如圖7 所示。從圖7 可以看出,DBSCAN 算法對光斑和背景噪音的抑制能力較好,果實形狀完整且與背景分割效果明顯。




K-means 算法也以HSV 色域模型中H 分量為試驗對象,設置聚類簇數為5,識別結果如圖8 所示。由圖8 可知,K-means 算法識別果實形狀完整,無明顯光斑,但是對棚室背景噪音的魯棒性不強。
使用3 種算法對10 組番茄圖像進行分割試驗的信噪比和平均耗時結果如表2 所示。
由表2 可知,3 種算法中DBSCAN 算法的平均耗時最短,約為292 ms,對比色差法的503 ms 和K-means 算法的591 ms 有較大提升。且DBSCAN算法的信噪比最高,為95.2%,高于其他2 種算法。

表2 3 種算法的試驗結果
本研究分別使用色差法、K-means 算法和DBSCAN 算法對番茄圖像進行分割識別。色差法識別番茄果實圖像原理較為簡單,但對棚室環境下番茄果實圖像出現的光斑問題較為敏感,識別番茄果實形狀不完整;使用K-means 算法識別番茄果實圖像時對果實區域識別效果較好,但對原圖像中的邊緣噪聲以及棚室頂部的曝光噪聲較為敏感,信噪比較低,受棚室環境的影響較大;使用DBSCAN 算法識別番茄果實圖像時運行時間短,且對背景中的噪聲抑制效果最佳,分割效果最好。棚室環境下使用DBSCAN 算法識別番茄果實圖像能滿足實際的采摘需要,為番茄自動采摘機器人的研發提供了一定的理論基礎。