







摘 要:我國作為水果生產大國,機器視覺技術已被用于水果的檢測識別中。然而在自然條件采摘過程中,往往受到光照不均、枝葉遮擋、果實重疊等復雜環境的影響,導致果實不易被辨識。因此,如何在復雜條件下,能快速、簡單、高效地檢測出目標具有重要意義。以柑橘為例,對數據采用數據增強和特定預處理方式,并用YOLOv5網絡對自然條件下柑橘進行檢測識別。在數據處理中,對樣本進行標注,然后通過對數據進行特定情況預處理,降低自然條件下光照遮擋、搖晃等環境的影響,提升模型魯棒性;通過對樣本數據增強,豐富訓練數據,提高模型泛化能力。通過實驗對比不同迭代次數與步長的模型效果,選出模型最合適的參數值。實驗表明,數據未經過特殊預處理,模型檢測識別率較低,而經過特殊預處理后(降低復雜環境的影響),模型檢測識別率較高,效果明顯,為在自然條件下水果采摘奠定了理論基礎。
關鍵詞:YOLOv5;自然條件;水果檢測;目標識別
中國作為水果主要產地之一,有著豐富的資源,然而其采摘過程比較繁瑣,機械化水平不高,效率低,成本高。為了解決這一問題,研究者將機器學習、深度學習、機器視覺等技術引入采摘機器人來提高采摘效率,降低人力成本[1-2]。從國內外研究情況看,當前最常用的方法是基于傳統的檢測識別和深度學習的目標識別方法[3]。傳統的水果檢測與分類方法需要手工抽取圖像特征,可檢測對象較為單一;且受到光照條件、復雜背景等影響,檢測結果存在誤差,效率較低,難以實現實時檢測[3-5]。相對于傳統的方法,深度學習因其能自主提取數據特征,在復雜情況下對水果檢測與識別具有更為出色的表現[4,6-8]。例如,為了減少 CNN在池化時會丟失部分特征,導致識別精確度降低,簡欽等[8]提出FC-CNN模型進行自主采樣,并用于水果識別分類,準確率達到99.63%。
隨著檢測與識別模型不斷優化,YOLO憑借實時檢測、速度快、精度高、網絡結構簡單等性能,在水果圖像檢測、分類方面取得了較好的效果[4]。為了降低夜間雜亂環境下對柑橘檢測和識別的影響,熊俊濤等[9]提出采用Des-YOLOv3算法進行特征提取和融合,有效地提高了檢測精確度,精確率達97.67%。裴瑞景等[10]提出一種改進的YOLOv4算法,該算法中引入注意力機制提高模型提取信息能力、引入殘差模塊加快網絡收斂速度。楊世忠等[11]在YOLOv5基礎上,提出用輕量級網絡結構(ShuffleNet)減少模型參數、降低模型復雜性,且作者設計α-EIoU損失函數作為目標檢測的評價指標,平均檢測精度均值達到了97.6%。然而,針對雜亂背景下的水果圖像,傳統的YOLOv5 模型存在漏檢或誤檢情況,檢測識別精確度有待提升[4]。
因此,為了降低自然條件復雜性,增強圖像清晰度和圖像抗噪性能,提升自然狀態下水果目標的檢測和識別成功率,筆者在本文中通過引入特定的數據增強和針對性的預處理方式降低復雜環境對檢測的影響,提出基于YOLOv5在自然條件下的檢測識別方法。
1 數據處理
在自然狀態下,環境復雜,目標檢測識別受到很多不確定性因素的影響,如光照強度、遮擋范圍大小、設備誤差、風力大小等。為了提升自然狀態下水果的檢測與識別成功率,筆者在本文中針對樣本進行特定預處理,如圖像降噪、二值化、形態學處理等。此外,還通過Mosaic數據增強來豐富數據集,有效地提高模型的魯棒性。針對自然條件下的目標檢測和識別采用了相應的預處理方法[12],如表1所示。
2 YOLOv5識別算法檢測
YOLOv5是一種深度學習模型,由于其具有模型輕量,速度快、可擴展性強等特點,因此廣泛應用于各領域目標檢測與識別中。為了使模型能實現實時檢測,且保證檢測速度和識別精確度,筆者在本文中選用YOLOv5算法作為檢測模型,如圖1所示。
YOLOv5模型主要由Backbone、Neck和Head三個模塊組成,分別對圖像特征提取、特征融合和檢測識別操作。在訓練模型之前,將原始數據進行標注、數據增強、特定預處理。然后Backbone進行特征提取,該模塊由Conv、C3、SPPF三部分組成,通過5次Conv對輸入進行下采樣,4次C3對輸入進行特征提取、融合,SPPF利用池化、特征融合的方式提取信息。Neck對淺層特征進行特征圖融合,提升算法檢測小目標的性能。最后,Head對加工后的特征圖進行預測。使用YOLOv5自帶的GIoU損失函數作為判別錨框與檢測框的誤差大小的指標。檢測流程如圖2所示。
3 實驗結果與分析
3.1 數據集劃分
筆者在本文中使用數據標注工具(Labelimg),在原始數據上做標注。由于原始樣本較少,為了使實驗更科學可行,通過圖片縮放、隨機圖片裁剪、隨機變換排列、拼接、Mosaic數據增強等方法來擴充樣本數量。將總數據的90%作為訓練數據,總數據的10%作為測試數據。
3.2 實驗結果與分析
筆者在本文中將采用準確率(Precision)召回率(Recall)和平均精度均值(mean average precision,mAP)三個評價指標作為檢測模型性能好壞的標準。通過對比不同迭代次數(Epoch)和步長(Batch_size)下模型的準確率、平均精度均值和召回率,選出模型最優時的超參,該模型Epoch選擇160,Batch_size值為32,初始學習率為0.01,選用GIoU損失作為bounding box的損失。
在實驗過程中,Box(Box推測為GIoU損失函數均值,其值越小方框越準、檢測越準)、Precision、Recall 和 mAP(IoU=0.5)的變化趨勢如圖3~圖6所示。隨著迭代次數的增加,Box值不斷減小,精確度、 mAP(IoU=0.5)、召回率都在逐漸向1靠近。圖3中,在迭代0~100次時,Box值曲線變化明顯;100次后,曲線相對平緩,最終Box值穩定在0.02左右。圖4~圖6中,在迭代0~20次時,曲線變化明顯,表明在此階段,模型還處于學習階段,不斷尋找最優參數,迭代20次后,曲線趨于平穩,表明此時模型處于相對最優化狀態。
筆者在本文中將測試集輸入到本模型中,其中一個結果如圖7所示,雖然圖像中有多個檢測目標,且光照不均、遮擋程度不同,但該模型都能夠很好地檢測出,很少出現漏檢情況。
筆者在本文中所提出的方法很好地解決了自然環境下由于光照、遮擋、搖晃等問題所導致的檢測率低的情況,相關評價指標表明,該方法取得較好地效果,為研究自然環境下水果的檢測識別開拓了思路。
4 結 論
筆者在本文中以自然條件下的柑橘作為識別目標,提出通過去噪、二值化、形態學等方法解決自然條件下光照不均勻、遮擋和搖晃等問題。采用YOLOv5模型來檢測識別目標,通過精確率和召回率來判斷模型效果。實驗結果表明,通過數據增強和特定預處理去除惡劣環境對檢測識別的影響后,YOLOv5模型能夠更準確地檢測自然條件下的目標,為智慧農業的發展奠定了理論基礎。
參考文獻
[1] 陳貝文,陳淦.水果分類識別與成熟度檢測技術綜述[J].計算機時代,2022(7):62-65.
[2] 孔鵬.基于深度學習的水果目標檢測研究及應用[D].北京:北京郵電大學,2021.
[3] 鄒偉.機器視覺在柑橘分級技術上的研究進展[J].農業裝備技術,2023,49(3):4-6.
[4] 羅家梅.改進YOLOv5的水果品質檢測與分類方法研究[D].江西贛州:贛南師范大學,2023.
[5] 王水平,唐振民,范春年,等.基于SVM的水果分類算法研究[J].武漢理工大學學報,2010,32(16):44-47.
[6] 張帆.基于深度卷積神經網絡的水果圖像識別算法研究[D].北京:中央民族大學,2020.
[7] 田有文,吳偉,盧時鉛,等.深度學習在水果品質檢測與分級分類中的應用[J].食品科學,2021,42(19):260-270.
[8] 簡欽,張雨墨,簡獻忠. FC-CNN: 基于卷積神經網絡的水果圖像分類算法[J]. 農業裝備與車輛工程,2021,59(1): 67-71.
[9] 熊俊濤,鄭鎮輝,梁嘉恩,等.基于改進YOLO v3網絡的夜間環境柑橘識別方法[J].農業機械學報,2020,51(4):199-206.
[10] 裴瑞景,王碩,王華英.基于改進YOLOv4算法的水果識別檢測研究[J].激光技術,2023,47(3):400-406.
[11] 楊世忠,王瑞彬,高升,等.基于YOLOv5的草莓輕量化網絡檢測模型[J].國外電子測量技術,2023,42(4):86-95.
[12] 任會. 基于機器視覺的自然條件下橘子檢測研究[D].長沙:中南林業科技大學,2022.