郭振華 謝學浩 王森瓏 徐洋帆



摘要:中國茶文化歷史悠久。茶帶給我們的不僅有底蘊豐厚的茶文化,還有巨大的經濟效益。目前我國茶葉的種植面積達257.9萬公頃,茶葉的產量達189萬噸。這么大種植面積和產量,意味著傳統的采集方式不能滿足需求,效率低下。隨著科技的發展和國家政策對農業的扶持力度加大,我國現代化農業不斷提升。茶葉的生產也應該更加科技化,文章就茶葉嫩芽識別,提出一種改進型YOLOv8,后續可通過潤和AL Camera開發套件用此模型進行茶葉嫩芽的圖像采集識別。改進后的YOLOv8識別準確率大有提升和效率都大有提升,為新型茶葉采集技術中茶葉嫩芽識別部分提供技術參考。
關鍵詞:YOLOv8;茶葉嫩芽識別;深度學習;目標檢測
中圖分類號:TP312 文獻標識碼:A
文章編號:1009-3044(2024)14-0023-03 開放科學(資源服務)標識碼(OSID) :
0 引言
我們國家是茶葉種植大國。茶葉種植面積大,茶葉產量也大。目前我國的茶葉采摘60% 要靠人工完成,效率低下,對于茶葉產業這種季節性密集勞動不太友好。而傳統的采茶機,雖然效率有所提升,但是它是一種無差別的采摘,將老葉和我們需要的嫩芽采摘下來。這樣的采摘方式仍然需要人工分揀出嫩芽,而且容易損傷嫩芽[1]。如果我們想要實現智能化采摘茶葉,第一步就是要解決茶葉嫩芽的識別問題。
本文就茶葉嫩芽識別,提出了一種基于YOLOv8 改進的模型用于茶葉嫩芽的識別方法。通過增加注意力機制對YOLOv8進行改進,使得其對茶葉嫩芽有更好的識別效果。通過對數據訓練得出的結果與原模型進行效果比對,從而完善改進版YOLOv8模型,使得其準確率(precision,P) ,召回率(recall,R) ,平均精度值(mean average precision,mAP) 高于原模型。為智能采茶機中的茶葉嫩芽提供了技術參考。
1 數據集
1.1 圖像采集
茶葉嫩芽數據集原始圖像采集地點為江西省景德鎮市浮梁縣莊灣鄉寒溪村寒溪茶山,采集對象為浮梁茶,茶樹均單攏栽種,長勢較好。圖像采集設備為松下相機,數據圖片的分辨率原本是3 648×2 736像素,以.JPG格式保存。
考慮到采摘茶葉的環境,在對茶葉嫩芽進行圖像采集時,校級與茶樹的距離為 10~50cm,拍攝角度大致在平行視角和俯視視角之間,即與豎直方向呈 0°~90°夾角。原始圖像均是茶園環境拍攝,以茶葉嫩芽為前景,嫩芽以外的信息為背景。共采集原始圖像1085幅。
1.2 創建數據集
利用LabelImg 對采集到的茶葉原始圖像中的嫩芽部分進行人工標記,以得圖像中目標嫩芽的特征信息,并以.txt文件形式保存。數據集按7:2:1分成訓練數據集、驗證數據集、測試數據集三部分。
2 算法
2.1 YOLOv8
本次研究使用YOLOv8為基礎模型,將目標檢測問題轉化為一個回歸問題,通過一次前向傳播即可同時檢測圖像中的多個目標。相比傳統的目標檢測算法,YOLOv8具有更快的速度和較高的準確性。
YOLOv8的網絡結構基于Darknet-53,這是一個由53層卷積神經網絡構成的骨干網絡。在Darknet-53的基礎上,YOLOv8添加了額外的卷積層和上采樣層來構建檢測頭部,以便檢測不同尺度的目標[2]。
Yolov8可擴展性強,其采用了模塊化設計,便于實驗時對其進行擴展和修改,使其改進后,效果更佳。
2.2 改進版YOLOv8
YOLOv8的改進方法有很多,如增加注意力機制、更換卷積或者block、head等,本次使用是針對茶園里茶葉嫩芽的識別。所以我們選用增加注意力機制的方式,對YOLOv8進行改進,幫助模型更好的關注有繁雜環境圖像中的茶葉嫩芽部分,從而提高模型識別的準確率。
本次試驗是使用CBAM增加注意力機制,CBAMS 是由通道注意力模塊(CAM) 和空間注意力模塊(SAM) 構成的通過結合CAM和SAM,CBAM模塊可以自適應地重新校準特征圖中的通道和空間信息,使網絡能夠專注于相關茶葉嫩芽的特征并抑制無關特征[3]。這種注意力機制有助于提高網絡對茶葉嫩芽的判別能力,并增強其捕捉細節的能力。
3 訓練與測試
3.1 試驗平臺
本實驗的計算機工作站配置為 Intel Core i5-12400h 處理器,主頻2.50GHz,運行內存為 16GB,并配有RTX 3060顯卡。試驗在Windows 11 操作系統上進行,采用 PyTorch 深度學習框架對模型進行搭建和改進。數據在Loss 曲線收斂后對各算法進行分析。
3.2 參數設置
訓練模型時,將訓練集圖像分辨率調整為 640×640 像素,訓練1 000epoch,批次大小設為16,初始學習率為 0.01,動量參數和權值衰減參數分別設置為0.937和0.000 5。驗證模型時,置信度設置為0.6。
3.3 評估指標
本次試驗采用準確率 P (Precision,%)、召回率 R(Recall,%)、平均精度 XmAP(mean average precision,%)三項指標之間的關系來衡量模型預測的準確度。[4]準確率P(Precision)=TP/(TP+FP)在預測是Positive所有結果中,預測正確的比重召回率recall=TP/(TP+FN),在真實值為Positive 的所有結果中,預測正確的比重。XmAP是用Precision和Recall作為兩軸作圖后圍成的面積。計算公式:XmAP=∫P(R)d(R)[5]。
TP:True Positive,即正確預測,真實為0,預測也為0。FN:False Negative即錯誤預測,真實為0,預測為1。FP:False Positive即錯誤預測,真實為1,預測為0。TN:True Negative即正確預測,真實為1,預測也為1。
4 結果與分析
4.1 YOLOv8原版結果
圖1(a)為準確率與召回率的調和平均數曲線圖(以下稱F1曲線圖),F1曲線曲線頂部寬度為0.62,頂部高度約為0.7。其中F1=2(precision×recall)/(preci?sion + recall),即F1 =2TP/(2TP + FN + FP)。
圖1(b) 為準確率與置信度的關系圖(以下稱P曲線圖),當置信度增大時,類別檢測得越準確。
圖1(c) 為準確率與召回率的關系圖(以下簡稱PR 曲線圖),PR曲線與X軸和Y軸圍成的面積稱作均值平均精度(即mAP,Mean A verage Precision的縮寫)。
所以有XmAP=XmAP=∫P(R)d(R)。如圖1(c)所示,XmAP=0.721,說明PR曲線與X軸和Y軸圍成的面積趨近于1。
4.2 Y0LOv8改進版結果
圖2(a) 為改進版YOLOv8準確率與召回率的調和平均數曲線圖,F1 曲線頂部寬度為0.68,頂部高度為0.71。
圖2(b) 為改進版的置信度閾值 - 準確率曲線圖(P 曲線圖),準確率一直都在0.78 以上,也就是說confidence很大,這說明可以容易判斷嫩芽,但是會漏檢一些置信度低的類別。
圖2(c) 為召回率 - 準確率曲線圖(PR曲線圖),PR曲線與坐標軸圍成的面XmAP=0.760。即面積接近1。
定位損失box loss:預測框與標定框之間的誤差GloU),越小定位得越準。置信度損失obi loss:計算網絡的置信度,越小判定為目標的能力越準。分類損失cls loss:計算錨框與對應的標定分類是否正確,越小分類得越準。如圖3所示,訓練和驗證的loss曲線均趨于擬合,說明改進后模型性能較好。
4.3 與原模型結果對比
將原版YOLOv8和改進版YOLOv8進行比較,由上表可知兩個版本的準確率與召回率的調和平均數,在寬度L 上,原版為0.62,改進版為0.68,改進版的YOLOv8比原版多0.06,在高度W上,原版為0.7,改進版為0.71,改進版的YOLOv8比原版多0.01。也就是說改進版的YOLOv8有更好的準確率與召回率的調和平均數,相同情況下,改進版YOLOv8能取得更好的F1分數。
均值平均精度,原版YOLOv8為XmAP=0.721,改進版為XmAP=0.760。改進版YOLOv8 比原版高了0.39。且由圖1(c)和圖2(c)可以看出,改進版的YO?LOv8波動不大,而原版的PR曲線與改進版相比,波動較大。表示改進版的訓練效果比原版好。
5 結論
本研究以YOLOv8為原型,對其進行改進,增加注意力機制。以用于茶園在用智能采茶機,采取茶葉時對茶葉嫩芽的識別。本研究根據茶園環境進行試驗,在實際情況下對茶葉嫩芽的圖片進行采集、訓練、驗證和測試。兩個版本得到的F1分數均較好,改進版YOLOv8相對較高。兩個版本的均值平均精度也都較高,原版和改進版的均值平均精度分別為0.721 和0.760。改進版本的均值平均精度相較于原版高出了0.39,且PR曲線比原版波動較小,也就是說改進后的YOLOv8,精度和效果比原版要好。改進后的YOVOv8 性能有所提升,在自然茶園環境下,對茶葉嫩芽的識別效果有了一定的提升,可以為智能采茶機在茶葉嫩芽識別領域的研發中提供技術參考。
參考文獻:
[1] 程永輝,黃彪,周遠書,等.茶葉識別技術研究現狀[J].計算機科學與應用,2021(2):461-466.
[2] 雷幫軍,余翱,余快.基于YOLOv8s改進的小目標檢測算法[J].無線電工程,2024,54(4):857-870.
[3] 涂萬,于紅,張鵬,等.基于通道非降維與空間協調注意力的改進YOLOv8養殖魚群檢測[J].大連海洋大學學報,2023,38(4):717-725.
[4] 胡和平,吳明暉,洪孔林,等.基于改進YOLOv5s的茶葉嫩芽分級識別方法[J].江西農業大學學報,2023,45(5):1261-1272.
[5] 王夢妮,顧寄南,王化佳,等.基于改進YOLOv5s模型的茶葉嫩芽識別方法[J].農業工程學報,2023,39(12):150-157.
【通聯編輯:唐一東】
基金項目:國家級大學生創新創業訓練項目:采橘說——人工智能加AR 助力研學旅行(項目編號:202210408033X)