田 華
(長春市九臺區莽卡滿族鄉綜合服務中心 農業農機技術服務科,長春 130500)
隨著農業生產要求不斷提升和農業勞動力轉移,對農業機械提出了更高要求,農業機械化正向智能化方向發展,對于提高農業生產效率、降低農業勞動強度具有重要意義。
農業機械目標定位及檢測技術是農業機械智能化發展的重要方向,是實現農業機械無人化發展的支撐技術之一,主要是基于視覺識別技術、計算機技術、圖像處理技術、人工智能技術等為一體,利用計算機模擬人類的視覺功能,通過圖像采集與處理技術,將圖像信息轉化為數字信號,進而獲取目標圖像并實現田間定位與檢測。目前,目標定位及檢測技術已經廣泛應用于航空航天、醫學成像、交通物流和工業生產等領域,在農業采摘、食品加工、機械生產和包裝分類等方面替代人工實現高效生產。
目前,視覺識別及定位檢測技術主要是基于ORB特征點匹配和SIFT特征提取技術,但是由于農業生產環境較為復雜,現有技術無法實現對田間作業目標的精準定位與檢測,農業機械視覺識別系統存在目標識別模糊、分類效率差和響應速度慢等問題,影響農業機械田間工作質量與工作效率。隨著深度學習及人工智能技術的逐漸發展,卷積神經網絡及YOLO,算法逐漸應用于目標定位與檢測技術中,響應速度塊,定位精準度較高。
本研究基于YOLOX算法進行圖像識別與樣本庫構建,用于視覺識別系統的目標特征向量提取、定位和檢測技術,總體工作流程圖如圖1所示。

圖1 YOLOX算法工作流程圖
為了增加訓練數據集,提高目標識別能力,本研究采用離線重采樣,在目標采集圖像中增強目標樣本后,使用兩倍的重采樣率來處理圖像集,由于圖像在輸入到網絡之前需要進行預處理,預處理后的數據不完全相同,因此訓練集不會過度擬合。本研究采集的圖像集為高分辨率,如果將這些數據直接輸入網絡進行訓練,在訓練過程中會因壓縮而失去很多有用的語義信息,減少目標特征提取效率,因此,使用多尺度訓練來提高模型的性能,并隨機選擇每個量表在每個時期進行訓練,增加訓練樣本的多樣性。在輸入端加入Focus結構用于增加圖像通道數量,優化后的YOLOX-x算法工作流程圖如圖2所示。

圖2 YOLOX-x算法工作流程圖
傳統的視覺識別系統采用卷積神經網絡進行特征提取,檢測目標的形狀和顏色等關鍵特征信息,高分辨率特征信息。針對傳統卷積神經網絡排模型在目標檢測與特征提取中存在的問題,采用HRNet高資源作為特征提取網絡,減少特征信息損失。將CBAM注意機制添加到HRNet的第一級特征提取和第二、三、四級特征融合中,在第一階段加入CBAM融合模塊,使網絡能夠鎖定在特征提取初始階段的目標特征,在第二階段加入CBAM融合模塊,在第二階段、第三階段和第四階段能充分提取到重要的目標特征信息。
操作平臺為臺式計算機,運行環境為Ubuntu 18.04,主頻4.10 GHz,16 G運行內存,1 TB機械硬盤,使用GPU加速計算,在Python編程語言下,運用PyCharm書寫調試大量代碼,對提出的YOLOX-x算法與傳統的YOLOX、YOLOXv3、YOLOXv4和卷積神經網絡Faster-RCNN進行田間對比驗證。模型設置中,學習效率為0.005,迭代次數為10×103次,權值衰減設置為0.005。
3.2.1 目標檢測精度
選擇平均精度(AP)作為評估指標,對田間目標正常位姿、物體重疊進行檢測與分析,試驗結果如表1所示。研究結果表明,在正常位姿檢測中,YOLOX-x算法較YOLOX、YOLOXv3、YOLOXv4和卷積神經網絡Faster-RCNN準確率提升7.76%,9.12%,1.51%和0.15%;在物體重疊情況下,YOLOX-x算法較YOLOX、YOLOXv3、YOLOXv4和卷積神經網絡Faster-RCNN準確率分別提升19.97%,18.69%,2.73%和1.61%;在目標檢測精度中,YOLOX-x算法較YOLOX、YOLOXv3、YOLOXv4和卷積神經網絡Faster-RCNN分別提升10.65%,9.05%,1.99%和0.87%;YOLOX-x響應速度較YOLOX、YOLOXv3、YOLOXv4和Faster-RCNN分別提升63.51%,34.51%,27.45%和67.96%,因此,YOLOX-x算法在田間目標定位與檢測中存在較高的精度。

表1 不同算法下農業機械目標檢測精度結果分析
3.2.2 農業機械定位
在對田間目標檢測結束后,農業機械需要進行定位試驗,通過對比農業機械實際運行坐標點與算法模擬坐標點進行差異性分析,重復實驗誤差計算公式如式(1)所示,不同算法下試驗結果如表2所示,YOLOX-x定位誤差較YOLOX、YOLOXv3、YOLOXv4和Faster-RCNN分別提升28.94%,25.28%,24.60%和16.08%。

表2 農業機械定位誤差分析 單位:%

(1)
式中,(xend,yend)為基于各項算法下的農業機械田間坐標,(xobject,yobject)為農業機械田間實際定位坐標。
為了解決農業機械視覺識別系統存在目標識別模糊、分類效率差和響應速度慢等問題,提出一種YOLOX優化算法——YOLOX-x,并通過田間試驗進行驗證,主要得出以下結論:
1)為了增加訓練數據集,提高目標識別能力,采用離線重采樣,在目標采集圖像中增強目標樣本后,使用兩倍的重采樣率處理圖像集,并隨機選擇每個量表在每個時期進行訓練,增加訓練樣本的多樣性。在輸入端加入Focus結構用于增加圖像通道數量。
2)本研究采用HRNet高資源作為特征提取網絡,減少特征信息損失。將CBAM注意機制添加到HRNet的第一級特征提取和第二、三、四級特征融合中,能夠充分提取到重要的目標特征信息。
3)本研究提出的YOLOX-x算法較YOLOX、YOLOXv3、YOLOXv4和卷積神經網絡Faster-RCNN在田間目標檢測準確率和響應速度都得到較大提升,在正常位姿和物體重疊的情況下定位識別中精度達到94.03%和91.56%,研究結果對于農業機械田間定位檢測技術提供技術參考與理論借鑒。
(05)