
中圖分類號:TP3191.4;TP183 文獻標識碼:A文章編號:2096-4706(2025)08-0034-07
Abstract:Aimingat theexisting problems of insufficient accuracy,the difficultyof identificationundercomplex backgrounds,ndthebvious limitationsof traditionalmethods infeatureextractioninfruitripenessdetection,afruitripenes detection algorithm (AGLU-YOLOv11) basedon improved YOLOv1 is proposed,to meet the demands for effcient data and reliable colection in fruit ripeness detection.AGLU-YOLOv11 designs the C3k2_AddBlock_CGLU module byoptimizing the C3k2 module in the YOLOv1l backbone network and integrating CATM(Conv Additive Self-Attention) and CGLU (Convolutional Gated Liear Unit),and significantlyenhances feature extraction capabilityand adaptabilityof multi-variety andmulti-stageripenessfruits.Atthesame time,theAFCAAtention Mechanism is introduced inthefeature fusion stage to strengthen global feature expresionand adaptability tocomplex backgrounds,andachieve eficient fruit quality detection andlabeling.Experimental results showthat AGLU-YOLOv1lperforsbeterin precision,robustnessand multi-saleobject adaptability than other detection models inPrecision,Recall, mAP @ 0 . 5 and 1 n A P@ 0 . 5:0 . 9 5 indicators,and can better meet the demands for identifying fruit ripeness.
Keywords:YOLO;ObjectDetection;CGLU;CATM; fruit ripenessdetection
0 引言
社會經濟的飛速發展下,人們的生活水平顯著提高,水果作為人類膳食結構中的重要組成部分,不僅為人體提供豐富的維生素、礦物質和膳食纖維,還在促進免疫力和預防慢性疾病中發揮著重要作用[]。然而,水果的成熟度直接關系到其營養價值、口感和食品安全。如果過早采摘,果實未完全成熟,可能導致品質下降;如果采摘過晚,則可能出現腐爛或營養流失,增加食品安全隱患[2]。因此,準確、高效地檢測水果的成熟度,對于保障食品安全、提高經濟效益以及減少浪費具有重要意義。傳統的水果成熟度檢測方法大多依賴人工判斷或簡單機械設備,盡管成本較低,但存在主觀性強、效率低以及易受外界環境影響等問題。
近年來,隨著食品安全標準的提高和消費者對果實品質要求的增強,基于機器視覺與深度學習的檢測方法逐漸成為研究熱點。這些方法不僅可以減少人工干預,還能在復雜場景下實現高精度和高效率的檢測。
目前,目標檢測技術在水果、蔬菜成熟度中得到廣泛的應用。Cubero等人探索了如何利用計算機視覺技術和移動平臺對柑橘類水果進行現場預分級,并將其轉換為HunterLab顏色空間以估計顏色指數。Ohali等人[4設計并實現了一種基于計算機視覺的棗果分級和分選系統,該系統可以使用棗果的RGB圖像和一組自動提取的外部質量特征將棗果分為三個質量類別。宋立航等人[5提出基于改進YOLOv5s的自然環境下油桃成熟度檢測方法,將原始YOLOv5s模型的頸部特征金字塔結構替換為BiS特征金字塔結構,增強模型對成熟度特征的融合和提取能力,引入QFocalLoss損失函數,解決訓練樣本中正負樣本比例失衡的問題,并通過CIoU-NMS作為非極大值抑制方法,提升模型對遮擋和重疊果實的檢測效果。實驗結果表明,改進后的YOLOv5s-BQC模型相比原模型,精確度和召回率分別提升了 0 . 9 % 和 0 . 7 % ,mAP提升了 2 . 3 % 。Zhao 等人[提出一種輕量級的石榴生長期檢測算法YOLO-Granada,以輕量級的ShuffleNetv2網絡為骨干提取石榴特征,使用分組卷積減少了普通卷積的計算量,使用通道混洗增加了不同通道之間的交互,并引入注意力機制,實驗表明,檢測速度比原網絡提高了 1 7 . 3 % 。
綜上所述,基于目標檢測的水果成熟度研究已取得了一定成果,但仍存在諸多問題亟待解決。例如,大部分現有方法往往聚焦于特定水果品種的檢測,而忽略了不同品種在顏色、形狀和大小等特征上的顯著差異。這些問題限制了水果成熟度檢測技術在多樣化實際場景中的廣泛應用,亟須進一步的優化與創新。為了解決以上問題,本文提出一種基于改進YOLOvI1的水果成熟度檢測算法AGLU-YOLOv11。本文主要貢獻如下:
1)提出一種高效的檢測算法AGLU-YOLOvl1,針對水果成熟度檢測,該模型可以在提高準確率的同時,優化模型結構,減少參數量。2)通過改進C3k2模型,融合CATM與CGLU,設計了C3k2-AddBlock-CGLU模塊,提升了主干網絡的特征提取能力。3)引入AFCA注意力機制,增強全局特征表達和語義信息捕捉能力。
1 研究方法
1.1 數據來源與處理
為提升模型在多場景下的適應性與魯棒性,本文圍繞水果成熟度檢測任務,在復雜場景中和密集場景中開展了多品種數據采集。采集的水果種類包括蘋果、香蕉、葡萄、草莓和柿子五種常見水果,涵蓋未成熟、部分成熟及完全成熟三個階段,以真實反映實際應用場景的多樣性。具體而言,未成熟水果通常外觀呈綠色或淺色,表皮堅硬且糖分較少;部分成熟水果顯現部分成熟色澤但質地較硬;完全成熟水果色澤均勻、表皮光滑,質地軟且風味濃郁。
數據采集過程中,采用了高清數碼相機和智能手機等設備,以確保采集到的圖像具有足夠高的分辨率,從而滿足深度學習模型的訓練需求。部分采集的圖像如圖1所示。為了保證模型訓練與評估的科學性與公正性,本文共采集了2212張圖片,并將數據集按照7:3的比例隨機劃分為訓練集和測試集,其中訓練集包含1768張圖片,測試集包含444張圖片。所有圖像均使用LabelImg軟件進行了標注,格式為YOLO標注格式,圖像標簽劃分為15個類別,分別為:完全成熟蘋果(apple-H)、部分成熟蘋果(apple-M)、未成熟蘋果(apple-L)、完全成熟香蕉(banana-H)、部分成熟香蕉(banana-M)、未成熟香蕉(banana-L)完全成熟葡萄(grape-H)、部分成熟葡萄(grape-M)、未成熟葡萄(grape-L)完全成熟草莓(strawberry-H)、部分成熟草莓(strawberry-M)、未成熟草莓(strawberry-L)完全成熟柿子(persimmon-H)、部分成熟柿子(persimmon-M)、未成熟柿子(persimmon-L)。

1.2 模型改進
YOLO(YouOnlyLookOnce)算法由Redmon等人于2016年提出[,旨在解決目標檢測領域中實時性與準確性的權衡問題。傳統目標檢測方法多采用兩階段策略,即先生成候選區域后進行分類,這種方法計算復雜度高,難以滿足實時檢測需求。YOLO算法創新性地將目標檢測轉化為端到端的回歸問題,通過直接預測整幅圖像中目標的邊界框和類別概率,顯著提升了檢測速度。隨著深度學習技術的發展,YOLO算法不斷迭代優化[8]。最新的YOLOvl1版本在網絡架構、特征提取和檢測精度等方面均有顯著提升。其主要改進包括:采用更深層的卷積神經網絡增強特征表示能力;引入C3k2模塊優化跨階段特征融合效率;整合多尺度特征金字塔網絡提升對不同尺度目標的檢測能力。同時,通過改進損失函數和訓練策略,進一步優化了邊界框回歸和分類精度[]。YOLOv11在保持實時檢測優勢的同時,取得了更高的平均精度(mAP)。然而,該模型在處理復雜背景和多樣化外觀目標時仍存在局限性,尤其是在目標與背景差異較小的場景中。以水果成熟度檢測為例,標準特征提取模塊難以有效捕捉不同成熟階段的細微差異,影響檢測準確性。針對上述問題,本文提出了以下改進方案(AGLU-YOLOvl1):設計C3k2_AddBlock_CGLU模塊替代原有C3k2模塊,提高推理速度;引入AFCA注意力機制,增強對水果成熟度特征的提取能力。這些改進對于提升農業生產和供應鏈管理中的水果成熟度檢測具有重要意義。AGLU-YOL0v11的主要結構如圖2所示。

1.2.1 C3k2_AddBlock_CGLU
為了解決C3k2模塊在特征提取過程中存在的瓶頸問題,本研究對其結構進行了深入改進。傳統的C3k2模塊在信息傳遞和特征融合方面可能存在效率低下的情況,限制了模型對細粒度特征的捕捉能力。通過引入AGLU-Bottleneck替換Bottleneck,在保證模型性能的前提下,顯著降級了模型的計算成本和內存占用。C3k2_AddBlock_CGLU結構圖如圖3所示。

其中,當C3k為True時,殘差塊為C3k-AGLU,如圖4所示,否則,殘差塊為AGLUBottleneck。

AGLU-Bottleneck在其主干結構中引入了卷積加性標記混合器(CATM)[1o],通過融合卷積操作和加性自注意力機制,實現了在保持高性能的同時顯著降低計算開銷。該模塊由Integration子網絡、CATM和MLP三部分組成,并采用殘差連接策略。Integration子網絡由三個帶有ReLU激活函數的深度卷積層構成。CATM利用軸向注意力機制,將二維空間的自注意力計算分解為水平方向和垂直方向的兩次一維注意力計算。這種方法不僅大幅降低了計算復雜度,還保留了捕獲全局特征的能力。對于輸入
其中 C 為通道數, H 和 W 分別為特征圖的高度和寬度,CATM的計算公式如下:

在上述公式中,Query、Key 和Value 是通過獨立的線性變換獲得的,例如
, ? ( ? ) 為上下文映射函數,包含了信息交互,具體體現為基于Sigmoid的通道注意力和空間注意力機制。在Query和Key分支上均進行了相似度提取,并保留了各自分支的原始特征維度。這種方法有助于更好地保留視覺稀疏特征,避免在二維特征向量中發生信息丟失。因此,CATM的輸出公式為:
O = τ ( ? ( Q ) + ? ( K ) ) ? V
其中,
為用于整合上下文信息的線性變換,由于CATM中的操作由卷積表示,復雜度為O ( N ) 。
其次,本文引入條件門控線性單元(CGLU)[]模塊作為MLP層,利用條件門控線性單元動態調節特征通道的權重,使模型能夠自適應地關注關鍵特征,抑制冗余信息。CGLU在GLU的門控分支的激活函數之前添加了一個簡化的 3 × 3 深度卷積,將其轉換為基于最近鄰特征的門控通道注意力機制。該模塊彌合了GLU和
機制之間的差距,增強了模型的局部建模能力和魯棒性。給定一個輸入C∈R×H×W,池化大小為
,窗口大小為 k × k ,則CGLU的計算復雜度
為:

式中:
和
為待變池化層的高度和寬度; C 為輸入數據的特征圖通道。
綜上,對于YOLOv11主干網絡中C3k2進行改進,改進后的C3k2模塊不僅提高了特征融合的效率,還有效緩解了信息流動中的瓶頸效應,增強了模型對細粒度特征的捕捉能力,為水果成熟度檢測任務的精度提升奠定了堅實基礎。AGLU-Bottleneck模型圖如圖5所示。
1.2.2 注意力機制
為了應對水果成熟度檢測中復雜環境和多樣干擾因素的問題,同時在保證目標檢測和精度的情況下降低計算量和參數量,本文在C2PSA模塊后引入了自適應細粒度通道注意力(AdaptiveFine-grainedChannelAttention,AFCA)機制來提升網絡性能[13]。AFCA模塊的引入旨在進一步優化網絡對關鍵特征的提取能力,實現對目標區域的精準關注。AFCA模塊的引入有兩個關鍵方面:
1)AFCA通過通道自適應調整來精細化地處理全局信息,使網絡能夠關注到水果的整體顏色、紋理等重要特征。具體而言,AFCA首先利用全局平均池化(Global AveragePooling,GAP)提取輸入特征圖的通道信息,通過自適應機制為每個通道分配權重,動態調整通道重要性,從而優化對水果成熟度特征的提取。
2)AFCA通過局部信息交互進一步增強網絡對水果細節的感知,特別是在表面紋理和斑點等小范圍特征上,AFCA能夠有效捕捉這些局部信息,從而提升對水果成熟度的識別精度。
AFCA模塊通過計算局部通道信息與全局通道信息的相關性,生成一個相關矩陣,這個矩陣通過逐點相乘的方式與輸入特征圖相結合,得到優化后的特征圖。這樣,網絡能夠在水果表面發生細微變化時,更加靈敏地反應并精確判斷成熟度。AFCA模型圖如圖6所示。


通過在C2PSA模塊后引入AFCA注意力機制,AGLU-YOLO模型能夠更有效地處理復雜環境中的水果成熟度檢測任務。AFCA不僅提升了網絡對水果表面細節的感知能力,還通過全局和局部信息的融合,優化了特征圖的表示,增強了水果成熟度分類的準確性。同時,AFCA通過自適應權重分配機制有效減少了不必要的計算和參數,提升了計算效率,在進行大規模水果成熟度檢測時依然能保持較高的實時性和準確性。
2 結果與分析
2. 1 實驗環境
本文模型通過使用PyTorch框架實現,實驗環境及配置如表1所示。

在訓練過程中,本文將輸入圖像的尺寸設置為6 4 0 × 6 4 0 像素,數據加載的工作線程數(workers)設置為16,批次大小(batchsize)為32。最大訓練迭代次數設為300次,同時采用早停策略,設置耐心值(patience)為30,即當驗證集上的性能在連續30輪迭代中未出現顯著提升時,自動停止訓練,以有效防止過擬合。此外,優化算法選擇了隨機梯度下降(SGD)
并結合學習率衰減等技術,以提高模型的泛化能力。
2.2 評估標準
為了全面衡量改進后的YOLOv11模型在水果成熟度檢測任務中的性能,本研究采用了一系列評價指標,從檢測精度(Precision)、召回率(Recall)、平均精度 (
和
和浮點運算次數(FLOPs)等參數進行評估,計算公式如下:



在本研究中,評估指標公式中的各個符號在水果成熟度檢測任務中具有特定的含義。TP模型能夠準確檢測并正確分類為某一成熟度等級的水果數量;假陽性(FalsePositives,FP)則指模型錯誤地將未達到該成熟度等級的水果識別為該等級的次數;假陰性(FalseNegatives,FN)表示實際屬于某一成熟度等級但未被模型檢測到的水果數量;平均精度(AveragePrecision,AP)和平均精度均值(meanAveragePrecision,mAP)分別用于評估單一成熟度等級和所有成熟度等級的檢測性能,通過在不同召回率下的精度平均值來衡量模型的綜合檢測能力。GFLOPs衡量模型在處理過程中所需的計算量,用于評估模型在資源受限環境中的可行性。
2.3 消融實驗
AGLU-YOLOv11通過改進C3k2模塊,融合AGLU-Bottleneck替換Bottleneck,創建C3k2AddBlockCGLU模塊。此外,引入AFCA注意力機制,強化了全局特征與語義信息的捕捉與建模能力。實驗結果如表2所示。

實驗結果表明,將YOLOv11中的C3k2模塊替換為C3k2AddBlockCGLU模塊,準確率提升了1 . 5 % ,平均精度提升 0 . 8 % ,計算量下降0.1GFloPs;在YOLOvl1的基礎上加入AFCA注意力機制,精度提升 0 . 9 % ,召回率提升 0 . 5 % ,平均精度提升 1 % 融合后,精度提升 2 . 5 % ,召回率提升 0 . 6 % ,平均精度提升 1 . 4 % ,計算量下降0.1GFloPs。
2.4 模型對比
為了驗證AGLU-YOLOvI1擁有更好的性能,本文通過對YOLO不同版本進行對比實驗,使用準確率、召回率、mAP、計算量5種指標進行評估模型,各項指標對比結果如表3所示。

實驗結果表明,本文提出的模型AGLU-YOLOv11在準確率、召回率、mAP、計算量上均優于其他模型。與YOLOv5相比,準確率提升 3 . 4 % 。召回率提升 1 % ,平均精度提升 3 . 5 % ;與YOLOv8相比,準確率提升 0 . 7 % ,平均進度提升 2 . 5 % ;與YOLOv10相比,準確率提升 5 % ,平均精度提升 3 . 1 % ,與YOLOvlls相比,準確度提升 0 . 5 % ,平均精度提升 0 . 4 % 。因此,本文提出的AGLU-YOLOvI1能夠有效提升目標識別能力和全局特征建模能力,為水果成熟度檢測提供了一種高效且可靠的技術方案。
2.5 檢測結果分析
為全面展示AGLU-YOLOv11的性能表現,本文在相同的數據集上對該模型及原始YOLOv1ln模型進行了檢測,并對檢測結果進行了可視化分析。通過對比可以直觀發現,AGLU-YOLOv11在目標檢測和成熟度識別方面的性能優于原始模型。具體檢測結果如圖7所示。

從可視化結果可以看出,AGLU-YOLOv11在水果檢測的準確性方面明顯優于YOLOv1ln模型。在YOLOvlln的檢測結果中,存在一定的漏檢現象,而AGLU-YOLOv11則能夠更全面地識別目標。此外,在水果成熟度的檢測任務中,AGLU-YOLOv11展現出了更高的檢測效果,有效提高了對不同成熟階段果實的識別能力。
3結論
本文提出了一種基于改進YOLOv11的水果成熟度檢測算法(AGLU-YOLOv11),通過改進C3k2模塊并引入AFCA注意力機制,顯著提升了模型在復雜場景下的檢測精度和魯棒性。實驗結果表明,該模型在小目標檢測和水果成熟度識別方面表現出明顯優勢,同時具備更強的泛化能力。結合區塊鏈農產品源系統,AGLU-YOLOv11能夠為高質量數據采集提供技術支持,實現從生產到流通的全鏈條質量追蹤。未來研究可進一步拓展模型在多品種水果檢測中的應用潛力,并結合更大規模的多模態數據集,探索更加高效的輕量化檢測框架,為農業智能化和農產品溯源體系提供先進的技術解決方案。
參考文獻:
[1]趙杰斌,鄧浩,徐振林.基于食品安全指數法的臺山市蔬菜和水果農藥殘留風險評估[J].現代食品科技,2023,39(6):277-283.
[2]田有文,吳偉,盧時鉛,等.深度學習在水果品質檢測與分級分類中的應用[J].食品科學,2021,42(19):260-270.
[3]CUBEROS,ALEIXOSN,ALBERTF,etal.Optimised ComputerVision System forAutomatic Pre-GradingofCitrusFruitintheFieldUsingaMobilePlatform[J].PrecisionAgriculture,2014,15(1):80-94.
[4] OHALI AY.ComputerVision Based Date Fruit Grading System:Design and Implementation [J].Journal ofKing Saud University-Computer and Information Sciences,2010,23(1): 29-36.
[5]宋立航,張屹,時寅豪.基于改進YOLOv5s的自然 環境下油桃成熟度檢測方法[J].中國農機化學報,2024,45(9): 250-257+2.
[6] ZHAO JF,DU CF,LIY,et al.YOLO-Granada: A Lightweight Attentioned Yolo for Pomegranates Fruit Detection [J/ OL].Scientific Reports,2024,14(1):16848[2024-10-26]. https://doi.0rg/10.1038/s41598-024-67526-4.
[7] REDMON J. You Only Look Once, Unified,Real-Time Object Detection [C]//Proceedings of the IEEE Conference on ComputerVision and Pattern Recognition.LasVegas:IEEE, 2016:779-788.
[8]常琳凱,馬繼東,張昊,等.基于改進YOLOv8的木 材表面缺陷檢測研究[J/OL].林業工程學報,2024:1-12[2024- 12-03].https://doi.org/10.13360/j.issn.2096-1359.202410002.
[9]ARISTOTELES,SYARIF A,SUTYARSO,et al. Identification of Human Sperm Based on Morphology Using the You Only Look Once Version 4 Algorithm [J/OL].International Journal of Advanced Computer Science and Applications (IJACSA),2022,13(7) [2024-11-02].https://dx.doi. org/10.14569/IJACSA.2022.0130752.
[10] ZHANG T,LIL,ZHOU Y,et al.CAS-ViT: Convolutional Additive Self-Attention Vision Transformers for Efficient Mobile Applications [J/OL].arXiv:2408.03703 [cs.CV]. [2024-10-28].https://arxiv.org/abs/2408.03703?context=cs.
[11] SHI D. TransNeXt: Robust Foveal Visual Perception for Vision Transformers [C]//Proceedings of the IEEE/CVF Conference on Computer Vision and Pattern Recognition. Seattle: IEEE,2024:17773-17783.
[12] HU J,SHENL,SUN G. Squeeze-and-Excitation Networks [J].IEEE Transactions on Patern Analysis and Machine Intelligence,2019,42(8):2011-2023.
[13] SUN H,WENY,FENGH,et al.Unsupervised Bidirectional Contrastive Reconstruction and Adaptive FineGrained Channel Atention Networks for Image Dehazing [J/OL]. Neural Networks,2024,176:106314[2024-11-02].https://doi. org/10.1016/j.neunet.2024.106314.
作者簡介:趙鵬(1973一),男,漢族,山西太原人,教授,博士在讀,研究方向:軟件工程、大數據、區塊鏈;強光磊(2001一),男,漢族,安徽蕪湖人,碩士研究生在讀,研究方向:區塊鏈、目標檢測;通信作者:盧波(1988—),男,漢族,山西晉中人,博士,研究方向:區塊鏈、協議安全性分析;高揚(2000一),男,漢族,山西忻州人,碩士研究生在讀,研究方向:圖像處理、目標檢測;張仟祥(2000一),男,漢族,山西太原人,碩士研究生在讀,研究方向:特征識別、嵌入式與物聯網工程。