















摘要:瓶胚缺陷檢測(cè)是保障PET瓶成型質(zhì)量的關(guān)鍵環(huán)節(jié)。為了將缺陷檢測(cè)模型部署到工業(yè)應(yīng)用場(chǎng)景中實(shí)現(xiàn)在線檢測(cè),并提高瓶胚缺陷檢測(cè)精度,提出一種基于改進(jìn)YOLOv8的瓶胚缺陷檢測(cè)模型——YOLOv8-FEMA模型。首先,將FasterNet Block引入YOLOv8模型的C2f模塊中,以減少模型的參數(shù)量;然后,引入EMA機(jī)制,使網(wǎng)絡(luò)更聚焦于有用的特征信息,以提升模型的檢測(cè)精度。實(shí)驗(yàn)結(jié)果表明,該模型相較于YOLOv8n模型,參數(shù)量、浮點(diǎn)運(yùn)算量分別減少了27%和26%,檢測(cè)精度提升了0.03。該模型部署在瓶胚缺陷檢測(cè)軟件中,可有效檢測(cè)出瓶胚缺陷。
關(guān)鍵詞:瓶胚檢測(cè);缺陷檢測(cè);YOLOv8;輕量化
中圖分類號(hào):TP391 """""""""""文獻(xiàn)標(biāo)志碼:A """""""""文章編號(hào):1674-2605(2024)06-0007-06
DOI:10.3969/j.issn.1674-2605.2024.06.007""""""""""""""""""""開放獲取
Bottle Preforms Defect Detection"Model"Based on Improved YOLOv8
HE Yonglun ZHANG Chong CHEN Ru LIANG Jianan
(1.South China Robotics Innovation Research Institute, Foshan 528399, China
2.Institute of Intelligent Manufacturing, Guangdong Academy of Sciences, Guangzhou 510070, China
3.School of Mechanical and Automation Engineering, Wuyi University, Jiangmen 529020, China)
Abstract:"Defect detection of bottle preforms is a crucial step in ensuring the quality of PET bottle molding. In order to deploy defect detection models to industrial application scenarios for online detection and improve the accuracy of preform defect detection, a bottle preform defect detection model based on improved YOLOv8, YOLOv8-FEMA model, is proposed. Firstly, embed the FasterNet Block into the C2f module of the YOLOv8 model to reduce the number of model parameters; Then, the EMA mechanism is introduced to make the network more focused on useful feature information and improve the detection accuracy of the model. The experimental results show that compared to the YOLOv8n model, this model reduces the number of parameters and floating-point operations by 27% and 26%, respectively, and improves detection accuracy by 0.03. This model is deployed in bottle embryo defect detection software and can effectively detect bottle preforms defects.
Keywords:"bottle preforms detection; defect detection; YOLOv8; lightweighting
0 引言
在現(xiàn)代包裝工業(yè)中,瓶胚作為PET瓶的原始成型件,在生產(chǎn)過程中可能出現(xiàn)各種缺陷,如劃痕、氣泡、黑點(diǎn)等。這些缺陷在后續(xù)的吹塑成型工序中,會(huì)直接影響PET瓶的質(zhì)量[1]。瓶胚缺陷檢測(cè)是保障PET瓶
質(zhì)量的關(guān)鍵環(huán)節(jié),而傳統(tǒng)的人工檢測(cè)方法存在準(zhǔn)確性及效率低等問題,因此探索一種高效的缺陷檢測(cè)技術(shù)迫在眉睫。
隨著機(jī)器視覺和深度學(xué)習(xí)技術(shù)的不斷進(jìn)步,視覺缺陷檢測(cè)技術(shù)已被廣泛應(yīng)用于瓶類物品的檢測(cè)領(lǐng)域。文獻(xiàn)[2]提出改進(jìn)的Faster-RCNN瓶身缺陷檢測(cè)方法,全類平均精度達(dá)到96.86%。文獻(xiàn)[3]構(gòu)建基于LeNet-5和VGG-16的卷積神經(jīng)網(wǎng)絡(luò),用于玻璃瓶的缺陷檢測(cè),檢測(cè)準(zhǔn)確率分別為91.2%和95%。文獻(xiàn)[4]通過徑向積分投影和雙圓周掃描實(shí)現(xiàn)玻璃瓶瓶口的缺陷檢測(cè),檢測(cè)正確率為98%。文獻(xiàn)[5]提出基于機(jī)器視覺的藥瓶缺陷檢測(cè)系統(tǒng),采用Halcon的var_threshold函數(shù)對(duì)藥瓶進(jìn)行缺陷檢測(cè),檢測(cè)準(zhǔn)確率超過97%。文獻(xiàn)[6]提出一種PET瓶口自模板缺陷快速檢測(cè)方法,通過對(duì)瓶口自建圓環(huán)模板和閾值分割圖像進(jìn)行圖像做差比較,實(shí)現(xiàn)了PET瓶口缺陷的快速檢測(cè),檢測(cè)精度超過99%。文獻(xiàn)[7]采用Shi-Tomasi算法對(duì)啤酒瓶口缺陷進(jìn)行識(shí)別,以實(shí)現(xiàn)缺陷啤酒瓶的自動(dòng)分揀。但上述研究主要針對(duì)瓶口或藥瓶的缺陷進(jìn)行檢測(cè),對(duì)瓶胚的缺陷檢測(cè)研究相對(duì)較少。
本文提出一種基于改進(jìn)YOLOv8的瓶胚缺陷檢測(cè)模型——YOLOv8-FEMA模型。在YOLOv8模型的C2f模塊引入了FasterNet Block,有效減少了模型的參數(shù)量,增強(qiáng)了模型的可部署性;引入高效的多尺度注意力(efficient multi-scale attention, EMA)機(jī)制,使模型更專注于有用的特征信息,從而提高模型的檢測(cè)精度。
1 YOLOv8模型
YOLO系列模型[8-11]以其高速度、高準(zhǔn)確性和模型緊湊等特點(diǎn),在實(shí)時(shí)檢測(cè)任務(wù)中展現(xiàn)出較好的性能。YOLOv8模型作為YOLOv5模型的迭代版本,不僅優(yōu)化了網(wǎng)絡(luò)結(jié)構(gòu),還提高了檢測(cè)速度和準(zhǔn)確性,同時(shí)減小了模型體積。根據(jù)不同的網(wǎng)絡(luò)寬度和深度,YOLOv8模型可分為YOLOv8n、YOLOv8s、YOLOv8m、YOLOv8l和YOLOv8x五個(gè)版本,其中YOLOv8n模型的網(wǎng)絡(luò)寬度和深度最小,速度最快,更符合本文的應(yīng)用場(chǎng)景,故選用其作為基準(zhǔn)模型。YOLOv8模型主要由主干網(wǎng)絡(luò)(Backbone)、頸部網(wǎng)絡(luò)(Neck)和頭部網(wǎng)絡(luò)(Head)組成,結(jié)構(gòu)如圖1所示。
主干網(wǎng)絡(luò)主要由Conv、C2f和快速空間金字塔池化(spatial pyramid pooling fast, SPPF)三種模塊組成,用于提取輸入圖像的特征信息。頸部網(wǎng)絡(luò)采用特征金字塔網(wǎng)絡(luò)(feature pyramid network, FPN)+路徑聚合網(wǎng)絡(luò)(path aggregation network, PAN)結(jié)構(gòu),用于特征融合,可獲得3個(gè)大小不同的加強(qiáng)特征圖。頭部網(wǎng)絡(luò)的3個(gè)檢測(cè)器分別用于不同尺度特征圖的預(yù)測(cè)。
2 改進(jìn)的YOLOv8模型
盡管YOLOv8模型在檢測(cè)任務(wù)中表現(xiàn)出色,但在瓶胚缺陷檢測(cè)過程中,仍面臨一些挑戰(zhàn),如模型的參數(shù)量較大,難以在資源受限的環(huán)境下部署;在識(shí)別細(xì)節(jié)復(fù)雜的缺陷時(shí),其檢測(cè)精度還有待提高。為此,本文對(duì)YOLOv8模型進(jìn)行改進(jìn),提出一種YOLOv8--FEMA模型,通過引入FasterNet Block和EMA機(jī)制,有效減少了模型的參數(shù)量并提升了檢測(cè)精度。
2.1 C2f模塊優(yōu)化
C2f模塊的輸入特征通過CBS塊進(jìn)行一次卷積處理;Split操作將特征拆分為兩個(gè)分支(一個(gè)分支不經(jīng)過任何處理,另一個(gè)分支經(jīng)過Bottleneck塊進(jìn)行特征提取);Concat將兩個(gè)分支的特征進(jìn)行拼接;CBS塊對(duì)拼接后的特征進(jìn)行一次卷積處理,得到最終輸出特征。C2f模塊結(jié)構(gòu)如圖2所示。
C2f模塊的Bottleneck塊由2個(gè)卷積層組成,用于特征提取與增強(qiáng)。但當(dāng)Bottleneck塊數(shù)量為1時(shí),殘差連接和Concat操作在功能上出現(xiàn)重疊,導(dǎo)致殘差冗余,降低模型的效率。此外,在某些極端情況下(如瓶胚圖像模糊、分辨率低),C2f模塊可能無法充分捕捉瓶胚圖像的細(xì)節(jié)或上下文信息,制約了模型檢測(cè)性能的進(jìn)一步提升。
為此,本文將FasterNet Block引入YOLOv8模型的C2f模塊中,在減少模型參數(shù)量的同時(shí),盡可能地保證模型的檢測(cè)精度。
FasterNet Block[12]以局部卷積構(gòu)建整個(gè)模塊。與常規(guī)卷積不同的是,局部卷積僅對(duì)一部分的輸入特征進(jìn)行卷積運(yùn)算,因此其運(yùn)算量遠(yuǎn)低于常規(guī)卷積。同時(shí),局部卷積保留的剩余特征用于后續(xù)的特征融合,提高了模型的檢測(cè)精度。FasterNet Block在局部卷積后直接連接反殘差塊,并去除了深度卷積,進(jìn)一步減少了卷積的運(yùn)算量,提高了模型的效率。FasterNet Block結(jié)構(gòu)如圖3所示。
在FasterNet Block中,圖像特征先經(jīng)過一個(gè)卷積核為3的局部卷積處理(保留3/4的圖像特征用于后續(xù)特征融合),再利用反殘差塊來增強(qiáng)圖像特征,并通過跳躍連接來合并圖像特征,得到最終的輸出。
2.2 EMA機(jī)制
EMA機(jī)制[13]是一種改進(jìn)的注意力機(jī)制,它在傳統(tǒng)注意力機(jī)制的基礎(chǔ)上,引入指數(shù)移動(dòng)平均的方法來更新注意力權(quán)重。具體來說,在計(jì)算初始的注意力權(quán)重后,EMA機(jī)制結(jié)合一個(gè)可學(xué)習(xí)的衰減因子來平滑這些權(quán)重。該衰減因子決定了初始注意力權(quán)重的影響程度,從而使新的注意力權(quán)重不僅反映了當(dāng)前信息,還考慮了歷史信息。這種平滑處理有助于減少噪聲對(duì)模型性能的影響,使注意力機(jī)制更加穩(wěn)健。EMA機(jī)制結(jié)構(gòu)如圖4所示。
本文將EMA機(jī)制連接在FasterNet Block后,并代替C2f模塊中的Bottleneck塊,改進(jìn)的C2f模塊稱為FEMA模塊,結(jié)構(gòu)如圖5所示。
利用FEMA模塊替換YOLOv8模型主干網(wǎng)絡(luò)和頸部網(wǎng)絡(luò)的C2f模塊,構(gòu)建YOLOv8-FEMA模型。YOLOv8-FEMA模型結(jié)構(gòu)如圖6所示。
3 實(shí)驗(yàn)
3.1 數(shù)據(jù)集
本實(shí)驗(yàn)數(shù)據(jù)集由MV-CS050-10GM相機(jī)在同一環(huán)境下采集的瓶胚缺陷圖像組成。瓶胚缺陷圖像主要包括黑點(diǎn)、劃痕、氣泡3種類型,如圖7所示。
每類缺陷各采集200幅圖像,整個(gè)數(shù)據(jù)集共包含600幅圖像。鑒于采集的缺陷圖像數(shù)據(jù)較少,為保證模型的泛化性和魯棒性,采用隨機(jī)旋轉(zhuǎn)角度、水平翻轉(zhuǎn)和添加噪聲的方法對(duì)數(shù)據(jù)集進(jìn)行擴(kuò)充,最終得到一個(gè)包含1 800幅圖像的瓶胚缺陷圖像數(shù)據(jù)集。該數(shù)據(jù)集按照8∶2的比例劃分為訓(xùn)練集和驗(yàn)證集。
3.2 實(shí)驗(yàn)配置
本文所有實(shí)驗(yàn)均在同一環(huán)境下進(jìn)行。實(shí)驗(yàn)環(huán)境如表1所示。
3.3 對(duì)比實(shí)驗(yàn)
將本文模型與YOLOv5s、YOLOv8n模型進(jìn)行對(duì)比實(shí)驗(yàn),3種模型的瓶胚缺陷檢測(cè)精度曲線如圖8所示,對(duì)比結(jié)果如表3所示。
由圖8可知,本文提出的YOLOv8-FEMA模型相較于YOLOv5s、YOLOv8n模型,收斂速度更快,且瓶胚缺陷檢測(cè)精度更高。
由表3可知,本文提出的YOLOv8-FEMA模型的參數(shù)量、浮點(diǎn)運(yùn)算量、R@0.5最小,mAP@0.5最大,表明該模型在減少參數(shù)量的同時(shí),保證了瓶胚的缺陷檢測(cè)精度。
3.4 消融實(shí)驗(yàn)
為進(jìn)一步驗(yàn)證本文模型的有效性,通過消融實(shí)驗(yàn)來對(duì)比基準(zhǔn)模型YOLOv8n在引入FasterNet Block、EMA機(jī)制后的性能,結(jié)果如表4所示。
由表4可知:YOLOv8n模型引入FasterNet Block后,模型的參數(shù)量有所減少,檢測(cè)精度小幅提升;進(jìn)一步引入EMA機(jī)制后,YOLOv8n模型抑制了無用信息,檢測(cè)精度得到進(jìn)一步提升。
3.5 檢測(cè)效果對(duì)比
為了更直觀地展示模型的性能,對(duì)改進(jìn)前后的YOLOv8n模型的瓶胚缺陷檢測(cè)效果進(jìn)行可視化對(duì)比,效果如圖9所示。3種模型的瓶胚缺陷檢測(cè)平均準(zhǔn)確率如表5所示。
由圖9、表5可知:YOLOv8-FEMA模型較YOLOv8n模型在瓶胚的黑點(diǎn)和氣泡檢測(cè)上,平均準(zhǔn)確率有所提高,且能準(zhǔn)確識(shí)別出黑點(diǎn)和氣泡的位置;而在瓶胚的劃痕檢測(cè)上,雖然平均準(zhǔn)確率稍有下降,但識(shí)別劃痕的位置和數(shù)量卻更為準(zhǔn)確,表明
YOLOv8-FEMA模型在引入EMA機(jī)制后,提升了YOLOv8網(wǎng)絡(luò)抑制噪聲的能力,聚焦于有用的信息,減少了漏檢和誤檢現(xiàn)象,實(shí)現(xiàn)了更準(zhǔn)確的瓶胚缺陷檢測(cè)。
3.6 模型部署實(shí)測(cè)效果
將YOLOv8-FEMA模型部署在基于C# Win-Forms平臺(tái)開發(fā)的瓶胚缺陷檢測(cè)軟件中。結(jié)合預(yù)設(shè)的品質(zhì)判斷標(biāo)準(zhǔn),該軟件能夠有效剔除不合格瓶胚。YOLOv8-FEMA模型的實(shí)際檢測(cè)效果如圖10所示。
由圖10可知,YOLOv8-FEMA模型能夠準(zhǔn)確檢測(cè)出瓶胚的缺陷類型和數(shù)量,如瓶胚1被檢測(cè)到有1個(gè)氣泡和3個(gè)劃痕,綜合判定其品質(zhì)為不合格(NG)。
4 結(jié)論
本文結(jié)合FasterNet Block和EMA機(jī)制提出了YOLOv8-FEMA模型,減少了模型參數(shù)量并提高了瓶胚缺陷檢測(cè)的精度。實(shí)驗(yàn)結(jié)果顯示,相比于YOLOv8n模型,YOLOv8-FEMA模型的參數(shù)量、浮點(diǎn)運(yùn)算量分別減少了27%和26%,檢測(cè)精度提高了0.03,表明該模型更易于部署在資源受限的環(huán)境中,且檢測(cè)性能也有所提升。
?The author(s) 2024. This is an open access article under the CC BY-NC-ND 4.0 License (https://creativecommons.org/licenses/ by-nc-nd/4.0/)
參考文獻(xiàn)
[1] 吳宇翔,鄭兆啟,石樸,等.基于機(jī)器視覺的PET瓶坯缺陷檢測(cè)系統(tǒng)設(shè)計(jì)[J].機(jī)械制造與自動(dòng)化,2024,53(5):255-258.
[2] 吉宏軒.基于機(jī)器視覺的玻璃瓶缺陷檢測(cè)方法研究[D].沈陽(yáng):沈陽(yáng)航空航天大學(xué),2023.
[3] 張帥.基于機(jī)器視覺的藥用玻璃瓶缺陷檢測(cè)[D].沈陽(yáng):沈陽(yáng)航空航天大學(xué),2019.
[4] 楊丹.玻璃瓶口定位與缺陷檢測(cè)系統(tǒng)設(shè)計(jì)[J].包裝工程,2020, 41(15):227-231.
[5] 胡艷麗,劉團(tuán)結(jié),李世杰,等.基于機(jī)器視覺的藥瓶缺陷檢測(cè)系統(tǒng)設(shè)計(jì)[J].赤峰學(xué)院學(xué)報(bào)(自然科學(xué)版),2021,37(2):18-22.
[6] 路云浩,楊萌偉,張銚,等.基于機(jī)器視覺的PET瓶口快速缺陷檢測(cè)[J].組合機(jī)床與自動(dòng)化加工技術(shù),2020(1):64-66;70.
[7] 王祥傲,郭建勇,王帥康.啤酒瓶瓶口缺陷檢測(cè)與分揀監(jiān)控系統(tǒng)設(shè)計(jì)[J].邵陽(yáng)學(xué)院學(xué)報(bào)(自然科學(xué)版),2022,19(3):25-31.
[8] REDMON J, DIVVALA S, GIRSHICK R, et al. You only look once: Unified, real-time object detection[C]//Proceedings of the IEEE Conference on Computer Vision and Pattern Recognition,"2016:779-788.
[9] 羅希,賀強(qiáng),張寧軒,等.基于改進(jìn)型YOLOv9的絕緣子及缺陷檢測(cè)[J].機(jī)電工程技術(shù),2024,53(10):197-202.
[10] 張青春,王文聘,張洪源,等.改進(jìn)輕量化YOLOv7-tiny道路限高障礙物檢測(cè)方法[J].中國(guó)測(cè)試,2024,50(5):186-192.
[11] 余浪,苗鴻賓,蘇赫朋,等.基于改進(jìn)YOLO v3的軸承端面缺陷檢測(cè)算法[J].機(jī)床與液壓,2024,52(9):209-214.
[12] CHEN J, KAO S, HE H, et al. Run, don't walk: Chasing higher FLOPS for faster neural networks[C]//Proceedings of the IEEE/CVF Conference on Computer Vision and Pattern Re-cognition,"2023:12021-12031.
[13] LI X, ZHONG Z, WU J, et al. Expectation-maximization attention networks for semantic segmentation[C]//Proceedings of the IEEE/CVF International Conference on Computer Vi-sion,"2019: 9167-9176.
作者簡(jiǎn)介:
何永倫,男,1990年生,本科,工程師,主要研究方向:機(jī)器視覺。E-mail: 497137436@qq.com
張沖,男,1997年生,在讀碩士研究生,主要研究方向:深度學(xué)習(xí)與智能控制。E-mail: zhangchong1919@163.com
陳儒,男,1990年生,本科,工程師,主要研究方向:機(jī)器人與自動(dòng)控制。E-mail: 2583321147@qq.com
梁佳楠,男,1989年生,在讀博士研究生,高級(jí)工程師,主要研究方向:深度學(xué)習(xí)與人工智能。E-mail: jn.liang@giim.ac.cn