999精品在线视频,手机成人午夜在线视频,久久不卡国产精品无码,中日无码在线观看,成人av手机在线观看,日韩精品亚洲一区中文字幕,亚洲av无码人妻,四虎国产在线观看 ?

目標物體檢測

2024-07-09 22:54:36劉栩辰
大眾科學 2024年6期

劉栩辰

摘 要: 物體檢測是計算機視覺中的一個具有挑戰(zhàn)性的任務,涉及到在圖像或視頻中定位和分類物體。其中一個最流行的基于深度學習的物體檢測方法是YOLO。YOLO已經(jīng)在各種物體檢測基準測試中取得了最先進的性能,并致力于通過神經(jīng)網(wǎng)絡(luò)在單次前向傳遞中檢測圖像中的對象的概念,使其成為可用的最快的對象檢測模型之一。介紹YOLO的發(fā)展、技術(shù)、架構(gòu)以及所利用的算法。

關(guān)鍵詞: YOLO 目標檢測 CNN NMS算法 ResNet 劃分錨框技術(shù)

中圖分類號: TP391.41;TP183文獻標識碼: A文章編號: 1679-3567(2024)06-0001-03

Target Object Detection

—Introduction to the YOLO Algorithm

LIU Xuchen

China Three Gorges University, Yichang, Hubei Province, 443002 China

Abstract: Object detection is a challenging task in computer vision that involves locating and classifying objects in images or videos. One of the most popular object detection methods based on deep learning is YOLO.YOLO has achieved state-of-the-art performance in the various benchmark tests of object detection, and it is working on the concept of detecting objects in an image in a single forward pass through a neural network, making it one of the available and fastest object detection models. The development, technology and architecture of YOLO and algorithms used in it will be introduced.

Key Words: YOLO; Object detection; CNN; NMS algorithm; ResNet; Delimiting anchor box technology

YOLO(You Only Look Once)是一種實時物體檢測系統(tǒng)[1],由單個神經(jīng)網(wǎng)絡(luò)組成,該網(wǎng)絡(luò)獲取整個輸入圖像并預測圖像中每個對象的邊界框和類別概率。與傳統(tǒng)目標檢測算法不同,YOLO將目標檢測問題視為一個回歸問題,是直接在圖像上預測邊界框和類別概率,從而實現(xiàn)端到端的目標檢測的功能。YOLO使用全卷積神經(jīng)網(wǎng)絡(luò),通過單元格網(wǎng)格劃分輸入圖像,并利用錨框技術(shù)優(yōu)化邊界框預測。YOLO通過結(jié)合定位和分類損失函數(shù)進行訓練,從而實現(xiàn)快速且準確的物體檢測,適用于需要實時處理的場景,如視頻分析和自動駕駛。

1 YOLO的應用和發(fā)展

1.1 YOLO的發(fā)展

YOLO系列算法自2016年推出以來,經(jīng)歷了多次迭代和優(yōu)化,具體如下。

1.1.1 YOLO v2(2018)

(1)Darknet-19網(wǎng)絡(luò)架構(gòu):YOLO v2使用了一個名為Darknet-19的更深的網(wǎng)絡(luò)結(jié)構(gòu),來提高檢測精度。(2)引入了Anchor boxes:這是一種預定義的邊界框,用于預測物體的位置和大小,從而提高了檢測準確率。(3)Batch normalization:批量歸一化技術(shù),使模型更易于訓練和調(diào)整,同時減少了過擬合的風險。(4)Multiscale training:通過對不同尺度的圖像進行訓練,使模型能夠更好地適應不同尺度的目標物體[2]。

1.1.2 YOLO v3

(1)使用殘差塊代替卷積層,可以有效地增加網(wǎng)絡(luò)的深度和復雜度,并減少梯度消失問題。(2)YOLO v3使用了三個不同的檢測尺度來處理不同尺度的目標物體,從而提高了檢測的準確率。(3)利用FPN結(jié)構(gòu)(Fea? ture Pyramid Network),可以有效地提取圖像的高級語義信息,從而提高檢測的準確率和穩(wěn)定性。

1.1.3 YOLO v4

YOLO v4在YOLO v3的基礎(chǔ)上進行了多項改進。(1)使用了CSPDarknet架構(gòu),能夠減少網(wǎng)絡(luò)中的參數(shù)數(shù)量和計算量,并提高網(wǎng)絡(luò)的穩(wěn)定性和魯棒性。(2)加入Mosaic數(shù)據(jù)增強,可以將多張圖像拼接成一張圖像進行訓練,可以增加數(shù)據(jù)的多樣性并提高模型的泛化能力。(3)采用SPP-block:SPP(Spatial Pyramid Pooling)塊可以對不同尺度的特征圖進行池化操作,從而提高模型對不同尺度物體的檢測能力。(4)采用Path Aggrega? tion Network(PANet)結(jié)構(gòu),可以有效地將不同尺度的特征圖進行融合,從而提高模型的檢測準確率和穩(wěn)定性。YOLO v4在目標檢測領(lǐng)域取得了很好的成果,其不僅綜合運用了各種先進的技術(shù)手段,還引入了PA? Net模塊,使網(wǎng)絡(luò)能夠跨多個尺度檢測目標,從而提高了目標檢測的準確性,并使模型更加穩(wěn)定和可靠。

1.1.4 YOLO v5

YOLO v5作為最新的版本之一,在v4的基礎(chǔ)上用了更加輕量級的網(wǎng)絡(luò)結(jié)構(gòu)。這使其在保持高性能的同時,具有更高的推理速度。并采用了一系列的模型優(yōu)化技巧,包括網(wǎng)絡(luò)結(jié)構(gòu)設(shè)計、模型壓縮和剪枝等,以提高模型的速度和精度。

YOLO算法的發(fā)展受益于硬件進步和數(shù)據(jù)集豐富,但也存在局限性,如對小物體檢測的不足。為解決這些問題,出現(xiàn)了Faster R-CNN、RetinaNet、CenterNet等改進算法。同時,評價指標的完善也推動了YOLO算法的持續(xù)創(chuàng)新。

除了技術(shù)創(chuàng)新外,YOLO系列算法的發(fā)展還受到了其他因素的影響,如硬件設(shè)備的進步、數(shù)據(jù)集的豐富和算法評價指標的不斷完善等[3]。硬件設(shè)備的進步為YOLO系列算法的發(fā)展提供了更強的計算能力和數(shù)據(jù)處理能力,這得益于GPU性能的提高和更高效的網(wǎng)絡(luò)設(shè)計。此外,一些專門為深度學習任務設(shè)計的硬件加速器,如Nvidia的Tensor Core、Google的TPU等,也可以進一步提高YOLO算法的計算效率和速度。

YOLO系列算法的發(fā)展得益于數(shù)據(jù)集的豐富和評價指標的完善。隨著COCO、PASCAL VOC、ImageNet等數(shù)據(jù)集的公開,算法能夠?qū)W習更多樣化的物體和場景,提高其泛化能力。然而,YOLO在檢測小物體和密集物體方面存在局限,且在大場景下可能漏檢。為克服這些挑戰(zhàn),研究者提出了Faster R-CNN、RetinaNet、CenterNet等改進算法,它們在保持高精度的同時,更有效地處理小物體、密集物體和大場景檢測。未來,YOLO算法需不斷優(yōu)化以適應復雜場景。此外,評價指標的改進,如從PASCAL VOC的平均精度(mAP)到COCO的mAP和召回率,促進了算法的技術(shù)創(chuàng)新。

1.2 YOLO的演變趨勢

從YOLO到Y(jié)OLO v5,模型不斷進行演變提升[4]。YOLO算法在目標檢測領(lǐng)域,尤其是對小目標的檢測上,通過不斷優(yōu)化網(wǎng)絡(luò)結(jié)構(gòu)和損失函數(shù),取得了顯著進步。其演變版本不僅提升了小目標的檢測性能,還通過引入多任務學習,增強了模型的多功能性,使其能夠同時完成檢測、分割、關(guān)鍵點檢測等任務。YOLO系列算法強調(diào)實時性和輕量性,因此在嵌入式設(shè)備和移動端應用中得到了廣泛應用。

YOLO v5等最新版本進一步推動了自動化和應用拓展,通過自動化工具簡化了模型訓練和推理過程,并在智能交通、工業(yè)檢測、無人機、自動駕駛等多個領(lǐng)域得到應用。這些進展展示了YOLO算法在目標檢測領(lǐng)域的持續(xù)創(chuàng)新和廣泛應用前景。

2 YOLO算法的機制與架構(gòu)

2.1 注意力機制

YOLO算法通過將物體檢測視為回歸問題,實現(xiàn)快速且準確的檢測。它通過聯(lián)合訓練分類和定位,提升了檢測精度。注意力機制在YOLO中主要通過Squeezeand-Excitation (SE) block實現(xiàn),這是一種增強CNN特征表示的輕量級方法。

SE block的操作分為兩步:

(1)Squeeze:通過全局平均池化,將每個通道的特征壓縮成一個單一數(shù)值;

(2)Excitation:使用兩個全連接層處理Squeeze得到的向量,學習每個通道的重要性權(quán)重,并通過sig? moid激活函數(shù)限制權(quán)重在0到1之間。最后,將權(quán)重與原始特征圖相乘,得到強化的特征圖[5]。

SE block的引入可以提升YOLO的檢測性能,它通過強化特征表示幫助網(wǎng)絡(luò)更有效地識別和分類物體。由于其輕量級特性,SE block易于集成并可根據(jù)需求調(diào)整優(yōu)化。

2.2 CNN

YOLO算法的主要結(jié)構(gòu)是基于卷積神經(jīng)網(wǎng)絡(luò)(Con? volutional Neural Network,CNN),通過對輸入圖像進行卷積和池化操作,提取特征信息,并用這些特征信息來預測目標的位置和類別。

CNN是一種深度學習模型,主要用于圖像、音頻和文本等數(shù)據(jù)的特征提取和分類。它由多層卷積和池化層構(gòu)成,能夠自動從原始數(shù)據(jù)中學習特征。CNN的核心在于卷積操作,通過卷積核與輸入數(shù)據(jù)的點積提取局部特征,形成特征圖。池化操作則用于下采樣,減少特征圖尺寸,保留重要特征。YOLO算法利用預訓練的CNN,如VGG、ResNet或Darknet,從圖像中提取特征。這些特征經(jīng)過多層卷積處理,提取更高級的特征,最終通過全連接層預測物體的邊界框和類別概率。

2.3 ResNet

YOLO算法采用殘差網(wǎng)絡(luò)(ResNet)作為骨干網(wǎng)絡(luò),以加快訓練速度和提升檢測精度。ResNet是一種深度卷積神經(jīng)網(wǎng)絡(luò),它通過引入殘差塊(Residual Block)解決了傳統(tǒng)深度網(wǎng)絡(luò)中的梯度消失或爆炸問題。殘差塊包含兩個卷積層和一個跳躍連接,后者允許輸入特征直接傳遞到輸出,從而維持梯度流。這種設(shè)計使ResNet能夠構(gòu)建更深的網(wǎng)絡(luò)結(jié)構(gòu),學習更復雜的特征表示,而不受深度限制。

2.4 NMS算法

在YOLO算法中,非極大值抑制(Non-Maximum Suppression, NMS)用于去除多余的邊界框,以避免對同一目標的重復檢測[6]。NMS通過選擇最有可能包含目標的邊界框,并抑制其他與之重疊但置信度較低的邊界框,從而提高檢測的準確性和效率。NMS的優(yōu)點在于有效減少冗余檢測,但需要調(diào)整閾值以適應不同的應用場景。此外,NMS可能不適用于密集場景,因為它可能會錯誤地抑制掉一些小目標的檢測。

2.5 劃分錨框技術(shù)

YOLO算法通過使用錨框(Anchor Box)來提升目標檢測的精確度。錨框技術(shù)涉及為每個像素點分配多個具有預設(shè)大小和寬高比的邊界框,然后對這些框進行分類和位置回歸,以識別和定位圖像中的目標對象[7]。

錨框的實現(xiàn)基于輸入圖像生成的特征圖,即卷積神經(jīng)網(wǎng)絡(luò)處理后的高級特征圖像。在特征圖上,每個像素點周圍會生成一系列錨框,預測模型對這些錨框進行分析,以確定是否包含目標對象并精確預測其位置。

錨框的優(yōu)點包括:能夠適應目標對象在不同尺寸和形狀下的變化,提高檢測準確性;減少計算量和內(nèi)存消耗,因為只對一組錨框而非整個圖像進行處理。

然而,錨框方法也有一些局限性:需要預先定義錨框的尺寸和寬高比,可能需要針對不同場景進行調(diào)整;如果錨框數(shù)量過多或尺寸設(shè)置不當,可能會導致效率降低。

3 結(jié)語

YOLO算法作為單階段目標檢測技術(shù),在檢測速度、類別多樣性和精度方面超越了傳統(tǒng)算法,如Detec? torNet、OverFeat、DeepMultiBox。其發(fā)展展示了技術(shù)創(chuàng)新的軌跡,融合了全卷積網(wǎng)絡(luò)、批量歸一化、殘差學習、FPN等先進技術(shù),顯著提升了性能。YOLO的開源特性為研究社區(qū)提供了豐富的資源,推動了目標檢測技術(shù)的進步。隨著技術(shù)的迭代、硬件的發(fā)展、數(shù)據(jù)集的擴展和評價標準的精細化,YOLO系列算法在計算機視覺領(lǐng)域展現(xiàn)出廣泛的應用潛力和高實用價值。YOLO算法通過不斷的創(chuàng)新和實踐,已對計算機視覺領(lǐng)域做出了顯著貢獻,在未來的研究中,YOLO算法還將繼續(xù)發(fā)揮重要作用,為目標檢測任務帶來更多的創(chuàng)新和進步。

參考文獻

[1] STEIN T,PEELEN M V.Object detection in natural scenes: Independent effects of spatial and categorybased attention[J].Attention,Perception,& Psychophys? ics,2017,79(3):738-752.

[2] JIANG P Y, ERGU D J, LIU F Y,et al.A Review of Yolo algorithm developments[J]. Procedia computer science,2022,199:1066-1073.

[3] ZHENG C.Stack-YOLO:A Friendly-Hardware RealTime Object Detection Algorithm[J]. IEEE Access, 2023,11:62522-62534.

[4] THUAN D.Evolution of Yolo algorithm and Yolov5: The State-of-the-Art object detention algorithm[D]. Finland:Oulun Ammattikorkeakoulu,2021.

[5] LEE Y H,KIM Y.Comparison of CNN and YOLO for Object Detection[J]. Journal of the semiconductor & display technology,2020,19(1):85-92.

[6] JEON D H,KIM T S,KIM J S.A Method for Reducing False Negative Rate in Non-Maximum Suppression of YOLO Using Bounding Box Density[J].Journal of Mul? timedia Information System, 2023,10(4):293-300.

[7] ORESKI G.YOLO* C:Adding context improves YOLO performance[J].Neurocomputing,2023,555:126655.

主站蜘蛛池模板: 强奷白丝美女在线观看 | 亚洲综合第一页| 亚洲欧美另类日本| 精品国产美女福到在线不卡f| 日本人妻一区二区三区不卡影院| 亚洲成人免费在线| 日韩精品一区二区三区视频免费看| 91毛片网| 国产永久免费视频m3u8| 国产区精品高清在线观看| 亚洲人成影视在线观看| 2020国产免费久久精品99| 国产在线观看第二页| 永久成人无码激情视频免费| 国产欧美综合在线观看第七页 | 亚洲丝袜第一页| 久久国产V一级毛多内射| 日韩欧美91| 亚洲最大在线观看| a级毛片网| 色噜噜狠狠狠综合曰曰曰| 免费国产好深啊好涨好硬视频| 欧美一区日韩一区中文字幕页| 久久久久久久蜜桃| 国产成本人片免费a∨短片| 丰满的少妇人妻无码区| 日韩亚洲综合在线| 热99精品视频| 美女一级毛片无遮挡内谢| 国产无码高清视频不卡| 91青青视频| 中文字幕人妻无码系列第三区| 国产亚洲精品自在久久不卡| 99热免费在线| 国产麻豆精品久久一二三| 久久人人妻人人爽人人卡片av| 亚洲第一天堂无码专区| 日韩中文精品亚洲第三区| 国产v精品成人免费视频71pao| 欧美一区二区福利视频| 91小视频在线观看免费版高清| 大陆精大陆国产国语精品1024| 久久国产精品无码hdav| 97综合久久| 成人毛片在线播放| 久久成人国产精品免费软件| 国产女人爽到高潮的免费视频| 91福利片| 成人在线亚洲| 国产自无码视频在线观看| 久久综合色天堂av| 中文成人在线视频| 婷婷伊人五月| 亚洲人精品亚洲人成在线| 91久久偷偷做嫩草影院精品| 国产呦精品一区二区三区下载| 国产真实乱了在线播放| 97在线免费| 成人精品视频一区二区在线| 偷拍久久网| 日本少妇又色又爽又高潮| 亚洲中文字幕国产av| 国产女人喷水视频| 亚洲AV一二三区无码AV蜜桃| 制服丝袜在线视频香蕉| 大香伊人久久| 制服丝袜在线视频香蕉| 久久一本日韩精品中文字幕屁孩| 中文字幕va| 日韩欧美综合在线制服| 日本久久免费| 亚洲人成影院在线观看| 91精品国产自产在线老师啪l| 亚洲无码高清免费视频亚洲| 国产精品午夜电影| 黑色丝袜高跟国产在线91| 欧美劲爆第一页| 中文字幕久久亚洲一区| 亚洲精品va| 一区二区偷拍美女撒尿视频| 国产18在线播放| 国产在线精彩视频二区|