999精品在线视频,手机成人午夜在线视频,久久不卡国产精品无码,中日无码在线观看,成人av手机在线观看,日韩精品亚洲一区中文字幕,亚洲av无码人妻,四虎国产在线观看 ?

深度學習背景下的目標檢測技術綜述

2024-02-09 00:00:00黃天才陳博張筱晨
科技資訊 2024年24期
關鍵詞:深度學習

摘要:目標檢測技術在計算機視覺領域中占據了重要地位,隨著深度學習的興起,該領域取得了顯著進展。從傳統手工檢測方法到現代目標檢測方法,從早期的基于候選區域的"R-CNN"系列到單階段的YOLO"系列,再到加入Transformer"架構的DETR"系列等,目標檢測技術隨科技進步而更新,通過對主流算法的介紹,對比了不同算法在精度、速度、資源消耗等方面的優劣,最后探討了目標檢測面臨的挑戰與未來的發展方向。

關鍵詞:深度學習"目標檢測"一階段檢測"兩階段檢測

中圖分類號:"TP391

A"Review"of"Target"Detection"Technology"Under"the"Background"of"Deep"Learning

HUANG"Tiancai""CHEN"Bo""ZHANG"Xiaochen

School"of"Mechanical"Engineering,"Xihua"University,"Chengdu,"Sichuan"Province,"610039"China

Abstract:"Target"detection"technology"occupies"an"important"position"in"the"field"of"computer"vision,"and"it"has"made"significant"progress"with"the"rise"of"deep"learning."From"traditional"manual"detection"methods"to"modern"target"detection"methods,"from"the"early"R-CNN"series"based"on"candidate"regions"to"the"single-stage"YOLO"series,"and"then"to"the"DETR"series"with"the"addition"of"the"Transformer"architecture,"target"detection"technology"has"been"updated"with"the"advancement"of"science"and"technology."Through"the"introduction"of"mainstream"algorithms,"the"advantages"and"disadvantages"of"different"algorithms"in"terms"of"accuracy,"speed,"resource"consumption"were"compared."Finally,"the"challenges"faced"by"target"detection"and"future"development"directions"are"discussed.

Key"Words:"Deep"learning;"Target"detection;"One-stage"detection;"Two-stage"detection

目標檢測是計算機視覺中的一項重要任務,目的是將輸入圖像中所需要的部分的類別和位置標注出來。傳統的目標檢測方法依賴手工特征和機器學習技術。然而,隨著深度學習技術的引入,卷積神經網絡(Convolutional"Neural"Networks,"CNN)和"Transformer"架構也能被應用于目標檢測中,目標識別的性能大大增強,目標檢測從傳統方法過渡到深度學習方法,此后,基于深度學習方法的目標檢測網絡成為了主流。

1"傳統目標檢測算法

1.1"傳統目標檢測方法流程

傳統目標檢測方法的一般流程為6步,第一,圖像預處理負責圖像歸一化和去噪處理等;第二,候選區域生成即使用滑動窗口等方法得到潛在的目標區域;第三,特征提取是使用手工特征描述子對輸入圖像進行特征的提取操作;第四,目標分類是使用如支持向量機(Support"Vector"Machine,"SVM)等的傳統分類器對待定區域的內容進行分類;第五,邊界框優化則是使用優化模型來調整目標的邊界框位置,以提高檢測的精度;第六,后處理是使用非極大值抑制(Non-Maximum"Suppression,NMS),排查掉多余的檢測部分,只留下里面評分最高的邊界框。

1.2""兩種人工目標檢測器

人工目標檢測器不依賴于大規模的神經網絡,而是通過設計特征提取和分類算法來檢測目標。典型的檢測器如方向梯度直方圖(Histogram"of"Oriented"Gradients,"HOG)、可變形組件模型(Deformable"Part"Model,"DPM)檢測器等,它們的成功得益于對圖像特征的精心設計和特定問題的精確建模。然而,局限性也很明顯,如特征表達能力弱、檢測速度慢等。

2"深度學習目標檢測算法

深度學習的浪潮掀起,目標檢測的精度在CNN的強大特征提取能力加持下得到了極大提升??梢詫⑵浞譃閮呻A段檢測器和單階段檢測器兩大類"[1],這二者的區別是否有候選框生成,后者直接生成邊界框和進行類別預測,流程簡單,速度更快,但通常精度稍遜于前者。

2.1"兩階段目標檢測

2.1.1"CNN系列

R-CNN(Region"with"CNN"Feature)是現代目標檢測領域的開創性工作之一,由GIRSHICK"R等人[2]在"2014"年提出,使用選擇性搜索算法得到大量的待選框,使用CNN進行特征提取后使用SVM分類,判斷其所屬的目標類別,準確性提高,但計算效率低、訓練復雜。Fast"R-CNN是"R-CNN"的改進版本,由"GIRSHICK"R"[3]于"2015"年提出,主要通過共享卷積特征來加速訓練和推理過程,同時引入感興趣區域池化(Region"of"interest"pooling,"RoI"Pooling)"層,使候選區域的特征提取更有效,但候選框生成方法未變,檢測速度慢。Faster"R-CNN是由"Ren"S"Q等人[4]于"2015nbsp;年提出。首先對輸入的圖像進行關鍵信息提取處理得到特征圖并生成候選區域,通過得分篩選出高質量的候選框,由檢測頭進行類別預測和位置回歸。

2.1.2"DETR系列

DETR[5](Detection"Transformer)首次將Transformer引入目標檢測任務,能夠自然地建模圖像中的全局關系和預測目標所在位置和物體的種類,具有較高的檢測精度。但是在小物體檢測和訓練效率上表現欠優。針對這兩方面,Deformable"DETR[6]提出了一種可變形注意力機制,能夠在局部區域內進行自注意力計算,避免了全局注意力計算帶來的高計算成本,加快了訓練過程,且在小物體檢測表現良好,成為DETR的重要改進版本。

2.2"一階段目標檢測

2.2.1"其他一階段算法

SSD算法全稱是"Single"Shot"MultiBox"Detector,由"LIU"W等人[7]在2016年提出,通過在多個尺度下直接預測邊界框和類別,有效處理多尺度物體的檢測任務。與Faster"R-CNN相比,速度快,精度接近。但在小物體檢測上仍然存在困難。CenterNet[8]是一種基于關鍵點檢測的目標檢測方法,直接檢測目標的中心點位置,不依賴"anchor"和"NMS,簡化檢測流程。速度快,精度高,特別擅長檢測小目標和密集目標。EfficientDet[9]是由谷歌提出的一個高效且性能優異的檢測網絡,通過雙向連接、模塊化設計等操作提升對不同尺寸特征的提取能力,有效提升檢測性能,通過復合縮放策略平衡了精度和效率。

2.2.2"YOLOv1-v7

YOLOv1[10],主要的結構是參考谷歌的模型,使用單一網絡直接對目標圖像進行邊界框架和類別的預測,是一個完整的端到端檢測框架,實現了實時目標檢測。v2算法將更新骨干網絡,具有更強的特征提取能力,整個網絡均由卷積層來構造,可以接受任意大小的輸入圖像,模型參數量減少,提高了檢測速度。v3算法使用了DarkNet53網絡,允許輸入信息直接傳輸到底層,引入特征金字塔增強在不同尺寸下的預測能力。增加CSP(Cross"Stage"Partial)和PAN(Path"Aggregation"Network)結構,得到新的v4算法,并采用馬賽克數據增強,能學習到更豐富的語義信息,提高模型的性能。v5算法由3個部分組成,Backbone用來特征提取,將特征分成兩個部分,分別經過不同的路徑處理;Neck將不同的特征進行融合;Head可以對獲取的特征進行分類和回歸處理。v6算法使用了新的骨干網絡Efficient"Backbone和解耦檢測頭,并采用高效的卷積操作以降低模型計算量,引入大量的訓練策略,增強網絡的泛化能力。v7算法引入了E-ELAN(Extended"Efficient"Layer"Aggregation"Networks)結構,使模型能夠更好地學習不同層次的特征,引入梯度流優化等技術,平衡了復雜度和速度,使其成為輕量化目標檢測的首選。

2.2.3"YOLOv8-v10

YOLOv8"[11]是由"Ultralytics"于"2023"年發布,集成了更高效的網絡結構,主要改進為模型結構優化、自動錨點優化、數據增強和提供更好的部署接口。而v9算法通過引入多尺度特征融合模塊(Multi-level"Feature"Fusion"Module,"MFFM),使網絡能夠更好地捕捉圖像中的細節,提升小物體檢測能力,優化嵌入式設備的推理速度,減少了多余的計算,同時保持較高的檢測精度。v10算法在CNN中融合了Transformer模塊,通過自注意力機制增強了網絡的全局感知能力,在處理復雜場景時具有更強的捕捉能力。引入了動態推理機制,在不降低精度的前提下提高推理速度。v10算法作為"YOLO"系列的最新進化版本,代表了單階段目標檢測算法的前沿,在精度和速度上達到了新的高度。

3"挑戰與展望

雖然DETR、YOLOv9、YOLOv10等最新算法在精度和速度方面取得了顯著進展,但目標檢測任務仍面臨諸多挑戰。

3.1"小物體檢測

盡管多尺度特征融合技術有利于小型物體的檢測,但面對復雜背景、環境,其檢測結果仍然不盡如人意,小目標物體的檢測需要更加精確,如何實現這種需求我們應該重點考慮。

3.2"復雜場景理解

目標檢測算法需要應對更加復雜的現實場景,如嚴重遮擋、多物體重疊以及極端光照條件。未來的算法可能會更多地結合上下文信息和多模態數據來增強對復雜場景的理解。

3.3"實時檢測與低資源設備支持

隨著邊緣計算的普及,如何在低計算資源的設備上實現高效目標檢測是一個重要的研究方向。像YOLOv10引入的動態推理機制就是這一領域的探索,但仍須進一步優化。

3.4"多任務學習

當前的目標檢測算法大部分只考慮到一種需求,如檢測或分割。隨著視覺任務的融合,算法可能會朝著多任務學習的方向發展,支持同時進行目標檢測、分割、姿態估計等任務。

4"結語

目標檢測技術是視覺任務的關鍵技術,經歷從傳統的手工特征方法到深度學習方法的演變。傳統方法在特征表達能力和檢測速度方面存在局限,深度學習技術,從一開始的R-CNN"系列到后面的YOLO"系列與DETR系列,其檢測的速度和精度均得到了顯著提升。未來,隨著技術的發展和需求的改變,目標檢測算法將不斷更新迭代,通過持續的研究和創新,其有望在更多實際應用中發揮更大的作用,為智能視覺系統的建設提供有力支持。

參考文獻

[1] 黃衛.基于深度學習的目標檢測應用研究[D].南京:南京郵電大學,2022.

[2]"GIRSHICK"R"B,"DONAHUE"J,"DARRELL"T,"et"al."Rich"feature"hierarchies"for"accurate"object"detection"and"semantic"segmentation[C]//"IEEE"conference"on"computer"vision"and"pattern"recognition."Piscataway,"NJ:IEEE,"2014:"580-587.

[3] GIRSHICK"R."Fast"R-CNN[C]//"IEEE"International"Conference"on"Computer"Vision(ICCV)."Piscataway,"NJ:IEEE,"2015:"1440-"1448.

[4] REN"S"Q,"HE"K"M,"GIRSHICK"R,"et"al."Faster"r-cnn:"towards"real-time"object"detection"with"region"proposal"networks[J]."IEEE"Transactions"on"Pattern"Analysis"and"Machine"Intelligence,"2016,"39(6):"1137-1149.

[5] CARION"N,"MASSA"F,"SYNNAEVE"G,"et"al."End-to-end"object"detection"with"transformers[C]//European"Conference"on"computer"Vision."Berlin:"Springer,2020:"213-229.

[6] ZHU"X"Z","SU"W"J","LU"L"W",et"al."Deformable"DETR:"Deformable"transformers"for"End-to-End"object"detection[C]//International"Conference"on"Learning"Representations."Washington"DC:"ICLR,2021.

[7] LIU"W,ANGUELOV"D,ERHAN"D,"et"al."SSD:"Single"Shot"Multi"Box"Detector[C]//European"Conference"on"Computer"Vision."Berlin:"Springer,2016:21-37.

[8] ZHOU"X"Y,"WANG"D"Q,"KR?HENBüHL"P."Objects"as"points[J]."arXiv"preprint"arXiv:1904.07850,"2019.

[9] TAN"M"X,"PANG"R"M,"LE"Q"V."Efficientdet:"Scalable"and"efficient"object"detection[C]//IEEE/CVF"Conference"on"Computer"Vision"and"Pattern"Recognition."Piscataway,"NJ:IEEE,"2020:"10781-10790.

[10] REDMIN"J,"DIVVALA"S,"GIRSHICK"R,"et"al."You"only"look"once:"unified,"realtime"object"detection[C]//2016"IEEE"Conference"on"Computer"Vision"and"Pattern"Recognition,"Piscataway,"NJ:IEEE,"2016:"779-788.

[11] 馬原.基于卷積神經網絡的道路目標檢測研究[D].南昌:南昌大學,2024.

猜你喜歡
深度學習
從合坐走向合學:淺議新學習模式的構建
面向大數據遠程開放實驗平臺構建研究
基于自動智能分類器的圖書館亂架圖書檢測
搭建深度學習的三級階梯
有體驗的學習才是有意義的學習
電子商務中基于深度學習的虛假交易識別研究
現代情報(2016年10期)2016-12-15 11:50:53
利用網絡技術促進學生深度學習的幾大策略
考試周刊(2016年94期)2016-12-12 12:15:04
MOOC與翻轉課堂融合的深度學習場域建構
大數據技術在反恐怖主義中的應用展望
深度學習算法應用于巖石圖像處理的可行性研究
軟件導刊(2016年9期)2016-11-07 22:20:49
主站蜘蛛池模板: 亚洲伊人电影| 亚洲中文字幕国产av| 88国产经典欧美一区二区三区| 四虎影视8848永久精品| 国产成人a在线观看视频| 亚洲无码电影| 精品超清无码视频在线观看| 亚洲狼网站狼狼鲁亚洲下载| 四虎影视8848永久精品| 欧美福利在线观看| 日韩欧美成人高清在线观看| 精品无码国产自产野外拍在线| 自拍欧美亚洲| 欧美激情第一欧美在线| 婷婷开心中文字幕| 亚洲人成人伊人成综合网无码| 一区二区影院| 黄色网站不卡无码| 综合亚洲色图| 免费毛片视频| 午夜啪啪福利| 国内毛片视频| 国产综合另类小说色区色噜噜| 国产精品一区在线麻豆| 国产精品精品视频| 国产无码精品在线| 国产高清国内精品福利| 91国内外精品自在线播放| 91青草视频| 四虎国产精品永久一区| 99久久精品国产精品亚洲| 亚洲最新在线| 国产亚洲欧美在线中文bt天堂| 亚洲精品图区| 国产va在线| 国产午夜无码片在线观看网站 | 五月婷婷导航| 91精品最新国内在线播放| 免费无码AV片在线观看中文| 亚洲,国产,日韩,综合一区| 国产精品美人久久久久久AV| 91久久夜色精品国产网站| 在线观看国产精美视频| 又粗又硬又大又爽免费视频播放| 99热这里只有精品免费| 国产精品久久久久久久久久久久| 天堂岛国av无码免费无禁网站 | 久久大香伊蕉在人线观看热2| 欧美在线免费| 国产午夜福利亚洲第一| 999精品色在线观看| 中文天堂在线视频| 日韩精品亚洲人旧成在线| 国产午夜看片| 国产人碰人摸人爱免费视频| 孕妇高潮太爽了在线观看免费| 一级不卡毛片| 色综合久久88| 国产精品欧美日本韩免费一区二区三区不卡 | 国产精品网拍在线| 国产精品爆乳99久久| 国产人成在线视频| 国产成人精品一区二区秒拍1o| 91久久偷偷做嫩草影院精品| 欧美亚洲欧美| lhav亚洲精品| 亚洲日韩国产精品综合在线观看| 天堂成人在线视频| 中文无码日韩精品| 亚洲VA中文字幕| 操美女免费网站| 久热中文字幕在线观看| 亚洲av日韩av制服丝袜| 91毛片网| 日韩精品一区二区三区中文无码| 91丝袜在线观看| 婷婷综合缴情亚洲五月伊| 国产精品毛片一区| 欧美日韩中文国产va另类| 国产无码精品在线播放| 欧美va亚洲va香蕉在线| 亚洲av无码成人专区|