999精品在线视频,手机成人午夜在线视频,久久不卡国产精品无码,中日无码在线观看,成人av手机在线观看,日韩精品亚洲一区中文字幕,亚洲av无码人妻,四虎国产在线观看 ?

基于深度學(xué)習(xí)的兩階段目標(biāo)檢測(cè)算法綜述

2023-03-10 17:26:02葉嘉欣
互聯(lián)網(wǎng)周刊 2023年5期
關(guān)鍵詞:深度學(xué)習(xí)

葉嘉欣

摘要:目標(biāo)檢測(cè)是計(jì)算機(jī)視覺(jué)的重要研究方向之一,旨在準(zhǔn)確識(shí)別圖像中目標(biāo)的位置和類別,因其較高的準(zhǔn)確性,受到研究人員的廣泛關(guān)注。近年來(lái),計(jì)算機(jī)技術(shù)快速發(fā)展,相對(duì)于傳統(tǒng)的目標(biāo)檢測(cè)算法,基于深度學(xué)習(xí)的目標(biāo)檢測(cè)算法的優(yōu)勢(shì)逐漸凸顯,該算法精度高、實(shí)時(shí)性好。本文介紹了幾種經(jīng)典的兩階段目標(biāo)檢測(cè)算法,對(duì)其優(yōu)缺點(diǎn)進(jìn)行了比較,并對(duì)未來(lái)兩階段目標(biāo)檢測(cè)算法的發(fā)展進(jìn)行了展望。

關(guān)鍵詞:深度學(xué)習(xí);目標(biāo)檢測(cè)算法;技術(shù)演變 ;計(jì)算機(jī)視覺(jué)

引言

自計(jì)算機(jī)誕生之時(shí),研究人員就在思考如何使計(jì)算機(jī)變得智能。如今,人工智能已經(jīng)成為一個(gè)熱點(diǎn)領(lǐng)域,而在人工智能領(lǐng)域中,目標(biāo)檢測(cè)[1]一直是計(jì)算機(jī)視覺(jué)領(lǐng)域經(jīng)久不衰的研究方向[2]。它主要通過(guò)綜合利用圖像處理、機(jī)器學(xué)習(xí)、人工智能等技術(shù),從圖像中查找對(duì)象,然后指定其位置和類別。在計(jì)算機(jī)視覺(jué)領(lǐng)域,由于各種外部環(huán)境因素的干擾,目標(biāo)檢測(cè)一直是具挑戰(zhàn)性的問(wèn)題之一。近年來(lái),深度學(xué)習(xí)因?yàn)槠鋬?yōu)越性廣泛應(yīng)用于各種領(lǐng)域,基于深度學(xué)習(xí)的目標(biāo)檢測(cè)算法也逐漸被人們關(guān)注,如圖1所示。本文首先簡(jiǎn)要說(shuō)明傳統(tǒng)的目標(biāo)檢測(cè)算法,并說(shuō)明它的缺陷,還對(duì)當(dāng)前經(jīng)典的兩階段目標(biāo)檢測(cè)算法進(jìn)行了詳細(xì)的介紹與比較,最后展望了兩階段目標(biāo)檢測(cè)算法未來(lái)的研究方向。

1. 傳統(tǒng)目標(biāo)檢測(cè)算法

傳統(tǒng)的目標(biāo)檢測(cè)算法可以分為兩個(gè)方向:根據(jù)特征進(jìn)行目標(biāo)識(shí)別、根據(jù)分割進(jìn)行目標(biāo)識(shí)別。在傳統(tǒng)的算法中,主要的特征有Harr特征[3]、HOG特征[4]、SIFT特征等。人為提取特征的效果難以保證是傳統(tǒng)目標(biāo)檢測(cè)算法的一大缺點(diǎn),可移植性較差,時(shí)間復(fù)雜度高,存在大量的冗余計(jì)算,勢(shì)必會(huì)導(dǎo)致運(yùn)行速度難以提升,而且面對(duì)復(fù)雜多變的環(huán)境時(shí),魯棒性差,只有在一些特定的環(huán)境下才會(huì)有較好的表現(xiàn),因此在現(xiàn)實(shí)生活中也得不到大規(guī)模的使用。在計(jì)算機(jī)視覺(jué)技術(shù)迅猛發(fā)展的今天,基于深度學(xué)習(xí)的目標(biāo)檢測(cè)算法因?qū)崟r(shí)精度高,逐步替代了傳統(tǒng)目標(biāo)檢測(cè)方法。在復(fù)雜場(chǎng)景下,背景變化劇烈時(shí),傳統(tǒng)的目標(biāo)檢測(cè)算法會(huì)出現(xiàn)誤檢或漏檢等現(xiàn)象。為克服傳統(tǒng)目標(biāo)檢測(cè)算法準(zhǔn)確性不高的不足,提出一種兩階段目標(biāo)檢測(cè)算法。

2. 基于深度學(xué)習(xí)的兩階段目標(biāo)檢測(cè)算法

2013年Sermanet等人[5]提出了著名的OverFeat算法。OverFeat可以說(shuō)是單階段目標(biāo)檢測(cè)算法的經(jīng)典開(kāi)山之作,基于AlexNet[6]實(shí)現(xiàn)了識(shí)別、定位、檢測(cè)共用同一個(gè)網(wǎng)絡(luò)框架。這也是首篇介紹使用一個(gè)網(wǎng)絡(luò)就能解決這一問(wèn)題的方法。它利用了卷積神經(jīng)網(wǎng)絡(luò)的特征提取功能,把分類過(guò)程中提取到的特征又同時(shí)用于定位檢測(cè)任務(wù)。該論文通過(guò)一種應(yīng)用于回歸邊界框的貪婪合并策略,合并各個(gè)預(yù)測(cè),是一種全新的定位與檢測(cè)方法。整體沒(méi)有全連接層,采用全卷積網(wǎng)絡(luò),消除了傳統(tǒng)滑動(dòng)窗口方法的很多冗余計(jì)算,提高了算法的魯棒性又保證了效率。此算法對(duì)后續(xù)深度學(xué)習(xí)目標(biāo)檢測(cè)算法的發(fā)展有著重要意義。但是該算法對(duì)小目標(biāo)的檢測(cè)效果不理想,且存在較高錯(cuò)誤率。

2014年,R-CNN搭載著“Region Proposal(候選框)+CNN”提取的分類網(wǎng)絡(luò)的組合模式出現(xiàn)在大眾視野中,這種兩階段目標(biāo)檢測(cè)算法以其優(yōu)秀的準(zhǔn)確度給目標(biāo)檢測(cè)算法提供了新思路。Two-stage(兩階段)目標(biāo)檢測(cè)算法將目標(biāo)檢測(cè)分為兩大部分:候選區(qū)域的選取、目標(biāo)的分類識(shí)別。兩階段目標(biāo)檢測(cè)算法的優(yōu)勢(shì)在于選取多個(gè)候選框可以充分提取目標(biāo)的特征信息,檢測(cè)的準(zhǔn)確度高,同時(shí)可以實(shí)現(xiàn)精準(zhǔn)定位,但是因?yàn)樗惴P蛷?fù)雜且分兩個(gè)步驟進(jìn)行,所以檢測(cè)速度較慢。下面簡(jiǎn)要介紹一些經(jīng)典的兩階段檢測(cè)算法以及它們的優(yōu)缺點(diǎn)。

2.1 R-CNN

R-CNN[7]算法由Girshick等人在2014年提出,它開(kāi)啟了將深度學(xué)習(xí)運(yùn)用在目標(biāo)檢測(cè)的大門,并為后續(xù)該系列檢測(cè)算法奠定了基礎(chǔ)。此后,目標(biāo)檢測(cè)算法的實(shí)時(shí)性與精確度不斷提高。

R-CNN目標(biāo)檢測(cè)算法可分為四個(gè)步驟:第一步,利用選擇性搜索算法SS(Selective Search)[8]從圖像中提取約2000個(gè)候選框。第二步,利用深度卷積神經(jīng)網(wǎng)絡(luò)提取各候選框的函數(shù)向量。第三步,用AlexNet將各個(gè)函數(shù)向量發(fā)送給各個(gè)向量機(jī)(SVM),判斷是否屬于此類。第四步,使用邊界框的回歸和非極大值抑制算法來(lái)獲得候選的最佳框。雖然該算法大幅提高了平均精確度,但是因?yàn)樾枰獙?duì)2000個(gè)候選框進(jìn)行特征提取,所以檢測(cè)速度較慢。針對(duì)此問(wèn)題,He等人在2015年提出了SPP-Net[9]算法。

2.2 SPP-Net

因?yàn)镽-CNN算法只能對(duì)固定大小的圖像進(jìn)行卷積運(yùn)算,這就會(huì)導(dǎo)致特征信息損失和運(yùn)算速度慢的問(wèn)題出現(xiàn)。為了解決R-CNN算法提取特征操作冗長(zhǎng)的問(wèn)題,He等人在2015年提出了SPP-Net算法。SPP-Net算法同樣大致分為四個(gè)步驟:第一步,采用SS(Selective Search)方法讓一張圖片生成2000個(gè)候選區(qū)域;第二步,利用空間金字塔池化[10](Spatial Pyramid Pooling,SPP)操作,把每個(gè)候選區(qū)域?qū)?yīng)的特征轉(zhuǎn)換成固定長(zhǎng)度的特征;第三步,輸入全連接層;第四步,進(jìn)行后續(xù)SVM的分類和回歸。SPP-Net算法通過(guò)引入SPP來(lái)避免重復(fù)進(jìn)行卷積運(yùn)算,在保證同樣或者更好的檢測(cè)精度的同時(shí),極大地提升了檢測(cè)速度,相比R-CNN 算法快24~102倍[11]。首先,訓(xùn)練還處于多個(gè)階段,接下來(lái),SPP-Net只對(duì)完全連接的層進(jìn)行了微調(diào),忽略了之前的所有層,添加池化層后,網(wǎng)絡(luò)只更新下面的完整連接層,忽略了以前層數(shù)對(duì)模型的影響,從而降低了檢測(cè)精度。為了解決R-CNN和SPP網(wǎng)絡(luò)的缺點(diǎn),Girshick等人在2015年提出了Fast R-CNN算法。

2.3 Fast R-CNN

Fast R-CNN[12]是對(duì)R-CNN算法的改進(jìn),在卷積計(jì)算部分使用VGG16網(wǎng)絡(luò)代替AlexNet網(wǎng)絡(luò),并且融合了SPP-net的思想,將網(wǎng)絡(luò)的SPP層設(shè)計(jì)成為單獨(dú)的一層,即ROI(Region of Interesting) Pooling層,進(jìn)一步解決了權(quán)值更新的問(wèn)題。該算法引入SVD(Singular Value Decomposition)對(duì)全連接層進(jìn)行分解,使得處理一張圖片的速度明顯提升。Fast R-CNN將卷積神經(jīng)網(wǎng)絡(luò)提取的特征存儲(chǔ)在顯存中,減少了對(duì)磁盤空間的占用,提高了訓(xùn)練性能,加快了訓(xùn)練速度。同時(shí)在網(wǎng)絡(luò)中加入多任務(wù)損失函數(shù)邊框回歸,整個(gè)訓(xùn)練過(guò)程僅包括候選區(qū)域提取和CNN訓(xùn)練兩個(gè)階段。但是,該算法存在一些缺陷。它仍然使用SS (Selective Search)方法來(lái)選擇候選區(qū)域,這一步仍然會(huì)有大量的計(jì)算。Fast R-CNN雖然成功地融合了R-CNN和SPP-Net的優(yōu)點(diǎn),但仍然無(wú)法實(shí)現(xiàn)端到端的目標(biāo)檢測(cè)。例如,不能同時(shí)獲得候選區(qū)域,速度仍有提高的空間。

2.4 Faster R-CNN

針對(duì)以上網(wǎng)絡(luò)存在的不足,在 Fast R-CNN 之后不久,Ren等人在2015年提出了Faster R-CNN[13]算法。Faster R-CNN是第一個(gè)接近實(shí)時(shí)的深度學(xué)習(xí)檢測(cè)算法。Faster R-CNN的主要貢獻(xiàn)是引入了區(qū)域生成網(wǎng)絡(luò)(Region Proposal Networks,RPN),代替Selective Search算法。盡管Faster R-CNN已經(jīng)突破了Fast R-CNN的速度瓶頸,但是后續(xù)檢測(cè)階段仍存在計(jì)算冗余問(wèn)題。它繼續(xù)沿用ROI Pooling層,這就會(huì)導(dǎo)致降低目標(biāo)檢測(cè)中定位的準(zhǔn)確性,而且Faster R-CNN對(duì)小目標(biāo)的檢測(cè)效果不佳,后來(lái)提出了各種改進(jìn)方案,包括R-FCN[14]和Light head R-CNN[15]都對(duì)Faster R-CNN做了進(jìn)一步的改進(jìn)。

2.5 FPN

為了解決Faster R-CNN目標(biāo)檢測(cè)算法在應(yīng)對(duì)多尺度變化問(wèn)題時(shí)的不足,以及對(duì)小目標(biāo)檢測(cè)效果不佳等問(wèn)題,Lin等人在Faster R-CNN的基礎(chǔ)上提出了FPN[16]算法。文章將一種自頂向下、帶有側(cè)向連接的層次結(jié)構(gòu)應(yīng)用在Faster R-CNN算法中,使得算法在不增加計(jì)算量的同時(shí),對(duì)小目標(biāo)的檢測(cè)能力大幅提升。在FPN出現(xiàn)之前,大多數(shù)基于深度學(xué)習(xí)的目標(biāo)檢測(cè)算法都只用頂層特征做預(yù)測(cè),雖然深層的特征語(yǔ)義信息豐富,但是目標(biāo)位置卻很模糊。FPN通過(guò)連續(xù)上采樣和跨層融合,使得輸出特征既具有底層視覺(jué)信息,又具有深層語(yǔ)義信息。嚴(yán)格來(lái)說(shuō),F(xiàn)PN本身并不屬于一種目標(biāo)檢測(cè)算法,它是一個(gè)骨干網(wǎng)絡(luò)。同時(shí)它也具有一定的缺陷,因?yàn)椴煌瑢又g存在語(yǔ)義鴻溝,直接融合會(huì)降低多尺度表示能力,而且下采樣過(guò)程會(huì)損失最高層金字塔特征信息。

結(jié)語(yǔ)

文中總結(jié)了當(dāng)前階段比較經(jīng)典的兩階段目標(biāo)檢測(cè)算法,并分析和總結(jié)其優(yōu)勢(shì)和局限。總體來(lái)看,兩階段目標(biāo)檢測(cè)算法無(wú)論是檢測(cè)精度還是檢測(cè)速度都得到了提升與優(yōu)化。相對(duì)于單階段目標(biāo)檢測(cè)算法,兩階段目標(biāo)檢測(cè)算法雖然沒(méi)有單階段目標(biāo)檢測(cè)算法那么快,但其檢測(cè)精度方面更具有優(yōu)勢(shì)。隨著計(jì)算機(jī)視覺(jué)與深度學(xué)習(xí)的快速發(fā)展和其硬件性能的不斷提高,給目標(biāo)檢測(cè)技術(shù)的發(fā)展提供了有利的環(huán)境與條件。與傳統(tǒng)的目標(biāo)檢測(cè)算法相比,基于深度學(xué)習(xí)的目標(biāo)檢測(cè)算法不論是在速度還是精度方面都有了很大的提高,但仍有很大的發(fā)展空間。如何提升小目標(biāo)的檢測(cè)精度,使其更好地運(yùn)用到遙感監(jiān)測(cè)與軍事領(lǐng)域中,如何使算法更加輕量化,使其能夠在移動(dòng)設(shè)備上平穩(wěn)運(yùn)行,如何運(yùn)用到視頻監(jiān)控檢測(cè),這對(duì)自動(dòng)駕駛有著重要意義,這些都將會(huì)是兩階段目標(biāo)檢測(cè)算法的重要研究方向。希望基于深度學(xué)習(xí)的兩階段目標(biāo)檢測(cè)算法在未來(lái)能夠?yàn)槿祟悗?lái)更大的貢獻(xiàn)。

參考文獻(xiàn):

[1]趙永強(qiáng),饒?jiān)砾i.深度學(xué)習(xí)目標(biāo)檢測(cè)方法綜述[J].中國(guó)圖象圖形學(xué)報(bào), 2020,25(4):629-654.

[2]張順,龔怡宏,王進(jìn)軍.深度卷積神經(jīng)網(wǎng)絡(luò)的發(fā)展及其在計(jì)算機(jī)視覺(jué)領(lǐng)域的應(yīng)用[J].計(jì)算機(jī)學(xué)報(bào),2019,42(3):453-482.

[3]宋曉琳,鄔紫陽(yáng),張偉偉.基于陰影和類Haar特征的動(dòng)態(tài)車輛檢測(cè)[J].電子測(cè)量與儀器學(xué)報(bào)2015,(9):1340-1347.

[4]徐淵,許曉亮,李才年.結(jié)合SVM分類器與HOG特征提取的行人檢測(cè)[J].計(jì)算機(jī)工程2016,(1):56-60,65.

[5]Sermanet P,Eigen D,Zhang X,et al.Overfeat:Integrated recognition, localization and detection using convolutional networks[J].arXiv preprint arXiv:1312.6229,2013.

[6]Krizhevsky A,Sutskever I,Hinton GE.Imagenet classification with deep convolutional neural networks[J].Communications of the ACM,2017.60(6):84-90.

[7]Girshick R, Donahue J, Darrell T,et al.Rich feature hierarchies for accurate object detection and semantic segmentation[C]//Proceedings of the IEEE conference on computer vision and pattern recognition.2014:580-587.

[8]吳素雯,戰(zhàn)蔭偉.基于選擇性搜索和卷積神經(jīng)網(wǎng)絡(luò)的人臉檢測(cè)[J].計(jì)算機(jī)應(yīng)用研究2017,(9),2854-2857,2876.

[9]He K,Zhang X,Ren S,et al.Spatial pyramid pooling in deep convolutional networks for visual recognition[J].IEEE transactions on pattern analysis and machine intelligence,2015,37(9):1904-1916.

[10]侯明偉.基于空間金字塔池化的卷積神經(jīng)網(wǎng)絡(luò)圖像分類算法[D].武漢:武漢大學(xué),2018.

[11]楊偉,杜學(xué)峰,張勇.基于深度學(xué)習(xí)的車輛目標(biāo)檢測(cè)算法綜述[J].汽車實(shí)用技術(shù)2022,(2):24-26.

[12]Girshick R. Fast r-cnn[C]//Proceedings of the IEEE international conference on computer vision.2015:1440-1448.

[13]Ren S,He K,Girshick R,et al.Faster r-cnn:Towards real-time object detection with region proposal networks[C]//Advances in neural information processing systems. 2015,(1):91-99.

[14]Dai J,Li Y,He K,et al.R-fcn:Object detection via region-based fully convolutional networks[C]//Advances in neural information processing systems. 2016: 379-387.

[15]Li Z,Peng C,Yu G,et al.Light-head r-cnn:In defense of two-stage object detector[C]//arXiv preprint arXiv.2017:1711-7264.

[16]Lin TY,Dollár P,Girshick R,et al.Feature pyramid networks for object detection[C]//Proceedings of the IEEE conference on computer vision and pattern recognition.2017:2117-2125.

作者簡(jiǎn)介:葉嘉欣,本科在讀,研究方向:日語(yǔ)、軟件工程。

猜你喜歡
深度學(xué)習(xí)
從合坐走向合學(xué):淺議新學(xué)習(xí)模式的構(gòu)建
面向大數(shù)據(jù)遠(yuǎn)程開(kāi)放實(shí)驗(yàn)平臺(tái)構(gòu)建研究
基于自動(dòng)智能分類器的圖書(shū)館亂架圖書(shū)檢測(cè)
搭建深度學(xué)習(xí)的三級(jí)階梯
有體驗(yàn)的學(xué)習(xí)才是有意義的學(xué)習(xí)
電子商務(wù)中基于深度學(xué)習(xí)的虛假交易識(shí)別研究
利用網(wǎng)絡(luò)技術(shù)促進(jìn)學(xué)生深度學(xué)習(xí)的幾大策略
考試周刊(2016年94期)2016-12-12 12:15:04
MOOC與翻轉(zhuǎn)課堂融合的深度學(xué)習(xí)場(chǎng)域建構(gòu)
大數(shù)據(jù)技術(shù)在反恐怖主義中的應(yīng)用展望
深度學(xué)習(xí)算法應(yīng)用于巖石圖像處理的可行性研究
主站蜘蛛池模板: 干中文字幕| 91精品啪在线观看国产60岁| 婷婷丁香在线观看| 女人18毛片水真多国产| 极品尤物av美乳在线观看| 日本91在线| 97se亚洲综合| 一本大道无码高清| 亚洲网综合| 亚洲色图欧美激情| 91视频免费观看网站| 精品91视频| 亚洲伊人天堂| 国产乱人伦偷精品视频AAA| 99ri精品视频在线观看播放| 好吊妞欧美视频免费| 婷婷午夜天| 午夜免费小视频| 国产精品jizz在线观看软件| 欧美色图久久| 青青操视频免费观看| 久久综合九色综合97婷婷| 欧美精品亚洲日韩a| 免费在线看黄网址| 国产在线一区视频| 久青草网站| 成人国内精品久久久久影院| 一区二区三区国产| 一本二本三本不卡无码| 国产亚洲现在一区二区中文| 成人精品亚洲| 亚洲国产91人成在线| 国产精品香蕉| 国产视频久久久久| 秋霞午夜国产精品成人片| 欧美中文一区| 爽爽影院十八禁在线观看| 黄色一及毛片| 欧美午夜理伦三级在线观看| 免费久久一级欧美特大黄| 日韩一区精品视频一区二区| 国产凹凸视频在线观看| 99视频在线免费| 亚洲第一天堂无码专区| 19国产精品麻豆免费观看| 亚洲婷婷丁香| AV熟女乱| 制服丝袜一区二区三区在线| 欧美成人一级| 18禁影院亚洲专区| 在线亚洲天堂| 色综合中文综合网| 丁香婷婷在线视频| 国产爽爽视频| 亚洲人成影院午夜网站| 亚洲人免费视频| 亚洲人精品亚洲人成在线| 一区二区三区国产| 香蕉视频在线精品| 老司机午夜精品视频你懂的| 亚洲中文字幕国产av| 久久久久久久久亚洲精品| 国产00高中生在线播放| 欧美成人午夜在线全部免费| a毛片在线免费观看| 国产午夜人做人免费视频中文| 国产在线小视频| 成人午夜视频免费看欧美| 2022国产无码在线| 亚洲专区一区二区在线观看| 精品国产成人av免费| 久久青青草原亚洲av无码| 亚洲香蕉在线| 国产女人在线观看| 精品少妇人妻一区二区| 视频在线观看一区二区| 国产一区二区三区视频| 精品国产电影久久九九| 欧美在线导航| 国内精品久久久久鸭| 亚洲妓女综合网995久久| 青青操视频免费观看|