999精品在线视频,手机成人午夜在线视频,久久不卡国产精品无码,中日无码在线观看,成人av手机在线观看,日韩精品亚洲一区中文字幕,亚洲av无码人妻,四虎国产在线观看 ?

類孿生網(wǎng)絡(luò)目標(biāo)跟蹤算法綜述

2022-05-30 11:49:32陳碩

關(guān)鍵詞:判別相關(guān)濾波;孿生網(wǎng)絡(luò);Transformer

中圖法分類號(hào):TP242 文獻(xiàn)標(biāo)識(shí)碼:A

作為計(jì)算機(jī)視覺(jué)領(lǐng)域的一項(xiàng)基礎(chǔ)任務(wù),視覺(jué)目標(biāo)跟蹤仍存在挑戰(zhàn)性,其致力于從一個(gè)視頻序列的第一幀中給出目標(biāo)信息,去定位視頻序列后續(xù)每幀中該目標(biāo)的目標(biāo)框。同其他計(jì)算機(jī)視覺(jué)任務(wù)一樣,目標(biāo)跟蹤也面臨光照、遮擋和形變因素的挑戰(zhàn)。目標(biāo)的尺度、外觀隨著時(shí)間變化增加了跟蹤的難度,導(dǎo)致目標(biāo)跟蹤的精度下降,甚至跟蹤失敗。這些挑戰(zhàn)使得設(shè)計(jì)一個(gè)實(shí)時(shí)高精度的跟蹤器仍然十分困難。

近幾年,隨著卷積神經(jīng)網(wǎng)絡(luò)的興起,使用卷積神經(jīng)網(wǎng)絡(luò)提取深度特征再進(jìn)行跟蹤相對(duì)于傳統(tǒng)使用手工提取特征的方法取得了巨大的進(jìn)展。其中,基于模版匹配的方法因其分類和邊界框回歸上具有很強(qiáng)的魯棒性而脫穎而出。這種方法主要是通過(guò)分別從模版和搜索區(qū)域中提取特征,再在模版特征和搜索區(qū)域特征之間做相關(guān)操作來(lái)預(yù)測(cè)后續(xù)每一幀搜索區(qū)域上的目標(biāo)在各個(gè)位置出現(xiàn)的概率,以此確定目標(biāo)的位置信息。其主要分為判別相關(guān)濾波跟蹤器和孿生網(wǎng)絡(luò)跟蹤器。這兩種方法可以簡(jiǎn)單描述為一個(gè)類孿生網(wǎng)絡(luò)的框架。

不過(guò),無(wú)論是判別相關(guān)濾波跟蹤器還是孿生網(wǎng)絡(luò)跟蹤器,在處理一個(gè)視頻序列中每一幀的圖像時(shí)都是一個(gè)獨(dú)立的過(guò)程。在完成最后的跟蹤任務(wù)之前,并沒(méi)有通過(guò)某種方法去建立前后幀之間的關(guān)聯(lián),忽略了幀與幀之間豐富的時(shí)間、空間信息,這個(gè)局限導(dǎo)致類孿生跟蹤器的性能無(wú)法進(jìn)一步提高。針對(duì)遠(yuǎn)距離(全局)交互信息的建模問(wèn)題,Transformer架構(gòu)具有天然的優(yōu)勢(shì)。Transformer在自然語(yǔ)言處理的任務(wù)以及語(yǔ)音處理中已經(jīng)取得了巨大的成功。研究者期望Transformer能在目標(biāo)跟蹤任務(wù)中發(fā)揮自身優(yōu)勢(shì),緩解上述幀與幀之間時(shí)間、空間信息被忽略的問(wèn)題,Transformer開(kāi)始被引入目標(biāo)跟蹤任務(wù)中,相比傳統(tǒng)方法取得了巨大的進(jìn)展。

本文從基于相關(guān)濾波的跟蹤器、基于孿生網(wǎng)絡(luò)的跟蹤器以及基于Transformer的跟蹤器等方面進(jìn)行闡述。

1類孿生網(wǎng)絡(luò)跟蹤器

首先,簡(jiǎn)單回顧主流的視覺(jué)跟蹤框架。一般大部分主流跟蹤器、相關(guān)濾波跟蹤器和孿生網(wǎng)絡(luò)跟蹤器可以簡(jiǎn)單描述為類孿生網(wǎng)絡(luò)架構(gòu)。上半分支使用模版學(xué)習(xí)一個(gè)跟蹤模型,下半分支通過(guò)跟蹤模型在搜索區(qū)域進(jìn)行模版匹配以確定目標(biāo)的位置。

孿生網(wǎng)絡(luò)跟蹤器把模版t和搜索區(qū)域x作為卷積神經(jīng)網(wǎng)絡(luò)Ψ的輸入,它們通過(guò)以下卷積相關(guān)操作生成響應(yīng)置信圖:

r(t,x=Ψ(z)?Ψ(x)+b1 (1)

其中,?表示卷積相關(guān)操作,b1表示偏置項(xiàng)。孿生網(wǎng)絡(luò)跟蹤器依賴于通過(guò)模版學(xué)習(xí)到的卷積核Ψ(z)實(shí)現(xiàn)模版匹配。

在深度學(xué)習(xí)的判別相關(guān)濾波跟蹤器中,通過(guò)以下最小化嶺回歸學(xué)習(xí)一個(gè)濾波器f:

min‖f?Ψ(t)-y‖2+λ‖f‖2 (2)

其中,y表示以模版t中目標(biāo)位置為中心的高斯分布,λ是正則項(xiàng)。當(dāng)學(xué)習(xí)到濾波器f后,判別相關(guān)濾波跟蹤器用來(lái)區(qū)分目標(biāo)和背景,通過(guò)r=f?Ψ(x)來(lái)生成響應(yīng),確定搜索區(qū)域中目標(biāo)的位置。

2相關(guān)濾波跟蹤器和孿生網(wǎng)絡(luò)跟蹤器

2.1相關(guān)濾波跟蹤器

基于相關(guān)濾波的跟蹤方法核心思想是:在給定的第一幀中,通過(guò)解決最小化嶺回歸問(wèn)題,根據(jù)MOSSE濾波器原理訓(xùn)練一個(gè)濾波器,利用該濾波器與搜索區(qū)域做相關(guān)運(yùn)算,最大輸出響應(yīng)的位置即為當(dāng)前幀的目標(biāo)位置。為了增強(qiáng)濾波器的魯棒性,通常使用目標(biāo)的多個(gè)樣本作為訓(xùn)練樣本。同時(shí),通過(guò)在線更新模版的方法更新濾波器。這些方法可以判斷目標(biāo)在當(dāng)前幀的位置,但在估計(jì)目標(biāo)的尺度問(wèn)題上存在很大的困難,通常采用多尺度的策略應(yīng)對(duì)目標(biāo)尺度變化的問(wèn)題,然而對(duì)于目標(biāo)的形變?nèi)匀粵](méi)有太好的方法。近幾年,隨著深度學(xué)習(xí)的興起,通過(guò)解決最小化嶺回歸問(wèn)題訓(xùn)練濾波器被證明可以通過(guò)深度學(xué)習(xí)網(wǎng)絡(luò)架構(gòu)解決,這些方法通過(guò)卷積神經(jīng)網(wǎng)絡(luò)學(xué)習(xí)一個(gè)判別卷積核作為目標(biāo)分類網(wǎng)絡(luò),使用這個(gè)判別卷積核去和搜索區(qū)域做卷積相關(guān)操作以生成置信圖,以此判斷目標(biāo)的位置,同時(shí)使用其他神經(jīng)網(wǎng)絡(luò)(例如IoUNet)去回歸目標(biāo)的邊界框。ATOM把目標(biāo)跟蹤分為:在線訓(xùn)練的目標(biāo)分類網(wǎng)絡(luò)和離線訓(xùn)練的目標(biāo)評(píng)價(jià)網(wǎng)絡(luò)。其中,目標(biāo)估計(jì)網(wǎng)絡(luò)使用IoUNet的網(wǎng)絡(luò)結(jié)構(gòu);目標(biāo)分類使用一個(gè)兩層的深度回歸網(wǎng)絡(luò)結(jié)構(gòu)。通過(guò)采用基于共軛梯度和牛頓高斯的方法加速分類網(wǎng)絡(luò)的訓(xùn)練。Prdimp方法從概率論的角度解決目標(biāo)邊界框的回歸問(wèn)題,主要是通過(guò)最小化網(wǎng)絡(luò)預(yù)測(cè)的目標(biāo)概率分布和標(biāo)簽分布之間的KL散度來(lái)訓(xùn)練網(wǎng)絡(luò)。

2.2孿生網(wǎng)絡(luò)跟蹤器

最近特別流行的追蹤方法是基于孿生網(wǎng)絡(luò)的方法,SiamFC是該方法的先驅(qū)者。通過(guò)使用同一個(gè)離線訓(xùn)練的卷積神經(jīng)網(wǎng)絡(luò)作為骨干網(wǎng)絡(luò),分別從模板和搜索區(qū)域提取深度特征,在模版特征和搜索區(qū)域特征之間做相關(guān)操作,以計(jì)算兩者的相似度來(lái)判斷目標(biāo)在當(dāng)前幀中的位置。同時(shí),基于孿生網(wǎng)絡(luò)的跟蹤方法很受關(guān)注。SiamRPN把目標(biāo)檢測(cè)器中RPN的方法遷移到目標(biāo)跟蹤中,以此來(lái)實(shí)現(xiàn)邊界框的回歸。SiamRPN以端到端的方法來(lái)訓(xùn)練目標(biāo)分類和邊界框的回歸,通過(guò)分類來(lái)判斷目標(biāo)在當(dāng)前幀中的位置,并通過(guò)回歸來(lái)確定邊界框的大小。SiamRPN++使用修改過(guò)的ResNet做為骨干網(wǎng)絡(luò)提取模版和搜索區(qū)域的特征,提取多個(gè)特征層的特征分別做分類和回歸,把最后的結(jié)果級(jí)聯(lián)獲得魯棒性更強(qiáng)的特征表示,再進(jìn)行最終的目標(biāo)分類和邊界框回歸。

3基于Transformer的跟蹤器

Transformer由谷歌大腦提出,應(yīng)用于機(jī)器翻譯任務(wù)。簡(jiǎn)單來(lái)說(shuō),Transformer架構(gòu)分別由以注意力模塊為基本組件的Encoder和Decoder組成,通過(guò)Encoder和Decoder把一個(gè)輸入序列(sequence)轉(zhuǎn)換成另一個(gè)輸出序列(Sequence)。注意力模塊通過(guò)計(jì)算一個(gè)序列中元素之間的相似性作為權(quán)重,以加權(quán)求和的方式抽取信息,從而在一整個(gè)輸入序列中整合全局關(guān)系信息。交叉注意力模塊用來(lái)整合兩個(gè)不同序列之間的全局關(guān)系信息。得益于Transformer可以并行計(jì)算的特性,以及特別的記憶機(jī)制,其在自然語(yǔ)言處理和語(yǔ)音處理領(lǐng)域正在逐步取代循環(huán)卷積神經(jīng)網(wǎng)絡(luò)的地位。在目標(biāo)跟蹤任務(wù)中,基于孿生網(wǎng)絡(luò)的跟蹤器和基于相關(guān)濾波的跟蹤器都在一定程度上忽略了幀與幀之間豐富的時(shí)間和空間信息,為了緩解該問(wèn)題,Transformer開(kāi)始被應(yīng)用到目標(biāo)跟蹤任務(wù)中。

TrTr使用了經(jīng)典的Transformer中的Encoder?Decoder模塊取代了孿生網(wǎng)絡(luò)跟蹤器中的相關(guān)操作卷積層,使用該模塊融合模版特征和搜索區(qū)域特征,之后使用三個(gè)獨(dú)立的頭來(lái)處理Transformer模塊輸出的融合特征,其中一個(gè)用于分類,另外兩個(gè)用于邊界框的回歸。TrTr使用的Transformer模塊僅僅融合了第一幀模版特征和搜索區(qū)域特征,損失了歷史幀信息。STARK提出了一個(gè)基于Transformer的跟蹤框架,在骨干網(wǎng)絡(luò)提取搜索區(qū)域特征和模版特征之后,分別轉(zhuǎn)換成向量,然后拼接在一起輸入到一個(gè)類似DETR中的Encoder?Decoder模塊中,通過(guò)該模塊整合搜索區(qū)域和模版之間的全局信息,輸入到全卷積網(wǎng)絡(luò)來(lái)預(yù)測(cè)目標(biāo)的邊界框。同時(shí)加入更新機(jī)制以及動(dòng)態(tài)的更新模板,從而使Encoder?Decoder模塊在最大程度上利用幀與幀之間豐富的時(shí)間、空間信息。

除此之外,Trdimp使用類孿生網(wǎng)絡(luò)的架構(gòu),分為兩個(gè)分支,在DiMP的基礎(chǔ)上增加了一個(gè)TransformerEncoder?Decoder模塊去處理骨干網(wǎng)絡(luò)提取的特征。在上面的分支中,Encoder接受一組骨干網(wǎng)絡(luò)提取的模版特征作為輸入,產(chǎn)生編碼特征,用于學(xué)習(xí)判別卷積核的同時(shí)也作為Decoder的輸入;在下面的分支中,Decoder把編碼特征和當(dāng)前搜索區(qū)域特征作為輸入,通過(guò)注意力機(jī)制融合模版特征和搜索區(qū)域特征輸出融合特征,最后使用判別卷積核對(duì)融合特征進(jìn)行卷積生成響應(yīng)圖,以確定目標(biāo)的位置。

Transformer在目標(biāo)跟蹤中的應(yīng)用主要是作為特征增強(qiáng)模塊來(lái)整合視頻序列中幀與幀之間的時(shí)間、空間信息,緩解了傳統(tǒng)類孿生網(wǎng)絡(luò)跟蹤器忽略幀與幀之間時(shí)間、空間信息的問(wèn)題。使得目標(biāo)跟蹤的研究取得了長(zhǎng)足的進(jìn)步。

4結(jié)束語(yǔ)

本文總結(jié)了目標(biāo)跟蹤領(lǐng)域的經(jīng)典方法,主要為基于相關(guān)濾波跟蹤器以及基于孿生網(wǎng)絡(luò)的跟蹤器。這兩種方法具有局限性——忽略了視頻序列中幀與幀之間的信息。Transformer在整合全局信息方面有著天然的優(yōu)勢(shì),因此被引入目標(biāo)跟蹤領(lǐng)域。Transofmer和傳統(tǒng)類孿生網(wǎng)絡(luò)跟蹤器進(jìn)行整合,使得跟蹤器的性能取得了巨大的提高。目前,在目標(biāo)跟蹤領(lǐng)域,Transformer還只是作為特征增強(qiáng)模塊來(lái)應(yīng)用,基于Transformer的類跟蹤器還依賴CNN作為骨干網(wǎng)絡(luò)進(jìn)行特征提取。在未來(lái),完全使用Transformer搭建一個(gè)目標(biāo)跟蹤框架是一個(gè)十分有研究?jī)r(jià)值的問(wèn)題。

作者簡(jiǎn)介:

陳碩(1994—),碩士,研究生,研究方向:計(jì)算機(jī)視覺(jué)。

主站蜘蛛池模板: 亚洲成人高清在线观看| 欧美无遮挡国产欧美另类| 国产又粗又爽视频| 天堂成人av| 人妻免费无码不卡视频| 国产欧美又粗又猛又爽老| 午夜啪啪福利| 日本成人在线不卡视频| 国产日韩精品一区在线不卡 | 日本欧美一二三区色视频| 精品国产成人a在线观看| 欧美日韩一区二区在线播放| 中文成人无码国产亚洲| 一级毛片在线免费视频| 久久久精品无码一区二区三区| 国产美女免费| 狠狠做深爱婷婷综合一区| 伊人久久精品亚洲午夜| 国产乱子伦视频三区| 99在线国产| 亚洲第一视频区| 国产精品美乳| 8090成人午夜精品| 男女男精品视频| 69av在线| 97超碰精品成人国产| 成人在线不卡| 国产香蕉97碰碰视频VA碰碰看| 日韩一区精品视频一区二区| 国产又爽又黄无遮挡免费观看| 亚洲va精品中文字幕| 欧美爱爱网| 亚洲精品成人片在线观看| 中文字幕在线日本| 欧美国产在线精品17p| 91九色视频网| 69av免费视频| 亚洲国产精品一区二区第一页免| 国产女人爽到高潮的免费视频| 日韩在线播放欧美字幕| 精品视频福利| 欧美国产精品拍自| 亚洲国产天堂在线观看| 永久免费无码成人网站| 日韩激情成人| 香蕉久久国产超碰青草| 香蕉久久永久视频| 欧美性精品| 国产sm重味一区二区三区| 日韩美一区二区| 国产三级毛片| 亚洲男人天堂2020| 国产一区二区在线视频观看| 毛片在线看网站| 日本尹人综合香蕉在线观看 | 久久久久亚洲精品成人网| 免费看一级毛片波多结衣| 2021亚洲精品不卡a| 免费啪啪网址| 福利视频久久| 无码粉嫩虎白一线天在线观看| 久久99精品久久久久纯品| 亚洲香蕉在线| 91免费国产在线观看尤物| 亚洲精品无码av中文字幕| 99视频在线免费| 免费不卡视频| 国产特级毛片| 欧美劲爆第一页| 国产香蕉在线| 亚洲第一色网站| 国产在线观看人成激情视频| 亚洲国产天堂久久综合226114| 2020国产精品视频| 日韩人妻精品一区| 国产内射在线观看| 国产在线精彩视频二区| 天天干伊人| 亚洲人成网站在线观看播放不卡| 欧洲熟妇精品视频| 婷婷丁香在线观看| 中文字幕乱码中文乱码51精品|