999精品在线视频,手机成人午夜在线视频,久久不卡国产精品无码,中日无码在线观看,成人av手机在线观看,日韩精品亚洲一区中文字幕,亚洲av无码人妻,四虎国产在线观看 ?

類孿生網(wǎng)絡(luò)目標(biāo)跟蹤算法綜述

2022-05-30 11:49:32陳碩

關(guān)鍵詞:判別相關(guān)濾波;孿生網(wǎng)絡(luò);Transformer

中圖法分類號(hào):TP242 文獻(xiàn)標(biāo)識(shí)碼:A

作為計(jì)算機(jī)視覺(jué)領(lǐng)域的一項(xiàng)基礎(chǔ)任務(wù),視覺(jué)目標(biāo)跟蹤仍存在挑戰(zhàn)性,其致力于從一個(gè)視頻序列的第一幀中給出目標(biāo)信息,去定位視頻序列后續(xù)每幀中該目標(biāo)的目標(biāo)框。同其他計(jì)算機(jī)視覺(jué)任務(wù)一樣,目標(biāo)跟蹤也面臨光照、遮擋和形變因素的挑戰(zhàn)。目標(biāo)的尺度、外觀隨著時(shí)間變化增加了跟蹤的難度,導(dǎo)致目標(biāo)跟蹤的精度下降,甚至跟蹤失敗。這些挑戰(zhàn)使得設(shè)計(jì)一個(gè)實(shí)時(shí)高精度的跟蹤器仍然十分困難。

近幾年,隨著卷積神經(jīng)網(wǎng)絡(luò)的興起,使用卷積神經(jīng)網(wǎng)絡(luò)提取深度特征再進(jìn)行跟蹤相對(duì)于傳統(tǒng)使用手工提取特征的方法取得了巨大的進(jìn)展。其中,基于模版匹配的方法因其分類和邊界框回歸上具有很強(qiáng)的魯棒性而脫穎而出。這種方法主要是通過(guò)分別從模版和搜索區(qū)域中提取特征,再在模版特征和搜索區(qū)域特征之間做相關(guān)操作來(lái)預(yù)測(cè)后續(xù)每一幀搜索區(qū)域上的目標(biāo)在各個(gè)位置出現(xiàn)的概率,以此確定目標(biāo)的位置信息。其主要分為判別相關(guān)濾波跟蹤器和孿生網(wǎng)絡(luò)跟蹤器。這兩種方法可以簡(jiǎn)單描述為一個(gè)類孿生網(wǎng)絡(luò)的框架。

不過(guò),無(wú)論是判別相關(guān)濾波跟蹤器還是孿生網(wǎng)絡(luò)跟蹤器,在處理一個(gè)視頻序列中每一幀的圖像時(shí)都是一個(gè)獨(dú)立的過(guò)程。在完成最后的跟蹤任務(wù)之前,并沒(méi)有通過(guò)某種方法去建立前后幀之間的關(guān)聯(lián),忽略了幀與幀之間豐富的時(shí)間、空間信息,這個(gè)局限導(dǎo)致類孿生跟蹤器的性能無(wú)法進(jìn)一步提高。針對(duì)遠(yuǎn)距離(全局)交互信息的建模問(wèn)題,Transformer架構(gòu)具有天然的優(yōu)勢(shì)。Transformer在自然語(yǔ)言處理的任務(wù)以及語(yǔ)音處理中已經(jīng)取得了巨大的成功。研究者期望Transformer能在目標(biāo)跟蹤任務(wù)中發(fā)揮自身優(yōu)勢(shì),緩解上述幀與幀之間時(shí)間、空間信息被忽略的問(wèn)題,Transformer開(kāi)始被引入目標(biāo)跟蹤任務(wù)中,相比傳統(tǒng)方法取得了巨大的進(jìn)展。

本文從基于相關(guān)濾波的跟蹤器、基于孿生網(wǎng)絡(luò)的跟蹤器以及基于Transformer的跟蹤器等方面進(jìn)行闡述。

1類孿生網(wǎng)絡(luò)跟蹤器

首先,簡(jiǎn)單回顧主流的視覺(jué)跟蹤框架。一般大部分主流跟蹤器、相關(guān)濾波跟蹤器和孿生網(wǎng)絡(luò)跟蹤器可以簡(jiǎn)單描述為類孿生網(wǎng)絡(luò)架構(gòu)。上半分支使用模版學(xué)習(xí)一個(gè)跟蹤模型,下半分支通過(guò)跟蹤模型在搜索區(qū)域進(jìn)行模版匹配以確定目標(biāo)的位置。

孿生網(wǎng)絡(luò)跟蹤器把模版t和搜索區(qū)域x作為卷積神經(jīng)網(wǎng)絡(luò)Ψ的輸入,它們通過(guò)以下卷積相關(guān)操作生成響應(yīng)置信圖:

r(t,x=Ψ(z)?Ψ(x)+b1 (1)

其中,?表示卷積相關(guān)操作,b1表示偏置項(xiàng)。孿生網(wǎng)絡(luò)跟蹤器依賴于通過(guò)模版學(xué)習(xí)到的卷積核Ψ(z)實(shí)現(xiàn)模版匹配。

在深度學(xué)習(xí)的判別相關(guān)濾波跟蹤器中,通過(guò)以下最小化嶺回歸學(xué)習(xí)一個(gè)濾波器f:

min‖f?Ψ(t)-y‖2+λ‖f‖2 (2)

其中,y表示以模版t中目標(biāo)位置為中心的高斯分布,λ是正則項(xiàng)。當(dāng)學(xué)習(xí)到濾波器f后,判別相關(guān)濾波跟蹤器用來(lái)區(qū)分目標(biāo)和背景,通過(guò)r=f?Ψ(x)來(lái)生成響應(yīng),確定搜索區(qū)域中目標(biāo)的位置。

2相關(guān)濾波跟蹤器和孿生網(wǎng)絡(luò)跟蹤器

2.1相關(guān)濾波跟蹤器

基于相關(guān)濾波的跟蹤方法核心思想是:在給定的第一幀中,通過(guò)解決最小化嶺回歸問(wèn)題,根據(jù)MOSSE濾波器原理訓(xùn)練一個(gè)濾波器,利用該濾波器與搜索區(qū)域做相關(guān)運(yùn)算,最大輸出響應(yīng)的位置即為當(dāng)前幀的目標(biāo)位置。為了增強(qiáng)濾波器的魯棒性,通常使用目標(biāo)的多個(gè)樣本作為訓(xùn)練樣本。同時(shí),通過(guò)在線更新模版的方法更新濾波器。這些方法可以判斷目標(biāo)在當(dāng)前幀的位置,但在估計(jì)目標(biāo)的尺度問(wèn)題上存在很大的困難,通常采用多尺度的策略應(yīng)對(duì)目標(biāo)尺度變化的問(wèn)題,然而對(duì)于目標(biāo)的形變?nèi)匀粵](méi)有太好的方法。近幾年,隨著深度學(xué)習(xí)的興起,通過(guò)解決最小化嶺回歸問(wèn)題訓(xùn)練濾波器被證明可以通過(guò)深度學(xué)習(xí)網(wǎng)絡(luò)架構(gòu)解決,這些方法通過(guò)卷積神經(jīng)網(wǎng)絡(luò)學(xué)習(xí)一個(gè)判別卷積核作為目標(biāo)分類網(wǎng)絡(luò),使用這個(gè)判別卷積核去和搜索區(qū)域做卷積相關(guān)操作以生成置信圖,以此判斷目標(biāo)的位置,同時(shí)使用其他神經(jīng)網(wǎng)絡(luò)(例如IoUNet)去回歸目標(biāo)的邊界框。ATOM把目標(biāo)跟蹤分為:在線訓(xùn)練的目標(biāo)分類網(wǎng)絡(luò)和離線訓(xùn)練的目標(biāo)評(píng)價(jià)網(wǎng)絡(luò)。其中,目標(biāo)估計(jì)網(wǎng)絡(luò)使用IoUNet的網(wǎng)絡(luò)結(jié)構(gòu);目標(biāo)分類使用一個(gè)兩層的深度回歸網(wǎng)絡(luò)結(jié)構(gòu)。通過(guò)采用基于共軛梯度和牛頓高斯的方法加速分類網(wǎng)絡(luò)的訓(xùn)練。Prdimp方法從概率論的角度解決目標(biāo)邊界框的回歸問(wèn)題,主要是通過(guò)最小化網(wǎng)絡(luò)預(yù)測(cè)的目標(biāo)概率分布和標(biāo)簽分布之間的KL散度來(lái)訓(xùn)練網(wǎng)絡(luò)。

2.2孿生網(wǎng)絡(luò)跟蹤器

最近特別流行的追蹤方法是基于孿生網(wǎng)絡(luò)的方法,SiamFC是該方法的先驅(qū)者。通過(guò)使用同一個(gè)離線訓(xùn)練的卷積神經(jīng)網(wǎng)絡(luò)作為骨干網(wǎng)絡(luò),分別從模板和搜索區(qū)域提取深度特征,在模版特征和搜索區(qū)域特征之間做相關(guān)操作,以計(jì)算兩者的相似度來(lái)判斷目標(biāo)在當(dāng)前幀中的位置。同時(shí),基于孿生網(wǎng)絡(luò)的跟蹤方法很受關(guān)注。SiamRPN把目標(biāo)檢測(cè)器中RPN的方法遷移到目標(biāo)跟蹤中,以此來(lái)實(shí)現(xiàn)邊界框的回歸。SiamRPN以端到端的方法來(lái)訓(xùn)練目標(biāo)分類和邊界框的回歸,通過(guò)分類來(lái)判斷目標(biāo)在當(dāng)前幀中的位置,并通過(guò)回歸來(lái)確定邊界框的大小。SiamRPN++使用修改過(guò)的ResNet做為骨干網(wǎng)絡(luò)提取模版和搜索區(qū)域的特征,提取多個(gè)特征層的特征分別做分類和回歸,把最后的結(jié)果級(jí)聯(lián)獲得魯棒性更強(qiáng)的特征表示,再進(jìn)行最終的目標(biāo)分類和邊界框回歸。

3基于Transformer的跟蹤器

Transformer由谷歌大腦提出,應(yīng)用于機(jī)器翻譯任務(wù)。簡(jiǎn)單來(lái)說(shuō),Transformer架構(gòu)分別由以注意力模塊為基本組件的Encoder和Decoder組成,通過(guò)Encoder和Decoder把一個(gè)輸入序列(sequence)轉(zhuǎn)換成另一個(gè)輸出序列(Sequence)。注意力模塊通過(guò)計(jì)算一個(gè)序列中元素之間的相似性作為權(quán)重,以加權(quán)求和的方式抽取信息,從而在一整個(gè)輸入序列中整合全局關(guān)系信息。交叉注意力模塊用來(lái)整合兩個(gè)不同序列之間的全局關(guān)系信息。得益于Transformer可以并行計(jì)算的特性,以及特別的記憶機(jī)制,其在自然語(yǔ)言處理和語(yǔ)音處理領(lǐng)域正在逐步取代循環(huán)卷積神經(jīng)網(wǎng)絡(luò)的地位。在目標(biāo)跟蹤任務(wù)中,基于孿生網(wǎng)絡(luò)的跟蹤器和基于相關(guān)濾波的跟蹤器都在一定程度上忽略了幀與幀之間豐富的時(shí)間和空間信息,為了緩解該問(wèn)題,Transformer開(kāi)始被應(yīng)用到目標(biāo)跟蹤任務(wù)中。

TrTr使用了經(jīng)典的Transformer中的Encoder?Decoder模塊取代了孿生網(wǎng)絡(luò)跟蹤器中的相關(guān)操作卷積層,使用該模塊融合模版特征和搜索區(qū)域特征,之后使用三個(gè)獨(dú)立的頭來(lái)處理Transformer模塊輸出的融合特征,其中一個(gè)用于分類,另外兩個(gè)用于邊界框的回歸。TrTr使用的Transformer模塊僅僅融合了第一幀模版特征和搜索區(qū)域特征,損失了歷史幀信息。STARK提出了一個(gè)基于Transformer的跟蹤框架,在骨干網(wǎng)絡(luò)提取搜索區(qū)域特征和模版特征之后,分別轉(zhuǎn)換成向量,然后拼接在一起輸入到一個(gè)類似DETR中的Encoder?Decoder模塊中,通過(guò)該模塊整合搜索區(qū)域和模版之間的全局信息,輸入到全卷積網(wǎng)絡(luò)來(lái)預(yù)測(cè)目標(biāo)的邊界框。同時(shí)加入更新機(jī)制以及動(dòng)態(tài)的更新模板,從而使Encoder?Decoder模塊在最大程度上利用幀與幀之間豐富的時(shí)間、空間信息。

除此之外,Trdimp使用類孿生網(wǎng)絡(luò)的架構(gòu),分為兩個(gè)分支,在DiMP的基礎(chǔ)上增加了一個(gè)TransformerEncoder?Decoder模塊去處理骨干網(wǎng)絡(luò)提取的特征。在上面的分支中,Encoder接受一組骨干網(wǎng)絡(luò)提取的模版特征作為輸入,產(chǎn)生編碼特征,用于學(xué)習(xí)判別卷積核的同時(shí)也作為Decoder的輸入;在下面的分支中,Decoder把編碼特征和當(dāng)前搜索區(qū)域特征作為輸入,通過(guò)注意力機(jī)制融合模版特征和搜索區(qū)域特征輸出融合特征,最后使用判別卷積核對(duì)融合特征進(jìn)行卷積生成響應(yīng)圖,以確定目標(biāo)的位置。

Transformer在目標(biāo)跟蹤中的應(yīng)用主要是作為特征增強(qiáng)模塊來(lái)整合視頻序列中幀與幀之間的時(shí)間、空間信息,緩解了傳統(tǒng)類孿生網(wǎng)絡(luò)跟蹤器忽略幀與幀之間時(shí)間、空間信息的問(wèn)題。使得目標(biāo)跟蹤的研究取得了長(zhǎng)足的進(jìn)步。

4結(jié)束語(yǔ)

本文總結(jié)了目標(biāo)跟蹤領(lǐng)域的經(jīng)典方法,主要為基于相關(guān)濾波跟蹤器以及基于孿生網(wǎng)絡(luò)的跟蹤器。這兩種方法具有局限性——忽略了視頻序列中幀與幀之間的信息。Transformer在整合全局信息方面有著天然的優(yōu)勢(shì),因此被引入目標(biāo)跟蹤領(lǐng)域。Transofmer和傳統(tǒng)類孿生網(wǎng)絡(luò)跟蹤器進(jìn)行整合,使得跟蹤器的性能取得了巨大的提高。目前,在目標(biāo)跟蹤領(lǐng)域,Transformer還只是作為特征增強(qiáng)模塊來(lái)應(yīng)用,基于Transformer的類跟蹤器還依賴CNN作為骨干網(wǎng)絡(luò)進(jìn)行特征提取。在未來(lái),完全使用Transformer搭建一個(gè)目標(biāo)跟蹤框架是一個(gè)十分有研究?jī)r(jià)值的問(wèn)題。

作者簡(jiǎn)介:

陳碩(1994—),碩士,研究生,研究方向:計(jì)算機(jī)視覺(jué)。

主站蜘蛛池模板: 亚洲高清免费在线观看| 青青青国产视频手机| 亚洲色图另类| 伊人网址在线| 91亚洲影院| 亚洲va欧美va国产综合下载| 国产av无码日韩av无码网站| 91热爆在线| 国内精品久久九九国产精品| 国产精品久久自在自线观看| 久久99国产精品成人欧美| 久久久久亚洲av成人网人人软件| 久久精品波多野结衣| 99在线视频网站| 热久久这里是精品6免费观看| 欧美成人第一页| 亚洲国语自产一区第二页| 国产主播福利在线观看| 日韩区欧美区| 亚洲av综合网| 丰满少妇αⅴ无码区| 老司国产精品视频91| 亚洲精品无码日韩国产不卡| 综合色区亚洲熟妇在线| 亚洲狼网站狼狼鲁亚洲下载| 亚洲av无码人妻| 国产熟女一级毛片| 欧美福利在线| 亚欧美国产综合| 欧美国产视频| 成人精品在线观看| 欧美笫一页| 国产91小视频在线观看| 在线精品亚洲国产| a网站在线观看| 欧美激情福利| 无码AV日韩一二三区| 青青操国产| 国产主播喷水| 国产精品欧美在线观看| 国产丝袜无码一区二区视频| 色爽网免费视频| 日韩精品成人网页视频在线| 亚洲区第一页| 国产a网站| 丰满的熟女一区二区三区l| 亚洲无线国产观看| 国产福利一区在线| 日韩天堂视频| 亚洲精品国产日韩无码AV永久免费网 | 欧美黑人欧美精品刺激| 国产a v无码专区亚洲av| lhav亚洲精品| 成人午夜在线播放| 视频一本大道香蕉久在线播放| 亚洲免费福利视频| 国产精品丝袜视频| 成人午夜久久| 日韩国产黄色网站| 乱系列中文字幕在线视频| www亚洲天堂| 超清无码一区二区三区| 久久国产乱子| 欧美.成人.综合在线 | 久久99热这里只有精品免费看| 久久精品欧美一区二区| 国产亚洲高清在线精品99| 午夜视频在线观看区二区| 欧美日韩亚洲国产主播第一区| V一区无码内射国产| 日韩欧美中文在线| 素人激情视频福利| 99热亚洲精品6码| a级毛片一区二区免费视频| 色综合天天综合中文网| 东京热高清无码精品| 国产成人做受免费视频| 日韩av手机在线| 国产SUV精品一区二区| 欧美日韩精品一区二区视频| 欧美区国产区| 亚洲中文制服丝袜欧美精品|