基于高效卷積算子的異常抑制目標跟蹤算法

2021-07-26 11:56:26蘇超群朱正為郭玉英

計算機工程 2021年7期

關(guān)鍵詞：模型

蘇超群，朱正為，郭玉英

（西南科技大學(xué)信息工程學(xué)院，四川綿陽621010）

0 概述

目標跟蹤是機器視覺領(lǐng)域的重點研究內(nèi)容之一，其廣泛應(yīng)用于智能監(jiān)控、智能交通控制、飛行器跟蹤等眾多領(lǐng)域［1-3］。在目標跟蹤過程中，目標通常會受到光照變化、尺度變化、背景干擾、目標形狀旋轉(zhuǎn)、遮擋等干擾的影響，因此，如何快速精準地進行目標跟蹤成為國內(nèi)外研究者們關(guān)注的熱點問題。

近年來，相關(guān)濾波算法越來越多地被應(yīng)用于目標跟蹤，這不僅催生出許多改進的相關(guān)濾波算法，也促使目標跟蹤技術(shù)取得突破性進展。文獻［4］設(shè)計出MOOSE 相關(guān)濾波器，利用輸出誤差平方和損失函數(shù)訓(xùn)練濾波器來實現(xiàn)目標跟蹤。文獻［5-6］在MOSSE 相關(guān)濾波器的基礎(chǔ)上引入循環(huán)矩陣和核函數(shù)，解決了稀疏采樣造成的樣本冗余問題。文獻［7］將多通道的顏色屬性引入CSK 算法中，使其具有對彩色視頻的跟蹤能力。文獻［8］提出一種DSST 算法，分別利用位移相關(guān)濾波器和尺度相關(guān)濾波器實現(xiàn)目標的尺度自適應(yīng)跟蹤。文獻［9-10］將單一特征擴展為多種特征，針對多特征尺度自適應(yīng)濾波器，利用尺度池的方法實現(xiàn)目標自適應(yīng)跟蹤。文獻［11］采用連續(xù)卷積方法將不同空間分辨率的特征圖進行整合，可更準確地實現(xiàn)目標跟蹤。文獻［12］利用分解卷積算子和樣本的緊湊生成模型解決計算復(fù)雜及過度擬合問題，提高了計算速度和算法魯棒性。文獻［13］采用多通道圖像表示特征組合的選擇方法提高DCF跟蹤器性能。

由于相關(guān)濾波算法利用循環(huán)矩陣在頻域中進行計算會產(chǎn)生邊界效應(yīng)，從而影響到目標跟蹤性能，因此研究人員采用多種方法來克服邊界效應(yīng)。文獻［14］引入空間權(quán)重函數(shù)增強目標樣本對濾波器的影響，進而弱化邊界效應(yīng)的作用。文獻［15-16］將目標背景信息作為負樣本擴大搜索區(qū)域，從而降低邊界效應(yīng)的影響。文獻［17］將空間正則化和時間正則化引入DCF 框架中，不僅減少了邊界效應(yīng)影響，還提升了算法的成功率。文獻［18］通過為正樣本采樣訓(xùn)練相關(guān)濾波器和引入空間懲罰來抵消由過多背景信息引入的噪聲，從而消除邊界效應(yīng)對目標跟蹤結(jié)果的影響。此外，針對跟蹤過程中因目標旋轉(zhuǎn)、遮擋、光照變化等導(dǎo)致的響應(yīng)圖突變問題，文獻［19］提出一種基于循環(huán)特征圖的跟蹤方法，通過在訓(xùn)練階段驗證響應(yīng)圖質(zhì)量來判斷是否更新濾波器，在一定程度上消除了響應(yīng)圖突變的影響。文獻［20］將多個相關(guān)濾波器集成為一個網(wǎng)絡(luò)，為每一幀響應(yīng)圖訓(xùn)練神經(jīng)網(wǎng)絡(luò)，并在下一幀響應(yīng)圖中選擇合適的相關(guān)濾波器，以避免響應(yīng)圖突變的問題。文獻［21］在背景感知濾波器的基礎(chǔ)上加入響應(yīng)圖變化率，有效減少了響應(yīng)圖異常問題。文獻［22］引入局部響應(yīng)圖變化情況使更多正樣本用于訓(xùn)練濾波器，并基于整體響應(yīng)圖變化情況來判斷是否更新濾波器。上述方法雖然針對響應(yīng)圖突變進行了改進，但其在抑制響應(yīng)圖的異常上作用有限。

為解決邊界效應(yīng)和響應(yīng)圖突變問題，本文提出一種基于高效卷積算子（Efficient Convolution Operator，ECO）的目標跟蹤算法。在訓(xùn)練相關(guān)濾波器時引入空間懲罰和響應(yīng)圖變化率，使其在更大的搜索區(qū)域消除邊界效應(yīng)的影響，同時抑制響應(yīng)圖突變，并將本文算法與多種算法在OTB100 數(shù)據(jù)集上的目標跟蹤性能進行對比和分析。

1 ECO 目標跟蹤算法

ECO 目標跟蹤算法（以下稱為ECO 算法）是在C-COT 跟蹤算法的基礎(chǔ)上，利用因式分解卷積方法減少訓(xùn)練模型的參數(shù)量，以提高濾波器訓(xùn)練速度，并采用高斯混合模型生成緊湊且多樣化的樣本，改變了模型更新策略，從而降低過度擬合的風險和計算復(fù)雜度，提高了算法的魯棒性。

1.1 多分辨率插值處理

ECO 算法基于M個訓(xùn)練樣本來訓(xùn)練卷積濾波器。每個特征層有獨立的分辨率Nd。通過引入運算符Jd得到的插值模型，將特征圖轉(zhuǎn)移到連續(xù)空間域t∈[0,T)，相關(guān)表達式如下：

其中：bd是周期T＞0 的插值內(nèi)核，Jd{xd}是周期為T的周期函數(shù)，也是一個插值特征層。

通過訓(xùn)練一個連續(xù)的T周期多通道卷積濾波器f=(f1,f2，…,fD)來計算目標的響應(yīng)值Sf{x}(t)，其表達式為：

其中：J{x}表示整個插值特征圖。

1.2 樣本空間模型生成

ECO 算法使用高斯混合模型（Gaussian Mixed Model，GMM）的不同分量來代替樣本，每個分量對應(yīng)一組相似樣本，不同分量之間差異性較大。

通過樣本特征圖x及其相應(yīng)響應(yīng)輸出值y的聯(lián)合概率分布p(x,y)，確定使期望相關(guān)誤差最小的濾波器，表達式如下：

其中：期望E在聯(lián)合樣本概率分布p(x,y)上取值，ω為解決邊界效應(yīng)的懲罰因子（定義在連續(xù)空間上）。樣本分布為訓(xùn)練樣本(xj,yj)的狄拉克脈沖函數(shù)。

假設(shè)目標在圖像區(qū)域的中心位置且所有y=y0均相同，則樣本分布可分解如下：p(x,y)=p(x)δy0(y)。采用高斯混合模型使，I為單位矩陣，L為高斯分量的數(shù)量，πl(wèi)為高斯分量的權(quán)重，μl為高斯分量的平均值。

當更新模型時，針對每個新樣本xj，初始化一個新分量m，其中，πm=υ，μm=xj，υ為學(xué)習(xí)速率。如果模型數(shù)量超過限制L，則丟棄權(quán)重πl(wèi)小于閾值的模型；否則將兩個最近的分量k和l合并為一個公共分量n，表達式如下：

因此，最小化目標函數(shù)表達式可轉(zhuǎn)化為：

其中：樣本數(shù)量從M減少到。

1.3 因式分解卷積算子

ECO 算法采用分解卷積的方法減少模型參數(shù)量，通過因式卷積操作后，得到目標響應(yīng)值如下：

其中：P為D×C的矩陣，PT為線性降維算子，pd,c為濾波器的學(xué)習(xí)系數(shù)，是由特征層d的濾波器和pd,c構(gòu)成的線性組合。

2 本文算法

本文算法是將抑制異常與相關(guān)濾波器的訓(xùn)練相結(jié)合，為了抑制異常，首先對異常進行識別。引入歐幾里得范數(shù)定義兩個響應(yīng)圖M1和M2的差分水平如下：

其中，p和q分別為二維空間兩個響應(yīng)圖中峰值的位置差，[φp,q]表示使兩個峰值彼此重合進行的移位操作。當發(fā)生異常時，兩個響應(yīng)圖相似度會突然下降，式（7）的值會變大，因此可通過判斷式（7）的值來判斷是否發(fā)生異常。

為抑制訓(xùn)練過程中的偏差，對訓(xùn)練目標進行優(yōu)化使目標函數(shù)最小化，表達式如下：

其中：k和k-1分別表示視頻序列的第k幀和第k-1幀；式（8）等號右側(cè)第3 項是限制響應(yīng)圖異常的正則化項；引入?yún)?shù)γ作為異常懲罰，將γ設(shè)置為0.7。變換和優(yōu)化部分通過式（8）轉(zhuǎn)換到頻域內(nèi)進行，以便在訓(xùn)練相關(guān)濾波器時進行異常抑制。

式（8）通過ECO 算法保留矩陣P并降低模型數(shù)量，使模型從D維降低到C維，同時保留懲罰因子ω以減少邊界效應(yīng)的影響。

2.1 優(yōu)化算法

為訓(xùn)練濾波器f，需最小化傅里葉域中函數(shù)（見式（8））。由傅里葉分析結(jié)果可以看出，由和z=J{x}可得到插值后特征圖的傅里葉系數(shù)，通過xd利用離散傅里葉變換的線性和卷積性質(zhì)獲得Xd[k]，進而得到輸出響應(yīng)函數(shù)（見式（2））的傅里葉系數(shù)，將其代入式（8）得到：

本文采用高斯-牛頓法進行迭代，并使用共軛梯度法優(yōu)化二次子問題。高斯-牛頓法是通過展開一階泰勒級數(shù)來實現(xiàn)式（9）中殘差線性化。當前估計值周圍的雙線性項?可近似表示為：

迭代i的高斯-牛頓子問題是通過將式（10）的一階近似值代入式（9）而得到，表達式如下：

式（11）是線性最小二乘問題，采用共軛梯度法對每個高斯-牛頓子問題進行優(yōu)化以獲得新濾波器和矩陣增量ΔP*，將濾波器和矩陣估計值分別更新為和Pi+1=Pi+ΔP*。由于濾波器的適應(yīng)性，僅從第一幀就可得到矩陣P，且矩陣P在第一幀之后是恒定的。

2.2 模型和尺度的更新

為避免連續(xù)更新模型導(dǎo)致計算量增大，本文算法采用和ECO 算法類似的稀疏更新方案，僅當目標發(fā)生一定程度的變化時才更新模型，而并非在每一幀圖像都以連續(xù)方式更新模型。通過每個第N幀圖像來更新濾波器，參數(shù)NS為濾波器的更新頻率，在每個第NS幀圖像中，執(zhí)行固定數(shù)量的NCG共軛梯度迭代次數(shù)來改進模型，該稀疏更新模型可使每幀CG 迭代的平均數(shù)量減少到，本文中NS=6，以減少更新濾波器增大的計算量，降低計算復(fù)雜度，從而有效實現(xiàn)算法加速。

2.3 算法流程

本文提出的抑制響應(yīng)圖突變的跟蹤算法流程如圖1所示，具體步驟如下：

圖1 本文算法流程Fig.1 Procedure of the proposed algorithm

1）輸入視頻序列，獲取目標的位置信息和尺度。

2）從視頻序列第一幀圖像中提取目標并提取其特征，計算搜索區(qū)域和初始化比例因子，初始化相關(guān)濾波器，形成目標區(qū)域的初始樣本集。

3）對初始樣本集進行高斯混合模型處理以獲取樣本的緊湊模型。

4）對相關(guān)濾波器進行卷積分解，獲取基本濾波器的緊湊集合。

5）獲取新一幀多分辨率特征圖，分別與濾波器卷積后將所有響應(yīng)圖加權(quán)得到最終響應(yīng)圖。

6）通過所得響應(yīng)圖的值M2與前一幀響應(yīng)圖的值M1計算出變化率φp,q。

7）將響應(yīng)圖的值最高的區(qū)域作為當前幀中的目標位置，并用跟蹤框標記。

8）將步驟7 中目標位置所在區(qū)域作為樣本集并用式（8）訓(xùn)練下一幀圖像的濾波器。

9）循環(huán)執(zhí)行步驟3～步驟8 直到視頻序列的最后一幀圖像結(jié)束。

3 實驗與結(jié)果分析

本文使用MATLAB R2018b 軟件進行仿真實驗，采用Inter Core i5-8400 計算機，主頻為2.80 GHz，操作系統(tǒng)為windows10。實驗使用VGG-m網(wǎng)絡(luò)中第一個卷積層（Conv-1）和最后一個卷積層（Conv-5）的特征組合。測試集使用目標跟蹤算法評估的數(shù)據(jù)集OTB100，該數(shù)據(jù)集包含光照變化、尺度變化、遮擋或半遮擋、快速運動等多種復(fù)雜情況。

本文采用一次測試的實驗結(jié)果，通過距離精度曲線和成功率曲線對算法性能進行評估。距離精度曲線計算中心位置誤差低于某個閾值的幀數(shù)占所有幀數(shù)的百分比，本文設(shè)定像素閾值為25。成功率曲線用于計算跟蹤重疊率大于某個閾值的幀數(shù)占所有幀數(shù)的百分比，其中跟蹤重疊率指目標跟蹤框與真實目標框的重疊面積與后者總面積的比值，本文設(shè)定跟蹤重疊率閾值為0.5。以每秒平均幀數(shù)表示算法的跟蹤速度。

3.1 不同算法性能對比

將本文算法和KCF 算法、SRDCF 算法、BACF算法、ECO 算法、ARCF 算法、GFSDCF 算法在OTB100 數(shù)據(jù)集上的目標跟蹤性能進行對比和分析。

上述7種算法在100組視頻序列上的成功率曲線和距離精度曲線如圖2所示。由圖2可知，本文算法的成功率和距離精度在7種算法中均為最高，分別是80.2%和86.4%，較GFSDCF算法分別高1.0個百分點和0.2個百分點，較ECO算法分別高3.1個百分點和1.9個百分點，較BACF算法分別高4.0個百分點和5.5個百分點，較ARCF算法分別高5.9個百分點和7.4個百分點，較SRDCF算法分別高8.5個百分點和8.6個百分點，較KCF算法分別高25.7個百分點和17.6個百分點。由此可見，增加抑制響應(yīng)圖突變后的ECO 算法優(yōu)于改進前的ECO 算法。

圖2 7 種算法在OTB100 數(shù)據(jù)集上的成功率曲線和距離精度曲線Fig.2 Success rate curve and distance accuracy curve of seven algorithms on OTB100 dataset

上述7 種算法在6 組視頻序列中的跟蹤速度如表1所示。由表1 可見，KCF 算法的平均跟蹤速度最高，達到80.4 frame/s，其次是ECO 算法，平均跟蹤速度為33.63 frame/s，本文算法平均跟蹤速度為22.98 frame/s，較ECO 算法少10.65 frame/s，但成功率和距離精度卻優(yōu)于ECO 算法。成功率和距離精度排第二位的GFSDCF算法平均跟蹤速度較慢，僅為7.96 frame/s。

表1 7 種算法在不同視頻序列中的跟蹤速度Table 1 Tracking speed of seven algorithms in different video sequences （frame·s-1）

圖3～圖6 為上述7 種算法分別在human3、lemming、shaking 和bird1 視頻序列中的定性測評結(jié)果（彩色效果參見《計算機工程》官網(wǎng)HTML 版）。在human3 視頻序列中（見圖3），當存在與目標非常相似的干擾物（見圖3（a））和遮擋（見圖3（b）～圖3（e））時，只有本文算法和ECO 算法能準確跟蹤目標，其他算法均無法準確跟蹤目標。從第88 幀圖像開始，除了本文算法和ECO 算法，其他算法均跟蹤失敗。本文算法由于引入響應(yīng)圖異常抑制框架，因此能準確跟蹤目標。在lemming 視頻序列中（見圖4），當目標被遮擋（見圖4（a）和圖4（b））時，SRDCF 算法、ARCF 算法和KCF 算法跟蹤失敗，當目標存在運動模糊、旋轉(zhuǎn)、超出視野外（見圖4（c）和圖4（d））時，ECO 算法、GFSDCF 算法和BACF 算法跟蹤效果較差，不能完全跟蹤目標，本文算法在上述情況下均能準確跟蹤目標。在shaking 視頻序列中（見圖5），當目標受到光照變換、背景雜波的影響（見圖5（a）和圖5（b））時，SRDCF 算法、ARCF 算法和KCF 算法目標跟蹤失敗，而目標發(fā)生旋轉(zhuǎn)（見圖5（c）和圖5（d））后，其他算法跟蹤效果均較差，僅本文算法跟蹤效果較準確。在bird1 視頻序列中（見圖6）：當目標出現(xiàn)快速移動和形變（見圖6（a））時，SRDCF 算法和KCF 算法目標跟蹤失敗，其他算法跟蹤效果良好；當目標存在運動模糊和超出視野范圍（見圖6（b）和圖6（c））時，只有GFSDCF 算法和本文算法能繼續(xù)進行目標跟蹤，其他算法均目標跟蹤失敗；從圖6（d）可明顯看出本文算法的跟蹤效果較GFSDCF 算法更好。

圖3 7 種算法在視頻序列human3 中的測評結(jié)果Fig.3 Evaluation results of seven algorithms in video sequence human3

圖4 7 種算法在視頻序列l(wèi)emming 中的測評結(jié)果Fig.4 Evaluation results of seven algorithms in video sequence lemming

圖5 7 種算法在視頻序列shaking 中的測評結(jié)果Fig.5 Evaluation results of seven algorithms in video sequence shaking

圖6 7 種算法在視頻序列bird1 中的測評結(jié)果Fig.6 Evaluation results of seven algorithms in video sequence bird1

7 種算法在不同干擾因素下的目標跟蹤成功率如表2所示。由表2 可見，在相似背景、快速運動、尺度變化、形態(tài)變化、遮擋、運動模糊的情況下，本文算法的目標跟蹤成功率均最高，在其他情況下目標跟蹤成功率僅較表現(xiàn)最好的算法略低。在光照變化、平面外旋轉(zhuǎn)、平面內(nèi)旋轉(zhuǎn)、視野外、低分辨率的情況下本文算法的目標跟蹤成功率分別比表現(xiàn)最好的算法GFSDCF 低0.3 個百分點、3.7 個百分點、1.4 個百分點、7.7 個百分點和6.8 個百分點。在所有干擾因素中，本文算法的目標跟蹤成功率僅在低分辨率情況下低于ECO 算法，在多種環(huán)境下本文算法較ECO算法具有更高的目標跟蹤成功率。

表2 7 種算法在不同干擾因素下的目標跟蹤成功率Table 2 Target tracking success rates of seven algorithms under different interference factors

3.2 本文算法與ECO 算法對比

將本文算法和ECO 算法對human3 和lemming兩組視頻序列的跟蹤結(jié)果進行對比，通過比較前一幀響應(yīng)圖和當前響應(yīng)圖之間的差值來判斷跟蹤效果，響應(yīng)圖差值越小表明跟蹤效果越好，結(jié)果如圖7所示。圖7（a）是視頻序列human3 前200 幀響應(yīng)圖的差值曲線，從整體上來看，本文算法的響應(yīng)圖差值較ECO算法更小。當?shù)?3幀～第67幀、第118幀～第130幀圖像中目標被遮擋時，ECO 算法的響應(yīng)圖差值顯著變大，而本文算法的響應(yīng)圖差值明顯更小，目標跟蹤效果更好。圖7（b）是視頻序列l(wèi)emming 第1 000 幀～第1 300 幀響應(yīng)圖的差值曲線，可以看出第1 020 幀響應(yīng)圖中目標在平面內(nèi)旋轉(zhuǎn)、快速移動和運動模糊時，ECO 算法的響應(yīng)圖差值變化較大，而本文算法的響應(yīng)圖差值遠比ECO 算法的響應(yīng)圖差值更小，目標跟蹤效果更好。

圖7 2 種算法對2 種視頻序列的響應(yīng)圖差值曲線Fig.7 Response graph difference curves of two algorithms for two video sequences

4 結(jié)束語

本文提出一種改進的ECO 異常抑制目標跟蹤算法。在ECO 目標跟蹤算法的基礎(chǔ)上，將異常抑制與訓(xùn)練相關(guān)濾波器相結(jié)合，通過引入前一幀響應(yīng)圖變化率來限制響應(yīng)圖異常變化，以防止跟蹤過程中目標發(fā)生漂移。在OTB100 數(shù)據(jù)集上的實驗結(jié)果表明，在光照變化、尺度變化、平面內(nèi)旋轉(zhuǎn)、平面外旋轉(zhuǎn)、背景雜波等干擾下，本文算法較其他相關(guān)濾波算法成功率更高。后續(xù)將對不同目標特征進行融合，進一步優(yōu)化算法的跟蹤性能。