劉勇



摘要 CSK( circulant structurekernel)運動目標跟蹤算法具有跟蹤穩定、計算量小、抗光照干擾等優點;根據上一幀圖像的基本特征和相關的信息,訓練出分類器,來對實時目標進行鎖定跟蹤。這是如此,CSK算法對抗遮擋的魯棒性很差,假如跟蹤目標在某一時刻被遮擋了,則將跟丟目標。為了解決CSK算法的遮擋問題,本文引入VIBE運動目標檢測算法,利用VIBE算法的計算量小,需要的樣本少,可在短時間內檢測出目標,然后重新對目標進行鎖定,從而達到連續跟蹤的目的,實驗驗證,本算法能達到實時性,滿足系統需要。
【關鍵詞】VIBE CSK 跟蹤 目標檢測
運動目標檢測跟蹤是當前視覺研究的熱門方向,廣泛各類武器裝備中,如:導引頭,光電吊艙等設備中。同時在民用領域也占有很大份額,在交通監控、視覺監控中也廣泛應用,同時在現階段熱門的AR和VR設備當中也經常能夠看到目標跟蹤的身影,應用十分廣泛。
現階段的目標跟蹤算法,大致可以分為以下四大類:
(1)基于模板匹配的目標跟蹤算法,這是在80年代的時候比較先進的算法,典型的代表有MAD、NCC和STC等算法;
(2)根據運動目標的軌跡來進行預測,通過根據預測來進行目標跟蹤的,常見的方法有粒子濾波跟蹤算法;
(3)通過實時的目標檢測,從而達到實時的跟蹤效果,以檢測來代替跟蹤的跟蹤策略
(4) 21世紀后,大量的跟蹤算法涌現,其中最引人注目的算法類就是基于核函數的濾波跟蹤算法。這種跟蹤算法不僅計算簡便,而且僅僅只需要一張圖像就可以進行訓練,因此操作起來十分的簡潔方便。
傳統的跟蹤算法,如NCC在進行小目標跟蹤時,由于其本身的非旋轉性,很多時候出現大量的匹配誤差;而粒子濾波在現階段由于計算量加大,暫時還不能夠實現嵌入式平臺,因此要想有一個處理速度快,跟蹤又穩定的處理算法還是有點困難的,本文就是基于跟蹤算法來完成的。運用快速核函數濾波跟蹤CSK,CSK算法對運動目標進行鎖定跟蹤;基于濾波類的跟蹤算法具有一個明顯的弱點,就是抗遮擋能力非常弱,一旦目標被遮擋了,則在后面的視頻當中目標也不在會出現,就算出現也已經報丟失,顯示跟蹤失敗。
CSK算法在目標跟蹤算法具有很強的魯棒性,但是也存在上述的一點缺陷。本文就是為了處理CSK跟蹤算法扛遮擋能力差的問題,在一般正常情況下采取CSK算法進行目標跟蹤,而如果目標消失不見了或者發生突變現象,則在算法前端加上了運動目標檢測算法一VIBE,從而將突變位置的目標位置傳送出去,給CSK算法來進行跟蹤,從而達到穩定實時的跟蹤系統。
1 CSK跟蹤算法介紹
圖像算法一般分為兩種:稠密型的和稀疏型。在大多數情況,為了能夠達到實時性,常規做法就是取用較少圖像像素點來進行圖像處理一稀疏性,這種方式可以減小算法的負責度,使得算法能夠達到實時性,但是犧牲了算法性能,造成跟蹤或者檢測不準確的情況發生。CSK算法通過單張圖片,通過循環舉證的操作,達到的稠密操作,具體做法是在行和列方向上分別做循環操作,從而達到多樣本的目的,最后進行訓練。而在檢測階段,算法可以采取求卷積的方式來代替傳統的滑窗操作,進一步提高算法的速度。
在分類器的訓練階段,CSK算法從前一幀圖像中,以目標為中心采集一個W*H的圖像塊i,然后對i在行和列方向上分別做循環移位,得到訓練樣本集Ip={i(w,h)),參數w∈(0,1,2,3…W一1)、h∈(0,1,2,3…H一1),分別表示在w和H方向上做w和h次的循環移位,從而得到多個樣本,達到單個樣本變成多個樣本的目的。樣本I(w,h)的訓練標記為高斯函數r(W,h),整個訓練采用百分制,目標中心位置的值為100%,無窮遠處記為O,與其距離成正比關系。最終的訓練目的是在樣本集Ip上形成一個分類器,在后期的檢測中對待檢測區域進行檢測。
CSK采用嶺回歸方法(Ridge Regression,即Regularized Least Squares,RLS)學習分類器,最終得到的參數是要使得如下損失函數最小的分類器參數ω,即
CSK算法采用高斯徑向基函數作為核函數k(),并利用FFT計算,采用線性插值對表觀i和分類器α進行更新,每幀跟蹤的計算復雜度成指數形式降低。
2 融合VIBE運動目標檢測算法
2.1 Vibe背景建模目標檢測算法
Vibe算法是一種用來檢測運動目標的檢測算法,具有計算量下、背景建模簡單、檢測目標準確等優點。它的原理是:運用第一張圖像通過給每一個像素點建立樣本空間,在實時的與實時圖像進行比對,看樣本空間的像素點點是否位于實時圖像的鄰域當中,根據處于樣本空間中的樣本個數來確定實時的區域是否是背景,從而能夠將整幅圖像進行分隔,將背景和目標進行分割;最后根據像素點在連續圖像中的背景次數來進行背景模板跟新,從而達到循環的運動目標檢測。具體的算法實現步驟如下:
2.1.1 背景模板初始化
運動目標檢測過程中,首先要對目標的背景進行建模:第一步是要對第一張圖像進行樣本空間的設定,將第一幅圖像拓展成為領域上的八個空間。假設SR(Vx)表示的是以實時像素點所構成的圓形值域空間,且用Vx表示的樣本空間中的每一個元素與實時元素的歐式距離,如下公式(5):
M(x)={V1,V2…,VN}
(5)
2.1.2 目標實時檢測
在得到了特定的運動目標背景以后,我們需要根據背景信息進行運動目標檢測。我們將初始化值域空間中的每一個值與實時的像素值進行求歐式距離,若反應的歐式距離小于特定值,在N加一,當N大于特定閾值時,也就是說SR Vx)圓形值域空間中點的個數大于某一個既定的閾值時,在認為該實時像素為背景,如圖1所示,在實時像素點的領域中的點個數大于2時,則認為該像素點為背景,反之則可以認為是運動目標。