吳楷澤
(廣東工業大學,廣東 廣州510000)
現如今,智能視頻監控系統已經在各個行業領域中受到廣泛應用,并在風險預警、保障安全過程中發揮了巨大的作用。在智能化視頻監控系統中,以人員為主要的目標對象的風險分析、輔助決策等智能化功能的開發主要依賴于人員目標跟蹤的實現。人員目標跟蹤在實際應用中面臨著目標遮擋和目標短暫消失的挑戰。針對遮擋問題,文獻[1]中在跟蹤目標主體選取多個部位并為其設置各自的跟蹤器進行獨立的跟蹤,當某些部位被遮擋時,其他未遮擋部分的跟蹤器仍能保持跟蹤。該方法雖然能夠解決部分遮擋的問題,但當目標被完全遮擋或者短暫離開當前畫面后重新出現的情況下該方法仍會出現跟蹤中斷問題。
單視角攝像頭在目標跟蹤過程中因遮擋問題導致跟蹤失敗的情況,究其原因是單視角攝像頭視域受限,獲取目標信息有限。若采用多個攝像頭從多個角度對目標進行跟蹤,獲取目標更為全面的信息,提高目標跟蹤的準確性。
多視角目標跟蹤的實現中,同一目標呈現到不同視角的攝像頭的采集圖像中各不相同,當同時跟蹤多個目標時,需要為不同視角獲取到的多個目標結果建立關聯匹配關系。常見的跨視角目標關聯方法主要要基于兩種思路,一種是基于目標顏色特征的約束關系,另一種是基于目標的空間約束關系。對于基于目標顏色特征約束建立的目標匹配關系,其結果易受光照環境影響。當攝像頭分辨率較低采集到的目標區域較小時,其顏色特征并不明顯,此種情況,通過顏色特征建立目標匹配關系的思路將不適用。因此本文從目標的空間約束關系出發,制定相應的跨視角匹配策略,建立目標關聯關系,從而實現多視角目標跟蹤。





基于跨視角目標匹配策略的多視角目標跟蹤流程可用如圖1的流程圖表示。
現對流程圖主要環節簡述如下:
相機初始化過程主要是采用張正友標定法[2]對相機進行標定,以確定相機的內外參數,建立相機成像幾何模型。
在該環節中,首先采用Vibe 算法[3]進行背景建模,對于每一幀圖像,對背景模型減除得到前景圖像,對前景圖像進行輪廓提取,獲得運動目標。
遍歷獲取到的每個運動目標,采用camshift-kalman[4,5]跟蹤器對運動目標進行跟蹤,若運動目標與已經存在的跟蹤器相匹配,則視為舊目標,并對該跟蹤器進行更新;若未找到相匹配的跟蹤器,則進入步驟4 的跨視角目標關聯匹配環節。
該環節中,將待匹配目標與其他視角相機獲取到的運動目標進行匹配,匹配策略采用第2、3 節分析的基于腳部坐標和頭部坐標的評估方式,若未能與其他視角匹配,則判斷為新出現的目標,進行步驟5 的行人檢測環節;若以匹配,則對跟蹤器進行更新。
對于新出現的目標,采用DMP[5]特征進行人員檢測,若為人員目標,則為其注冊跟蹤器,并在后續的視頻幀中為該目標保持跟蹤。
圖2 為跨視角目標匹配過程。其中,視角A 當前幀包含了兩個運動目標,該兩個目標均與歷史跟蹤器相匹配,因而能通過歷史幀的回溯獲取目標ID。視角B 同樣包含兩個目標,其中一個未能找到相匹配濾波器,無法通過歷史幀獲取目標ID。將該目標采用跨視角目標匹配策略與視角A 獲取到的目標相匹配,繼而通過跨視角回溯方式獲取目標ID,保持繼續跟蹤。

圖1 多視角目標跟蹤流程圖

圖2 跨視角目標匹配過程
本文通過2、3 節的分析,制定了三種跨視角目標匹配策略方案,分別如下:
方案一:基于腳底坐標的跨視角目標匹配策略;
方案二:基于頭部坐標的跨視角目標匹配策略;
方案三:先基于腳底坐標進行目標匹配判斷,若匹配成功則視為同一目標;若匹配失敗則再基于頭部坐標進行目標匹配判斷,若匹配失敗則判定為不是同一目標,反之則為統一目標。
對三個方案的測試結果如下:

表1 三種方案測試結果表
由表1 分析可得,三種方案能夠成功地對不同視角的視頻幀運動目標進行匹配,其中方案三的匹配成功率最高,這是由于方案三結合了方案一和方案二的匹配結果再做出統一的判斷,但三種方案都存在一定的匹配失敗的情況。究其原因,主要是由于腳底或者頭部坐標的跨視角匹配策略都是基于運動目標提取區域的位置來獲得,若提取的運動目標區域存在誤差,同時,腳底與頭部坐標采用中點的近似估算,相機標定過程可能存在頭部被遮擋,也會影響其坐標提取準確度,在方案三中,采用了腳底坐標和頭部坐標綜合判斷的策略,該策略只有在頭部與腳底均被遮擋時才可能造成誤判,從而方案三的成功率比方案一和方案二都高。
本文基于目標的空間約束關系提出了基于腳部和頭部的跨視角目標匹配策略,并通過實驗測試證明了該匹配策略在多相機目標跟蹤過程中的可行性。應用該策略有效減少了目標因遮擋或者暫時離開畫面而導致跟蹤中斷情況的出現。同時如上節分析,該策略因坐標估算和相機標定累積的誤差,導致該策略存在誤判現象,此時可以考慮結合顏色特征的關聯匹配策略進行輔助判斷,以提高匹配成功率。