

摘 要 視頻目標跟蹤一直是計算機領域的熱點問題,近些年,深度學習等技術的發展使得目標跟蹤算法的正確率獲得很大提升,但是目標發生變化如被遮擋等情景時,易導致跟蹤錯誤,為了進一步提高目標跟蹤算法的準確性,文中將在目標跟蹤中引入新的算法,并對該流程做了系統概述。
關鍵詞 計算機領域;深度學習;目標跟蹤
本文主要通過基于目標檢測的跟蹤算法,將視頻中的每一幀的目標檢測出來,并將結果關聯成軌跡,從而確定每個行人目標各自的運動軌跡。
基于目標檢測的跟蹤分為兩大部分:行人檢測和行人跟蹤,行人檢測利用目標檢測算法對視頻序列中的目標進行自動檢測、確定其位置。行人跟蹤則主要根據檢測的結果跟蹤和識別目標,精準地估計目標的位置、尺寸和運動軌跡等。但是由于視頻場景存在復雜的非線性變化,有很大的不確定性 ,例如目標遮擋等情況,因此,還引入了行人再識別[1]。
1Yolov3行人檢測算法
目標檢測是將圖像中的目標與其余區域分離開,判斷是否存在目標,如果存在目標則確定目標的位置[2]。
Yolov3算法并沒有使用darknet-53的全部層數,Yolov3網絡是個全卷積的網絡,利用大量殘差的跳層相連,而且為了減小池化帶來的梯度負面效果,直接放棄了池化,用步長為2的卷積進行降采樣。同時為了增強算法對小目標檢測的精確度,Yolov3融合了FPN算法,在多個尺度的特征圖上做檢測。
采用darknet-53網絡結構的Yolov3目標檢測算法相對于采用ResNet網絡結構的Faster rcnn目標檢測算法,不僅在分類精度上差不多,計算速度還比Faster rcnn強多了。
2利用DeepSort跟蹤算法的確定行人軌跡
DeepSort跟蹤的思路是現在主要流行的跟蹤思路:基于目標檢測的跟蹤。以Yolov3目標檢測結果為DeepSort的輸入:bounding box、confidence、feature 。卷積主要用于篩選出一部分的檢測框;bounding box與feature用于后面與跟蹤器的match計算;首先是預測模塊,會對跟蹤器使用卡爾曼濾波器進行預測。在這里使用的是卡爾曼濾波器的勻速運動和線性觀測模型(意味著只有四個量且在初始化時會使用檢測器進行恒值初始化)。其次是更新模塊,包括匹配,追蹤器更新與特征集更新。在更新模塊的部分,根本的方法還是使用IOU來進行匈牙利算法的匹配。圖1是DeepSort對路人進行跟蹤的結果,每一個框的上的數字都是用來標記行人的唯一ID號。
3行人再識別糾正DeepSort算法的行人軌跡
但是利用DeepSort進行行人跟蹤會存在如圖1所示的問題:圖中1號人物目標和2號人物目標相互疊加在一起時,行人檢測無法準確地確定每個人的位置,所以會導致行人追蹤在二者相互疊加錯開時可能會發生ID改變(即ID-Switch)。
行人相互疊加遮擋一直是行人檢測和行人追蹤中的一個難題,依據現有的資料無法從算法上將其解決,所以只能從工程上尋找突破口,繼而打算在行人跟蹤模塊引入行人再識別。
行人再識別的實現思路是先抽取特征在進行比對,首先檢索經過網絡抽取圖片特征,然后底庫中里的所有圖片全部抽取圖片特征,接著將檢索圖與底庫圖中的特征計算距離(例如歐氏距離),最后根據計算的距離進行排序,排序越靠前表示相似率越高。從而改正跟蹤中的一些錯誤。
4結果展示
行人追蹤能通過行人再識別在一定程度上可以使準確率提高。行人再識別-跟蹤改正結果如圖2所示
5結束語
雖然目標跟蹤的方法種類不少,但每一類方法或算法都有其不足,距離實用性還有不少的難題。主要集中于以下幾點:
(1)運動目標頻繁變動的干擾
(2)遮擋與陰影問題。
所以,要依據實際的情況,選擇合適的目標跟蹤算法。
參考文獻
[1] 陳星,李郴.C語言組卷系統中重復問題研究[J].電腦知識與技術,2016(1):214-216.
[2] 任立平. 智能視頻監控系統在民航機場的應用研究[J]. 自動化應用,2010,47(3):377-389.
作者簡介
王克(1995-),男,江蘇省徐州市人;學歷:碩士,現就職單位:沈陽理工大學,研究方向:大數據與智能信息處理技術。