視頻目標跟蹤算法研究

2020-09-06 14:15:55王克

科學與信息化 2020年23期

摘要視頻目標跟蹤一直是計算機領域的熱點問題，近些年，深度學習等技術的發展使得目標跟蹤算法的正確率獲得很大提升，但是目標發生變化如被遮擋等情景時，易導致跟蹤錯誤，為了進一步提高目標跟蹤算法的準確性，文中將在目標跟蹤中引入新的算法，并對該流程做了系統概述。

關鍵詞計算機領域;深度學習;目標跟蹤

本文主要通過基于目標檢測的跟蹤算法，將視頻中的每一幀的目標檢測出來，并將結果關聯成軌跡，從而確定每個行人目標各自的運動軌跡。

基于目標檢測的跟蹤分為兩大部分：行人檢測和行人跟蹤，行人檢測利用目標檢測算法對視頻序列中的目標進行自動檢測、確定其位置。行人跟蹤則主要根據檢測的結果跟蹤和識別目標，精準地估計目標的位置、尺寸和運動軌跡等。但是由于視頻場景存在復雜的非線性變化，有很大的不確定性，例如目標遮擋等情況，因此，還引入了行人再識別[1]。

1Yolov3行人檢測算法

目標檢測是將圖像中的目標與其余區域分離開，判斷是否存在目標，如果存在目標則確定目標的位置[2]。

Yolov3算法并沒有使用darknet-53的全部層數，Yolov3網絡是個全卷積的網絡，利用大量殘差的跳層相連，而且為了減小池化帶來的梯度負面效果，直接放棄了池化，用步長為2的卷積進行降采樣。同時為了增強算法對小目標檢測的精確度，Yolov3融合了FPN算法，在多個尺度的特征圖上做檢測。

采用darknet-53網絡結構的Yolov3目標檢測算法相對于采用ResNet網絡結構的Faster rcnn目標檢測算法，不僅在分類精度上差不多，計算速度還比Faster rcnn強多了。

2利用DeepSort跟蹤算法的確定行人軌跡

DeepSort跟蹤的思路是現在主要流行的跟蹤思路：基于目標檢測的跟蹤。以Yolov3目標檢測結果為DeepSort的輸入：bounding box、confidence、feature 。卷積主要用于篩選出一部分的檢測框;bounding box與feature用于后面與跟蹤器的match計算;首先是預測模塊，會對跟蹤器使用卡爾曼濾波器進行預測。在這里使用的是卡爾曼濾波器的勻速運動和線性觀測模型（意味著只有四個量且在初始化時會使用檢測器進行恒值初始化）。其次是更新模塊，包括匹配，追蹤器更新與特征集更新。在更新模塊的部分，根本的方法還是使用IOU來進行匈牙利算法的匹配。圖1是DeepSort對路人進行跟蹤的結果，每一個框的上的數字都是用來標記行人的唯一ID號。

3行人再識別糾正DeepSort算法的行人軌跡

但是利用DeepSort進行行人跟蹤會存在如圖1所示的問題：圖中1號人物目標和2號人物目標相互疊加在一起時，行人檢測無法準確地確定每個人的位置，所以會導致行人追蹤在二者相互疊加錯開時可能會發生ID改變（即ID-Switch）。

行人相互疊加遮擋一直是行人檢測和行人追蹤中的一個難題，依據現有的資料無法從算法上將其解決，所以只能從工程上尋找突破口，繼而打算在行人跟蹤模塊引入行人再識別。

行人再識別的實現思路是先抽取特征在進行比對，首先檢索經過網絡抽取圖片特征，然后底庫中里的所有圖片全部抽取圖片特征，接著將檢索圖與底庫圖中的特征計算距離（例如歐氏距離），最后根據計算的距離進行排序，排序越靠前表示相似率越高。從而改正跟蹤中的一些錯誤。

4結果展示

行人追蹤能通過行人再識別在一定程度上可以使準確率提高。行人再識別-跟蹤改正結果如圖2所示

5結束語

雖然目標跟蹤的方法種類不少，但每一類方法或算法都有其不足，距離實用性還有不少的難題。主要集中于以下幾點：

（1）運動目標頻繁變動的干擾

（2）遮擋與陰影問題。

所以，要依據實際的情況，選擇合適的目標跟蹤算法。

參考文獻

[1] 陳星，李郴.C語言組卷系統中重復問題研究[J].電腦知識與技術，2016（1）：214-216.

[2] 任立平. 智能視頻監控系統在民航機場的應用研究[J]. 自動化應用，2010，47（3）：377-389.

作者簡介

王克（1995-），男，江蘇省徐州市人;學歷：碩士，現就職單位：沈陽理工大學，研究方向：大數據與智能信息處理技術。