



摘要:針對當前目標車輛因遮擋、天氣等因素造成的漏檢,以及跟蹤過程中車輛身份丟失和變換等現象,本文提出了一種改進的YOLOv5與DeepSort車輛檢測跟蹤算法。在車輛目標檢測部分,本文在YOLOv5網絡中添加了注意力模塊CBAM,以更有效地提取目標特征;同時,引入了SIoU作為邊界框損失函數,不僅提升了邊界框定位的準確性,也加快了邊界框的回歸速度。在車輛跟蹤部分,改進了DeepSort算法,使用擴展卡爾曼濾波器預測非線性環境下的車輛位置,并且使用匈牙利算法將預測軌跡和檢測軌跡進行最優匹配,從而在復雜環境下優化由車輛相互覆蓋引起的漏檢問題。最終,通過改進后的YOLOv5與DeepSort算法進行檢測和跟蹤,并使用UA-DETRAC數據集進行驗證。實驗結果表明:改進后的YOLOv5用于目標追蹤算法后,平均精確度較原算法提高了4%;結合改進后的DeepSort追蹤算法,平均精確度提高至63.6%,比原算法提高了3.6%;車輛目標身份轉換的次數比原算法減少了53次,降低了6.6%。改進后的算法模型在追蹤精確度和實時性上均表現良好。
關鍵詞:YOLOv5;DeepSort;目標檢測;多目標跟蹤;注意力機制
中圖分類號:TP18 文獻標識碼:A
文章編號:1009-3044(2024)19-0001-05
0 引言
近幾年,計算機視覺技術常被用于車輛多目標檢測跟蹤領域[1],該技術的發展有助于推動智能駕駛車輛和視頻監控等[2-5]相關方向的發展。在多目標跟蹤問題的研究中,解決方案通常分為兩個步驟:目標檢測和目標數據關聯。這兩個步驟共同構成了車輛跟蹤研究中的核心問題,即如何準確地將不同幀中的目標識別為同一目標。現階段多目標跟蹤可分為兩類:一類是將Re-ID(re-identification) 模塊與目標檢測網絡分離的DBT(detection-based tracking) [6]方法;另一類是將Re-ID模塊整合到目標檢測網絡中的JDT(joint detectiontracking) 方法。DBT方法通過兩個獨立的網絡來實現目標檢測和Re-ID,從而提高追蹤的準確性,而JDT方法則在一個統一的網絡中完成這兩個任務,這兩類方法均是基于視覺的目標跟蹤的主流方法。
提升目標跟蹤的推測速率是近年來一個熱門的研究方向。毛昭勇等[7]通過將原有的耗時主干網絡替換為輕量級EfficientNet網絡,不僅加快了推理速度,還通過小目標檢測的網絡設計,縮短了推理時間并提升了效率。這一改進使得YOLOv3在處理速度和檢測準確度上都得到了顯著提高,特別是在小目標檢測方面表現更加優異。武明虎等[8]結合SORT算法,在完善YO?LOv3的損失函數和網絡結構后,其目標檢測可以實現最快14.39 fps 的追蹤速度。Zuraimi 等[9]驗證了YO?LOv3不如YOLOv4網絡,采用YOLOv4作為目標檢測網絡的DeepSort整體上達到了14.12 fps的追蹤速度。
自YOLO算法推出以來,其多個版本在目標檢測與追蹤領域都有著廣泛應用。趙桂平等[10]在YOLOv5 的框架基礎上改良了生成目標邊界框的過程,從而提升了檢測的準確度。Wang等[11]在目標檢測過程中采用了YOLOv5s網絡,而在單目標跟蹤任務中則選用了SiamRPN算法。這兩種算法的結合使得綜合檢測速度達到了20.43 fps。
上述目標檢測算法難以兼顧檢測的精確性和實時性;另外在車輛被遮擋和復雜路況等環境下,解決身份變換問題也是一大挑戰。基于以上情況,本文改進了YOLOv5和DeepSort算法。模型通過增加注意力模塊CBAM來增強特征提取能力,使得模型能夠更加關注關鍵特征,并快速分析復雜場景中的信息。同時,采用SIoU Loss損失函數改進邊界框定位精度,提升了模型訓練時的收斂速度和推理時的準確性。此外,通過應用擴展卡爾曼濾波器改進目標跟蹤算法,有效避免了因遮擋引起的車輛身份變換問題。