





摘 要:為增強高速公路收費車輛分類的實時性和準確性,對比分析了SSD、YOLO和Faster R-CNN圖像識別算法的優缺點,提出了一種結合MixUp數據增強、Focus網絡結構和CIOU損失函數的高速公路收費車輛分類方法,對門架高清攝像機抓拍的圖像進行識別和分類,在京港澳高速公路數據集上進行驗證。結果表明:YOLO模型系列中的YOLOv3模型對于收費車輛分類的平均準確率超過了Faster R-CNN和SSD模型,并且在使用了MixUp數據增強、Focus網絡結構和CIOU損失函數時平均準確率達到了92.04%,FPS為22.8。進行消融實驗,使用MixUp數據增強后,模型精度提高了0.62%;使用Focus網絡結構后,模型FPS提高了1.4;使用CIOU損失函數后,模型精度提高0.28%。由此說明,改進后的YOLOv3模型在高速公路收費車輛分類中可以準確、實時地實現收費車輛分類,為高速公路智能收費系統提供技術支撐。
關鍵詞:高速公路;深度學習;圖像識別;車輛分類;YOLOv3;模型精度
中圖分類號:TP39;U495 文獻標識碼:A 文章編號:2095-1302(2024)02-0-04
0 引 言
高速公路逃費現象屢禁不止,給國家帶來了巨大的經濟損失,因此必須采取有效措施減少偷逃費行為,集中執法力量、提升處罰力度[1]。以往的查處主要是以經驗為主,通過建立黑名單系統,調取抓拍圖像進行分析對比[2]。然而高速公路通行車輛多,人工進行分析對比難度大,打擊效率不高。D Burgess表示新技術的創新應用為解決偷逃費行為提供了新的方式[3]。日本學者Fukasawa等人開發出全自動收費系統,從技術層面制定了減少偷逃費行為的方案[4]。Claus Doll等學者借助GPS定位系統對車輛進行定位,有效解決了車輛收費過程中里程難以確定等問題[5]。
本文針對高速公路收費車輛的圖像特點,利用基于深度學習算法對高速公路收費車輛進行智能識別[6]和分類[7],從分類準確率、識別速度等方面進行分析對比,并對算法進行改進,在收集的數據集上進行對比實驗和消融實驗,驗證算法的可行性,為打擊高速公路偷逃費的及時性和準確性提供支撐。
1 圖像識別算法
圖像識別算法能夠提取和分析圖像的特征,進而實現分類。在21世紀前,圖像識別方法僅限于簡單的數字。隨著21世紀計算機性能的提升,計算機運算神經網絡的效率大幅提升,結構復雜、高維度、復雜的深度神經網絡層出不窮。2010年以來,R-CNN系列、SSD、YOLO系列等基于深度學習的圖像識別算法應運而生。R-CNN系列最新的算法是Faster R-CNN[8],具有很高的準確率,但是識別速度較慢。SSD[9]算法既快又準確,但調試過程依賴經驗,很難找到算法的最佳參數。YOLO[10]系列不斷改進和迭代,算法的準確率和檢測速度也在不斷提高,目前具有較好的檢測效果。
考慮到高速公路收費車輛分類對于速度和準確率的要求都較高,且車輛目標相對較大,對于大型車輛不能拍攝到完整的車軸信息,無法進行大型車輛的細分類,但是可以依據圖片信息對大型車輛和小型車輛進行粗分類。因此本文選擇采用YOLOv3算法構建分類模型,并結合MixUp數據增強、Focus網絡結構和CIOU損失函數對ETC門架上提取的車輛圖片進行粗分類。
2 高速公路收費車輛分類方法
YOLOv3網絡是速度和精度最均衡的目標檢測網絡,YOLOv3網絡主要有特征提取網絡、特征融合層和解碼層。其識別流程為:輸入圖像,通過特征提取網絡提取特征,通過特征融合層融合不同尺度的特征,將加強的特征通過解碼層輸出在圖像上。同時,考慮到高速公路收費車輛特征具有部分相似性,不易區分的特點,在訓練過程中應用MixUp數據增強、Focus網絡結構和CIOU損失函數進一步提升模型的性能。
2.1 MixUp數據增強
神經網絡需要大量數據進行訓練,然而優質的訓練數據數量較少,如果訓練數據只擁有目標的一部分特征,網絡就會在此部分過度擬合。因此,需要大量訓練數據以覆蓋目標的所有特征。在數據量有限的情況下,通過旋轉、裁剪、移位、翻轉等方式增加數據量,可以提高網絡對目標識別的準確率。MixUp數據增強方法能提供不同數據類別之間的連續數據樣本,擴大了訓練集的分布,從而使網絡的檢測準確率更高,如圖1所示。
具體過程:每次讀取兩張圖片,分別對這兩張圖片進行翻轉、縮放、色域變化等數據增強,最后將二者的真實框堆疊到一起,再輸入到神經網絡進行訓練。
2.2 Focus網絡結構
神經網絡的檢測速率主要與網絡的計算量和參數量有關,減少參數量能夠提高速率但是降低了準確率。常用的方法包括濾波器級別的剪枝、知識蒸餾、輕量化網絡和結構搜索等方法,但此類方法會改變卷積核或者網絡層級結構,對網絡的檢測精度有一定影響。而Focus模塊則是先對圖片進行切片、拼接和一次卷積,再輸入到特征提取網絡,在不影響檢測準確率的條件下,提高檢測速率。Focus網絡結構如圖2所示。
2.3 CIOU損失函數
損失函數用于評估模型的預測值與真實值之間的差異,作用于神經網絡反向傳播時的權值更新,可以在很大程度上影響模型的收斂效果。
YOLOv3的損失函數計算公式如下:
(1)
式中:λ1,λ2,λ3為平衡系數。目標定位損失Lloc在本文中采用CIOU損失來改進,代替了原有的均方差損失,能夠優化總損失,改善回歸精度。
IOU(Intersection over Union, IOU)交并比,是大部分檢測框使用的Loss。如圖3(a)所示是兩個框的交集比上并集,它可以被定義為:
(2)
式中:area(C)為圖3(a)中紅色框(Candidate Bound)的面積;area(G)為圖3(a)中藍色框(Ground Truth Bound)的面積。
雖然IOU相比原YOLOv3中均方差損失能夠更好地反應重合程度且具有尺度不變性,但是在兩個框不相交的情況下,Loss的值為0,無法反映兩者的距離,而且IOU無法反映兩者的重合度。CIOU解決了在IOU作為損失函數時梯度無法計算的問題,引入框的寬高比,進一步提高了回歸精度。其懲罰項公式如下:
(3)
如圖3(b)所示,ρ代表預測框和真實框的中心點a,abt的歐氏距離。d代表預測框和真實框最小外接矩形的對角線的長度。αv代表的是長寬比,α和v的定義如下:
(4)
(5)
最終LossCIOU的計算公式為:
(6)
3 實驗結果與分析
3.1 訓練數據集
本實驗在京港澳高速公路路段上收集來自ETC門架上的圖片信息建立數據集,根據高速公路收費標準對數據集中的收費車輛類別進行劃分。通過ETC門架攝像頭拍攝得到車輛圖片56 553張,去除雨雪天氣、分辨率低、晚上和重復的圖片,參與實驗的圖片有2 300張。將其中90%用于訓練,10%用于測試。
3.2 評價指標
在對模型進行評估時,速度衡量指標為FPS,表示每秒能處理的圖片數量,準確度衡量指標通常采用精確率P(Precision)和召回率R(Recall)。精確率是模型預測的所有正樣本中,預測正確的比例。召回率是對于所有正樣本,模型預測的正樣本所占的比例。其公式如下所示:
(7)
(8)
式中:TP(True Positives, TP)指正樣本被正確預測為正樣本;FP(False Positives, FP)表示負樣本被錯誤預測為正樣本;FN(False Negatives, FN)表示正樣本被錯誤預測為負樣本。
調和平均數F1是結合精確率和召回率的綜合評價指標。該分值越高表明該算法越優秀。F1的值由公式(9)計算可得:
(9)
mAP(mean Average Precision, mAP)為平均精度均值,其中AP是準確率和召回率所圍成的面積,m表示平均值,mAP即各類AP的均值。AP計算如式(10)所示:
(10)
本文采用mAP和FPS對模型的準確率和速率進行評估。
3.3 訓練結果
YOLOv3與YOLOv3-MFC(改進后的YOLOv3)的mAP關于迭代次數的曲線如圖4所示。其中,橫坐標為迭代次數,縱坐標為mAP。從圖4可以看出,網絡訓練初期模型收斂較快,在迭代到120次左右準確率逐漸達到0.9,然后緩慢增長,最終YOLOv3模型的mAP達到了0.91左右。本文算法YOLOv3-MFC收斂速度更快,最終mAP值穩定在0.92左右,相比原模型有更快的收斂速度和更高的識別精度。
實驗中構建的車輛分類模型對收費車輛的識別效果如圖5所示。
3.4 對比實驗
為了評價改進后模型的優勢,將本文提出的算法與常用的車輛識別算法SSD、Faster R-CNN和YOLOv3進行對比,使用相同的數據集訓練后,從mAP和FPS對模型進行對比和評價。對比實驗結果見表1所列。
由表1可知,Faster R-CNN算法具有較高的平均精度,但是檢測速率較低,無法滿足檢測的實時性要求;SSD算法具有較高的檢測速率,但是平均精度較低,不能滿足檢測的準確性要求;YOLOv3算法具有較好的平均精度和檢測速率,本文算法YOLOv3-MFC在YOLOv3上進行了拓展與改進,在滿足檢測實時性要求的基礎上,平均精度提高了1.27%,F1值提高了0.007,FPS提高了0.4,對于高速公路收費車輛檢測能力有明顯提升。
3.5 消融實驗
為了驗證本算法中不同的改進策略對模型檢測性能的影響,進行了消融實驗。改進部分包括MixUp數據增強、Focus網絡結構和CIOU損失函數,從mAP和FPS來評估影響。消融實驗結果見表2所列。
從表2可以看出,單獨使用MixUp數據增強可以提高模型的檢測準確率,而且不影響檢測速率;使用Focus網絡結構能加快檢測速率,但是降低了檢測精度;使用CIOU損失函數也可以提高模型的檢測準確率,但是降低了檢測速率。綜合使用這3種改進策略時,可以在提高檢測精度的同時提高檢測速率。
4 結 語
本文基于深度學習的收費車輛分類算法,結合收費車輛圖像的識別特點,構建了高速公路收費車輛分類方法,分析了常見的3種模型對于收費車輛分類的精確率、召回率、F1值、mAP和FPS的實驗結果。實驗結果顯示,YOLOv3模型在使用MixUp數據增強、Focus網絡結構和改進的損失函數時的檢測準確率和速率較為理想,可作為高速公路收費車輛分類的模型之一。本文主要針對高速公路收費車輛分類進行研究和驗證,模型的樣本量相對較小、圖像獲得的信息較為局限,未來在實驗條件允許的情況下,可以在雨天、霧天等復雜環境下對收費車輛進行更細的分類,以擴大模型的適用范圍,更好地為高速公路收費系統提供技術支撐。
注:本文通訊作者為劉維宇。
參考文獻
[1] MAGGIO M, SHIFTAN Y. Automated toll enforcement financial and policy considerations:the Dulles toll road case [J]. International journal of traanssport economics,2005,32(3):267-286.
[2]王俊健,王瑩,王以好. 基于深度學習的高速公路逃費車輛圖像稽查技術研究[J]. 中國交通信息化,2019,21(5):126-130.
[3] BURGESS D. Caught in the act [J]. Traffic technology international 2008,(2):37-39.
[4] FUKASAWA K,NATIO K. Efficiently managed electronic toll collection system [J]. Professional translation 2002(6):54-57.
[5] DOLL C,SCHAFFER A. Economic impact of the introduction of the German HGV toll system [J]. Transport policy,2007,14(1):49-58.
[6] FERIS R S,SIDDIQUIE B,PETTERSON J,et al. Large-scale vehicle detection,indexing,and search in urban surveillance videos [J]. IEEE transactions on multimedia,2011,14(1):28-42.
[7] YANG L,LUO P,CHANGE LOY C,et al. A large-scale car dataset for fine-grained categorization and verification [C]// Proceedings of the IEEE conference on computer vision and pattern recognition. 2015:3973-3981.
[8] REN S,HE K,GIRSHICK R,et al. Faster R-CNN:Towards real-time object detection with region proposal networks [J]. IEEE transactions on pattern analysis amp; machine intelligence,2017,39(6):1137-1149.
[9] LIU W,ANGUELOV D,ERHAN D,et al. Ssd:Single shot multibox detector [C]// Computer Vision-ECCV 2016:14th European Conference,Amsterdam,The Netherlands,October 11-14,2016,Proceedings,Part I 14. Springer International Publishing,2016:21-37.
[10] REDMON J,DIVVALA S,GIRSHICK R,et al. You only look once:Unified,real-time object detection [C]// Proceedings of the IEEE conference on computer vision and pattern recognition. 2016:779-788.