


摘要:針對現(xiàn)有大多數(shù)基于光電傳感器的軸型識別檢測方法存在準確率低、維護成本高等問題,文章提出了一種基于YOLOv5深度神經(jīng)網(wǎng)絡高效準確的貨車軸型識別方法。利用目標檢測算法YOLOv5檢測貨車輪軸,根據(jù)檢測結(jié)果識別貨車軸型;為減輕因強光斑及夜間補光不足所帶來的影響,基于貨車圖像的像素均值和標準差對圖像數(shù)據(jù)進行標準化,減輕了環(huán)境因素所帶來的影響;為減少運動模糊帶來的影響,使用Scharr濾波器進行邊緣預加重處理,強化目標輪廓特征。所設計的軸型識別方法于防城港西收費站進行了試運行應用分析,總體的軸型識別率達到99.43%,滿足新型智慧收費站系統(tǒng)的建設需要。
關鍵詞:智能交通系統(tǒng);深度學習;軸型識別;YOLOv5;圖像處理
中圖分類號:U412.6
0 引言
據(jù)統(tǒng)計,中大型貨車主要行駛于城市間高速公路上,為城市間提供貨物運輸服務,極大滿足了社會物質(zhì)生活需要。為了解決貨車超限超載的問題,常見的做法是使用地磅稱重方式,憑借計重數(shù)據(jù)明細收費。但該方法低效且計重準確度較差,往往造成排隊擁堵。
自全國收費公路統(tǒng)一執(zhí)行標準起[1],現(xiàn)行的公路貨車收費方式從原先的計重收費改為按車軸數(shù)收費。新標準的執(zhí)行,也給貨車軸型的準確識別帶來了新的挑戰(zhàn)——檢測系統(tǒng)需要動態(tài)識別貨車軸數(shù),給出軸型判定信息?,F(xiàn)有的公路貨車軸型識別方法中,較為常見的是通過在地面鋪設傳感器,通過信號的變化來對軸數(shù)進行識別。但是采用這類方法通常檢測精度較低,出現(xiàn)設備異常時,維護成本高,并且會破壞路面本身,該類方法已經(jīng)無法滿足智能交通系統(tǒng)的建設需要。
隨著數(shù)字圖像處理和深度學習等技術的快速發(fā)展,許多研究人員開始使用新技術對貨車軸型進行識別。基于數(shù)字圖像處理的軸型識別系統(tǒng)方便高效,通過獲取車輛車身圖,對圖像進行輪軸定位,進一步做檢測得出輪軸數(shù)?;谏疃葘W習的方法需要借助深度神經(jīng)網(wǎng)絡進行識別,通過輸入車身圖,檢測出貨車的相關信息,從而實現(xiàn)對貨車軸型識別的目的。該類方法高效可靠,并且維護簡單,是未來交通領域的新著力點。
本文提出一種基于YOLOv5深度神經(jīng)網(wǎng)絡的貨車軸型識別方法,該方法通過對貨車圖像進行預處理從而強化特征信息,隨后通過深度神經(jīng)網(wǎng)絡對圖像進行多級特征提取進行目標檢測,從而完成貨車軸型識別。
1 軸型識別方法和原理
1.1 傳統(tǒng)貨車軸型識別方法
傳統(tǒng)貨車軸型識別方法主要有地磁線圈法、激光紅外線識別以及動態(tài)壓電檢測法[2]。
1.1.1 地磁線圈與動態(tài)壓電檢測法
地磁線圈法[3]與動態(tài)壓電檢測法[4]檢測原理類似。地磁線圈和動態(tài)壓電設備都需要預先布設在路面下,當車輛經(jīng)過時,會通過對應的傳感器。此時傳感器會根據(jù)駛?cè)胲囕v的特征產(chǎn)生不同的電感信號。不同長度、輪軸數(shù)的貨車會產(chǎn)生不同的信號類型,因此可以根據(jù)信號明細來區(qū)分對應貨車的車型輪軸信息。該類方法識別速度較快,但該方法成本高,不易維護。此外,當進入識別區(qū)域的車輛車速較快時,識別準確性能下降顯著。
1.1.2 激光紅外檢測法
激光紅外檢測法[5]是通過紅外反射進行軸型識別。詳細來說,該方法需要在入口布設紅外傳感器。當駛?cè)胲囕v時,設備會發(fā)射紅外激光,布設在同一側(cè)的紅外接收器通過接受反射光線來識別該車的車型輪軸,從而實現(xiàn)軸型自動識別。該類方法識別靈敏,對車型適應性廣,但該方法受環(huán)境因素影響較大,在大霧天氣時,該方法精度會顯著下降。
1.2 基于深度學習的貨車軸型識別方法
基于深度學習的方法實際上是借助深度神經(jīng)網(wǎng)絡對貨車進行車型輪軸檢測與識別。一般而言,端到端的網(wǎng)絡需完成兩項任務:(1)對圖像中貨車車身以及車輪進行檢測;(2)根據(jù)車型信息以及車輪數(shù)對最終的車型輪軸明細進行識別,即完成特征提取、對應車型輪軸關系分類的任務。由于網(wǎng)絡需要輸入貨車車身圖像數(shù)據(jù)對深度神經(jīng)網(wǎng)絡模型進行訓練,因此建立大量標注好的數(shù)據(jù)集也是必不可少的一環(huán)。
2 基于YOLOv5深度神經(jīng)網(wǎng)絡的貨車軸型識別方法
本節(jié)將介紹本文所提出的方法,所提出的方法可以分為三個部分,建立貨車圖像數(shù)據(jù)集、貨車圖像數(shù)據(jù)的預處理以及使用YOLOv5卷積神經(jīng)網(wǎng)絡進行目標檢測。
建立貨車圖像數(shù)據(jù)集需要通過攝像頭設備捕捉公路貨車車身圖像并進行車身、車輪標注。此外,為減輕環(huán)境因素以及運動模糊對識別所帶來的影響,需要對輸入的圖像進行特征強化。將處理好的數(shù)據(jù)輸入到深度神經(jīng)網(wǎng)絡中進行訓練,獲取到對應的軸型識別結(jié)果,實現(xiàn)公路貨車軸型識別?;赮OLOv5深度神經(jīng)網(wǎng)絡的整體識別流程如圖1所示。
2.1 貨車圖像數(shù)據(jù)集
基于YOLOv5深度神經(jīng)網(wǎng)絡的貨車軸型識別方法,需要包含完整車輪的車身圖作為網(wǎng)絡的輸入進行訓練。本文抓取了道路上所拍攝的貨車車身圖像建立公路貨車車身圖數(shù)據(jù)集,所采集到的公路貨車車身圖要求清晰并能夠體現(xiàn)所有貨車側(cè)方特征和細節(jié)。數(shù)據(jù)采集完整后需要對數(shù)據(jù)集進行標注,本文使用標注工具Labelimg對貨車車身車輪進行標注,標簽為YOLO格式。詳細為對象的標簽索引、目標的中心坐標以及目標的寬和高。
2.2 貨車圖像預處理
一般而言,相機受太陽光直射時會產(chǎn)生光斑,出現(xiàn)光照不均的情況;與此同時,在夜間環(huán)境下,相機也會因為光線不足出現(xiàn)噪點,導致圖像質(zhì)量下降的情況。為了減少所采集的貨車車身圖受環(huán)境光的影響,提高軸型識別的準確率,需要對采集的圖像進行預處理。本文基于原始貨車數(shù)據(jù)的均值和標準差進行了數(shù)據(jù)的標準化,減少了因環(huán)境光所帶來的影響;本文還使用Scharr濾波器進行邊緣預加重處理,使得目標輪廓特征更明顯。
2.2.1 基于貨車圖像的均值和標準差進行標準化
因時間、天氣以及光照的影響,存在曝光過高的圖像和光線特別不足的夜間圖像。這些圖像相對于正常圖像而言,特征表征與正常圖像不同,容易成為導致網(wǎng)絡無法穩(wěn)定收斂的離群值。為減少這類圖像對網(wǎng)絡模型訓練的影響,對所有原始貨車圖像數(shù)據(jù)計算均值和標準差,進行標準化處理[6]。標準化的目的在于統(tǒng)一規(guī)格,使所有貨車圖像特征都在同一個量綱上,服從于正態(tài)分布,增加模型的泛化能力,減少因為部分特征的量綱過大而導致整個網(wǎng)絡模型無法收斂的影響。
標準化的公式如下所示:
式中:μ——圖像的標準均值;
σ——圖像的標準方差;
Xi——該圖像第i個像素的值;
Xi*——標準化后該圖像第i個像素的值。
2.2.2 使用Scharr濾波器對圖像進行邊緣預加重
由于進站的每臺貨車車速、車長和車高均不相同,因此存在車速過快或者是車長過長等原因?qū)е缕唇雍蟮膱D像有運動模糊的問題。這部分運動模糊的圖片會使得網(wǎng)絡在定位輪軸位置上存在困難,因此需要通過Scharr濾波器對圖像進行邊緣預加重[7]。通過微分運算增強圖像高頻區(qū)域,衰減和抑制低頻區(qū)域,使圖像變得銳化,從而增強圖像像素值跳變劇烈部分,使模糊的細節(jié)變得清晰。
Scharr濾波器是Soble濾波器在ksize=3時的優(yōu)化。Scharr濾波器與 Sobel 濾波器的不同點是Scharr 濾波器權(quán)值更大,其中心元素占的權(quán)重更重,相當于使用較小標準差的高斯函數(shù)進行濾波,這使其對圖像中邊緣的響應更為敏感。
式中:Gx——水平方向的濾波器;
Gy——垂直方向上的濾波器,分別提取水平梯度和垂直梯度。
將處理后的圖像以超參數(shù)為0.5的條件下與原圖進行疊加融合(Mixup)數(shù)據(jù)增強,以強化邊緣特征。
2.3 YOLOv5卷積神經(jīng)網(wǎng)絡
考慮到貨車軸型識別的實時性與準確性,本文使用了YOLOv5[8]作為目標檢測的骨干網(wǎng)絡。網(wǎng)絡結(jié)構(gòu)明細如圖2所示。
YOLOv5框架包括骨干網(wǎng)絡(特征金字塔骨干網(wǎng)絡)、頸部網(wǎng)絡(通道增強模塊和自適應特征池化)和檢測網(wǎng)絡(全連接層和分類層)三部分。骨干網(wǎng)絡的作用是通過多次卷積和合并從輸入圖像中提取特征圖。在骨干網(wǎng)絡中生成三層的特征圖,尺寸分別為:80 px×80 px、40 px×40 px、20 px×20 px。頸部網(wǎng)絡主要融合骨干網(wǎng)絡生成的不同尺度的特征圖,輸出新的增強特征圖,以獲得更多的上下文信息,減少信息損失。在檢測網(wǎng)絡中輸出物體的類別和邊界框的坐標信息,通過在原始輸入圖像中生成和標記這些預測邊界框和類別信息,最終實現(xiàn)車身車輪的檢測,從而得出輪軸識別結(jié)果。
3 試驗及其結(jié)果
3.1 試驗環(huán)境與訓練參數(shù)設置
在訓練階段,本文對輸入的貨車圖像使用的數(shù)據(jù)增強策略包括水平翻轉(zhuǎn),隨機剪裁。具體而言,本文以概率為0.5進行水平翻轉(zhuǎn),并且為特征提取骨干提供640 px×640 px×3 px大小的隨機剪裁圖像子塊。網(wǎng)絡的訓練以批次為8的條件下進行,并且,網(wǎng)絡使用SGD作為優(yōu)化器的條件下,初始學習率設置為1×10-2,權(quán)重衰減為5×10-4,學習率下降因子為0.2。在Pytorch中實現(xiàn)提出的模型算法,并使用單個NVIDIA GeForce Tesla V100 GPU進行了100個周期的訓練。
在測試階段,對圖像進行測試時增強。對每張輸入的圖像以概率為0.5做水平翻轉(zhuǎn)、以10%的調(diào)整閾值做對比度調(diào)整。從而得出多個子圖像。該輸入圖像的最終輪軸識別結(jié)果通過一定權(quán)重由各個子圖像的識別結(jié)果得到。
本文對所采集的貨車圖像,以隨機的方式分為訓練集(80%的圖像)和測試集(20%的圖像)。在網(wǎng)絡訓練的期間,只可見訓練集數(shù)據(jù)。網(wǎng)絡在ImageNet預訓練的條件下,根據(jù)訓練情況確定最后模型加載的權(quán)重,并使用測試集來評估最終性能。
3.2 試驗結(jié)果分析
針對該軸型識別方法,通過2個目標衡量檢測方法的性能,其中一項是檢測時間;另一項是模型的檢測準確度。檢測時間通過量化單張圖片處理的時長得出,檢測準確率則需要引入平均精度的概念。在本文所提出的軸型識別方法中,所需檢測目標類別為貨車的軸數(shù)。整體網(wǎng)絡的參數(shù)量、模型計算復雜度(GFLOPs)和檢測時間三項的測試結(jié)果如表1所示,滿足實時識別的要求。
針對使用了邊緣預加重以及圖像標準化的預處理方法進行訓練與不使用的訓練方式,本文也做了消融實驗對比,明細如表2所示。
在使用了邊緣預加重以及圖像標準化的預處理方法后,所消耗的訓練時間增加了5%,計算復雜度增加了5.7%,檢測時間增加了3.5%,平均精度值提高了1.52%。預處理策略在不增加過多網(wǎng)絡負擔的情況下提升了檢測精度,滿足了貨車軸型識別的高要求。
4 生產(chǎn)環(huán)境試運行結(jié)果
目前在羅城收費站入口治超車道已經(jīng)布設了該輪軸識別設備2臺。試運行日期為2023-11-01至2023-01-08。通行貨車1 771輛,共10輛貨車識別錯誤。識別錯誤項有掃路車專項二識別成貨二、水霧影響車身相機,皮卡識別成客一、六軸車因光線干擾導致圖像拼接異常問題識別成五軸等,軸型識別整體達到了99.43%的準確率。
5 結(jié)語
本文針對貨車軸型識別這一實際問題,提出了一種基于YOLOv5深度神經(jīng)網(wǎng)絡的貨車軸型識別方法。本文方法在實驗室環(huán)境以及生產(chǎn)環(huán)境上進行了驗證,結(jié)果表明,該方法準確率高,滿足實時檢測要求,具有良好的精度和穩(wěn)定性。
參考文獻
[1]GB 1589-2016,汽車、掛車及汽車列車外廓尺寸、軸荷及質(zhì)量限值[S].
[2]張 念,張 亮.基于深度學習的公路貨車車型識別[J].交通運輸工程學報,2023,23(1):267-279.
[3]李子龍,薛林軍,韓莉潔.基于激光雷達的動態(tài)汽車衡車輛軸型識別方法研究[J].衡器,2022,51(12):17-21.
[4]向 濤.基于壓電傳感器的路面移動荷載識別[D].杭州:浙江大學,2021.
[5]戰(zhàn)蔭澤,張立東,秦 穎.基于激光雷達與紅外圖像融合的車輛目標識別算法[J].激光與紅外,2021,51(9):1 238-1 242.
[6]He K,Zhang X,Ren S,et al.Deep residual learning for image recognition[C].In Proceedings of the IEEE conference on computer vision and pattern recognition,2016.
[7]李浩誼,馬春庭.基于改進的Scharr算法的海上艦船圖像邊緣檢測[J].艦船電子工程,2019,39(3):103-106.
[8]Liu S,Qi L,Qin H,et al.Path aggregation network for instance segmentation[C].In Proceedings of the IEEE conference on computer vision and pattern recognition,2018.
收稿日期:2024-03-25
作者簡介:鄭海軍(1977—),工程師,主要從事交通機電管理工作。