徐超 秦宇強
(太原科技大學計算機科學與技術學院 太原 030024)
關鍵字 交通標識牌;目標檢測;顏色分量;YOLO算法;注意力模塊
在無人駕駛與輔助駕駛領域中,車輛需要檢測和識別前方道路旁設立的交通標識牌,從而得到即將行駛的道路信息,對得到的信息進行相應判斷,安全通過道路。
現階段主要有兩種的交通標識牌檢測方法:一是傳統圖像處理方法。例如LI Wenju 等[1]提出的一種結合RGB 顏色空間和形狀輪廓空間的在復雜光照環境下的檢測交通標志牌的方法。二是基于深度學習的多種目標檢測算法進行交通標識牌的檢測。目前有Ou Z 等[2]提出了一種基于特征聚合多徑網絡實時的交通標志牌檢測方法,主要解決交通標識牌作為小目標難以檢測的問題。
在基于深度學習交通標識牌檢測的過程中,交通標識牌的類別的檢測是關鍵的一步,近幾年,涌現出的基于深度卷積網絡的目標檢測可以分為single-stage[3~5]和two-stage[6~7]兩種;基 于singlestage 的方法具有較快的檢測速度,而基于two-stage的方法需要產生許多候選區域,檢測速度較慢,但具有很高的準確率。
根據我國道路交通法律法規規定,將交通標識牌分為最多的警告標志、禁令標志、指示標志和少量的其他標志。本文的方法主要檢測警告類、禁令類、指示類交通標志牌。
由于禁令標志都是以紅色,警告標志都是以黃色,指示類以藍色作為標志的主要顏色,所以,通過圖像中標志的類別,可以將圖像最終轉換為其顏色分量特征圖。同時,為了減少光照和惡劣天氣對交通標識牌的顏色檢測,本文提出了RGBN 顏色空間。
Mahatme M B 和Kuwelkar M S[8]提出檢測目標有著鮮明的顏色特征,就可以依靠算法找到目標的顏色分量特征。因此,本文對算法改進,將分別對三種類型的標識牌,利用RGB 分量分別提取圖像中的紅、黃、藍顏色分量的像素點,獲得顏色分量特征圖。
通過式(1)將RGB 顏色空間的原圖像轉換為RGBN顏色空間。

式中R,G,B,R′,G′,B′表示通過公式轉換的前后三色分量。
基于機器視覺的交通標識牌檢測對準確率和實時性都有較高的要求。YOLO 算法是由Redmon J 等[9]提出具有在準確性和實時性都有較高的表現,可以完美適用于視頻中的目標檢測,因此本文以YOLO 算法中現階段最優的YOLOv3[10]網絡進行檢測。
深度學習中的注意力機制[11~12]從本質上講和人類的選擇性視覺注意力機制[13]類似,本質上也是在眾多的影響信息中挑選出關鍵的目標。
Woo S 等[14]提出了卷積層的注意力模塊(Convolutional Block Attention Module,CBAM),這個模塊分為兩個部分:通道注意力(channel)和空間注意力(spatial)。優點是可以和任何卷積網絡結構一起使用,不會增加額外的開銷。
2.4.1 通道注意力
如圖1,是一個通道注意力模塊(channel Attention Module)輸入特征F,分別進行空間的全局平均池化(AvgPool)和最大池化(MaxPool)得到兩個通道描述。再將它們分別送入一個兩層的神經網絡,共享網絡(Shared MLP)。最后,將得到的兩個特征相加后經過一個Sigmoid 激活函數得到權重系數Mc。

圖1 通道注意力模塊
2.4.2 空間注意力
如圖2,與通道注意力相似,空間注意力模塊(spatial Attention Module)給定特征F,先分別進行一個通道維度的平均池化和最大池化得到兩個通道描述。然后,經過一個7×7 的卷積層,得到權重系數Ms。

圖2 空間注意力模塊
2.4.3 CBAM結合YOLO
卷積層的注意力模塊(CBAM)是將空間注意力模塊和通道注意力模塊按照順序串聯。將CBAM 模塊分別嵌入YOLOv3 的Darknet53 的五個殘渣卷積塊(Residual block)[10],改進網絡。
本文實驗的計算機配置為CPU i5-9600kf,顯卡Gtx2080Ti,內存 16G,操作系統為 Ubuntu16.04。境Windows10,使用Matlab 進行仿真模擬實驗。
本次實驗數據共計20000 張,其中10000 張為CCTSDB 數據集[15]作為正樣本,10000 張非交通標識牌圖片作為負樣本。
3.2.1 實驗效果
通過使用訓練好的模型,在300 張實景拍攝的測試集下測試,測試結果如圖3。

圖3 實驗效果圖
測試結果表明,本文算法可以在自然環境下精確地檢測出中國三類交通標識牌。在此基礎下,本文設計了對比實驗來展示本文算法的綜合性能的提升。
3.2.2 對比指標
在目標檢測中常使用平均準確率mAP 做為檢測結果的評價指標。mAP 的計算依靠準確率和召回率,通過式(3)計算準確率和召回率。

式中,P和R表示需要的準確率與召回率。TP表示實驗結果中正樣本識別為正樣本的數量;FP 表示實驗結果中負樣本識別為正樣本的數量;FN 表示實驗結果中正樣本識別為負樣本的數量。
單類平均準確率AP 的計算是以召回率為x軸,準確率為y 軸,畫出P-R 曲線,計算曲線下的面積即為AP 值。包含N 個類別的測試集來說,根據式(4),得到平均準確率mAP。

3.2.3 對比分析
通過將本文的改進YOLO 算法與其他流行的算法在相同交通標識的數據集上進行橫向對比,使用IoU 為0.5 標準下的mAP,同時對比各個算法的FPS,對比算法的檢測速度。對比結果如表1所示。
表1 的測試結果表明,本文算法在同類檢測算法中取得了最好的檢測精度,同時也較好地保證了算法的實時性。

表1 對比結果
從實驗結果表明,本文利用顏色分量提取的三類交通標識牌的顏色分量特征圖,并且通過在YOLOv3 的殘渣卷積塊中嵌入CBAM 注意力模塊,改進YOLO 算法,用于自然場景下的交通標識牌檢測,在保證目標檢測的實時性的同時,提高了準確性。