黃尚安,董超俊,林庚華,甄俊杰
(五邑大學智能制造學部,江門 529020)
近年來,交通標志識別技術(TSR)越來越受到關注,因為這是駕駛員輔助系統(ADAS)和自動駕駛汽車領域的一個關鍵技術。在真實的自然場景下,交通標志識別的傳統方法會面臨許多艱難的挑戰,并且交通標志的正確識別直接影響到車輛的安全駕駛,這都對我們的研究提出了更加嚴格的要求。
本文側重于研究交通標志的檢測算法,現有的關于交通標志檢測的算法可以大致分為三類:①Violajones的方法[2];②基于顏色和形狀模型的方法[3];③基于梯度方向直方圖(HOG)和支持向量機(SVM)的方法[4];④基于CNN卷積神經網絡的方法。
Viola-jones使用AdaBoost算法訓練一系列二進制線性分類器,然后在測試圖像中執行滑動窗口對交通標志進行檢測,對分類器具有最高響應的窗口位置被視為檢測到的標志位置;對基于模型的方法,其首先使用顏色和形狀特征來檢測圖像中的邊緣,然后將邊緣連接起來形成規則的多邊形或者圓形,通過霍夫圓變換來進行模板匹配;基于方向梯度直方圖(HOG)的方法,從圖像單元中提取產生高性能的HOG特征,然后在多個單元上集合成塊,在這些HOG特征上使用線性或非線性分類器作為檢測器進行訓練,最后得到檢測結果。對于CNN的方法即是建立卷積神經網絡的結構,通過訓練網絡,最后能夠使網絡獲得檢測交通標志的能力。
對于前面三種傳統方法來講,算法復雜度高;檢測使用的數據集較為專一;檢測精度受天氣等自然場景的影響較大。故本文選擇第四種基于CNN卷積神經網路的方法來研究交通標志的檢測問題,CNN是當下最流行的圖像檢測和分類的方法。CNN對于目標檢測的方法大致分為兩類:第一類是基于區域推薦的目標檢測算法,以 R-CNN[5]、Fast R-CNN[6]、Faster R-CNN[7]算法為代表;第二類是基于回歸的目標檢測算法,以YOLO[1]、SSD[8]算法為代表。對于第一類基于區域推薦的算法,其首先預選出推薦區域,即找出感興趣區域再來做特征提取。其算法擁有較高的檢測精度,但是處理速度太慢;對于第二類基于回歸的算法,其建立默認框、真實標簽框、預測框之間的關系進行訓練。其算法實時性好,檢測精度高,但是對于交通標志這樣小目標檢測的結果卻不甚滿意。
本文選擇研究基于YOLO模型的交通標志檢測問題,研究目標即是提高YOLO模型對交通標志這樣小目標的檢測精度,并且希望本文改進的方法對其他小目標的檢測都能有一定的借鑒作用。
首先介紹一下原YOLO[1]模型:YOLO模型采用一個單獨的CNN模型實現端到端的目標檢測,其首先將輸入圖片調整到448×448,然后送入CNN網絡,最后處理網絡預測結果得到檢測的目標。相比R-CNN算法,YOLO是一個統一的框架,其速度更快,而且YOLO的訓練過程也是端到端的。YOLO采用卷積網絡來提取特征,然后使用全連接層來得到預測值。網絡結構包含24個卷積層和2個全連接層,對于卷積層,其主要使用1×1的卷積來做減少通道數的運算,然后再緊跟3×3的卷積,網絡結構如圖1所示。
在一幅含有交通標志的圖像中,與圖像中其他物體例如汽車、行人、建筑物等相比,交通標志相對較小。為了更加準確的檢測交通標志,本文提出了一種特征轉移連接(Feature Transfer Connection)的方法來改進原YOLO模型。特征轉移連接(FTC)的核心思想是將卷積神經網絡結構中高層和低層的特征進行有效的聚合,可以聚合來自不同的多尺度特征,所提方法的框架如圖2所示。
如圖2所示,黑色框表示YOLO模型的原始架構,藍色框表示提出的特征轉移鏈接(FTC)的方法。該模型在每次下采樣操作(C1-C5)之后應用FTC的方法以收集聚合不同比例級別的特征。

圖2
FTC是一種特殊的卷積層,對圖1中所示的每一個FTC卷積層來說,其卷積核的大小、步長都是不一樣的。接下來詳細說明FTC卷積層的計算公式:在FTC的卷積層中,用“a×a”表示FTC卷積層的卷積核大小,“b”表示FTC卷積層的通道數,“d”表示FTC卷積層的步長。FTC卷積層相關系數的計算公式如下所述:

上述式中m和n是FTC卷積層輸入特征圖的寬度和高度,o和p是C6卷積塊輸出特征圖的寬度和高度,c是C6卷積塊輸出特征圖的通道數。在FTC卷積層的操作之后,我們通過使用元素求和的方法來聚合空間信息,將多尺度的特征聚合為C7的輸入,如下所述:

圖1

上述式中 fx表示卷積層C7的輸入特征,Σ和⊕表示元素加法的求和,fCY表示CY的輸出特征,Y表示卷積塊的級別。
在我們的實驗中,YOLO網絡模型中的損失函數和所有參數(即每層中的內核數量,每個圖像中單元格的大小還有激活函數等)都設置為默認值,如YOLO模型的原始工作[1]。本文提出的模型和YOLO模型都在公共交通標志數據集MASTIF[10]上進行訓練和評估,MASTIF數據集包括:TS2009、TS2010和 TS2011。我們在具有 Intel Core i7-7700k CPU,16 GB RAM和NVIDIA GeForce GTX1080 GPU的計算機上做實驗。
如圖3所示,所提出的方法可以很好地檢測不同尺寸、角度和位置的交通標志。特別是對于較小的交通標志,相對于原模型,改進的YOLO模型能夠很好地將交通標志檢測出來,較好的解決了原YOLO模型對交通標志這樣小目標漏檢的問題。改進的模型和原模型的具體數據比較如表1所示。

圖3 左:原YOLO模型,右:改進的YOLO模型

表1 原模型和改進YOLO模型的精確度對比
在本文中,我們提出了一種針對交通標志檢測的多尺度特征聚合和空間傳播的網絡模型。我們的實驗表明,所提出的方法優于原網絡模型,并對小交通標志的檢測獲得了令人滿意的效果。所提出的特征轉移連接確實提高了模型對不同尺寸目標對象的檢測性能。在未來,希望我們的方法可以對更廣泛的對象和數據集進行更深層次的研究。