田潤 魏志剛 劉明錚


摘要:交通標志在日常生活中起著重要作用,如何利用視覺輔助技術識別交通標志已經成為當前智能交通領域的熱點問題。本文將深度學習技術中的卷積神經網絡算法應用于斑馬線的識別研究。基于ResNet34結構[1]構建卷積神經網絡,并在此基礎上設計了用于識別斑馬線的二分類器。通過實驗驗證,本文方法的識別精度可達到93%,平均識別速度在0.1s以下。
關鍵詞:卷積神經網絡;智能交通;深度學習
中圖分類號:TP391.41 文獻標識碼:A 文章編號:1007-9416(2019)02-0081-02
0 引言
隨著公路交通的發展,路況更加復雜,交通事故發生的頻率也在不斷上升,視覺輔助技術在交通安全領域中得到了廣泛關注。作為重要的交通標志之一,斑馬線的識別是交通視覺輔助設備研究的重中之重。識別斑馬線的方法有很多種,目前應用最多的是雙極系數法,即對道路圖像進行分塊,再根據斑馬線的灰度特征進行識別。然而,這種方法受制于其分塊方式,分塊的大小將直接影響識別的準確度。本文提出了一種基于卷積神經網絡檢測斑馬線的新方法,能夠快速識別斑馬線所在的區域,從而避免了分塊方式問題。在識別出斑馬線的范圍后,再利用卷積神經網絡不斷提取,縮小圖像特征,從而實現對斑馬線的準確識別。
1 卷積神經網絡的基本理論
卷積網絡[2]是是深度學習模型中的一種,具有稀疏連接、參數共享、等變表示等特點,這使參數更少,存儲空間更小,計算效率更高,同時能夠對圖像的平移翻轉保持不變性。卷積網絡的權值共享結構,可以大幅度減少神經網絡的參數量,防止過擬合的同時,又降低了網絡模型的復雜程度,在較深的網絡模型中,能夠達到很好的泛化能力。
卷積神經網絡是一個多層前饋神經網絡,它的基本結構是輸入層、激勵層、卷積層、池化層、全鏈接層以及輸出層。卷積神經網絡能夠構建多個提取特征的濾波器,通過對輸入的數據進行逐層的卷積和池化來提取數據的結構特征,最后將這些特征輸入全鏈接層進行整合,并且通過某種激活函數來解決分類和回歸問題。
2 卷積神經網絡的構建
本文采用卷積神經網絡中的ResNet34結構來檢測圖片中是否含有斑馬線,如圖1所示,包括33個卷積層,1個全連接層。其中,除第一個卷積層中卷積核的尺寸為7×7之外,其余32個卷積層中卷積核的尺寸均為3×3。在每兩個卷積層中插入了一個快捷鏈接,每一層卷積后的圖像參數通過快捷鏈接后,再與殘差求和即可得到輸入到下一卷積層的參數。將所有的卷積層分成四組,每經過一組,特征矩陣的尺寸就會縮小一倍,同時下一組的每個卷積層中的卷積核的個數加倍。全連接層中的每一個結點都與最后一個卷積層的所有結點相連,將之前提取到的特征綜合起來,其具有1000個輸出參數。為達到圖像中斑馬線識別的2分類目的,在全連接層后接入一個具有2個輸出的softmax分類器。
3 卷積神經網絡的訓練及實驗驗證
3.1 數據集準備及預處理
在訓練及測試網絡模型過程中,樣本集來源于浙江大學江凱巍課題組,樣本總量為4100。訓練模型過程中將樣本集分為訓練集、驗證集和測試集,分別占樣本總量的60%、20%和20%。為了增強模型的健壯性,需要對訓練集和驗證集中的數據進行數據擴充[3]。本文采用的方法為:(1)圖像的豎直翻轉;(2)按照寬度對圖像伸縮;(3)對圖像進行顏色增強。
在開始訓練之前,在訓練集中選取一小部分圖片計算每個像素點的平均值和標準差,并對所有的輸入圖片進行標準化處理。另外,ResNet34網絡輸入的圖像尺寸為224×224,因此在訓練過程中,輸入網絡的樣本均為從原圖片中隨機切割的224×224的區域。
3.2 模型訓練及實驗
訓練過程中采用批量梯度下降算法進行參數更新,批量大小為256。為避免出現損失函數無法收斂的情況,在梯度下降的基礎上增加了沖量Momentum,取經驗值0.9。另外,為防止模型過擬合,在計算損失函數時依據權重值添加了一個懲罰項,即權重衰減,經多次實驗,取值為0.3。模型訓練后,通過測試集對本文方法進行實驗,由實驗結果可知,本文方法對于圖像中斑馬線識別的準確率達到93.2%,平均檢測速度在0.1s以內。部分實驗結果如圖2所示,其中Predicted:1代表識別圖像中含有斑馬線,Predicted:0代表識別圖像中不含斑馬線。
4 結語
本文基于深度學習算法對斑馬線的識別方法進行研究,采用ResNet34結構卷積神經網絡構建了用于識別斑馬線的二分類器。通過實驗驗證,本文方法的識別準確率可達93.2%。與傳統的機器學習方法相比,由于卷積神經網絡能夠自動生成檢測區域,省去了圖像預處理過程,大大減少了計算量,使圖像處理的速度較之傳統算法有了明顯的提升。
參考文獻
[1] 徐培超,陳雯柏,陳祥鳳,韓琥.多任務及Resnet網絡在人臉多屬性識別中的應用[J].小型微型計算機系統.2018(12):2720-2724.
[2] 孫旭,李曉光,李嘉鋒,卓力.基于深度學習的圖像超分辨率復原研究進展[J].自動化學報,2017(05):697-709.
Traffic Sign Recognition Method Based on Deep Learning
TIAN Run,Wei Zhi-gang,LIU Min-zheng
(Civil Aviation University of China,Tianjin? 300300)
Abstract:Traffic signs are vital to our daily life, and how to discriminate them with the help of Visual Aided Technology has came to an hot topic. Thus, in this paper, well use convolutional neural network based on deep learning to recognize the zebra crossing. Weve constructed an convolutional neural network based on the ResNet34 structrue, and designed a binary classifier which relys on this network. After being tested, the accuracy of this paper can reach in 93 percent, and the average speed of recognition is below 0.1 second.
Key words:convolutional neural network;intelligent transportation;deep Learning