楊力川
(四川大學計算機學院,成都610065)
隨著私人汽車保有量不斷上升,交通標志的識別這一領域開始凸顯越來越大的影響力。交通標志識別是智能交通系統的重要內容,在無人駕駛和駕駛員輔助系統中具有重要的應用以及發展前景,并且為自動或半自動駕駛車輛提供有用的道路信息。
交通標志識別的內容主要有交通標志圖像檢測、特征的提取以及最后的分類。而在較為復雜的自然場景中,各種外部因素使得準確又較快地完成交通標志識變得有不小難度。
因此,在當下智能交通發展的趨勢下,需要借助更為科學和先進的工具來進行交通標志識別。交通標志識別的傳統方法在精確度和速率已經不足以達到當前無人駕駛系統的需求。而依靠圖像的顏色和形狀特征來匹配的方法固然簡單方便而且速度快,但識別率和精確度難以達到實際的要求。而基于深度學習的交通標志識別方法則不同,在識別目標的同時進行訓練,雙管齊下有效地提高了識別精度并且減少了耗費時間,能夠在復雜自然情況下較為有效地提高交通標志的識別正確率,成為交通標志識別的新興熱門領域。
交通標志識別是實現智能駕駛的重要一環。所謂的標志識別就是通過車內的攝像設備捕獲到的圖像信息,來對這些標志進行設別,然后再把這些信息反饋給駕駛員,做到及時提醒,進而保證行駛安全。例如,當駕駛員勞累、注意力分散、情緒波動、走神、或受到霧霾等外在自然因素,此時駕駛員依靠自己的肉眼不能快速并且準確獲得相關的交通標志信息,高效準確的交通標志識別技術就變得相當有必要。
隨著神經網絡和深度學習的發展,交通標志識別也開始運用相關的技術。卷積神經網絡(Convolutional Neural Network,CNN)是深度學習的核心部分。CNN在檢測性能和準確率方面都比傳統檢測識別有優勢,尤其是遇到復雜情況下的交通標志檢測,包括物體遮擋、拍攝角度、形狀改變、天氣因素之類的,在這些情況下進行交通標志識別仍然是目前研究的難點部分,還需要進一步的發展。
早期的交通標志識別方法基本大概由兩部分組成。一類是基于顏色、形狀視覺信息等進行識別,另外一類是基于特征提取與機器學習進行識別。
這類方法主要通過對目標圖像相關特征進行提取,進而把圖像中的交通標志志進行圖像分離并且檢測出來,接著進行分類,雖然這種方法的檢測速度比較快,但是正確率就相應的偏低。這種算法的核心是對圖像的顏色空間進行選擇,大部分顏色空間特征是RGB,當亮度發生變化時,就不能單一的選擇RGB,解決的方法也有很多。包括調整通道的比值或者是對RGB值進行處理,再或者將其轉至另外的顏色空間(HIS、HS等)中進行處理。
朱雙東等人[1]把圖像從RGB模型轉化成HSI模型,然后再從H通道值中提取出紅色,隨后用模板LOG提取邊緣,最后用BP網絡來對圖像進行處理。初秀平等人[2]將圖像從RGB顏色模型轉換到色度-飽和度-亮度的HSV顏色模型,并對圖像進行分割,最后在進行二值化處理。再例如Paclik等人[3]將目標從RGB模型轉為HSI模型,通過選擇合適的閾值來獲得所需的顏色,進而進行識別檢測。C.Y.Fanga等人[4]提出了一種依據人類的眼球結構的識別系統,通過對圖像的紅黃藍信息的提取來檢測,黑色和白色信息來識別。朱國康等人[5]針對圖像中的標志大小不一和位置不一定的情況,對目標的多種特征進行融合,他們先對樣本進行相應的預處理,再對圖像進行裁剪,提取相應區域的顏色,最后對顏色形狀等特征進行分類檢測,完成標志識別。這些根據顏色以及形狀特征的交通標志識別方法盡管在準確性方面進行了不少的優化,但是面對某些特殊情況,如標志受到破壞時,再使用這類方法的效果就不是很好,識別所需時間較長,效率偏低。
此類算法核心內容是抽取被訓練圖像中目標區域的特征,再對其進行訓練,將分類器進行特征匹配,來完成交通標志的識別工作。這種方法的難點在于找出那些最重要的特征,當無法準確判斷所需的特征是否滿足要求時,人們會偏向多取特征,甚至不做分析,將無用的測量值用作分類特征,造成的結果不僅是耗時,而且對結果造成巨大影響。這類方法需要先對測量值分析,獲得有效的特征識別,并且再保證一定分類精度下,減少特征的維數,讓分類器的分類變得快速準確且高效。
支持向量機(Support Vector Machine,SVM)是其中重要的一環,它在速度和準確率上都表現出令人滿意的一面,SVM分類器參與的檢測能夠滿足大部分基本的需求。張興敢等人[6]通過卷積變換獲得圖像的特征,其中輸入層采用滑動窗口計算卷積,接著把激活函數作為輸出,得到數個特征圖,單個特征圖也是由多個圖卷積得到的,這樣得到的實驗結果的準確率明顯提高。Creusen等人[7]通過有向梯度直方圖(HOG)算法針對大規模全景數據集上的交通標志檢測,該算法在特征向量中加入顏色信息進行擴展。而這一舉措顯著提高了檢測性能,HOG算法性能很高,此外,他們也提出了一種新的迭代向量機訓練模式處理圖片,優點是能夠降低內存消耗并且提高背景信息效率。
Huang等人[8]提出了一種由方向梯度變量直方圖(HOGv)和極值學習機(ELM)算法訓練分類器的檢測方法。提取的HOGV的特征在冗余和特定細節間有良好的平衡關系,而基于ELM的分類器又在輸入層和隱藏層之間實現隨機特征映射,帶來的好處就是不需要逐層調整,所以可以滿足大部分特征提取的精度要求。這幾種方法要進行分類識別需要分類器,效率并不是很高。
卷積神經網絡(CNN)作為深度學習的重要組成部分,在檢測識別領域獲得了許多成果,學者將其用于交通標志識別領域,讓這個領域進入一個新的里程碑。與上面兩種交通標志識別方法不同的是,CNN可以在訓練的同時提取特征,即一邊提取一邊訓練,雙管齊下,有效提高檢測和訓練效率,并且檢測性能上也不落后甚至更優于傳統交通標志識別。Schmidhuber等人[9]運用CNN識別交通標志,得到了非常高的正確率。其正確率達到99.46%。他們使用了一個快速的,完全參數化的GPU實現的深度神經網絡。在監督學習下,訓練了不同組合而成的單個多列,再一次地提高了識別正確率,并且也降低了對光照以及對比對變化的敏感度。Jin等人[10]則通過一種鉸鏈損失隨機梯度下降(HLSGD)方法訓卷積神經網絡(CNN)。HLSGD經過評估,具有更快和更穩定的收斂性,最好的結果是有99.65%的識別率,具體是通過編寫一個圖形處理單元包來訓練多個CNN并集成最終分類器。Ren等人[11]提出依賴候選區域算法(RPN)的檢測網絡,共享完整的圖像卷積特征,從而實現了近乎無成本候選區,并且把相關過程放在GPU上運行,在目標檢測領域達到了很高的檢測正確率和較快的速度。伍曉暉[12]則從小目標交通標志識別入手,在精度方面在已有的Tiny-YOLOv3交通標志檢測算法上進行了改進,加深特征金字塔圖層,具有比較好的魯棒性。并且增加網絡的寬度和深度,用批量歸一化處理樣本,再一次提高原網絡的精度。
雖然基于深度學習的目標檢測方法在國內外已經取得不少的成果,但是將這類方法還沒有大規模使用,還有很大發展空間。
本文介紹了基于深度學習的交通標志識別相關的研究和技術,解釋了其技術的核心內容,并舉出傳統交通識別的相關研究,對比分析,剖析其優缺點。在深度學習、神經網絡出現后,在目標檢測和識別方面有巨大優勢,交通標志識別也因此向前邁進了一大步。隨著越來越多的目光投向這個領域,基于深度學習的交通識別適用面也越來越廣,研究人員對其中神經網絡的優化工作也越來越重視,識別的準確率也就越來越高。相信在不久之后,基于深度學習的交通標志識別會廣泛應用,無人駕駛和自動駕駛也就更進一步了。