彭 洋,汪孟杰
(1.武漢理工大學 計算機科學與技術學院,湖北 武漢430070;2.武漢理工大學 汽車工程學院,湖北 武漢430070)
隨著經(jīng)濟的發(fā)展,汽車已經(jīng)普及到千家萬戶。作為汽車最直觀的識別標志,車牌識別技術也成為了研究熱點問題。通常情況下,車牌識別分為車牌定位、字符分割、字符識別三個主要步驟。由于車牌字符間距較小,區(qū)別度較小。目前車牌識別技術已經(jīng)廣泛運用于停車場、高速公路收費站等場所。但由于拍攝環(huán)境和拍攝角度多變,基于全連接神經(jīng)網(wǎng)絡的車牌識別需要大量的訓練數(shù)據(jù)提取特征,而且性能不穩(wěn)定。而最近幾年興起的基于卷積神經(jīng)網(wǎng)絡的字符識別方法相比于傳統(tǒng)字符識別技術,能夠克服字符識別率較低、識別速度慢等技術困難,其識別率可達到99.7%。
卷積神經(jīng)網(wǎng)絡具有局部連接、權值共享、下采樣三大特性[1]。局部連接即在進行圖像識別時,不需要處理整個圖像,只需要關注圖像中某些特殊的區(qū)域,在識別車牌時,按照不同的特征將車輛分成不同的區(qū)域,這樣就可以只關注車牌區(qū)域,使處理圖像的時間和效率大大提高。卷積層的另一大特征是權值共享,一個[i][i]的卷積核,則一共有i*i個參數(shù),而通過權值共享,則能夠分區(qū)域進行卷積,檢測到相同的特征,不同的卷積核會有不同的權值參數(shù),每個參數(shù)用來訓練不同的特征。卷積神經(jīng)網(wǎng)絡三大特性如圖1所示,使用權值共享的方法,總共產(chǎn)生了[i]個不同的權值參數(shù),而局部連接則會產(chǎn)生[j]個參數(shù),那么總共有i*j個參數(shù),使用權值共享的方法后,僅僅需要i個權值,更進一步地減少了參數(shù)的數(shù)量,使訓練的時間和效率進一步提高。而下采樣則使圖像變小,但并不會影響圖像識別,處理得更加方便。
車牌定位主要分為基于圖形圖像學的定位方法和基于機器學習的定位方法。依靠圖形圖像定位的方法,在識別時,外界會有很多干擾圖形、干擾顏色和干擾邊緣,而傳統(tǒng)的濾波方法很難消除圖形圖像干擾,因此使用基于圖形和圖像的定位方法時,很容易造成定位失敗,假如給一個處理該誤差的算法,那么會選定很多非車牌區(qū)域,處理速度慢,難度大?;跈C器學習的定位方法分為基于特征工程的方法和基于神經(jīng)網(wǎng)絡的定位方法,前者訓練車牌識別時速度和效率都很低,所以基于神經(jīng)網(wǎng)絡的定位方法則是目前主流的定位方法?;谏窠?jīng)網(wǎng)絡的定位方法可以分為全神經(jīng)網(wǎng)絡和卷積神經(jīng)網(wǎng)絡,相比于全神經(jīng)網(wǎng)絡,卷積神經(jīng)網(wǎng)絡具有的局部連接、權值共享、下采樣三大特性,使得圖像識別和定位的效率大大提高。由于卷積神經(jīng)網(wǎng)絡具有平移不變性,在學習過程中可以輔以候選區(qū)域,并對候選區(qū)域進行分類。正確分類的候選區(qū)域即為目標定位的位置。此類方法有較多實現(xiàn)模型,如RCNN、faster-RCNN、SSD等[2]。

圖1卷積神經(jīng)網(wǎng)絡三大特性
在進行車牌字符識別時,通過百度AI實訓平臺——AI Studio進行識別訓練。首先,導入characterData.zip文件夾,里面包含了0~9、A~Z以及各省簡稱。由于國內(nèi)沒有公布車牌信息的網(wǎng)站,所以在采集信息進行訓練時,對0~9、A~Z、各省簡稱字符分割,方便對車牌上的字符進行重組,以便進行大量的訓練。車牌字符分割如圖2所示。
字符分割之后,便開始對字符進行識別訓練。訓練步驟如下:①查看當前掛載的數(shù)據(jù)集目錄,該目錄下的變更重啟環(huán)境后會自動還原;②導入需要文件包;③解壓原始數(shù)據(jù)集,將src_path路徑下的zip包解壓至data/dataset;④生成數(shù)據(jù)列表并存放所有類別的信息;⑤對車牌圖片進行處理,識別出車牌中的每一個字符并保存。模型的訓練結果如圖3所示,識別無誤。

圖2車牌字符分割圖

圖3模型的訓練結果
基于卷積神經(jīng)網(wǎng)絡的車牌識別技術優(yōu)勢之一是可以高速、高效率地進行大量模型訓練,在對分割字符進行上萬次的排列組合后,也進行了上萬次的訓練識別[3]。累積訓練時間如圖4所示,從中可以看出,隨著訓練次數(shù)的增多,識別的速度也逐漸增大,在經(jīng)過上千次的訓練之后,幾乎可以準確無誤進行高速識別。訓練累積識別失誤率如圖5所示,可以看到,隨著訓練次數(shù)的增加,車牌識別的失誤率在慢慢降低,最后幾乎可以達到零失誤。
本文基于卷積神經(jīng)網(wǎng)絡算法對車牌信息進行識別,通過百度AI實訓平臺——AI Studio進行識別訓練,相較于傳統(tǒng)的車牌識別方法,不需要對干擾圖形和干擾顏色進行濾波,卷積神經(jīng)網(wǎng)絡算法在車牌定位、字符分割、字符識別方面都有著十分高的效率[4]。而卷積神經(jīng)網(wǎng)絡通過大量的訓練,識別速度和識別準確率等方面得到很大提高。而目前存在的問題就是無法獲得較多實際車牌信息,無法得到切合實際的訓練效果,但是由于本文在字符切割進行了高效率的處理,因此在字符切割方面不存在過大的問題。

圖4累積訓練時間

圖5訓練累積失誤率