基于輪廓特征的車牌英文和數(shù)字識別方法
王忠飛,陳元正
(浙江工業(yè)大學(xué) 特種裝備制造與先進(jìn)加工技術(shù)教育部重點實驗室,浙江 杭州 310014)
摘要:車牌字符識別是智能車牌識別系統(tǒng)中的核心部分,而車牌字符識別的關(guān)鍵在于提取有效的字符特征.字符的輪廓特征能很好地反應(yīng)字符圖像的局部和全局的結(jié)構(gòu)特征,在分析字符凹凸輪廓結(jié)構(gòu)的基礎(chǔ)上,定義了字符凹凸輪廓方向和圈,提出一種基于字符凹凸輪廓特征的字符識別方法.通過對字符凹凸輪廓背景賦值,標(biāo)記凹凸輪廓方向,提取字符不同凹凸輪廓方向的特征及輪廓特征個數(shù);根據(jù)字符輪廓特征及其個數(shù)可以對待識別字符粗分類識別;對未識別的字符提取局部特征分類識別.該方法不需要對待識別的字符進(jìn)行細(xì)化,計算量小,識別率高.經(jīng)實驗證實該方法識別效果較好.
關(guān)鍵詞:車牌字符識別;輪廓特征;凹凸特征
收稿日期:2015-03-24
作者簡介:王忠飛(1971—),男,河南南陽人,副研究員,博士,碩士生導(dǎo)師,主要從事機電系統(tǒng)控制技術(shù)、并聯(lián)機器人機構(gòu)及相關(guān)理論方面的研究,E-mail:wzf1225@hzcnc.com.
中圖分類號:TP391.4
文獻(xiàn)標(biāo)志碼:A
文章編號:1006-4303(2015)05-0522-05
Abstract:License plate character recognition is the centre part of Intelligence Vehicle License-Plate Recognition System, and the key to it is extracting character feature effectively. The outline feature of character can partly or wholly reflect the architectural feature of character, and based on the analysis of concave-convex outline structure of a character, defining the orientation and circle of concave-convex outline, which is a character recognition method based on the concave-convex outline feature. By assigning to the background of concave-convex outline of a character and marking the orientation of the concave-convex outline, the concave-convex outline orientation feature of a character can be extracted. Then the concave-convex outline orientation feature can be used to classify and recognize the character roughly. To the unrecognized character, local feature should be extracted before classify and recognize. With proposed recognition method, the process of thinning the character to be recognition can be moved, and the calculation is smaller, the recognition rate is higher.
Keywords:license plate character recognition;outline feature; concave-convex feature
Recognition method based on outline feature for alphabetic and
digital characters on vehicle license plate
WANG Zhongfei, CHEN Yuanzheng
(Key Laboratory of Special Purpose Equipment and Advanced Manufacturing Technology, Ministry of
Education, Zhejiang University of Technology,Hangzhou 310014, China)
車牌識別系統(tǒng)作為智能交通系統(tǒng)的核心部分,在城市道路交通、停車場和高速公路等車輛管理項目中顯得十分重要.隨著道路上行駛車輛數(shù)量不斷增加,使停車場和道路交通管理越來越棘手,對車牌識別系統(tǒng)的識別速度和識別率提出了更高的應(yīng)用需求,例如,車庫自動道閘系統(tǒng)對車牌快速識別需求,利用車牌作為機動車“身份證”,快速識別認(rèn)證車牌,可避免出入口停車取卡、還卡操作.車牌字符識別是車牌識別系統(tǒng)中最核心部分,輸入經(jīng)過車牌定位、字符分割后獲取的字符圖片,提取出字符特征,設(shè)計合理的字符分類器,輸出字符圖片的識別結(jié)果[1-3].
目前,我國車牌數(shù)字和字母字符的識別,最常用的是基于人工智能的神經(jīng)網(wǎng)絡(luò)算法和模板匹配算法兩大類[4].張旭蘭[5]對BP(Back propagation)神經(jīng)網(wǎng)絡(luò)參數(shù)優(yōu)化,改進(jìn)收斂性,改善BP神經(jīng)網(wǎng)絡(luò)對字符識別的應(yīng)用;郭榮艷等[6]采用改進(jìn)的神經(jīng)網(wǎng)絡(luò)進(jìn)行特征提取訓(xùn)練,提出基于分級網(wǎng)絡(luò)的車牌字符識別方法;NAGARE[7]結(jié)合BP(Back propagation)神經(jīng)網(wǎng)絡(luò)和LVQ(Learning vector quantization)神經(jīng)網(wǎng)絡(luò),建立混合神經(jīng)網(wǎng)絡(luò),提高字符識別率;陳瑋等[8]提出基于歐拉數(shù)的模板匹配,去除了模板匹配過程中冗余背景信息,改善某些相似字符的識別率.眾所周知:神經(jīng)網(wǎng)絡(luò)算法需要選擇大量可靠的訓(xùn)練樣本,面臨神經(jīng)網(wǎng)絡(luò)結(jié)構(gòu)設(shè)計及參數(shù)優(yōu)化等問題,模板匹配需要提取的特征維數(shù)多,計算量大,識別速度相對較慢,不能很好得滿足在線、快速識別車牌的需求[9-12].因此,很多學(xué)者熱衷于研究分析字符整體結(jié)構(gòu)特征,特征提取的過程中計算量小,字符識別速度快.胡金蓉等[13]基于字符的凹凸性、彎曲度和交點數(shù)等形狀特征,設(shè)計了一種字符形狀特征的車牌字符識別算法;MENG等[14]分析字符連通域的凹凸性和圈特征,提出一種基于字符連通域特征的車牌字符識別算法;宋加濤等[15]選用字符細(xì)節(jié)特征:三叉點,四叉點和筆畫端點,將筆畫中的拐點作為輔助結(jié)構(gòu)特征,閉合曲線作為字符的整體特征,構(gòu)造三級字符分類器.筆者基于字符凹凸輪廓結(jié)構(gòu)的分析,提出一種基于字符凹凸輪廓特征的字符識別方法,實現(xiàn)對凹凸背景區(qū)域快速賦值,根據(jù)背景值快速判斷字符輪廓特征,提取字符特征.筆者算法相較于字符結(jié)構(gòu)特征匹配的文獻(xiàn),計算量更少,識別率更高,能夠滿足在線、快速車牌識別系統(tǒng)應(yīng)用的實時性需求.
1字符輪廓特征提取
對車牌字符圖像歸一化和二值化預(yù)處理,字符圖片背景區(qū)域有兩種分布方式:一種是分布在字符筆畫內(nèi)部,即背景區(qū)域被字符筆畫包圍;一種是分布在字符筆畫外輪廓上,形成凹凸區(qū)域,前者稱為輪廓圈,后者稱為凹凸輪廓區(qū).因此,若字符圖像上一個區(qū)域為字符輪廓圈,則從該區(qū)域的任意一點出發(fā),向上、下、左、右4個方向作射線,則4條射線必定與字符筆畫區(qū)域相交;對于凹凸輪廓區(qū)域,從該區(qū)域的任一點出發(fā),向上、下、左、右4個方向作射線,至少存在一個方向不會與筆畫區(qū)域相交.
1.1圖像預(yù)處理
字符分割、字符識別和車牌定位是智能車牌識別系統(tǒng)中的三個重要組成部分.經(jīng)過分割后的字符通常大小不一,首先將待識別字符歸一化到15×30像素,其次,在RGB顏色空間上將其二值化[16].經(jīng)過預(yù)處理后的車牌字符圖片如圖1所示,其中白色部分為前景,黑色部分為背景.

圖1 字符預(yù)處理效果 Fig.1 The character pre-processing
1.2字符圖像背景區(qū)域賦值
字符的二值化圖像矩陣可以分為前景和背景兩部分,前景是字符筆畫區(qū)域,背景是非字符筆畫區(qū)域.字符前景像素取為1(或255,這里取1),字符背景像素取為0.從任意一個背景點向上、下、左、右4個方向作射線,經(jīng)過對字符輪廓分析,這些方向射線有的不會與字符的筆畫區(qū)域相交,直接到達(dá)圖像邊緣,而有的會與字符筆畫區(qū)域相交,.
設(shè)定背景像素點射線與筆畫相交取值規(guī)則:從背景點B出發(fā),向上、下、左、右4個方向作射線,且對4個方向的射線賦予屬性值,如圖2所示.背景點B的初值p=0,若4個方向的射線中存在與字符筆畫區(qū)域相交的射線,將相交射線對應(yīng)方向上的射線屬性值相加賦值給p.

18B24
圖2背景點4方向射線屬性值
Fig.2The four-way directional value of the background point
例如,背景點B1只有右射線與字符筆畫區(qū)域相交,則背景點B1的值p1=2;背景點B2的上、下、右射線與字符筆畫區(qū)域相交,則背景點B2的值p2=1+2+4=7.如圖3所示,對字符A和字符C處理后的結(jié)果.

圖3 A和C背景處理結(jié)果 Fig.3 The background result of character A and C
1.3字符輪廓圈特征的提取
由字符輪廓圈定義可知:該區(qū)域的點,4個方向的射線都與字符筆畫相交,字符背景圖像區(qū)域被字符筆畫圍繞.因此,若字符圖像連通域背景具有字符輪廓圈特征,則該字符背景區(qū)域上的任一像素點B的背景值p就為15.根據(jù)背景值可以提取字符輪廓圈的特征:提取字符背景值為15的連通域,并統(tǒng)計連通域個數(shù),即輪廓圈個數(shù).其中,背景值為15的連通域有完全被字符筆畫包圍和非完全被字符筆畫包圍兩種情況,前者如圖3中字符A背景處理結(jié)果所示,背景值為15的連通域只與字符筆畫區(qū)域相鄰;后者如圖3中字符C背景處理結(jié)果所示,背景值為15的連通域除了與字符筆畫區(qū)域相鄰?fù)?,還與值為13的連通域相鄰.因此,字符輪廓圈可分為輪廓真圈和輪廓偽圈,提取字符輪廓圈的算法步驟為:
1) 提取字符背景值為15的連通域.
2) 判斷背景值為15的連通域鄰接是否存在非字符筆畫區(qū)域,若存在,則該連通域定義為輪廓偽圈;若不存在,則該連通域定義為輪廓真圈,并分別統(tǒng)計輪廓偽圈和輪廓真圈的個數(shù).
1.4字符凹凸輪廓特性的提取
字符在輪廓上除了輪廓圈外,根據(jù)字符輪廓的凹凸位置,可以把凹凸區(qū)分為左凹凸、右凹凸、上凹凸、下凹凸、上左凹凸、上右凹凸、下左凹凸、下右凹凸8種.圖4中所示,B為目標(biāo)背景點,黑色填充區(qū)域是字符筆畫所在的區(qū)域,白色填充區(qū)域是非字符筆畫所在區(qū)域,從目標(biāo)背景點B向左、右、上、下4個方向作方向射線,除了向上的方向射線,其他方向射線都與字符筆畫區(qū)域相交,則該背景區(qū)域稱為上凹凸(圖4),同理可以定義字符的下凹凸,左凹凸,右凹凸,并且上凹凸、下凹凸、左凹凸、右凹凸所對應(yīng)B點的背景值p分別為14,11,7,13.

圖4 上凹凸輪廓 Fig.4 The up concave-convex outline
若在4個方向射線中,只有向下、向右射線與字符筆畫區(qū)域相交,則該區(qū)域稱為上左凹凸,同理可以定義字符的上右凹凸,下左凹凸,下右凹凸.并且上左凹凸、上右凹凸、下左凹凸、下右凹凸所對應(yīng)B點的背景值p分別為6,12,3,9.因此,可以根據(jù)背景值判斷該字符背景區(qū)域輪廓特征,如表1所示.

表1 字符背景輪廓特征
對于二值化圖像可以很容易得到背景區(qū)域矩陣,在背景矩陣中,即有輪廓圈,也有凹凸輪廓區(qū)域,通過分析,根據(jù)表1中字符背景值,可判斷字符輪廓是否存在字符背景值對應(yīng)的字符背景輪廓特征,并可統(tǒng)計該輪廓特征個數(shù).
2基于字符輪廓特征的分類識別
根據(jù)對字符輪廓特征的分析研究,可以提取待識別字符的輪廓特征,如表2和表3所示.其中24個英文字母(除去字母“I”和“O”)和0~9這10個阿拉伯?dāng)?shù)字,數(shù)字字符“1”可以根據(jù)其寬高比來識別.字符識別分兩步完成:1)根據(jù)字符輪廓特征及特征個數(shù),對待識別字符粗分類識別;2)對粗分類完成后未識別字符,采用其他字符特征進(jìn)行細(xì)分類.

表2 字符輪廓特征個數(shù)

表3 字符輪廓特征個數(shù)
根據(jù)字符不同輪廓特征及其個數(shù),對24個英文字母和0~9(除“1”以外)這9個阿拉伯?dāng)?shù)字識別分類.根據(jù)字符的輪廓真圈個數(shù)可以將待識別字符分為三個待識別字符子集:沒有輪廓真圈特征的字符子集、具有一個輪廓真圈特征的字符子集和具有兩個輪廓真圈特征的字符子集,利用字符輪廓偽圈和凹凸輪廓特征可以對字符進(jìn)一步分類識別.一個輪廓真圈字符識別流程如圖5所示,兩個輪廓真圈字符只有“8”和“B”,可通過輪廓左凹凸特征分類識別,無輪廓真圈字符識別流程如圖6所示.

圖5 單輪廓真圈字符識別流程 Fig.5 The process of identifying character which has only one true circle

圖6 無輪廓真圈字符識別流程 Fig.6 The process of identifying character which has no true circle
經(jīng)過字符輪廓特征的粗分類,字符A,E,F(xiàn),J,K,L,M,R,S,T,W,X,Z,1,2,6,7,9可以直接分類識別,剩余待識別字符C1~C6,共6個字符集,需要使用其他的字符局部特征處理識別.如表4所示,對待識別字符提取局部特征分類識別.

表4 待識別字符集識別策略
3實驗結(jié)果與分析
在eclipse開發(fā)環(huán)境下,對上述算法使用C++編寫了基于輪廓特征的車牌字符識別程序,在華碩A43SD筆記本電腦(Intel酷睿i5,2 450 M,2.5 GHz的CPU,8 GB內(nèi)存,ubuntu12.04操作系統(tǒng))上運行,在確保所抽取車牌覆蓋了所有英文字母和數(shù)字字符的前提下,隨機抽取500個汽車牌照,對3 000張字符圖片實驗測試,實驗結(jié)果如表5所示.從表5中顯示:筆者提出的車牌字符識別算法具有較高的識別率和較好的實用價值,并且整個字符識別的平均時間為20 ms/字符,識別效率較高.車牌原圖和正確識別字符圖片如圖7所示.

表5 實驗及相關(guān)文獻(xiàn)中的識別效果

圖7 車牌和正確識別字符 Fig.7 License plate and correct recognition characters
分析字符識別實驗結(jié)果發(fā)現(xiàn),圖像中存在的噪聲是影響字符識別率的主要原因,例如字符“8”的筆畫中若出現(xiàn)斷裂情況,影響字符輪廓特征的提取,導(dǎo)致無法識別該字符.同時,噪聲也容易引起字符筆畫出現(xiàn)粘連情況,破壞完整的字符結(jié)構(gòu)特征,使得提取的字符特征無效,并直接影響字符識別的準(zhǔn)確性.一些噪聲引起誤識和拒識字符圖片如圖8所示.實驗表明:筆者提出算法具有較高的車牌字符識別率,并且識別速度快.進(jìn)一步提高識別率的關(guān)鍵是加強字符圖像預(yù)處理,實現(xiàn)具有自適應(yīng)能力的數(shù)學(xué)形態(tài)學(xué)方法來消除字符筆畫噪聲的影響,并提高字符輪廓特征的魯棒性.

圖8 噪聲影響的字符 Fig.8 The noisy characters
4結(jié)論
在分析車牌英文字母和數(shù)字字符整體輪廓特征的基礎(chǔ)上,對字符背景凹凸輪廓進(jìn)行方向性標(biāo)記,快速提取出字符輪廓特征,對字符實現(xiàn)快速簡便的識別.方向性凹凸輪廓特征具有字符特征提取快速簡單,特征數(shù)據(jù)量小,形狀相似字符識別能力強等特點,能很好的滿足當(dāng)前高效、快速、在線的智能車牌識別系統(tǒng)的技術(shù)要求.以往在停車場、高速路口和工廠的自動道閘系統(tǒng)等管理中,需要在入口停車取卡、出口停車還卡等操作,在出入高峰時容易引起堵車,在線、快速識別車牌,且場內(nèi)自助繳費的需求非常強烈,筆者提出的算法能很好地滿足這一需求.
參考文獻(xiàn):
[1]CHANG S L, CHEN L S, CHUNG Y C, et al. Automatic license plate recognition[J]. IEEE Transactions on Intelligent Transportations Systems,2004,5(1):42-53.
[2]翟中,常慶麗,王永昆,等.改進(jìn)的車牌相似字符分級分類識別算法研究[J].計算機工程與設(shè)計,2013,34(4):1336-1340.
[3]DEDGAONKAR S G, CHANDAVALE A A, SAPKAL A M. Survey of methods for character recognition[J]. International Journal of Engineering and Innovative Technology,2012(1):180-189.
[4]WEN Y, YUE L, YAN J Q, et al. An algorithm for license plate recognition applied to intelligent transportation system[J]. IEEE Transactions on Intelligent Transportation Systems,2011,12(3):830-845.
[5]張旭蘭.基于BP人工神經(jīng)網(wǎng)絡(luò)的車牌字符識別優(yōu)化算法[J].計算機工程與應(yīng)用,2012,48(35):182-185.
[6]郭榮艷,胡雪惠.BP神經(jīng)網(wǎng)絡(luò)在車牌字符識別中的應(yīng)用研究[J].計算機仿真,2010,27(9):299-301.
[7]NAGARE A P. License plate recognition system using neural network[J]. International Journal of Computer Application,2011,25(10):36-39.
[8]陳瑋,曹志廣,李劍平.改進(jìn)的模板匹配方法在車牌識別中的應(yīng)用[J].計算機工程與設(shè)計,2013,34(5):1808-1811.
[9]ANAGNOSTOPOULOS C N, ANAGNOSTOPOULOS I E, PSOROULAS I D, et al. License plate recognition from still images and video sequences: a survey[J]. IEEE Transactions on Intelligent Transportation Systems,2008,9(3):377-391.
[10]許紅平.基于不變矩理論的字符串圖像識別方法研究[J].浙江工業(yè)大學(xué)學(xué)報,2007,35(2):210-213.
[11]呂剛,郝平.基于神經(jīng)網(wǎng)絡(luò)的數(shù)字驗證碼識別研究[J].浙江工業(yè)大學(xué)學(xué)報,2010,38(4):433-436.
[12]何通能,賈志勇.基于小波矩的車牌字符識別研究[J].浙江工業(yè)大學(xué)學(xué)報,2005,33(2):170-172.
[13]胡金蓉,周激流,王玲,等.一種新的基于字符形狀特征的高效車牌識別算法[J].計算機應(yīng)用研究,2010,27(6):2398-2400.
[14]MENG Q Y, HU H P, BAI Y P. A method of character recognition based on general characteristic and connected regions[C]//Multimedia and Signal Processing. IEEE International Conference on. Guilin, Guangxi:IEEE,2011:94-98.
[15]宋加濤,劉濟林.車輛牌照上英文和數(shù)字字符的結(jié)構(gòu)特征分析及提取[J].中國圖像圖形學(xué)報,2002,7(9):945-949.
[16]張引.基于空間分布的最大類間方差牌照二值化算法[J].浙江大學(xué)學(xué)報:工學(xué)版,2001,35(3):272-275.
(責(zé)任編輯:劉巖)