郭 磊,呂 鑫
(安陽師范學院 計算機與信息工程學院,河南 安陽 455000)
基于復合特征BP神經網絡算法的車牌識別技術研究
郭 磊,呂 鑫
(安陽師范學院 計算機與信息工程學院,河南 安陽 455000)
傳統的模板匹配算法對車牌圖像的伸縮、傾斜及背景干擾比較敏感,識別效果不理想。提出將對字符進行歸一化處理后所提取的點特征與重心特征進行復合,作為BP神經網絡算法的輸入特征,大大提高了識別率與識別速度。
BP神經網絡;神經元;點特征與重心特征;權值
車牌識別系統工作在室外環境,拍攝的圖像易出現變形失真,且分辨率低、易受各種因素干擾。車牌字符識別的典型方法是基于模板匹配的識別方法,但模板匹配法對車牌圖像的伸縮、傾斜及背景干擾比較敏感,識別效果不理想。本文提出,將對字符進行歸一化處理后所提取的點特征與重心特征進行復合,作為BP神經網絡算法的輸入特征。大大提高了識別率與識別速度。
BP(Back Propagation,前向反饋)神經網絡通常是指基于誤差反向傳播算法的多層前向神經網絡。BP網絡由輸入層、隱層和輸出層三層構成,相鄰層之間的神經元全部連通,但,同一層中的神經元不連通。如圖1所示。
圖1結構為典型的只有一個隱層的三層BP神經網絡。其中輸入層神經元(Input Layer Neuron,ILN)為N個,對應輸入為X0、X1…XN-1;輸出層神經元(Output Layer Neuron,OLN)為M個,對應輸出為Y0、Y1…YM-1;隱層神經元(Hidden Layer Neuron,HLN)為L個。輸入層神經元到隱層神經元的權值為Vij(0≤i<N,0≤j<L);隱層到輸出層神經元的權值為Wij(0≤i<L,0≤j<M)。
進行神經網絡設計的首要任務就是網絡結構的確定,一般情況下,網絡結構的設計包括:I/O神經元個數、隱層個數、隱含層中神經元數目以及每層傳遞函數的確定。
1.1 I/O神經元個數的確定
輸入層神經元個數根據待識別字符所提取的特征向量維數所確定。在本研究實驗中,車牌字符歸一化為32× 16點陣大小,以每一個字符像素點為一個網格,根據提取出的點特征及重心特征基礎數據,得到一個568維的特征向量,所以,輸入層神經元個數取568個。
神經網絡輸出層神經元個數由設計網絡時所采用的輸出表示和決策規則所確定。在理論上,對于一個K類分類問題,對K個不同類的整個輸入空間,我們需要K個輸出表示所有可能的分類決策,當設計神經網絡作為模式分類器時,典型的方法是以模式樣本和它的類別標記做訓練,從而采用“K中取1”的方式來表示目標向量。因此,神經網絡輸出層神經元的數目就是待識別的類別數K,神經網絡輸出層的每一個神經元就代表一個目標種類。由于車牌中所含字符分為字母與數字兩類,所以,本車牌識別BP神經網絡也分為兩類:數字網絡、字母網絡。由于數字網絡中只涉及到0-9十個數字,所以,數字網絡的輸出層神經元為10個;而由于字母網絡中只涉及到A-Z,這26個大寫字母,所以,字母網絡的輸出層神經元個數為26。
1.2 隱層數的確定
雖然具有多個隱層的前向神經網絡更易于學習,在處理模式識別領域的問題時更能適應平移、旋轉或其它變換的不變性,但由于存在著較多的神經元節點和連接權值,因而需要更多的調整與運算,計算量較大,并且劃分空間過細容易導致網絡的歸納與泛化能力下降。實驗證明具有多個隱層的網絡更易于陷入局部極小值中。并且,Kolmogorov定理[1]表明,具有單隱層的三層神經網絡足夠執行任意復雜的函數映射。因此,一般在沒有特定的理由要求使用多個隱層時,僅僅使用一個隱層進行處理是最簡單的。而本實驗的兩個神經網絡所處理的都是小類別的分類問題,基于此,本設計采用具有一個隱層的三層BP神經網絡結構。
1.3 隱層神經元個數的確定
從理論上講,隱層神經元數量越多,網絡越能精確地逼近給定的函數[2]。但隨著隱層神經元的數目增加達到一定程度時,計算的復雜度增加,網絡訓練的收斂速度將降低。太少的神經元數目,在訓練網絡時可能會陷入局部極小點[3];太多的神經元數目,又會使網絡的訓練時間過長,而且效果也不好。目前對多層前饋神經網絡的隱層神經元數目的確定并沒有一個公認或統一的理論作指導[4]。在實際的設計過程中,只有根據以往的經驗及實際問題情況,對大量的試驗結果進行分析、比較,才可能找到一個較好的確定解。經過大量實驗并參考其他學者的研究結果,本實驗采用了公式(1)所得到的隱層神經元個數較符合要求:式中,HLN表示隱層神經元個數,ILN表示輸入層神經元的個數,OLN表示輸出層神經元的個數。根據2.1所述,輸入層神經元個數為ILN=568,數字網絡輸出層神經元個數OLN =10,字母網絡輸出層神經元個數ONL=26。由此計算出,數字網絡的隱層神經元個數HLN=79,字母網絡的隱層神經元個數HLN=124。
BP神經網絡是采用誤差反向傳播算法對網絡權值進行訓練的多層前向網絡,其最大特點就是網絡的權值是通過使網絡輸出和樣本輸出之間的誤差平方和達到期望值而不斷調整訓練出來的。
2.1 能量函數及權值修正公式
神經網絡的誤差反向傳播過程即它的權值修正過程,通過調整權值和閾值,使當能量達到最小時,網絡趨于穩定狀態。根據BP神經網絡算法原理[5],確定出網絡能量函數,即誤差函數為
其中,Ep表示樣本p的輸出誤差,dp表示樣本p的期望輸出,op表示輸出層神經元的實際輸出。則,N個樣本的總誤差為
根據能量最小原則,推導出權值修正公式為
2.2 訓練過程
對于BP神經網絡,按照上述的權值修正公式來進行調整網絡的權值進行學習訓練,當系統的能量達到最小時,網絡趨于穩定狀態,學習結束[6]。
(1)初始化。將權值、閾值初始化為0到1之間的隨機值;
(2)樣本輸入與期望輸出。從樣本組中取出輸入向量X=(x0,x1,…,xN-1)輸入網絡,指定期望輸出向量為D=(d0,d1,…,dM-1);
(3)計算中間層輸出與實際輸出。中間層輸出向量為H=(h0,h1,…,hL-1)和網絡實際輸出向量為Y=(y0,y1,…,yM-1);
(4)計算實際輸出與期望輸出的誤差:
(5)計算中間層誤差:
(6)調整權值,其中,η為學習因子:
以上過程,就是一次完整的訓練過程。用所有樣本反復訓練網絡,多次迭代,直到權值達到穩定。實際訓練時,定義出反映實際輸出與期望輸出誤差平方和的價值函數,如公式(2)所示。再定義收斂規則:
其中,p為訓練樣本數,ε為給定誤差范圍,當E<ε時,結束訓練。經過訓練的BP神經網絡就可以工作了,對某一個輸入可以讓它認知,達到識別的效果。
本次實驗主要是對以下兩種情況進行了對比:
(1)根據粗網格特征提取的基礎數據,使用BP神經網絡進行的車牌字符識別情況(簡稱粗網絡BP)。
(2)根據點特征及重心特征提取出的基礎數據,使用BP神經網絡進行的車牌字符識別情況(簡稱復合BP)。
本實驗所使用的字符樣本分別為:字母E和數字3。各取樣本300幅。部分識別情況如表1和表2所示。
在字母E的300幅樣本中,如果是采用粗網格特征作為特征向量輸入BP神經網絡,識別正確幅數為236,識別錯誤64幅,識別率為78.67%;若是采用點特征與重心特征作為特征向量輸入BP神經網絡,識別正確幅數為259,識別錯誤41幅,識別率為86.33%。如表3所示。
在數字3的300幅樣本中,若是采用粗網格特征作為特征向量輸入BP神經網絡,識別正確幅數為254,識別錯誤46幅,識別率為84.67%;如果是采用點特征與重心特征作為特征向量輸入BP神經網絡,識別正確幅數為273,識別錯誤27幅,識別率為91.00%。如表3所示。
采用點特征與重心特征的復合特征作為特征向量輸入BP神經網絡對車牌字符進行識別時,具有比較高的識別率。其局限性的在于,對于待識別字符比較多及對漢字的識別結果并不令人滿意。
[1] 蔡義發.神經網絡計算機系統及其現狀[J].計算機科學, 1990(2):30-32.
[2] 雷鳴,朱心飚,尹申明,楊叔子.自構形神經網絡及其應用[J].計算機科學,1994(1):52-54.
[3] 孟祥武,程虎.優化神經網絡結構[J].計算機研究與發展,1997(8):594-598.
[4] 劉建英,徐愛萍.自組織神經網絡在模糊聚類中的應用研究[J].微機發展,2005(12):81-84.
[5] 孫功星,戴貴亮.神經網絡設計的特征空間序貫劃分算法[J].計算機科學,2003(11):36-37.
[6] 王明會,潘新安,鐘義信.用分組神經網絡識別手寫體數字[J].北京郵電大學學報,1993(4):12-15.
(責任編輯、校對:田敬軍)
Study on Vehicle License Plate Recognition Based on Hybrid Feature BP Neural Network Algorithm
GUO Lei, LV Xin
(School of Computer and Information Engineering, Anyang Normal University, Anyang 455000, China)
The traditional template matching algorithm is sensitive to the stretching, tilt and background interference of vehicle license plate images, but the recognition result is not satisfactory. In this paper, through normalization processing of characteristics, the point feature and barycenter feature extracted are composted, as the input feature of BP neural network algorithm. The method greatly improved the recognition rate and recognition speed.
BP neural network; neurons; point feature; barycenter feature; weight
TP399
A
1009-9115(2012)02-0056-03
2011-09-19
郭磊(1976-),男,河南安陽人,碩士,講師,研究方向為數據庫與數據倉庫、決策支持系統。