(1.沈陽建筑大學 信息與控制工程學院 沈陽 110168; 2. 東北大學 信息科學與工程學院 沈陽 110004)
摘 要:提出了一種基于分級徑向基神經網絡的車牌字符識別算法,采用兩級徑向基神經網絡結構,由一級網絡識別后,通過對識別結果和置信度進行分析,確定了12個二級子網;采用動態誤差分割算法進行網絡訓練,通過大量實驗研究,車牌整體識別率達到了86.58%,平均識別時間為181ms,對比性研究驗證了該方法的有效性。
關鍵詞:車牌識別; 徑向基函數網絡; 二級網絡; 識別率
中圖分類號:TP301.6; TP391.41文獻標志碼:A
文章編號:1001-3695(2009)05-1703-03
Pattern recognition algorithm for license plate character
based on multilevel network
LI Mengxin1,2 WU Chengdong2
(1.School of Information Control Engineering Shenyang Jianzhu University Shenyang 110168 China; 2.School of Information Science Engineering Northeastern University Shenyang 110004 China)
Abstract:This paper proposed a new recognition algorithm for license plate character based on multilevel network adopted twolevel network. According to recognition results from onelevel network and the confidence levels built recognition distribution table and accordingly designed twolevel network. As a result formed 12 twolevel subnetworks. A large amount of samples are used for system test. Overall recognition accuracy is 86.58% and recognition time is 181ms. Through contrastive research the method presented is proved to be effective.
Key words:license plate recognition; RBF network; twolevel network; recognition accuracy
0 引言
隨著車流量的不斷加大和道路建設的不斷完善,對交通自動化管理系統將會提出更高的要求。在保證識別精度的基礎上提高識別速度,以滿足實時高速系統的需要,并能適應多種場合的應用是車牌識別系統(PLR)的發展趨勢。車牌識別的研究,最早出現于20世紀80年代,可以粗略地計算出車輛的速度、車流量、道路負載等數據,識別過程需要人工干預。隨著計算機技術的進一步發展,國內外對汽車牌照識別系統的研究工作已經有了很大進展。隨著社會要求的不斷提高,這些現有產品的弊端也隨之凸顯出來,即識別速度慢、精度低、抗干擾性能差等[1,2]。
人工神經網絡是模式識別領域中比較成熟和有效的分類方法,它通過網絡節點間的連接來存儲信息并完成分類計算,具有信息分布式存儲、大規模自適應并行處理、自組織、自學習功能、高度的容錯性、魯棒性等優點,可處理一些背景知識不清楚、推理規則不明確、輸入模式部分損失等問題。在PLR系統中,神經網絡分類方法的缺點是不易區分相似的類(如車牌中的B和8、2和Z等),而且,若一個網絡過于龐大則訓練難度明顯增加。由于不同的字符特征均有其各自的限制,單獨使用某一種特征的神經網絡進行字符識別不能取得很好的識別效果,因而采用多神經網絡集成識別已成為近年來字符識別領域的主要研究方向。任何一種特征和識別方法都有其優點和局限性,走多特征組合、多方案集成的道路[3,4],已成為字符識別系統走向實用化的有效途徑。本文提出了基于分級徑向基神經網絡(RBF)的字符識別方法進行車牌字符識別。
1 基于分級徑向基神經網絡的字符識別
字符分割是車牌識別的前置部分,本文采用了基于垂直投影和優割字符的字符分割算法。該算法結合字符分割的垂直投影法和連通域法的優點,形成一個滑動窗口對圖像進行評判分割,有效地解決了二值化圖像中字符斷裂及字符粘連的情況。
根據車牌字符的特點:車牌第一個字符為漢字,第二個字符為英文字母,第三、四個字符為英文字母或數字,第五到第七個字符均為數字。首先構造了四個一級徑向基神經網絡(RBF),即漢字、字母、混合和數字,用于粗分類;然后,對字母網絡、混合網絡和數字網絡根據內部字符的易混程度(如O、Q、D等)分別構建了不同的二級子網進行精確識別。網絡的組織結構如圖1所示。
多級網絡工作過程為:首先,根據分割結果將七個不同位置的字符圖像輸入對應的一級網絡進行識別,每個網絡輸出該網絡的識別結果及結果的置信度。對于漢字網絡,目前沒有設置二級識別,直接根據置信度輸出識別字符或者非法字符。對于字母、混合和數字網絡,該識別結果及置信度輸入一個類分流器的二級網絡進行分流或直接輸出識別結果。如果確定需要二級識別,將根據一級識別結果選擇二級識別子網進行識別,然后將識別結果轉入表決器進行評判表決,輸出置信度大的識別結果作為最終識別結果。數字二級網絡為例來闡述二級子網的確定過程,在一級網絡訓練完成后,對每個數字使用1 000個不同的樣本進行測試。測試結果如表1所示。實驗結果表明了以列為真值的字符圖像被識別為其余字符的數量的分布關系,為了便于觀察將小于10個的值賦為空。
分析表1可知,如果一級網絡輸出結果為3,那么其真值的結果應該為3或者5;反之卻不成立。如果一級網絡輸出結果為5,可以認為結果是正確的,無須進行二級網絡識別。通過分析漢字、字母、混合和數字網絡四個一級網絡的識別分布表,本文最終確定了12個二級子網。這些二級子網分別是四個字母子網:字母CDLOU網、字母BFHPR網、字母ATVY網和字母ABEFLP網;七個混合子網:混合OCD網、混合158BEFR網、混合2379VZ網、混合1479ATY網、混合589BES網、混合358BHK網和混合6BCDGOU網;1個數字子網:數字35網。
2 字符識別系統設計及仿真
由于車牌識別系統有其使用的地域性,如,對沈陽地區來說,違章車輛幾乎集中于遼、蒙、吉、黑、晉等地區,而來自桂、藏等地區的違章車輛幾乎為0。在訓練漢字網絡時,為了提高網絡的識別精確度,應加入地域性的限制,即對不同的地域訓練不同的漢字網絡。而數字、字母和混合網絡不存在地域性問題。通過實驗選取大量違章車牌圖像進行觀察,本文最終確定沈陽地區的漢字網絡選用遼、蒙、京、津、蘇、吉、黑、晉、冀和魯10個省市的樣本進行訓練。
一個具有最少一個隱含層的三層神經網絡,可以逼近任何有理函數。通過增加層數或增加神經元數目,可以進一步地降低誤差。一般情況下,應優先考慮增加隱含層中的神經元數。因此,本文采用含有一個隱含層的三層RBF神經網絡來進行字符的識別。一個RBF神經網絡,輸入神經元個數等于所提取的特征個數,輸出神經元個數等于所分類別數。而隱層神經元個數的確定,一直是神經網絡設計中的一個重點和難點問題,本文依據Meng Joo Er提出的方法進行隱層神經元個數的確定[5]。該算法首先假設隱層神經元個數與輸出層神經元個數相等,即每一個類別在隱層有其惟一的映射;然后,將所有的訓練模式輸入,判別這些訓練模式是否能夠表現為同一類的樣本都匯集于隱層的同一個神經元附近,如果出現各個類別之間互相混淆的情況,那么增加一個隱層神經元,重復計算,直到每一個隱層神經元都對應相同類的樣本為止。這時,網絡隱層神經元的個數即為該神經網絡的最終的隱層神經元個數。
利用上述算法,通過實驗獲得的各網絡隱層神經元個數如表2所示。
從表2可以看出,本文的隱層神經元個數確定方法獲得的隱層神經元個數一般小于輸入層個數,且該確定過程自動完成,無須進行大量的實驗調整,具有一定的實用性。
本文采用Li[5]提出的網絡訓練方法對各網絡進行訓練,該網絡沿負梯度方向動態分段快速收斂到指定誤差,避免了BP網絡的局部極小值問題。網絡訓練結果如表3所示。
從訓練結果可以看出,本文所采用的基于分級RBF網絡的車牌字符識別方法及網絡訓練方法可以在很少的步數內使網絡達到收斂。訓練算法采用動態誤差分割算法,加快了全局最小值的搜尋時間,避免了進入局部極小值,一般動態分割段為3~4段。
3 實驗結果及分析
車牌中漢字的識別一直是車牌識別的一個難點問題,本文采用基于字符的灰度圖像提取字符特征,避免了漢字字符圖像在二值化過程中因筆畫斷裂、粘連等影響使得提取的特征不準確的問題。漢字網絡獨立字符識別結果表4所示。
從表4中可以看出,系統對漢字獨立字符的平均識別率為92.32%,大于文獻[6]的漢字獨立字符識別率89.7%。此外,本文采用3 000個樣本進行訓練,16 000多個樣本進行測試,這些樣本均來自實際交通路口違章車輛圖像,因此,測試結果更具一般性和普遍性。
對于數字和字母的識別,文獻中已有較高識別率的報道。如文獻[6]中數字識別率為95.12%,本文經實驗測試,數字的識別結果如表5所示。
與其他數字相比,對于數字3和8的識別率稍低,分別為94.8%和95.2%,平均識別率為96.10%。通過分析訓練及測試樣本發現,數字3和8的訓練及測試樣本中,由于分割偏差及污跡、光照等的影響,使得3和8的訓練及測試樣本中,部分樣本容易混淆所致。字母網絡的識別結果如表6所示。
車牌中的字母不包括“I”,從表6可以看出,系統對其余25個英文字母的平均識別率為94.0%,最高識別率為98.5%,比文獻[5,6]的90.5%有較大的提高。此外,相似字母的識別率較其他字母稍低,如C、D、O、U、B和H等,這些字母的識別率均低于平均識別率。而外形結構相對較獨立的字母,如W、X、Z等識別率較好。因此,對相似字符進行二級識別是很必要的。
數字與字母混合的識別率如表7所示。
車牌字符中,不進行數字0和字母O的區別,因此,混合網絡有34個輸出類別(包括10個數字和24個英文字母)。文獻[6~8]均未進行混合網絡獨立字符識別率的報道。從實驗結果可以看出,混合網絡中各字符的平均識別率為92.72%,比數字獨立字符識別率及字母獨立字符識別率低,這也說明,神經網絡隨識別類別的增加,網絡變得復雜,識別率會降低。對于字符Z,在字母網絡中的識別率為98.5%,而在混合網絡中的識別率只有91.6%,這是由于混合網絡中有字符2的存在。因為2和Z在外形結構上比較相似,提取出的特征也相似,導致誤識的幾率增加。
為了整體衡量本文系統的性能,取1 000幅實際交通道路抓拍的車牌圖像進行測試,圖像大小為768×288的單場圖像。測試結果如表8所示,可以看出,全車牌識別率為86.58%,平均識別時間為181 ms,可以滿足實際應用系統的技術要求。文獻[6~8]中均對系統的整體性能進行了測試,比較幾種方法的測試樣本數目、系統運行速度及系統識別率,本文提出的方法具有更好實時性和精確性指標。
4 結束語
本文提出了一種基于分級RBF神經網絡的車牌字符識別方法,采用兩級RBF神經網絡來對車牌字符進行識別,由一級網絡識別分布圖進行二級網絡設計,最終確定了12個二級子網,對4個一級網絡的識別結果進行二級識別;用大量樣本對所設計的網絡進行了測試,識別率達到了86.58%,平均運行時間為181 ms,有效地提高了識別的精度。
參考文獻:
[1]KERRY L C. Intelligent transportation systems[J]. Better Roads 2005,75(7):75-76.
[2]BRIAN L S WILLIAM T S. Development of integrated intelligent transportation systems[J]. Trans on Research Record 1999,6(4):84-90.
[3]金連文 徐秉錚. 基于多級神經網絡結構的手寫體漢字識別[J]. 通信學報 1997,18(5): 21-27.
[4]FRANCOISE F S VIENNET E LAMY B. Multimodular neural network architectures applications in optical character and human face recognition[J]. International Journal of Pattern Recognition and Artificial Intelligence 1993,7(4):721-755.
[5]LI Mengxin WU Chengdong YUE Yong. An automatic inspection system based on a neural network and uniform design[C]//Proc ofInternational Conference on Machine Learning and Cybernetics. Guangzhou: IEEE Press,2005:4528-4532.
[6]章為川. 基于神經網絡的車牌識別系統的研究與設計[D].成都: 西南交通大學 2006.
[7]鐘余. 基于神經網絡的車牌識別技術的研究與應用[D]. 大連:大連海事大學 2007.
[8]李飛. 基于人工神經網絡的車牌識別系統的研究 [D]. 太原:中北大學 2007.