張 博
基于 Trace 變換和支持向量機的車牌字符識別新方法
張 博
為了提高車牌上的字符識別準確率,提出一種結合 Trace 變換和支撐矢量機(SVM)的字符識別方法。在字符識別方面,以 Trace 變換方法提取字符特征,并運用支持向量機對字符進行模式分類。將算法應用到實際的車牌字符識別中,識別結果表明,這種方法在提高識別速度的同時,有效提高了字符的識別精度。
車牌識別系統;字符識別;Trace 變換;支持向量機;特征提取
車輛牌照識別系統是計算機視覺與模式識別應用的重要研究課題之一。車牌字符識別的準確和高效成為整個識別系統的關鍵。目前常用的車牌字符識別方法有模板匹配,神經網絡]2[]3[等。模板匹配是根據字符的直觀形象抽取特征,用相關匹配原理進行識別。對于有變形、位移、旋轉的待識字符,模鈑匹配方法很容易產生誤識。神經網絡雖然具有較強的模式分類能力,但算法的收斂數度較慢,且無法保證其全局最優。基于統計學習理論]4[的支持向量機,在解決小樣本,非線形及高維數等模式識別問題中表現出許多特有的優勢,成為近年來機器學習領域新的研究熱點,并在模式識別領域得到廣泛應用。但SVM 也有其缺點,比如對于復雜問題的分類精度不是很高,訓練樣本混疊嚴重時 SVM分類面過于復雜產生過學習情況,對于有些復雜情況由于支持向量集較大而導致決策速度較慢等。
基于常用算法的不足,改進了SVM算法并提出了一種基于 Trace 變換和支持向量機相結合的車牌字符識別新方法。引入 Trace 變換這種具有旋轉、平移、尺度不變性的特征提取方法,并將其提取的特征作為特征向量輸入支持向量機進行識別,增強了對各種前期處理不理想的字符的識別適應性,提高了識別率。
SVM 算法[5]的基本思想是根據結構風險最小化原理[6]的統計學習理論,通過最優超平面的構造使泛化誤差的上限最小化。它通過選擇訓練一組成為支持向量(Support Vectors)的特征子集,使得對支持向量集的劃分等價于對整個數據集的分割。
1.1 最優分類超平面的選取
在訓練集線形可分時,支持向量機就是要構造一個最優超平面,如公式(1):

其中,w是權向量,b是最大裕量。

利用 Lagrange 乘子法構造范函如公式(3)


約束條件為公式(5):

求解最優化問題,可得最優超平面的形式為公式(6):


相應的,問題變為使下式最小為公式(8):

同樣可將此優化形式改為極大化形式,結果幾乎完全相同,只是約束條件變為公式(9):

其中,C是事先選定的,它反映了在復雜性和不可分樣本所占比例之間的折中。
1.2 多分類支持向量機
支持向量機是從二分類問題發展而來的,將其延伸到多類分類問題,最常采用的是“一對一”或“一對多”方法。“一對多”方法往往在實際應用中識別率不高,且容易會出現拒判情況。“一對一”方法進行識別時,各分類器對給定的測量向量均給出分類結果進行“投票”,最終把“得票”數量最多的一類作為最終的分類結果。該方法在實際應用中效果較好,且性能穩定,所以文中采用“一對一”方法,并選用徑向基(RBF)核函數作為支持向量機的核函數。
用支持向量機對進行識別時,需要提取車牌字符的特征作為特征向量,輸入支持向量機。由于車牌字符的提取質量不如印刷體字符,往往有字符輕微傾斜,大小不一、甚至字符殘缺的缺點,因此,特征向量的提取應不受這些因素的影響或影響較小。
本文提出了一種種優秀的特征提取方法:Trace 變換,這種方法具有在圖像旋轉、平移、尺度變換下保持不變的性質,有較好的適應性。
2.1 Trace 變換的特征提取理論
Trace 變換,也稱為廣義的 Radon 變換,它是沿著直線計算圖像函數的某個泛函值來描述一幅圖像。首先,定義一系列穿過圖像的直線,每條直線l由參數φ和 p 定義如圖1所示:
Trace 變換借助于沿直線 l的參數 t計算一個泛函T ,通過泛函T對每條直線計算一個數值,即對每一組計算一個數值,把這些數值畫在以為參數的坐標系中就是 Trace 變換結果。用所有方向的直線掃描一幅圖像,用Λ表示這些直線所構成的域。在T 的作用下,Trace 變換是一個定義在Λ中的函數g,此時的圖像函數被看作是參數t 的函數。如果表示坐標系C 中的直線,Trace變換的定義如公式(10)所示:

最主要的問題是如何選取這3個函數。在確定之前先定義兩類函數:不變性泛函數和位置敏感性泛函數。
(1)不變泛函(Invariant Functional)[7]

不變泛函通常具有下列性質:
性質一:當自變量的比例系數為a時,泛函的比例系數為 )(aA ,即:


(2)位置敏感泛函(Sensitive to Displace Functional)[7]


結合(13)式和(性質一)式得到性質
2.2 不變量的構造

其中泛函Φ,P分別是圓周泛函和直徑泛函,T是進Trace 變換是所選用的泛函表達式。假設原始圖像所在的系統記做,失真系統記做。當系統經過旋轉 θ- 角度、以參數ν對圖像進行尺度縮放、以向量平移后,得到的系統即為。設一幅二維的圖像函數F從系統中觀察記為從系統中觀察記為可以看作將以角度進行旋轉、ν為比例系數進行尺度縮放和以向量為平移參數進行平移得到的。原始圖像上的直線在失真坐標系統中仍然顯示為一條直線,即線性坐標系保持直線不變。當對圖像進行線性變換時,沿著直線上的像素點的灰度值不會變化。所以從原始圖像和失真圖像中存在的直線考慮:假設坐標系中存在某條直線,其參數為坐標系中該條直線的參數記為則同一條直線不同坐標系的參數關系如公式(15)、(16)、(17):

對于同一幅圖像F要想使得構造出的三重特征向量具有旋轉、尺度和平移不變性,只需要使得三重特性值在坐標系 1C 和 2C 中滿足公式(18):

選擇相同的泛函表達式 Φ , P ,T ,根據公式(14)替換(18)得出公式(19)

根據三重特征值的定義如公式(20):

將公式(15)、(16)和(17)代入公式(21):

這里選擇Τ為不變泛函,根據不變泛函的定義式和性質一,推出下式成立公式(22):

選擇泛函Ρ為不變泛函,根據不變泛函的定義式、性質一和性質二,推出下式成立公式(23):

選擇泛函Φ為不變泛函,根據不變泛函的定義式和性質二,推出下式成立公式(24):

用以κ和λ為參數的指數形式表示,則公式(25)(26):

將公式(26)代入公式(24),最終推出公式(27)(28):


公式中的各個參數均與選擇的泛函 Φ ,P,T 的表達式有關。若要滿足三重特征具有旋轉、尺度和平移不變性,滿足公式(18),只需要使得下式成立公式(29):

現在假設函數T、Φ是不變性函數,函數P是敏感性函數,且T滿足不變泛函性質一,P滿足位移泛函性質三,Φ滿足不變泛函性質二。由于P是不變性函數且滿足位移
泛函性質三,所以(22)式可簡化為公式(30):

最后,由于Φ是不變性函數且滿足不變泛函性質二,則公式(31):

同樣地,可以寫成公式(32):
從上式可以看出,只要滿足公式(33):

Trace 特征就對旋轉、平移和縮放比例失真不變。
但是,式(33)的限制過于嚴格。可以將三維特征總結為公式(34):

因此,三維特征可以歸一化為:

式(33)可以改寫為公式(35):

這樣的一對特征的比率就構成了一個不變量。
基于以上的特性,我們可以對T、P、Φ函數進行選擇組合以滿足不變特性,從而利用其不變性進行車牌字符圖像的特征提取。
首先選擇不同的T 、P、Φ函數組合構造不變量組合,如(I6,I1,I5)/(I6,I1,I4),(I3,S3,I4)/(I3,S3,I5),(I3,I1,I6)/ (I3,I1,I7)等,根據式(35)計算特征量。
實驗選取從采集到的車牌圖片中分割出的車牌常用的34 個漢字字符,24 個英文字符以及 10 個數字字符分別進行訓練和識別。用 Matlab 7.0 仿真實現該算法,對不同字符進行識別的實驗結果如表1所示:

表1 不同類型字符識別效果比較
本文的基于 Trace 變換的方法平均識別率為 98.3 %,識別的平均速度為 0.16s。
將在傾斜校正和字符分割中處理不理想(校正后仍存在傾斜或分割后字符有缺損)的字符送入SVM分類器進行識別,實驗結果如表2所示:

表2 正常字符與不理想字符識別效果比較
由表2 可見,由于 Trace 變換具有平移、旋轉、尺度不變性,因此對存在傾斜和缺損的字符有較好的適應性。
將本文方法與模板匹配和神經網絡方法的識別結果進行比較,結果如表3所示:

表3 不同識別方法效果比較
由表3可見,用相同的樣本進行訓練和識別,本文提出的方法比模板匹配和神經網絡方法有了較大的提高,且提取的特征向量的性質好于用小波分解提取的特征向量。
本文以 Trace 變換方法提取字符特征,并運用支持向量機對字符進行模式分類,實驗結果表明,本文提出的車牌字符識別算法識別率更高,且對于存在傾斜、大小不一和不完整的字符有較好的適應性,具有良好的識別能力和推廣能力。
[1] 馬俊莉,莫玉龍,王明祥.一種基于改進模板匹配的車牌字 符 識 別 方 法 [J].小 型 微 型 計 算 機 系 統 ,2003,24(9): 1670.
[2] 王敏,黃心漢,魏武,等.一種模板匹配和神經網絡的車牌識別方法[J].華中理工大學學報,2001,29(3):48.
[3] 楊曉敏,吳煒,黎濤,等.基于 Gabor 變換和支持向量機的車牌字 符 識 別 算法[J].四川大學學 報 :工程科學 版 , 2005,37(5):130.
[4] Vapnik V.統計學習理論的本質[M].北京:清華大學出版社,1999.
[5] 邊肇祺,張學工.模式識別[M].第 2 版.北京:清華大學出版社,2000.
[6] Burges J C.Autorial on support vector machines for pattern recognition [J].Data Mining and Knowledge Discovery,1998,2(2):1~47.
[7] MARIA P,KADYROV A. Affine parameter estimation for the trace transform[J]. IEEE Transactions on Pattern Analysis and Machine Intelligence, 2006, 28(10):1631-1645.
[8] 馬騰飛,鄭永果,趙衛東.基于邊緣檢測與 Hough 變換的 車 牌 字 符 分 割 算 法 [J]. 系 統 仿 真 學報,2006,8(18):391~392.
[9] 潘梅森,郭國強.基于圖像矩的車牌號碼傾斜校正[J].計算機輔助設計與圖形學學報,2007,19(8):1041~1045.
[10] Sahoo P.K., Arora G., A thresholding method based on two-dimensional Renyi’s entropy[J],Pattern Recognition, 2004, 37(6):1149~1161.
[11] 遲曉君,孟慶春.基于投影特征值的車牌字符分割算法[J].計算機應用研究,2006,23(7):256~257.
[12] 李旻,吳煒,楊曉敏等.基于獨立分量分析的車牌字符識別[J].四川大學學報(自然科學版),2006,43(6):42~46.
[13] 廉飛宇,付麥霞,張元.基于支持向量機的車輛牌照識別的研究[J].計算機工程與設計,2006,27(21): 4033~4035.
[14] BAO QIAN, GUO PING. Comparative studies on similarity measures for remote sensing image retrieval[J]. IEEE International Conference on Systems, Man and Cybernetics, 2004:1112-1116.
[15] R R GALIGEKERE,D W HOLDSWORTH,M N S SWAMY, et al. Moment Patterns in Radon Shape[J]. Opt. Eng, 2000,39(4):1088-1097.
[16] C.KOTROPOULOS,I.PITAS. Nonlinear Model-Based Image/Video Processing and Analysis[J]. Wiley-Interscience, 2001:3-14.
[17] Seetharaman V, Sathyakhala A.License plate recognition system using hybrid neural networks[C]//IEEE Annual Meeting of the Fuzzy Information, 2004: 363- 366.
[18] Huang Yo- Ping, Lai Shi- Yong, Chuang Wei- Po.A template- based model for license plate recognition[C]//IEEE International Conference on Networking, Sensing and Control, 2004: 737- 742.
[19] Wu Wei, Yu Yanmei, Liu Dayu,et al. Recognition of license plate character based on hausdorff distance[J].Application Re-search of Computer,2004,21(2):258~260.
[20] Wang Xuewen, Ding Xiaoqing, Liu Changhong. Gabor filters based feature extraction for robust chinese charater recognition[J].Acta Electronica Sinica,2002,9:1317~1321.
A New License Plate Character Recognition Method Based on the Trace Transform and SVM
Zhang Bo
(Electronic Information Engineering Department, Changsha Normal University, Changsha410100, China)
To improve the recognition accuracy of the characters on car license plate, a novel method based on the Trace Transform and support vector machine (SVM) was proposed. In character recognition, the trace transform method is chosen to extract character features, and SVM classification is used as the method to identify characters. The result of vehicle license plate recognition demonstrated that this algorithm can offer higher prediction accuracy and less decisive time compared with other methods.
License Plate Recognition System;Character Recognition;Trace Transformation;Support Vector Machine;Feature Extraction
TP391.4
A
1007-757X(2014)02-0009-05
2013.12.15)
2013 年度湖南省教育廳科學研究項目資助(編號:13C1070)
張 博 (1980-),男,長沙師范學院電子信息工程系,講師,碩士,研究方向:圖像處理與模式識別、信號處理、計算機信息安全理論,長沙,410100