基于在線序列極限學習機的車牌字符識別方法

2015-07-24 19:01:18崔雷濤

網絡安全與數據管理 2015年23期

關鍵詞：特征提取特征

崔雷濤，陳亮，馬強

（東華大學信息科學與技術學院，上海 201620）

基于在線序列極限學習機的車牌字符識別方法

崔雷濤，陳亮，馬強

（東華大學信息科學與技術學院，上海 201620）

當前基于神經網絡方法的車牌字符識別技術都使用固定的訓練樣本，學習的效果受初始樣本限制，對于識別過程中新出現的不同角度、光線等特征的字符圖片不能自適應地學習。本文針對這個問題提出了基于在線序列極限學習機（OS-ELM）的車牌字符識別方法。在樣本實時更新中使系統自適應調整網絡權值，不斷提高識別準確率。本文設計了漢字、字母、字母混合數字三個字符分類器，根據車牌字符的排列特征識別相應的字符。通過與傳統ELM方法和BP神經網絡法對比，結果證明該字符識別技術達到了較高的識別率，在訓練速度上也比BP神經網絡法提高了2～3個數量級。

車牌字符識別；極速學習機；在線序列；特征提取

0 引言

車牌識別是智能交通系統（Intelligent Transportation System，ITS）的重要組成部分。在交通擁堵、停車場管理和套牌檢測等眾多領域得到了廣泛的應用。在車牌識別系統中字符識別是核心與難點，目前字符識別方法主要有模板匹配法、神經網絡技術，以及兩者的聯合應用。

中國大陸車牌字符中含一位漢字且漢字結構復雜，識別困難，出錯率高，模板匹配法對于相似的字符區分能力差，同時受光線和天氣等復雜情況的影響，在特征數據維數過大時效率較低。神經網絡技術以 BP（Back Propagation）算法居多［1-2］。BP神經網絡具有良好的自學習性和存儲知識的能力，但網絡的訓練速度慢，存在局部最優解等問題。因而基于該方法的車牌字符識別只能離線訓練樣本，測試精度也較依賴于初始樣本的全面性。

Huang等［3-5］提出了極限學習機（Extreme LearningMachine，ELM），設置合適的隱藏層節點數，為輸入權值和隱藏層偏差隨機賦值，輸出層權值通過最小二乘法得到，整個過程一次完成，無需迭代，與 BP神經網絡相比學習速度顯著提高，于是出現了一些基于ELM及其改進算法的車牌識別方法。Gou Chao等［6］利用 ELM算法構建分類器，設計了完整的車牌識別系統，取得了較好的分類性能。但是所采用的訓練樣本始終是初始樣本集，對于車牌識別，初始訓練樣本包含全部拍攝角度的車牌字符圖片是比較困難的，所以ELM算法對于新出現的字符樣本沒有學習能力，限制了網絡的魯棒性和泛化能力。因此有必要尋找一種算法，可以將就近識別的樣本加入訓練集，做到實時訓練。

本文設計了基于在線序列極限學習機［7］（Online Sequential Extreme Learning Machine，OS-ELM）的車牌識別分類器，能夠在小樣本數量的基礎上，實時訓練，自適應調整網絡參數，可快速地獲得高識別率。并提出一種新的適合神經網絡結構的特征提取方式，以降低提取特征的維度，滿足車牌識別準確性、魯棒性和實時性要求。

1 車牌字符的特征提取

本文主要采用字符的網格特征和圖像矩陣行列信息作為待識別的字符特征。由于漢字字符筆劃錯綜復雜且分布不均，而字母和數字字符相對比較簡單，容易提取特征值，因而在提取特征方法的具體實施上兩者有所差別，以便后續投入不同的分類器。

對漢字的特征提取具體步驟為：

（1）網格特征提取。將歸一化后的漢字字符（大小為32×16）平均劃分成 4×4大小相等的子區域，計算每個子區域中白色像素值數量，產生 32個網格特征。

（2）行列特征信息提取。從漢字圖像第一行開始，提取第一行中白色像素點的個數，之后將每隔兩行的下一行定為目標行，逐一統計目標行中的白點數。用同樣方法對圖像矩陣列進行操作。至此，提取出 17個行列特征信息值。漢字“浙”的字符特征提取過程示例如圖1。

圖1 漢字字符特征提取過程示例

對于英文字母字符和數字字符的特征提取，也是采用網格特征結合行列特征的提取方法。但是由于字母、數字結構簡單，為便于訓練，提取較小維數的向量作為特征向量。本文提取了 16個網格特征和 9個行列信息特征共 25維特征向量。

2 車牌字符分類器的設計

本文根據車牌字符的排列特點構造了三個基于OS-ELM的子網絡分類器，分別為漢字字符分類器、字母字符分類器以及字母/數字混合字符分類器，一方面降低了識別時間，另一方面也提高了識別精度。三種分類器如圖2所示。

分類器配置方面，提取的特征向量維數即輸入節點數目。訓練樣本中漢字字符有 14種，分別為魯、京、浙、豫、粵、陜、遼、蘇、吉、瓊、滬、桂、冀、閩；車牌中沒有 O和 I兩個字母，所以字母有 24種，字母加數字有 34種。三種分類器配置如表1。

圖2 分類器組合

表1 分類器的配置

3 OS-ELM車牌字符識別算法設計

傳統的極限學習機只能學習不變的數據，而如果初期訓練樣本不能包含全部角度的字符圖片，則新字符圖片由于具有不同角度，以及受遮擋、污跡等影響特殊特征會難以識別，故而限制了網絡的泛化能力。部分特殊特征的字符圖片如圖3所示。

圖3 部分傾斜、受遮擋的字符圖片

所以本文采用OS-ELM算法，將后繼車牌樣本分批加入訓練，增強網絡的泛化能力，構建基于在線序列極限學習的車牌識別方法。網絡的基本結構如圖4。以漢字分類器設計為例，將提取 400張漢字字符圖片特征數據均分為4批先后輸入網絡，學習過程如下：

圖4 網絡基本結構

（1）初始化階段。取 k=0，其中 k為送到網絡的字符數據批次。給定激活函數 g（x）=隱層節點數目L和初始訓練數據 Z0=｛（xi，ti）｝N0，其中 xi為輸入特征向量，ti為每個特征向量對應的字符類別，N0=100，L由交叉驗證法試驗后取為 40。隨機產生輸入權值向量 ωj和偏置bj初始化網絡，則由參考文獻［6］，輸出權值向量 β（0）= P0H0TT0。其中：

（2）在線學習階段。給定第 k+1批數據，計算出隱層輸出矩陣為 Hk+1，輸出權值向量為：

令 k=k+1，返回到在線學習階段，不斷更新參數 H和 β，直到學習完 4批數據。

4 實驗結果及分析

實驗中選取了100幅實際的車牌圖片。用三個OSELM分類器進行整體的識別。隱藏層節點數目本文用5折交叉驗證法選擇最優數目。識別速度取 50次測試結果的平均值。識別結果如表2所示。

表2 三種OS-ELM分類器識別性能

本文還將 OS-ELM法與已有的ELM法、BP神經網絡的車牌字符識別方法進行了實驗結果的比較。具體比較為：從大量準確分割出的單個字符中選取 100張包含字母及數字的字符圖像作為對比測試樣本，100張作為ELM法和 BP神經網絡法的訓練樣本，同時作為 OSELM訓練樣本的第一批輸入樣本，再選取200張字符圖片分別作為ELM法的第二、第三批訓練樣本。測試結果如表3所示，其中識別結果采取50次識別結果的平均值。

表3 不同算法性能對比

從表2、表3的實驗對比結果可以看出，BP神經網絡算法由于本身繁瑣的迭代過程，因而訓練耗費時間很長。OS-ELM法相比于BP神經網絡法不僅在字符的識別率上表現出了更令人滿意的效果，能達到 90%以上，而且在識別速度上更是體現出很大的優越性，訓練速度比BP法高出近200倍。與ELM法相比，識別速度相差不多，但有更好的泛化性能。

5 結束語

本文采用在線序列學習機算法對車牌字符進行識別，與BP法相比訓練時間短，能夠滿足在線訓練的要求；與ELM法相比有更好的泛化能力。采用字符的網格特征和圖像矩陣行列信息提取的特征提取方法，降低了特征維數。針對車牌字符的排列特征，設計了漢字、字母、字母與數字三個分類器，能夠提高分類準確率并且縮短運算時間。該車牌字符識別技術可以應用于道路監控中對實時性要求較高的場合。

［1］KOVAL V，TURCHENKO V，KOCHAN V.Smart license pattern recognition system based on imaging processing using neural network［C］.Procedings of the Second IEEE International Workshop on Intelligent Data Acquisition and Advanced Computing System-technology and Applications.Lviv，Ukraine：IEEE press，2003：123-127.

［2］劉雄飛，朱盛春.車牌字符多特征提取與 BP神經網絡的識別算法［J］.計算機仿真，2014，31（10）：161-164.

［3］HUANG G B，ZHU Q Y，SIEW C K.Extreme learning machine：theory and applications［J］.Neurocomputing，2006，70（1）：489-501.

［4］HUANG G B，WANG D H，LAN Y.Extreme learning machines：a survey［J］.Intelligent Journal of Machine Learning and Cybernetics，2011，2（2）：107-122.

［5］HUANG G B，ZHOU Hm，DING X J，et al.Extreme learning machine for regression and multiclass classification［J］. IEEE Transactions on System， Man， and Cybernetics，2012，42（2）：513-529.

［6］Gou Chao，Wang Kunfeng，Yu Zhongdong.License plate recognition using MSER and HOG based on ELM［C］.IEEE Service Operation and Logistics，and Informatics，2014：217-221.

［7］Liang Nanying，Huang Guangbin，SARATCHANDRAN P，et al.A fast and accurate online sequential learning algorithm for feedforward networks［J］.IEEE Transactionson Neural Networks，2006，17（6）：1411-1423.

License plate character recognition method based on online sequence extreme learning machine

Cui Leitao，Chen Liang，Ma Qiang
（College of Information Science and Technology，Donghua University，Shanghai 201620，China）

Current license plate character recognition technology which based on neural network method always uses fixed training samples， so learning effect isrestricted by theinitialsampleand can not learn adaptively forthe new appeared characteristics in indentifying process，like different angles and light.This paper presents a new license plate character recognition method based on the online sequence learning machine（OS-ELM）method，which makes system adjusts network weight selfadaptively in real-time updating，and improves recognition accuracy.This paper designs Chinese characters classifier，letters classifier and letters mixed number classifier on the order of each character， which recognizes corresponding characters according to the arrangement of license plate character features.After compared with the traditional ELM method and BP network method，the result proves that this character recognition technology not only achieves a higher recognition rate，but also computes faster than the BP neural network for 2～3 orders of magnitude on the training speed.

license plate character；extreme learning machine；online sequence；feature extraction

TP391.4

1674-7720（2015）23-0030-03

崔雷濤，陳亮，馬強.基于在線序列極限學習機的車牌字符識別方法［J］.微型機與應用，2015，34（23）：30-32.

2015-07-26）

崔雷濤（1990-），通信作者，男，碩士研究生，主要研究方向：極限學習機算法、車牌識別等。E-mail：717633923@qq.com。

陳亮（1970-），女，博士，副教授，主要研究方向：機器學習、數據挖掘等。

馬強（1990-），男，碩士研究生，主要研究方向：布匹瑕疵檢測、極限學習機算法等。