張小春,任開春,曹龍漢,張興起,張遷
(重慶通信學院 軍事電力工程系,重慶 400035)
智能交通系統(Intelligent Traffic System,ITS)作為目前世界交通運輸領域的前沿研究課題己經成為交通管理發展的主要方向,并已廣泛應用于高速公路收費站、智能小區、電子警察等領域。ITS的核心是汽車牌照自動識別技術(License Plate Recognition,LPR)。LPR系統分為兩個步驟:一是對牌照的精確定位,二是字符的識別?;谏窠浘W絡的模式識別方法是字符識別領域的一個重要研究方向。但目前大部分都是基于BP(Back Propagation)網絡進行的。BP網絡的主要缺點是易受干擾、難以確定隱層節點數、易陷入局部極值點。而對于徑向基函數(Radial Basis Function,RBF)神經網絡,由于結構簡單、徑向對稱、光滑性好,可以保證學習速度快,且能實現全局最優。本文通過一種動態K-均值聚類算法的RBF網絡對車牌數字進行了識別,試驗結果表明,網絡學習速度快,正確率較高,抗干擾力較強,具有一定應用價值。
RBF神經網絡[1]是一種前饋型神經網絡,包含1個具有徑向基函數神經元的隱層和1個具有線性神經元的輸出層。RBF神經網絡模型如圖1所示。
式中:dj為 隱單元函數寬度。顯然,dj越 小,徑向基函數的寬度也就越小,基函數就越具有選擇性。高斯函數模型如圖2所示。
于是,圖1中的RBF神經網絡的第k個輸出就可以表示為
式中:wkj表示第j個隱層神經元與第k個神經元的連接權值,輸入層與隱層之間的所有權值固定為1。圖1中輸出層節點中的Σ表示輸出層神經元采用線性激活函數。
K-均值聚類算法是一種自組織學習選取徑向基函數中心的方法,徑向基函數的中心值可以移動,并通過自組織學習確定其位置,從而使徑向基函數的中心位于輸入空間重要的區域。然而K-均值聚類算法的性能受到許多因素的影響,需要大量試驗來確定K值的選擇及初始化參數的選擇,因而本文選取了另外一種動態K-均值算法。其算法實現步驟如下。
第1步:隨機選取1個輸入向量作為初始時的聚類中心,此時中心個數q=1,設置距離門限值ρ、正學習步長ηk和反學習步長ηr,且滿足0<ηr< ηk< 1,令 s=1。
第2步:計算第s個輸入向量Ins與所有已知聚類中心Cj的距離dj。
式中:q是當前聚類中心的個數;n是第s個輸入向量的維數,同時也是隱含層第j個中心的維數。
3)同業競爭:在國內,由于品牌建設落后,引領作用不強。眾多隴藥中,有影響力的佛慈制藥、太寶制藥、奇正藏藥等少數品牌,與國內十大中藥品牌的“北京同仁堂”“云南白藥”等相比仍有較大差距。在國外,最大的競爭對手是日本、德國及韓國。日本現已成為除中國之外, 開展中草藥研究歷史久、范圍廣、水平高、從事人數多的國家。日本的中藥企業以大企業為主, 產業集中度高。德國憑借其高技術和加工生產能力,成為目前世界產銷植物藥最多的國。
第4步:比較dk與距離門限值ρ,若dk>ρ,則增加一個新的中心,即q=q+1,中心值就為該輸入向量;若dk<ρ,則按照RPCL方法修正獲勝中心與次勝中心,其它中心保持不變。
第5步:s=s+1。若s>輸入樣本數量,表示已經找到全部聚類中心C,算法結束,否則轉到第2步。
輸入層與輸出層的神經元數目由問題本身的性質決定,輸入層神經元個數由待識別字符所提取的粗網格特征的維數大小確定[2]。在本車牌數字識別系統中,已經手工用畫圖工具將車牌中的數字切割出來,生成尺寸大小不一的24位點陣位圖,從0~9的每一個數字都取了9個樣本,切割完成的車牌樣本命名為00.bmp,01.bmp,…,89.bmp,如圖3所示。
再通過程序對每個圖像進行處理,生成歸一化的16×16點陣大小字符,以每個像素點為一個網格,因而輸入層神經元個數取為256。
人工神經網絡對模式的分類可以采用“M中取1”的方式來表示目標向量,因此,網絡輸出層神經元的數目即為待識別的類別數M,輸出層的每一個神經元就代表一個目標種類。在本系統中,也采用“M中取l”的方式來表示目標向量。本系統將輸入樣本進行10個結果的輸出,即0~9,這樣,網絡輸出層神經元個數即為10。
確定隱函數中心Cj采用動態K-均值聚類算法,如上文所述。
半徑dj決 定了RBF單元接受域的大小,對網絡的精度有極大的影響,半徑選擇的基本原則是使所有RBF隱單元的接受域之和覆蓋整個訓練樣本空間。對樣本空間分好類以后,dj計算根據如下k鄰近的方法。
式中:x(k)和Cj的維數相同;x(k)即為距離Cj最近的K個點[3-4]。
通過線性最小二乘法來訓練RBF神經網絡便可以得到隱層與輸出層之間的連接權值。初始化時,先設定樣本模式計數器p和訓練次數q為1,誤差E置為0,試驗的誤差閾值Emin設為0.05,初始學習率設定在0~1之間的值。本文共有訓練樣本數為P=90。故網絡總誤差為

在神經網絡模型確定后,將測試樣本輸入網絡進行識別測試。每輸入一個車牌數字圖片后,經過程序的自動處理,將生成16×16的點陣圖像作為輸入特征矢量,經過隱層和輸出層的計算后就可以得到每個字符的分類號,將這個分類號與輸入特征矢量自帶的分類號比較,相等則識別正確,反之則識別錯誤。
系統訓練誤差曲線如圖4所示。
基于RBF神經網絡的車牌數字識別系統操作界面如圖5所示。
為了測試系統的整體性能,特在實際交通道路上抓拍了273張不同的車牌圖像,其中,含3個數字的車牌數目共計174個,含4個數字的車牌數目共計87個,含5個數字的車牌數目共計12個。經過對車牌的分割處理,得到數目分布不均的從0到9的車牌數字共計930個。用此樣本對所得車牌數字進行了識別,結果見表1。
由表1可以看出,識別正確率在90.6%~98.9%之間,平均正確率為95.91%。若考慮每一個車牌數字出現的概率后,即按照式(6)計算有

表1 識別結果
式中:p1i為數字出現的概率;p2i為每個數字單獨識別的正確率;p為綜合識別正確率,則由表1計算出綜合識別正確率為p=95%。
數字識別系統對數字0~9的部分識別效果見表2。

表2 部分識別效果
表3所示為系統對帶噪聲、模糊、拍攝角度不好的圖片的識別結果,右側所示圖片為經過算法自動處理后的圖片,目視可知干擾都比較大,但是由于RBF神經網絡的高度非線性化和高識別率,這些照片仍然得出了正確結果。

表3 對部分帶噪聲和模糊圖片的識別結果
本文通過K-均值聚類算法實現了RBF神經網絡對車牌數字的識別。本系統經過對每個數字的訓練后,能夠對輸入的車牌數字做到比較精確的識別,具有較高的識別準確率,區分字符能力較強,不易受噪聲影響,在交通檢測、停車場、和高速公路超速檢測等方面有較高實用性和現實意義。
[1]魏海坤.神經網絡結構設計的理論與方法[M].北京:國防工業出版社,2005:55-62.Wei Haikun. Theory and Method of Artificial Neural Networks Design[M]. Beijing:China National Defense Industry Press,2005:55-62.(in Chinese)
[2]高雋. 人工神經網絡原理及仿真實例[M].北京:機械工業出版社,2010:98-102.Gao Jun. Artificial Neural Networks:Theory and Simulation Examples[M].Beijing:China Machine Press,2010:98-102. (in Chinese)
[3]KERRY L C. Intelligent Transportation Systems [J].Better Roads,2005,75(7):75-76.
[4]李國友,姚磊,李惠光,等. 基于優化的RBF神經網絡模式識別新方法[J]. 系統仿真學報,2006,18(1):181-184.Li Guoyou,Yao Lei,Li Huiguang,et al. A New Method of Pattern Recognition Based on Optimized RBF Neural Networks [J]. Journal of System Simulation,2006,18(1):181-184. (in Chinese)
[5]趙秀麗,李廷軍,金慧琴,等. 基于RBF神經網絡的數字模式識別方法[J].海軍航空工程學報,2004,19(1):191-192.Zhao Xiuli,Li Tingjun,Jin Huiqin, et al. A Way of Recognition Based on RBF Neural Network [J].Journal of Naval Aeronautical Engineering Institute,2004,19(1):191-192. (in Chinese)
[6]張秀玲,李海濱. 基于RBF神經網絡的數字模式識別方法[J]. 模式識別與人工智能,2002,15(1):93-97.Zhang Xiuling,Li Haibin. A Digit Recognition Method Based on RBF Network [J]. Pattern Recognition and Artificial Intelligence,2002,15(1):93-97. (in Chinese)