張 嶠
(重慶工業職業技術學院,重慶 401120)
智能交通體系極大地方便了人們的出行和生活。隨著智能交通的飛速發展與完善,車牌識別技術在交通管理、數字安全監控、車輛識別、停車管理、監視過境和搜索可疑車輛等多個領域中頻繁使用,已成為智能交通系統的重要組成部分。這些具有巨大經濟價值的應用技術,不僅顯著地提高了工作效率,還節約了人力和物力資源。
LPR 系統是幾個模塊的組合,涉及對象檢測、圖像處理和模式識別。除了圖像采集和預處理之外,讀取車牌的過程還經歷了三個主要階段:第一階段是板定位或板提取,即定位圖片中的牌照位置;第二階段是字符分割,即把每個字符都被檢測到并與其他字符分開;第三階段是字符識別,即把分割好的字符進行識別,并最終組成牌照號碼。車牌識別過程中,牌照顏色的識別依據算法不同,可能在上述不同步驟實現,通常與車牌識別互相配合、互相驗證。實際上,車牌識別過程包括圖像采集、預處理、車牌定位、字符分割、字符識別、結果輸出等一系列算法運算。
目前車牌識別技術發展已經比較成熟,識別準確率和魯棒性均比較高。C.Sharma 和 A.Kaur 提出了利用直方圖均衡的邊緣檢測技術來檢測和識別印度車牌,識別率為89%,其主要領域是分割部分,但所提出的方法對角度和環境敏感。M.H.Dashtban 嘗試使用邊緣檢測和神經網絡算法兩種算法來測試巴黎車牌,識別率達到94%。這項研究的優勢在于圖像數據庫包含了在不同光照條件下具有不同背景和坡度的各種車輛的圖像。R.Lee 和K.Hung 使用100 個樣本圖像研究了基于Haar 離散小波變換這種執行速度較快的方法進行實時車牌識別,有93%的準確率[1]。G.Lekhana 和R.Srikantaswamy 用神經網絡和支持向量機支持向量機識別車牌號,無需對圖像進行任何增強,這種方法能夠成功識別運動中的車輛。S.Qing-kun 和Y.Hui-jun 利用140 個樣本圖像對中國車牌進行了基于數學形態學方法和RBF 神經網絡的車牌識別研究,達到了94%的識別率。通過使用RBF神經網絡基函數中心確定算法,可以直接確定隱藏節點的數量,易于實現且識別精度較高。另一方面,在中國的車牌識別領域中也提出了一種新的方法,即PVD,這種方法可以適應性地處理車牌中的各種變化,例如旋轉、縮放、照明。利用支持向量機與神經網絡的模板匹配,成功識別出印度車牌,識別率為96%。H.Rajput 通過邊緣檢測和形態學運算進行Gussing 濾波的實驗,該實驗對250 個澳大利亞車牌進行了測試,并獲得了96%的識別率[2]。
對于車牌文字識別的方法,目前主要是采用判別式分析方法,這些方法包括基于模板匹配的字符識別、基于支持向量機的字符識別和神經網絡的字符識別算法等。
艾哈邁德(Ahmed)等人提出了模板匹配。模板匹配是一種簡單的方法。字符和模板之間的相似性是度量,與角色最相似的模板被識別為目標,大多數模板匹配方法都使用二進制圖像,因為灰度會由于光照的變化而改變,在將提取的字符調整為相同大小后執行模板匹配。此方法對于識別非旋轉,不間斷的單個字體很有用。如果由于字體變化、旋轉、雜音而使字符與模板不同,則模板匹配會產生錯誤的識別[3]。
LeCun 等人使用HOG 功能進行字符識別,在訓練階段,從每個字母的高分辨率圖像生成訓練數據,然后獲得每個字母在HOG 特征空間中的分布。在識別階段,從圖像中切出每個字符,計算出HOG 特征向量,并根據上面獲得的HOG 特征空間中的分布識別字符。支持向量機和神經網絡有較強的自學能力,能夠在一定程度上克服字符形狀的改變和位置偏移的缺陷[4]。
Siddharth 等人使用支持向量機(SVM)分類器,SVM分類器由一組給定的訓練數據進行訓練,并準備了一個基于該模型對測試數據進行分類的模型。對于多分類問題,我們將多分類問題分解為多個二進制分類問題,并設計了合適的組合多個二進制SVM 分類器。根據如何以適當的余量將所有樣本分為不同的類別,在SVM 分類器中使用了不同類型的內核[5]。
Sharma 和Singh 已將人工神經網絡應用于字符識別,這種方法模擬了人類神經系統創建智能行為的方式。這個想法是采用大量的角色(稱為訓練集),然后開發一個可以從這些訓練中學習的系統。換句話說,神經網絡使用訓練來自動推斷識別字符的規則。這些方法在良好的數據集上可以取得令人印象深刻的結果,但在質量較差的數據集上仍會產生不正確的識別,CNN 的引入使得模糊數據集的字符識別做得更好。
Bounchain 在角色識別任務中應用了Lenet-5,該網絡已用包含50,000 多個手寫數字的數據庫進行了測試,所有數字均在輸入圖像中進行了標準化,達到了約0.95%的錯誤率[6]。
實際應用中,車牌識別系統的識別率還與牌照質量和拍攝質量密切相關。牌照質量會受到各種因素的影響,如生銹、污損、油漆剝落、字體褪色、牌照被遮擋、牌照傾斜、高亮反光、多牌照、假牌照等等;實際拍攝過程也會受到環境亮度、拍攝方式、車輛速度等等因素的影響。這些影響因素不同程度上降低了車牌識別的識別率,也正是車牌識別系統的困難和挑戰所在。為了提高識別率,除了不斷地完善識別算法還應該想辦法克服各種光照條件,使采集到的圖像最利于識別。
車牌識別在過去的幾年內取得了驕人的成績,但還是存在著有待解決的問題。比如,現實應用中往往會因為沙塵、濺起的泥巴、雨水腐蝕、風化等各種原因使得車牌的字符不完整,致使字符分割和識別可能會遇到麻煩。上文提到的高識別準確率的方法在不完整車牌識別中結果不盡如人意。在常態下識別率達到98%的XX 網絡用于識別文字殘缺不全的車牌,識別率降低一半以下,因此如何正確地分割和識別車牌文字成為一項艱巨的任務。
令人振奮的是,得益于圖像修復技術的發展,我們可以通過技術手段對殘缺文字進行修補,還原文字的真實形態。近年來,深度學習在圖像語義修復、情感感知、模式識別以及特征分類等領域展現出噴發時發展的態勢[7],特別在圖像生成方面,表現出優越的性能。基于深度學習的圖像生成算法相對于傳統的基于結構和紋理的生成算法能夠捕獲更多圖像的高級特征,常用于進行紋理合成和圖像風格化遷移。2014 年由Goodfellow 提出的生成式對抗網絡(GAN)在圖像生成領域取得了開創性進展,在圖像生成的過程中,生成式對抗網絡相對于傳統的編碼-解碼器而言能夠更好地擬合數據,且速度較快,生成的樣本更加銳利,但該方法也存在不足,如數據訓練不穩定、模型自由不可控、訓練崩潰等問題。[8]2016 年,Radford 等人發表了一篇名為《無監督代表性學習與深度卷積生成式對抗性網絡》的論文,提出深度卷積生成式對抗網絡DCGAN。DCGAN 融合CNN和GAN,通過設計獨特的網絡結構,使得訓練更加穩定[9],這是首篇表明向量運算可以作為從生成器中學習的固有屬性進行特征表達的論文。2019 年SHENG ZHANG 等人提出了一個有效而高效的共享對抗訓練網絡(SATN),該網絡可以在具備標準模板渲染車牌的先驗知識的情況下,從車牌中學習與環境無關且無透視的語義特征[10]。
生成式對抗網絡(GAN)的出現也給類似被遮擋的車牌識別問題帶來曙光,將車牌識別率進一步提高。當然,車牌識別還會受到光照、傾斜度、陰影、字符磨損變形、運動等諸多因素影響[11],因此車牌識別仍需要繼續研究。