摘要:提出一種基于均值聚類的車牌定位算法,該算法能避免由于環境的復雜而帶來的定位的不確定性。
關鍵詞:車牌定位;HLS顏色空間;圖像分割;K-均值聚類
1、引言
近年來國內的機動車輛大規模大幅度增加,車輛的自動識別技術在公共安全、交通管理和軍事部門等有廣泛的應用,成為智能交通領域應用的重要研究課題之一。一般車牌識別系統的識別率和識別速度有待提高,特別是車牌定位方面,還沒有一種統一合適的定位和識別方法。任何基于二值圖像處理的思路進行的定位方法都具有一定環境變化的不適應性。目前車牌定位的算法主要有:基于紋理特征的車牌定位法、基于神經網絡的定位算法、基于特征統計的車牌定位、基于數學形態學的定位方法、基于改進Sobel算子邊緣檢測法等等。本文所提出的聚類分析算法在HLS顏色空間下,用聚類中心的方法將車牌圖像中的像素點分為白、黑、黃和藍四種顏色群,結合數字圖像學中的腐蝕和膨脹等技術找出具有車牌特征的區域,從而達到車牌定位的目的。
2、基于均值聚類的車牌的定位算法
汽車車牌的識別過程主要包括車牌定位、字符車牌分割和車牌字符識別三個關鍵環節。而車牌定位是車牌識別系統中的第一步,它的準確行直接影響著車牌字符識別的效率。
首先監控裝置得到原始圖像,然后對圖像進行濾波,邊界增強等處理以克服圖像干擾預處理以增強效果,接下來通過邊緣檢測算法,二值化處理,得到圖像的邊緣,最后采用均值聚類思想對車牌進行定位。
車牌定位主要利用車牌邊緣、形狀、顏色等特性,再結合數字特性處理、形態學小波變換、人工神經元網絡等技術對車牌進行定位,定位之后,再通過神經網絡識別出每個字符,從而通過計算機知道識別出圖片上的車牌號碼。
2.1 HLS顏色空間
顏色空間按照基本結構可以分成兩大類:基色顏色空間和色、亮分離顏色空間。被人們熟知的RGB就屬于前者;而HLS(Hue色度,Lightness亮度,Saturation飽和度)顏色空間則屬于后者的一個子類型“色相類顏色空間”,HLS將顏色分成一個代表亮的屬性和兩個表示色的屬性。HLS顏色空間相比RGB顏色空間,在復雜背景的環境下較容易進行顏色提取,因此,本定位算法中采用HLS顏色空間。
2.2 基于HLS顏色的均值聚類算法原理
K-meaDS算法的基本思想是:以空間中k個點為中心進行聚類,對最靠近他們的對象歸類。通過迭代的方法,逐次更新各聚類中心的值,直至得到最好的聚類結果。
算法步驟如下:第一步:選K個初始聚類中心,z1(1),z2(1),…,zK(1),其中括號內的序號為尋找聚類中心的迭代運算的次序號。聚類中心的向量值可任意設定,例如可選開始的K個模式樣本的向量值作為初始聚類中心。第二步:逐個將需分類的模式樣本(x)按最小距離準則分配給K個聚類中心中的某一個zj(1)。假設i=j時。其中k為迭代運算的次序號,第一次迭代k=1,sj表示第j個聚類,其聚類中心為zj。第三步:計算各個聚類中心的新的向量值,zj(k+1),j=l,2,…,K求各聚類域中所包含樣本的均值向量:其中Nj為第j個聚類域sj中所包含的樣本個數。以均值向量作為新的聚類中心,可使如下聚類準則函數最小:在這一步中要分別計算K個聚類中的樣本均值向量,所以稱之為k-均值算法。第四步:若,j=1,2,…,K,則返回第二步,將模式樣本逐個重新分類,重復迭代運算;若,j=1,2,…,K,則算法收斂,計算結束。
2.3 車牌區域的分割和分割后的處理
對不同顏色車牌圖片進行數學上的統計,得到常用的白、黃、藍、黑等4個底色的初始中心,然后用K-Means:Y法對車輛圖片中屬于該類別的所有點去均值聚類調整顏色類別的中心二得到只有4種顏色大塊的車牌圖片,再在這個四色圖中選擇出車牌區域。
經過K-Means算法處理后的車身和背景圖像只包含了4種中國車牌的白、黃、藍、黑等四種顏色。但是車牌圖像分割以后,所得到的車牌中還有一些斷點、裂縫和孤立的小小像素,需要對其進一步進行腐蝕運算和膨脹運算等數學形態學的處理。數學形態非線性濾波,可以用于抑制噪聲,進行特征提取、邊緣檢測、圖像分割等圖像處理問題。
2.4 車牌區域的定位
分割后的車牌區域由4種顏色組成,對于不同的顏色需要找出符合車牌長寬比的區域,并根據先驗知識,比較誰的寬高比更接近實際車牌寬高比,將更接近的提取并顯示出來。為了優化矩形區域搜索效率,需要事先統計不同地方、不同類型車輛出現的概率,然后根據車輛出現的概率大小依次進行分類搜索,如在市中心藍牌車輛出現的概率最大,則先搜索藍牌的符合車牌特征(長度、寬帶以及長寬比)的連通區域作為候選區域,并對其進行標識。
本文所提出的基于K-Means均值聚類的車牌定位算法,在HLS顏色空間下,用自定義聚類中心的方法將車牌圖像中的像素點分為白、黑、黃和藍四種顏色群,結合數字圖像學中的腐蝕和膨脹等技術找出具有車牌特征的區域,從而達到定位車牌的目的。該算法與灰度化或二值化處理的定位方法相比,由于處理的對象始終是彩色圖像,而不是灰度圖像,因此避免了由于環境的復雜而帶來的定位的不確定性。