秦鵬++付先平++石婷潔
摘要:本文提出了一種新的基于統(tǒng)計(jì)特征的實(shí)時(shí)限速標(biāo)志識別算法。首先確定道路圖像中待處理的區(qū)域并利用SVF(Simple Vector Filter,以下簡稱SVF)進(jìn)行濾波處理。其次利用RGB空間進(jìn)行顏色分割,并利統(tǒng)計(jì)特征對非限速標(biāo)志進(jìn)行排除。最終利用縱橫投影的七段碼“8”字型手寫數(shù)字識別方法對提取的數(shù)字進(jìn)行識別。
關(guān)鍵詞:實(shí)時(shí) 統(tǒng)計(jì)特征 限速標(biāo)志
中圖分類號:TP391.41 文獻(xiàn)標(biāo)識碼:A 文章編號:1007-9416(2014)12-0125-03
1 介紹
從視頻圖像中識別限速標(biāo)志,尤其是實(shí)時(shí)的限速標(biāo)志識別,對于道路安全具有重要意義。本文提出了一種基于統(tǒng)計(jì)特征的實(shí)時(shí)限速標(biāo)志識別算法,可以識別視頻中的限速標(biāo)志。首先按照分區(qū)優(yōu)先搜索策略確定需要處理的圖像區(qū)域。其次,利用SVF向量濾波器對圖像進(jìn)行濾波處理,并利用RGB顏色空間進(jìn)行顏色分割。再次利用先驗(yàn)知識排除非限速標(biāo)志,從而最終確定感興趣區(qū)域ROI。最后在最終確定的感興趣區(qū)域中提取數(shù)字,并利用縱橫投影的七段碼“8”字型手寫數(shù)字識別方法對提取的數(shù)字進(jìn)行識別。
2 限速標(biāo)志識別算法
2.1 限速標(biāo)志的檢測
限速標(biāo)志的檢測包括分區(qū)處理、SVF濾波和顏色分割幾個(gè)過程。
2.1.1 分區(qū)處理策略
交通標(biāo)志一般都處于道路右側(cè)上方,根據(jù)這一情況,我們并不直接對圖像的所有像素點(diǎn)進(jìn)行處理,而是有選擇性的針對某一區(qū)域進(jìn)行搜索。由汪哲慎[1]的分區(qū)優(yōu)先搜索策略的啟發(fā),本文對其搜索策略進(jìn)行改進(jìn),對圖像的像素進(jìn)行有選擇性的處理。分區(qū)示意圖如圖1:
圖1中的W、H分別為圖像的寬度與高度。通常情況下,交通標(biāo)志出現(xiàn)在圖像的1級搜索區(qū)域中,如果在此區(qū)域內(nèi)搜索失敗,則擴(kuò)大搜索范圍,在2級搜索區(qū)域內(nèi)進(jìn)行搜索,如果搜索失敗,則在3級搜索區(qū)域,即全圖搜索。
圖2便是從視頻中提取的單幀原始圖像initImg的搜索區(qū)域以及分割后的子圖subImg示意圖,交通標(biāo)志處于1級搜索區(qū)域中,即圖中的紅色矩形區(qū)域內(nèi),我們的后續(xù)工作都是在此區(qū)域中進(jìn)行。
2.1.2 預(yù)處理
由于RGB三分量的相關(guān)性,對原始圖像的預(yù)處理往往會(huì)改變像素點(diǎn)的顏色,從而造成識別錯(cuò)誤。為了盡量保留像素的顏色信息,我們將在后面的各個(gè)步驟中對噪聲進(jìn)行去除。本文利用Asakura等人[2]提出簡單向量濾波器(SVF,Simple Vector Filter)對搜索區(qū)域進(jìn)行濾波,以此來去除非彩色區(qū)域,以減少后續(xù)工作需要處理的像素。首先創(chuàng)建與subImg大小相同二值圖bImg_SVF,再將bImg_SVF中與子圖subImg中彩色的像素點(diǎn)對應(yīng)位置的值賦值為1,否則為0。
2.1.3 基于RGB空間的快速顏色分割
在去掉非彩色的圖像基礎(chǔ)上進(jìn)行顏色分割,考慮到實(shí)時(shí)性,本文使用RGB顏色空間。經(jīng)過大量實(shí)驗(yàn),本文采用楊修銘[3]的RGB空間分割方法,滿足如式(3.1)的像素點(diǎn)被認(rèn)為是紅色像素:
(3.1)
這里R、G、B表示像素點(diǎn)的亮度分量。我們在圖像subImg中找到滿足公式的像素位置,并將二值圖bImg_SVF中相應(yīng)位置的像素置為1,否則為0。利用這種方法對圖像進(jìn)行進(jìn)一步分割,得到二值圖bImg_RGB。再利用形態(tài)學(xué)開操作對圖像進(jìn)行去噪處理,得到二值圖bImg_OPEN。結(jié)果如圖3:
2.2 根據(jù)先驗(yàn)知識排除非限速標(biāo)志
僅僅依靠顏色分割只能找到紅色的區(qū)域,而不能準(zhǔn)確定位那些區(qū)域?yàn)橄匏贅?biāo)志區(qū)域。所以我們需要在顏色檢測的基礎(chǔ)上進(jìn)行進(jìn)一步處理。首先我們對bImg_OPEN進(jìn)行連通區(qū)域標(biāo)記,然后根據(jù)限速標(biāo)志的形狀特征的特點(diǎn),對非限速標(biāo)志進(jìn)行排除。排除時(shí)需要利用限速標(biāo)志的統(tǒng)計(jì)特征。所以下面先進(jìn)行限速標(biāo)志分析。
2.2.1 限速標(biāo)志形狀分析
本文允許的交通標(biāo)志的最大形變程度為交通標(biāo)志max(w,h)與min(w,h)的比值
(3.2)
其中w、h分別為是外接矩形的寬度和高度。下面我們對極限情況下的變形交通標(biāo)志進(jìn)行分析,未變形的交通標(biāo)志可以看作是變形交通標(biāo)志的特例。不失一般性,我們用圖4來進(jìn)行分析:
圖4中的紅色矩形框?yàn)榻煌?biāo)志的外接矩形,A、B分別為代表交通標(biāo)志外部和內(nèi)部形狀的兩個(gè)橢圓。按照上圖所示,交通標(biāo)志紅色像素占外接矩形面積的比例
(3.3)
SA與SB分別為橢圓A與B的面積,SRA為橢圓A外接矩形的面積。我們假定極限情況下橢圓B的長短軸分別為A的一半,則Rr=0.5890。另外,我們記錄SB與交通標(biāo)志外接矩形面積的比值
(3.4)
在上圖中,Rn=0.1963。此外,計(jì)算內(nèi)部橢圓B外接矩形中所包含的紅色像素?cái)?shù)量與交通標(biāo)志外接矩形面積的比值
(3.5)
SRA、SRB為橢圓A與B外接矩形的面積。在上圖中,Ri=0.0537。Rn與Ri這兩個(gè)數(shù)值將在數(shù)字識別與非限速交通標(biāo)志排除的過程中使用。
2.2.2 排除非限速標(biāo)志
首先對bImg_OPEN進(jìn)行連通區(qū)域標(biāo)記,然后按照如下規(guī)則進(jìn)行排除:
(1)如果連通區(qū)域的像素面積小于300,則認(rèn)為不是交通標(biāo)志,否則進(jìn)行下一步判斷。
(2)本文允許的最大形變量Rd≤2,若Rd>2,則認(rèn)為不是交通標(biāo)志,否則進(jìn)行下一步判斷。
(3)交通標(biāo)志中的紅色像素的數(shù)量占其外接矩形面積的比例是一定的,若比例超過閾值Tr的連通區(qū)域可以認(rèn)為不是交通標(biāo)志。根據(jù)上一節(jié)計(jì)算得到的,我們可以將Tr賦值為Rr,即若連通區(qū)域內(nèi)的白色像素個(gè)數(shù)與外接矩形面的比值大于Rr,則認(rèn)為不是交通標(biāo)志,否則進(jìn)行下一步判斷。endprint
(4)計(jì)算圓形度。圓形度可以在一定程度上反映圖像與圓的近似程度。圓形度定義為metric=4πS/C2,metric∈[0,1],其中,S為連通區(qū)域的面積,C為連通區(qū)域的周長。當(dāng)填充后的連通區(qū)域?yàn)閳A形時(shí),metric=1。根據(jù)Rd≤2,我們可知,理論上限速標(biāo)志的填充連通區(qū)域的圓形度不會(huì)低于metrics=4πSA/CA2,,其中SA為橢圓A的面積,CA為利用近似公式π(3(a+b)/2-(ab)1/2)計(jì)算得到的橢圓A的周長,其中a,b為橢圓的半軸長度。根據(jù)圓形度計(jì)算公式,metrics=0.8402。考慮到噪聲影響,如果某填充后的連通區(qū)域圓形度低于0.8,則認(rèn)為不是交通標(biāo)志,否則進(jìn)行下一步判斷。
(5)限速標(biāo)志的內(nèi)部不含有紅色像素,所以我們在bImg_OPEN中連通區(qū)域外接矩形中的固定區(qū)域x∈[w/4,3w/4]且y∈[h/4,3h/4]中進(jìn)行搜索并對白色像素進(jìn)行統(tǒng)計(jì),w、h分別為連通區(qū)域外接矩形的寬度和高度。如果白色像素?cái)?shù)目與連通區(qū)域外接矩形的面積之比超過Ti,則認(rèn)為不是交通標(biāo)志。Ti的取值為前面得到的Ri=0.0537,但由于考慮到噪聲影響,我們將Ti設(shè)為0.06。
(6)盡管除了限速標(biāo)志之外,還有很多交通標(biāo)志中間沒有紅色像素,但是其內(nèi)部的圖案與限速標(biāo)志差異很大,在禁令標(biāo)志中,只有限速標(biāo)志內(nèi)部圖案的高度相似,而其他交通標(biāo)志的內(nèi)部連通區(qū)域的高度相差很大。所以我們首先提取bImg_OPEN中黑色像素面積最大的連通區(qū)域作為交通標(biāo)志內(nèi)部區(qū)域,在內(nèi)部區(qū)域中將原始圖subImg中對應(yīng)的部分進(jìn)行灰度化,并進(jìn)行灰度變換以增強(qiáng)對比度,然后進(jìn)行二值化處理、去噪并提取連通區(qū)域。
2.3 數(shù)字識別
2.3.1 數(shù)字圖像預(yù)處理
由于數(shù)字部分可能由于拍攝角度的不同,可能使數(shù)字產(chǎn)生傾斜。本文采用最小二乘法對圖像進(jìn)行傾斜校正。并利用統(tǒng)計(jì)直方圖對數(shù)字圖像進(jìn)行字符分割。之后將分割后的數(shù)字進(jìn)行歸一化為24行16列,并提取其骨架。
2.3.2 數(shù)字識別
接下來,本文對縱橫投影的七段碼“8”字型手寫數(shù)字識別[4]的方法加以改進(jìn),并用該算法對數(shù)字進(jìn)行識別。該算法的基本思想是根據(jù)數(shù)字的外形特征將數(shù)字在七段碼“8”字的各框上進(jìn)行投影,將其規(guī)范化為標(biāo)準(zhǔn)數(shù)字再進(jìn)行識別。
該方法首先將數(shù)字骨架投影到“8”字型的7個(gè)字框上,然后按照一定規(guī)則將投影規(guī)范化,最后根據(jù)判別策略進(jìn)行判別和匹配。
由于數(shù)字不規(guī)范等情況造成的變形會(huì)使同一個(gè)數(shù)字存在不同的投影,某些數(shù)字如1,4,6,9并不只有唯一的字框投影。而原算法針對每個(gè)數(shù)字只有一個(gè)對應(yīng)的模板,本文對該算法進(jìn)行改進(jìn),對于可能發(fā)生變形的數(shù)字設(shè)置了多套模板進(jìn)行匹配。
3 實(shí)驗(yàn)結(jié)果
圖5是從不同視頻中提取的幀圖像。圖像中的右下角為檢測出的限速標(biāo)志的內(nèi)部區(qū)域圖。
J.Miura等人[5]中的識別系統(tǒng)包括一個(gè)廣角鏡頭和一個(gè)長焦鏡頭,由長焦鏡頭對廣角鏡頭中的感興趣區(qū)域進(jìn)行放大,接著利用YUV空間進(jìn)行顏色分割,并利用Hough變換確定標(biāo)志形狀,最后利用模板匹配識別限速標(biāo)志。該系統(tǒng)的每幀識別速度約為440-520ms,限速標(biāo)志的檢測成功率為97.2%,識別率為46.5%。S. Estable等人[6]通過神經(jīng)網(wǎng)絡(luò)進(jìn)行顏色分割,接著對形狀進(jìn)行輪廓分析,最后對交通標(biāo)志的特征圖(Pictogram)利用訓(xùn)練好的統(tǒng)計(jì)分類器進(jìn)行識別。該系統(tǒng)的識別速度則低于200ms,整體檢測成功率約為90%。
本文利用Matlab對算法進(jìn)行仿真,盡管第一幀識別速度較慢,約為1.3630s,但是后續(xù)幀的識別速度大大提高,可以達(dá)到0.1440s。限速標(biāo)志檢測成功率約為90%,數(shù)字識別率約為70%。如果利用硬件加速,則可以進(jìn)一步提高處理速度[7]。
4 結(jié)語
本算法可以在視頻圖像中識別限速標(biāo)志,由于沒有采用過于復(fù)雜的算法,所以除了第一幀識別速度較慢之外,后續(xù)幀的識別速度較為理想。然而在視頻圖像過于模糊或噪聲干擾強(qiáng)烈的情況下,感興趣區(qū)域ROI以及交通標(biāo)志內(nèi)部連通區(qū)域的提取將會(huì)受到影響,導(dǎo)致本算法的識別率降低。但是隨著車輛行駛,限速標(biāo)志的可視面積不斷增大,本算法仍然可以達(dá)到理想的效果。
參考文獻(xiàn)
[1]汪哲慎.復(fù)雜場景下交通標(biāo)志檢測技術(shù)研究:(碩士學(xué)位論文).廈門:廈門大學(xué),2006.
[2]馬碧燕,鄭勝林,趙全友.縱橫投影的七段碼"8"字型手寫數(shù)字識別.廣東工業(yè)大學(xué)學(xué)報(bào),23(3):113-117,2006.
[3]秦鵬.駕駛行為評測系統(tǒng)中限速標(biāo)志識別方法的研究:(碩士學(xué)位論文).大連:大連海事大學(xué),2010.endprint