陳利娟 徐利華
摘 要:噪聲污染字符圖像的預處理是字符識別技術中一項關鍵技術,字符識別的準確度直接取決于字符圖的質量。基于消噪和數學形態學的基本原理,提出了一種預處理算法。仿真實驗驗證了所提出新算法的有效性和可行性。這種算法不僅能消除圖像中的噪聲,而且還有效地修復了筆劃斷裂的字符。新算法解決了識別筆劃缺損字符的識別難點,從而間接地提高了字符識別技術的準確度。
關鍵詞:數學形態學;加權平均;均值濾波;中值濾波;形態學濾波
中圖分類號:TP391
0 引 言
近年來,字符識別技術已發展成為當今一個熱門的主要研究領域,在許多領域都需要對字符做識別操作,例如:車牌字符識別、手寫體字符識別、運動工件上的字符識別等。字符圖像往往會受到各種噪聲的污染,以及字符筆劃斷裂情況等,這些都會嚴重影響字符識別的準確度。許多學者針對消噪提出了一些解決方案,如:基于直方圖特性的圖像去噪方法,基于數學形態學的圖像去噪方法,基于小波變換和中值濾波的圖像去噪方法等。該類方法為消除圖像噪聲,以及橋接筆畫斷裂字符提出了一些效果好,可行的算法。
1 理論基礎
文中用到的理論知識主要包括數學形態學、圖像的代數運算以及圖像濾波處理技術。
1.1 數學形態學方法原理
數學形態學是建立在積分幾何和隨機集論等嚴格數學理論基礎上的一門密切聯系實際的學科。它用于圖像處理的基本思想是利用一個稱作結構元素的“探針”,收集待處理圖像的信息,探針在圖像中不斷移動,即可考察圖像物體間的相互關系,提取出有用的特征。所有的形態學處理過程都是基于填充結構元素的概念。二值形態學中的運算對象是集合,通常給出一個圖像集合和一個結構元素集合,利用結構元素集合對圖像進行操作。
膨脹和腐蝕分別用數學符號“⊕”和“Θ”表示,若A,B是Z中的集合,h為空集,則A被結構元素B膨脹和腐蝕的定義
1.2 圖像的代數運算
代數運算是指對兩幅輸入圖像進行點對點的加、減、乘和除計算而得到輸出圖像的運算。圖像相加的┮桓霆重要應用是對同一場景的多幅圖像加權求取平均值,以達到消除加性隨機噪聲的目的。
式中:f(x,y)是靜止圖像;n璱(x,y)是加性隨機噪聲。┦(3)表明對N幅圖像平均可把噪聲方差減少㎞倍,N越大,g(x,y)就越接近于f(x,y),г肷的影響逐步減少。[JP]
1.3 濾波處理
濾波處理主要用于平滑圖像、消除圖像噪聲的目的,最常用的祛除噪聲方法是用濾波器進行濾波處理。可以根據不同的需要構造不同的空域濾波器,如均值濾波器、中值濾波器、維納濾波器等。
1.3.1 中值濾波
中值濾波是基于排序的非線性平滑濾波器,它既可消除噪聲,又能保護圖象的細節[9]。中值濾波步驟為:
(1) 將模板在圖像中漫游,并將模板中心與圖中┠掣霆像素位置重合;
(2) 讀取模板下各對應像素的灰度值;
(3) 將這些灰度值從小到大排成一列;
(4) 找出這些值中排在中間的一個;
(5) 將這個中間值賦給對應模板中心位置的像素。
[BT4]1.3.2 均值濾波
均值濾波是將一個像元及其鄰域中所有像元的平均值賦給輸出圖像中相應的相元,從而達到平滑的目的。
2 算法實現
本文采用加權平均、形態學腐蝕以及均值濾波相結合的方法實現了消噪,并且有效地實現了比劃斷裂字符的橋接功能。同時將新算法的處理結果與過去常用的算法處理結果做了比較。
2.1 新算法設計并仿真實現
本文稱這種算法為組合濾波橋接算法,算法設計步驟:
(1) 對噪聲圖像如圖1所示做加權平均操作,得到加權平均圖像,如圖2所示,在本文中加權次數取為100即可;
(2) 選取一個結構元素對加權平均圖像做膨脹操作,獲得膨脹圖像如圖3所示;
(3) 對膨脹圖像做均值濾波得到組合濾波橋接圖像,如圖4所示。
算法步驟說明,在經過步驟(1)后,由于加權平均消噪的原理可知,通過試探選擇合適的疊加次數,僅完全消除了黑色背景上的鹽噪聲,而白色字體上的椒噪聲仍然存在,并且從圖中可以看到由于椒噪聲的存在,使得字符筆劃不連通,產生了間斷。因此對加權平均圖像做膨脹操作,膨脹結構元素通過試探的方式選取,本文經試探選取的結構元素SE=[0,1,0;1,1,1;0,1,0]。從圖3可見,通過膨脹操作后,字符斷裂的筆劃被橋接上,但是其邊緣仍存在部分噪聲。所以需進行第(3)步的操作。可以看到,通過組合濾波橋接算法運算后,噪聲基本被消除,筆劃斷裂的字符被橋接上。可見,對圖4進行字符識別,可以大大提高其識別正確度,并且不再需要考慮字符筆劃斷裂的情況,因此用普通的字符識別算法就可得到很高的識別準確率。
2.2 組合濾波橋接算法與其他濾波橋接算法效果展示
為了能清晰地看出不同算法的濾波橋接效果,┩4~圖6放大了“ea”字符串。圖5是對受噪圖像直接中值濾波,再用結構元素SE橋接的效果圖;圖6是用常用的形態學濾波消噪,再用結構元素SE橋接的效果圖。