董 春,孫 力,全慶霄
(1.江南大學 物聯網工程學院,江蘇 無錫214122;2.江陰蘇陽電子股份有限公司 江蘇 江陰214421)
一種改進的激光打印圖像預處理方法
董 春1,孫 力1,全慶霄2
(1.江南大學 物聯網工程學院,江蘇 無錫214122;2.江陰蘇陽電子股份有限公司 江蘇 江陰214421)
針對激光打印圖像字符不夠鮮明、噪聲太多的特點,提出了一種基于新型組合濾波算法與改進的Niblack法結合的激光打印圖像預處理方法。傳統的Niblack法,較好地保留了字符特征,但是出現了過多噪音雜點,效果不理想。該方法首先用Niblack法對圖像二值化,同時應用自適應中值濾波模糊噪聲和非噪聲點對應的形態學濾波設計一種新型組合濾波器,建立恰當濾波窗口,保護更多的圖像細節,增強圖像邊緣。實驗結果表明該方法可有效地過濾激光打印圖像中的噪聲,獲得了較好的二值化圖像,具有一定的實用價值。
預處理;Niblack法;自適應中值濾波;形態學濾波
印記自動識別系統是集成電路行業實現自動化生產管理模式的重要環節之一。印記是高能激光束汽化塑封料表面形成的標記,屬于激光打印圖像。由于印記形成環境復雜,以及在采集傳輸過程中會受到各種因素的影響,如系統噪聲、光照不均等。這些使激光打印圖像不可避免地受到不同程度的脈沖噪聲污染,嚴重影響了圖像的質量。激光打印圖像預處理方法的優劣直接影響到后期印記的識別。因此對激光打印圖像預處理方法的研究就顯得十分重要。
圖像的預處理包括圖像灰度化、圖像二值化以及圖像平滑去噪等過程,而激光打印圖像中含有多種不同程度的噪聲,這使得激光打印圖像的預處理工作增加了難度。特別是如何確定激光打印圖像二值化的閾值以及噪聲濾波器。近年來,國內外研究者對圖像預處理方法做了大量的研究工作,其中包括研究圖像的二值化[1-3]、噪聲濾除[4-6]以及圖像增強[7]等工作,但是仍沒有人研究出一種適用于激光打印圖像的預處理方法。
針對激光打印圖像的特殊性,需要尋找一種特殊的預處理方法,通過大量仿真實驗及定量評價指標對比,本文提出了一種基于新型組合濾波算法與Niblack法結合的激光打印圖像預處理方法。該方法通過設計一種新型組合濾波器與Niblack法相結合,以有效提高濾波器濾除噪聲和保留圖像細節信息的能力,預處理效果明顯。
到目前為止,還沒有一種專門針對激光打印圖像的二值化方法。尋找更好的激光打印圖像二值化方法,仍然是印記識別研究領域的目標之一。二值化方法可分為全局閾值法和局部閾值法[8]。全局閾值法對于目標和背景明顯分離、直方圖分布呈雙峰的圖像效果良好,但對光照不均勻、噪聲干擾較大的圖像,二值化效果明顯變差。典型的局部閾值法有均值分割法、Bernsen法、Niblack法等。局部閾值法較全局閾值法有更廣泛的應用,但缺點也較為明顯,比如速度慢、容易出現偽影現象和筆畫斷裂現象。Niblack法容易產生大量背景噪聲的缺點,但對于低對比度的印記圖像有更好的適應性[9]。3種常用的二值化方法效果如圖1所示。

圖1 3種常用的二值化方法效果圖
激光打印圖像含有大量復雜的噪聲,通常在二值化之前需要進行濾波處理。一般地,常用的濾波方法包括三類[10]:一類是經典濾波算法及在此基礎上的改進和提升算法,例如中值濾波、自適應中值濾波、開關中值濾波等;另一類是以嚴密數學理論為基礎的濾波算法,如偏微分方程濾波、形態學濾波、小波去噪等;第三類是通過將現有的濾波算法進行不同程度的組合,充分發揮各自的濾波優勢,實現對噪聲的多級濾除。針對激光打印圖像噪聲的降噪問題,借鑒組合濾波算法基本思想,嘗試將改進的自適應中值濾波與形態學濾波相結合實現對印記圖像噪聲的逐級濾除。
自適應中值濾波[11]是根據噪聲密度大小來確定濾波窗口尺寸,改善了去噪效果,但其細節保護能力較弱,容易造成圖像模糊。形態學濾波是一種非線性的濾波運算,基本的形態學運算是開運算和閉運算,是數學形態學腐蝕和膨脹基本運算的二級運算。因此,可根據需要選擇不同形式的濾波運算來消除或者抑制噪聲。形態學運算處理圖像的效果與結構元素形狀、大小的選取有直接關系,這還需要根據目標圖像的特征具體研究與分析[12]。特別是處理激光打印圖像時,圖像中聚集了大量的噪聲點,噪聲點周圍也往往全是噪聲點。這時,對噪聲點進行濾波處理,如果只采用一種濾波算法,濾噪效果不明顯,并且還會損失印記圖像細節。
在實際環境下,由于各種客觀原因,如采集時的光照、機器、塑封料的模糊等,都使得原始激光打印圖像需要經過一系列的處理才能進行下一步的印記識別。這些處理包括圖像的灰度變換、二值化、去噪、濾波、圖像增強等。文中采用灰度變換、自適應中值濾波、二值化和形態學方法相結合的預處理方法,如圖2所示。由于激光打印圖像的種類較多,不利于圖像處理,因此文中首先將激光打印圖像轉換為灰度圖像;然后采用自適應中值濾波對圖像進行濾波處理,使圖像明暗更加清晰,減少邊緣模糊;再選用Niblack法對圖像進行二值化處理,使圖像變為只有黑白二色的二值圖像,把印記特征更加清晰地突顯出來;最后選擇數學形態學方法對二值后的圖像進一步處理,濾除散落的噪音雜點以及增強圖像邊緣。

圖2 本文預處理方法流程圖
3.1 極值法噪聲檢測
經過灰度變換后的激光打印圖像,其對比度比較低,若直接對圖像用Niblack法二值化,二值化圖像模糊,印記邊緣不清晰。為了后面能更好地提取圖像特征,這里需要對灰度化圖像進行噪聲濾除工作。首先對印記圖像進行噪聲點檢測,如果中心像素是信號則保留,如果中心像素為噪聲則需對圖像進行濾波處理。一般印記圖像在顯示時,噪聲點會隨機分布地表現為黑色或白色,而且出現的概率相等,其灰度值為極小值或極大值(0或255)。
設激光打印圖像G尺寸為N×N,其噪聲概率為p0,而g(i,j),f(i,j)分別為原始圖像和噪聲圖像的灰度值函數[13]。現依據激光打印圖像噪聲特點,選取噪聲圖像的灰度值函數的數學模型為:

其中i,j=1,2,…,N,p(g(i,j))表示當像素點(i,j)的灰度值為g(i,j)時,該點受到噪聲污染的概率。
從上述模型明顯可以看出,圖像中共有N2×p0個噪聲點,而且受污染的像素點(i,j)的灰度值f(i,j)與其相鄰像素點的灰度值互不影響。因此,基于這一思想,文中采用極值法檢測激光打印圖像的噪聲,即若某個像素點(i,j)的灰度值g(i,j)為0或255,則可認為該像素點可能為噪聲,并對檢測出的噪聲點進行濾除,而非噪聲點直接保留即可。
3.2 自適應中值濾波
對于激光打印圖像高密度噪聲污染而言,噪聲濾除的效果受窗口大小影響,若采用較小鄰域作為濾波窗口,則可能窗口內完全不存在非噪聲點,還會將噪聲擴散;若將濾波窗口擴大,則在濾波窗口內部會引入離中心像素較遠的非噪聲點,從而出現新的誤差,造成濾波圖像模糊不清。為避免上述一些缺陷,通常對極值法檢測出的每個噪聲點建立恰當濾波窗口,以便在窗口內找到非噪聲點的同時,又不會引入新的偏差。
為了充分利用濾波窗口濾除噪聲,通過迭代擴大窗口來選取恰當濾波窗口尺寸,直到窗口中包含非噪聲點為止。一般地,在邊心距為1的3×3鄰域內,極值法檢測出的噪聲點個數為nun(i,j),根據nun(i,j)的值來確定濾波窗口大小。濾波窗口的大小K(i,j)根據nun(i,j)自適應地確定,確定規則如下[14]:

在激光打印圖像G中為了更好的保留圖像細節,文中采用極值法檢測噪聲,并對其建立恰當濾波窗口,利用中值濾波思想設計了如下濾波器。首先采用極值法檢測激光打印圖像所受到的噪聲,并且將像素點分為噪聲點和非噪聲點。為了減少其算法的復雜程度,我們只對噪聲點進行濾除,對非噪聲點直接保留其灰度值。其次,以每個噪聲點為中心建立邊心距為1的3×3濾波窗口,并在窗口內檢測周圍的其他像素點中是否還存在非噪聲點,若存在,則采用3×3濾波窗口;若不存在,則擴大為邊心距為2的5×5濾波窗口,進而繼續去檢測窗口內的非噪聲點,反復進行直到找到窗口內的所有非噪聲點為止。此時,濾波窗口不再被擴大,因此可對每個噪聲點創建恰當的濾波窗口。
3.3 Niblack法二值化
下面對經過自適應中值濾波處理后的激光打印圖像,進一步應用圖像二值化處理技術將印記的特征與背景信息進行分離,提取印記字符的幾何特性,以便后續進行印記字符識別。為了可以在盡可能多地保留激光打印圖像印記信息的基礎上去除亢余信息,選擇一個合理的閾值就顯得至關重要。文中選用對低對比度的印記圖像有更好適應性的Niblack法進行二值化。Niblack法是一種常見且有效的局部閾值算法,它的基本思想是對圖像中的每一個點,在它的R×R鄰域內,計算鄰域中像素點的均值和方差,然后用下面的公式計算閾值進行二值化[15]:

式中:T(x,y)是像素點(x,y)處的閾值;n(x,y)是該點R× R鄰域內所有像素點的均值;s(x,y)是該點R×R鄰域內所有像素點的標準方差;k為修正系數,確定選取多大的字符目標邊界來作為給定目標的一部分。當K的取值不斷增大,噪聲幾乎完全消除,但是字符筆畫越來越細,越來越模糊不清。
選取適當的鄰域大小和K值對算法的結果是至關重要的。在本文中鄰域的大小是根據上文自適應濾波窗口的大小來選取,因此本文Niblack法鄰域大小的選取是基于激光打印圖像噪聲點分布情況決定的,也是自適應的調整鄰域大小。而K值的選擇和激光打印圖像本身的灰度值有關。假設選取30×30這一固定鄰域的情況下,不同K值的二值化效果如圖3所示。由圖中可以看出:當K=0時,圖像有較多噪 值化效果已經很好,K值的增加僅僅是使印記字符變細。因此在本文改進的Niblack法中,采用K值為-0.2,保留了字符特征的同時,盡量減少噪聲。

圖3 不同K值的二值化效果圖
3.4 形態學濾波
激光打印圖像用上述方法處理后,噪聲不均勻等現象有了很大的改善,如圖4(b)所示,該圖像含有一些干擾點和小區域,但是卻包含了原始激光打印圖像印記的絕大部分特征,表明改進的Niblack法能成功對圖像二值化,為了改善圖像的視覺效果,得到清楚的二值化圖像,必須對圖像進一步濾除雜點,同時對部分斷裂的字符進行圖像增強,這就需要用到形態學濾波方法,它既能有效去除噪聲,又可增強圖像、保留圖像原有的細節信息。
由于文中二值化算法是基于Niblack法,根據Niblack法的特點,二值化的圖像不僅存在散落的噪音雜點而且還會有部分印記字符斷裂。因此,還需對處理后的激光打印圖像進行形態學運算。形態學運算是物體形狀集合與結構元素之間的相互作用,能抑制噪聲和增強圖像。圖像增強是在原始圖像上增強圖像中的有用信息,將原來不清晰、斷裂的圖像變得清晰或者加強某些特征,擴大圖像中不同物體特征之間的差別,從而改善圖像質量、豐富圖像的信息量,加強圖像的識別效果。
文中形態學運算包括開運算和閉運算,開運算是用結構元素B先對待處理的圖像A進行腐蝕,然后進行膨脹;閉運算是用結構元素B先對待處理的圖像A進行膨脹,然后進行腐蝕。如圖4所示,圖4(b)是待處理的圖像A,B選用十字型3×3結構元素,首先用B對A先進行開運算,清除背景中得小結構,濾除孤立的噪聲雜點;然后用B對A進行閉運算,實現對背景中不包含結構元素的部分填充,連接斷裂的字符。圖4(a)是最大灰度值為255的源圖像。圖4(b)為經過自適應中值濾波后又用Niblack法二值化得到的圖像,圖4(c)為圖4(b)經過形態學運算后的圖像。
為了證實該預處理方法的有效性,隨機采集了3張不同的印記圖像,他們的亮度、對比度、噪聲程度等各不相同。本文預處理方法效果如圖5所示:克服了激光打印圖像容易受到噪聲污染,對比度低的缺點,沒有出現印記字符斷裂和大量聚集噪音現象,預處理效果理想,為后續的印記分割、識別等工作做好了充分的準備。
另外,文中采集了300張激光打印圖像,將每100張隨機作為一個實驗樣本,經過文中預處理方法處理后,統計分析其預處理效果,統計結果如表1所示。表1數據客觀地表明了文中預處理方法有很好的預處理性能,3個實驗樣本預處理質量均達到92%以上,其中預處理結果圖包含了原始印記圖像的絕大部分信息,噪聲濾除明顯,細節保留豐富,預處理效果好,用時少。

圖4 預處理過程中產生的圖像

圖5 本文預處理方法效果對比

表1 預處理結果統計表
文中在自適應中值濾波的原理及算法的基礎上再結合形態學,得到一種基于新型組合濾波算法與改進的Niblack法結合的激光打印圖像預處理方法,該預處理方法有效克服了激光打印圖像質量差的缺點,改進的Niblack法二值化效果要優于Otsu等常用的二值化方法,優化了二值化過程,減少了算法的計算量,成功實現了激光打印圖像的二值化效果,而且預處理后的圖像噪聲濾除明顯,印記細節信息保留豐富。在同類的集成電路封裝產品印記識別領域都有一定的應用價值。實驗結果表明,該方法在實際應用中對印記自動識別率是有用的,且優于傳統預處理方法。
[1]童立靖,張艷,舒巍.幾種文本圖像二值化方法的對比分析[J].北方工業大學學報,2011(1):25-33.
[2]申森,李艾華,姚良,等.基于小波包和Niblack法的槍號圖像二值化算法[J].光子學報,2013,42(3):354-358.
[3]孫少林,馬志強,湯偉.灰度圖像二值化算法研究[J].價值工程,2010,29(5):142-143.
[4]劉國宏,郭文明.改進的中值濾波去噪算法應用分析[J].計算機工程與應用,2010,46(10):187-189.
[5]Zhu Youlian,Huang Cheng.An improved median filtering algorithm for image noise reduction [J].Physics Procedia,2012,25:609-616.
[6]張成斌,王開福.基于形態開閉算子的高濃度椒鹽噪聲去除方法[J].計算機工程,2015,41(2):199-202.
[7]段先知,丁亞軍,錢盛友,等.改進型快速ICA算法與數學形態學結合的圖像分割方法[J].微電子學與計算機,2015,32(2):80-84.
[8]章毓晉.圖像工程(上冊)-圖像處理[M].2版.北京:清華大學出版社,2006.
[9]Niblack W.An Introduction to Image Processing[M]. Prentice-Hall,Inc,1986:115-116.
[10]姚宏.一種基于椒鹽噪聲新型組合濾波算法仿真研究[J].電視技術,2015,38(1):39-42.
[11]孫海英,李鋒,商慧亮.改進的變分自適應中值濾波算法[J].電子與信息學報,2011,33(7):1743-1747.
[12]Soille P.形態學圖像分析原理與應用[M].2版.王小鵬,譯.北京:清華大學出版社,2008.
[13]王貴君,楊永強.基于高概率椒鹽噪聲的模糊濾波器在圖像恢復中的算法設計[J].電子學報,2015(1):24-29.
[14]段群,吳粉俠,劉小豫.基于CUDA的椒鹽噪聲自適應中值濾波算法[J].航空計算技術,2013,43(2):60-63.
[15]卜飛宇.一種改進的文本圖像二值化方法[J].電腦知識與技術,2014,10(12):2822-2824.
An improved preprocessing method of laser printing image
DONG Chun1,SUN Li1,QUAN Qing-xiao2
(1.School of Internet of Things,Jiangnan University,Wuxi 214122,China;2.Jiangyin Sunny Crient Technology Co,Ltd,Jiangyin 214421,China)
Aiming at the characteristics of the laser printing image that characters are not bright enough and too much noise,a preprocessing method based on combination of the new combination filtering and the improved niblack algorithm is proposed. Traditional Niblack algorithm can be better to retain the characteristics of the characters,but appear too noisy miscellaneous points,the used result is not satisfactory.This method can establish appropriate filtering window,protect more image details,and enhance image edges,that the image is binarized for by Niblack algorithm,and designed a new type of composite filter by combining with the adaptive median filtering to fuzzy noise and the morphological filtering for the non noise points.The experimental results demonstate that this method can effectively filter the noise in the laser printing image,obtain the better binary image,and it has a certain practical value.
preprocessing;Niblack algorithm;the adaptive median filtering;the Morphological filtering
TN249
A
1674-6236(2016)24-0176-04
2016-01-11 稿件編號:201601066
董 春(1990—),女,山東肥城人,碩士研究生。研究方向:圖像識別技術。