張思俊,王樂樂,宦 海,陸振宇
(南京信息工程大學(xué)電子與信息工程學(xué)院,江蘇南京 210044)
隨著智能手機(jī)的普及,信息分享的速度越來越快。很多人喜歡用手機(jī)隨時拍下自己的所見所聞。例如,在課堂上,如果來不及記錄老師的PPT,很多同學(xué)會用手機(jī)直接拍下黑板上的影像回去再慢慢整理。不過,由于手機(jī)的拍攝功能遠(yuǎn)沒有相機(jī)專業(yè),加之多是在1~2 s的短時間內(nèi)迅速完成的拍照,更無暇考慮光線的問題,因而導(dǎo)致拍攝的內(nèi)容不清晰。這種在不規(guī)則光線下拍攝的圖片上會出現(xiàn)大塊的陰影、噪聲點(diǎn)或者是局部出現(xiàn)高光,直接影響了有效信息的讀取。針對這些問題,提出了自適應(yīng)閾值處理分割的有效信息提取方法,較好地解決了問題。
對于原始圖像首先是進(jìn)行前期處理,這樣可以濾除一部分噪聲的影響以及其他一些無關(guān)信息,增強(qiáng)圖像的品質(zhì)以便于之后的分割。通常圖像預(yù)處理過程包括:數(shù)字化、幾何變換、歸一化、平滑、復(fù)原和增強(qiáng)等步驟[1]。但文中的預(yù)處理主要是進(jìn)行圖像灰度化處理,將彩色的原始圖像轉(zhuǎn)換為灰度圖。此時顏色并不是目標(biāo)信息,灰度處理能降低需要處理的信息量,排除不必要的干擾。在處理后圖像的基礎(chǔ)上再進(jìn)行前景背景的分割,效果會更好。圖1是原始圖像和經(jīng)過預(yù)處理后的圖像。

圖1 原始圖片與預(yù)處理圖片對比
通常圖像二值化是一種特殊的閾值分割法。設(shè)原始圖像為f(x,y),按一定的準(zhǔn)則在原始圖像f(x,y)中找到特征值T,將圖像分割為兩個部分。如指定b0=0(黑),b1=1(白),得出的就是二值化的圖像[2]。閾值分割方法是在區(qū)域圖像分割技術(shù)的基礎(chǔ)上,像上述這樣通過設(shè)定不同的特征閾值,對圖像像素點(diǎn)進(jìn)行分類,再按照特征閾值進(jìn)行分割的方法。閾值分割方法分為:基于點(diǎn)的全局閾值方法、基于區(qū)域的全局閾值方法、局部閾值方法以及多閾值方法[3]。針對不規(guī)則光照下的圖像,由于陰影、噪聲、局部高光和不規(guī)則邊緣等復(fù)雜因子的存在,并不能找到一個有效的單一閾值,這時如仍采用單一的全局閾值分割方法,會將目標(biāo)區(qū)域和背景區(qū)域混淆,導(dǎo)致錯誤劃分。
自適應(yīng)閾值分割的思想,即圖像中的每個像素點(diǎn)對應(yīng)的閾值有可能不相同。一個比較簡單的自適應(yīng)閾值選取方法是:每個像素的閾值由以自身為中心的一個鄰域內(nèi)的窗口確定,該鄰域的中值、均值、或者高斯卷積都可以作為閾值,另外還可以在此基礎(chǔ)上加上一個常量等。
自適應(yīng)閾值分割是建立在局部多閾值方法上。將圖像劃分成若干個子圖像(F1,F(xiàn)2,F(xiàn)3,…,F(xiàn)n),每個子圖像再根據(jù)自身的顏色分布等特征劃分多個鄰域(M1,M2,M3,…,Mn),這樣劃分出來的鄰域足夠小并具有一定的代表性,整個大圖就有很多個閾值(a1,a2,a3,…,an),圖2所示是這種方法的原理示意圖。若劃分夠多,每個閾值近乎可以代表原來那個像素點(diǎn)的灰度值。采用自適應(yīng)劃分閾值的方法,對于照明不均而使畫面變得復(fù)雜的圖像,它的多個局部特征得到保留,就可有效地避免背景和有效信息的錯誤劃分[4-5]。

圖2 自適應(yīng)閾值劃分原理示意圖
文中設(shè)計的算法包含兩個Matlab代碼,將自適應(yīng)閾值分割算法作為函數(shù)調(diào)用。圖3是分割后的結(jié)果。

圖3 提取出的前景圖像
進(jìn)一步對初步提取的目標(biāo)圖像進(jìn)行圖片質(zhì)量增強(qiáng)。分割后的圖片中可能還存在一些噪聲,可以通過中值濾波去除獨(dú)立存在的噪聲,如果噪聲比較多而且分布得較分散,則采用均值濾波,一般采用3×3的窗口再進(jìn)行二值化增強(qiáng)效果較好。如果目標(biāo)圖像中的字母,文字等比較模糊,可以采用Sobel算子進(jìn)行銳化處理。圖4是使用圖片的實際效果進(jìn)行增強(qiáng)后的結(jié)果。

圖4 增強(qiáng)處理后的目標(biāo)圖像
對比圖2和圖3,通過坐標(biāo)定位,圖3去除了一些不需要的背景線條,使目標(biāo)區(qū)域更加突出。通過均值濾波去除了部分噪聲點(diǎn),目標(biāo)圖像更加清晰。
文中對多幅不規(guī)則光照下拍攝的圖像進(jìn)行了分割實驗,圖4是另外兩組圖片的原始圖像和自適應(yīng)閾值分割后的圖像。經(jīng)多次實驗發(fā)現(xiàn),對于英文、數(shù)字、圖形類似的對象,采用文中方法提取出的效果較好,對于筆畫多的漢字,由于光照不均已經(jīng)造成文字模糊,識別更加復(fù)雜。

圖5 另兩組圖片的識別效果
文中所提出的自適應(yīng)閾值分割方法,能夠較好地解決不規(guī)則光照下圖像中陰影、高光等造成的模糊問題,快捷有效地提取目標(biāo)圖像,從而方便人們讀取有用信息。文中提出的方法針對拍攝到的書本文字圖像、PPT投影圖像、文件等圖片前景的提取效果較好。
[1]錢蘇斌.基于四鄰域檢索的自適應(yīng)閾值分割方法[J].成都大學(xué)學(xué)報:自然科學(xué)版,2011(3):239-241.
[2]迂雪峰,吳慶洪.美元圖像的自適應(yīng)閾值分割方法[J].現(xiàn)代電子技術(shù),2007(8):96-100.
[3]楊星,陸宇平.一種用于彩色圖像目標(biāo)識別的自適應(yīng)閾值分割方法[J].計算機(jī)與數(shù)字工程,2006(8):15-17.
[4]高旭輝.一種自適應(yīng)閉值分割方法[J].紅外與激光工程,2006(10):167-170.
[5]趙仕良.一種用于彩色圖像處理的自適應(yīng)閾值分割方法[J].四川師范大學(xué):自然科學(xué)版,2002,25(4):405 -408.
[6]冉隆科.一種基于檢測方法的骨齡圖像關(guān)鍵點(diǎn)定位[J].電子設(shè)計工程,2011(14):181-183.