999精品在线视频,手机成人午夜在线视频,久久不卡国产精品无码,中日无码在线观看,成人av手机在线观看,日韩精品亚洲一区中文字幕,亚洲av无码人妻,四虎国产在线观看 ?

文本圖像的去噪算法應用研究

2012-07-27 03:22:02曾凡鋒高艷云付曉玲
計算機工程與設計 2012年7期
關鍵詞:文本

曾凡鋒,高艷云,付曉玲

(北方工業大學 信息工程學院,北京100144)

0 引 言

隨著圖像處理技術的發展,傳統的通過掃描儀采集信息的方式已經越來越滿足不了人們的需求,而隨著現代數碼產品越來越廣泛的應用,通過拍照采集信息的方式得到了很大程度上的應用,尤其是在印刷文字識別方面。雖然拍照方式采集圖像方便快捷,但是在應用中仍然存在一些問題,例如拍照獲得的文本圖像可能由于外界不確定因素存在一些光照不均的現象等,這些將影響后續對文字的識別效果。通常的處理方法是先對圖像進行二值化,但是二值化后的圖像可能殘留噪聲,這就需要對二值化圖像進行去噪處理。目前常用的圖像去噪算法有中值濾波、均值濾波、小波變換和數學形態學濾波等,但這些方法只是對一般圖像的去噪處理,針對性不強,對于文本圖像的去噪效率不高,效果不是很好。本文在原有算法的基礎上,主要分析了文本圖像特有的結構特征和噪聲特征,提出了一種基于文本圖像的投影結合分塊形態學的快速去噪方法,首先對輸入的二值化文本圖像進行投影,通過分析投影結果去除行列間噪聲,然后對圖像分塊統計噪聲的數量,通過閾值對分塊的圖像進行快速去噪。該方法對于通過拍照方式獲得的文本圖像由于光照不均而產生的一些噪聲的處理比傳統的濾波等方法的效果更好,速度更快,為后續的文字識別和注視放大提供了良好的條件。

1 文本圖像的結構特征及噪聲特征

1.1 文本圖像排版特征

(1)文本主要有橫排,豎排及橫豎混排3種版面。橫排版的文本是從上往下、從左向右排版;豎排版文本是從右向左、從上向下排版。

(2)文本正文中的文字字型字號相同。

(3)文本正文中的文字行、列間隔相等。

(4)文本行間和列間不會再出現字符。

如圖1所示為排版結構,第一幅為橫排文本,第二幅為豎排文本,第三幅為橫豎混排文本。

圖1 文本圖像結構特征

1.2 文本圖像噪聲特征

由于光照不均產生的文本圖像的噪聲通常出現在文本的行間和列間或者在字符的邊緣,噪聲形態通常是點狀或是小型塊狀噪聲(光照嚴重不均情況除外),如圖2所示為一種橫排版面的文本圖像二值化后的效果圖。可以看出由于光照不均會造成部分圖像的噪聲分布比較集中并且多,而部分圖像的噪聲很少或者是幾乎沒有。噪聲的分布主要是點狀的和小型的塊狀噪聲。

圖2 二值化后圖像的噪聲分布情況局部放大

2 文本圖像的去噪算法設計

2.1 算法流程

首先對文本圖像進行二值化,根據文本圖像的結構特征及噪聲特征,對二值化后的圖像通過投影確定文本結構,并快速去除行間和列間的噪聲,字符內去噪采取分塊局部閾值方法,并采用形態學濾波法去噪。算法流程如圖3所示。

圖3 整體算法流程

2.2 行(列)間去噪

本文中提到的行(列)間去噪是相對于排版不同的文本而言的,即通過投影分析其投影結果中脈沖的周期性,如果行投影的結構脈沖有一定得周期性則為橫排文本,反之則為豎排文本,判斷了文本的結構特征之后接著可以運用投影結果對文本進行行間去噪,因為橫排文本的排版是從上到下,從左到右的,文本是按行排版的,而對于豎排文本則應該先進行列間去噪,因為豎排文本的排版是從右到左,從上到下,文本是按列排版的。首先應該對文本圖像進行投影,由于文本圖像的正文中的文字行間和列間一般都是等距的,同一圖像中正文的文字大小是相等的,所以可以對投影結果進行分析,根據其脈沖的周期性,判斷文本圖像的行間距和列間距,選取投影結果中相鄰的兩個脈沖,其中一個脈沖的起始點和終止點的差值就是行高即字符的高度,選擇得到的字符高度的數據中出現次數最多的作為文本圖像中的字符高度。由于根據經驗值一行內如果只有一個字符時黑像素點為20左右,所以可以以20作為閾值,大于這個閾值的就認為這一行內有字符,而小于這個閾值的則認為這行內存在的是噪聲,將這一行的所有點的像素置為255即對這行整體去噪。如圖4所示為行(列)間去噪的流程圖。

圖4 行(列)間去噪流程

2.3 字符間去噪

通過前一步的行(列)間去噪之后,對于橫排文本的圖像,可以去除字符間的噪聲即每一行文本中的列間噪聲,因為圖像中的文字有可能不是每一行都是對齊的,所以應該對每一行進行操作,根據每一行中列的周期性確定一個字符的寬度,由于每一個字符的寬度一般都是相等的,所以可以對任意一行進行列投影,投影結果中選取相鄰的兩個脈沖,其中前一個脈沖的終止點和后一個脈沖的起始點的間隔就是這個列間距即字符的寬度,然后選取這一行中得到列間距中出現次數最多的數作為整篇文本的字符間距。因為根據經驗值一個逗號的黑像素點為3,所以可以選取3作為閾值,大于這個閾值的就認為這一列是字符,而小于這個閾值的則認為這列是噪聲,將這一列的所有點的像素置為255即對這列整體去噪。如圖5所示為字符間去噪的流程圖。

圖5 字符間去噪流程

由于上述兩步的去噪方法類似,如圖6所示為經過上述兩步去噪之后的效果圖,可以看出經過行間和字符間的去噪,出現在字符間和行間的噪聲點已經基本去除。其中最為明顯的是“豪”字上方出現的塊狀的噪聲在經過行間和字符間去噪后已經不存在了。

圖6 行列間去噪前后局部放大對比

2.4 圖像分塊

由于一些文本圖像的光照不均會造成一部分圖像的噪聲點多而部分圖像的噪聲點很少,噪聲點少的部分對后續的識別和放大的效果影響不大可以直接進行輸出,而噪聲點多的部分還需要進一步去噪。為此對圖像進行分塊去噪,圖像分塊的流程如圖7所示。

圖7 圖像分塊的流程

首先將圖像分成3*3或者是5*5塊,對每塊內的圖像進行分析,即分析統計每塊內行列間的噪聲點數,由于在統計出的行列間噪聲點數的數組中肯定會存在一些特別小的數和一些特別大的數,其中特別大的數肯定是噪聲點多的部分需要去噪,而特別小的肯定是不需要去噪的,這時就需要確定一個閾值,確定這個閾值時先將前面得到的噪聲點數的數組排序,選擇數組中相鄰兩個元素中差值最大的兩個數的中值作為閾值,大于這個閾值的圖像進行下一步的塊內字符去噪,小于這個閾值圖像的直接進行輸出。

2.5 字符內去噪

對于前面統計的需要進行塊內字符去噪的圖像采用形態學算法進行去噪。運用形態學運算去掉一些偏離的噪聲,吸收一些近距離的噪聲點,以達到去噪效果。因為形態學算法比中值濾波速度快,并且比鄰域法等去噪算法效果明顯。所以在塊內選擇形態學算法進行去噪。

2.5.1 形態學去噪算法

形態學運算包括腐蝕、膨脹、開和閉運算,其中最基本的腐蝕和膨脹。

形態學腐蝕如下所示

式中:S——腐蝕后的二值圖像集合,B——進行腐蝕的結構元素,X——原圖像經過二值化后的像素集合,此公式是用結構元素B來腐蝕X得到集合S。

形態學膨脹如下所示

式中:S——膨脹后的二值圖像集合,B——進行膨脹的結構元素,X——原圖像經過二值化后的像素集合,此公式是用B來膨脹X得到集合S。

形態學開運算是運用數學腐蝕和膨脹相結合的一種算法,如下所示

其中結構元素B對集合A進行運算,即B對A先腐蝕后膨脹。

形態學閉運算是運用數學腐蝕和膨脹相結合的一種算法,如下所示

其中結構元素B對集合A進行運算,即B對A先膨脹后腐蝕。

數學形態學腐蝕可以消除圖像的邊界噪聲,使邊界向內收縮,而膨脹是對圖像邊界點得擴充,使部分背景點合并到圖像中,使圖像的邊界向外擴張。開運算和閉運算是將腐蝕和膨脹相結合的算法,開運算不僅可以使圖像的輪廓變的光滑,還可以斷開狹窄的間斷和消除細的突出物,閉運算可以使輪廓線更光滑,消除狹窄的間斷和長細的鴻溝,消除小孔并填補輪廓線中的斷裂。對于文本圖像可以去除字符間的孤立點并且可以保持字符的大小。所以對于文本圖像的去噪采用形態學方法比其它的傳統去噪算法效果會好。

2.5.2 傳統的中值濾波算法

值濾中波器的基本原理是把數字圖像或數字序列中一點的值用該點的一個鄰域中各點值的中值代替,讓周圍像素灰度值的差比較大的像素改取與周圍的像素值接近的值,從而可以消除孤立的噪聲點。

中值濾波算法如下所示

式中:X(n-N)…X(n)…X(n+N)——定義窗口內的作用樣本,med[]——對一個滑動窗口內的像素由大到小排序完之后取中值的運算。

中值濾波算法中最重要的操作就是對中值的計算,而中值的計算主要又是對窗口內像素的排序操作。排序的重要步驟是對像素做比較和交換,數據元素之間的比較次數是影響排序的重要因素。用冒泡排序的話,其時間復雜度為O(m2),所以中值濾波的時間耗費會比較大。

綜上所述,在塊內選擇一種符合文本圖像結構特征和噪聲特征的去噪算法,形態學去噪速度會比較快而且效果會比較好。而傳統的中值濾波算法運用在全局的時候速度已經不快,如果運用在塊內的話速度不會比運用數學形態學算法快。并且傳統的中值濾波算法對孤立的噪聲點效果會比較好,而對于塊狀的噪聲效果不太明顯。

如圖8所示為一幅文本圖像在去噪前和應用本文算法以及傳統的全局算法效果比較放大圖,其中圖8(a)為去噪前的文本圖像,圖8(b)所示為經過投影結合分塊形態學去噪后的圖像,而圖8(c)所示為經過全局形態學去噪的效果圖,圖8(d)為經過全局中值濾波去噪的效果圖,從圖中可以看出,全局形態學去噪和全局中值濾波去噪對光照不均的圖像整體去噪使一部分原本噪聲很少的圖像失真很嚴重,對后續的識別和放大效果影響很大,就如圖8(c)和圖8(d)所示的圖像中最后兩行文字在經過去噪處理后也被當作噪聲去掉一部分了,其局部放大之后會發現很多字符出現嚴重的斷筆現象使的后續的識別和助視放大效果很差,而運用分塊的去噪算法,只對噪聲點多的部分圖像進行去噪,對噪聲點少的部分圖像則不進行操作直接輸出,這樣噪聲點少的部分會將原圖直接輸出對后續的圖像識別和助視放大不會造成影響。

3 算法測試結果與分析

測試條件:利用攝像頭外加輔助光造成文本圖像的光照不均來采集圖像,將采集到的圖像保存在本地機上,運用前面的算法對其進行去噪。

測試環境:Windows XP,Visual C++6.0

對于以5號字組成的A4紙全文的文本圖像,算法效率見表1。

表1 算法比較

圖8 圖像去噪前和應用本文算法及傳統算法效果比較

通過前面圖所示及測試結果可以看出,全局形態學的去噪算法雖然在速度方面會比較快,但是運用這個算法得出的效果圖中有很多噪聲點比較少的圖像的失真嚴重,會有部分圖像中的字符被當作噪聲去掉而對后續的操作產生很多不利的因素,影響識別和助視放大的效果,而全局中值濾波采用5*5窗口濾波算法,得到的結果不僅出現形態學所示的現象并且速度也不快,但是,運用投影法結合分塊去噪的快速去噪方法對大多數光照不均的文本圖像去噪有較好效果。比傳統的全局去噪算法效率更高,效果更好。

4 結束語

本文提出的基于文本圖像的快速去噪方法,根據文本圖像的結構及噪聲特征,采用投影結合分塊形態學方法提高去噪效果和速度。對大多數光照不均的文本圖像去噪有較好效果。可用于文字識別前的圖像預處理或印刷文字的助視放大。

針對傳統去噪算法的普遍性而沒有特定針對性的特別,分析文本圖像所區別與一般圖像的結構特征和噪聲特征,提出一種投影法結合分塊形態學方法的快速去噪算法,通過測試和分析,達到了一定的效果,較傳統的全局去噪算法效率更高,效果更好,但是,這個算法主要針對的是正常情況下光照不均的文本圖像的去噪,對于一些光照嚴重不均,比如在二值化后會出現大面積黑色區域并且大面積噪聲中夾雜文字的圖像這種去噪算法效果會和傳統的去噪算法的效果差不多,不太有明顯的優勢。

[1]YANG Bo,QI Fei-hu,HAO Jun-sheng.A new approach for marginal noise removal of binary document image[J].Computer Engineering,2006,32(5):186-188(in Chinese).[楊博,戚飛虎,郝峻晟.一種去除二值文本圖像邊緣噪聲的新方法[J].計算機工程,2006,32(5):186-188.]

[2]ZHANG Yuan,CAI Li-dong.A method of salt-pepper denoising for text images[J].Journal of Changchun University of Science and Technology(Natural Science Edition),2010,33(2):129-132(in Chinese).[張媛,蔡利棟.一種去除文本圖像椒鹽噪聲的方法[J].長春理工大學學報(自然科學版),2010,33(2):129-132.]

[3]TIAN Da-zeng,HAO Yong,HA Ming-hu.New algor ithm for r emoval of salt-pepper noises of visual text images[J].Computer Engineering and Applications,2007,43(14):81-83(in Chinese).[田大增,郝永,哈明虎.一種新的去除視覺文本圖像椒鹽噪聲的算法[J].計算機工程與應用,2007,43(14):81-83.]

[4]YANG Shu-ying.VC+ + image processing program design[M].2nd ed.Beijijng:Tsinghua University Press,2005(in Chinese).[楊淑瑩.VC++圖像處理程序設計[M].2版.北京:清華大學出版社,2005.]

[5]YANG Xiao-gang,MENG Fei,LI Jun-shan.Practical image filtering algorithm[J].Journal of Computer Applications,2009,29(6):216-218(in Chinese).[楊小岡,孟飛,李俊山.一種實用的圖像濾波算法[J].計算機應用,2009,29(6):216-218.]

[6]LIU Guo-hong,GUO Wen-ming.Application of improved arithmetic of median filtering denoising[J].Computer Engineering and Applications,2010,46(10):187-189(in Chinese).[劉國宏,郭文明.改進的中值濾波去噪算法應用分析[J].計算機工程與應用,2010,46(10):187-189.]

[7]LI Yan-jun,SU Hong-qi,YANG Feng,et al.Improved algorithm study about removing image noise[J].Computer Engineering and Design,2009,30(12):2995-2996.[李彥軍,蘇紅旗,楊峰,et al.改進的中值濾波圖像去噪方法研究[J].計算機工程與設計,2009,30(12):2995-2996.]

[8]WANG Xiao-kai,LI Feng.Improved adaptive median filtering[J].Computer Engineering and Applications,2010,46(3):175-176(in Chinese).[王曉凱,李鋒.改進的自適應中值濾波[J].計算機工程與應用,2010,46(3):175-176.]

[9]ZHANG Yong,CHEN Da-jian,SUN Zhi-jun.Comparing of two improved median filtering algorithms[J].Electro-Optic Technology Application,2010,25(1):67-70(in Chinese).[張勇,陳大建,孫志軍.兩種改進型中值濾波算法比較[J].光電技術應用,2010,25(1):67-70.]

[10]Kazuya Matsushita,Hitoshi Kitazawa.An improved camera identification method based on the texture complexity and the image restoration[C].Daejeon,Korea:International Conference on Convergence and Hybrid Information Technology,2009.

猜你喜歡
文本
文本聯讀學概括 細致觀察促寫作
重點:論述類文本閱讀
重點:實用類文本閱讀
初中群文閱讀的文本選擇及組織
甘肅教育(2020年8期)2020-06-11 06:10:02
作為“文本鏈”的元電影
藝術評論(2020年3期)2020-02-06 06:29:22
在808DA上文本顯示的改善
“文化傳承與理解”離不開對具體文本的解讀與把握
基于doc2vec和TF-IDF的相似文本識別
電子制作(2018年18期)2018-11-14 01:48:06
文本之中·文本之外·文本之上——童話故事《坐井觀天》的教學隱喻
從背景出發還是從文本出發
語文知識(2015年11期)2015-02-28 22:01:59
主站蜘蛛池模板: 欧美影院久久| 日韩欧美国产精品| 99国产精品国产| 日本三区视频| 亚洲欧洲日产无码AV| 日韩欧美综合在线制服| 1级黄色毛片| 欧美日韩一区二区在线免费观看 | av天堂最新版在线| 一级爆乳无码av| 女人18毛片久久| 在线看AV天堂| 亚洲成人在线播放 | 成人免费午间影院在线观看| 国产资源免费观看| 亚洲视频a| 好吊色国产欧美日韩免费观看| 亚洲日韩日本中文在线| 天天色综合4| 亚洲精品中文字幕午夜| 一本大道在线一本久道| 亚洲欧美一区在线| 亚洲天堂首页| 精品国产一二三区| 丝袜久久剧情精品国产| 国产成人综合久久精品尤物| 亚洲欧美成人影院| 亚洲成人福利网站| 成人一区在线| 国产欧美高清| 欧美精品成人一区二区在线观看| 久久综合丝袜长腿丝袜| 成年人视频一区二区| 国产精品亚洲片在线va| 欧美成一级| 免费无遮挡AV| 亚洲国模精品一区| 少妇人妻无码首页| 一级成人a毛片免费播放| 国产成人艳妇AA视频在线| 亚洲精品在线影院| 一级爆乳无码av| 国产探花在线视频| 高清不卡毛片| 国产专区综合另类日韩一区| 九九视频在线免费观看| 亚洲热线99精品视频| 国产午夜福利在线小视频| 精品国产aⅴ一区二区三区| 99久久国产自偷自偷免费一区| 伊在人亚洲香蕉精品播放| 亚洲无线视频| 国产免费久久精品99re丫丫一| 成年人福利视频| 日本高清免费不卡视频| 午夜在线不卡| 欧美成人精品在线| 国产福利小视频在线播放观看| 草草影院国产第一页| 一本久道热中字伊人| 免费毛片全部不收费的| 久久福利网| 中文字幕亚洲综久久2021| 一级毛片在线播放免费| 996免费视频国产在线播放| 色吊丝av中文字幕| 99久久国产综合精品2023| 久久国产精品麻豆系列| 亚洲无码高清免费视频亚洲 | 久久一色本道亚洲| 国内精品九九久久久精品| 热这里只有精品国产热门精品| 亚洲最猛黑人xxxx黑人猛交| 五月天久久综合国产一区二区| 尤物亚洲最大AV无码网站| 国产导航在线| 中文成人无码国产亚洲| 欧美成人精品在线| 国产后式a一视频| 天堂在线亚洲| 亚洲69视频| 国产精品久久久久久影院|