王莉麗+于印


摘要:針對目前主流文本圖像字符分割方法面臨的問題,考慮投影法及改進方法容易實現之優點,提出了一種行與列投影的文本圖像字符分割新方法,以通過雙向掃描分割字符。首先對文本圖像進行行投影,接著,實施列投影操作,最后,根據投影譜圖統計字符內、外間距,分割單個字符。試驗表明,提出的方法能快速準確分割文本圖像字符。
關鍵詞:文本圖像處理;字符分割;投影法
中圖分類號:TP391 文獻標識碼:A 文章編號:1007-9416(2017)05-0074-02
傳統的數據主要以紙質文件為載體,但紙張文件存在不易保存、不易共享等缺點。隨著信息化與數字化技術的飛速發展, 越來越多的文檔以電子格式存儲。電子文本具有空間占用小,易于保存等優點,受到了公眾廣泛的歡迎。為了充分利用以往的海量紙質版文檔數據,對其數字化成為信息化建設領域亟待解決的主要問題之一。
文本圖像字符分割是紙質文檔數字化的關鍵問題之一。自上世紀 70 年代起,從圖像中自動提取文字的技術研究逐漸開展,到了上世紀90 年代末,受益于多媒體技術日新月異發展,圖像文字獲取逐漸成為研究熱點,許多學者在上述領域做了積極的研究與嘗試,提出了諸多字符分割方法[1-6]。字符分割操作一般分為兩個步驟,首先定位與檢測圖像主要信息區域,即文字區域,一般使用矩形框來標記,原圖像被分離多個子圖像。然后分別從子圖像中提取像素(提取)。但這兩個步驟沒有嚴格的界限,某些算法在進行字符檢測時同時字符提取的功能也得到實現,一些算法在不進行字符區域檢測的情況下也能夠直接實現提取。目前的字符分割算法有很多,大體來說,現有主要的字符分割方法可以被分為五類: 基于連通分析、基于灰度以及基于邊緣的方法、基于紋理的方法、基于垂直投影的方法。目前字符分割方法面臨的主要問題有:(1)分割效率較低;(2)對字符大小、語言特征要求高;(3)復雜背景適應性差。為此,本文提出了一種新的有效文字圖像字符分割方法。
1 提出的分割方法
觀察眾多文本圖像,發現文本圖像一般內容規整,多數以行與列的形式存在。基于此觀察,提出本文方法,其基本思想是:將文本圖像進行行與列掃描投影,行投影分割出文本圖像每行;而后進一步做列掃描與投影,得到對應的投影譜圖,根據字符列間距完成字符分割。具體流程圖與實施步驟見圖1。
首先將輸入待分割的圖像,若為特殊圖像,則需要將其轉化為matlab所能識別的格式,如tif,bmp,jpg等;然后提取有效區域。對行與列上的像素值進行統計,繼而求得行與列均值,進而統計像素值為0的行與列;再者,找到行/列的始末跳變點,以區分開字符區域及非字符區域,舍去上下及左右純空白區域之后,獲得出有效區域。
基于有效區域段落分割。采用行投影方法,標記出間隔區域;接著,分析行特征,將文本以行形式提取出來。基于文本均以段落的形式存在這一特征,根據段落內與外行間隔有差異特性,完成分段操作。
最后實施字符分割。首先對段內圖像做行投影,分割出段內每行。接著,對行內字符進行列投影,標記出間隔區域。為解決字符內空隙、標點符號等對字符提取造成的偏差,需要后期處理步驟,具體為比較求得的列間距與平均列間距,將兩者區分,實現單個字符分割。試驗舉例見圖2。
2 結語
字符分割是文本圖像信息化的關鍵問題之一。針對該問題,本文分析了文本圖像以行列形式存在的特征,將該特性引入到傳統的投影法中,提出了基于行與列雙向掃描投影的文本圖像字符分割新方法,通過實驗驗證了所提方法的有效性。實驗結果表明,新方法字符分割效率高,運算速度快。
參考文獻
[1]李文舉,梁德群,王新年.質量退化的車牌字符分割方法.計算機輔助設計與圖形學學報[J].2004,16(5):697-700.
[2]王俊杰,黃心漢.一種對圖像進行快速二值化處理的方[J]電子技術應用,1998,24(10):16-17.
[3]M. Elad. Why simple shrinkage is till relevant for redundant representations. IEEE Transactions on Information Theory,2006,52(12): 5559-5569.
[4]胡小峰,周勇,葉慶泰.復雜背景彩色圖像中的文字分割[J].光學技術,2006,32(1):141-147
[5]王勇,鄭輝,胡德文.圖像和視頻中的文字獲取技術[J].中國圖象圖報,2004,9(5):532-538.
[6]Lia C L,Hui K C.Feature recognition by template matching.Computers and Graphics,2000(24):569-582.endprint