程燕群
【摘 要】復雜多變的采集環境和不確定的人工采集質量給后期的文字圖像識別帶來困難。通過總結前人的經驗,本文提出的方法,首先在圖像中提取出純文本區域,并對隨機hough變換的點選擇進行位置限定,在保留原有圖像特征的同時大大縮減了檢測的數據量,通過仿真結果可知,該算法具有很好的檢測準確度和速度。
【關鍵詞】文字圖像;傾斜校正;hough變換;文字區域提??;隨機hough變換
0 前言
在信息時代,圖像已經成為一種重要的信息載體,圖像文字識別的發展已經經歷了幾十年的過程。在實際生活中,圖像文字識別技術廣泛應用于如車牌識別、文字掃描、地圖中的文字識別等。但是,在文字圖像識別中,圖像的傾斜對于系統始終是一個敏感因素,因此,如何能夠快速而準確的檢測出圖像的傾斜角度一直是該領域研究的課題。
文本圖像的傾斜校正可分為傾角檢測、旋轉校正兩個問題。目前存在的比較常用的傾角檢測算法主要有基于投影的方法、基于Hough變換的方法以及基于K-最近鄰簇法?;贖ough變換的方法由于其高精確度一直廣受關注,但在應用中卻一直面臨著高時間成本和高內存消耗的問題。針對該問題,文獻[2]通過投影法預先篩選出文字子區域,再結合連通域搜索法提取出文本直線來計算傾斜角度,但其文字子區域篩選區域面積大,且當文字圖像中存在頁面寬的圖像時,無法提取出文字子區域,連通域搜索法在傾斜角度大于20度時就無法使用;文獻[3]提出兩級hough變換法,相對傳統hough變換速度是有提高,但仍需要消耗大量的時間;陳軍等[4]提出的隨機Hough變換,將傳統的“一對多”的hough變換轉化成“多對一”的映射,大大降低了內存需求和計算時間;文獻[5]在此基礎上,運用變分辨率金字塔策略,分別對低、高分辨率圖層進行兩級隨機 Hough變換,算法取得了不錯的效果。
本文在總結前人研究的基礎上,首先利用投影法篩選出純文本區域,再運用隨機hough變換方法,并限定變換兩點的選擇區域,然后計算出文本圖像傾斜角度。該方法在保留文本傾斜的特征的基礎上,通過三個步驟大大減少了變換的數據量。
1 純文本區域提取
圖像投影時,不同的內容會形成不同的投影特征。在選取篩選區域時,考慮一般的頁面特征,從上到下貫穿整個版面的圖像概率較小,而由于段落的原因,版面右側出現行不完整情況的概率較大,這樣會對純文本的投影特征造成一定的影響。再綜合考慮拍照傾斜時可能帶入的頁面邊界,在文字圖像中的行1/4處,列1/4、2/4、3/4處分別取m*n像素大小的區域,作為候選區進行水平投影。
其中,a、b、c、d、e、f是位于Vproj取值范圍[0,m]之間的相鄰點,Vproj是該行的黑色像素點數。
當a與b, b與c,c與d組成的線段滿足相應的長度限制時,則認為存在滿足條件的波峰與波谷,如圖所示,[b,c]和[d,e]所在區域為波峰,[a,b]和[c,d]所在區域為波谷。
利用以上算法對選擇的區域進行篩選,找出有效的純文本區。
2 隨機hough變換
Hough變換方法是利用圖像空間和參數空間中點與線的關聯對偶性,將原始圖像空間的給定曲線通過適當表達式運算變換為參數空間的一個對應點。文本圖像一行中通常會存在較多的字,這條文本行可以看成是由許多中間有隔斷的直線組成,這條直線代表著文本行的走向。
例如,直線在二維空間的參數表示形式為:
其中ρ為極半徑,θ為極角。則圖像中某條直線就會與參數空間中的一點(ρ,θ)相對應,圖像中某點對應參數空間中的一條正弦曲線。因此,原圖中直線上的任意兩點(xi,yi) 、(xj,yj)對應參數空間中的兩條正弦曲線理論上相交于共同的一點(ρ,θ)。再通過投票累加找出局部最大值,即為對應直線的參數。但若對圖像中的每一點都做hough變換,則計算量會相當大,因此本文采用隨機hough變換。
隨機hough變換是在hough變換的基礎上運用統計學知識,并不對所有點進行變換,只隨機取兩點作直線,取得一個參數(ρ′,θ′),對結果進行投票累加。當迭代達到一定的閾值后,投票累加最高的結果就對應著圖像上的直線。將圖像空間中的兩個點映射到參數空間中的一個點 ,是一個 “多對一 ”的映射,避免了傳統 Hough變換 “一對多 ”映射的龐大計算量。
為了進一步減小計算量,本文在運用隨機hough變換法時,在純文本區域豎直方向選取一個窄長的區域D,并根據實際精度要求選擇區域E。分別在區間D和E中隨機各選擇一個黑點 d1、d2,hough變換后,求得參數 (ρ′,θ′),對累加器數組 P[ρ,θ]中相應結果投票加一 。
當區域D的高度和區域E的高度選取合適時,可以進行大幅度的傾斜角檢測。
通過實驗得知,本文中手機采集的2448*3264的照片通過該算法處理檢測出傾斜角度的時間為1.02s,檢測結果相對傳統hough變換的標準偏差為0.047,可見其在保證準確度的同時大大提高了檢測速度。
3 小結
本文提出的算法是在前人的基礎上所做的改進。子區域具有與頁面相同的傾斜角度,通過提取純文本區域,減少背景和頁面中圖像的干擾;采用隨機hough變換,保證hough變換準確度;同時對于隨機hough變換中的兩個點采取限定區域的方式,三個階段均對變換數據量有大幅減少。通過實驗可知,通過該算法對文本圖像傾斜角度的檢測角度具有較高的準確度和速度。對內含表格、背景或版面較復雜的文本圖片來說,只要通過合適的方法篩選出純文本區域后,同樣適用,具有較高的應用價值。
【參考文獻】
[1]吳飛飛.文本圖像傾斜校正算法的研究與應用[D].北京:北方工業大學,2014.
[2]周冠瑋,平西建,程娟.基于改進Hough變換的文本圖像傾斜校正方法[J].計算機應用,2007,27(7):52-57.
[3]陳軍,徐友春,趙明,等.基于隨機hough變換的道路邊界識別算法研究[J].中國圖象圖形學報,2009,14(5):905-911.
[責任編輯:田吉捷]