999精品在线视频,手机成人午夜在线视频,久久不卡国产精品无码,中日无码在线观看,成人av手机在线观看,日韩精品亚洲一区中文字幕,亚洲av无码人妻,四虎国产在线观看 ?

基于隨機hough變換的文字圖像傾斜檢測

2017-04-18 18:37:44程燕群
科技視界 2017年2期

程燕群

【摘 要】復雜多變的采集環境和不確定的人工采集質量給后期的文字圖像識別帶來困難。通過總結前人的經驗,本文提出的方法,首先在圖像中提取出純文本區域,并對隨機hough變換的點選擇進行位置限定,在保留原有圖像特征的同時大大縮減了檢測的數據量,通過仿真結果可知,該算法具有很好的檢測準確度和速度。

【關鍵詞】文字圖像;傾斜校正;hough變換;文字區域提??;隨機hough變換

0 前言

在信息時代,圖像已經成為一種重要的信息載體,圖像文字識別的發展已經經歷了幾十年的過程。在實際生活中,圖像文字識別技術廣泛應用于如車牌識別、文字掃描、地圖中的文字識別等。但是,在文字圖像識別中,圖像的傾斜對于系統始終是一個敏感因素,因此,如何能夠快速而準確的檢測出圖像的傾斜角度一直是該領域研究的課題。

文本圖像的傾斜校正可分為傾角檢測、旋轉校正兩個問題。目前存在的比較常用的傾角檢測算法主要有基于投影的方法、基于Hough變換的方法以及基于K-最近鄰簇法?;贖ough變換的方法由于其高精確度一直廣受關注,但在應用中卻一直面臨著高時間成本和高內存消耗的問題。針對該問題,文獻[2]通過投影法預先篩選出文字子區域,再結合連通域搜索法提取出文本直線來計算傾斜角度,但其文字子區域篩選區域面積大,且當文字圖像中存在頁面寬的圖像時,無法提取出文字子區域,連通域搜索法在傾斜角度大于20度時就無法使用;文獻[3]提出兩級hough變換法,相對傳統hough變換速度是有提高,但仍需要消耗大量的時間;陳軍等[4]提出的隨機Hough變換,將傳統的“一對多”的hough變換轉化成“多對一”的映射,大大降低了內存需求和計算時間;文獻[5]在此基礎上,運用變分辨率金字塔策略,分別對低、高分辨率圖層進行兩級隨機 Hough變換,算法取得了不錯的效果。

本文在總結前人研究的基礎上,首先利用投影法篩選出純文本區域,再運用隨機hough變換方法,并限定變換兩點的選擇區域,然后計算出文本圖像傾斜角度。該方法在保留文本傾斜的特征的基礎上,通過三個步驟大大減少了變換的數據量。

1 純文本區域提取

圖像投影時,不同的內容會形成不同的投影特征。在選取篩選區域時,考慮一般的頁面特征,從上到下貫穿整個版面的圖像概率較小,而由于段落的原因,版面右側出現行不完整情況的概率較大,這樣會對純文本的投影特征造成一定的影響。再綜合考慮拍照傾斜時可能帶入的頁面邊界,在文字圖像中的行1/4處,列1/4、2/4、3/4處分別取m*n像素大小的區域,作為候選區進行水平投影。

其中,a、b、c、d、e、f是位于Vproj取值范圍[0,m]之間的相鄰點,Vproj是該行的黑色像素點數。

當a與b, b與c,c與d組成的線段滿足相應的長度限制時,則認為存在滿足條件的波峰與波谷,如圖所示,[b,c]和[d,e]所在區域為波峰,[a,b]和[c,d]所在區域為波谷。

利用以上算法對選擇的區域進行篩選,找出有效的純文本區。

2 隨機hough變換

Hough變換方法是利用圖像空間和參數空間中點與線的關聯對偶性,將原始圖像空間的給定曲線通過適當表達式運算變換為參數空間的一個對應點。文本圖像一行中通常會存在較多的字,這條文本行可以看成是由許多中間有隔斷的直線組成,這條直線代表著文本行的走向。

例如,直線在二維空間的參數表示形式為:

其中ρ為極半徑,θ為極角。則圖像中某條直線就會與參數空間中的一點(ρ,θ)相對應,圖像中某點對應參數空間中的一條正弦曲線。因此,原圖中直線上的任意兩點(xi,yi) 、(xj,yj)對應參數空間中的兩條正弦曲線理論上相交于共同的一點(ρ,θ)。再通過投票累加找出局部最大值,即為對應直線的參數。但若對圖像中的每一點都做hough變換,則計算量會相當大,因此本文采用隨機hough變換。

隨機hough變換是在hough變換的基礎上運用統計學知識,并不對所有點進行變換,只隨機取兩點作直線,取得一個參數(ρ′,θ′),對結果進行投票累加。當迭代達到一定的閾值后,投票累加最高的結果就對應著圖像上的直線。將圖像空間中的兩個點映射到參數空間中的一個點 ,是一個 “多對一 ”的映射,避免了傳統 Hough變換 “一對多 ”映射的龐大計算量。

為了進一步減小計算量,本文在運用隨機hough變換法時,在純文本區域豎直方向選取一個窄長的區域D,并根據實際精度要求選擇區域E。分別在區間D和E中隨機各選擇一個黑點 d1、d2,hough變換后,求得參數 (ρ′,θ′),對累加器數組 P[ρ,θ]中相應結果投票加一 。

當區域D的高度和區域E的高度選取合適時,可以進行大幅度的傾斜角檢測。

通過實驗得知,本文中手機采集的2448*3264的照片通過該算法處理檢測出傾斜角度的時間為1.02s,檢測結果相對傳統hough變換的標準偏差為0.047,可見其在保證準確度的同時大大提高了檢測速度。

3 小結

本文提出的算法是在前人的基礎上所做的改進。子區域具有與頁面相同的傾斜角度,通過提取純文本區域,減少背景和頁面中圖像的干擾;采用隨機hough變換,保證hough變換準確度;同時對于隨機hough變換中的兩個點采取限定區域的方式,三個階段均對變換數據量有大幅減少。通過實驗可知,通過該算法對文本圖像傾斜角度的檢測角度具有較高的準確度和速度。對內含表格、背景或版面較復雜的文本圖片來說,只要通過合適的方法篩選出純文本區域后,同樣適用,具有較高的應用價值。

【參考文獻】

[1]吳飛飛.文本圖像傾斜校正算法的研究與應用[D].北京:北方工業大學,2014.

[2]周冠瑋,平西建,程娟.基于改進Hough變換的文本圖像傾斜校正方法[J].計算機應用,2007,27(7):52-57.

[3]陳軍,徐友春,趙明,等.基于隨機hough變換的道路邊界識別算法研究[J].中國圖象圖形學報,2009,14(5):905-911.

[責任編輯:田吉捷]

主站蜘蛛池模板: 国产精品久久久久久久久| 精品国产一区91在线| 国产免费怡红院视频| 九九热视频精品在线| 国产97区一区二区三区无码| 亚洲免费黄色网| 中文字幕日韩久久综合影院| 91区国产福利在线观看午夜 | 亚洲欧美日韩高清综合678| 国产区福利小视频在线观看尤物| 欧美在线观看不卡| 久久久久人妻一区精品| 久久久久亚洲AV成人人电影软件| 在线观看网站国产| 国产精品视频白浆免费视频| 思思99思思久久最新精品| 亚洲伊人电影| 精品国产91爱| 九色综合伊人久久富二代| 日本尹人综合香蕉在线观看 | 亚洲AV色香蕉一区二区| 91在线一9|永久视频在线| 99免费在线观看视频| 精品国产美女福到在线直播| 国产无码在线调教| 久热这里只有精品6| 精品国产自| 亚洲中文字幕无码mv| 漂亮人妻被中出中文字幕久久| 国产男女XX00免费观看| 亚洲欧美日韩中文字幕在线一区| 亚洲AV无码乱码在线观看裸奔| 福利视频一区| www.精品视频| 嫩草在线视频| 精品国产黑色丝袜高跟鞋| 国产99在线观看| 一本二本三本不卡无码| 999在线免费视频| 第一区免费在线观看| 一本久道久久综合多人| 久草视频一区| 亚洲视频四区| 国产麻豆91网在线看| 国产综合色在线视频播放线视 | 亚洲国产欧洲精品路线久久| 麻豆精品视频在线原创| 国内精自视频品线一二区| 日韩国产黄色网站| 亚洲人成网站色7799在线播放| swag国产精品| 色婷婷色丁香| 国产又色又爽又黄| www.99在线观看| 亚洲精品无码抽插日韩| 国产成人乱码一区二区三区在线| 午夜综合网| 亚洲精品成人福利在线电影| 免费va国产在线观看| 午夜精品久久久久久久无码软件| 亚洲欧洲自拍拍偷午夜色| 国产精品无码一二三视频| 毛片大全免费观看| a亚洲视频| 福利在线不卡一区| AV老司机AV天堂| 91在线免费公开视频| 国产精品七七在线播放| 亚洲综合色区在线播放2019| 欧美人人干| 国产精品无码AV片在线观看播放| 亚洲五月激情网| 美女啪啪无遮挡| 日本www在线视频| 无码区日韩专区免费系列| 在线国产三级| 亚洲欧美成人影院| 亚洲日本一本dvd高清| 91网站国产| 88av在线| 3D动漫精品啪啪一区二区下载| 国产屁屁影院|