999精品在线视频,手机成人午夜在线视频,久久不卡国产精品无码,中日无码在线观看,成人av手机在线观看,日韩精品亚洲一区中文字幕,亚洲av无码人妻,四虎国产在线观看 ?

基于掃描圈的字符識別方法

2012-09-29 03:19:14宋賢霞李玉琴
自動化與信息工程 2012年5期
關(guān)鍵詞:英文符號方向

宋賢霞 李玉琴

(1.甘肅中醫(yī)學(xué)院 2.蘭州理工大學(xué))

0 引言

公式廣泛存在于各類文獻(xiàn)資料中,當(dāng)對這些文獻(xiàn)進(jìn)行數(shù)字化時,其中的公式只能按照圖像格式使用,不能加以識別分析,也不能依據(jù)公式對文章進(jìn)行檢索。當(dāng)需要驗證或重用這些公式時,只能使用專門的排版軟件進(jìn)行重新輸入,因此找到一種簡單有效的方法將文獻(xiàn)中的公式轉(zhuǎn)化為可編輯的文本公式是非常必要的[1-2]。

在實際應(yīng)用中,數(shù)學(xué)公式一般是由英文字符、阿拉伯?dāng)?shù)字、特殊符號及希臘字母組成的,因此要正確識別數(shù)學(xué)公式首先要識別這些組成元素[3-5]。本文所做的關(guān)于掃描圈的識別就是針對每一個單獨字符進(jìn)行識別,本文以印刷體的英文小寫字母為例對掃描圈識別的方法進(jìn)行闡述[6]。

1 掃描圈提取

1.1 掃描圈概念

英文字符在外觀上是由一些曲線組成的,任何一個連筆符號都可以看成是由一個外圈和若干個內(nèi)圈組合而成,如a是由一個內(nèi)圈和一個外圈組合而成的;c則是由一個外圈形成的。用不同的數(shù)字代表上下左右四個方向,并且用它們的組合代表左上、左下、右上、右下四個方向(如圖1所示)。通過掃描搜索,每一個幾何圈都可以一一對應(yīng)于由這四種符號構(gòu)成的數(shù)字串,這個數(shù)字串簡稱為掃描圈。

圖1 掃描圈的數(shù)字串表示

1.2 掃描圈提取

掃描圈的提取是按照相對坐標(biāo)和鄰點搜索實現(xiàn)的,在掃描開始之前需要給出一個初始中心點,即掃描初點。尋找掃描初點的過程有兩種方式:一種是按照行掃描的方式以搜索到的第一個黑色點作為掃描初點;另一種是按照列掃描的方式搜索掃描初點。本文采用的是行掃描的方式。

找到掃描初點之后,將其作為當(dāng)前中心點,按照逆時針的方向搜索它的八個領(lǐng)域點,應(yīng)當(dāng)注意此時它的鄰點中有四個方向的點已經(jīng)在行掃描的過程中被考察過,且都不為黑點,因此,此時只要搜索它另外四個方向上的鄰點(01、00、30、11)。若在搜索過程中得到一個黑色新鄰點,定義這個首次出現(xiàn)的黑色新鄰點為下一個中心點,然后按照逆時針方向以前中心點的下一個點為起始點,在8個方向中搜索新的中心點,這樣就形成了幾何圈的掃描過程;若在掃描過程中未在掃描初點的鄰域中找到黑色新鄰點,表明此掃描初點為一個孤立的像素點,將其視為無效點清除,并尋找新的掃描初點。表1對遵循以上規(guī)律得到的掃描圈結(jié)果進(jìn)行了舉例說明。

表1 掃描圈結(jié)果舉例

按照上述方法,對每一個英文小寫字母都可以得到若干個四進(jìn)制的字符串,如果依照點的絕對坐標(biāo)的單調(diào)性,可以將幾何圈分成若干個單調(diào)弧,在四進(jìn)制的字符串中便能得到單調(diào)段的個數(shù)及序數(shù)穩(wěn)定性,即同一符號在一定范圍內(nèi)的放大和縮小格式具有相同的單調(diào)段個數(shù)及序數(shù)。一個計算機(jī)符號實際上是幾何符號的有限剖分,符號識別就是研究幾何符號的剖分不變性,知道了剖分不變性便可以得到計算機(jī)符號的不依賴于硬件的抽象碼。

1.3 掃描圈提取過程中的特殊處理

為防止在掃描圈提取過程中由于筆畫過細(xì)而造成損失單調(diào)段及影響序數(shù)的情況,在掃描圈提取過程中如果出現(xiàn)相反的方向就進(jìn)行加寬處理,即在掃描圈中多加入一個與這兩個方向按逆時針的垂直方向上的像素點,表2對進(jìn)行了加寬處理的筆畫作了舉例說明。

從表2的處理中可以看出,掃描圈是一個很長的數(shù)字串,包含多個相同的碼字連續(xù)出現(xiàn)的子段,它們實際上就是一個個的單調(diào)弧。為在不損失圖像筆畫信息的前提下盡可能的壓縮掃描圈的長度,提出掃描核的提取方法。

表2 對掃描圈進(jìn)行加寬處理

2 掃描核及特征提取

2.1 掃描核

在幾何相似變換下,即適當(dāng)?shù)膸缀畏糯蠡蚩s小,同一個幾何圈的掃描圈是不同的,但具有內(nèi)在的結(jié)構(gòu)不變性,提取這些結(jié)構(gòu)不變量是結(jié)構(gòu)識別的關(guān)鍵。

掃描圈是由數(shù)字0、1、2、3的組合構(gòu)成的數(shù)字串,不同的組合表示不同的方向,如果掃描圈cod為:{i、j}={0、1},{1、2},{2、3},{3、0},則稱 cod由數(shù)字{i、j}構(gòu)成的極大段為掃描弧。這里的極大段是指不含相反方向數(shù)字的極大弧段。

每一個掃描圈都可以看作是掃描弧的有序組合,如果用cod[ i ]來表示一個掃描弧,那么掃描圈cod可以分解為弧段的表示:

cod=cod[1]cod[2]cod[3] ……cod[n],n稱為弧段的個數(shù),這是一個相似不變量,當(dāng)對字符進(jìn)行適當(dāng)?shù)姆糯蠛涂s小后,n均不會改變。

每一個弧段中由于其不含相反方向的數(shù)字,所以可以對弧段進(jìn)行壓縮,例如弧段 2222121212222222可以壓縮為12,這樣每一個掃描圈便可壓縮為掃描基的表示,將其稱之為掃描核。

一般,掃描圈在其長度得到大幅度縮減的基礎(chǔ)上仍保留著掃描弧個數(shù)、方向等重要形態(tài)信息。下面對字符的特征提取就是在掃描核的基礎(chǔ)上進(jìn)行的。

2.2 特征代碼庫的建立

經(jīng)過壓縮之后很長的掃描圈變成了由掃描基表示的較短的掃描核,掃描核所攜帶的筆畫走向信息與掃描圈是相同的,每一個掃描基就表示一種筆畫的走向。由于英文字符在結(jié)構(gòu)上具有不變性,因此任一字符在某一方向上的筆畫總數(shù)是不變的,即每一個掃描基在掃描核中的總數(shù)是不會變的,根據(jù)這一特性對于每一個英文字符,首先提取它的掃描核,然后數(shù)出其中每一個掃描基的個數(shù),用它們組成一個長度為4的特征向量,表3是對一部分字符特征向量的舉例說明。

表3 字符特征向量舉例

對于26個英文小寫字母,按照上述方法分別計算它們的特征向量并保存在計算機(jī)中作為匹配的模板。

3 模板匹配

對于輸入的單個字符,按照前面的方法提取它的特征向量,將其與所有模板逐個進(jìn)行比較,計算它們之間的距離

對于距離D,設(shè)定了一個閥值,當(dāng)D大于該閥值時,中斷與該模板的比較,并進(jìn)行與下一個模板的比較。當(dāng)所有的模板都比較完之后,找出其中距離最短的模板,則識別結(jié)果為該模板對應(yīng)的英文字符,若所有的距離都超過了閥值,則認(rèn)為該字符無法識別。

4 結(jié)束語

文中所設(shè)計的方法主要是針對印刷體的英文小寫字母,對于不同字體的英文小寫字母,它們的像素點位置略有差別,這種差別將影響字符的識別率。因此,為了提高字符的識別率需要針對每一種字體分別提取它們的特征代碼庫。這樣每一個英文小寫字母所對應(yīng)的特征代碼就不止一個,在模板匹配過程中需要與這些不同的特征代碼進(jìn)行比較。

[1] 程值軍.基于掃描表方法和命令串方法的數(shù)學(xué)公式識別與文本轉(zhuǎn)化的理論研究[D].蘭州大學(xué),2007.

[2] 龐東虎,金偉杰.英文字符特征提取系統(tǒng)[J].計算機(jī)仿真,2007,24(12):208-210.

[3] 黃炯生,黃敏琪.基于模型匹配法的字符識別[J].中國科技信息,2008(8):92-94.

[4] 藍(lán)章禮.基于中心與圓周的英文字符識別方法研究[J].計算機(jī)科學(xué)學(xué)報,2007,34(4):241-242.

[5] 黃敏,龍輝敏,楊曦,等.一種典型的英文字符識別算法[J].電子儀器儀表用戶,2000,7(4):17-21.

[6] 王萍,劉恒,狄光敏.基于簡約碼特性樹的字母和數(shù)字識別[J].天津大學(xué)學(xué)報, 2008,41(6):668-672.

猜你喜歡
英文符號方向
2022年組稿方向
學(xué)符號,比多少
幼兒園(2021年6期)2021-07-28 07:42:14
2021年組稿方向
2021年組稿方向
“+”“-”符號的由來
變符號
英文摘要
英文摘要
英文摘要
財經(jīng)(2016年19期)2016-08-11 08:17:03
英文摘要
主站蜘蛛池模板: 亚洲中文无码av永久伊人| 少妇人妻无码首页| 亚洲三级影院| 啊嗯不日本网站| 99一级毛片| 日韩高清欧美| 日韩在线播放中文字幕| 国产福利一区二区在线观看| 日韩精品免费在线视频| 免费Aⅴ片在线观看蜜芽Tⅴ| 69视频国产| 欧美性猛交一区二区三区| 国产成人高清精品免费| 成·人免费午夜无码视频在线观看 | 99视频在线观看免费| 国产中文一区a级毛片视频| 五月丁香伊人啪啪手机免费观看| 萌白酱国产一区二区| 国产成人久久777777| 国产午夜人做人免费视频| 成年片色大黄全免费网站久久| 国产成人三级| 亚洲第一区精品日韩在线播放| 丰满人妻中出白浆| 国产欧美成人不卡视频| 久久这里只有精品66| 亚洲色无码专线精品观看| 国产美女无遮挡免费视频网站| av在线手机播放| 欧美日韩亚洲国产主播第一区| 日本久久免费| 99re经典视频在线| 毛片久久久| 亚洲色图综合在线| 日韩欧美视频第一区在线观看 | 青青操国产| 亚洲午夜片| 国产在线麻豆波多野结衣| 99视频精品在线观看| 欧美激情首页| 亚洲不卡影院| 在线99视频| 国产欧美精品一区二区| 亚洲欧洲日韩综合| 露脸国产精品自产在线播| 欧美啪啪一区| 欧美成人午夜影院| 无码国产伊人| 午夜精品久久久久久久无码软件 | 欧美成人综合视频| 国产免费怡红院视频| 免费不卡在线观看av| 国产视频一二三区| 国产一级特黄aa级特黄裸毛片 | 中文字幕人妻无码系列第三区| 久久五月视频| 成人一区在线| 久久久91人妻无码精品蜜桃HD| 69精品在线观看| 中文字幕无码制服中字| 91青青草视频| 在线日韩日本国产亚洲| igao国产精品| 免费国产无遮挡又黄又爽| 亚洲国产成人在线| 亚洲 成人国产| 亚洲欧美日韩天堂| 日韩天堂网| 国产高清毛片| 久久久久久久蜜桃| 三区在线视频| 亚洲欧美另类色图| 狠狠色丁香婷婷| 国产又黄又硬又粗| 欧美国产三级| 国产www网站| 日韩在线视频网站| 欧美国产三级| 久久99国产精品成人欧美| 欧美成人综合在线| 日韩精品一区二区三区免费| 强乱中文字幕在线播放不卡|