999精品在线视频,手机成人午夜在线视频,久久不卡国产精品无码,中日无码在线观看,成人av手机在线观看,日韩精品亚洲一区中文字幕,亚洲av无码人妻,四虎国产在线观看 ?

基于BP網(wǎng)絡(luò)的字符識別算法

2021-10-18 08:13:34王汝心馬維華
現(xiàn)代計(jì)算機(jī) 2021年24期

王汝心,馬維華

(南京航空航天大學(xué)計(jì)算機(jī)科學(xué)與技術(shù)學(xué)院,南京210016)

0 引言

字符識別應(yīng)用于多個領(lǐng)域。常用的字符識別方法包括基于模板匹配[1-2]、基于特征分析匹配[3]和基于機(jī)器學(xué)習(xí)[4-6]。字符特征有網(wǎng)格像素統(tǒng)計(jì)、正交投影法、骨架特征等方法,但這些特征提取方法各有側(cè)重,具有局限性,當(dāng)字符相似時識別效果較差。隨著機(jī)器學(xué)習(xí)算法的研究進(jìn)展,機(jī)器學(xué)習(xí)算法被越來越多的應(yīng)用到字符識別領(lǐng)域。孫國棟、江亞杰等使用訓(xùn)練好的BP(Back Propagation,反向傳播)網(wǎng)絡(luò)對圖像全局閾值進(jìn)行預(yù)測并二值化,達(dá)到分離重影的目的,并采用改進(jìn)LeNet-5網(wǎng)絡(luò)完成字符識別[4]。咼潤華、蘇婷婷等通過總體密度、分塊密度等特征表達(dá)不同字符的差別,以減少后續(xù)工作的計(jì)算量,將模板匹配方法嵌入到收斂的BP神經(jīng)網(wǎng)絡(luò)中,在提高系統(tǒng)的計(jì)算效率、縮短運(yùn)行時間的同時提高了字符識別效率[6]。

本文將骨架提取與BP網(wǎng)絡(luò)相結(jié)合,在細(xì)化圖片、保留原字符特征的同時引入字符圖片中更多的特征,優(yōu)化BP網(wǎng)絡(luò),以提高對尺寸偏小的圖片的識別準(zhǔn)確度和精確度。

1 特征提取

1.1 骨架提取

骨架提取(image skeletonization)是實(shí)現(xiàn)二值圖像細(xì)化(image thinning)的運(yùn)算方法之一。當(dāng)圖像本身尺寸偏小、或者當(dāng)字符圖案在圖片整體中所占區(qū)域過小時,進(jìn)行字符分割后獲得的字符圖片往往像素點(diǎn)偏少,導(dǎo)致提取特征時能夠提取的特征向量個數(shù)也會隨之減少,因而會對字符識別結(jié)果造成影響。對圖片中的字符筆畫進(jìn)行細(xì)化,提取字符的骨架,從而在不改變字符的輪廓特征的同時,突出字符與字符之間的細(xì)微區(qū)別

對一個二值圖像而言,骨架可以理解為圖像的中軸,它是一種細(xì)化結(jié)構(gòu),描述了目標(biāo)的拓?fù)浣Y(jié)構(gòu)。細(xì)化過程就是將圖像中的像素點(diǎn)剝離,圖像有規(guī)律地縮小,在保持原圖案形狀的基礎(chǔ)上,逐步刪除原圖像中的部分像素點(diǎn),直到獲得圖像的骨架。

保證圖案形狀不變,應(yīng)保證圖像的連通性質(zhì)不變,減少線條相交處的畸變,在細(xì)化過程中,應(yīng)判斷一個點(diǎn)p1是否能去掉時,應(yīng)參考該點(diǎn)的相鄰8個點(diǎn)的情況。在這9個點(diǎn)中,只有當(dāng)p1不是內(nèi)部點(diǎn)、且不是端點(diǎn)、且不是固定點(diǎn)、且是邊界點(diǎn)、且去掉p1后,如果連通分量不增加時才可刪除p1點(diǎn)。

如圖1所示,當(dāng)p1周圍的8個點(diǎn)滿足圖1(b)、(c)、(d)中任意一種情況時,p1點(diǎn)都不能刪除。

根據(jù)以上條件可以推導(dǎo)出,對于圖像中的任意像素點(diǎn)p1,只有同時滿足以下4個條件時才能將p1點(diǎn)刪除:

(1)f(p)=p2+p3+p4+p5+p6+p7+p8+p9,則f(p)應(yīng)滿足2≤f(p)≤6。

結(jié)合圖1可知,當(dāng)p1為孤立點(diǎn)時,f(p)的值為0;當(dāng)p1為端點(diǎn)時,f(p)的值為1;當(dāng)p1為內(nèi)部點(diǎn)時,f(p)的值為7或8。由此得出,當(dāng)2≤f(p)≤6時,排除了p1點(diǎn)是端點(diǎn)、孤立點(diǎn)或內(nèi)部點(diǎn)的可能性。

(2)在序列{p2,p3,p3,p4,p4,p5,p5,p6,p6,p7,p7,p8,p8,p9,p9,p2}中,0,1的數(shù)量為1,以保證圖片的連通性不發(fā)生改變。

(3)p2*p4*p8=0或者A(p2)≠0,其中A(p2)表示p2周圍8鄰域的0,1的數(shù)量,以保證2個像素寬的垂直區(qū)域不完全被腐蝕掉。

(4)為了保證2個像素寬的水平區(qū)域不完全被腐蝕掉,應(yīng)滿足條件p2*p4*p6=0或者A(p4)≠0,其中A(p4)表示p4周圍8鄰域的0,1的數(shù)量。

圖1細(xì)化條件

1.2 HOG提取

為了減少計(jì)算復(fù)雜度、時間消耗和空間消耗,對分割好的字符圖片進(jìn)行分析,從大量數(shù)據(jù)中提取中關(guān)鍵信息轉(zhuǎn)換為若干特征。本文通過提取字符的HOG特征,在描述目標(biāo)特征的同時獲取分布向量。

提取HOG特征共分5步:

(1)分割圖像為2×2像素的連通區(qū)域;

(2)采集連通區(qū)域內(nèi)的像素點(diǎn),通過垂直梯度算子[- 1,0,1]T,水平梯度算子[- 1,0,1]提取像素點(diǎn)的水平和垂直梯度。

(3)計(jì)算水平和垂直方向的合梯度,包括幅值和方向。

(4)以2×2個連通區(qū)域?yàn)橐粋€block,將block中的HOG向量拼接并歸一化。

(5)滑動步長設(shè)定為1個像素,計(jì)算圖像整體的HOG特征向量。

2 BP分類器

2.1 BP網(wǎng)絡(luò)構(gòu)建

BP神經(jīng)網(wǎng)絡(luò)分為兩個過程:將輸入信息正向傳遞,完成一次訓(xùn)練過程;將實(shí)際結(jié)果和預(yù)測結(jié)果的誤差反向傳播,修正各層的權(quán)重。Robert Hecht-Nielsen曾提出萬能逼近定理,證明了包含一個隱藏層的BP網(wǎng)絡(luò)可以用于擬合任意閉區(qū)間內(nèi)的連續(xù)函數(shù)。換言之,假設(shè)單個樣本具有m個樣本特征、n個輸出向量,一個包含輸入層(I)、隱含層(H)、輸出層(O)的三層的BP網(wǎng)絡(luò)就可以完成任意的維到維的映射。當(dāng)m=3、n=3時,BP網(wǎng)絡(luò)如圖2所示。

圖2 BP網(wǎng)絡(luò)

假設(shè)有a個訓(xùn)練樣本,那么對于第p個輸入,輸入向量為Ip=(ip1,…,ipm)T,目標(biāo)輸出向量Tp=(tp1,…,tpm)T,最終輸出向量表示為Op=(op1,…,opm)T。以wij表示輸入向量第j(j=1,2,…,m)個分量到輸出向量的第i(i=1,2,…,n)個分量的權(quán)重。則第p個輸入下輸出方差為:

其中,p=1,2,…,a。則網(wǎng)絡(luò)總誤差如公式(2)所表示:

根據(jù)梯度下降法和Widrow-Hoff規(guī)則,連續(xù)調(diào)整網(wǎng)絡(luò)的權(quán)值和閾值,wij應(yīng)沿著相對誤差平方和方向,權(quán)值矢量的修正值和當(dāng)前位置上的E的梯度成正比,則對于第j個輸出節(jié)點(diǎn),有:

重復(fù)上述過程,以修正各層神經(jīng)元之間的連接權(quán)重,使得期望輸出值在誤差閾值的允許范圍內(nèi)。

2.2 BP網(wǎng)絡(luò)優(yōu)化

由于BP網(wǎng)絡(luò)中的極小值較多,易于陷入局部極小值,而無法獲得全局最優(yōu)值。所以通過以下方法優(yōu)化BP網(wǎng)絡(luò)。

(1)多次隨機(jī)訓(xùn)練,選擇使訓(xùn)練后效果最好的初始值。在依據(jù)誤差函數(shù)進(jìn)行BP網(wǎng)絡(luò)訓(xùn)練以得到最小誤差的過程中,需要以初始值為基礎(chǔ)和起點(diǎn),所以初始值決定了BP網(wǎng)絡(luò)的收斂方向。并采用退火思想允許E按照一定概率上升,從而減少BP網(wǎng)絡(luò)陷入局部最小值的可能性。

(2)增加動量項(xiàng)∝。通過增加動量項(xiàng),增大搜索步長,從而加速算法收斂,同時可以降低BP網(wǎng)絡(luò)對誤差曲面局部區(qū)域的敏感性。根據(jù)BP網(wǎng)絡(luò)的思想,第n-1次的迭代結(jié)果影響力第n次迭代中,神經(jīng)元之間的權(quán)值更新,所以在迭代過程中采用公式(4),其中動量因子∝一般選擇0.1~0.8。

(3)自適應(yīng)調(diào)節(jié)學(xué)習(xí)率。學(xué)習(xí)率的大小影響了BP網(wǎng)絡(luò)的收斂快慢和訓(xùn)練成果。當(dāng)學(xué)習(xí)率取值較小時,訓(xùn)練更容易穩(wěn)定收斂,但取值過小會導(dǎo)致BP網(wǎng)絡(luò)訓(xùn)練時間變成、運(yùn)行速度降低等問題;當(dāng)學(xué)習(xí)率取值較大時,可以加速收斂,訓(xùn)練結(jié)果可能震蕩發(fā)散。因此,為了選擇合適的學(xué)習(xí)率,應(yīng)采用自適應(yīng)方法調(diào)節(jié)取值大小。

(4)通過優(yōu)化隱含層數(shù)和隱含節(jié)點(diǎn)數(shù)目完成網(wǎng)絡(luò)結(jié)構(gòu)優(yōu)化。若隱含節(jié)點(diǎn)過少,可能導(dǎo)致精度降低;若隱含節(jié)點(diǎn)過多,雖然能提高精度,但由于網(wǎng)絡(luò)結(jié)構(gòu)過大導(dǎo)致BP網(wǎng)絡(luò)性能下降。艷霞、李禹生等曾就隱藏節(jié)點(diǎn)數(shù)目與BP網(wǎng)絡(luò)性能之間的關(guān)系進(jìn)行實(shí)驗(yàn),結(jié)果表明,當(dāng)隱藏節(jié)點(diǎn)數(shù)目為取20~40時BP網(wǎng)絡(luò)性能更好[7]。

3 性能評估

隱藏層選擇Sigmoid型函數(shù)作為變換函數(shù),隱藏層節(jié)點(diǎn)設(shè)置為30個,采用自適應(yīng)學(xué)習(xí)算法,目標(biāo)誤差設(shè)置為0.001,或執(zhí)行30次迭代訓(xùn)練。將樣本數(shù)據(jù)集進(jìn)行骨架提取,所得結(jié)果圖片作為BP網(wǎng)絡(luò)的訓(xùn)練數(shù)據(jù)集。獲得迭代次數(shù)和識別正確率的數(shù)據(jù)后,將隱藏層節(jié)點(diǎn)設(shè)置為40個和50個。在圖3中,展示了迭代次數(shù)、識別正確率、節(jié)點(diǎn)個數(shù)三者之間的關(guān)系。

從圖3可以看出,第一次學(xué)習(xí)迭代的識別正確率普遍較低,在第10次迭代之前,正確率的波動較大。在第10次迭代之后,正確率趨于穩(wěn)定。在多次迭代、正確率穩(wěn)定后,當(dāng)隱藏層節(jié)點(diǎn)設(shè)置為30個時,平均正確率為93.88%,最大正確率為94.36%;隱藏層節(jié)點(diǎn)設(shè)置為40個時,平均正確率為94.23%,最大正確率為95.06%;隱藏層節(jié)點(diǎn)設(shè)置為50個時,平均正確率為95.20%,最大正確率為95.60%。

綜合考慮迭代次數(shù)的多少、隱藏層節(jié)點(diǎn)數(shù)目和網(wǎng)絡(luò)結(jié)構(gòu)復(fù)雜度等因素對訓(xùn)練結(jié)果、訓(xùn)練時間的長短的影響,設(shè)置隱藏層的神經(jīng)元個數(shù)為50個,令BP網(wǎng)絡(luò)迭代訓(xùn)練30次。

圖3迭代次數(shù)與正確率之間的關(guān)系

將測試樣本數(shù)據(jù)集進(jìn)行骨架提取,將所得結(jié)果圖片作為BP網(wǎng)絡(luò)的輸入,得到字符識別結(jié)果,并對識別結(jié)果進(jìn)行統(tǒng)計(jì),以測驗(yàn)BP網(wǎng)絡(luò)對低像素圖片的識別效果,得到BP神經(jīng)網(wǎng)絡(luò)對骨架提取后的字符圖片進(jìn)行識別,正確率為95.55%。將識別錯誤的圖片經(jīng)過圖像細(xì)化、HOG特征提取后,通過BP網(wǎng)絡(luò)進(jìn)行識別,正確率為95.65%。

4 結(jié)語

本文通過分析低像素圖片的特征,將二值圖片的骨架提取與BP神經(jīng)網(wǎng)絡(luò)相結(jié)合。通過骨架提取細(xì)化圖片中的字符圖案,判斷像素點(diǎn)是否應(yīng)刪除的依據(jù),并進(jìn)行HOG特征提取。構(gòu)建BP網(wǎng)絡(luò),并對BP網(wǎng)絡(luò)進(jìn)行優(yōu)化,完成對低像素圖片識別算法。對BP網(wǎng)絡(luò)進(jìn)行訓(xùn)練,對隱藏層節(jié)點(diǎn)個數(shù)、迭代次數(shù)和識別正確率進(jìn)行統(tǒng)計(jì)和分析,迭代次數(shù)為30次,隱藏層節(jié)點(diǎn)個數(shù)為50個。將測試樣本數(shù)據(jù)進(jìn)行圖片細(xì)化,通過BP網(wǎng)絡(luò)進(jìn)行識別,正確率為95.55%。

主站蜘蛛池模板: 99热在线只有精品| 狠狠色综合网| 韩国福利一区| 亚洲中文在线看视频一区| 国产极品美女在线播放| 免费a在线观看播放| 伊人成人在线| 国产一区二区精品福利| 国产一二视频| 91在线无码精品秘九色APP| 宅男噜噜噜66国产在线观看| 日本一区二区三区精品视频| 亚洲一道AV无码午夜福利| 91免费国产在线观看尤物| 九九免费观看全部免费视频| 黑色丝袜高跟国产在线91| 毛片免费视频| 国产高清自拍视频| 国产日韩欧美视频| 国产一区二区丝袜高跟鞋| www.国产福利| 波多野结衣视频网站| 伊人久久大香线蕉影院| 免费欧美一级| 中文国产成人久久精品小说| 伊人色天堂| 国产成人精品综合| 久久久噜噜噜久久中文字幕色伊伊 | 国产精品手机在线播放| 中文字幕在线欧美| 99久久无色码中文字幕| 亚洲日韩第九十九页| 精品视频一区二区三区在线播| 国产视频a| 精品国产一区二区三区在线观看 | 婷婷午夜天| 一本大道香蕉中文日本不卡高清二区| 亚洲色欲色欲www网| 91小视频在线观看免费版高清 | 999国产精品| 亚洲中文久久精品无玛| 不卡无码h在线观看| 国产乱子伦一区二区=| 毛片久久网站小视频| 2020国产在线视精品在| 亚洲一区二区在线无码| 看av免费毛片手机播放| 日韩欧美国产综合| 国产精品手机在线观看你懂的| 国产日本一线在线观看免费| 97久久人人超碰国产精品| 亚洲黄网视频| 五月婷婷导航| 国产成人精品综合| 在线观看网站国产| 国产女人18毛片水真多1| 国产女同自拍视频| 国产精品色婷婷在线观看| 国产69精品久久久久妇女| 国产玖玖视频| 免费高清毛片| 日韩无码真实干出血视频| av在线手机播放| 亚洲国产成人久久精品软件| 欧美午夜性视频| 91麻豆精品国产91久久久久| 欧美国产菊爆免费观看| 精品夜恋影院亚洲欧洲| 国产毛片不卡| 美女一区二区在线观看| 中文字幕丝袜一区二区| 久久人搡人人玩人妻精品| 9966国产精品视频| 超碰精品无码一区二区| 国产欧美日韩另类| 国产自产视频一区二区三区| 国产一级片网址| 亚洲国产天堂在线观看| 精品福利一区二区免费视频| 中文字幕天无码久久精品视频免费 | 久久久久久久久18禁秘| 视频一本大道香蕉久在线播放 |