999精品在线视频,手机成人午夜在线视频,久久不卡国产精品无码,中日无码在线观看,成人av手机在线观看,日韩精品亚洲一区中文字幕,亚洲av无码人妻,四虎国产在线观看 ?

基于神經網絡與比例法的多文字識別

2016-10-17 09:05:16林毅斌姚劍敏郭太良
電視技術 2016年9期
關鍵詞:特征提取區域

林毅斌,姚劍敏,郭太良

(福州大學 物理與信息工程學院,福建 福州 350002)

?

基于神經網絡與比例法的多文字識別

林毅斌,姚劍敏,郭太良

(福州大學 物理與信息工程學院,福建 福州 350002)

用傳統方法進行文字識別時,需要花費時間分別去提取各個文字的區域。但是在講究速度與效率的實時系統中,文字識別的速度是一個值得深思的問題。提出了一種多文字識別方法,其核心思想是將輸入的文字當做一個整體進行處理,而不需要在單字區域提取上消耗過多時間,再利用ROI以及投影法進一步減少比例法特征提取算法的運算時間。在此基礎上,采用BP神經網絡進行樣本訓練與文字識別。實驗結果表明,該方法能夠有效地實現快速識別,識別四個字的所花費的時間為120 ms。

多文字識別;比例法;BP神經網絡

伴隨著計算機技術的快速發展,多媒體信息的重要傳遞媒介已經逐漸從文字轉換為圖像;同時相機從之前的膠卷相機發展到數碼相機,并且其制造技術逐年成熟,大大提高了數碼相機的性能,高質量的相機也出現在市場上,配合這軟件技術對拍照質量的提升,高質量的數字圖像已經可以較為輕松地獲取。因此,作為數字圖像處理中的文字識別技術也由此受到了研究人員的關注[1]。位于數字圖像中的文字(如拍攝到的車牌等)是圖像信息中的重點,具有非常豐富的含義,對于圖像中文字信息的提取,可獲取圖像中包含的語義,可以運用到生活中的多個方面[2]。

文字識別是模式識別的重要應用領域之一,文字識別的方法主要有以下幾種:基于統計特征字符的文字識別方法[3-4]、基于模板匹配的方法[5]、模糊識別和結構字符識別[6]。作為模式識別中的一種,文字識別的成功率在很大程度也是取決于所提取特征的正確性和穩定性。因此,能良好反映文字本質的特征在表示文字的同時,還應該具有易于實現和簡潔性質[7]。

神經網絡作為一門日益成熟的學科,已經在計算機視覺、語言識別、模式識別等領域廣泛應用,利用神經網絡來實現文字識別也因此成為研究人員的興趣所在,受到重視[8]。其中BP神經網絡算法具有算法成熟,結構簡單,精確尋優等優點,故而可將BP神經網絡用于文字識別。

由于在現實使用中,特別是在實時系統中,文字識別的速度是制約系統的一大因素,例如在脫機式智能顯示器自動化測試時,由于圖像中文字信息保持的時間長短不一,文字識別所消耗時間過長就可能導致文字信息的漏測,造成錯誤。因此本文提出基于神經網絡和比例法的多文字識別方法,將多個文字進行統一處理,減少文字識別的時間,提升速率。

1 比例法文字特征提取

傳統的文字識別技術,通常對各個文字區域采用分別提取的方式,由此為基礎上再利用某種文字識別算法對各個單文字進行識別,得到各個文字的識別結果,從而得到整體文字識別的結果。

本文采取的特征提取方法為比例法提取,其關鍵是將輸入的文字當做一個整體部分進行處理,而不需要經過單個文字的提取,從而減少文字提取的處理時間;同時在特征提取上,采用ROI與投影法[9]降維相結合的方法減少運算量,從而達到快速特征提取的效果。

1.1ROI文字區域粗提取

感興趣區域(Region of Interest,ROI)[10-11]在進行圖像處理時,可在原圖像內部以矩形、圓等圖形勾勒出所需要處理的區域。設置ROI后,對圖像進行處理時大多數情況下只會ROI區域進行處理,從而忽略其他區域,大大減少了圖像的運算量,增加了精度,因此被廣泛應用于視覺處理中。在文字圖像中設置ROI區域,將文字信息包含于ROI 中,并將ROI區域作為子圖,在進行閾值處理、文字精提取等處理時可大大減少運算速度,從而為達到快速文字識別奠定了基礎。

1.2文字區域精提取

在初步提取的文字ROI區域中,需要進一步對文字區域進行精確提取。提取的步驟如下所述:

1) 對該區域進行二值分割,使用的方法為直方圖與大津法相結合的二值化算法[12],該方法的具體實施如下:求出ROI區域的直方圖,直方圖反映的是圖像的灰度分部。再對直方圖進行濾波,從而可以得到平滑的直方圖,在去除掉部分噪聲的同時又保留了直方圖的原始信息。

(1)在濾波后的直方圖中找出波峰,得到波峰集合

R0={Rl,Rl≥Rl-t&Rl≥Rl-t&h(l)>(1/L)×θ}

(1)

式中:L為灰度的等級;h(l)則是直方圖的原始數值;θ是一個比例系數,用來保留在直方圖中占一定比例的波峰。

(2)把直方圖中相近的波峰進行處理,當距離小于某一數值時,將較小的波峰刪除;同時去除波谷不明顯的峰值,將其視為同一峰值合并。

(3)將篩選過后的峰值進行區域劃分,若剩余的峰值為r0,r1,r2,…,rn,則區域劃分為[0,r0],[r0,r1],…,[rn-1,rn]。

(4)在劃分后的區域中分別利用大津法求得局部閾值。設在某一灰度區域內[1,m]中,根據大津法原理,若所求的閾值為K,前景C0與背景C1出現的概率和均值為

(2)

(3)

式中:Pi為每個灰度出現的概率。

則C0和C1類間方差為

(4)

式中:uL為整圖的總體均值;K*即為最佳閾值。

2) 在進行圖像分割后,作為前景的文字信息與背景分離。因為文字信息在排列上具有一定的規律性,最直觀的表現為按某同一方向進行排列,且各個字符之間的空隙幾乎一致,因此文字信息在投影上有這特殊的現象,即等距相隔出會出現規律性的波谷(峰)。因此在此處可用投影方法對圖像文字的區域進行提取,可得到文字區域的最小外接矩形,并提出文字信息。

1.3文字特征提取

由于在脫機式智能顯示器自動化測試時所涉及到的文字以4個字為主,本文討論的多文字以4個字為例。本文的文字特征提取關鍵在于降維和比例法,降維有助于減少計算量,從而能夠更加快速提取文字的特征,在提取文字特征時應當考慮全局與局部相考慮,如果只考慮全局部分,則提取到的文字特征就缺少對局部特征的描述,如果只考慮局部部分,就會造成提取到的文字特征缺乏全局特征,不具有全局代表性,因此只有將全局特征和局部特征相結合才能得到具有代表性且相對穩定的文字特征。

在滿足本文應用的條件下,本文的文字特征提取過程如下:將4個文字平均分為16個子區域部分,每個區域部分作為一個子圖存在,圖1為其示意圖,對每個子圖分別提取2個特征值,其中一個特征值與全局相關,另一個特征與局部相關,故對“無線網絡”而言,有32個特征值,組成代表文字的特征向量。

圖1 子區域示意圖

1)比例法全局特征提取

本文采取的比例法全局特征為各個子圖中筆畫占子圖總面積的百分比,若假設子圖像的行有W個像素,高有H個像素,則比例法全局特征有

(5)其中:c1為比例法全局特征;s為子圖總面積,即s=W×H;f(i,j)表示二值圖像中像素點的值,有

(6)

信息感知層對耗材流轉進行跟蹤定位、自動識別并將實時采集到的信息反饋到網絡支撐層,網絡支撐層同步記錄數據并及時無誤地向平臺上層傳輸[7]。

2)比例法局部特征提取

本文的比例法局部特征的提取涉及到圖像的投影[10]。對于任意一幅圖像來說,其構成都是由像素構成的,若文字圖像中的背景為白色的像素點,將文字部分所占的部分為黑色的像素點。則此時有該圖像中一行像素點中黑色像素點的總和為該行的水平投影,把圖像中每行的水平投影求出并統計即可得到該圖像的水平投影;同理,垂直投影就是圖像中每一列垂直投影的統計整合,而每列的垂直投影為該列中黑色像素的和。投影可以將二維的圖像降維成兩個一維的函數,維度的減少也就意味著計算量的減少。

該特征的提取方法如下,若已求出子圖中的水平投影與垂直投影,則在水平投影中找到筆畫(黑色點)最多的一行,記該行的筆畫點數為L;在垂直投影中找到筆畫最多的一列,記該列的筆畫點數為V,則該局部特征值為

(7)

根據上述方法提取“無線網絡”的特征向量為:

(1.264 706,0.686 250,1.041 667,0.784 583,1.075 000,0.757 500,1.041 667,0.670 000,1.025 641,0.670 000,1.041 667,0.695 417,1.242 424,0.752 500,1.041 667,0.664 583,1.041 667,0.825 417,1.041 667,0.758 750,1.351 351,0.736 667,1.041 667,0.677 500,1.136 364,0.731 250,1.041 667,0.711 250,6.250 000,0.738 750,1.041 667,0.630 833)。

2 BP神經網絡

人工神經網絡即神經網絡,是一種模擬生物神經網絡的算法[13],利用該算法可從外界中學習獲取相關知識,并通過學習到的相關知識處理某些問題,是一門廣泛應用的交叉性學科。

2.1人工神經元

圖2 人工神經元原理

圖2中,x1~xn是從其他神經元傳輸過來的信號;ωij表示表示從神經元j到神經元i的連接權值;θ表示一個閾值,或稱為偏置,用來改變神經元的活性。則神經元i的輸出與輸入的關系表示為

(8)

則輸出yi表示為

yi=f(neti)

(9)

式中:函數f(·)為激活函數,neti為凈激活,若神經元的凈激活neti為正,稱該神經元處于激活狀態或興奮狀態,若凈激活neti為負,則稱神經元處于抑制狀態。

2.2BP神經網絡及學習過程

BP神經網絡是應用最為廣泛的人工神經網絡模型,使用的是常見的負梯度下降算法,具有很強的非線性映射能力,通常應用中所利用的三層BP神經網絡被證明可以實現任意函數的逼近,具有通用性,所說的三層BP網絡即含有輸入層、輸出層和一個隱含層。BP網絡的結構如圖3所示。在算法訓練過程中,輸入信息由輸入層正常傳遞,誤差則是反向回饋,從而不斷對權值和閾值進行調整,實現對函數的逼近[14]。

圖3 BP神經網絡

激活函數作為神經網絡的重要環節,對BP網絡訓練有重要作用, 為了能實現梯度算法,BP網絡要求神經元的激活函數必須是可導的,并且導函數必須連續函數。激活函數常采用S型函數和雙極S型函數這兩個非線性函數。其中S型函數為

(10)

雙極S型函數為

(11)

假設BP網絡的有P個訓練樣本,則有P個輸入輸出對(Ip,Tp),其中p=1,2,…,P,則設輸入向量為Ip=(ip1,ip2,…,ipm)T,理論網絡算法輸出為Op=(op1,op2,…,opn)T,算法實際的輸出為Tp=(tp1,tp2,…,tpn)T,通常情況下,理論值與實際輸出值有誤差,BP算法的學習過程就是重復不斷地把Tp與Op進行比較,并根據極小原則修改權值ωij,從而使誤差平方和為最小,即

(12)

若記Δωij表示一次學習過程對權值的修改量,則有

ωij+Δωij?ωij

(13)

(14)

其中:δpi=tpi-opi;η為學習因子,影響BP網絡的學習速率,又稱學習速率。

2.3網絡參數選擇

1)激活函數選擇

根據BP網絡的特性,激活函數將采用Sigmoid函數,即S形函數,Sigmoid函數可以實現對神經元較好的模擬,同時微分簡單,運算方便。

2)輸入層神經元的個數

輸入神經元個數應與文字的特征向量的維數相對應,故在本文中輸入層神經元個數為32個。

3)隱含層神經元個數

隱含層神經元個數的選取[15]需要經過反復的實驗才能得出最合適的值。對與給定的樣本輸入值和理論輸出值,不重復調整隱含層神經元個數,訓練完成后必須查看網絡識別結果,如此反復進行實驗,選取網絡結果最理想的值。對于本文來說,經過多次反復驗證,神經元個數取29時BP網絡有良好的效果。

4)輸出層神經元個數

網絡的輸出層可因樣本的規模大小選取不同的個數。當樣本規模較小時,對于本文選取的Sigmoid函數,可將Sigmoid函數值域[0,1]平均分為若干份,分別對應于各個樣本;若樣本規模較大時,可適當增加神經元個數以便使用。在本文中,選取的神經元個數為6。

3 實驗結果

在實驗中,本文采用的硬件平臺為CPU2.2 GHz,內存為4 Gbyte,軟件算法使用VC編寫實現,操作系統為Windows7。

本文一共采用250個四字漢字,各20個樣本,總共5 000個樣本作為BP網絡訓練樣本,與其他文字識別算法進行對比,如表1所示。

表1實驗結果對比

方法識別時間(4個字)/ms輪廓提取法183三角統計法168本文方法120

由表1可得到,本文提出的算法在識別4個字的情況下,識別時間為120ms,比其他算法具有更快的速度,因此此方法可行且有效。

4 結語

本文在針對脫機式智能顯示器自動化測試的應用特點,在需識別文字可預知在一定范圍內的情況下,研究了一種基于神經網絡與比例法的多文字識別。該方法采用將輸入文字作為整體進行識別,從而減免了單個文字區域的提取,在文字特征的提取上也采用了運算速度較快的降維方法等,實現了更快的識別速度。因此本方法適用于其他實時性系統,如logo檢測等。

[1]姚麗君,李浪.靜態圖像文字提取技術綜述[J]. 電腦知識與技術,2014 (33):7991-7992.

[2]HEL,RUANWT,ZHANGM,etal.Surveyonhyperspectralimageryclassificationwithsupportvectormachine[J].Journalofnewindustrialization,2012,2(1):46-51.

[3]錢娜,侯清濤,李金屏. 基于神經網絡和三角形統計特征的文字識別[J]. 濟南大學學報(自然科學版),2008 (2):128-131.

[4]梁華剛,程加樂,茹鋒. 基于特征空間法的旋轉多字體文字識別[J]. 微電子學與計算機,2015 (4):82-85.

[5]陳瑋,曹志廣,李劍平. 改進的模板匹配方法在車牌識別中的應用[J].計算機工程與設計,2013,34(5):1808-1811.

[6]蘇暢,胡曉冬,王斌輔,等.基于筆畫相關加權的視頻圖像文字識別[J].計算機應用,2012 (8):2305-2308.

[7]ERLERM,KENDERJR.Semantickeywordextractionviaadaptivetextbinarizationofunstructuredunsourcedvideo[C]//Proc.the16thIEEEInternationalConferenceonImageProcessing.Piscataway:IEEE,2009:26l-264.

[8]焦微微,巴力登. 基于改進BP神經網絡的脫機手寫文字識別[J]. 電視技術,2014,38 (13):200-202.

[9]張娜,陳露軍,王緒本. 基于水平垂直投影的考古文字修復識別方法[J]. 科技通報,2014 (6):185-187.

[10]馮競舸. 靜止圖像的ROI區域自動提取與編碼[D]. 南京:南京郵電大學,2013.

[11]白瑪玉珍. 藏文文字特征提取方法的研究[J]. 電腦知識與技術,2013 (10):6362-6364.

[12]吳丹,蔡曉東,謝月飛,等. 基于直方圖分析和OTSU算法的文字圖像二值化[J]. 計算機與現代化,2013 (7):117-119.

[13]KALAICHELVIV.Applicationofneuralnetworksincharacterrecognition[J].Internationaljournalofcomputerapplications,2012,12 (52):183-192.

[14]張宇博,舒紅平. 改進的BP神經網絡算法及其應用[J]. 網絡安全技術與應用,2015 (3):78-80.

[15]沈花玉,王兆霞,高成耀,等.BP神經網絡隱含層單元數的確定[J].天津理工大學學報,2008 (5):13-15.

林毅斌(1991— ),碩士生,主研信息顯示系統;

姚劍敏(1978— ),碩士生導師,副研究員,為本文通信作者,主要研究方向為視頻圖像處理、模式識別;

郭太良(1963— ),博士生導師,研究員,主要研究方向為場致發射陰極材料及器件研究。

責任編輯:閆雯雯

Multi-character recognition based on the neural network and projective method

LIN Yibin, YAO Jianmin,GUO Tailiang

(CollegeofPhysicsandInformationEngineering,FuzhouUniversity,Fuzhou350002,China)

It is time-consuming to use the traditional method in recognizing characters by collecting characters by every word region. However, it is worth of digging deeper into the problem of recognition speed, regarding to the efficiency in the real-time system. A multi-characters recognition method is presented. It mainly focuses on recognizing characters as a whole batch instead of spending much time in picking up every word region. In addition, it can make further improvement in reducing the computing time of characteristic parameter by using ROI and projective method. On that basis, BP neural network is applied in training samples and recognizing characters. The experimental result shows that it is an efficient method of characters recognition, which takes 120 ms in recognizing four characters.

multi-character recognition; projective method; BP neural network

TN911.73;TP391.4

A

10.16280/j.videoe.2016.09.023

國家“863”重大專項(2013AA030601);福建省科技重大專項(2014HZ0003-1);福建省資助省屬高校專項課題(JK2014003)

2015-09-29

文獻引用格式:林毅斌,姚劍敏,郭太良. 基于神經網絡與比例法的多文字識別[J].電視技術,2016,40(9):112-116.

LIN Y B, YAO J M,GUO T L. Multi-character recognition based on the neural network and projective method[J]. Video engineering,2016,40(9):112-116

猜你喜歡
特征提取區域
特征提取和最小二乘支持向量機的水下目標識別
永久基本農田集中區域“禁廢”
今日農業(2021年9期)2021-11-26 07:41:24
分割區域
基于Gazebo仿真環境的ORB特征提取與比對的研究
電子制作(2019年15期)2019-08-27 01:12:00
基于Daubechies(dbN)的飛行器音頻特征提取
電子制作(2018年19期)2018-11-14 02:37:08
Bagging RCSP腦電特征提取算法
關于四色猜想
分區域
基于嚴重區域的多PCC點暫降頻次估計
電測與儀表(2015年5期)2015-04-09 11:30:52
基于MED和循環域解調的多故障特征提取
主站蜘蛛池模板: 国产又爽又黄无遮挡免费观看 | 精品亚洲欧美中文字幕在线看| 操操操综合网| 亚洲国产一成久久精品国产成人综合| 亚洲性视频网站| 久草视频一区| 国产成人综合日韩精品无码不卡| 国内精品一区二区在线观看| 香蕉网久久| 日韩色图区| 久久久受www免费人成| 久久精品只有这里有| 亚洲av色吊丝无码| swag国产精品| 久久精品aⅴ无码中文字幕| 国产主播喷水| 国产精品v欧美| 亚洲色图综合在线| 亚洲无限乱码| 国产xxxxx免费视频| 在线观看国产精品日本不卡网| a级毛片免费看| 成人亚洲国产| 国产乱子精品一区二区在线观看| 99r在线精品视频在线播放| 在线欧美一区| 亚洲不卡影院| 欧美日韩动态图| 精品丝袜美腿国产一区| 国产人成在线视频| 超级碰免费视频91| 91麻豆国产视频| 欧美成人免费午夜全| 久久国产精品娇妻素人| 日韩精品资源| 高清无码手机在线观看| 国产亚洲精品自在久久不卡| 亚洲日韩Av中文字幕无码 | 免费A∨中文乱码专区| 午夜少妇精品视频小电影| 久久性妇女精品免费| 成人国产三级在线播放| 午夜毛片免费看| 亚洲av无码牛牛影视在线二区| 精品国产Av电影无码久久久| 99国产精品免费观看视频| www.99在线观看| 欧美狠狠干| 91麻豆精品国产高清在线| 在线日本国产成人免费的| 国产一区成人| 啪啪啪亚洲无码| 欧美日韩亚洲国产| 91麻豆久久久| 日韩美女福利视频| 国产精品视频白浆免费视频| 亚洲国产无码有码| 亚洲日韩精品欧美中文字幕 | 国产第四页| 人与鲁专区| 永久免费AⅤ无码网站在线观看| 午夜福利网址| 亚洲va在线∨a天堂va欧美va| 88av在线| 色老二精品视频在线观看| 国产成人调教在线视频| 又爽又大又光又色的午夜视频| a级毛片一区二区免费视频| 农村乱人伦一区二区| 日本一区二区三区精品视频| 国产69精品久久久久孕妇大杂乱| 欧美一区二区啪啪| 五月婷婷精品| 69视频国产| 国产91无码福利在线| 免费可以看的无遮挡av无码| 欧美日韩一区二区三区四区在线观看| 中文字幕 91| 久久综合色视频| 99在线观看国产| 久久a级片| 欧美成人h精品网站|