童文超,舒小華,龍永紅,肖習(xí)雨
(湖南工業(yè)大學(xué) 電氣與信息工程學(xué)院,湖南 株洲 412007)
LED顯示儀表的字符識別方法
童文超,舒小華,龍永紅,肖習(xí)雨
(湖南工業(yè)大學(xué) 電氣與信息工程學(xué)院,湖南 株洲 412007)
針對LED顯示儀表,提出了一種字符識別方法。字符分割采用邊緣檢測、直線檢測和灰度投影相結(jié)合的方法,可快速提取目標(biāo)字符,將數(shù)字和小數(shù)點分開識別,并改進了基于數(shù)字筆畫統(tǒng)計特征的自適應(yīng)閾值數(shù)字識別方法。試驗結(jié)果表明,本識別算法的識別率能達到95%以上,且算法耗時較低,說明此算法的準(zhǔn)確率較高、實時性較好。
字符分割;幾何特征;統(tǒng)計特征;字符識別
LED數(shù)字顯示計量設(shè)備具有可靠性高、精度高、操作簡單等特點,被廣泛應(yīng)用于自動化生產(chǎn)線、加油站、水質(zhì)監(jiān)測、化工生產(chǎn)以及環(huán)境監(jiān)測等領(lǐng)域。LED數(shù)顯設(shè)備的識別技術(shù),是實現(xiàn)各種數(shù)顯設(shè)備互聯(lián)和集成,實現(xiàn)管控一體化,提高智能化管理水平的關(guān)鍵。如自動抄表系統(tǒng)[1-3]就是利用網(wǎng)絡(luò)與供電局的營業(yè)收費系統(tǒng)相連,實現(xiàn)抄表收費一體化。
字符提取和識別模塊是儀表自動校正和儀表數(shù)據(jù)自動錄入系統(tǒng)的核心。目前,字符分割方法主要有:邊緣檢測、背景減法、顏色聚類、筆畫聚類等。字符識別方法主要是基于字符的兩類特征:幾何特征和統(tǒng)計特征,如模板匹配、機器學(xué)習(xí)、基于模糊理論的識別方法、特征向量法、穿線法等。文獻[4]提出了復(fù)雜彩色背景下的文字標(biāo)題識別系統(tǒng),該系統(tǒng)是針對字符顏色單一,與背景有明顯差異的情況,采用顏色聚類、直線檢測和自偏移矩形窗檢測相結(jié)合的方法來提取字符。文獻[5]設(shè)計了一種基于手機終端的LED字符識別系統(tǒng),該系統(tǒng)利用數(shù)字筆畫與背景的差異,采用基于封閉圖形的筆畫聚類方法來提取目標(biāo)字符,采用機器學(xué)習(xí)機制來識別字符。文獻[6]設(shè)計了自動識別數(shù)字測量儀器數(shù)據(jù)系統(tǒng),利用Sobel邊緣檢測方法提取字符整體區(qū)域,再用三重卷積分割出字符的筆畫,采用基于數(shù)字筆畫幾何特征的穿針法來識別數(shù)字字符。文獻[7]提出了用掃描線的一階差分來掃描每一行的紋理特征,根據(jù)LED區(qū)域的紋理特征(亮暗切換的變換特征)與其他區(qū)域的特征差異來定位LED區(qū)域。文獻[8]提出了HSV空間的閾值分割方法,即從H, S, V三個通道得到3個閾值后,進行3次閾值分割,試驗結(jié)果顯示,該方法能消除部分噪聲的干擾,分割效果也有明顯改善。文獻[9]提出利用Sobel垂直和水平邊緣檢測方法來提取LED區(qū)域。
當(dāng)字符與背景的差異不太明顯,有陰影或者光照不均,成像設(shè)備的分辨率較低時,容易導(dǎo)致圖像的噪聲點較多,數(shù)字筆畫易丟失;還有當(dāng)數(shù)字字符不是垂直顯示時,字符投影覆蓋了小數(shù)點,這都使得字符識別率較低。針對以上問題,本文提出一種LED顯示儀表的識別方法。該方法分為3個部分: LED區(qū)域分割、字符分割和字符識別,LED區(qū)域分割采用基于亮度變化的邊緣檢測方法,字符分割采用邊緣檢測和區(qū)域掃描相結(jié)合的方法,字符識別是利用字符筆畫的統(tǒng)計特征。該識別方法能有效提高識別準(zhǔn)確率,降低算法耗時。
2.1 LED區(qū)域分割
LED區(qū)域分割的方法主要有:閾值分割、區(qū)域生長、紋理掃描、邊緣檢測等。由于LED區(qū)域位于整個設(shè)備的中部,周圍的背景復(fù)雜,閾值分割難以滿足分割的要求,紋理掃描在時間上消耗較長,因此,本文利用基于亮度變化的邊緣檢測方法來分割LED區(qū)域。文獻[9]所提的Sobel邊緣檢測算法與本文算法分割LED區(qū)域的效果對比見圖1。

圖1 LED區(qū)域分割效果圖Fig.1 The segmenting effect of LED region
由圖1可以看出,Sobel邊緣檢測算法只能大概地檢測出LED區(qū)域的邊界,而本文的方法能精確地檢測出LED區(qū)域的邊界,這樣利于提取LED區(qū)域。從上面的檢測結(jié)果中,可以得到LED矩形區(qū)域的2對橫縱坐標(biāo),根據(jù)這2對坐標(biāo)將LED屏幕從原圖中切割出來,LED區(qū)域的提取效果如圖2所示。

圖2 LED區(qū)域提取圖Fig.2 Region extraction of LED
2.2 字符分割
在LED區(qū)域,目標(biāo)數(shù)字與背景對比比較明顯,因此,該圖像的灰度直方圖會出現(xiàn)明顯的雙峰。但現(xiàn)場采集的圖像噪聲較大,如采用最佳閾值分割算法來提取目標(biāo)字符,它的分割效果不理想,因為該算法對噪聲敏感,數(shù)字筆畫二值化后,會出現(xiàn)部分信息丟失的情況,如圖3所示。針對非均勻光照的字符圖像,文獻[10]采用局部均值分割圖像的二值化方法,該方法能降低圖像處理的耗時,但其對噪聲較敏感。本文將邊緣檢測與區(qū)域掃描方法相結(jié)合的方法對數(shù)字筆畫進行二值化處理。首先,在RGB空間內(nèi)對圖像進行梯度計算,根據(jù)計算得到的梯度圖像,初步勾畫出字符的邊緣;其次,選擇適當(dāng)?shù)拇皩拻呙柘鄳?yīng)的筆畫區(qū)域,刪除噪聲影響下的偽筆畫邊緣;最后,對已確定的有效筆畫區(qū)域進行填充。試驗結(jié)果表明,本文方法對噪聲不太敏感,且在由于陰影、光照條件較差、噪聲背景干擾等原因使得筆畫圖像不清晰的情況下,也能獲得較好的分割效果。根據(jù)二值化后的圖像特征,再利用水平投影和垂直投影來分割單個字符。二值化后的圖像和垂直投影圖像分別見圖4和5。

圖3 最佳閾值分割算法Fig.3 Optimal threshold segmentation

圖4 本文算法效果圖Fig.4 The result diagram of the proposed algorithm

圖5 垂直投影圖Fig.5 Vertical projection image
由圖4和5可以看出,由于LED區(qū)域的數(shù)字是傾斜顯示的,導(dǎo)致該圖像的垂直投影會出現(xiàn)小數(shù)點被覆蓋,或者數(shù)字投影和小數(shù)點投影相連,而無明顯分界點的現(xiàn)象,因此,小數(shù)點無法被分割出來,使數(shù)字識別結(jié)果出現(xiàn)錯誤。
由于小數(shù)點所占的像素少,容易受到噪聲的干擾。因此,小數(shù)點的確定和識別需要單獨處理。針對上述問題,文獻[9]提出了先計算出每個字符的寬度,再通過統(tǒng)計各個字符的寬度和字符間的距離來確定小數(shù)點的存在和所處的位置。故本文采用文獻[9]的方法將小數(shù)點分割出來。
2.3 字符識別
字符特征主要分為兩類:統(tǒng)計特征和結(jié)構(gòu)特征。
1)小數(shù)點識別
小數(shù)點的識別是利用其統(tǒng)計特征和結(jié)構(gòu)特征。將分割出來的小數(shù)點圖像分別作水平和垂直投影,根據(jù)小數(shù)點水平和垂直投影形狀相同的原則,排除噪聲干擾。該方法能有效地檢測出小數(shù)點,且抗噪能力較好。試驗結(jié)果表明,該方法拒絕識別率和錯誤識別率都較低,說明了基于小數(shù)點的幾何特征和統(tǒng)計特征的投影識別方法是可行的、有效的。小數(shù)點識別效果圖見圖6。

圖6 小數(shù)點識別圖Fig.6 Recognition of decimal point
2)數(shù)字識別
LED顯示的數(shù)字字符的統(tǒng)計特征比較明顯,利用字符筆畫的統(tǒng)計特征可以將字符有效的筆畫識別出來。統(tǒng)計筆畫采用自適應(yīng)的閾值判定所檢測的筆畫的有效性,該計算過程簡單,只有計算筆畫有效區(qū)域的面積和算數(shù)運算(減法運算),因此,該方法的魯棒性和時效性較高。結(jié)合數(shù)字的統(tǒng)計特征和多線程思想,數(shù)字識別算法流程見圖7。圖中,n0為單個字符中部區(qū)域的白色像素點個數(shù);nl為單個字符左半?yún)^(qū)域的白色像素點個數(shù);nr為單個字符右半?yún)^(qū)域的白色像素點個數(shù) ;nu為單個字符上半?yún)^(qū)域的白色像素點個數(shù);nd為單個字符下半?yún)^(qū)域的白色像素點個數(shù);n11/2為單個字符上半?yún)^(qū)域左半?yún)^(qū)的白色像素點個數(shù);nr1/2為單個字符上半?yún)^(qū)域右半?yún)^(qū)的白色像素點個數(shù);nu1/2為單個字符上半?yún)^(qū)域上半?yún)^(qū)的白色像素點個數(shù);nd1/2為單個字符上半?yún)^(qū)域下半?yún)^(qū)的白色像素點個數(shù);T為閾值,其數(shù)值為一筆的有效筆畫所含的白色像素點個數(shù)。

圖7 數(shù)字識別流程圖Fig.7 Number recognition flow chart
該識別系統(tǒng)采用VC 6.0編程實現(xiàn),系統(tǒng)識別界面如圖6所示。試驗圖像集來源于工業(yè)現(xiàn)場,由63幅LED圖像組成。試驗結(jié)果見表1。

圖8 識別模塊界面Fig.8 Recognition module interface

表1 試驗結(jié)果Table1 The result of experiment
由試驗結(jié)果可知,數(shù)字字符和小數(shù)點的識別率在95%以上,且拒識別率不到4%,算法運行的平均時間為1300ms,這說明算法的識別率較高,整個系統(tǒng)耗時也較短。
隨著機器視覺和數(shù)字圖像處理技術(shù)的發(fā)展,自動智能抄表設(shè)備將會成為工業(yè)生產(chǎn)和日常生活的常用智能設(shè)備。因此,本文提出了一種LED顯示儀表的字符識別方法。試驗結(jié)果表明,該系統(tǒng)的識別率較高,能達到95%以上,且算法耗時也有一定改善。本方法主要用于識別LED顯示的數(shù)字字符,有一定局限性。下一步的研究工作是提高識別算法的魯棒性和實時性,同時將完善多種儀表區(qū)分、識別等功能,促進智能抄表技術(shù)適應(yīng)更多的使用環(huán)境,提高儀表校正和儀表數(shù)據(jù)的錄入效率。
[1]Ghugardare R P,Narote S P,Mukherji P,et al. Optical Character Recognition System for Seven Segment Display Image of Measuring Instruments[C]// 2009 IEEE Region 10 Conference. [S. l.]:IEEE,2009:1-6.
[2]Algeria F C,Serra A C.Automatic Calibration of Analog and Digital Measuring Instruments Using Computer Vision [J]. IEEE Transaction on Instrumentation and Measurement,2000,49(1):94-99.
[3] 譚 義. 機器視覺的數(shù)顯儀表讀數(shù)研究及應(yīng)用[D]. 廣東:廣東工業(yè)大學(xué),2007. Tan Yi. Number Instrument Reading Research and Application Based on Machine Vision[D]. Guangdong:Guangdong University of Technology,2007.
[4]Katsuyama Y,Minagawa A,Hotta Y,et al. A Study on Caption Recognition for Multi-Color Characters on Complex Background[C]//2012 IEEE International Symposium on Multimedia. [S. l.]:IEEE,2012:401-408.
[5]Shen Huiying,Coughlan J. Reading LCD/LED Displays with a Camera Cell Phone[C]//2006 Conference on Computer Vision and Pattern Recognition Workshop. [S. l.]:IEEE,2006:1-6.
[6]Liang Chao,Yang Wenming,Liao Qingmin. An Automatic Interpretation Method for LCD Images of Digital Measuring Instruments[C]//2011 4th International Congress on Image and Signal Processing. [S. l.]:IEEE,2011:1826-1829.
[7] 荊倩倩. 電表抄表中的識別算法研究[D]. 長春:吉林大學(xué),2011. Jing Qianqian. The Research of Recognition Algorithm for Ammeter[D]. Changchun:Jilin University,2011.
[8] 李曉東,李志強,雷曉平,等. 彩色數(shù)字儀表圖像二值化技術(shù)研究[J].計算機技術(shù)與發(fā)展,2010,20(4):120-123. Li Xiaodong,Li Zhiqiang,Lei Xiaoping,et al. A Research of Thresholding Technology for Color Image of Digital Instrument[J]. Computer Technology and Development,2010,20(4):120-123.
[9] 唐軼峻,申小陽,朱雯蘭,等. 基于BP神經(jīng)網(wǎng)絡(luò)的數(shù)顯儀表數(shù)字字符識別系統(tǒng)[J].電測與儀表,2005,42(477):42-45. Tang Yijun,Shen Xiaoyang,Zhu Wenlan,et al. Recognition System for Character of Numeral Instrument Dynamic Displayed Based on BP Neural Network[J]. Electrical Measurement & Instrumentation,2005,42(477):42-45.
[10]黃蒞辰,張 劍,周 游,等.基于非均勻光照下文本圖像二值化改進算法[J].湖南工業(yè)大學(xué)學(xué)報,2013,27 (6):40-45. Huang Licheng, Zhang Jian, Zhou You, et al. An Improved Image and Text Binarization Algorithm Based on Non-Uniform Illumination[J]. Journal of Hunan University of Technology,2013,27(6):40-45.
(責(zé)任編輯:鄧 彬)
The Method of Character Recognition Displaying on LED
Tong Wenchao,Su Xiaohua,Long Yonghong, Xiao Xiyu
(School of Electrical and Information Engineering,Hunan University of Technology,Zhuzhou Hunan 412007,China)
Aiming at LED display meter, put forward a character recognition method. Its character segmentation applied edge detection, line detection and gray projection to rapidly extract target character. It recognized number and decimal point separately and improves the self-adaptive threshold number recognition based on the statistical feature of numerical strikes. Experimental result indicates that the accuracy of the proposed recognition algorithm reaches over 95% and the time-consuming is short, which demonstrates the algorithm of high accuracy and good real-time.
character segmentation;geometrical feature;statistical characteristic;character recognition
TP273
:A
:1673-9833(2014)01-0067-04
2013-11-30
童文超(1988-),男,江西上饒人,湖南工業(yè)大學(xué)碩士生,主要研究方向為數(shù)字圖像處理,機器視覺,
E-mail:tongwenchao888@163.com
10.3969/j.issn.1673-9833.2014.01.014