尹 佳,李 杰,王麗榮
(1.長春理工大學 研究生學院,吉林 長春 130022;2.長春大學 電子信息工程學院,吉林 長春 130022)
盲文自動識別方法研究
尹 佳1,李 杰2,王麗榮2
(1.長春理工大學 研究生學院,吉林 長春 130022;2.長春大學 電子信息工程學院,吉林 長春 130022)
本文研究的盲文點字自動識別技術,利用數字攝像機采集盲文圖像,并利用圖像處理技術,對盲文圖像進行預處理,將盲文圖像轉換成二值圖像,然后再利用盲文點字的特性來提取盲文點字特征,并定位、分組盲文點字單元,以二進制字符串的形式與盲文語料庫進行匹配,識別出盲文點字信息。本論文中給出了盲文識別的總體方法,并詳細介紹了具體的處理方法。實驗證明,該方法能有效、準確的提取盲文點字,并轉換成漢語拼音。
盲文識別;盲文圖像采集;盲文圖像分割;盲文特征提取
根據我國的盲人數量以及受教育的盲人數量來看,我國視力殘疾人群中有很大一部分不能順利閱讀盲文讀物,這對盲人信息獲取、融入社會極為不利。在盲人學校,任課教師大都視力正常且大多不懂盲文,大量的盲文試卷、作業等盲文材料需要任課教師閱讀、批改,這對老師來說無疑是一項艱巨的工作,如何快速準確批閱盲生試卷作業等現實性事件已成為盲校教學中亟待解決的問題。
本文主要研究盲文點字的提取識別方法,主要包括盲文圖像的獲取方法及預處理、盲文點字信息的提取及識別技術等幾個部分。研究的最終目的是要研發出一種方便快捷的盲文自動識別裝置。盲文是通過點字機等在紙張上制作出的不同組合的凸點陣(3×2陣列),如圖1所示為盲文的采集圖片。
盲文圖像的采集部分由成像裝置和鏡頭兩部分組成,這也是組成識別系統的重要環節。本論文在研究階段采用如圖2所示的圖像采集系統,該裝置能完成一秒鐘高速拍攝,分辨率達到2048×1536,可拍取30cm ×23cm大小紙張的材料,圖像數據通過USB2.0接口傳送到主機。

圖1 盲文采集系統采集的盲文示意圖

圖2 盲文采集系統
本文采用了有限對比自適應直方圖均衡化的方法。該方法采用局部均衡的方法,就是把圖像分割成若干小區域進行各個部分的局部均衡。該方法由于對每一小塊都進行了直方圖均衡,輸出圖像更加接近指定圖像。同時該方法還可調整灰度圖像的對比度,使圖像像素均勻分布在圖像的整個灰度范圍內。此外,盲文圖像在進行局部均衡化后產生的人為邊界,通過雙線性插值方法來組合相鄰的區域予以消除。經過增強處理的盲文圖像如圖3所示。
盲文點字檢測也就是點字的特征提取,即把點字從圖像中提取出來。本文主要包括以下兩個部分:數學形態學處理和閾值分割數學形態學是一門新興的圖像處理分析工具,包括腐蝕、膨脹、開運算和閉運算[1]。根據盲文圖像特點,我們最終選取半徑為1的圓形結構元素對盲文圖像進行腐蝕的方法,來檢測相應盲文特征信息。圖像的腐蝕可以消除圖像的邊界點,使圖像邊界向內部收縮,把小于結構元素的圖像去除,消除圖像邊緣的尖峰和凸角及圖像間的細小連通。之后采用閾值分割方法[2]對圖像進行二值處理。
閾值分割的關鍵是閾值的選取方法,大津法是一種自適應計算閾值的分割方法。假設有大小為M×N圖像I(x,y),記T為前景(目標)和背景的分割閾值,屬于前景的像素點數占整幅圖像的比例記為w0,其平均灰度v0;背景像素點數占w1,其平均灰度為v1。圖像的總平均灰度記為v,類間方差記為g。圖像中像素的灰度值小于閾值T的像素個數記作N0,像素灰度大于閾值T的像素個數記作N1,則有:

在實際應用中,我們直接用大津法計算量大,一般為了減少計算量,將式(1)代入式(2),得到等價公式:

采用遍歷的方法,設灰度值t,然后從最小灰度值到最大灰度值遍歷t,當t值使類間方差g最大時,t即為分割的最佳閾值T,使用該方法進行分割意味著錯分概率最小。針對盲文圖像特點,本文具體采用了局部閾值分割方法,先把盲文圖像分成若干小塊,再分別在每個圖像小塊內采用大津算法進行局部分割,并根據盲文排列的直線型特點,去除孤立點及雜點。提取出我們實驗所需要的盲文點字,實驗結果如圖4所示。

圖3 盲文增強圖像

圖4 盲文二值圖像
進行盲文圖像處理的目的就是要把盲點與背景分開,也就是說盲點與背景的閾值要形成很大的差異,這樣我們就可以在后面的處理中,根據盲點的閾值來定位該點,并分出盲文單元,與語料庫進行匹配,輸出識別結果。
4.1 盲文單元分組定位
如圖5所示左上角的一個3×2陣列即為一個盲文單元,假設6點的位置按圖5所示順序(a,b,c,d,e,f)進行排列。研究發現,盲文字符所對應的點陣的排列是有一定規律的,而且每個盲文字符代碼間的距離都是有一定標準的[3]。我們可以根據這一性質來進行盲文字符的提取。
根據紙介盲文的這些特點,我們通過盲點的閾值,以水平和垂直兩個方向為目標,對盲文圖像進行劃線處理,則盲文點字落在直線上,如圖5所示。然后以3×2矩陣形式依次進行分塊劃分,一個目標矩陣為一個盲文單元。在每個盲文單元里按先前規定的順序檢測直線交點處是否存在盲點,有點處用1表示,無點處用0表示[4],最終以一個二進制字符串的形式予以表示并保存該盲文字符。圖5所示上半部的首個盲文單元以二進制字符串011110的形式保存。

圖5 盲文識別示例圖
4.2 盲文字符到漢語拼音的識別
由于漢語盲文是由拼音、數字、標點符號組成的。我們的任務是把識別出的盲文單元轉換成他所代表的字母、數字或標點,這要求我們建立標準的盲文語料庫。根據我們前文提到的方法,把所有漢語盲文字符的二進制字符串和所對應的字符一一對應的存入預料庫中,建立專業的標準盲文語料庫。識別過程是:提取出盲文單元,把盲文轉換成二進制的字符串,和語料庫中的字符串進行一一比對,匹配成功則輸出該字符串所代表的漢語拼音、數字或者標點。未匹配則重新定位該盲文單元,進行再次細化分割,準確識別出盲文單元后再匹配輸出結果。
論文所提及的方法能有效提取紙介盲文圖像中的盲文點字,并能準確的轉換成漢語拼音,完成了盲文到漢語拼音的轉換識別。我們下一步的實驗任務,就是繼續細化相關算法,進一步消除噪聲污染,提高盲文點字提取和盲文識別的準確率;同時把漢語拼音轉換成漢字并進行語音處理,最終以語音的形式輸出。當前所遇到的困難在于,漢語拼音存在一音多字的現象,無論是有聲調的盲文還是無聲調的盲文,在識別成漢語拼音后都存在這種歧義性[5],我們的任務就是深化研究,盡可能的減少識別的歧義性,提高識別率。
[1] 張津,萬振凱.基于數學形態學的圖像二值化算法[J].儀器儀表用戶,2008,115(2):1671-1041.
[2] R.Lienhat,A.Wernicke.Localizing and segmenting text in image,video and web pages[J].IEEE Transactions on Circuits and Systems for Video Technology,2002(12):256-268.
[3] Shanjun ZHANG,K.YOSHINO.A Braille Recognition System by the Mobile Phone with Embedded Camera[J].ICICIC 2007:1321-1324.
[4] H.R.Shahbazkia,T.T.Silva and R.M.Guerreiro.Automatic Braille Code Translation System[M].M.Lazo and A.Sanfeliu(Eds.):CIARP 2005,LNCS 3773,2005:233-241.
[5] 江銘虎,朱小燕,等.基于多種知識的盲文翻譯的研究[J].清華大學學報(自然科學版),2000,40(9):69-73.
責任編輯:吳旭云
Research on braille automatic identification method
YIN Jia1,LI Jie2,WANG Li-rong2
(1.Graduate School,Changchun University of Science and Technology,Changchun 130022,China; 2.College of Electronic Information Engineering,Changchun University,Changchun 130022,China)
The braille automatic identification technology described in this paper captures braille images by digital camera,pretreats them by image processing technology,converts them into binary images,then extracts braille features by the fixed nature of braille,positions and groups braille cells to match corpora by the binary character string so as to identify information.This paper gives the general method of braille recognition and introduces concrete methods.The experiments show that the method is effective and accurate for braille extraction and convertion into Chinese spelling.
braille recognition;braille image acquisition;braille image segmentation;braille feature extraction
TP391.41
A
1009-3907(2010)08-0054-03
2010-06-07
長春市科技局國際科技合作項目[08GH07]
尹佳(1986-),男,陜西西安人,碩士研究生,主要從事檢測技術與過程控制方向的研究。