李榮瑞,施 霖
(昆明理工大學(xué) 信息工程與自動(dòng)化學(xué)院,云南 昆明 650500)
盲文識(shí)別研究對(duì)于盲人特殊教育事業(yè)和生活具有重要的意義[1-2]。近年來(lái),國(guó)內(nèi)外學(xué)者在盲文識(shí)別方面做了大量研究,國(guó)外Yasuhiko Ogawat等[3-5]進(jìn)行了基于數(shù)字圖像處理的盲文識(shí)別等研究;國(guó)內(nèi)的周小燕、周春耕等學(xué)者[6-9]做了許多盲文漢語(yǔ)轉(zhuǎn)換方面的工作。但是這些研究中還存在問(wèn)題:(1)使用條件要求嚴(yán)苛,光照、角度的輕微變化會(huì)嚴(yán)重影響識(shí)別準(zhǔn)確率;(2)圖片預(yù)處理過(guò)程復(fù)雜,步驟繁瑣;(3)特征點(diǎn)由研究人員手工提取,費(fèi)時(shí)費(fèi)力且無(wú)法保證準(zhǔn)確性。
自2006年以來(lái),深度學(xué)習(xí)作為機(jī)器學(xué)習(xí)領(lǐng)域中對(duì)圖像等進(jìn)行特征學(xué)習(xí)的一種新方法,在圖像識(shí)別方面取得了巨大成功[10]。卷積神經(jīng)網(wǎng)絡(luò)(Convolutional Neural Network, CNN)是深度學(xué)習(xí)中廣為應(yīng)用的經(jīng)典模型,例如Lenet-5[11],Cifar-10[12]等模型,其強(qiáng)大的特征學(xué)習(xí)能力使得圖像識(shí)別研究取得了突破性的進(jìn)展。
本文利用灰度投影方法來(lái)自動(dòng)校正和分割盲文;構(gòu)建卷積神經(jīng)網(wǎng)絡(luò)(CNN)模型,利用大量疊加噪聲的盲文圖片訓(xùn)練網(wǎng)絡(luò)得到的CNN模型連接Softmax分類器作為盲文識(shí)別部分。最終的盲文自動(dòng)識(shí)別系統(tǒng)具有識(shí)別率高、抗干擾性強(qiáng)等特點(diǎn),在傳統(tǒng)盲文識(shí)別研究中無(wú)法工作的多種環(huán)境下,系統(tǒng)可良好工作,突破傳統(tǒng)盲文識(shí)別系統(tǒng)對(duì)環(huán)境的嚴(yán)苛要求。
作盲文圖像的灰度投影圖要先將盲文圖像轉(zhuǎn)換為二值圖像。盲文圖像盲點(diǎn)與背景的灰度差異很大且灰度值比較集中,這有利于通過(guò)閾值分割方法進(jìn)行二值處理,圖1分別為盲文圖像和利用大律法(OTSU法)[13]得到的此盲文圖像的二值圖像。……