李強(qiáng) 萬太昊 張超 王守志
【摘 要】圖像處理和模式識(shí)別中我們最常用并最具有研究價(jià)值的就是手寫數(shù)字體自動(dòng)識(shí)別技術(shù),本文主要是簡述手寫數(shù)字體自動(dòng)識(shí)別技術(shù)的現(xiàn)狀情況,對我們的手寫數(shù)字體自動(dòng)識(shí)別技術(shù)中的預(yù)處理中一些方法進(jìn)行分析,將該技術(shù)服務(wù)中的重要特征和結(jié)構(gòu)進(jìn)行分開概述,并通過我們的分析,讓讀者可以更加了解手寫數(shù)字體自動(dòng)識(shí)別技術(shù)。
【關(guān)鍵詞】手寫數(shù)字體;自動(dòng)識(shí)別;預(yù)處理;特征提取
引言
手寫數(shù)字體自動(dòng)識(shí)別其實(shí)就是我們手寫出來的數(shù)字通過計(jì)算機(jī)優(yōu)化自動(dòng)識(shí)別出來,它也是我們光學(xué)字符識(shí)別技術(shù)中的一項(xiàng)。我們國內(nèi)的大多學(xué)者其實(shí)已經(jīng)對自動(dòng)識(shí)別技術(shù)有一些較為深入的研究,由此可見,我們國內(nèi)對手寫數(shù)字識(shí)別技術(shù)非常的看重,且該技術(shù)具有非常重要的意義。現(xiàn)在市面上最多的是聯(lián)機(jī)識(shí)別的服務(wù),就是主要通過攝像或手寫板,計(jì)算機(jī)聯(lián)機(jī)在攝像或手寫板進(jìn)行書寫,再通過書寫出來的筆跡或落筆情況的像素空間的位置進(jìn)行自動(dòng)識(shí)別,這個(gè)技術(shù)是已經(jīng)較為成熟的情況,那么我們現(xiàn)在主要是針對脫機(jī)手寫數(shù)字體自動(dòng)識(shí)別技術(shù)進(jìn)行研究,它所涉及到的圖像處理、統(tǒng)計(jì)、模式識(shí)別等等。現(xiàn)在這個(gè)技術(shù)是已經(jīng)有非常廣泛的應(yīng)用了,比如是銀行票據(jù)和文本信息處理等,這個(gè)技術(shù)還有很多的不足之處,因?yàn)閿?shù)字的筆畫和字型的不同,可能會(huì)導(dǎo)致識(shí)別錯(cuò)誤。本文就以脫機(jī)手寫數(shù)字體識(shí)別為主,對其所存在的問題和優(yōu)點(diǎn)、缺點(diǎn)進(jìn)行分別闡述。
一、預(yù)處理
預(yù)處理是我們的手寫數(shù)字體識(shí)別的必不可少的一部分,它其實(shí)主要就是在字符圖像中降噪、壓縮多余信息,以此提高我們的自動(dòng)識(shí)別率和系統(tǒng)的識(shí)別速度。首先:我們?yōu)榱藢D像中筆劃進(jìn)行清晰的展示,需要將我們的圖像顏色進(jìn)行灰度化處理,沒有其他的顏色顯示,只是調(diào)整亮度,通過常用的加權(quán)平均法,然后將圖像的亮度進(jìn)行處理。然后,將我們得到的圖像進(jìn)行二值化,二值化中我們不常用的是動(dòng)態(tài)閥值法,因?yàn)樗饕歉鶕?jù)像元的領(lǐng)域特征來自己適應(yīng)的改變閥值,領(lǐng)域灰度變化太快,計(jì)算時(shí)間長,很麻煩。我們在圖像的采集中,拍攝的時(shí)候光照情況和我們的拍攝環(huán)境是會(huì)影響到圖像的展示,同時(shí)圖像的本身可能也會(huì)存在有損壞的情況,圖像的質(zhì)量無法得到保證。為了得到高質(zhì)量的圖像保證,提高系統(tǒng)的識(shí)別率,我們就需要采取相應(yīng)的措施,增強(qiáng)圖像的主要方式是頻率域法和空間域法。我們常用的是空間域法,因?yàn)樗浅5暮唵我撞僮鳎俣瓤欤瑫r(shí)處理效果也非常好;但不是頻率域法效果不好,它主要是因?yàn)樘闊僮鞯男实停允欠浅2粚?shí)用。
我們的圖像在采集時(shí)都是隨機(jī)選擇的,沒有一個(gè)統(tǒng)一的角度,所以在獲取的圖像,它的傾斜角度是不確定的,即使是有傾斜角度校正的情況,但是識(shí)別出來的效果卻是不一樣的,傾斜校正也就是將圖像的傾斜角度按照一定的角度、方向進(jìn)行旋轉(zhuǎn),我們常常使用的傾斜校正算法是:投影法、近鄰法,Hough變換法等等。我們一般現(xiàn)在使用的是基于小波變換與霍夫變換的圖像傾斜校正的算法:先是我們的原始圖像,進(jìn)行灰度化得到灰度圖像;然后使用動(dòng)態(tài)閥值得到二值圖像;通過小波變換,就有圖像整體概貌的形態(tài)了;再通過邊緣檢測,得出邊緣直線信息,最后再通過霍夫變換就有傾斜角度,最后的最后我們的圖像就校正成功了。
二、特征提取
特征提取是非常關(guān)鍵的,我們的圖像處理中需要保證有足夠的信息量,以此來得到圖像的較高識(shí)別率。我們的手寫數(shù)字特征常見的是結(jié)構(gòu)特征和統(tǒng)計(jì)特征的,結(jié)構(gòu)特征顧名思義就是主要在數(shù)字的結(jié)構(gòu)本質(zhì)上的特點(diǎn);常用的特征提取是主要有:首先是粗網(wǎng)格,通過數(shù)字書寫的不同區(qū)域的黑色像素點(diǎn)的個(gè)數(shù),計(jì)算出黑色像素占比。不管有沒有降噪,它注重的是整體的分布情況,使用中會(huì)自動(dòng)抑制噪聲,圖像的識(shí)別率高。然后是18維特征,主要是在粗網(wǎng)格的基礎(chǔ)上二次改進(jìn),還有主元素分析法。
三、模式分類識(shí)別
模式分類識(shí)別是圖像特征提取后,將特征空間來劃分,脫機(jī)手寫數(shù)字識(shí)別可以分成單分類和多分類集成。我們使用較多的還是多分類集成服務(wù),也是現(xiàn)代社會(huì)的主流。我們的主流手寫體數(shù)字分類器有:基于距離的分類器:相對來說它的概念簡單,操作易上手,對小成本和低維等情況搓搓有余,但是缺點(diǎn)也很明顯,就是太過絕對的代表點(diǎn),容易出錯(cuò);人工神經(jīng)網(wǎng)絡(luò)分類;支持向量機(jī):它主要是針對的機(jī)器學(xué)習(xí)和模式識(shí)別問題;孿生支持向量機(jī):還有待改進(jìn)。
四、結(jié)束語
隨著現(xiàn)代社會(huì)的信息技術(shù)發(fā)展,手寫數(shù)字識(shí)別是已經(jīng)廣泛應(yīng)用了,且在該領(lǐng)域已經(jīng)有非常重大的成果。本文就手寫數(shù)字識(shí)別服務(wù)中的預(yù)處理、特征提取、模式分類識(shí)別等,簡述它們的優(yōu)點(diǎn)和缺點(diǎn)情況,通過以上的分析情況來看,讓讀者對手寫數(shù)字體自動(dòng)識(shí)別技術(shù)有進(jìn)一步的了解,希望有助于以后的手寫數(shù)字體自動(dòng)識(shí)別技術(shù)的更進(jìn)一步的研究。
參考文獻(xiàn):
[1]郭曉永,王相軍.一種基于SNMP的網(wǎng)絡(luò)拓?fù)浒l(fā)現(xiàn)算法[J].重慶工商大學(xué)學(xué)報(bào)(自然科學(xué)版),2011,(1):59-62.doi:10.3969/j.issn.1672-058X.2011.01.015
[2]朱江,宣國榮.一種基于骨架特征順序編碼的脫機(jī)手寫體數(shù)字識(shí)別方法[J].小型微型計(jì)算機(jī)系統(tǒng),2001,(8):957-960.doi:10.3969/j.issn.1000-1220.2001.08.017.
[3]吳冰,秦志遠(yuǎn).自動(dòng)確定圖像二值化最佳閾值的新方法[J].測繪學(xué)院學(xué)報(bào),2001,(4):283-286.doi:10.3969/j.issn.1673-6338.2001.04.014.
[4]張偉,王克儉,秦臻.基于神經(jīng)網(wǎng)絡(luò)的數(shù)字識(shí)別的研究[J].微電子學(xué)與計(jì)算機(jī),2006,(8):206-208.doi:10.3969/j.issn.1000-7180.2006.08.063.
作者簡介:
李強(qiáng),男,山東臨沂人,臨沂大學(xué)信息學(xué)院與工程學(xué)院;
萬太昊,男,山東青島人,臨沂大學(xué)信息學(xué)院與工程學(xué)院;
張超,男,山東臨沂人,臨沂大學(xué)信息學(xué)院與工程學(xué)院
王守志,男,山東臨沂人,臨沂大學(xué)信息學(xué)院與工程學(xué)院,副教授
(作者單位:臨沂大學(xué)信息學(xué)院與工程學(xué)院)