李怡軒
(渭南師范學(xué)院,渭南 714000)
手寫(xiě)數(shù)字在人口普查、金融票據(jù)、郵件分揀等領(lǐng)域有著極其廣泛地應(yīng)用[1-2],手寫(xiě)數(shù)字識(shí)別是當(dāng)前圖像處理和模式識(shí)別領(lǐng)域的一個(gè)重要研究分支,由于手寫(xiě)數(shù)字的隨意性大,其識(shí)別準(zhǔn)確率易受字體大小、筆畫(huà)粗細(xì)和傾斜角度等因素的影響,因此進(jìn)行手寫(xiě)數(shù)字識(shí)別方法和系統(tǒng)的設(shè)計(jì)具有重要的理論價(jià)值和實(shí)際意義。本文將機(jī)器學(xué)習(xí)方法應(yīng)用于手寫(xiě)數(shù)字系統(tǒng)識(shí)別設(shè)計(jì),開(kāi)發(fā)出一個(gè)小型的基于機(jī)器學(xué)習(xí)的手寫(xiě)數(shù)字識(shí)別系統(tǒng)。
基于機(jī)器學(xué)習(xí)的手寫(xiě)數(shù)字識(shí)別主要包括圖像預(yù)處理模塊、特征提取模塊、分類(lèi)器設(shè)計(jì)模塊以及數(shù)字識(shí)別模塊。圖像預(yù)處理主要包括圖像降噪、二值化;特征提取主要根據(jù)手寫(xiě)數(shù)字圖像的自身結(jié)構(gòu)特征,計(jì)算指定方向直線的交叉點(diǎn)、端點(diǎn)作為數(shù)字識(shí)別的特征向量;分類(lèi)器設(shè)計(jì)最主要采用類(lèi)中心的歐式距離分類(lèi)器[3]、馬氏距離分類(lèi)器[4]和貝葉斯分類(lèi)器[5]。手寫(xiě)數(shù)字識(shí)別系統(tǒng)框架,如圖1所示。
基于機(jī)器學(xué)習(xí)的手寫(xiě)數(shù)字識(shí)別的流程如下:

圖1 手寫(xiě)數(shù)字識(shí)別系統(tǒng)框架
(1)讀取手寫(xiě)數(shù)字圖像,并將其歸一化和統(tǒng)一尺寸為24×24圖像塊;
(2)圖像降噪、二值化和細(xì)化操作;
(3)數(shù)字圖像特征提取;
(4)載入模板數(shù)據(jù)矩陣,進(jìn)行數(shù)字識(shí)別。
識(shí)別流程,如圖2所示。
預(yù)處理二值化和細(xì)化的手寫(xiě)數(shù)字圖像,在行寬的5/12、1/2和7/12處生成三條垂直線[6],提取三條垂直線和手寫(xiě)數(shù)字筆劃的交點(diǎn)數(shù)并保存。……