999精品在线视频,手机成人午夜在线视频,久久不卡国产精品无码,中日无码在线观看,成人av手机在线观看,日韩精品亚洲一区中文字幕,亚洲av无码人妻,四虎国产在线观看 ?

基于2DPCA的手寫(xiě)數(shù)字識(shí)別

2012-09-26 02:27:36王軍平趙振華
電子設(shè)計(jì)工程 2012年21期

王軍平,趙振華

(1.咸陽(yáng)職業(yè)技術(shù)學(xué)院 電子信息系,陜西 咸陽(yáng) 712000;2.蘭州理工大學(xué) 電氣工程與信息工程學(xué)院,甘肅 蘭州 730050)

手寫(xiě)數(shù)字識(shí)別研究有著廣泛的應(yīng)用背景和重要的理論意義[1-3]。如今在郵政、財(cái)政、稅務(wù)等工作中都需要進(jìn)行手寫(xiě)數(shù)字的識(shí)別,識(shí)別結(jié)果的好壞直接影響到工作的效率。另外,由于數(shù)字識(shí)別的類(lèi)別較小,有助于作深入分析及驗(yàn)證一些新的理論。例如支持向量機(jī)的提出,就是先在手寫(xiě)體數(shù)字識(shí)別領(lǐng)域里進(jìn)行驗(yàn)證,然后推廣到了其他的領(lǐng)域。

目前,對(duì)手寫(xiě)數(shù)字識(shí)別的研究依據(jù)特征的提取可分為兩大類(lèi):基于字符統(tǒng)計(jì)規(guī)律和基于字符結(jié)構(gòu)特征。基于統(tǒng)計(jì)規(guī)律的方法是利用字符樣本庫(kù),找出0到9中每類(lèi)字符空間分布的統(tǒng)計(jì)規(guī)律,構(gòu)成分類(lèi)器進(jìn)行識(shí)別?;谧址Y(jié)構(gòu)特征的方法是分析字符筆畫(huà)的構(gòu)造如圈、端點(diǎn)、交叉點(diǎn)、輪廓等來(lái)構(gòu)造分類(lèi)器進(jìn)行識(shí)別。兩類(lèi)方法各有優(yōu)勢(shì),總體而言,統(tǒng)計(jì)方法能更好地描述一類(lèi)模式的本質(zhì)特征,對(duì)于與給定訓(xùn)練集差別不大的字符具有較高的識(shí)別率;基于字符結(jié)構(gòu)特征的方法精確地描述了字符的細(xì)節(jié)特征,對(duì)書(shū)寫(xiě)結(jié)構(gòu)較規(guī)范的字符有較高的識(shí)別率。

在字符的特征提取中,主元分析(PCA)是一種十分有效的方法。PCA的思想是將高維樣本空間的樣本投影到某個(gè)低維子空間,使得在該子空間中,投影樣本的類(lèi)間方差最大,類(lèi)內(nèi)方差最小。在字符識(shí)別中,PCA方法通常是將樣本庫(kù)中的每個(gè)字符圖像矩陣轉(zhuǎn)換為一維向量,然后求出樣本總體的協(xié)方差矩陣,計(jì)算出該矩陣的特征值及特征向量,根據(jù)特征值及對(duì)應(yīng)的特征向量確定子空間的基向量。子空間的這些基向量又稱(chēng)為字符圖像的特征圖,每個(gè)字符圖像都可以由特征圖的不同加權(quán)和重構(gòu)出來(lái),其與原圖的均方誤差是沒(méi)有選取的那些特征值之和。由于選取的特征向量是對(duì)應(yīng)于特征值較大的那些向量,一般遠(yuǎn)少于特征向量總數(shù),這樣就實(shí)現(xiàn)了對(duì)原始樣本空間的降維。

雖然PCA能有效地降低樣本空間的維數(shù),但在實(shí)現(xiàn)過(guò)程中2D的圖像矩陣必須首先轉(zhuǎn)換為1D的圖像向量,其所產(chǎn)生的圖像向量空間的維數(shù)就很高,例如在MINIST字符庫(kù)中,每個(gè)字符圖像為28×28像素,轉(zhuǎn)換為一維圖像向量是1×784,這些圖像向量所構(gòu)成的空間的維數(shù)就為784。這樣就很難精確計(jì)算相應(yīng)的協(xié)方差矩陣。為了克服這一困難,就產(chǎn)生了二維主元分析(2DPCA)方法。相對(duì)于PCA,2DPCA是基于二維圖像矩陣而非一維向量,即不需將圖像轉(zhuǎn)換成一維的向量,取代PCA中樣本總體協(xié)方差矩陣的是圖像協(xié)方差矩陣,它是直接從字符圖像矩陣中構(gòu)造出來(lái)的。這樣得到的圖像協(xié)方差矩陣較PCA要小很多。2DPCA有兩個(gè)明顯的優(yōu)點(diǎn):首先容易精確計(jì)算協(xié)方差矩陣,其次確定相應(yīng)的特征向量所耗的時(shí)間要少的多。

文中首先介紹2DPCA的原理及其算法的描述,隨后簡(jiǎn)要說(shuō)明識(shí)別過(guò)程要用到的一些圖像預(yù)處理,第3節(jié)講述兩種分類(lèi)器的構(gòu)造,第4節(jié)是實(shí)驗(yàn)及結(jié)果分析,最后做出總結(jié)。

1 二維主元分析

1.1 原理及算法

用X表示一個(gè)歸一化的n維列向量,A為某個(gè)m×n的圖像矩陣,通過(guò)下面的線性變換將A投影到X:

這樣就得到了一個(gè)m維的向量Y,稱(chēng)之為圖像A的投影特征向量。為了確定最佳的投影向量X,引入投影到X上的樣本的整體散度來(lái)度量X的分辨能力。投影樣本的總體散度可以用投影特征向量的協(xié)方差矩陣的跡來(lái)確定。由此得到下面的判據(jù):

其中Sx表示訓(xùn)練樣本的投影特征向量所構(gòu)成的協(xié)方差矩陣,tr(Sx)表示的跡。通過(guò)對(duì)(2)式的最大化來(lái)找出X的某個(gè)投影方向,投影到該方向的樣本總體散度最大。協(xié)方差矩陣Sx可表示為

所以有

現(xiàn)在定義下面的矩陣

稱(chēng)矩陣Gt為圖像協(xié)方差(散度)矩陣。容易驗(yàn)證Gt為n×n非負(fù)定矩陣。Gt可以利用訓(xùn)練圖像樣本直接計(jì)算出來(lái)。假定共有 M 個(gè)訓(xùn)練樣本,Aj(j=1,2,…,M)表示第 j個(gè)訓(xùn)練圖像,大小為m×n的矩陣,A表示所有訓(xùn)練圖像的均值。則Gt為

則判據(jù)(2)可表示為

其中X為歸一化的列向量。使這個(gè)判據(jù)最大化的歸一化向量X被稱(chēng)為最優(yōu)投影軸。直觀上講,它意謂著在圖像投影到X后,所得的投影樣本的總體散度是最大的。

最優(yōu)投影軸Xopt是最大化J(X)的歸一化向量,即Gt的特征向量中對(duì)應(yīng)于最大特征值的那個(gè)特征向量。通常需要選取一組正交的投影軸,X1,…,Xd,來(lái)最大化 J(X),即

事實(shí)上,最優(yōu)的投影軸,X1,…,Xd,是 Gt的前 d 個(gè)最大特征值所對(duì)應(yīng)的正交特征向量。

1.2 特征提取

已經(jīng)得到了2DPCA的最優(yōu)投影向量X1,…,Xd,就可以用這些向量進(jìn)行特征提取。對(duì)圖像樣本A,定義:

這樣得到一組特征向量Y1,…,Yd,稱(chēng)之為樣本圖像A的主成分(向量)。注意2DPCA的每個(gè)主成分是向量,而PCA的主成分是標(biāo)量。

用這些主成分向量構(gòu)成一個(gè)m×d矩陣C=[Y1,…,Yd],稱(chēng)其為圖像樣本A的特征矩陣或特征圖。

1.3 基于2DPCA的圖像重構(gòu)

在PCA方法中,重構(gòu)圖像是用主成分和特征向量(特征圖)結(jié)合在一起完成的。2DPCA可以用下面類(lèi)似的方法實(shí)現(xiàn)對(duì)圖像的重構(gòu)。

設(shè)圖像的協(xié)方差矩陣為Gt,其前d個(gè)最大的特征值所對(duì)應(yīng)的特征向量為X1,…,Xd,這些特征向量是正交的。將圖像樣本投影到這些向量軸上,生成主成分向量,Yk=AXk,(k=1,2,…,d)。 設(shè)

因?yàn)?X1,…,Xd是正交的,由(8)可以得到樣本 A的重構(gòu)圖像:

2 字符識(shí)別方法

用2DPCA方法對(duì)字符圖像進(jìn)行變換后,就可以利用圖像的主成分向量來(lái)構(gòu)造分類(lèi)器進(jìn)行字符的識(shí)別。作為研究,文中采用了兩種識(shí)別方法。第一種是最鄰近法,另一為重構(gòu)誤差法,下面分別介紹。

2.1 最鄰近法

其中‖Y(i)k-Y(j)k‖2表示兩個(gè)主成分向量Y(i)k和Y(j)k之間的歐氏距離。

現(xiàn)在假定訓(xùn)練樣本為C1,C2,…,CN(N為訓(xùn)練樣本的總數(shù)),并且每個(gè)樣本都指定了類(lèi)別γk,對(duì)某個(gè)測(cè)試樣本C,若d(C,Cl)=mind(C,Cj),且 Cl∈γk,則有 C∈γk。

2.2 重構(gòu)i誤差法

隨后分別計(jì)算出測(cè)試樣本與每類(lèi)近似圖像的誤差,

則C應(yīng)屬于誤差最小的那類(lèi)字符,即

3 圖像預(yù)處理

為了提高字符的識(shí)別率,有必要對(duì)字符圖像進(jìn)行一些預(yù)處理。預(yù)處理的目的是將字符的灰度圖像二值化,并將筆畫(huà)粗細(xì)統(tǒng)一規(guī)范為2個(gè)像素。

文中采用Otsu方法對(duì)字符圖像進(jìn)行二值化。Otsu又稱(chēng)最大類(lèi)間方差法,是在最小二乘法原理的基礎(chǔ)上推導(dǎo)得出的。它通過(guò)利用直方圖零階、一階累積矩來(lái)最大化判別函數(shù),選擇最佳閾值。

字符灰度圖像轉(zhuǎn)化為二值圖像后,利用數(shù)學(xué)形態(tài)學(xué)方法進(jìn)行筆畫(huà)粗細(xì)的規(guī)范處理。下面簡(jiǎn)單介紹一下本文所用到的一些數(shù)學(xué)形態(tài)法的原理。

數(shù)學(xué)形態(tài)學(xué)(Mathematical Morphology)是分析幾何形狀與結(jié)構(gòu)的數(shù)學(xué)方法,目前它已成為分析圖像幾何特征的重要工具。它是由一組形態(tài)學(xué)的代數(shù)運(yùn)算子組成,其中最基本的是腐蝕算子和膨脹算子,運(yùn)用這些算子及其組合可以對(duì)圖像結(jié)構(gòu)和形狀進(jìn)行分析與處理。

對(duì)于一個(gè)給定的目標(biāo)圖像X和一個(gè)結(jié)構(gòu)元素S,如果S[x]∩X≠Φ,即S[x]與X的交集不為空集,表明它們部分相關(guān),則稱(chēng)這個(gè)點(diǎn)集為結(jié)構(gòu)元素S對(duì)X的膨脹,記為X⊕S,用集合表示為X⊕S={x|S[x]∩X≠Φ},膨脹運(yùn)算可以看作是將圖像X中的每一個(gè)點(diǎn)x擴(kuò)大為S[x];與此相反,腐蝕是將X中的每一個(gè)與結(jié)構(gòu)元素S全等的子集S[x]收縮為x所構(gòu)成的集合,記為XΘS,用集合表示為

一個(gè)字符的“骨架”是描述其幾何及拓?fù)湫再|(zhì)的重要特征。本文通過(guò)對(duì)經(jīng)過(guò)二值化的字符進(jìn)行細(xì)化,提取其骨架特征,然后用包括原點(diǎn)的2×2結(jié)構(gòu)元素對(duì)骨架圖像進(jìn)行一次膨脹。包括原點(diǎn)的2×2結(jié)構(gòu)元素對(duì)圖像的膨脹,相當(dāng)于沿著字符骨架在骨架像素的3鄰域分別“加粗”了一個(gè)像素,這就嚴(yán)格保證了字符所有筆畫(huà)均為2個(gè)像素寬度。

圖1是MINIST數(shù)據(jù)庫(kù)中部分樣本的處理結(jié)果。圖中第1行是原始樣本的灰度圖,第2行是二值化圖,第3行是骨骼化圖,第4行是筆畫(huà)規(guī)范圖。從圖中可以看出,通過(guò)上述預(yù)處理過(guò)程,使所有字符筆畫(huà)粗細(xì)取得一致,并且通過(guò)數(shù)學(xué)形態(tài)預(yù)處理,使圖像中字符的部分細(xì)節(jié)得到改善,從而使同類(lèi)字符整體形態(tài)的一致性得到改善。

圖1 字符圖像預(yù)處理Fig.1 Image preprocession of digits

4 實(shí)驗(yàn)及結(jié)果分析

本實(shí)驗(yàn)采用的數(shù)據(jù)庫(kù)是MNIST數(shù)據(jù)庫(kù)[4],此數(shù)據(jù)庫(kù)中含有60 000個(gè)訓(xùn)練樣本和10 000個(gè)測(cè)試樣本,每個(gè)樣本都是28×28個(gè)像素的圖像加上一個(gè)樣本標(biāo)示組成。

圖2 部分子圖Fig.2 Some reconstructed subimages

從圖2可以看到,第一個(gè)子圖包含了原始圖像的大部分信息,隨著k的增加,子圖 A?k的信息量逐漸減少,圖3所示的特征值也逐漸收斂到0,這是因?yàn)槊總€(gè)子圖對(duì)應(yīng)著某個(gè)特征值,而特征值的大小反映了該子圖對(duì)重構(gòu)原圖的貢獻(xiàn)。所以,可以認(rèn)為原始圖像的大部分信息都集中在前幾個(gè)比較大的特征值所對(duì)應(yīng)的子圖中,在識(shí)別過(guò)程中用這些主成分向量來(lái)表示原始圖像是合理的。

現(xiàn)在將這些子圖相加,就可以得到樣本的重構(gòu)(近似圖,圖4給出了數(shù)字3的5個(gè)重構(gòu)圖,它們是將前d(d=2,4,6,8,10)個(gè)子圖相加得到的。 隨著子圖數(shù)量的增加,近似圖越來(lái)越清晰。作為比較,同時(shí)也給出了用PCA的特征圖進(jìn)行重構(gòu)的近似圖,可以看到,2DPCA的效果要好于PCA。

圖3 降序排列的特征值幅度圖Fig.3 Plot of the magnitude of the eigenvalues in decreasing order

圖4 部分基于2DPCA(第一行)和PCA(第二行)重構(gòu)圖Fig.4 Some reconstructed images based on 2DPCA (upper)and PCA (lower)

完成了字符的特征提取,接下來(lái)對(duì)測(cè)試樣本進(jìn)行識(shí)別實(shí)驗(yàn)。實(shí)驗(yàn)中分類(lèi)器分別采用最近鄰法 (Nearest Neighbour Method)和重構(gòu)誤差法(RMEM),識(shí)別結(jié)果如表1所示。作為比較,表1除了PCA外,還給出了其他常用的分類(lèi)器的識(shí)別結(jié)果及計(jì)算耗時(shí)。

表1 常用方法相比較Tab.1 Contrast with traditional methods

從實(shí)驗(yàn)結(jié)果可以看出,無(wú)論是PCA還是2DPCA,采用最近鄰法 (1-nearest neighbor)識(shí)別效果要優(yōu)于重構(gòu)誤差法(Rmem),但重構(gòu)誤差法的計(jì)算時(shí)間要明顯少于最近鄰法,而且2DPCA-Rmem耗時(shí)是所有分類(lèi)器中最少的。

2DPCA優(yōu)于PCA的原因,主要有兩條:1)2DPCA的圖像協(xié)方差矩陣比較小,所以計(jì)算精度要高于PCA;2)重構(gòu)原始樣本時(shí)所用的參數(shù)比PCA要少很多。

在和未作“骨架提取”與“膨脹”預(yù)處理的字符識(shí)別的對(duì)比實(shí)驗(yàn)中發(fā)現(xiàn),通過(guò)圖像預(yù)處理對(duì)字符筆畫(huà)粗細(xì)進(jìn)行規(guī)范后,對(duì)各字符的識(shí)別率平均提高了大約2個(gè)百分點(diǎn)。

總體而言,在表1所示的識(shí)別方法中,2DPCA的識(shí)別率并不是最高的,這是因?yàn)?DPCA是基于統(tǒng)計(jì)規(guī)律,采用的是單一分類(lèi)器,要想進(jìn)一步提高識(shí)別精度,就必須利用字符的結(jié)構(gòu)特征來(lái)構(gòu)造分類(lèi)器,并將兩類(lèi)分類(lèi)器結(jié)合起來(lái)進(jìn)行識(shí)別。不過(guò)就計(jì)算速度而言,2DPCA具有明顯的優(yōu)勢(shì),比較適用于某些實(shí)時(shí)性要求較高的場(chǎng)合。

5 結(jié) 論

文中提出了一種基于2DPCA的手寫(xiě)字符識(shí)別方法:針對(duì)手寫(xiě)字符書(shū)寫(xiě)隨意,字符筆畫(huà)形態(tài)結(jié)構(gòu)不穩(wěn)定的特點(diǎn),提出首先采用數(shù)學(xué)形態(tài)學(xué)方法對(duì)字符筆畫(huà)的粗細(xì)特征進(jìn)行規(guī)范,保證了字符筆畫(huà)粗細(xì)的一致性,同時(shí)也使字符部分細(xì)節(jié)的一致性得到改善;在通過(guò)圖像預(yù)處理得到相對(duì)穩(wěn)定的模式后,利用2DPCA抽取字符特征,在相應(yīng)基向量張成的特征空間里對(duì)字符的重建模型進(jìn)行估計(jì),并利用重建誤差及最近鄰法對(duì)字符進(jìn)行識(shí)別。從實(shí)驗(yàn)結(jié)果看,該方法在準(zhǔn)確率和計(jì)算耗時(shí)方面有明顯的提高。從理論上講,訓(xùn)練集的規(guī)模越大越好,但從實(shí)驗(yàn)中發(fā)現(xiàn)訓(xùn)練集規(guī)模達(dá)到一定程度時(shí),本算法的識(shí)別率已很高且穩(wěn)定,初步觀察發(fā)現(xiàn)它所要求的訓(xùn)練集規(guī)模比其他方法相對(duì)要小,這樣就會(huì)節(jié)省不少訓(xùn)練時(shí)間。在進(jìn)一步的研究中將考慮結(jié)合其它字符形態(tài)矯正預(yù)處理方法,使字符模式更加穩(wěn)定,以進(jìn)一步提高字符識(shí)別率。

[1]YousefAO,CherietM.Databasesforrecognitionof handwritten arabic cheques[J].Pattern Recognition,2003(36):111-121.

[2]Juan A,Vidal E.On the use of Bernoulli mixture models for text classification[J].Pattern Recognition,2002,35 (12):2705-2710.

[3]Hu J,Yan H.Structural primitive extraction and coding for handwritten numeralrecognition[J].Pattern Recognition,1998,31(5):493-509.

[4]Hsu Chih-wei,Chang Chih-chung.A practicalguide to support vector classification [EB/OL](2010-04-15).http://www.csie.ntu.edu.tw/~cjlin/.

[5]LeCun Y,Jackel L.Learning algorithms for handwritten digitalrecognition [J].Int’L Conf1 ArtificialNeural Networks1 Paris.AI Computer Press,1995(1):53-60.

[6]Seong-Whan L.Multilayer cluster neural network for totally unconstrained handwritten numeral recognition[J].Neural Networks,1995,8(5):783-792.

[7]DONG Jian-xiong,Krzy’zakb A,Suen C Y.Local learning framework for handwritten character recognition [J].Engineering Applications of Artificial Intelligence,2002,15(2):151-159.

[8]ZHANG Bai-ling,F(xiàn)U Min-yue,YAN Hong.Handwritten digit recognition by adaptive-subspace self-organizing map[J].IEEE Trans Neural Network,1999,10(4):589-603.

[9]Teow L N,Loe K F.Robustvision-basedfeatures and classificationschemes for off-linehandwritten digit recognition[J].Electronic Design Engineering,2002,35(11):2355-2364.

主站蜘蛛池模板: 亚洲欧美日韩高清综合678| 国产福利免费在线观看| 欧美一区精品| 99热国产这里只有精品无卡顿"| 丁香综合在线| 亚洲AV人人澡人人双人| 多人乱p欧美在线观看| yjizz国产在线视频网| 国产综合另类小说色区色噜噜 | 干中文字幕| 色偷偷一区二区三区| 亚洲欧美不卡| 国产精品专区第1页| 性欧美久久| 97影院午夜在线观看视频| 亚洲伊人电影| 在线观看免费国产| 久久黄色视频影| 无码 在线 在线| 伊人成人在线| 国产99久久亚洲综合精品西瓜tv| 91成人免费观看在线观看| 亚洲一区无码在线| 日韩无码视频专区| 国产高颜值露脸在线观看| 2020精品极品国产色在线观看| 白浆免费视频国产精品视频| 色婷婷综合激情视频免费看| 99视频在线免费| 亚洲精品制服丝袜二区| 激情国产精品一区| 国产成人毛片| 呦女亚洲一区精品| 91精品伊人久久大香线蕉| 色婷婷丁香| 精品无码一区二区三区电影| 国产99在线| 国产精品欧美日本韩免费一区二区三区不卡| 国产91高跟丝袜| 极品私人尤物在线精品首页 | 国产成人高清在线精品| 亚洲国产系列| 国产精品片在线观看手机版 | a亚洲视频| 亚洲精品国产日韩无码AV永久免费网| 麻豆精品国产自产在线| 在线视频亚洲色图| lhav亚洲精品| 在线观看亚洲成人| a级毛片免费网站| 亚洲一级毛片免费看| 国产精品久久久久久久久| 久久窝窝国产精品午夜看片| v天堂中文在线| 波多野结衣一区二区三区四区视频 | 国产av一码二码三码无码| 久久精品嫩草研究院| 97国产精品视频自在拍| 国产在线小视频| 午夜小视频在线| 免费无遮挡AV| 亚洲色图综合在线| 久久国产V一级毛多内射| 欧美日韩中文国产va另类| 91精品伊人久久大香线蕉| 综1合AV在线播放| 天堂成人av| 无码AV日韩一二三区| 欧美一级专区免费大片| 婷婷午夜天| 午夜老司机永久免费看片| 成年人国产网站| 色哟哟国产精品一区二区| 蜜臀AV在线播放| 国产黑丝视频在线观看| 亚洲乱强伦| 久久99国产综合精品女同| 久久久亚洲国产美女国产盗摄| m男亚洲一区中文字幕| 国产在线91在线电影| 成色7777精品在线| 2021国产精品自产拍在线|