陽(yáng)哲
(四川大學(xué)計(jì)算機(jī)學(xué)院,成都 610065)
卷積神經(jīng)網(wǎng)絡(luò)在印章編號(hào)識(shí)別中的應(yīng)用
陽(yáng)哲
(四川大學(xué)計(jì)算機(jī)學(xué)院,成都610065)
卷積神經(jīng)網(wǎng)絡(luò);印章編號(hào);識(shí)別
印章做為一種重要的鑒定和簽署的文具,在日常生活中應(yīng)用廣泛。每一枚印章都會(huì)有一個(gè)獨(dú)一無(wú)二的編號(hào),作為印章的標(biāo)識(shí)。在實(shí)際生活中,我們往往需要輸入印章的編號(hào)來查詢印章的基本信息,但是目前都是通過手動(dòng)輸入印章的編號(hào)來查詢。隨著深度學(xué)習(xí)的火熱發(fā)展,近幾年深度學(xué)習(xí)在人工智能領(lǐng)域取得很大的進(jìn)展,尤其是在語(yǔ)音識(shí)別和圖像識(shí)別中取得很好的效果。而卷積神經(jīng)網(wǎng)絡(luò)做為一種深度的監(jiān)督學(xué)習(xí)下的機(jī)器學(xué)習(xí)模型,其在圖像識(shí)別領(lǐng)域的應(yīng)用已經(jīng)越來越廣泛,因此本文提出了基于卷積神經(jīng)網(wǎng)絡(luò)的印章編號(hào)識(shí)別算法。
卷積神經(jīng)網(wǎng)絡(luò)是一種前饋神經(jīng)網(wǎng)絡(luò),它的特點(diǎn)是其前饋神經(jīng)元可以響應(yīng)一部分范圍內(nèi)的周圍單元[1],因此適應(yīng)于大型圖像處理。卷積神經(jīng)網(wǎng)絡(luò)可以識(shí)別有變化的模式,對(duì)幾何圖形變形具有魯棒性,較一般神經(jīng)網(wǎng)絡(luò)具有以下優(yōu)點(diǎn):(1)輸入圖像和網(wǎng)絡(luò)的拓?fù)浣Y(jié)構(gòu)可能剛好吻合;(2)特征提取和模式分類同時(shí)進(jìn)行;(3)權(quán)值共享技術(shù)大大減少了網(wǎng)絡(luò)的訓(xùn)練參數(shù),從而使網(wǎng)絡(luò)的結(jié)構(gòu)更加簡(jiǎn)單,適應(yīng)性更強(qiáng)[2]。
1.1卷及神經(jīng)網(wǎng)絡(luò)的歷史
卷積神經(jīng)網(wǎng)絡(luò)的設(shè)計(jì)源自于活生物體視覺機(jī)制的發(fā)現(xiàn)。20世紀(jì)60年代,Hubel和Wiesel發(fā)現(xiàn)動(dòng)物的視覺皮質(zhì)中包含了許多細(xì)胞,這些細(xì)胞組成了感受野,其功能是探測(cè)細(xì)微的光線和覆蓋視覺的子區(qū)域。20世紀(jì)80年代,F(xiàn)ukushima基于感受野概念提出了神經(jīng)認(rèn)知機(jī),這個(gè)可以看做是卷積神經(jīng)網(wǎng)絡(luò)的第一個(gè)實(shí)現(xiàn)網(wǎng)絡(luò),也是感受野在神經(jīng)網(wǎng)絡(luò)領(lǐng)域的首次應(yīng)用。
1.2卷積神經(jīng)網(wǎng)絡(luò)的結(jié)構(gòu)
卷積神經(jīng)網(wǎng)絡(luò)是一個(gè)多層次的前饋式神經(jīng)網(wǎng)絡(luò),每層由多個(gè)二維平面組成,每個(gè)平面由多個(gè)獨(dú)立神經(jīng)元組成。一個(gè)完整的卷積神經(jīng)網(wǎng)絡(luò)的結(jié)構(gòu)如圖1 所示。
從圖1 可以看出,卷積神經(jīng)網(wǎng)絡(luò)一般包含卷積層,分段抽樣層和全連接層。其中卷積層由若干卷積單元組成,每個(gè)卷積單元的參數(shù)都是通過反向傳播算法優(yōu)化得到的。卷積運(yùn)算的目的是提取輸入的不同特征,第一層卷積層可能只能提取一些低級(jí)的特征如邊緣、線條和角等層級(jí),更多層的網(wǎng)絡(luò)能從低級(jí)特征中迭代提取更復(fù)雜的特征。而在圖像識(shí)別中,卷積操作就是用一個(gè)卷積核在圖像矩陣上游走,在對(duì)應(yīng)位置元素相乘,再把相乘的結(jié)果相加,最后相加的結(jié)果形成新的圖像矩陣,游走完成后即完成了對(duì)原始圖像的卷積變換,形成此卷積核下的特征提取,具體如圖2 所示。

圖1 卷積神經(jīng)網(wǎng)絡(luò)結(jié)構(gòu)

圖2 卷積操作
分段抽樣層的作用則是二次特征提取,通常在卷積層之后會(huì)得到維度很大的特征,將需要特征切成幾個(gè)區(qū)域,取該區(qū)域的最大值或者平均值,從而得到新的,維度較小的特征[3]。而分段抽樣操作也叫池化操作,具體如圖3 所示。

圖3 池化操作
全連接層采用的是Softmax回歸,該層就是以卷積神經(jīng)網(wǎng)絡(luò)提取到的圖片特征做為輸入,然后根據(jù)這些特征則可以做一個(gè)數(shù)據(jù)訓(xùn)練分類器。因?yàn)檫壿嫽貧w一般用來進(jìn)行二值分類,也就是說邏輯回歸的結(jié)果只能是0或者1;而印章編號(hào)是0~9的阿拉伯?dāng)?shù)字,一共需要分成10個(gè)類別,所以全連接層必須采用Softmax回歸,Softmax的結(jié)構(gòu)如圖4所示:

圖4 Softmax分類器的結(jié)構(gòu)
1.3卷積神經(jīng)網(wǎng)絡(luò)算法偽代碼
卷積神經(jīng)網(wǎng)絡(luò)算法的偽代碼如下:
(1)對(duì)輸入的印章編號(hào)圖片做卷積操作,形成若干個(gè)卷積核。
(2)對(duì)卷積操作形成的特征層進(jìn)行二次特征提取操作。
(3)重復(fù)步驟(1)和步驟(2),直至獲取到具有足夠畸變?nèi)萑棠芰Φ奶卣鳌?/p>
(4)根據(jù)步驟(3)得到的特征做一個(gè)分類器,從而解決印章編號(hào)的識(shí)別問題。
可以用多個(gè)印章編號(hào)來訓(xùn)練一個(gè)卷積神經(jīng)網(wǎng)絡(luò),而該網(wǎng)絡(luò)可以對(duì)印章編號(hào)中的數(shù)字進(jìn)行分類,從而識(shí)別出印章編號(hào)中的阿拉伯?dāng)?shù)字,訓(xùn)練的過程大致分為以下幾個(gè)步驟:
①?gòu)牧舻子∥闹刑崛〕鼍幪?hào),用這些編號(hào)訓(xùn)練一個(gè)稀疏編碼器C1;
②以C1做為第一個(gè)卷積層,從原始編號(hào)中做卷積特征提取;
③在C1的后面添加一個(gè)分段抽樣層S1,對(duì)C1所提取的特征做池化計(jì)算;
④以最后一個(gè)池化層的輸出做為印章編號(hào)的分類器,即將印章編號(hào)中的數(shù)字按0~9進(jìn)行分類,從而識(shí)別出印章編號(hào)中的數(shù)字。
實(shí)驗(yàn)環(huán)境為MATLAB,實(shí)驗(yàn)的訓(xùn)練數(shù)據(jù)集是來自留底印文中的印章編號(hào),而測(cè)試數(shù)據(jù)集則來自蓋在支票或者文件上的印章編號(hào)。留底印文如圖5 所示。

圖5 留底印文
圖5 中的印文是RGB模式,RGB模式又稱為三原色模型。這是一種加色模式,將紅、綠、藍(lán)三原色的色光以不同的比例相加,以產(chǎn)生多種多樣的顏色。因此可以先將圖片分離為紅、綠、藍(lán)三個(gè)通道,然后通過像素值的分布來設(shè)定一個(gè)閾值,用于分割提取印章編號(hào)。將印章圖片進(jìn)行RGB通道分離后得到像素值的分布如圖6所示:

圖6 印文像素值分布圖
因此可以通過閾值分割的辦法提取出印章的編號(hào)。提取得到的印章編號(hào)如圖7所示。

圖7 留底印文的編號(hào)
將具有m個(gè)訓(xùn)練樣本的訓(xùn)練集合{(x(1),y(1)),…,(x(m),y(m))}(其中,y(i)∈{0,…,9})放入卷積神經(jīng)網(wǎng)絡(luò)中進(jìn)行訓(xùn)練,通過訓(xùn)練可以得到的特征如圖8所示。

圖8 訓(xùn)練印章編號(hào)得到的特征
卷積神經(jīng)網(wǎng)絡(luò)是當(dāng)前最熱門的深度學(xué)習(xí)算法之一,其在圖像識(shí)別和語(yǔ)音識(shí)別已經(jīng)取得了顯著的效果。通過卷積和分段取樣操作,卷積神經(jīng)網(wǎng)絡(luò)具有權(quán)值共享的特性,這就使得卷積神經(jīng)網(wǎng)絡(luò)在處理大型圖像時(shí)有著先天性的優(yōu)勢(shì)。印章編號(hào)的識(shí)別本質(zhì)上是一個(gè)阿拉伯?dāng)?shù)字的分類問題,而卷積神經(jīng)網(wǎng)絡(luò)則擅長(zhǎng)處理圖像分類問題。因此本文嘗試將卷積神經(jīng)網(wǎng)絡(luò)應(yīng)用到印章編號(hào)的識(shí)別中,提出了基于卷積神經(jīng)網(wǎng)絡(luò)的印章編號(hào)識(shí)別算法。在識(shí)別方形章的編號(hào)上取得了很好的效果,但是由于在實(shí)際應(yīng)用中圓形章的編號(hào)呈弧形狀,而不像方形章一樣呈直線狀,這給提取和識(shí)別印章編號(hào)帶來了不便。因此,下一步需要重點(diǎn)解決識(shí)別圓形章和橢圓形章的印章編號(hào)的問題。
[1]Convolutional Neural Networks(LeNet)-DeepLearning 0.1 Documentation[OL].DeepLearning 0.1.LISA Lab.[2013-08-31].http:// deeplearning.net/tutorial/lenet.html
[2]徐珊珊,劉應(yīng)安,徐昇.基于卷積神經(jīng)網(wǎng)絡(luò)的木材缺陷識(shí)別[J].山東大學(xué)學(xué)報(bào)(工學(xué)版),2013,43(2):28-33.
[3]卷積神經(jīng)網(wǎng)絡(luò)[OL].wikipedia.[2012-12-11].https://zh.wikipedia.org/wiki/%E5%8D%B7%E7%A7%AF%E7%A5%9E%E7%BB% 8F%E7%BD%91%E7%BB%9C
Convolution Neural Network;Seal Number;Recognition
Application of Convolution Neural Network in Seal Number Identification
YANG Zhe
(College of Computer Science,Sichuan University,Chengdu 610065)
陽(yáng)哲(1990-),男,湖南邵陽(yáng)人,碩士研究生,研究方向?yàn)闄C(jī)器智能
2015-12-31
2016-01-13
卷積神經(jīng)網(wǎng)絡(luò)算法在圖像識(shí)別中有著廣泛的應(yīng)用,但是目前在印章識(shí)別領(lǐng)域的應(yīng)用還不是很多。因此可以將卷積神經(jīng)網(wǎng)絡(luò)應(yīng)用到印章識(shí)別中,提出一種基于卷積神經(jīng)網(wǎng)絡(luò)的印章編號(hào)識(shí)別算法。
Convolution neural network algorithm has been widely used in image recognition,but currently used in the field of seal of recognition is not a lot.Presents a seal number recognition algorithm based on convolution neural network.