999精品在线视频,手机成人午夜在线视频,久久不卡国产精品无码,中日无码在线观看,成人av手机在线观看,日韩精品亚洲一区中文字幕,亚洲av无码人妻,四虎国产在线观看 ?

基于改進Inception卷積神經網絡的手寫體數字識別

2019-12-12 07:06:44余圣新夏成蹊唐澤恬
計算機應用與軟件 2019年12期
關鍵詞:深度特征結構

余圣新 夏成蹊 唐澤恬 丁 召 楊 晨

(貴州大學大數據與信息工程學院貴州省微納電子與軟件技術重點實驗室 貴州 貴陽 550025)

0 引 言

手寫體數字識別廣泛地應用在銀行、快遞等領域。例如銀行人工服務支取大量現金時需要填寫的單據上的金額、日期等手寫數字信息。其他常見的應用場景還包括填寫快遞單時的手機號碼、郵政編碼等,因此研究手寫體數字識別具有較高的現實意義與經濟價值。

傳統手寫體數字識別與分類的方法是通過人為構建特征描述子來提取圖像特征,再利用分類器對所得特征進行分類,如通過梯度方向直方圖特征(Histogram of Oriented Gradient,HOG)[1]和局部二值模式(Local Binary Pattern,LBP)[2],但是該方法需要大量人工操作。隨著硬件設備計算能力快速提升,深度學習也成為圖像分類的一個重要方式。1998年,文獻[3]結合卷積與池化,提出LeNet-5,用于識別手寫體數字,識別率達到99.13%,高于傳統方法的98.67%。2012年,文獻[4]提出AlexNet,使用Relu作為激活函數,并且大量使用卷積層與池化層,使得網絡能夠獲得更加豐富的特征,在ImageNet(ILSVRC-2012)競賽中,top-5測試誤差為15.3%。2014年,文獻[5]提出GoogLeNet,其提出的Inception V1結構,采用不同大小卷積核提取不同的特征,在ImageNet(ILSVRC-2014)競賽中,top-5測試誤差只有6.66%。GoogLeNet為卷積神經網絡的研究與發展提供了新方向,即增加網絡寬度以獲得更好的正確率。但寬度增加也會引起參數增加,同時增加計算負擔。為減少參數,提出Inception V2[6]和Inception V3[7],Inception V2采用三個3×3代替7×7卷積,Inception V3則采用連續非對稱卷積1×7與7×1代替7×7卷積。2015年,文獻[8]提出殘差網絡(ResNet),隨網絡層數增加而出現的梯度彌散問題由此得以解決。2016年,文獻[9]結合ResNet,改進Inception提出Inception-ResNet。2017年,為更好地增加網絡寬度,深度可分離卷積(Xception)被提出[10],將通道間的相關性完全分離。

盡管卷積神經網絡越做越深,但是對于手寫數字這類小分辨率圖像的識別,大而深的網絡會由于參數量過大而占用過多計算資源,因此需要一款深度合適而識別率較高的網絡。本文采用深度可分離卷積代替Inception結構中的傳統卷積,改進Inception結構,增加Inception結構的網絡寬度,并且結合殘差網絡(ResNet)防止梯度彌散。在分類器的選擇上則選用支持向量機作為分類器[11],基于其對數據的維度、多變性不敏感等特性[12],結合支持向量機(SVM)對卷積神經網絡提取的特征進行分類[13],使用10折交叉驗證法驗證SVM所得識別率。

1 網絡結構和改進算法

本文采用訓練網絡整體結構如圖1所示。對輸入圖像進行兩次連續非對稱卷積代替7×7卷積核,完成圖像特征的初步提取;改進Inception結構用于加大網絡寬度,并通過Maxpool對特征進行壓縮,同時引入殘差網絡防止梯度彌散;之后使用傳統卷積層與池化層相結合的方式,縮小特征圖,中間加入Dropout層,其作用為以一定概率隨機將部分隱藏層節點權重歸零,從而防止網絡過擬合;最后分別使用softmax與支持向量機對特征進行分類與比較。每一層卷積后都使用Relu函數y=max(0,y) 作為激活函數,使用交叉熵函數作為損失函數訓練網絡,同時使用批量標準化來減少網絡對學習率的要求,加快網絡收斂,緩解過擬合。

圖1 整體網絡結構

網絡各層輸出如表1所示。

表1 各層輸出特征圖大小

算法流程如圖2所示。

(a) 訓練流程圖

(b) 識別流程圖圖2 算法流程

圖2(a)中訓練過程分為本文網絡訓練與支持向量機訓練兩個部分。第一部分為MNIST數據集通過本文網絡、全連接層與softmax,更新本文網絡的權重;第二部分為MNIST數據集通過已訓練的本文網絡,將本文網絡所提取的特征圖向量化后所得特征訓練支持向量機。訓練完畢后,以圖2(b)中所示順序完成識別。

1.1 連續非對稱卷積

圖1中連續非對稱卷積×2結構如圖3所示,其中Conv代表卷積(convolution),Convn表示使用n個卷積核。首先使用一組連續非對稱卷積實3×3卷積,得到26×26×32輸出特征圖。第二組同樣使用一組連續非對稱卷積實現3×3卷積,得到24×24×64的輸出特征圖,這與直接使用5×5卷積所得特征圖大小相同。

圖3 兩組非對稱卷積實現5×5卷積

1.2 改進Inception結構

本文使用深度可分離卷積代替Inception結構中的傳統卷積以增加網絡寬度,同時提升網絡性能。深度可分離卷積[10]是針對加大網絡寬度提出的一種卷積形式,該卷積可以分解成一個深度卷積和一個1×1點卷積,深度卷積用于拓寬網絡,點卷積用于調整輸出通道數。

傳統卷積可以表示為:

(1)

式中:F表示輸入特征圖,大小為k+i-1×i+j-1×m;G表示輸出特征圖,輸出特征圖的大小為k×l×n;K表示卷積核,大小為i×j×m,卷積核個數為n。可見,為得到k×l×n大小的輸出特征圖,傳統卷積所需參數量為i×j×m×n。

深度可分離卷積可以表示為:

(2)

(3)

圖4 深度可分離卷積結構

因此,對于同樣大小輸出特征圖,深度可分離卷積所需參數量相比傳統卷積所需參數量減少了大約n倍。

由于深度可分離卷積能夠完全分離通道間的相關性,為進一步加寬網絡,將深度可分離卷積引入到Inception里面。Inception結構與深度可分離卷積結構都能加大網絡寬度,兩者并聯之后網絡寬度能得到進一步增加。例如,輸入特征圖通道數為64,Inception間有3個分支,每個分支都使用不同卷積核進行可分離卷積,這樣網絡寬度就能從64增加到3×64。由于增加網絡寬度會造成參數增加,因此引入點卷積,點卷積就是1×1卷積,它能很容易地整合卷積神經網絡的通道,因此1×1卷積主要用來降低特征維度以避免因網絡受硬件條件而限制網絡模型。本文設計結構如圖5所示。

圖5 改進后Inception結構

對該部分的輸入分別接兩個1×1卷積,卷積核個數均為32,得到兩個分支,并通過整合輸入特征圖的通道數來降低參數。接下來分別對兩個分支進行3×3與5×5深度可分離卷積,之后對兩分支的輸出沿通道數方向進行堆疊。

使用Python語言,tensorflow、slim庫完成Inception結構改進,改進Inception結構代碼如下:

def improved_inception_model(inputs,kernel,o_channels,depth):

?inputs為改進inception結構的輸入,kernel為每個分支中1×1卷積核的個數,o_channel每個分支中深度可分離卷積的輸出通道數,depth為每個分支中深度可分離卷積的卷積核個數,函數返回三個分支輸出的堆疊。其中stride均設為1,padding均設為′SAME′,即輸入與輸出同維度,以便堆疊。?

batch0=silm.conv2d(inputs, kernel, [1, 1],

stride=1, padding=′SAME′)

batch0=slim.separeble_conv2d(batch0,

o_channels, [3, 3],

depth_multiplier=depth,

padding=′SAME′)

#對第一個分支進行1×1卷積后再進行3×3

#深度可分離卷積。

batch1=silm.conv2d(inputs, kernel, [1, 1],

stride=1, padding=′SAME′)

batch1=slim.separeble_conv2d(batch1,

o_channels, [5, 5],

depth_multiplier=depth,

padding=′SAME′)

#對第二個分支進行1×1卷積后再進行5×5

#深度可分離卷積。

batch2=slim.max_pool2d(inputs, [3, 3],

stride=1, padding=′SAME′)

#對第三個分支進行最大值池化

output = tf.concat([batch0, batch1, batch2], 3)

#將三個分支的輸出在通道數上進行堆疊

return output

由表2可知,改進后結構在保留Inception結構對尺度適應性的同時減少參數量。

表2 參數量對比

1.3 殘差網絡結構

為防止網絡深度增加導致梯度爆炸或者梯度彌散,造成梯度不能很好地往后傳播,一般會在網絡中引入殘差網絡,本文使用殘差網絡結構如圖6所示。

圖6 殘差網絡

為保證Maxpool層的輸出與3×1卷積層的輸出維度相一致以實現線性相加,本文利用點卷積與連續非對稱卷積對上一層輸出特征圖進行大小調整,見圖6虛線框。所得輸出結合卷積層與池化,對殘差網絡輸出特征圖進行縮小。

1.4 支持向量機

本文用支持向量機替代softmax作為最后的分類器。支持向量機是1963年Vapnik[15]提出的一種以統計學理論為基礎的學習算法,利用核函數將低維向量映射到高維空間,并有效控制計算復雜度。通常使用高斯函數作為徑向基函數:

(4)

式中:xc為核函數中心;σ為核函數寬度參數,控制函數的徑向作用范圍。

訓練完本文設計的網絡后,將全連接層與softmax層以支持向量機替代,在MNIST中隨機選擇10 000幅圖片作為訓練集,進行10折交叉驗證,使用高斯核函數作為徑向基函數。

2 實驗結果與分析

為驗證算法可行性,本文以來自美國國家標準與技術研究所MNIST手寫體數字數據集作為實驗數據。訓練集包含60 000個樣本,分別由250個來自不同地區的人手寫的數字構成。測試集同樣包含10 000個手寫數字樣本。其中訓練集和測試集均為50%高中學生和50% 人口普查局的工作人員組成。圖像均為28×28像素,本文所有實驗均在配置為Intel Core i5-3470 CPU,主頻3.20 GHz,16 GB的RAM上運行,使用3 GB顯存的NVIDIA GTX1060做GPU加速。

實驗分成兩步:第一步先用softmax作為分類器,以交叉熵函數作為誤差函數訓練該網絡,選擇合適dropout概率防止網絡過擬合;第二步固定所有網絡層權重,使用支持向量機(SVM)替代softmax,訓練SVM。

2.1 網絡參數的選取

為防止過擬合,在模型訓練時,本文在圖1所示結構中采用Dropout層,保留概率與Dropout概率關系如下:

P=1-PD

(5)

式中:P為保留概率;PD為Dropout概率。

保留率設置為1.0、0.5、0.2、0.1,訓練及測試loss曲線,所得結果如圖7、表3所示。

(c) P=0.2 (d) P=0.1圖7 保留概率(P)對網絡的影響

表3 不同保留概率的識別率

可以看出,當不使用Dropout層時(保留概率為1.0),loss下降至0.3后網絡已經收斂,測試誤差與訓練誤差之間相距較遠,即兩者方差較大,且測試誤差在訓練至2 200步后一直大于訓練誤差,說明網絡已過擬合,識別率為89.95%;當保留概率為0.5時,loss下降明顯,測試誤差與訓練誤差之間相距較近,即兩者方差較小,識別率為99.38%;當保留概率為0.2時,loss下降明顯,同時測試誤差始終高于訓練誤差,且在5 700步后基本重合,即方差最小,識別率為99.45%;當保留概率為0.1時,loss值大且下降較慢,說明此時網絡欠擬合,識別率為78.34%。因此保留概率為0.2時,網絡性能最優。

2.2 不同網絡的比較

為便于比較,實驗時分類器統一使用softmax作為分類器。經softmax分類后,正確率相對于LeNet-5提高了0.20%,相對于Inception結構提高了0.08%,實驗結果如表4所示。

表4 不同網絡結構實驗結果

與Inception結構相比,本文改進結構較Inception具有更大的網絡寬度,由圖8可以看出,改進Inception收斂速度較快。

(a) accuracy曲線對比圖

(b) loss曲線對比圖圖8 accuracy與loss曲線對比圖

2.3 SVM參數的選取

為進一步提高識別率,選擇SVM代替softmax,為選擇合適的參數,從MNIST中隨機取10 000個數據,對SVM的不同核寬與懲罰系數進行10折交叉驗證,每次實驗所得平均識別率如表5所示。

表5 核寬與懲罰系數對交叉驗證平均正確率的影響

在表5所選參數條件下,10折交叉驗證所得平均識別率均分布在99.58%~99.78%區間,均高于表4中softmax正確率。其中:C=0.5,σ=0.005時,平均識別率為99.78%;C=0.5,σ=0.007時,平均識別率為99.74%;C=0.1,σ=0.003時,平均識別率為99.67%。其10折交叉驗證正確率曲線如圖9所示。可見當懲罰系數C=0.5,σ=0.005時,10折交叉驗證的每一次結果均高于其余兩個,即為最優懲罰系數與核寬。

圖9 10折交叉驗證正確率

綜上,本文網絡結構在采用softmax分類器已經獲得較高正確率,使用SVM分類器代替softmax分類器,可以將正確率從99.45%進一步提高到99.78%

3 結 語

本文采用改進Inception網絡模型提取手寫體數字的特征,并將其傳遞給SVM分類器進行識別。連續非對稱卷積可以實現傳統卷積功能同時節省計算開支,而改進Inception結構相比Inception結構擁有更大的網絡寬度。實驗結果表明,改進Inception結構相比Inception結構獲得了更高的識別率。使用本文設計網絡提取的特征作為特征向量訓練SVM,識別率相比使用全連接層后經softmax分類所得識別率有明顯地提升,說明SVM對于數據分類能力優于softmax分類器。在財務、稅務、金融及實驗記錄等領域,存在大量的手寫體數字文檔。本文模型有望在上述領域的自動化識別中得到應用,以節省時間提升工作效率。

猜你喜歡
深度特征結構
《形而上學》△卷的結構和位置
哲學評論(2021年2期)2021-08-22 01:53:34
深度理解一元一次方程
如何表達“特征”
論結構
中華詩詞(2019年7期)2019-11-25 01:43:04
不忠誠的四個特征
當代陜西(2019年10期)2019-06-03 10:12:04
深度觀察
深度觀察
深度觀察
抓住特征巧觀察
論《日出》的結構
主站蜘蛛池模板: 一级香蕉人体视频| 亚洲精品波多野结衣| 色哟哟国产成人精品| 精品三级网站| 久久精品国产免费观看频道| 欧美午夜网| 亚洲一区波多野结衣二区三区| 日韩 欧美 小说 综合网 另类| 国产在线视频自拍| 免费一级无码在线网站| 亚洲av无码专区久久蜜芽| 国产小视频免费| 国产香蕉97碰碰视频VA碰碰看| 狠狠干综合| 天天干天天色综合网| 青青草国产一区二区三区| 国产精品13页| 丝袜美女被出水视频一区| 色婷婷亚洲综合五月| 在线观看国产黄色| 在线观看免费人成视频色快速| 国产毛片一区| 亚洲视频免| 国产办公室秘书无码精品| 视频一区视频二区中文精品| 亚洲国产精品一区二区第一页免 | 天天综合色天天综合网| 91探花在线观看国产最新| 在线看片免费人成视久网下载| 国产青榴视频| 亚洲侵犯无码网址在线观看| 就去吻亚洲精品国产欧美| 国产人成午夜免费看| 成人一级黄色毛片| 五月婷婷导航| 免费人成黄页在线观看国产| 熟妇丰满人妻av无码区| 九九热免费在线视频| 精品人妻一区二区三区蜜桃AⅤ| 91年精品国产福利线观看久久 | 国产精品午夜福利麻豆| 精品一區二區久久久久久久網站| 国模视频一区二区| 国产精品香蕉在线| 88av在线| 四虎在线观看视频高清无码| 欧美日韩v| 亚洲国产精品久久久久秋霞影院| 日韩欧美国产精品| 亚洲男人的天堂在线观看| av天堂最新版在线| 91www在线观看| 在线观看欧美国产| 国产福利免费在线观看| 国产视频你懂得| 国产免费羞羞视频| 老熟妇喷水一区二区三区| 国产特一级毛片| 欧美激情视频二区| 无码中文字幕乱码免费2| 久久香蕉国产线| 九色最新网址| 亚洲男人天堂2020| 亚洲男人的天堂久久香蕉| 在线观看无码a∨| 欧美成人h精品网站| 无码专区国产精品第一页| 高清精品美女在线播放| 国产尤物在线播放| 色综合婷婷| 激情五月婷婷综合网| 亚洲欧美一级一级a| 免费a级毛片18以上观看精品| 亚洲va精品中文字幕| 在线观看热码亚洲av每日更新| 欧美激情伊人| 日韩欧美成人高清在线观看| 精品一區二區久久久久久久網站| 国产成人综合亚洲欧洲色就色| 精品国产美女福到在线直播| 日韩 欧美 国产 精品 综合| 欧美日韩国产在线人成app|