999精品在线视频,手机成人午夜在线视频,久久不卡国产精品无码,中日无码在线观看,成人av手机在线观看,日韩精品亚洲一区中文字幕,亚洲av无码人妻,四虎国产在线观看 ?

深度學習在文字識別領域的應用

2018-05-10 05:10:32李新煒殷韶坤
電子技術與軟件工程 2018年24期
關鍵詞:深度效果方法

李新煒 殷韶坤

摘要

在本論文中使用了深度學習的DenseNet網絡及CTC進行了深度學習,用來實現漢字印刷體OCR的功能,同時與傳統OCR開源軟件Tesseract進行了性能對比,證明了深度學習的效果好,速度快的優勢,但又暴露了深度學習需要的較多數據進行訓練的缺點。

【關鍵詞】深度學習 DenseNet TensorflowTesseract

1引言

本文會通過在印刷體文字OCR領域對兩種技術進行一些對比,驗證、討論深度學習對比傳統機器學習有什么優點,深度學習未來是否會完全取代其他的人工智能算法。

2算法介紹

2.1機器學習與深度學習

機器學習是經由各種算法用大量的數據來“訓練”讓機器實現人工智能的一種方式。利用算法來解析現實中的數據做出預測和做出判斷后再從中學習并不斷完善的過程。這與傳統的使用固定編碼來解決特定任務的軟件程序是不同的。

深度學習是機器學習的其中一種技術,其訓練深度神經網絡也會用到有、無監督的方法。但由于近年來該領域發展迅猛,一些獨有的學習手段相繼被提出,因此越來越多的人將其單獨看作一種學習的方法。

2.2 DenseNet

DenseNet是一種具有密集連接的CNN。DenseNet有以下長處:首先如要在ImageNer分類數據集上達到類似的準確率,DenseNer網絡結構比ResNet節省了一半的參數量。其次只需要ResNet算法計算量的50%左右,DenseNet算法就可以達到與ResNet相當的精度。最后該算法有較強的抗過擬合能力,密集連接具備正則化效果,極大的降低了對訓練集數量較少的任務的過擬合量。

2.3 Tesseract與Tensorflow

Tesseract是一個開源光學字符識別引擎,它是基于Apache許可證的自由軟件,支持多種的操作系統。由于其Tesseract4.0版本應用了基于深度學習的算法,因此在這里使用的是之前的版本用來做對比試驗。Tensorflow屬于第二代人工智能學習系統,由谷歌公司研發。它可用于語音識別或圖像識別等多項機器學習和深度學習領域,在本文中主要通過使用Tensorflow來進行深度學習訓練用來對比識別效果。

3算法實現

3.1數據集的準備

首先選擇基于TensorFlow通過DenseNet和CTC進行文字識別的訓練,其中數據利用了中文語料庫,使用模糊、拉伸、灰度、字體等轉變方式隨機生成了大量圖片。圖片分辨率統一為280x32,共約364萬張圖片,按照99:1劃分成訓練集和驗證集,每個樣本固定10個字符,字符隨機截取自語料庫中的句子。

3.2基于TensorFlow對算法的實現

3.2.1通過CTPN進行文本檢測

用卷積神經網絡VGG16取前五層得到一個多層矩形陣列的特征圖,在這個特征圖的每層里都取一個3*3的窗口特征量,并且讓這個窗口特征量滑動。向一個雙向的LSTM神經網絡輸入得到的特征量,得到一個結果為寬度x256長度的輸出,然后配合長度為512的全連接層開始輸出。然后能得到一個密集預測的文本結果,并用一個標準的非極大值抑制算法來處理該結果。最后將大量的文本段利用基于圖的文本行構造算法組合成文本行。

3.2.2通過DenseNet和CTC進行文字識別

DenseNet網絡選用Relu作為激活函數,使用了3個Dense Block層進行演算,各個Dense Block之間通過Transition結構連接在一起組成的DenseNet網絡,配合CTC loss進行訓練并得出最終的數據模型。該算法的數據經由DenseBlock層處理后,進行卷積操作然后傳送給Transition結構進行參數整合規范,通過池化減少參數后傳送給下層的Dense Block結構,從而達到較高的精度。

4與傳統的OCR軟件Tesseract效果進行對比

4.1使用兩種方法對數據集識別效果對比

隨機抽取1000張測試集圖片,分別進行識別測試。測試結果如表1所示。

4.2準確率接近情況下的資源消耗對比

對Tesseract訓練識別天貓工商執照圖片,使用498張原圖,通過人工標注后進行訓練的方式,訓練后準確率達到96.8%,此時使用深度學習方式識別此類圖片準確率下降至97.1%,準確率相近。

5結論

顯然通過深度學習訓練后的模型識別效果要遠好于Tesseract的效果,但是并不能說明“深度學習最終會淘汰其他傳統機器學習算法”。目前深度學習在計算機視覺和自然語言處理領域的應用已經遠超過傳統機器學習的方法。雖然深度學習方法在機器學習領域非常熱門,但通過本文的比較測試可以發現深度學習目前還存在兩個問題。首先,深度學習需要大量的數據進行訓練,才能表現出它的優勢,面對小樣本的問題,深度學習方法的效果就會差強人意,而傳統的機器學習方法就可以處理;其次,在個別領域只需要采用傳統的機器學習方法,便可以較好的解決問題,無需使用復雜的深度學習方法。

參考文獻

[1] Graves A, Gomez F. Connectionisttemporal classification: labellingunsegmented sequence data withrecurrent neural networks[C].International Conference on MachineLearning.ACM,2006.

[2]降小龍,基于語義結構和視覺焦點的場景目標識別[D].中北大學,2016.

[3]吳杰.基于卷積神經網絡的行為識別研究[D].電子科技大學,2015.

猜你喜歡
深度效果方法
按摩效果確有理論依據
深度理解一元一次方程
迅速制造慢門虛化效果
深度觀察
深度觀察
深度觀察
抓住“瞬間性”效果
中華詩詞(2018年11期)2018-03-26 06:41:34
模擬百種唇妝效果
Coco薇(2016年8期)2016-10-09 02:11:50
用對方法才能瘦
Coco薇(2016年2期)2016-03-22 02:42:52
四大方法 教你不再“坐以待病”!
Coco薇(2015年1期)2015-08-13 02:47:34
主站蜘蛛池模板: 亚洲视频四区| 91无码人妻精品一区| 青青热久麻豆精品视频在线观看| 99久久精品无码专区免费| 日本一本在线视频| 91探花国产综合在线精品| 国产成人a在线观看视频| 国产亚洲精品自在久久不卡| 精品久久高清| 99尹人香蕉国产免费天天拍| 精品剧情v国产在线观看| 国产日韩欧美黄色片免费观看| 4虎影视国产在线观看精品| 日韩大片免费观看视频播放| 色综合天天视频在线观看| 婷婷五月在线| 最新国产网站| 精品国产美女福到在线不卡f| 国产精品欧美激情| 国产特级毛片aaaaaa| 在线观看网站国产| 97在线观看视频免费| 波多野结衣第一页| 午夜毛片免费观看视频 | 欧洲成人在线观看| 国产亚卅精品无码| 久久久久人妻一区精品色奶水| 国产屁屁影院| 1024你懂的国产精品| 国产一区二区三区夜色| 午夜国产不卡在线观看视频| 亚洲免费播放| 国产熟睡乱子伦视频网站| 波多野结衣在线一区二区| 青青青视频免费一区二区| 欧美精品另类| 亚洲精品成人片在线观看 | 亚洲美女操| 欧美性猛交一区二区三区| 欧美三级自拍| 亚洲欧美天堂网| 美女被狂躁www在线观看| 国产激爽爽爽大片在线观看| 久久五月天综合| 色综合手机在线| 热久久综合这里只有精品电影| 亚洲av片在线免费观看| 欧美伊人色综合久久天天| 亚洲精品欧美日本中文字幕| 激情综合激情| 国产麻豆另类AV| 久久这里只精品国产99热8| 国产精品网址在线观看你懂的| 国产另类乱子伦精品免费女| 国产你懂得| 亚洲欧美成人影院| 亚洲不卡网| 久久人人爽人人爽人人片aV东京热 | 国产剧情国内精品原创| 婷婷六月天激情| 国产9191精品免费观看| 欧美日韩成人| 无码中文字幕加勒比高清| 蜜臀AV在线播放| 久久a毛片| 欧美成人看片一区二区三区| 成人久久精品一区二区三区| 新SSS无码手机在线观看| 久久精品人妻中文系列| 欧美午夜视频在线| 国产sm重味一区二区三区| 高潮爽到爆的喷水女主播视频 | 亚洲人精品亚洲人成在线| 亚洲人在线| 激情六月丁香婷婷| 天堂在线亚洲| 国产成人无码Av在线播放无广告| 特级精品毛片免费观看| 中文字幕人妻无码系列第三区| 国产成人精品一区二区三区| 99视频只有精品| 88av在线看|