999精品在线视频,手机成人午夜在线视频,久久不卡国产精品无码,中日无码在线观看,成人av手机在线观看,日韩精品亚洲一区中文字幕,亚洲av无码人妻,四虎国产在线观看 ?

基于深度學(xué)習(xí)的文檔圖像形變矯正

2018-10-20 17:43:17申澤軒
數(shù)碼設(shè)計(jì) 2018年12期
關(guān)鍵詞:深度學(xué)習(xí)

申澤軒

摘要:OCR已經(jīng)被廣泛應(yīng)用,其識(shí)別準(zhǔn)確率影響著最終審核效果的好壞,而來(lái)自掃描儀、手機(jī)的文檔圖像多存在卷曲、折疊。本文旨在利用深度學(xué)習(xí)算法對(duì)文檔圖像形變進(jìn)行矯正,從而提高OCR識(shí)別效果。

關(guān)鍵詞:深度學(xué)習(xí);U - net模型;OCR

中圖分類號(hào):G434

文獻(xiàn)標(biāo)識(shí)碼:A

文章編號(hào):1672 - 9129(2018)12 - 0086 - 02

1 應(yīng)用前景

近年來(lái),人工智能在許多任務(wù)中的表現(xiàn)已經(jīng)超過了人類。如果能將AI引入辦公場(chǎng)景,實(shí)現(xiàn)智能辦公,將大大提高辦公效率。要讓機(jī)器代替人去做文本審核,首先需要讓機(jī)器看到人所能看到的( OCR),而后才是理解人所能看到的( NLP)。作為后面一切算法的源頭,OCR算法在其中起著至關(guān)重要的角色。除卻算法本身,圖像質(zhì)量乃是影響OCR識(shí)別準(zhǔn)確率的最大因素。一般從三方面來(lái)衡量圖像的質(zhì)量:傾斜、清晰度、扭曲。本文目的在于如何通過算法使得扭曲的文檔圖像變得平整,從而改善扭曲文檔圖像的OCR識(shí)別準(zhǔn)確率,

1.1 傳統(tǒng)方法。當(dāng)前針對(duì)扭曲文檔圖像的矯正算法主要有以下三類:基于硬件的矯正通常使用特制硬件掃描紙張的三維形狀信息。如采用結(jié)構(gòu)光源來(lái)對(duì)文檔進(jìn)行掃描從而獲取文檔的三維信息,然后根據(jù)深度信息對(duì)文檔圖像進(jìn)行矯正。基于3D模型重建的矯正從造成文檔扭曲的原因出發(fā),包含文檔及其擺放角度、光源方向、圖像獲取設(shè)備特征等因素。對(duì)文檔進(jìn)行3D建模,利用已有的數(shù)學(xué)知識(shí)對(duì)扭曲進(jìn)行矯正。

傳統(tǒng)方法多是針對(duì)特定場(chǎng)景進(jìn)行建模,而一旦跳出當(dāng)前場(chǎng)景,模型就無(wú)法起作用。

1.2 深度學(xué)習(xí)方法。深度學(xué)習(xí)算法用語(yǔ)義分割相關(guān)的模型對(duì)扭曲文檔圖像進(jìn)行建模,將像素級(jí)的分類問題轉(zhuǎn)化為像素級(jí)的回歸問題,實(shí)現(xiàn)扭曲文檔圖像的矯正,模型具有一定的泛化能力,可針對(duì)復(fù)雜場(chǎng)景下的扭曲或折疊圖像進(jìn)行矯正。深度學(xué)習(xí)的優(yōu)勢(shì)在于如若有足夠豐富和質(zhì)量高的訓(xùn)練樣本集,其深層網(wǎng)絡(luò)結(jié)構(gòu)令其具有一定的泛化能力,可針對(duì)多種扭曲實(shí)現(xiàn)矯正,跳出傳統(tǒng)方法的場(chǎng)景限制。

2基于U - net模型的文檔圖像形變矯正

U - net模型是一種用于生物醫(yī)學(xué)圖像分割的卷積網(wǎng)絡(luò),其網(wǎng)絡(luò)架構(gòu)形如字母“U”,因此被稱為U - net,可以將此類神經(jīng)網(wǎng)絡(luò)理解為一個(gè)En-coder - Decoder結(jié)構(gòu),其中Encoder是收縮路徑,主要是由卷積層和池化層組成,主要目的在于實(shí)現(xiàn)特征的提取或者說(shuō)捕捉語(yǔ)義,而Decoder是擴(kuò)展路徑,主要通過轉(zhuǎn)置卷積和跳躍連接實(shí)現(xiàn),其主要目的是為了實(shí)現(xiàn)上采樣,由于Pooling操作進(jìn)行了下采樣導(dǎo)致圖像維度減小,而轉(zhuǎn)置卷積可以讓±fature map的維度變大,從而恢復(fù)到原圖的大小,從而實(shí)現(xiàn)像素級(jí)回歸。但是這樣得到的結(jié)果是很粗糙的,所以一般還通過跳躍連接將淺層的特征concat到upsampling之后的feature map中以實(shí)現(xiàn)精準(zhǔn)定位。

為了實(shí)現(xiàn)對(duì)模型的優(yōu)化,還可以考慮以下方案,改變模型的結(jié)構(gòu):從U- net變成Stacked U - net,以提高分辨率。修改損失函數(shù):使得模型在優(yōu)化過程中讓原本相鄰的像素點(diǎn)之間的距離與預(yù)測(cè)結(jié)果差別不要太大,以改善文字扭曲變形的現(xiàn)象。對(duì)預(yù)測(cè)結(jié)果進(jìn)行后處理,以改善噪點(diǎn)現(xiàn)象。

3 模型評(píng)價(jià)

本文旨在對(duì)扭曲圖像進(jìn)行矯正,基于圖像分割領(lǐng)域的U - net模型,將扭曲文檔圖像矯正問題轉(zhuǎn)化為像素級(jí)別的回歸問題,針對(duì)模型結(jié)果中出現(xiàn)的文檔扭曲錯(cuò)行以及預(yù)測(cè)結(jié)果分辨率不足等問題,提出了進(jìn)一步優(yōu)化的需求,目前雖然能夠在簡(jiǎn)單場(chǎng)景下得到不錯(cuò)的效果,但仍存在不足,具體可描述為以下幾點(diǎn):

數(shù)據(jù)集:目前的數(shù)據(jù)集是參考圖形學(xué)的相關(guān)知識(shí)自行構(gòu)造而成,導(dǎo)致神經(jīng)網(wǎng)絡(luò)能學(xué)到的知識(shí)有限,一旦遇到場(chǎng)景中的復(fù)雜問題,神經(jīng)網(wǎng)絡(luò)的性能將受到限制。神經(jīng)網(wǎng)絡(luò)結(jié)構(gòu):目前的神經(jīng)網(wǎng)絡(luò)結(jié)構(gòu)Dilated U - net相對(duì)于Stackfed U - net,雖然更輕型且訓(xùn)練速度更快,但最終若要實(shí)現(xiàn)網(wǎng)絡(luò)模型在移動(dòng)端的部署,其響應(yīng)速度仍然存在優(yōu)化之處。

4 未來(lái)展望

本文只是深度學(xué)習(xí)在計(jì)算機(jī)視覺領(lǐng)域的一個(gè)簡(jiǎn)單應(yīng)用,其在計(jì)算機(jī)視覺、自然語(yǔ)言處理、數(shù)據(jù)挖掘、游戲、復(fù)合應(yīng)用等領(lǐng)域還有著更為廣泛的應(yīng)用。OCR技術(shù)的廣泛應(yīng)用彌補(bǔ)了人工掃描的繁瑣,更加便捷、快速、準(zhǔn)確。未來(lái)對(duì)計(jì)算機(jī)視覺相關(guān)算法的優(yōu)化勢(shì)不可擋,必定要學(xué)會(huì)優(yōu)化算法解決自己專業(yè)領(lǐng)域的特殊問題。

參考文獻(xiàn):

[1] Ma K, Shu Z,Bai X, et al.DocUNet: Document Image Unwarpingvia A StackedU - Net[C]//Proceedings of the IEEE Conference on ComputerVision and PatternRecognition. 2018: 4700 -4709.

[2] Ronneberger0, Fischer P,BroxT.U- net: Convolutional networksforbiomedical imagesegmentation[ C]//International Conference on Medicalimage computing andcomputer - assisted intervention. Springer, Cham, 2015:234 - 241.

[3] Yu F.KoltunV. Multi - scale context aggregation by dilated convo-lutions[J].arXiv preprintarXiv:1511. 07122, 2015.

猜你喜歡
深度學(xué)習(xí)
從合坐走向合學(xué):淺議新學(xué)習(xí)模式的構(gòu)建
面向大數(shù)據(jù)遠(yuǎn)程開放實(shí)驗(yàn)平臺(tái)構(gòu)建研究
基于自動(dòng)智能分類器的圖書館亂架圖書檢測(cè)
搭建深度學(xué)習(xí)的三級(jí)階梯
有體驗(yàn)的學(xué)習(xí)才是有意義的學(xué)習(xí)
電子商務(wù)中基于深度學(xué)習(xí)的虛假交易識(shí)別研究
利用網(wǎng)絡(luò)技術(shù)促進(jìn)學(xué)生深度學(xué)習(xí)的幾大策略
考試周刊(2016年94期)2016-12-12 12:15:04
MOOC與翻轉(zhuǎn)課堂融合的深度學(xué)習(xí)場(chǎng)域建構(gòu)
大數(shù)據(jù)技術(shù)在反恐怖主義中的應(yīng)用展望
深度學(xué)習(xí)算法應(yīng)用于巖石圖像處理的可行性研究
主站蜘蛛池模板: 亚洲欧美综合在线观看| 亚洲AV无码精品无码久久蜜桃| 国产高潮流白浆视频| 国产成人精品免费av| 国产精品嫩草影院av| 色婷婷在线影院| 国产欧美高清| 亚洲男人在线| 91在线播放国产| 伊人无码视屏| 欧美一区二区三区香蕉视| 久久久久亚洲AV成人网站软件| 91福利国产成人精品导航| JIZZ亚洲国产| 国产又粗又猛又爽| 亚洲a级在线观看| 高潮毛片无遮挡高清视频播放| 亚洲a级在线观看| 夜夜拍夜夜爽| 99在线免费播放| 麻豆国产精品一二三在线观看| 亚洲成a∧人片在线观看无码| 久久亚洲中文字幕精品一区| 日本色综合网| 免费一级毛片在线观看| 妇女自拍偷自拍亚洲精品| 精品丝袜美腿国产一区| 亚洲第一黄片大全| 亚洲天堂精品在线观看| 91综合色区亚洲熟妇p| 国产精品浪潮Av| 亚洲精品综合一二三区在线| 怡春院欧美一区二区三区免费| 欧美国产日产一区二区| 欧美国产综合视频| 再看日本中文字幕在线观看| 91精品人妻一区二区| 欧美在线黄| 亚洲精品无码人妻无码| 亚洲一区毛片| 四虎在线观看视频高清无码| 广东一级毛片| 国产精品网址你懂的| 国产成人免费视频精品一区二区| 91精品国产91久久久久久三级| 欧美一级高清免费a| 精品成人一区二区三区电影| 国产乱论视频| WWW丫丫国产成人精品| 国产一级二级三级毛片| 日韩在线视频网站| 男人天堂伊人网| 精品视频在线观看你懂的一区| 国产网站一区二区三区| 亚洲精品动漫| 国产69囗曝护士吞精在线视频| 亚洲欧洲日韩久久狠狠爱| 亚洲人成人无码www| 欧美一级在线| 久久精品国产精品国产一区| 亚洲国产综合自在线另类| 最新无码专区超级碰碰碰| 五月婷婷综合色| 97狠狠操| 久久国产乱子| 爽爽影院十八禁在线观看| 中文毛片无遮挡播放免费| 久久一本精品久久久ー99| 国产成人综合久久精品下载| 18禁色诱爆乳网站| 片在线无码观看| 91青青在线视频| 99久久99视频| 一区二区三区四区日韩| 久久精品aⅴ无码中文字幕| 国产精品网址你懂的| 日韩不卡高清视频| 五月丁香在线视频| 久久久久中文字幕精品视频| 亚洲AⅤ波多系列中文字幕| 亚洲人网站| 波多野结衣二区|