999精品在线视频,手机成人午夜在线视频,久久不卡国产精品无码,中日无码在线观看,成人av手机在线观看,日韩精品亚洲一区中文字幕,亚洲av无码人妻,四虎国产在线观看 ?

基于R2CNN的自然場景圖像中文本檢測方法

2019-05-24 14:21:16沈偉生
無線互聯科技 2019年2期

沈偉生

摘 要:在互聯網世界中,圖片是傳遞信息的重要媒介。特別是電子商務、社交、搜索等領域,每天都有數以億兆級別的圖像在傳播。自然場景就是我們所處的生活環境,自然場景圖像中存在著大量的文本信息,例如路標信息、商店門店信息、商品包裝信息等。隨著深度學習的發展,基于深度學習的文本檢測技術也逐漸流行起來。文章主要提出的是基于R2CNN的文本檢測算法。在R2CNN算法的基礎上對算法的結構進行改進,最終算法在ICDAR2015數據集上的召回率為87.2%,精確率為81.43%。

關鍵詞:自然場景圖像;文本檢測;R2CNN算法

隨著互聯網技術以及便捷式移動設備的高速發展,圖像在許許多多場景中取得廣泛的應用,如通過手機拍攝的照片在微信上發布來分享自己的生活和工作等,圖像中的文本信息更能直觀地呈現出圖像所表達的內容[1]。自然場景就是我們所處的生活環境,自然場景圖像中的文本多為路標信息、商店門店信息、商品包裝信息等,如圖1所示。這些文本信息也發揮著很重要的應用,目前主要應用于圖像內容識別與檢索、無人駕駛、視覺輔助系統等。因此,自然場景中的文本檢測與識別扮演著越來越重要的角色。

隨著深度學習的快速發展,自然場景下的文本檢測逐漸得到了國際的重視。國際文檔分析與識別會議(International Conference on Document Analysis and Recognition,ICDAR)每兩年都會舉行一次,會上科研人員分享最新的研究成果。雖然傳統的文檔文本檢測與光學字符識別技術已經趨向于成熟,但是自然場景下的文本檢測仍然是一項極具挑戰性的任務,具有的挑戰有:圖像背景的復雜性、場景文本的多樣性、圖像分辨率的不確定性[2]。

1 研究現狀

自然場景下的文本檢測是文本識別的核心前端模塊,檢測結果的好壞直接影響后端的識別效果。目前主流的文本檢測算法都是基于深度學習技術的,主要是對通用的目標檢測框架的針對性改進,使得新改進算法滿足新的需求。

深度學習強大的特征提取能力,使其在目標檢測領域取得出色的檢測效果。基于深度學習的文本檢測算法主要可以分為兩類,一類是基于候選區域的檢測方法,一類是基于回歸的檢測方法[3]。

基于候選區域的檢測方法主要代表有:(1)Faster RCNN[4]使用區域候選網絡(Region Proposal Network,RPN)進行候選框的篩選,再使用了感興趣區域池化(Region of Interest pooling,ROIpooling)將RPN篩選到的候選框進行一個統一尺度(7×7)的池化,控制輸入全連接層的維度。(2)R2CNN[5]算法是對Faster RCNN算法的改進,RPN篩選得到的候選框進行ROIpooling的時候,不再是一種尺度(7×7),而是多增加了兩種尺度(3×11,11×3),另外增加了一個傾斜框的回歸。

基于回歸的檢測方法的主要代表有:(1)SSD[6]加入了特征金字塔(Pyramidal Feature Hierarchy),在不同感受野的Feature map上設置預置框然后進行分類和回歸,這極大地提高檢測的速度。(2)YOLO[7]首選將圖像劃成等分相同大小的格子,然后對每個格子進行分類和回歸,檢測速度很快,但是精度不高。

2 本文方法

本文是基于R2CNN算法進行改進的,R2CNN算法采用的是預訓練網絡模型的最后一層特征圖輸入RPN網絡,如ResNet101網絡中的C5層,如圖2所示。雖然高層的特征語義比較豐富,但是往往文本目標的位置比較粗糙,常常會造成文本框的定位不準確以及小文本目標被忽略的問題。除此之外,ROIpooling的尺寸過多會造成計算內存的溢出,實際情況下實現起來有難度。本文針對R2CNN存在的問題,對R2CNN算法做了如下改進。

(1)算法的輸入不再是特征網絡ResNet101中的C5層,而是將C4層做下采樣操作后和C5層相加得到P1層再輸入RPN1中。除此之外,將C3層做上采樣操作和C2層相加得到P2層再輸入RPN2中。RPN1和RPN2中的scale和ratio的設置也不同。

(2)對ROIpooling的尺寸進行改進,保留原來的7×7尺寸。由于ICDAR2015數據集圖像中絕大數文本是水平長文本,因此,去除原來的11×3豎直的尺寸,將原來水平的尺寸修改為4×12尺寸。

改進后的R2CNN算法步驟如下:

①將C4層做下采樣操作后和C5層相加得到P1層再輸入RPN1中,RPN1中的scale為[256],ratio為[1,1/2,2,3,1/3,4,1/4,5,1/5,6,1/6,7,1/7,8,1/8],得到文本候選框Proposals1。

②將C3層做上采樣操作和C2層相加得到P2層再輸入RPN2中,RPN2中的scale為[32],ratio為[1,1/2,2,3,1/3,4,1/4,5,1/5],得到Proposals2。

③將①和②中得到的候選框合并(concat)起來得到Proposals。

④此時的損失函數為:

(1)

(2)

其中:Ncls表示RPN中參與訓練softmax的候選框個數,Nreg表示RPN中訓練邊界框回歸的候選框個數,λ是一個平衡參數。loss_cls是交叉熵損失函數,loss_reg是平滑的L1損失函數。

⑤將③得到的Proposals進行ROIpooling操作,ROIpooling的尺寸為7×7和4×12。ROIpooling的操作得到特征圖扁平化(flatten),再輸入全連接操作。

⑥全連接操作后進行softmax分類和兩次回歸,一次是水平回歸,一次是旋轉回歸,水平回歸有助于旋轉回歸。

⑦此時的損失函數為:

(3)

Lcls(p,t)為交叉熵損失函數,Lreg(w,w*)為平滑的L1損失函數,λ1,λ2是平衡參數,x,y,w,h分別代表候選框的中心點、寬和高,x1,y1,x2,y2,h代表的是候選框順時針方向的兩點坐標和高。

⑧綜上,算法訓練過程的總的損失函數為:

⑨本文改進的算法結構如圖3所示。

3 實驗與分析

3.1 實驗數據

本實驗采用的是ICDAR2015自然場景文本數據集,原訓練集圖像為1 000張,通過旋轉數據增強,將訓練集擴充至20 000張。

3.2 環境配置

操作系統:Ubuntu16.04 LTS,CPU:intel7代8700k,內存:16G,GPU:GTX1080ti,深度學習框架:Tensorflow-gpu1.2版本。

3.3 參數設置

本實驗采用的是在ImageNet數據集上預訓練的ResNet101模型,訓練的學習率設置為0.000 3,采用固定步長更新學習率,訓練的迭代次數為10萬次。

3.4 結果分析

評價算法的性能與表現采用的是精確率P和召回率R,公式如下:

4 結語

通過利用多層特征圖的信息,使得文本目標的定位更加精確,也使得小的文本目標能夠被檢測到,極大地提高了R值。多ROIpooling的操作也使得候選框的信息能夠被更多的提取出送入后續全連接層等操作,這么做使得P值提高。綜上以上的兩個點改進,使得改進后的算法更加具有魯棒性,可以應用于多種自然場景數據集(ICDAR2011、ICDAR2013、MSRA-TD500等),并且可以取得可觀的效果。

[參考文獻]

[1]王潤民,桑農,丁丁,等.自然場景圖像中的文本檢測綜述[J].自動化學報,2018(12):2113-2141.

[2]夏勇.基于深度學習的自然場景文本檢測與識別算法研究[D].西安:西安電子科技大學,2017.

[3]方清.基于深度學習的自然場景文本檢測與識別[D].成都:電子科技大學,2018.

[4]REN S,HE K,GIRSHICK R,et al.Faster R-CNN: towards real-time object detection with region proposal networks[J].IEEE Transactions on Pattern Analysis & Machine Intelligence,2015(6):1137-1149.

[5]JIANG Y,ZHU X,WANG X,et al.R2CNN: rotational region CNN for orientation robust scene text detection[J].IEEE Access,2017(7):126-129.

[6]LIU W,ANGUELOV D,ERHAN D,et al.SSD: single shot multibox detector[C].Crete:European Conference on Computer Vision,2016.

[7]REDMON J,DIVVALA S,GIRSHICK R,et al.You only look once: unified,real-time object detection[J].Computer Vision & Pattern Recognition,2015(6):67-71.

主站蜘蛛池模板: 91丨九色丨首页在线播放| 亚洲无码日韩一区| 波多野结衣无码中文字幕在线观看一区二区| 亚洲黄网在线| 2020国产在线视精品在| 国产免费人成视频网| 久久精品亚洲专区| 亚洲视频一区| 欧美一级片在线| 老司机精品99在线播放| 中文字幕欧美日韩高清| 国外欧美一区另类中文字幕| 成人va亚洲va欧美天堂| 欧美亚洲国产精品久久蜜芽| 欧美日韩第二页| 最新国语自产精品视频在| 久久频这里精品99香蕉久网址| www.91在线播放| 久久香蕉国产线看观看亚洲片| 日本成人福利视频| 国产18在线播放| 成人免费网站久久久| 精品久久人人爽人人玩人人妻| a毛片在线| 午夜视频免费一区二区在线看| 尤物亚洲最大AV无码网站| 玩两个丰满老熟女久久网| 欧美第一页在线| 久久综合亚洲色一区二区三区| 日韩国产黄色网站| 亚洲综合色婷婷| 色丁丁毛片在线观看| 97精品久久久大香线焦| 久久 午夜福利 张柏芝| 无码丝袜人妻| 亚洲无限乱码| 福利国产在线| 啦啦啦网站在线观看a毛片| 精品三级在线| 亚洲一级毛片在线观播放| 亚洲国产日韩视频观看| 久久精品无码国产一区二区三区 | 久久国产高清视频| 亚洲精品图区| 久久久久免费精品国产| 国产欧美日韩综合一区在线播放| 亚洲三级电影在线播放| 波多野结衣在线se| 伦伦影院精品一区| 日韩 欧美 小说 综合网 另类| 99色亚洲国产精品11p| 国产成人一区在线播放| 久久久久久高潮白浆| 国产福利不卡视频| 亚洲 欧美 日韩综合一区| 91在线丝袜| 99热这里只有精品5| 日韩在线第三页| 亚洲国产AV无码综合原创| 91久久夜色精品| 亚洲三级色| 国产系列在线| 国产精品综合久久久| 夜夜爽免费视频| 国产一二三区在线| 曰韩免费无码AV一区二区| 亚洲永久色| 亚洲人成网站观看在线观看| 精品视频在线观看你懂的一区| 中国国产高清免费AV片| 亚洲综合色婷婷中文字幕| 中文字幕有乳无码| 欧美三级自拍| 国产成人91精品| 热久久综合这里只有精品电影| 亚洲精品久综合蜜| 全色黄大色大片免费久久老太| 亚洲午夜福利在线| 操国产美女| jizz国产视频| 91久久国产热精品免费| 亚洲高清无码精品|