999精品在线视频,手机成人午夜在线视频,久久不卡国产精品无码,中日无码在线观看,成人av手机在线观看,日韩精品亚洲一区中文字幕,亚洲av无码人妻,四虎国产在线观看 ?

基于特征融合的電商圖片文本檢測?

2020-11-02 09:00:36王麟琦何成威
計算機與數(shù)字工程 2020年9期
關(guān)鍵詞:特征文本檢測

王麟琦 何成威

(1.南京烽火天地通信科技有限公司 南京 210019)(2.武漢郵電科學(xué)研究院 武漢 430074)(3.國網(wǎng)電力科學(xué)研究院武漢南瑞有限責(zé)任公司 武漢 430074)

1 引言

電子商務(wù)自從1999 年在中國出現(xiàn)以來,發(fā)展迅速。到2017 年年底,中國電子商務(wù)市場交易額高達29.16 萬億元,其中網(wǎng)絡(luò)零售市場交易規(guī)模達到了7 萬億,占據(jù)全球網(wǎng)售份額的50%。中國已經(jīng)成為電子商務(wù)規(guī)模最大、發(fā)展最快的國家之一。如今電商平臺越來越多地采用圖片的方式展示信息,而電商圖片存在背景復(fù)雜、水印重疊等問題,這為電子商務(wù)的管理帶來了技術(shù)上的挑戰(zhàn)。因此,自動讀取商品信息圖片中的文本信息成了熱點問題。

根據(jù)不同的實現(xiàn)框架,文本檢測的方法大致可以分為三類:自底向上的生成式方法[1~3];基于滑動窗口的方法[4~5];基于深度學(xué)習(xí)的檢測方法[6]。隨著深度學(xué)習(xí)算法的不斷優(yōu)化和硬件水平的提高,基于深度學(xué)習(xí)的文本檢測算法已經(jīng)成為圖像文本檢測領(lǐng)域的主流方法。其中以Faster R-CNN[7~9]系列、MR-CNN[10]以及SPP-NET[11]為主流的基于RP(Re?gion Proposal)的目標(biāo)檢測算法,由于區(qū)域推薦網(wǎng)絡(luò)(RPN)結(jié)構(gòu)的存在,雖然檢測結(jié)果精度越來越高,但是檢測的速度卻遇到瓶頸,難以滿足有實時性需求的場景。

針對以上問題,為了能檢測電商圖片中的文本,本文實現(xiàn)了一種基于特征融合的文本檢測模型。通過50 層的殘差網(wǎng)絡(luò)提取輸入圖像的特征,然后將殘差網(wǎng)絡(luò)得到的每一層不同尺寸的特征圖進行特征融合,對特征融合后的特征圖進行回歸和分類,去除候選區(qū)域的提取、過濾和融合等步驟,提高模型的效率。通過利用改進后的NMS 將預(yù)測的文本框合并,得到最終的檢測結(jié)果。為解決非平衡數(shù)據(jù)的問題以及加快模型的收斂,模型引入了DiceLoss 和實例間平衡的交叉熵損失相結(jié)合的損失函數(shù)

2 網(wǎng)絡(luò)結(jié)構(gòu)

圖1 特征提取層結(jié)構(gòu)圖

本文通過殘差網(wǎng)絡(luò)構(gòu)建的全卷積網(wǎng)絡(luò)文本檢測模型,網(wǎng)絡(luò)結(jié)構(gòu)分為以下三個部分:特征提取層、特征融合層、結(jié)果輸出層。特征提取層采取殘差網(wǎng)絡(luò)來做特征提取。圖1 為特征提取層結(jié)構(gòu)圖,如圖所示,在特征提取步驟中,原圖先經(jīng)過一層卷積核為7×7,步長為2 的卷積層,輸出的通道數(shù)為64。圖中一共有4 個Block 模塊,模塊的中括號里的三位數(shù)字分別代表:殘差單元第三層輸出通道數(shù)、前兩層輸出通道數(shù)、中間層的步長。在本網(wǎng)絡(luò)中,每個殘差學(xué)習(xí)單元里面有三個卷積層,例如[256,64,2]代表構(gòu)建的殘差學(xué)習(xí)單元中,第三層輸出通道數(shù)為256,前兩層輸出通道數(shù)為64,且中間層的步長為2,在Block1 中有3 個殘差學(xué)習(xí)單元。特征圖每經(jīng)過一次Block 區(qū)域的操作后,得到新的特征圖尺寸變?yōu)樯弦粚犹卣鲌D的一半,而通道數(shù)則增加一倍,達到抽取不同層次的特征圖的目的。因此可以得到不同尺度的特征圖,解決文本行尺度變換劇烈的問題。低層的特征圖尺寸較大,對局部信息較為敏感,可用于預(yù)測較小的文本行,高層特征圖尺寸較小,提取的特征更為抽象,可用于檢測較大的文本行。特征提取層得到的特征圖依次為f4、f3、f2、f1。

特征融合層將特征提取層中抽取的特征進行合并,合并的規(guī)則采用了U-net[12]的方法。圖2 為特征融合層的結(jié)構(gòu)圖。從圖中可以看出,特征融合層首先從特征提取網(wǎng)絡(luò)的頂部特征逐步向下進行合并,在每一個合并階段,從上一個階段來的特征圖先進行反卷積,使得特征圖尺寸增大一倍,然后和當(dāng)前特征圖級聯(lián)。然后,利用一個1×1 的卷積層減少特征圖的通道數(shù),也達到了降低計算量的目的,接著經(jīng)過一個3×3 的卷積核對特征圖進行卷積,將信息融合,最終產(chǎn)生合并階段的結(jié)果。在最后一個合并階段之后,利用一個3×3 卷積層產(chǎn)生最終的歸并部分的特征圖,并輸入到輸出層。

圖2 特征融合層結(jié)構(gòu)圖

第三部分為結(jié)果輸出層,將特征融合層產(chǎn)生的特征圖進行1×1 的卷積,激活層采用Sigmoid 作為激活函數(shù)。輸出的結(jié)果分為兩個部分。一個是完成分類任務(wù)的輸出,另外一個表示檢測框的輸出,檢測框的輸出有5 個通道,前四個通道分別對應(yīng)點到邊框的四條邊的距離。最后一個通道表示文本框的旋轉(zhuǎn)角度。

2.1 非極大值抑制算法的優(yōu)化

非極大值抑制算法(Non-maximum suppres?sion,NMS)的本質(zhì)是通過選擇最具代表性的候選框刪除同一對象的重疊候選框。

物體檢測中應(yīng)用NMS 算法的主要目的是消除交叉重復(fù)的窗口,找到最佳物體檢測位置。通常的流程為以下三步:

1)通過滑動窗口或者其他的目標(biāo)推薦的方法產(chǎn)生大量的候選窗口;

2)用訓(xùn)練好的分類器對候選窗口進行分類,類似于打分的過程;

3)使用NMS對檢測結(jié)果進行融合。

非極大值抑制算法常用于物體檢測領(lǐng)域,并能取得較好的檢測的結(jié)果。物體檢測和文本檢測有很多相同之處,文獻[13]采用NMS 算法作為去掉重復(fù)率較大的文本框。NMS算法公式如式(1)所示。

其中M 為當(dāng)前得分最大的文本框,Nt 為抑制閾值,si為分數(shù)。

NMS 這種簡單直接的方法也存在一些不利。假設(shè)有兩個物體之間存在遮擋,則后面的物體預(yù)測框有可能被NMS 算法誤刪掉,從而導(dǎo)致檢測網(wǎng)絡(luò)無法起到作用。為了解決這種hard threshold(硬閾值)問題,遵循IoU 越大,得分越低的原則,對該函數(shù)進行平滑處理。平滑函數(shù)的選取一般有兩種,一種是線性加權(quán)函數(shù),一種是高斯加權(quán)函數(shù)。兩者的目的都是為了將NMS的函數(shù)進行平滑化。

該式滿足了連續(xù)的懲罰函數(shù)在沒有重疊時沒有懲罰項,而在高度重疊時有非常高的懲罰項。

2.2 訓(xùn)練損失函數(shù)

網(wǎng)絡(luò)損失函數(shù)由兩個部分構(gòu)成:分類誤差函數(shù)和幾何誤差函數(shù),具體損失函數(shù)如式(4)所示。其中,Ls為分類誤差,λg為權(quán)重,Lg為幾何誤差。

1)分類誤差函數(shù)

文本檢測在文本檢測問題中,文字和背景的比例通常較小,存在數(shù)據(jù)的不平衡問題。本文采用Dice loss 緩解數(shù)據(jù)的非平衡問題。Dice loss 是Fausto Milletar[14]等 在V-net 中 提 出 的 損 失 函 數(shù),Dice Loss的本質(zhì)就是不斷學(xué)習(xí),使得交集和并集的比值越來越大。如式(5)所示,DSC 表示兩個輪廓區(qū)域的相似的程度,A 和B 分別表示兩個輪廓區(qū)域所包含的點集。

當(dāng)DSC越高,代表分割結(jié)果和標(biāo)準答案相似度越高,但模型是用求最小值的思想進行訓(xùn)練,因此分類誤差函數(shù)如下式所示。

在計算損失函數(shù)時,為了避免不同大小的文本框?qū)p失造成的影響不同,較大的文本框造成的影響大,為緩解這個問題,本模型采用了實例間平衡的交叉熵損失[15]。假設(shè)圖像中有M 個文本框。Sj代表第j 個文本框的面積,S 表示所有文本框的總面積,則文本框i的損失權(quán)重應(yīng)為

2)幾何誤差函數(shù)

文本檢測中的一大挑戰(zhàn)是文本在圖像中的尺寸變化范圍較大。直接用L1 或者L2 損失,會導(dǎo)致文本區(qū)域的損失偏差更大。文本檢測需要的是一個不會影響尺寸的回歸損失函數(shù),因此回歸損失采用IoU(Intersection over Union)Loss。IoU Loss 的公式和Dice Loss較為相似,如式(9)所示。

其中,R 代表預(yù)測的文本框的幾何位置,R*代表的真實值。

幾何誤差函數(shù)除了邊框的回歸損失函數(shù)外,還包含角度的誤差損失函數(shù),角度誤差函數(shù)如式(10)所示。

其中θ*代表的角度的真實值,θ代表的預(yù)測的角度值。完整的幾何誤差函數(shù)如式(11)所示。

2.3 數(shù)據(jù)預(yù)處理

本文數(shù)據(jù)集來自天池大賽的ICPR MTWI 挑戰(zhàn)賽。為了豐富圖像數(shù)據(jù)集,提高模型的泛化能力,本文采用了以下步驟對訓(xùn)練圖像進行數(shù)據(jù)增強。設(shè)立四種縮放倍數(shù)0.5、1、2、3,隨機從中選取一個參數(shù)對圖片進行縮放操作,對縮放的圖片進行隨機剪切(不小于原圖的十分之一)并隨機選取一些圖像數(shù)據(jù)進行旋轉(zhuǎn)角度處理。處理后的圖片如圖3所示。

圖3 預(yù)處理后的圖片數(shù)據(jù)示例

檢測的任務(wù)中,一般會存在正負樣本嚴重失衡的情況,為緩解數(shù)據(jù)集文字和背景樣本不平衡的問題和增強模型的魯棒性,本文采用均衡采樣的方法,將數(shù)據(jù)增強后的純背景圖片和包含文字的圖片比例控制在3:5,最后利用雙線性插值法將圖像尺寸改變?yōu)槟P退璧妮斎氤叽纭?shù)據(jù)集中的四個坐標(biāo)圍成的文本框并不一定為矩形,因此,需要對文本框坐標(biāo)進行數(shù)據(jù)預(yù)處理。首先將坐標(biāo)的方向都改為順時針,以便于模型后續(xù)的計算,然后按照增加最小面積的原則,將文本框填補為矩形。在后續(xù)的學(xué)習(xí)過程中,標(biāo)準的文本框中會存在一些非文本信息,進行適當(dāng)?shù)乜s進可以減少這些信息對最終目標(biāo)的影響,從而提高網(wǎng)絡(luò)的性能。

2.4 評估標(biāo)準以及訓(xùn)練參數(shù)配置

文本檢測的效果評價共有三個評價指標(biāo),分別為精度、召回率以及二者之間的綜合評價因素F-Score(f)。召回率表示圖片中真實存在的文本框被檢測到的比例,代表真實標(biāo)簽有多大比例被檢測出來,精度表示正確檢測文本定位框與檢測文本框總數(shù)的比例,代表檢測出來的結(jié)果正確率。實際情況下,算法得到的檢測結(jié)果與人工標(biāo)記的邊界框不可能完全重合,當(dāng)檢測框與真實框之間的匹配度滿足一定閾值則認為是正確匹配。這三個參數(shù)的定義如下所示:

本模型的訓(xùn)練過程中,基礎(chǔ)模型選用的殘差網(wǎng)絡(luò)以及全卷積網(wǎng)絡(luò),采用Adam 算法替代傳統(tǒng)隨機梯度下降算法(Stochastic Gradient Descent,SGD)對訓(xùn)練參數(shù)不斷更新,該算法計算高效,所需的內(nèi)存少,梯度對角度縮放的不變形,適合解決大規(guī)模數(shù)據(jù)和參數(shù)的優(yōu)化問題。訓(xùn)練過程中一共迭代了3萬次,初始的學(xué)習(xí)率為10-4,采用指數(shù)衰減法,通過迭代逐步減小學(xué)習(xí)率,每1 萬次迭代后,縮小0.96。為了使得模型在測試數(shù)據(jù)上更加健壯,本模型采用滑動平均模型控制參數(shù)更新前后的差距,達到減緩參數(shù)變化的目的。

3 實驗結(jié)果分析

算法檢測為正樣本的條件是:

1)預(yù)測框和真實1之間的IoU值大于0.5;

2)在條件1)滿足的同時,預(yù)測框和真實框之間角度差應(yīng)小于10°。

圖4 展示了ICPR MTWI 挑戰(zhàn)賽上的正確檢測樣本。圖5 為模型訓(xùn)練過程中,模型總損失函數(shù)的訓(xùn)練過程。在訓(xùn)練最開始的5000 次訓(xùn)練中,模型總損失的下降速度較快,5000 次以后,分類損失逐步下降速度變緩,到30k次后,趨于穩(wěn)定。

圖4 ICPR MTWI挑戰(zhàn)賽的部分正確檢測結(jié)果

圖5 模型總損失的訓(xùn)練過程

表1 為對本實現(xiàn)模型做的切除實驗的實驗結(jié)果,用于分析關(guān)鍵步驟對模型表現(xiàn)的影響。

表1 本實驗?zāi)P颓谐龑嶒灲Y(jié)果

實例間平衡的交叉熵損失用于緩解文本實例大小差異過大對模型的影響。實驗3 沒有使用實例間平衡的損失函數(shù),在計算損失函數(shù)時,所有像素使用一樣的權(quán)重。改進后的NMS 能取得比傳統(tǒng)NMS 更好的性能。對比實驗1 和實驗2,加入改進的NMS 后,可以發(fā)現(xiàn)召回率和精準率都提高了三個百分點。同時,可以在高度重疊的環(huán)境下取得更大的性能提升,在電商圖片中,存在大量的水印文字和圖片的文字重疊的情況。因此,相比于傳統(tǒng)NMS,改進后的NMS 在文本檢測中具有更好的定位效果。改進后的NMS 對相鄰區(qū)域內(nèi)的檢測框的分數(shù)進行調(diào)整而不是NMS 方法中的徹底抑制,達到了提高檢測率時準確率的目的。NMS 對相鄰區(qū)域的徹底抑制使其在較高重疊環(huán)境下更容易發(fā)生漏檢文本框的情況,而改進后的NMS 在低檢索率時,仍能提高模型的檢測性能。由實驗4 可以看出,在本模型中使用ResNet 作為基礎(chǔ)網(wǎng)絡(luò),比使用VGG16 作為基礎(chǔ)網(wǎng)絡(luò),性能更好,實驗結(jié)果在召回率和精準率都有一定提升。

表2 為本文的檢測方法和其他一些主流的文本檢測算法進行比較的結(jié)果。表中其他深度學(xué)習(xí)的文本檢測算法,都將ICPR MTWI 挑戰(zhàn)賽的數(shù)據(jù)集作為訓(xùn)練集。

表2 不同方法文本檢測指標(biāo)對比

從表中可以看出,在多方向ICPR MTWI 挑戰(zhàn)賽的數(shù)據(jù)集上,本模型的召回率、精度、F-measuren都達到了較好的評估結(jié)果。CTPN在水平方向的文本上的檢測效果較好,而在多方向的文本檢測時,檢測效果差強人意。PixelLink 也是基于全卷積神經(jīng)網(wǎng)絡(luò)的,但它在處理重疊問題時,可能會將兩個有重疊部分的文本框劃分成四個文本框,而ICPR MTWI 挑戰(zhàn)賽的數(shù)據(jù)集主要為電商圖片,有著大量的水印,因此文本框重疊是很常見的。這個問題使得PixelLink模型對該數(shù)據(jù)集有著較大的影響。

4 結(jié)語

本文主要完成電商圖片的多方向文本檢測的任務(wù),提出了一種基于全卷積的文本檢測網(wǎng)絡(luò)模型,直接產(chǎn)生預(yù)測的文本框,免除了中間多個步驟,如候選區(qū)域的提取、過濾和融合,以及后處理等。首先通過一個50 層的殘差網(wǎng)絡(luò)進行特征抽取,抽取不同尺寸的特征圖,以解決文本行尺度變換劇烈的問題。然后將特征抽取層的不同尺寸的特征進行上采樣后,采用通道數(shù)串聯(lián)的方式合并,將融合后的特征圖傳到輸出層。最后用改進后的非極大值抑制的方法對上一層結(jié)果進行處理,得到最終的預(yù)測結(jié)果。本節(jié)算法在ICPR MTWI 挑戰(zhàn)賽的數(shù)據(jù)集上進行測試,通過切除實驗,分析了殘差網(wǎng)絡(luò)、改善后的NMS 以及實例平衡的交叉熵損失對本算法的影響。最后,將算法測試結(jié)果與其他文本檢測的方法進行對比,取得了較好的檢測效果。

猜你喜歡
特征文本檢測
“不等式”檢測題
“一元一次不等式”檢測題
“一元一次不等式組”檢測題
如何表達“特征”
在808DA上文本顯示的改善
不忠誠的四個特征
基于doc2vec和TF-IDF的相似文本識別
電子制作(2018年18期)2018-11-14 01:48:06
抓住特征巧觀察
小波變換在PCB缺陷檢測中的應(yīng)用
文本之中·文本之外·文本之上——童話故事《坐井觀天》的教學(xué)隱喻
主站蜘蛛池模板: 亚洲成a人在线播放www| 欧美精品影院| 久久国产高清视频| av性天堂网| 亚洲成年人片| 亚洲综合精品香蕉久久网| 亚洲综合专区| 色哟哟国产精品| lhav亚洲精品| 丰满人妻一区二区三区视频| 欧美一级在线| 亚洲系列无码专区偷窥无码| 蜜桃臀无码内射一区二区三区| 99热线精品大全在线观看| 国产素人在线| A级毛片高清免费视频就| 欧美日韩国产综合视频在线观看| 国产成人禁片在线观看| 国产人人乐人人爱| 久夜色精品国产噜噜| 无码又爽又刺激的高潮视频| 亚洲精品第五页| 国产成人综合在线观看| 国产原创第一页在线观看| 亚洲欧美一区二区三区图片| 精品少妇人妻一区二区| 国产视频a| 色老二精品视频在线观看| 国产精品亚洲精品爽爽| 99国产在线视频| 久久精品无码中文字幕| 日韩高清无码免费| 91po国产在线精品免费观看| 国产亚洲成AⅤ人片在线观看| 国产成人精品一区二区免费看京| 欧美天堂在线| 先锋资源久久| 亚洲h视频在线| 欧美高清三区| 亚洲首页国产精品丝袜| 精品视频一区二区观看| 青青青视频91在线 | 精品国产一二三区| 人妻一本久道久久综合久久鬼色| 97国产精品视频人人做人人爱| 精品国产污污免费网站| 亚洲视屏在线观看| 免费高清毛片| 国产精品第页| 欧美a√在线| 亚洲愉拍一区二区精品| 免费观看三级毛片| 999精品色在线观看| 中国毛片网| 国产系列在线| 久久精品丝袜高跟鞋| 免费无遮挡AV| 欧美久久网| 国产精品分类视频分类一区| 久久公开视频| 激情综合五月网| 91尤物国产尤物福利在线| 啪啪永久免费av| 久久大香香蕉国产免费网站| aaa国产一级毛片| 国产另类视频| 啪啪永久免费av| 伊人久久久久久久| 国产精品青青| 一级全黄毛片| 国产精品久久久久久久伊一| 人人91人人澡人人妻人人爽| 国内精自视频品线一二区| 国产麻豆另类AV| 国产精品密蕾丝视频| 特级做a爰片毛片免费69| 欧美日韩免费观看| 国产无码在线调教| 久热这里只有精品6| 人妻21p大胆| 日本欧美在线观看| 99中文字幕亚洲一区二区|